¿Existe alguna alternativa para el módulo ‘nltk.model.NGramModel’ que se eliminó ahora?

He estado tratando de encontrar una alternativa por dos días seguidos, y no pude encontrar nada relevante. Básicamente, estoy tratando de obtener una puntuación probabilística de una oración sintetizada (sintetizada al reemplazar algunas palabras de una oración original seleccionada de los corpus).

Intenté Colocaciones, pero las puntuaciones que estoy obteniendo no son muy útiles. Así que intenté usar el concepto de modelo de lenguaje, solo para encontrar que el módulo ‘modelo’ aparentemente útil se ha eliminado de NLTK debido a algunos errores.

Sería realmente genial si alguien pudiera hacerme saber acerca de alguna forma alternativa para obtener la implementación del modelo ngram en Python, o mejor aún, sugerirme otra manera de resolver el problema de “calificar” la oración.

De acuerdo con este problema abierto en el repository nltk , NGramModel actualmente no está en master debido a algunos errores. Su solución actual es instalar el código de la twig modelo. Sin embargo, esto es alrededor de 8 meses de retraso, por lo que podría perderse otras características y correcciones de errores.

 pip install https://github.com/nltk/nltk/tarball/model 

El código relevante está aquí en la twig modelo . Puede copiar esto a su código local si no desea utilizar la twig obsoleta. Si realmente te importa usar esto, puedes intentar solucionar los errores pendientes y enviar una solicitud de extracción.