¿Cómo instalar e invocar Stanford NERTagger?

Estoy tratando de usar la interfaz NLTK para Stanford NER en el entorno python, nltk.tag.stanford.NERTagger .

 from nltk.tag.stanford import NERTagger st = NERTagger('/usr/share/stanford-ner/classifiers/all.3class.distsim.crf.ser.gz', '/usr/share/stanford-ner/stanford-ner.jar') st.tag('Rami Eid is studying at Stony Brook University in NY'.split()) 

Se supone que debo obtener la salida:

 [('Rami', 'PERSON'), ('Eid', 'PERSON'), ('is', 'O'), ('studying', 'O'), ('at', 'O'), ('Stony', 'ORGANIZATION'), ('Brook', 'ORGANIZATION'), ('University', 'ORGANIZATION'), ('in', 'O'), ('NY', 'LOCATION')] 

He instalado NLTK según el procedimiento descrito en el sitio web de NLTK . Sin embargo, no puedo encontrar / usr / share / stanford-ner en absoluto. ¿Dónde y cómo encuentro el paquete completo y lo instalo en mi directorio?

Solo pensé que valdría la pena mencionar que la línea de importación es ahora:

 from nltk.tag.stanford import StanfordNERTagger 

Podría ser más fácil ver las interfaces más recientes de Stanford CoreNLP para python que están disponibles aquí: http://nlp.stanford.edu/software/corenlp.shtml

Uno tiene que descargar el paquete de Stanford independiente de la descarga NLTK, colocarlo en el lugar que indica la ruta y cambiar el nombre del directorio en la ruta descrita en el documento NLTK al nombre que uno quiera usar para el directorio. Hubiera sido bueno si la documentación de NLTK lo declarara explícitamente.

 from nltk.tag.stanford import StanfordNERTagger st = StanfordNERTagger('/Users/mahendrabilagi/Desktop/stanford-ner-2017-06-09/classifiers/english.all.3class.distsim.crf.ser.gz', '/Users/mahendrabilagi/Desktop/stanford-ner-2017-06-09/stanford-ner.jar') print st.tag('Rami Eid is studying at Stony Brook University in Bengaluru'.split()) 

Si bien esta es una respuesta de un solo enlace, resolverá la pregunta del OP.

Para Windows : https://gist.github.com/alvations/0ed8641d7d2e1941b9f9

Para Linux : https://gist.github.com/alvations/e1df0ba227e542955a8a


Editado

Pero tenga en cuenta que esta no es una solución eterna y dado que las herramientas de NLP y NLTK de Stanford cambian más de 2 ó 3 veces al año, consulte la https://github.com/nltk/nltk/wiki/Installing-Third-Party- Software para las últimas instrucciones de configuración de la API NLTK a las herramientas de Stanford.

Las soluciones anteriores se publican el 17.03.2016.