problemas al importar el etiquetador pos stanford en nltk

Esta es probablemente una pregunta muy trivial. Estoy tratando de usar el etiquetador pos stanford a través de nltk que se da aquí. El problema es que mi nltk lib no contiene el módulo stanford. Así que copié lo mismo en la carpeta apropiada y compilé lo mismo. Ahora, cuando bash ejecutar un ejemplo, se detecta el módulo pero no la clase dentro del módulo. ¿Alguien puede decirme a dónde me voy mal? De nuevo, esto es probablemente muy tonto.

>>> from nltk.tag import stanford >>> st = StanfordTagger('bidirection-distsim-wsj-0-18.tagger') 

Utilicé py_compile para comstackr el archivo stanford.py. Me estoy perdiendo de algo

Sólo estás importando stanford . Para acceder a StanfordTagger necesitas usar:

 >>> from nltk.tag.stanford import StanfordTagger 

(Suponiendo que `StanfordTagger no esté más nested en un módulo) o acceda a él por

 >>> st = stanford.StanfordTagger('bidirection-distsim-wsj-0-18.tagger') 

Si quieres usar el analizador de Stanford, usa esto:

 import os from nltk.parse import stanford os.environ['STANFORD_PARSER'] = '/folder/with/standford/jars' os.environ['STANFORD_MODELS'] = '/folder/with/standford/jars' parser = stanford.StanfordParser(model_path="/location/of/the/englishPCFG.ser.gz") print parser.raw_batch_parse(("Hello, My name is Melroy.", "What is your name?")) 

Salida:

[Árbol (‘ROOT’, [Árbol (‘S’, [Árbol (‘INTJ’, [Árbol (‘UH’, [‘Hola’]))), Árbol (‘,’, [‘,’]), Árbol (‘NP’, [Árbol (‘PRP $’, [‘Mi’]), Árbol (‘NN’, [‘nombre’))]), Árbol (‘VP’, [Árbol (‘VBZ’, [ ‘is’]), Tree (‘ADJP’, [Tree (‘JJ’, [‘Melroy’])))), Tree (‘.’, [‘.’]))))) Tree (‘ ROOT ‘, [Árbol (‘ SBARQ ‘, [Árbol (‘ WHNP ‘, [Árbol (‘ WP ‘, [‘ Qué ‘]))), Árbol (‘ SQ ‘, [Árbol (‘ VBZ ‘, [‘ is ‘ ]), Árbol (‘NP’, [Árbol (‘PRP $’, [‘su’]), Árbol (‘NN’, [‘nombre’)))))), Árbol (‘.’, [‘? ‘]))))))]

Nota 1: En este ejemplo, tanto el analizador como los flasks de modelo están en la misma carpeta.

Nota 2:

  • El nombre del archivo de stanford parser es: stanford-parser.jar
  • El nombre del archivo de stanford models es: stanford-parser-xxx-models.jar

Nota 3: El archivo englishPCFG.ser.gz se puede encontrar dentro del archivo models.jar (/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz). Utilice el administrador de archivos de Come para ‘descomprimir’ el archivo models.jar.