Articles of stanford nlp

Stanford NER Tagger en NLTK

Estoy intentando importar el Reconocedor de entidades con nombre de Stanford en Python. Esto ya está integrado en el paquete NLTK. Sin embargo, mi código de abajo no funciona: from nltk.tag.stanford import NERTagger Traceback (most recent call last): File “”, line 1, in ImportError: cannot import name NERTagger ¿Qué podría ser la causa? En todos […]

Usando Stanford Tregex en Python

Soy un novato en PNL y Python. Estoy tratando de extraer un subconjunto de frases nominales de los árboles analizados desde StanfordCoreNLP utilizando la herramienta Tregex y la biblioteca de subproceso Python. En particular, estoy tratando de encontrar y extraer frases nominales que coincidan con el siguiente patrón: ‘(NP [$ VP]> S) | (NP [$ […]

NLTK CoreNLPDependencyParser: Error al establecer la conexión

Estoy tratando de usar el Stanford Parser a través de NLTK, siguiendo el ejemplo aquí . Sigo las dos primeras líneas del ejemplo (con la importación necesaria) from nltk.parse.corenlp import CoreNLPDependencyParser dep_parser = CoreNLPDependencyParser(url=’http://localhost:9000′) parse, = dep_parser.raw_parse(‘The quick brown fox jumps over the lazy dog.’) pero me sale un error diciendo: […] Failed to establish […]

Cargue el modelo NER personalizado Stanford CoreNLP

He creado mi propio modelo NER con el software “Stanford-NER” de Stanford y siguiendo estas instrucciones. Soy consciente de que CoreNLP carga tres modelos NER de la caja en el siguiente orden: edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz Ahora quiero incluir mi modelo NER en la lista de arriba y tener el texto etiquetado por mi modelo NER […]

nltk Stanford NERTagger: cómo obtener nombres propios sin mayúsculas

Estoy tratando de usar Stanford NERTagger y nltk para extraer palabras clave de un fragmento de texto. docText=”John Donk works for POI. Brian Jones wants to meet with Xyz Corp. for measuring POI’s Short Term performance Metrics.” words = re.split(“\W+”,docText) stops = set(stopwords.words(“english”)) #remove stop words from the list words = [w for w in […]

cómo acelerar el reconocimiento NE con stanford NER con python nltk

Primero tokenize el contenido del archivo en oraciones y luego llamo al NER de Stanford en cada una de las oraciones. Pero este proceso es realmente lento. Sé que si lo llamo en todo el contenido del archivo sería más rápido, pero lo hago en cada oración, ya que deseo indexar cada oración antes y […]

Simplificando el conjunto de tags POS francesas con NLTK

¿Cómo se puede simplificar la parte de las tags de voz devueltas por el etiquetador POS francés de Stanford? Es bastante fácil leer una oración en inglés en NLTK, encontrar la parte del discurso de cada palabra y luego usar map_tag () para simplificar el conjunto de tags: #!/usr/bin/python # -*- coding: utf-8 -*- import […]

Nltk stanford pos tagger error: error del comando de Java

Estoy tratando de usar el nltk.tag.stanford module para etiquetar una oración (primero como el ejemplo de wiki) pero sigo recibiendo el siguiente error: Traceback (most recent call last): File “test.py”, line 28, in print st.tag(word_tokenize(‘What is the airspeed of an unladen swallow ?’)) File “/usr/local/lib/python2.7/dist-packages/nltk/tag/stanford.py”, line 59, in tag return self.tag_sents([tokens])[0] File “/usr/local/lib/python2.7/dist-packages/nltk/tag/stanford.py”, line 81, […]

¿Cómo hacer un árbol a partir de la salida de un analizador de dependencia?

Estoy intentando hacer un árbol (diccionario nested) a partir de la salida del analizador de dependencias. La frase es “Le disparé a un elefante mientras dormía”. Puedo obtener la salida como se describe en el enlace: ¿Cómo hago el análisis de dependencias en NLTK? nsubj(shot-2, I-1) det(elephant-4, an-3) dobj(shot-2, elephant-4) prep(shot-2, in-5) poss(sleep-7, my-6) pobj(in-5, […]

¿Cómo puedo extraer la dirección del texto sin formato utilizando NLTK en python?

Tengo este texto ” ‘Hola, el Sr. Sam D. Richards vive aquí, 44 West 22nd Street, New York, NY 12345 . ¿Puedes contactarlo ahora? Si necesita ayuda, llámeme al 12345678 ” ‘ . ¿Cómo se puede extraer la parte de la dirección del texto anterior utilizando NLTK? He probado Stanford NER Tagger , que solo […]