Articles of stanford nlp

nltk Stanford NERTagger: NoClassDefFoundError: org / slf4j / LoggerFactory (en Windows)

NOTA: Estoy usando Python 2.7 como parte de la distribución de Anaconda. Espero que esto no sea un problema para nltk 3.1. Estoy tratando de usar nltk para NER como import nltk from nltk.tag.stanford import StanfordNERTagger #st = StanfordNERTagger(‘stanford-ner/all.3class.distsim.crf.ser.gz’, ‘stanford-ner/stanford-ner.jar’) st = StanfordNERTagger(‘english.all.3class.distsim.crf.ser.gz’) print st.tag(str) pero entiendo Exception in thread “main” java.lang.NoClassDefFoundError: org/slf4j/LoggerFactory at edu.stanford.nlp.io.IOUtils.(IOUtils.java:41) […]

Chunking Stanford Named Entity Recognizer (NER) genera salidas desde el formato NLTK

Estoy usando NER en NLTK para encontrar personas, ubicaciones y organizaciones en oraciones. Soy capaz de producir los resultados de esta manera: [(u’Remaking’, u’O’), (u’The’, u’O’), (u’Republican’, u’ORGANIZATION’), (u’Party’, u’ORGANIZATION’)] ¿Es posible unir las cosas juntas usándolas? Lo que quiero es así: u’Remaking’/ u’O’, u’The’/u’O’, (u’Republican’, u’Party’)/u’ORGANIZATION’ ¡Gracias!

nltk no puede interpretar la salida de la categoría gtwigtical PRP $ por stanford parser

Quiero generar una oración de la gramática extraída del analizador de Stanford, pero NLTK no puede interpretar los PRP $. from nltk.parse.stanford import StanfordParser from nltk.grammar import CFG from nltk.parse.generate import generate sp=StanfordParser(model_path=’/home/aman/stanford_resource/stanford-parser-full-2014-06-16/stanford-parser-3.4-models/edu/stanford/nlp/models/lexparser/englishPCFG.ser.gz’,path_to_jar=’/home/aman/stanford_resource/stanford-parser-full-2014-06-16/stanford-parser.jar’,path_to_models_jar=’/home/aman/stanford_resource/stanford-postagger-full-2014-08-27/stanford-postagger-3.4.1.jar’) sent1=’He killed the tiger in his pants’ parse_result=sp.raw_parse(sent1) grammar_list=[] for p in parse_result: l=p.productions() grammar_string=’\n’.join(map(str,l)) grammar=CFG.fromstring(grammar_string) #grammar_list.append(grammar) #for s in generate(grammar,n=3): # […]

Cómo almacenar resultados ner en json / database

import nltk from itertools import groupby def get_continuous_chunks(tagged_sent): continuous_chunk = [] current_chunk = [] for token, tag in tagged_sent: if tag != “O”: current_chunk.append((token, tag)) else: if current_chunk: # if the current chunk is not empty continuous_chunk.append(current_chunk) current_chunk = [] # Flush the final current_chunk into the continuous_chunk, if any. if current_chunk: continuous_chunk.append(current_chunk) return continuous_chunk […]

Stanford nlp para python

Todo lo que quiero hacer es encontrar el sentimiento (positivo / negativo / neutral) de cualquier cadena dada. En la investigación me encontré con Stanford PNL. Pero lamentablemente está en Java. ¿Alguna idea sobre cómo puedo hacer que funcione para python?

problemas al importar el etiquetador pos stanford en nltk

Esta es probablemente una pregunta muy trivial. Estoy tratando de usar el etiquetador pos stanford a través de nltk que se da aquí. El problema es que mi nltk lib no contiene el módulo stanford. Así que copié lo mismo en la carpeta apropiada y compilé lo mismo. Ahora, cuando bash ejecutar un ejemplo, se […]

Cómo mejorar la velocidad con Stanford NLP Tagger y NLTK

¿Hay alguna manera de usar el Standford Tagger de una manera más eficaz? Cada llamada al envoltorio de NLTK inicia una nueva instancia de java por cadena analizada que es muy lenta, especialmente cuando se usa un modelo de idioma extranjero más grande … http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford

Stanford NER en NLTK no etiqueta correctamente varias oraciones – Python

Tengo una función que devuelve las entidades nombradas en un cuerpo de texto dado, utilizando la NER de Stanford. def get_named_entities(text): load_ner_files() print text[:100] # to show that the text is fine text_split = text.split() print text_split # to show the split is working fine result = “named entities = “, st.tag(text_split) return result Estoy […]

Resolución de referencia en Python nltk utilizando Stanford coreNLP

Stanford CoreNLP proporciona una resolución de referencia central como se menciona aquí , también este hilo , esto , proporciona algunas ideas sobre su implementación en Java. Sin embargo, estoy usando python y NLTK y no estoy seguro de cómo puedo usar la funcionalidad de resolución Coreference de CoreNLP en mi código de python. He […]

Stanford CoreNLP OpenIE anotador

Tengo una pregunta con respecto al anotador OpenIE de Stanford CoreNLP. Estoy usando la versión Stanford CoreNLP stanford-corenlp-full-2015-12-09 para extraer relaciones usando OpenIE. No sé mucho de Java, por eso estoy usando el contenedor pycorenlp para Python 3.4. Quiero extraer la relación entre todas las palabras de una oración, a continuación está el código que […]