Articles of stanford nlp

NLTK Stanford Segmentor, cómo configurar CLASSPATH

Estoy tratando de usar el bit Stanford Segementer del paquete NLTK Tokenize. Sin embargo, me encuentro con problemas tratando de usar el conjunto de prueba básico. Ejecutando lo siguiente: # -*- coding: utf-8 -*- from nltk.tokenize.stanford_segmenter import StanfordSegmenter seg = StanfordSegmenter() seg.default_config(‘zh’) sent = u’这是斯坦福中文分词器测试’ print(seg.segment(sent)) Resultados en este error: Llegué a agregar … import […]

TypeError: DataType float32 para attr ‘Tindices’ no en la lista de valores permitidos: int32, int64

Estoy haciendo el curso CS224n de Stanford. Recibo un error en la asignación2 q2_parser_model.py en mi analizador de dependencias == Initializing== Loading data… took 2.17 seconds Building parser… took 0.04 seconds Loading pretrained embeddings… took 2.16 seconds Vectorizing data… took 0.06 seconds Preprocessing training data… 1000/1000 [==============================] – 1s Building model… Traceback (most recent call […]

verificar si una oración es gtwigticalmente correcta usando el analizador de stanford

¿Hay algún método para verificar si una oración es gtwigticalmente correcta o no usa el analizador de stanford? A partir de ahora puedo obtener el árbol de análisis de una oración utilizando el analizador de stanford. Me quedé atascado aquí y no sé cómo seguir adelante.

Stanford NER Tagger en NLTK

Estoy intentando importar el Reconocedor de entidades con nombre de Stanford en Python. Esto ya está integrado en el paquete NLTK. Sin embargo, mi código de abajo no funciona: from nltk.tag.stanford import NERTagger Traceback (most recent call last): File “”, line 1, in ImportError: cannot import name NERTagger ¿Qué podría ser la causa? En todos […]

Usando Stanford Tregex en Python

Soy un novato en PNL y Python. Estoy tratando de extraer un subconjunto de frases nominales de los árboles analizados desde StanfordCoreNLP utilizando la herramienta Tregex y la biblioteca de subproceso Python. En particular, estoy tratando de encontrar y extraer frases nominales que coincidan con el siguiente patrón: ‘(NP [$ VP]> S) | (NP [$ […]

NLTK CoreNLPDependencyParser: Error al establecer la conexión

Estoy tratando de usar el Stanford Parser a través de NLTK, siguiendo el ejemplo aquí . Sigo las dos primeras líneas del ejemplo (con la importación necesaria) from nltk.parse.corenlp import CoreNLPDependencyParser dep_parser = CoreNLPDependencyParser(url=’http://localhost:9000′) parse, = dep_parser.raw_parse(‘The quick brown fox jumps over the lazy dog.’) pero me sale un error diciendo: […] Failed to establish […]

Cargue el modelo NER personalizado Stanford CoreNLP

He creado mi propio modelo NER con el software “Stanford-NER” de Stanford y siguiendo estas instrucciones. Soy consciente de que CoreNLP carga tres modelos NER de la caja en el siguiente orden: edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.muc.7class.distsim.crf.ser.gz edu/stanford/nlp/models/ner/english.conll.4class.distsim.crf.ser.gz Ahora quiero incluir mi modelo NER en la lista de arriba y tener el texto etiquetado por mi modelo NER […]

nltk Stanford NERTagger: cómo obtener nombres propios sin mayúsculas

Estoy tratando de usar Stanford NERTagger y nltk para extraer palabras clave de un fragmento de texto. docText=”John Donk works for POI. Brian Jones wants to meet with Xyz Corp. for measuring POI’s Short Term performance Metrics.” words = re.split(“\W+”,docText) stops = set(stopwords.words(“english”)) #remove stop words from the list words = [w for w in […]

cómo acelerar el reconocimiento NE con stanford NER con python nltk

Primero tokenize el contenido del archivo en oraciones y luego llamo al NER de Stanford en cada una de las oraciones. Pero este proceso es realmente lento. Sé que si lo llamo en todo el contenido del archivo sería más rápido, pero lo hago en cada oración, ya que deseo indexar cada oración antes y […]

Simplificando el conjunto de tags POS francesas con NLTK

¿Cómo se puede simplificar la parte de las tags de voz devueltas por el etiquetador POS francés de Stanford? Es bastante fácil leer una oración en inglés en NLTK, encontrar la parte del discurso de cada palabra y luego usar map_tag () para simplificar el conjunto de tags: #!/usr/bin/python # -*- coding: utf-8 -*- import […]