Articles of wordnet

Importar WordNet en NLTK

Quiero importar el diccionario de wordnet pero cuando importe el diccionario de wordnet formulario, veo este error: for l in open(WNSEARCHDIR+’/lexnames’).readlines(): IOError: [Errno 2] No such file or directory: ‘C:\\Program Files\\WordNet\\2.0\\dict/lexnames’ Instalo wordnet2.1 en este directorio pero no puedo importar. Por favor, ayúdeme a resolver este problema. import nltk from nltk import * from nltk.corpus […]

Sinónimo general y parte del procesamiento de voz usando nltk

Estoy tratando de crear un identificador de sinónimo general para las palabras en una oración que son significativas (es decir, no “a” o “the”), y estoy usando el kit de herramientas de lenguaje natural (nltk) en python para ello. El problema que tengo es que el buscador de sinónimos en nltk requiere una parte del […]

¿Cómo obtener la frecuencia de detección de wordnet de un sincronismo en NLTK?

De acuerdo con la documentación, puedo cargar un corpus etiquetado con sentido en nltk como tal: >>> from nltk.corpus import wordnet_ic >>> brown_ic = wordnet_ic.ic(‘ic-brown.dat’) >>> semcor_ic = wordnet_ic.ic(‘ic-semcor.dat’) También puedo obtener la definition , pos , offset , examples como tales: >>> wn.synset(‘dog.n.01’).examples >>> wn.synset(‘dog.n.01’).definition Pero, ¿cómo se puede obtener la frecuencia de un […]

¿Cómo calculo la distancia de la ruta más corta (geodésica) entre dos adjetivos en WordNet usando Python NLTK?

El cálculo de la similitud semántica entre dos synsets en WordNet se puede hacer fácilmente con varias medidas de similitud incorporadas, tales como: synset1.path_similarity(synset2) synset1.lch_similarity(synset2) , similitud de Leacock-Chodorow synset1.wup_similarity(synset2) , Wu-Palmer Similarity (como se ve aquí) Sin embargo, todos estos explotan las relaciones taxonómicas de WordNet, que son relaciones para sustantivos y verbos. Los […]

¿Estás usando Python nltk para encontrar similitud entre dos páginas web?

Quiero saber si dos páginas web son similares o no. ¿Alguien puede sugerir si Python nltk con wordnet similarity funciones útil y cómo? ¿Cuál es la mejor función de similitud que se utilizará en este caso?

oracion dividida sin espacio en python (nltk?)

Tengo un conjunto de palabras concatenadas y quiero dividirlas en matrices Por ejemplo : split_word(“acquirecustomerdata”) => [‘acquire’, ‘customer’, ‘data’] Encontré pyenchant , pero no está disponible para ventanas de 64 bits. Luego traté de dividir cada cadena en una cadena secundaria y luego compararlas con wordnet para encontrar una palabra equivalente. Por ejemplo : from […]

Cómo normalizar las medidas de similitud de Wordnet

Estoy tratando de calcular la similitud semántica entre dos palabras. Estoy utilizando medidas de similitud basadas en Wordnet, es decir, medida Resnik (RES), medida Lin (LIN), medida Jiang y Conrath (JNC) y medida Banerjee y Pederson (BNP). Para hacer eso, estoy usando nltk y Wordnet 3.0. A continuación, quiero combinar los valores de similitud obtenidos […]

Instalando datos nltk en el script setup.py

Utilizo NLTK con wordnet en mi proyecto. Hice la instalación manualmente en mi PC, con pip: pip3 install nltk –user en un terminal, luego nltk.download() en un shell de python para descargar wordnet. Quiero resumirlos con un archivo setup.py, pero no conozco una buena forma de instalar wordnet. Por el momento, tengo este fragmento de […]

Importar Wordnet árabe en python

Necesito hacer una función en palabras árabes usando python … y necesito vincular wordnet árabe con python para hacer algún método como: wn.synset(‘جميل’) Encuentro Léxico Multilingüe: AWN – ArabicWN http://www.talp.upc.edu/index.php/technology/resources/multilingual-lexicons-and-machine-translation-resources/multilingual-lexicons/72-awn y trato de ejecutar: un conjunto de funciones básicas de Python para acceder a la base de datos http://nlp.lsi.upc.edu/awn/AWNDatabaseManagement.py.gz pero cuando se ejecuta el código […]

¿Es la similitud de la ruta de wordnet conmutativa?

Estoy usando la API de wordnet de nltk. Cuando comparo un sincronismo con otro, obtengo None pero cuando los comparo al revés obtengo un valor flotante. ¿No deberían dar el mismo valor? ¿Hay una explicación o es un error de wordnet? Ejemplo: wn.synset(‘car.n.01’).path_similarity(wn.synset(‘automobile.v.01’)) # None wn.synset(‘automobile.v.01’).path_similarity(wn.synset(‘car.n.01’)) # 0.06666666666666667