Articles of lucene

Encontrar términos de un solo campo con Lucene (PyLucene)

Soy bastante nuevo en los Vectores de términos de Lucene, y quiero asegurarme de que mi recostackción de términos sea lo más eficiente posible. Obtengo los términos únicos y luego recupero el docFreq () del término para realizar facetado. Estoy recostackndo todos los términos de los documentos del índice utilizando: lindex = SimpleFSDirectory(File(indexdir)) ireader = […]

Búsqueda de texto completo y Python

¿Puede alguien ayudarme con alguna sugerencia para un motor de búsqueda de texto completo que admita Python? En este momento, tenemos una base de datos MySQL y me gustaría agregar la capacidad de tener un índice de motor de búsqueda de texto completo en algunas de las tablas de esta base de datos. Estos datos […]

Pyparsing un formato de consulta a otro

Estoy en una pérdida. Llevo días intentando que esto funcione. Pero no estoy llegando a ninguna parte con esto, ¡así que pensé en consultarles aquí y ver si alguien puede ayudarme! Estoy utilizando el uso de pyparsing en un bash de analizar un formato de consulta a otro. Esto no es una transformación simple pero […]

¿Hay un Python Lucene puro?

La gente de Ruby tiene hurón . Alguien sabe de alguna iniciativa similar para Python? Estamos usando PyLucene en el momento actual, pero me gustaría investigar cómo realizar búsquedas en Python puro.

Edificio Pylucene en Ubuntu 14.04 (trusty tahr)

De acuerdo con las instrucciones de instalación, JCC se construyó con éxito. Las dependencias instaladas fueron: ant, openjdk-7-jdk, python-setuptools, python-dev. Luego, procediendo a hacer pylucene, en “Makefile” elijo las especificaciones correspondientes a Ubuntu 11. # Linux (Ubuntu 11.10 64-bit, Python 2.7.2, OpenJDK 1.7, setuptools 0.6.16) # Be sure to also set JDK[‘linux2’] in jcc’s setup.py […]

Búsqueda y indexación de archivos Python

Tengo un gran conjunto de archivos (hdf) que necesito para habilitar la búsqueda. Para Java, usaría a Lucene para esto, ya que es un motor de indexación de archivos y documentos. Sin embargo, no sé cuál sería el equivalente de python. ¿Alguien puede recomendar qué biblioteca debería usar para indexar una gran colección de archivos […]