Articles of elasticsearch

Búsqueda de texto difuso en python

Me pregunto si hay alguna biblioteca de Python que pueda realizar búsquedas de texto difuso. Por ejemplo: Tengo tres palabras clave “carta” , “sello” y “correo” . Me gustaría tener una función para verificar si esas tres palabras están dentro del mismo párrafo (o ciertas distancias, una página). Además, esas palabras tienen que mantener el […]

Elasticsearch “more_like_this” consulta específica para los campos

La consulta “more_like_this” de Elasticsearch permite a los usuarios encontrar documentos similares en función de un ID de documento de búsqueda. Tengo una consulta para encontrar documentos que son similares a un documento buscado en campos específicos (es decir, título, marca, nombre de categoría). es.search(index=INDEX_NAME, body = {‘query’: { “more_like_this” : { “fields” : [‘title’, […]

¿Cómo creo un filtro “O” usando elasticsearch-dsl-py?

La siguiente pregunta es qué me gustaría construir utilizando elasticsearch–dsl-py, pero no sé cómo hacerlo. GET /my_index/_search { “query”: { “filtered”: { “filter”: { “bool”: { “must”: [ { “term”: { “status”: “published” } }, { “or”: { “filters”: [ { “range”: { “start_publication”: { “lte”: “2015-02-17T03:45:00.245012+00:00” } } }, { “missing”: { “field”: “start_publication” […]

Clasificación por múltiples parámetros en pyes y elasticsearch.

Puedo pasar un solo parámetro de clasificación a la consulta de búsqueda en pyes como esto: s = MatchAllQuery() conn.search(query=Search(s), indexes=[“test”], sort=’_score’) Pero necesito pasar un parámetro extra para ordenar los documentos con la misma puntuación, como esto: { “sort”: [ “_score”, { “extra_param”: { “order”: “asc” } } ], “query”: { “term”: { “match_all”: […]

Elasticsearch-py escanea y desplaza para devolver todos los documentos

Estoy usando elasticsearch-py para conectarme a mi base de datos de ES que contiene más de 3 millones de documentos. Quiero devolver todos los documentos para poder abstraer datos y escribirlos en un csv. Pude lograr esto fácilmente para 10 documentos (la statement predeterminada) usando el siguiente código. es=Elasticsearch(“glycerin”) query={“query” : {“match_all” : {}}} response= […]

No se puede iniciar elasticsearch como un servicio en ubuntu 16.04

Recientemente he actualizado mi máquina de Ubuntu 14.04 a 16.04 . Estoy enfrentando el problema de usar el servicio elasticsearch . Instalé elasticsearch usando: sudo apt-get install elasticsearch Ahora el comando sudo service elasticsearch status me muestra este resultado: elasticsearch.service – LSB: Starts elasticsearch Loaded: loaded (/etc/init.d/elasticsearch; bad; vendor preset: enabled) Active: active (exited) since […]

¿Cómo ejecutar este CURL en python 2.7 para eliminar documentos de Elasticsearch?

Hola soy nuevo en python y elasticsearch. En mi local, he configurado Elasticsearch y le he agregado datos. http://127.0.0.1:9200/index_data/type_data . Quiero eliminar algunos _ids de type_data. Supongamos que la lista de _ID son x = [‘a’, ‘b’, ‘c’. ‘d’] que quiero eliminar. curl -XDELETE ‘localhost: 9200 / index_data / type_data / a? pretty’ usando este […]

agregue un campo en elasticsearch-dsl usando python

¿Alguien me puede decir cómo escribir sentencias de Python que agregarán (sumrán y contarán) cosas sobre mis documentos? GUIÓN from datetime import datetime from elasticsearch_dsl import DocType, String, Date, Integer from elasticsearch_dsl.connections import connections from elasticsearch import Elasticsearch from elasticsearch_dsl import Search, Q # Define a default Elasticsearch client client = connections.create_connection(hosts=[‘http://blahblahblah:9200’]) s = Search(using=client, […]

¿Cómo hacer uso de la caché del sistema de archivos en Java o Python?

Una publicación reciente del blog en el sitio web de Elasticsearch habla de las características de su nueva versión 1.4 beta. Tengo mucha curiosidad acerca de cómo hacen uso del caché del sistema de archivos: Las versiones recientes han agregado soporte para los valores de doc. Esencialmente, los valores de documento proporcionan la misma función […]

El pajar de Django EdgeNgramField obtuvo resultados diferentes a los de elasticsearch

Actualmente estoy ejecutando un pajar con un backend de elasticsearch, y ahora estoy construyendo un autocompletado para los nombres de las ciudades. El problema es que SearchQuerySet me está dando resultados diferentes, que desde mi perspectiva son incorrectos, que la misma consulta ejecutada directamente en elasticsearch, que son para mí los resultados esperados. Estoy usando: […]