Articles of elasticsearch

elasticsearch actualización parcial con python

Tengo un documento de elasticsearch en el siguiente formato. Necesito actualizar parcialmente el campo “x” y agregar un dict de python en él. { “_index”: “gdata34”, “_type”: “gdat”, “_id”: “328091-72341-118”, “_version”: 1, “_score”: 1, “_source”: { “d”: { “Thursday”: { “s”: “” }, “Email”: { “s”: “” }, “Country”: { “s”: “US” }, }, “x”: […]

Cómo habilitar track_scores en elasticsearch-dsl python

Estoy usando elasticsearch dsl para buscar en elasticsearch: https://elasticsearch-dsl.readthedocs.org/en/latest/ ¿Cómo puedo habilitar track_scores para la consulta? Sé que es compatible con elasticsearch: https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-sort.html#_track_scores Simplemente no sé cómo hacer lo mismo en Elasticsearch-dsl

¿Cómo obtener n objetos de búsqueda de un SearchQuerySet sin cambiar el tipo?

Estoy tratando de obtener los 10 objetos como: q_auth = SearchQuerySet().filter(content=validate_query) q_auth = q_auth[:10] print type(q_auth) La salida que quiero es: pero estoy obteniendo es . ¿Puede alguien ayudarme?

Ningún controlador para el tipo declarado en el campo (python elasticsearch

todos. La versión de python elasticsearch que utilicé es import elasticsearch print elasticsearch.__version__ (5, 0, 1) las asignaciones es request_body = { ‘mappings’:{ ‘post’: { ‘properties’: { ‘title’: { ‘type’: ‘text’, } } } } } El error es: {u’status ‘: 400, u’error’: {u’caused_by ‘: {u’reason’: u’No hay controlador para el tipo [texto] declarado en […]

Proceso de indexación de Django Haystack / ElasticSearch abortado

Estoy ejecutando una configuración con django 1.4, Haystack 2 beta y ElasticSearch .20. Mi base de datos es postgresql 9.1, que tiene varios millones de registros. Cuando trato de indexar todos mis datos con haystack / elasticsearch, el proceso se agota y aparece un mensaje que dice “Matado”. Hasta ahora he notado lo siguiente: Obtengo […]

Únete a todas las tablas de PostgreSQL y crea un diccionario de Python

Necesito unirme a todas las tablas de PostgreSQL y convertirlas en un diccionario de Python. Hay 72 tablas en la base de datos. El número total de columnas es mayor que 1600 . Escribí un sencillo script de Python que une varias tablas pero no logra unirlas todas debido al error de memoria . Toda […]

Cómo obtener una lista de todos los índices en python-elasticsearch

¿Cómo obtendría una lista de los nombres de un índice en Python? Aquí está lo que tengo hasta ahora: >>> es=e.es >>> es >>> es.indices # how to get a list of all indexes in this cluster?

Indexa un dataframe de pandas en Elasticsearch sin elasticsearch-py

Me gustaría indexar un montón de grandes marcos de datos de pandas (algunos millones de filas y 50 columnas) en Elasticsearch. Al buscar ejemplos sobre cómo hacer esto, la mayoría de la gente usará el método de ayuda masiva de elasticsearch-py , pasándole una instancia de la clase Elasticsearch que maneja la conexión, así como […]

Búsqueda de texto difuso en python

Me pregunto si hay alguna biblioteca de Python que pueda realizar búsquedas de texto difuso. Por ejemplo: Tengo tres palabras clave “carta” , “sello” y “correo” . Me gustaría tener una función para verificar si esas tres palabras están dentro del mismo párrafo (o ciertas distancias, una página). Además, esas palabras tienen que mantener el […]

Elasticsearch “more_like_this” consulta específica para los campos

La consulta “more_like_this” de Elasticsearch permite a los usuarios encontrar documentos similares en función de un ID de documento de búsqueda. Tengo una consulta para encontrar documentos que son similares a un documento buscado en campos específicos (es decir, título, marca, nombre de categoría). es.search(index=INDEX_NAME, body = {‘query’: { “more_like_this” : { “fields” : [‘title’, […]