Articles of elasticsearch

Ningún controlador para el tipo declarado en el campo (python elasticsearch

todos. La versión de python elasticsearch que utilicé es import elasticsearch print elasticsearch.__version__ (5, 0, 1) las asignaciones es request_body = { ‘mappings’:{ ‘post’: { ‘properties’: { ‘title’: { ‘type’: ‘text’, } } } } } El error es: {u’status ‘: 400, u’error’: {u’caused_by ‘: {u’reason’: u’No hay controlador para el tipo [texto] declarado en […]

Proceso de indexación de Django Haystack / ElasticSearch abortado

Estoy ejecutando una configuración con django 1.4, Haystack 2 beta y ElasticSearch .20. Mi base de datos es postgresql 9.1, que tiene varios millones de registros. Cuando trato de indexar todos mis datos con haystack / elasticsearch, el proceso se agota y aparece un mensaje que dice “Matado”. Hasta ahora he notado lo siguiente: Obtengo […]

Únete a todas las tablas de PostgreSQL y crea un diccionario de Python

Necesito unirme a todas las tablas de PostgreSQL y convertirlas en un diccionario de Python. Hay 72 tablas en la base de datos. El número total de columnas es mayor que 1600 . Escribí un sencillo script de Python que une varias tablas pero no logra unirlas todas debido al error de memoria . Toda […]

Cómo obtener una lista de todos los índices en python-elasticsearch

¿Cómo obtendría una lista de los nombres de un índice en Python? Aquí está lo que tengo hasta ahora: >>> es=e.es >>> es >>> es.indices # how to get a list of all indexes in this cluster?

Indexa un dataframe de pandas en Elasticsearch sin elasticsearch-py

Me gustaría indexar un montón de grandes marcos de datos de pandas (algunos millones de filas y 50 columnas) en Elasticsearch. Al buscar ejemplos sobre cómo hacer esto, la mayoría de la gente usará el método de ayuda masiva de elasticsearch-py , pasándole una instancia de la clase Elasticsearch que maneja la conexión, así como […]

Búsqueda de texto difuso en python

Me pregunto si hay alguna biblioteca de Python que pueda realizar búsquedas de texto difuso. Por ejemplo: Tengo tres palabras clave “carta” , “sello” y “correo” . Me gustaría tener una función para verificar si esas tres palabras están dentro del mismo párrafo (o ciertas distancias, una página). Además, esas palabras tienen que mantener el […]

Elasticsearch “more_like_this” consulta específica para los campos

La consulta “more_like_this” de Elasticsearch permite a los usuarios encontrar documentos similares en función de un ID de documento de búsqueda. Tengo una consulta para encontrar documentos que son similares a un documento buscado en campos específicos (es decir, título, marca, nombre de categoría). es.search(index=INDEX_NAME, body = {‘query’: { “more_like_this” : { “fields” : [‘title’, […]

¿Cómo creo un filtro “O” usando elasticsearch-dsl-py?

La siguiente pregunta es qué me gustaría construir utilizando elasticsearch–dsl-py, pero no sé cómo hacerlo. GET /my_index/_search { “query”: { “filtered”: { “filter”: { “bool”: { “must”: [ { “term”: { “status”: “published” } }, { “or”: { “filters”: [ { “range”: { “start_publication”: { “lte”: “2015-02-17T03:45:00.245012+00:00” } } }, { “missing”: { “field”: “start_publication” […]

Clasificación por múltiples parámetros en pyes y elasticsearch.

Puedo pasar un solo parámetro de clasificación a la consulta de búsqueda en pyes como esto: s = MatchAllQuery() conn.search(query=Search(s), indexes=[“test”], sort=’_score’) Pero necesito pasar un parámetro extra para ordenar los documentos con la misma puntuación, como esto: { “sort”: [ “_score”, { “extra_param”: { “order”: “asc” } } ], “query”: { “term”: { “match_all”: […]

Elasticsearch-py escanea y desplaza para devolver todos los documentos

Estoy usando elasticsearch-py para conectarme a mi base de datos de ES que contiene más de 3 millones de documentos. Quiero devolver todos los documentos para poder abstraer datos y escribirlos en un csv. Pude lograr esto fácilmente para 10 documentos (la statement predeterminada) usando el siguiente código. es=Elasticsearch(“glycerin”) query={“query” : {“match_all” : {}}} response= […]