Articles of elasticsearch

Volcar datos elásticos en csv o en cualquier NOSQL a través de python

Como sabemos, no podemos obtener más de 10000 filas en python desde la búsqueda elástica debido a un problema de error de conexión. Quiero datos durante dos horas de mi grupo elástico y por cada 5 minutos, tengo aproximadamente 10000 observaciones. 1.) ¿Hay alguna forma si puedo simplemente descargar los datos de búsqueda elástica directamente […]

Cómo utilizar elasticsearch.helpers.streaming_bulk

Alguien puede recomendar cómo usar la función elasticsearch.helpers.streaming_bulk en lugar de elasticsearch.helpers.bulk para indexar datos en elasticsearch. Si simplemente cambio streaming_bulk en lugar de en bloque, nada se indexa, por lo que supongo que se debe utilizar de forma diferente. El código a continuación crea datos de índice, tipo e índice del archivo CSV en […]

Formato de la salida de elasticsearch-py

Estoy tratando de usar el cliente de python para elasticsearch . Aquí hay un ejemplo mínimo: import logging logging.basicConfig() from elasticsearch import Elasticsearch as ES print “Setup connection…” es=ES([‘localhost:8080′]) print “Done!” print “Count number of users…” print es.count(index=’users’) La salida es: {u’count’: 836780, u’_shards’: {u’successful’: 5, u’failed’: 0, u’total’: 5}} Tengo dos preguntas: ¿Cómo me […]

Búsqueda elástica que no da datos con gran número para el tamaño de la página

Tamaño de los datos a obtener: 20,000 aprox. Problema: buscar datos indexados de Elastic Search usando el comando de abajo en python Pero no obteniendo ningún resultado. from pyelasticsearch import ElasticSearch es_repo = ElasticSearch(settings.ES_INDEX_URL) search_results = es_repo.search( query, index=advertiser_name, es_from=_from, size=_size) Si doy un tamaño menor o igual a 10,000, funciona bien pero no con […]

MapperParsingException sobre la reconstrucción del índice de generación en django-haystack con elasticsearch

Estoy usando java 1.7.0_95 , Django 1.8.4 , Python 3.4.0 , Django Rest Framework 3.1.3 , ElasticSearch 2.3.1 , pyelasticsearch 1.4 y Django Haystack 2.4.1 Estoy experimentando un error en elasticsearch cada vez que bash hacer python manage.py rebuild_index . Este es el error: MapperParsingException [La definición de asignación de raíz tiene parámetros no compatibles: […]

No puedo conseguir que Elasticsearch trabaje con Django

Estoy tratando de usar Django y Haystack con Elasticsearch como backend en Ubuntu 14.04. Tengo Elasticsearch y Haystack instalados. El error que recibo cuando ejecuto python manage.py runserver: me@ubuntu:$ python manage.py runserver Validating models… 0 errors found January 31, 2015 – 17:40:37 Django version 1.5.4, using settings ‘website_project.settings’ Development server is running at http://127.0.0.1:8000/ Quit […]

Compruebe el estado de la conexión elasticsearch en python

Estoy tratando de conectar elasticsearch en mi local y me pregunto cómo puedo saber si la conexión ha sido exitosa o fallida antes de continuar con el proceso: deseo que sea posible con la forma que utilizo a continuación, pero no (devuelve demasiados valores pero todos son inútiles) : try: es = Elasticsearch([‘http://localhost:9200/’], verify_certs=True) except […]

Índice a granel de Elasticsearch en trozos utilizando PyEs

Tengo un script de python simple para indexar un archivo CSV que contiene 1 millón de filas: import csv from pyes import * reader = csv.reader(open(‘data.csv’, ‘rb’)) conn = ES(‘127.0.0.1:9200′, timeout=20.0) counter = 0 for row in reader: try: data = {“name”:row[5]} conn.index(data,’namesdb’,counter, bulk=True) counter += 1 except: pass Esto funciona bastante bien, pero a […]

¿Cómo actualizar un documento usando elasticsearch-py?

¿Alguien tiene un ejemplo de cómo usar la actualización? Se documenta aquí , pero la documentación no está clara y no incluye un ejemplo práctico. He intentado lo siguiente: coll = Elasticsearch() coll.update(index=’stories-test’,doc_type=’news’,id=hit.meta.id, body={“stanford”: 1, “parsed_sents”: parsed }) y me pongo elasticsearch.exceptions.RequestError: TransportError(400, u’ActionRequestValidationException[Validation Failed: 1: script or doc is missing;]’) Me gustaría actualizar utilizando […]

Error: El backend ‘elasticsearch’ requiere la instalación de ‘solicitudes’. ¿Cómo lo arreglo?

Tengo un problema cuando ejecuté “python manage.py rebuild_index” en mi aplicación con el apoyo de haystack y elasticsearch. Python 2.7 Django versión 1.6.2 Haystack 2.1.0 Elasticsearch 1.0 Por favor vea el error que está apareciendo: Seguimiento (última llamada más reciente): archivo “manage.py”, línea 10, en execute_from_command_line (sys.argv) Archivo “/usr/lib/python2.7/site-packages/django/core/management/ init .py” , línea 399, en> […]