Articles of cassandra

Descriptor de archivo de inundación de TimeRID de Cassandra cuando se usa uuid en forma predeterminada

Tengo el modelo de Cassandra como import uuid from cassandra.cqlengine import columns from cassandra.cqlengine.models import Model class MyModel(Model): … … created_at = columns.TimeUUID(primary_key=True, clustering_order=’DESC’, default=uuid.uuid1) … … La aplicación uuid1 de forma recentrada no cierra los archivos: alcanza el límite del descriptor de archivos . Intento encontrar la solución, pero parece que las opciones creo […]

¿Cómo puedo lograr el rendimiento de 50 k / s al insertar mis datos en Cassandra mientras leo la entrada de un archivo csv?

Mi objective es boost el rendimiento de los datos de versiones en Cassandra. He usado lecturas y escrituras concurrentes y también he aumentado el tamaño de trozo que mi código lee en el archivo. Mi máquina es de 16 gb con 8 núcleos y sí, he cambiado el archivo yaml de Cassandra para 10k lecturas […]

Django con base de datos NoSQL

Estoy trabajando con una aplicación Django que usa la versión Django 1.8 . La mayoría de los datos con los que tratamos son de formato JSON. Estamos tratando de implementar cualquier base de datos NoSQL . Pero veo que MONGODB no es compatible con la versión 1.8 o superior y ¿hay alguna base de datos […]

No se puede conectar a Cassandra de forma remota con el controlador DataStax Python

Tengo problemas para conectarme a Cassandra (que se ejecuta en un nodo EC2) de forma remota (desde mi computadora portátil). Cuando uso el controlador DataStax Python para Cassandra: from cassandra.cluster import Cluster cluster = Cluster([’10.XXX’], port=9042) cluster.connect() Yo obtengo: Traceback (most recent call last): File “/Users/user/virtualenvs/test/lib/python2.7/site-packages/IPython/core/interactiveshell.py”, line 3035, in run_code exec(code_obj, self.user_global_ns, self.user_ns) File “”, […]

Paginación de Cassandra: cómo usar get_slice para consultar una base de datos de Cassandra 1.2 desde Python usando la biblioteca cql

Tengo un cluster Cassandra 1.2 y lo estoy usando desde Python usando la biblioteca cql. Ahora necesito implementar alguna funcionalidad de paginación que parece bastante sencilla usando get_slice, pero no puedo encontrar ninguna documentación sobre cómo usar algo como esto en la biblioteca cql: get_slice(“key” : table_key, “column_parent” : {“column_family” : “MyColumnFamily”}, “predicate” : { […]

Error de decapado al ejecutar el comando COPY: CQLShell en Windows

Estamos ejecutando un comando de copia en CQLShell en Windows 7. Al principio, nos encontramos con un “COMANDO DE COPIA INCORRECTO”: COPY ourdata(data_time, data_ID, dataBlob) FROM ‘TestData.csv’ WITH HEADER = true; Más tarde comenzamos a recibir este error después de ejecutar el mismo comando: Error starting import process: Can’t pickle : it’s not found as […]

Error: no se puede conectar al servidor cassandra. Tabla no configurada

Estoy tratando de conectarme a cassandra, que se ejecuta en el escritorio local, a través de cassandra-driver para python usando este simple código. from cassandra.cluster import Cluster cluster = Cluster() session = cluster.connect() y obteniendo este error: NoHostAvailable: (‘No se puede conectar a ningún servidor’, {‘127.0.0.1’: InvalidRequest (u’code = 2200 [Consulta no válida] message = […]

Cassandra: Archivo “cqlsh”, línea 95 excepto ImportError, e:

Estoy teniendo problemas para poner en funcionamiento a Cassandra. He descargado Cassandra 2.0.1 y Python 3.3.2. Al iniciar el CLI para cassandra me sale un error: C:\Dev\ApacheCassandra\apache-cassandra-2.0.1\bin>python cqlsh File “cqlsh”, line 95 except ImportError, e: ^ SyntaxError: invalid syntax ¿Alguna sugerencia? Voy a bajar Python a 2.7 y ver si eso soluciona mi problema. ¡Gracias!

Python leyó los datos de Cassandra en pandas

¿Cuál es la forma correcta y más rápida de leer los datos de Cassandra en pandas? Ahora uso el siguiente código pero es muy lento … import pandas as pd from cassandra.cluster import Cluster from cassandra.auth import PlainTextAuthProvider from cassandra.query import dict_factory auth_provider = PlainTextAuthProvider(username=CASSANDRA_USER, password=CASSANDRA_PASS) cluster = Cluster(contact_points=[CASSANDRA_HOST], port=CASSANDRA_PORT, auth_provider=auth_provider) session = cluster.connect(CASSANDRA_DB) session.row_factory […]

Cassandra / Pycassa: Obteniendo filas al azar

¿Existe la posibilidad de recuperar filas aleatorias de Cassandra (usándolas con Python / Pycassa)? Actualización: ¡Con filas aleatorias me refiero a filas seleccionadas al azar !