Articles of cassandra

Cassandra Batch Insert en Python

Necesito hacer un INSERT lotes en Cassandra usando Python . Estoy usando el último controlador de Datastax python. Los INSERTS son lotes de columnas que estarán en la misma fila. Tendré muchas filas para insertar, pero los fragmentos de los datos estarán en la misma fila. Puedo realizar INSERTS individuales en un for loop como […]

Cassandra: “No se puede completar la operación contra ningún host” durante session.execute ()

Versión de Cassandra: 1.2.2 Thrift API version: 19.35.0 Versiones compatibles con CQL: 2.0.0,3.0.1 (predeterminado: 3.0.1) cassandra-driver para python 3.4 corriendo cassandra / bin / cassandra con sudo Ejemplo de código : from cassandra.cluster import Cluster cluster = Cluster() session = cluster.connect() # 1 session.execute(“use test”) # 2 cluster.shutdown() Mensaje de error para el # 2: […]

Cuando cassandra-driver estaba ejecutando la consulta, cassandra-driver devolvió el error OperationTimedOut

Yo uso el script de Python, que pasa a la consulta por lotes de Cassandra, como esto: query = ‘BEGIN BATCH ‘ + ‘insert into … ; insert into … ; insert into …; ‘ + ‘ APPLY BATCH;’ session.execute(query) Es tiempo de trabajo, pero en aproximadamente 2 minutos después de que los guiones de […]

Serializar un dict de Python en una columna Cassandra 1.2

El problema Estoy tratando de guardar un objeto serializado (usando cPickle) en una columna de Cassandra 1.2, estoy usando la biblioteca de Python cql . Ya he intentado definir la columna como texto (cadena utf8) y blob, en ambos casos recibo el mismo error: El objeto es un dict de Python: obj = {‘id’:’sometextid’, ‘time_created’:05/12/2013, […]

Cómo pasar el nombre de usuario y la contraseña a Cassandra en Python

Estoy aprendiendo y solo configuro mi grupo Cassandra y trato de usar Python como el cliente para interactuar con él. En el yaml, configuro el autenticador como PasswordAuthenticator. Así que ahora planeo proporcionar mi nombre de usuario y contraseña a la función de conexión pero no encuentro dónde colocarlos. cluster = Cluster(hosts) session = cluster.connect(keyspace) […]

¿Por qué mi base de datos Cassandra es tan lenta en la lectura de datos? Me gustaría leer 100,000 filas en menos de 10s

Tengo una tabla de cassandra ‘artículos’ con 400,000 filas con primary key (source,created_at desc) Cuando pregunto nuestros datos usando: select * from articles where source = ‘abc’ and created_at <= '2016-01-01 00:00:00' Se tarda 8 minutos en cargar 110,000 filas. Esto es extremadamente lento y no sé dónde está el error. Me gustaría cargar 100,000 […]

Cassandra cqlsh “no se puede conectar a ningún servidor”

Recibo el siguiente mensaje al ejecutar cqlsh.bat en la línea de comandos Connection error: (‘Unable to connect to any servers’, {‘127.0.0.1’: ProtocolError(“cql_version ‘3.3.0’ is not supported by remote (w/ native protocol). Supported versions: [u’3.2.0′]”,)}) Estoy ejecutando Python versión 2.7.10 junto con Cassandra versión 2.2.1. No estoy seguro de si está relacionado, pero cuando inicio el […]

¿La mejor biblioteca / envoltorio de Cassandra para Python?

Encontré lazyboy y pycassa , tal vez hay otros también. He visto muchos sitios que recomiendan a lazyboy. En mi humilde opinión, el proyecto parece muerto, vea https://www.ohloh.net/p/compare?project_0=pycassa&project_1=lazyboy Entonces, ¿cuál es la mejor opción para un nuevo proyecto? Gracias.

Reutilización de la sesión de la base de datos Cassandra en AWS Lambda (python)

Estoy tratando de reutilizar una sesión de clúster de Cassandra para las siguientes llamadas a la función de AWS Lambda. Lo he implementado con éxito en Java, pero al reutilizar la sesión en python se agota el tiempo de espera de la invocación lambda (la primera llamada que realiza la inicialización está bien). Desde los […]

Verifique si existe un registro en una tabla de Cassandra usando el controlador Python

¿Cómo se puede determinar si existe un registro en una tabla? La forma en que lo intenté fue hacer una consulta SELECT y luego contar las filas del ResultSet usando lo siguiente: rows = session.execute(“SELECT * FROM test_table WHERE id=%s”, ([])) if len(rows) == 0: print “Does not exist” Sin embargo, ResultSet no admite len […]