Articles of indexación

¿Cómo administro correctamente un índice legado de neo4j-community-3.1.0 lucene? (problemas realmente extraños)

Tengo problemas extraños con la indexación heredada de Neo4j y hoy me he quedado atascado. Necesito soporte de texto completo, ya que deseo realizar una comparación de rendimiento con Solr (que utiliza el texto completo de Lucene) para ver cómo se comparan los diferentes modelos de datos. He estado siguiendo algunas guías en línea, así […]

Consulta rápida en datos formateados

En mi progtwig necesito consultar a través de metadatos. Leí datos en la numpy registros numpy A del archivo de texto similar a csv ** sin filas duplicadas **. var1|var2|var3|var4|var5|var6 ‘a1’|’b1’|’c1’|1.2|2.2|3.4 ‘a1’|’b1’|’c4’|3.2|6.2|3.2 ‘a2’|”|’c1’|1.4|5.7|3.8 ‘a2’|’b1’|’c2’|1.2|2.2|3.4 ‘a3’|”|’c2’|1.2|2.2|3.4 ‘a1’|’b2’|’c4’|7.2|6.2|3.2 … Hay millones de filas y la consulta en bucles nesteds puede ser hasta mil millones de veces (en […]

Cálculo del crecimiento interanual por grupos en Pandas.

Tengo el siguiente dataframe : In [1]: df Out[1]: ID Month Transaction_Amount 1 2013/01 10 1 2013/02 20 1 2013/03 10 1 2013/04 20 1 2013/05 10 1 2013/06 20 1 2013/07 10 1 2013/08 20 1 2013/09 10 1 2013/10 20 1 2013/11 10 1 2013/12 20 1 2014/01 15 1 2014/02 25 1 […]

Reemplazar subarrays en numpy

Dada una matriz, >>> n = 2 >>> a = numpy.array([[[1,1,1],[1,2,3],[1,3,4]]]*n) >>> a array([[[1, 1, 1], [1, 2, 3], [1, 3, 4]], [[1, 1, 1], [1, 2, 3], [1, 3, 4]]]) Sé que es posible reemplazar los valores de manera sucinta así. >>> a[a==2] = 0 >>> a array([[[1, 1, 1], [1, 0, 3], [1, […]

Obtener índices de elementos numpy.argmax sobre un eje

Tengo matriz N-dimensional que contiene los valores para una función con N parámetros. Cada parámetro tiene un número discreto de valores. Necesito maximizar la función sobre todos los parámetros excepto uno, lo que resulta en un vector unidimensional de tamaño igual al número de valores del parámetro no maximizado. También necesito guardar qué valores son […]

¿Cómo obtener filas en el dataframe de pandas, con valores máximos en una columna y mantener el índice original?

Tengo un dataframe de pandas. En la primera columna puede tener el mismo valor varias veces (en otras palabras, los valores de la primera columna no son únicos). Cada vez que tengo varias filas que contienen el mismo valor en la primera columna, me gustaría dejar solo las que tienen un valor máximo en la […]

numpy.argmax: cómo obtener el índice correspondiente a la * última * ocurrencia, en caso de múltiples ocurrencias de los valores máximos

Tengo una serie de números y el valor máximo puede aparecer más de una vez. ¿Es posible encontrar el índice de la última aparición del valor máximo utilizando algo como numpy.argmax? O, mejor aún, ¿es posible obtener una lista de índices de todas las apariciones del valor máximo en la matriz?

Método para indexar una base de datos de objetos

Estoy usando una base de datos de objetos (ZODB) para almacenar relaciones complejas entre muchos objetos, pero tengo problemas de rendimiento. Como resultado, comencé a construir índices para acelerar la recuperación e inserción de objetos. Aquí está mi historia y espero que puedas ayudar. Inicialmente, cuando agregaría un objeto a la base de datos, lo […]

SQLalchemy especifica qué índice usar

¿Hay alguna forma en SQLalchemy para indicar a la consulta qué índice usar? La razón por la que necesito esto es que las consultas SQL que genera utilizan el índice “incorrecto”; existe un índice para exactamente los dos campos que tengo y no lo usa. ¡Gracias!

Lista de eficiencia de indexación (python 2 vs python 3)

Al responder a otra pregunta , sugerí usar timeit para probar la diferencia entre indexar una lista con enteros positivos y enteros negativos. Aquí está el código: import timeit t=timeit.timeit(‘mylist[99]’,setup=’mylist=list(range(100))’,number=10000000) print (t) t=timeit.timeit(‘mylist[-1]’,setup=’mylist=list(range(100))’,number=10000000) print (t) Corrí este código con Python 2.6: $ python2.6 test.py 0.587687015533 0.586369991302 Luego lo ejecuté con python 3.2: $ python3.2 test.py […]