Articles of indexing

dataframe pandas: loc vs rendimiento de consulta

Tengo 2 marcos de datos en python que me gustaría consultar para obtener datos. DF1: 4M registros x 3 columnas. La función de consulta es más eficiente que la función loc. DF2: 2K registros x 6 columnas. La función loc se ve mucho más eficiente que la función de consulta. Ambas consultas devuelven un solo […]

“IndexError: demasiados índices” en pypy de numpy

Sé que muchas personas hicieron esta pregunta, pero no pude obtener una respuesta adecuada que pueda resolver mi problema. Tengo una matriz X :: X= [1. 2. -10.] Ahora estoy tratando de hacer una matriz Y leyendo esta matriz X. Mi código es: # make Y matrix Y=np.matrix(np.zeros((len(X),2))) i=0 while i < len(load_value): if X[i,1] […]

Python Bool e int comparación e indexación en lista con valores booleanos

La indexación en la lista con valores booleanos funciona bien. Aunque el índice debe ser un entero. Lo siguiente es lo que probé en la consola: >>> l = [1,2,3,4,5,6] >>> >>> l[False] 1 >>> l[True] 2 >>> l[False + True] 2 >>> l[False + 2*True] 3 >>> >>> l[‘0’] Traceback (most recent call last): […]

Rendimiento de varios métodos de indexación de lujo numpy, también con numba

Como para mi progtwig, la indexación rápida de matrices Numpy es bastante necesaria y la indexación elegante no tiene una buena reputación en cuanto al rendimiento, decidí realizar algunas pruebas. Sobre todo porque Numba está desarrollando bastante rápido, probé qué métodos funcionan bien con numba. Como entradas, he estado usando las siguientes matrices para mi […]

adormidera taquigrafía para tomar rebanadas dentadas

Tengo una operación que estoy haciendo comúnmente y la llamo “corte irregular” porque no sé el nombre real de la misma. Se explica mejor con el ejemplo: a = np.random.randn(50, 10) entries_of_interest = np.random.randint(10, size = 50) # Vector of 50 indices between 0 and 9 # Now I want the values contained in each […]

¿Por qué obtenemos este resultado para la indexación booleana doble en Numpy?

¿Me sorprendió el resultado de la última expresión? >>> from numpy import array, arange >>> a = arange(12).reshape(3,4) >>> b1 = array([False,True,True]) # first dim selection >>> b2 = array([True,False,True,False]) # second dim selection >>> >>> a[b1,:] # selecting rows array([[ 4, 5, 6, 7], [ 8, 9, 10, 11]]) >>> >>> a[b1] # same […]

Búsqueda y indexación de archivos Python

Tengo un gran conjunto de archivos (hdf) que necesito para habilitar la búsqueda. Para Java, usaría a Lucene para esto, ya que es un motor de indexación de archivos y documentos. Sin embargo, no sé cuál sería el equivalente de python. ¿Alguien puede recomendar qué biblioteca debería usar para indexar una gran colección de archivos […]

Seleccionar elementos de la matriz numpy a través de la matriz de máscara booleana

Tengo una matriz de máscara booleana de longitud n : a = np.array([True, True, True, False, False]) Tengo una matriz 2d con n columnas: b = np.array([[1,2,3,4,5], [1,2,3,4,5]]) Quiero una nueva matriz que contenga solo los valores “Verdaderos”, por ejemplo c = ([[1,2,3], [1,2,3]]) c = a * b no funciona porque contiene también “0” […]

¿Cómo funciona la solución temporal del operador condicional de Python?

Por lo que he leído, descubrí que no existe un operador ternario incorporado (estaré encantado de saber más sobre él). Encontré el siguiente código como sustituto: def val(): var = float(raw_input(“Age:”)) status = (“Working”,”Retired”)[var>65] print “You should be:”,status No pude entender cómo funciona este código; ¿Alguien me puede explicar cómo funciona realmente el código? También […]

Obtener el índice de un elemento en un queryset

Tengo un QuerySet, llamémoslo qs , que está ordenado por algún atributo que es irrelevante para este problema. Entonces tengo un objeto, llamémoslo obj . Ahora me gustaría saber qué índice obj tiene en qs , de la manera más eficiente posible. Sé que podría usar .index() de Python o posiblemente recorrer qs comparando cada […]