Articles of indexación

Reemplazar subarrays en numpy

Dada una matriz, >>> n = 2 >>> a = numpy.array([[[1,1,1],[1,2,3],[1,3,4]]]*n) >>> a array([[[1, 1, 1], [1, 2, 3], [1, 3, 4]], [[1, 1, 1], [1, 2, 3], [1, 3, 4]]]) Sé que es posible reemplazar los valores de manera sucinta así. >>> a[a==2] = 0 >>> a array([[[1, 1, 1], [1, 0, 3], [1, […]

Obtener índices de elementos numpy.argmax sobre un eje

Tengo matriz N-dimensional que contiene los valores para una función con N parámetros. Cada parámetro tiene un número discreto de valores. Necesito maximizar la función sobre todos los parámetros excepto uno, lo que resulta en un vector unidimensional de tamaño igual al número de valores del parámetro no maximizado. También necesito guardar qué valores son […]

¿Cómo obtener filas en el dataframe de pandas, con valores máximos en una columna y mantener el índice original?

Tengo un dataframe de pandas. En la primera columna puede tener el mismo valor varias veces (en otras palabras, los valores de la primera columna no son únicos). Cada vez que tengo varias filas que contienen el mismo valor en la primera columna, me gustaría dejar solo las que tienen un valor máximo en la […]

numpy.argmax: cómo obtener el índice correspondiente a la * última * ocurrencia, en caso de múltiples ocurrencias de los valores máximos

Tengo una serie de números y el valor máximo puede aparecer más de una vez. ¿Es posible encontrar el índice de la última aparición del valor máximo utilizando algo como numpy.argmax? O, mejor aún, ¿es posible obtener una lista de índices de todas las apariciones del valor máximo en la matriz?

Método para indexar una base de datos de objetos

Estoy usando una base de datos de objetos (ZODB) para almacenar relaciones complejas entre muchos objetos, pero tengo problemas de rendimiento. Como resultado, comencé a construir índices para acelerar la recuperación e inserción de objetos. Aquí está mi historia y espero que puedas ayudar. Inicialmente, cuando agregaría un objeto a la base de datos, lo […]

SQLalchemy especifica qué índice usar

¿Hay alguna forma en SQLalchemy para indicar a la consulta qué índice usar? La razón por la que necesito esto es que las consultas SQL que genera utilizan el índice “incorrecto”; existe un índice para exactamente los dos campos que tengo y no lo usa. ¡Gracias!

Lista de eficiencia de indexación (python 2 vs python 3)

Al responder a otra pregunta , sugerí usar timeit para probar la diferencia entre indexar una lista con enteros positivos y enteros negativos. Aquí está el código: import timeit t=timeit.timeit(‘mylist[99]’,setup=’mylist=list(range(100))’,number=10000000) print (t) t=timeit.timeit(‘mylist[-1]’,setup=’mylist=list(range(100))’,number=10000000) print (t) Corrí este código con Python 2.6: $ python2.6 test.py 0.587687015533 0.586369991302 Luego lo ejecuté con python 3.2: $ python3.2 test.py […]

La cadena fila-índice en pd.read_csv causa el error “La etiqueta no está en el “

Estoy importando un CSV en un dataframe de pandas. Cuando hago esto, estoy configurando la columna de índice en 0, que es el índice listado (0 a 10). Recibo el error Error de clave: la etiqueta [1] no está en el [índice]. He revisado los datos varias veces para asegurarme de que la primera columna […]

Python Pandas clasificando por multiindex y columna

En Pandas 0.17 trato de ordenar por una columna específica manteniendo el índice jerárquico (A y B). B es un número de ejecución creado al configurar el dataframe a través de la concatenación. Mis datos se ven así: CD AB bar one shiny 10 two dull 5 three glossy 8 foo one dull 3 two […]

Seleccionar las últimas n columnas y excluir las últimas n columnas en el dataframe

Cómo puedo: ¿Seleccionar las últimas 3 columnas en un dataframe y crear un nuevo dataframe? Lo intenté: y = dataframe.iloc[:,-3:] ¿Excluir las últimas 3 columnas y crear un nuevo dataframe? Lo intenté: X = dataframe.iloc[:,:-3] ¿Es esto correcto? Recibo más errores de matriz en mi código y quiero asegurarme de que este paso sea correcto. […]