Articles of multi index

Pandas groupby (), agg (): ¿cómo devolver resultados sin el índice múltiple?

Tengo un dataframe: pe_odds[ [ ‘EVENT_ID’, ‘SELECTION_ID’, ‘ODDS’ ] ] Out[67]: EVENT_ID SELECTION_ID ODDS 0 100429300 5297529 18.00 1 100429300 5297529 20.00 2 100429300 5297529 21.00 3 100429300 5297529 22.00 4 100429300 5297529 23.00 5 100429300 5297529 24.00 6 100429300 5297529 25.00 Cuando uso groupby y agg, obtengo resultados con un índice múltiple: pe_odds.groupby( [ […]

Estructura de datos de alta dimensión en Python

¿Cuál es la mejor manera de almacenar y analizar fechas de alta dimensión en Python? Me gusta Pandas DataFrame y Panel donde puedo manipular fácilmente el eje. Ahora tengo un hipercubo (dim> = 4) de datos. He estado pensando en cosas como dict de paneles, tupla como entradas de panel. Me pregunto si hay algo […]

Reindex subnivel de pandas dataframe multiindex

Tengo un dataframe de series de tiempo y me gustaría reindexarlo por ensayos y mediciones. Simplificado, tengo esto: value Trial 1 0 13 1 3 2 4 2 3 NaN 4 12 3 5 34 Que quiero convertir en esto: value Trial 1 0 13 1 3 2 4 2 0 NaN 1 12 3 […]

pandas: ¿cómo ejecutar un pivote con un multi-índice?

Me gustaría ejecutar un pivote en un DataFrame pandas, con el índice siendo dos columnas, no una. Por ejemplo, un campo para el año, uno para el mes, un campo de “elemento” que muestra el “elemento 1” y el “elemento 2” y un campo de “valor” con valores numéricos. Quiero que el índice sea año […]

Remodelando los marcos de datos en pandas basados ​​en tags de columnas

¿Cuál es la mejor manera de remodelar el siguiente dataframe en pandas? Este DataFrame df tiene valores x,y para cada muestra ( s1 y s2 en este caso) y se ve así: In [23]: df = pandas.DataFrame({“s1_x”: scipy.randn(10), “s1_y”: scipy.randn(10), “s2_x”: scipy.randn(10), “s2_y”: scipy.randn(10)}) In [24]: df Out[24]: s1_x s1_y s2_x s2_y 0 0.913462 0.525590 […]

¿Cómo iterar sobre niveles MultiIndex en Pandas?

A menudo tengo índices MultiIndex y me gustaría recorrer grupos en los que los índices de nivel superior son iguales. Básicamente se parece a from random import choice import pandas as pd N = 100 df = pd.DataFrame([choice([1, 2, 3]) for _ in range(N)], columns=[“A”], index=pd.MultiIndex.from_tuples([(choice(“ab”), choice(“cd”), choice(“de”)) for _ in range(N)])) for idx in […]

intervalo de tiempo en el segundo nivel de multiindex

pandas permite rebanar fresco en los índices de tiempo. Por ejemplo, puedo dividir un df para los meses de enero de 2012 a marzo de 2012 haciendo lo siguiente: df[‘2012-01′:’2012-03’] Sin embargo, tengo un df dataframe con un índice múltiple donde el índice de tiempo es el segundo nivel. Parece que: ABCDE a 2001-01-31 0.864841 […]

colapsar un pandas multiindex

Supongamos que tengo un DataFrame con columnas MultiIndex . ¿Cómo puedo colapsar los niveles a una concatenación de los valores para que solo tenga un nivel? Preparar np.random.seed([3, 14]) col = pd.MultiIndex.from_product([list(‘ABC’), list(‘DE’), list(‘FG’)]) df = pd.DataFrame(np.random.rand(4, 12) * 10, columns=col).astype(int) print df ABCDEDEDEFGFGFGFGFGFG 0 2 1 1 7 5 9 9 2 7 4 […]

Dando a una columna múltiples índices / encabezados

Estoy trabajando con marcos de datos de pandas que son esencialmente series de tiempo como esta: level Date 1976-01-01 409.67 1976-02-01 409.58 1976-03-01 409.66 … Lo que quiero tener, es múltiples índices / encabezados para la columna de nivel, así: Station1 #Name of the datasource 43.1977317,-4.6473648,5 #Lat/Lon of the source Precip #Type of data Date […]

Corte el dataframe multiindex de pandas usando la lista de valores de índice

Tengo un dataframe de índice múltiple que parece texto tid uid abc x t1 bcd y t2 uid y tid son los índices. Tengo una lista de uid s, y quiero obtener las filas correspondientes a los uids en esa lista, pero manteniendo los valores de índice de segundo nivel (tid). Quiero hacerlo sin ejecutar […]