Articles of multi index

Dando a una columna múltiples índices / encabezados

Estoy trabajando con marcos de datos de pandas que son esencialmente series de tiempo como esta: level Date 1976-01-01 409.67 1976-02-01 409.58 1976-03-01 409.66 … Lo que quiero tener, es múltiples índices / encabezados para la columna de nivel, así: Station1 #Name of the datasource 43.1977317,-4.6473648,5 #Lat/Lon of the source Precip #Type of data Date […]

Corte el dataframe multiindex de pandas usando la lista de valores de índice

Tengo un dataframe de índice múltiple que parece texto tid uid abc x t1 bcd y t2 uid y tid son los índices. Tengo una lista de uid s, y quiero obtener las filas correspondientes a los uids en esa lista, pero manteniendo los valores de índice de segundo nivel (tid). Quiero hacerlo sin ejecutar […]

Marco de datos de Pandas con columna multiindex – fusionar niveles

Tengo un dataframe, grouped , con columnas multiindex como se muestra a continuación: import pandas as pd codes = [“one”,”two”,”three”]; colours = [“black”, “white”]; textures = [“soft”, “hard”]; N= 100 # length of the dataframe df = pd.DataFrame({ ‘id’ : range(1,N+1), ‘weeks_elapsed’ : [random.choice(range(1,25)) for i in range(1,N+1)], ‘code’ : [random.choice(codes) for i in range(1,N+1)], […]

Reemplazo de valores en un multi-índice pandas

Tengo un dataframe con un multi-índice. Quiero cambiar el valor del segundo índice cuando se cumplen ciertas condiciones en el primer índice. Encontré una pregunta similar (pero diferente) aquí: Reemplace un valor en MultiIndex (pandas) que no responde a mi punto porque se trataba de cambiar una sola fila, y la solución pasó el valor […]

seleccionando de pandas multi-index

Tengo un dataframe de índice múltiple con las columnas ‘A’ y ‘B’. Existe una forma de seleccionar filas filtrando en una columna del índice múltiple sin restablecer el índice a un índice de columna única. Por ejemplo. # has multi-index (A,B) df #can i do this? I know this doesnt work because index is multi-index […]

Selección de filas de un dataframe de Pandas con un índice compuesto (jerárquico)

Sospecho que esto es trivial, pero aún tengo que descubrir el conjuro que me permitirá seleccionar filas de un dataframe de Pandas basado en los valores de una clave jerárquica. Entonces, por ejemplo, imagine que tenemos el siguiente dataframe: import pandas df = pandas.DataFrame({‘group1’: [‘a’,’a’,’a’,’b’,’b’,’b’], ‘group2’: [‘c’,’c’,’d’,’d’,’d’,’e’], ‘value1’: [1.1,2,3,4,5,6], ‘value2’: [7.1,8,9,10,11,12] }) df = df.set_index([‘group1’, […]

Cómo dividir un MultiIndex DataFrame con el MultiIndex de otro

Tengo un dataframe de pandas con 3 niveles de un MultiIndex. Estoy tratando de sacar filas de este dataframe de acuerdo con una lista de valores que corresponden a dos de los niveles. Tengo algo como esto: ix = pd.MultiIndex.from_product([[1, 2, 3], [‘foo’, ‘bar’], [‘baz’, ‘can’]], names=[‘a’, ‘b’, ‘c’]) data = np.arange(len(ix)) df = pd.DataFrame(data, […]

Cómo filtrar fechas en el dataframe multiindex

Estoy buscando una manera de filtrar un dataframe multiindex como el siguiente por día de la semana y / o fechas seleccionadas. Digamos que necesito una consulta para select only mondays ; otra consulta en la que quiero select all days except monday and friday ; una tercera consulta para seleccionar los datos presentes en […]

Pandas: forma correcta de establecer valores según la condición para el subconjunto de dataframe multiindex

No estoy seguro de cómo hacer esto sin asignaciones encadenadas (lo que probablemente no funcionaría de todos modos porque estaría configurando una copia). No voy a tomar un subconjunto de un dataframe de múltiples índices de pandas, probar valores menores a cero y establecerlos en cero. Por ejemplo: df = pd.DataFrame({(‘A’,’a’): [-1,-1,0,10,12], (‘A’,’b’): [0,1,2,3,-1], (‘B’,’a’): […]

Multiindex y zona horaria – Error de lista congelada

Intento cambiar la zona horaria de un DataFramebut multiindex, pero aparece un error de lista congelada. ¿Alguien tiene alguna idea de cómo proceder? >>> array = [(‘s001′, d) for d in pd.date_range(start=’01/01/2014′, end=’01/01/2015′, freq=’H’)] + [(‘s002′, d) for d in pd.date_range(start=’01/01/2014′, end=’01/01/2015′, freq=’H’)] >>> index = pd.MultiIndex.from_tuples(array, names=[‘sce’, ‘DATES’]) >>> df = pd.DataFrame(np.random.randn(len(index)), index=index) >>> […]