Articles of multi index

Suma filas duplicadas en un dataframe pandas de múltiples índices

Hola estoy teniendo problemas para tratar con Pandas. Estoy tratando de sumr filas duplicadas en un Dataframe multiindex. df.groupby(level=[0,1]).sum() con df.groupby(level=[0,1]).sum() , también con df.stack().reset_index().groupby([‘year’, ‘product’]).sum() y algunos otros, pero no puedo hacerlo funcionar. También me gustaría agregar cada producto único para cada año dado y darles un valor de 0 si no estaban en […]

Pandas Multiindex from array => TypeError: tipo unsashable: ‘dict’

Estoy tratando de crear el dataframe desde la matriz con la siguiente estructura: df = [[{‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘Tom’, ‘value’: ‘129’}, {‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘Kate’, ‘value’: ‘0’}, {‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘GroupeId’, ‘value’: ‘0’}, {…}, {…}, {…}],[another list of dictionaries like the first one],[and another one]] usando este código: def create_from_arr(): baby_array=pd.MultiIndex.from_tuples(df, names=[‘sessions’, […]

Convertir un dataframe MultiIndex de pandas de filas a columnas

Estoy trabajando en zipline y pandas y he convertido un pandas.Panel en un pandas.DataFrame usando el método to_frame() . Este es el resultado de pandas.DataFrame que, como puede ver, tiene múltiples pandas.DataFrame : price major minor 2008-01-03 00:00:00+00:00 SPY 129.93 KO 26.38 PEP 64.78 2008-01-04 00:00:00+00:00 SPY 126.74 KO 26.43 PEP 64.59 2008-01-07 00:00:00+00:00 SPY […]

Reemplace un valor en MultiIndex (pandas)

En el siguiente DataFrame: ¿Cómo puedo reemplazar [“x2”, “Total”] con [“x2”, “x2”] dejando x1 como está? l1 900 902 912 913 916 l2 ИП ПС ИП ПС ИП ПС ИП ПС ИП ПС i1 i2 x1 Total 10 6 3 3 10 16 2 9 3 8 x2 Total 1 0 0 0 0 0 […]

¿Usando .loc con un MultiIndex en pandas?

¿Alguien sabe si es posible usar el método DataFrame.loc para seleccionar desde un MultiIndex? Tengo el siguiente DataFrame y me gustaría poder acceder a los valores ubicados en las columnas ‘Dwell’, en los índices de (‘at’, 1) , (‘at’, 3) , (‘at’, 5) , y así sucesivamente (no secuencial). Me encantaría poder hacer algo como […]

Cortar y asignar valores a un dataframe pandas de índices múltiples de índices secuenciales únicos

Quiero seleccionar y cambiar el valor de una celda de dataframe. Hay 2 índices utilizados para este dataframe: ‘datetime’ e ‘idx’. Ambos contienen tags que son únicas y secuenciales. El índice ‘datetime’ tiene una etiqueta datetime del tipo datetime, e ‘idx’ tiene tags de valor entero. import numpy as np import pandas as pd dt […]

Sumando sobre un nivel multiindex en una serie de pandas

Al usar el paquete Pandas en python, me gustaría sumr (marginar) más de un nivel en una serie con un índice múltiple de 3 niveles para producir una serie con un índice múltiple de 2 niveles. Por ejemplo, si tengo lo siguiente: ind = [tuple(x) for x in [‘ABC’, ‘ABc’, ‘AbC’, ‘Abc’, ‘aBC’, ‘aBc’, ‘abC’, […]

Pandas que trazan con Multi-Index

Después de realizar un groupby.sum() en un DataFrame , tengo algunos problemas al intentar crear la ttwig deseada. ¿Cómo puedo crear una subplot ( kind=’bar’ ) para cada Code , donde el eje x es el Month y las barras son ColA y ColB ?

Ordene pandas DataFrame con MultiIndex según el valor de la columna

Tengo un DataFrame con MultiIndex con el siguiente aspecto después de imprimir en la consola: valor indA indB grupo de ID de escenario 2015-04-13 1 A -54.0 1.0 1.0 B -160.0 1.0 1.0 C -15.0 0.0 1.0 2 A -83.0 1.0 1.0 3 A -80.0 2.0 2.0 4 A -270.0 2.0 2.0 2015-04-14 1 A […]

Pandas: restar una columna de otra en una tabla dinámica

Me gustaría restar una columna de otra en una tabla dinámica. ‘diff’ debe ser la diferencia entre 2017 y 2016 raw_data = {‘year’: [2016,2016,2017,2017], ‘area’: [‘A’,’B’,’A’,’B’], ‘age’: [10,12,50,52]} df1 = pd.DataFrame(raw_data, columns = [‘year’,’area’,’age’]) table=pd.pivot_table(df1,index=[‘area’],columns=[‘year’],values[‘age’],aggfunc=’mean’) table[‘diff’]=table[‘2017’]-table[‘2016’]