Hola estoy teniendo problemas para tratar con Pandas. Estoy tratando de sumr filas duplicadas en un Dataframe multiindex. df.groupby(level=[0,1]).sum() con df.groupby(level=[0,1]).sum() , también con df.stack().reset_index().groupby([‘year’, ‘product’]).sum() y algunos otros, pero no puedo hacerlo funcionar. También me gustaría agregar cada producto único para cada año dado y darles un valor de 0 si no estaban en […]
Estoy tratando de crear el dataframe desde la matriz con la siguiente estructura: df = [[{‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘Tom’, ‘value’: ‘129’}, {‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘Kate’, ‘value’: ‘0’}, {‘date_time’: Timestamp(‘2015-05-22 05:37:59’), ‘name’: ‘GroupeId’, ‘value’: ‘0’}, {…}, {…}, {…}],[another list of dictionaries like the first one],[and another one]] usando este código: def create_from_arr(): baby_array=pd.MultiIndex.from_tuples(df, names=[‘sessions’, […]
Estoy trabajando en zipline y pandas y he convertido un pandas.Panel en un pandas.DataFrame usando el método to_frame() . Este es el resultado de pandas.DataFrame que, como puede ver, tiene múltiples pandas.DataFrame : price major minor 2008-01-03 00:00:00+00:00 SPY 129.93 KO 26.38 PEP 64.78 2008-01-04 00:00:00+00:00 SPY 126.74 KO 26.43 PEP 64.59 2008-01-07 00:00:00+00:00 SPY […]
En el siguiente DataFrame: ¿Cómo puedo reemplazar [“x2”, “Total”] con [“x2”, “x2”] dejando x1 como está? l1 900 902 912 913 916 l2 ИП ПС ИП ПС ИП ПС ИП ПС ИП ПС i1 i2 x1 Total 10 6 3 3 10 16 2 9 3 8 x2 Total 1 0 0 0 0 0 […]
¿Alguien sabe si es posible usar el método DataFrame.loc para seleccionar desde un MultiIndex? Tengo el siguiente DataFrame y me gustaría poder acceder a los valores ubicados en las columnas ‘Dwell’, en los índices de (‘at’, 1) , (‘at’, 3) , (‘at’, 5) , y así sucesivamente (no secuencial). Me encantaría poder hacer algo como […]
Quiero seleccionar y cambiar el valor de una celda de dataframe. Hay 2 índices utilizados para este dataframe: ‘datetime’ e ‘idx’. Ambos contienen tags que son únicas y secuenciales. El índice ‘datetime’ tiene una etiqueta datetime del tipo datetime, e ‘idx’ tiene tags de valor entero. import numpy as np import pandas as pd dt […]
Al usar el paquete Pandas en python, me gustaría sumr (marginar) más de un nivel en una serie con un índice múltiple de 3 niveles para producir una serie con un índice múltiple de 2 niveles. Por ejemplo, si tengo lo siguiente: ind = [tuple(x) for x in [‘ABC’, ‘ABc’, ‘AbC’, ‘Abc’, ‘aBC’, ‘aBc’, ‘abC’, […]
Después de realizar un groupby.sum() en un DataFrame , tengo algunos problemas al intentar crear la ttwig deseada. ¿Cómo puedo crear una subplot ( kind=’bar’ ) para cada Code , donde el eje x es el Month y las barras son ColA y ColB ?
Tengo un DataFrame con MultiIndex con el siguiente aspecto después de imprimir en la consola: valor indA indB grupo de ID de escenario 2015-04-13 1 A -54.0 1.0 1.0 B -160.0 1.0 1.0 C -15.0 0.0 1.0 2 A -83.0 1.0 1.0 3 A -80.0 2.0 2.0 4 A -270.0 2.0 2.0 2015-04-14 1 A […]
Me gustaría restar una columna de otra en una tabla dinámica. ‘diff’ debe ser la diferencia entre 2017 y 2016 raw_data = {‘year’: [2016,2016,2017,2017], ‘area’: [‘A’,’B’,’A’,’B’], ‘age’: [10,12,50,52]} df1 = pd.DataFrame(raw_data, columns = [‘year’,’area’,’age’]) table=pd.pivot_table(df1,index=[‘area’],columns=[‘year’],values[‘age’],aggfunc=’mean’) table[‘diff’]=table[‘2017’]-table[‘2016’]