Articles of agrupados

¿Cómo usar groupby para aplicar múltiples funciones a múltiples columnas en Pandas?

Tengo un df normal A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]], columns=[‘A’, ‘B’, ‘C’], index=[1, 2, 3, 4, 5]) Siguiendo esta receta , obtuve los resultados que quería. In [62]: A.groupby((A[‘A’] > 2)).apply(lambda x: pd.Series(dict( up_B=(xB >= 0).sum(), down_B=(xB = 0).sum(), down_C=(xC < 0).sum(), mean_C=(xC).mean(), […]

Python pandas groupby key error en pandas.hashtable.PyObjectHashTable.get_item

Estoy haciendo lo que parece ser un grupo simple en Pandas. La columna es una columna de cadena sin cadenas de NaN o cadenas extrañas. Sin embargo, sigo recibiendo el error de abajo. ¿Alguien sabe por qué sucede esto? Siento que puede tener algo que ver con mis datos, pero todo parece estar bien … […]

Marco de datos de Pandas: Agrupe por dos columnas y luego promedie sobre otra columna

Suponiendo que tengo un dataframe con los siguientes valores: df: col1 col2 value 1 2 3 1 2 1 2 3 1 Quiero primero agrupar por mi dataframe en base a las dos primeras columnas (col1 y col2) y luego promediar sobre los valores de la columna de sed (valor). Entonces la salida deseada se […]

Pandas – devuelve un dataframe después de groupby

Tengo una pandas df : Name No A 1 A 2 B 2 B 2 B 3 Quiero agrupar por Name columna, sum de columna No y luego devolver un dataframe de 2 columnas como este: Name No A 3 B 7 Lo intenté: df.groupby([‘Name’])[‘No’].sum() pero no devuelve mi deseo de dataframe. No puedo agregar […]

seleccionando una fila particular de un objeto groupby en python

id marks year 1 18 2013 1 25 2012 3 16 2014 2 16 2013 1 19 2013 3 25 2013 2 18 2014 Supongamos ahora que agrupo lo anterior en id por comando python. agrupado = archivo.grupo (archivo.id) Me gustaría obtener un archivo nuevo con solo la fila en cada grupo con el año […]

Cómo aplicar funciones de rotación en un grupo por objeto en pandas

Estoy teniendo dificultades para resolver un problema de retroceso o renovación en el dataframe o tal vez en groupby. El siguiente es un ejemplo simple del dataframe que tengo: fruit amount 20140101 apple 3 20140102 apple 5 20140102 orange 10 20140104 banana 2 20140104 apple 10 20140104 orange 4 20140105 orange 6 20140105 grape 1 […]

Cómo usar groupby en pandas para calcular un porcentaje / proporción total basado en un criterio en otra columna

Estoy intentando averiguar cómo usar la función groupby en pandas para calcular las proporciones de valores por año con un determinado criterio de Sí / No. Por ejemplo, tengo un dataframe llamado names : Name Number Year Sex Criteria 0 name1 789 1998 Male N 1 name1 688 1999 Male N 2 name1 639 2000 […]

Contar valores únicos usando pandas groupby

Tengo datos de la siguiente forma: df = pd.DataFrame({ ‘group’: [1, 1, 2, 3, 3, 3, 4], ‘param’: [‘a’, ‘a’, ‘b’, np.nan, ‘a’, ‘a’, np.nan] }) print(df) # group param # 0 1 a # 1 1 a # 2 2 b # 3 3 NaN # 4 3 a # 5 3 a # […]

¿Cómo puedo usar el cumsum dentro de un grupo en Pandas?

yo tengo df = pd.DataFrame.from_dict({‘id’: [‘A’, ‘B’, ‘A’, ‘C’, ‘D’, ‘B’, ‘C’], ‘val’: [1,2,-3,1,5,6,-2], ‘stuff’:[’12’,’23232′,’13’,’1234′,’3235′,’3236′,’732323′]}) id stuff val 0 A 12 1 1 B 23232 2 2 A 13 -3 3 C 1234 1 4 D 3235 5 5 B 3236 6 6 C 732323 -2 Me gustaría ejecutar un poco de val para cada […]

Obtener la identificación del grupo de nuevo en el dataframe de pandas

Para el dataframe In [2]: df = pd.DataFrame({‘Name’: [‘foo’, ‘bar’] * 3, …: ‘Rank’: np.random.randint(0,3,6), …: ‘Val’: np.random.rand(6)}) …: df Out[2]: Name Rank Val 0 foo 0 0.299397 1 bar 0 0.909228 2 foo 0 0.517700 3 bar 0 0.929863 4 foo 1 0.209324 5 bar 2 0.381515 Estoy interesado en agrupar por nombre y […]