Articles of agrupados

pandas obtener promedio de un groupby

Estoy tratando de encontrar el costo mensual promedio por usuario_id, pero solo puedo obtener el costo promedio por usuario o el costo mensual por usuario. Debido a que agrupo por usuario y mes, no hay manera de obtener el promedio del segundo grupo por (mes) a menos que transforme la salida de groupby a otra […]

pandas, aplique múltiples funciones de múltiples columnas al objeto groupby

Quiero aplicar varias funciones de varias columnas a un objeto groupby que da como resultado un nuevo pandas.DataFrame . Sé cómo hacerlo en pasos separados: by_user = lasts.groupby(‘user’) elapsed_days = by_user.apply(lambda x: (x.elapsed_time * x.num_cores).sum() / 86400) running_days = by_user.apply(lambda x: (x.running_time * x.num_cores).sum() / 86400) user_df = elapsed_days.to_frame(‘elapsed_days’).join(running_days.to_frame(‘running_days’)) Lo que resulta en user_df siendo: […]

Pandas de Python: Agregar una columna a mi dataframe que cuenta una variable

Tengo un dataframe ‘gt’ como este: org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 y me gustaría agregar la columna ‘recuento’ a gt dataframe para los recuentos número de miembros de los grupos, resultados esperados como este: org group count org1 1 2 org2 1 2 org3 2 1 […]

Python pandas regresión lineal groupby

Estoy tratando de usar una regresión lineal en un grupo por el dataframe de pandas python: Este es el df dataframe: group date value A 01-02-2016 16 A 01-03-2016 15 A 01-04-2016 14 A 01-05-2016 17 A 01-06-2016 19 A 01-07-2016 20 B 01-02-2016 16 B 01-03-2016 13 B 01-04-2016 13 C 01-02-2016 16 C […]

Pandas consiguen filas después de groupby

Supongamos que tengo el siguiente conjunto de datos: uid iid val 1 1 2 1 2 3 1 3 4 1 4 4.5 1 5 5.5 2 1 3 2 2 3 2 3 4 3 4 4.5 3 5 5.5 A partir de estos datos, quiero agrupar primero por uid, luego obtener el último […]

clasifica dentro de groupby en pandas

Tengo un “panel de datos” típico (en términos econométricos, no objeto de panel de pandas). El dataframe tiene una columna Date y una columna ID , y otras columnas que contienen ciertos valores. Para cada Fecha, necesito clasificar de manera transversal las distintas identificaciones basadas en V1 en 10 grupos (deciles) y crear una nueva […]

¿Cómo aplicar diferentes funciones a un objeto groupby?

Tengo un dataframe como este: import pandas as pd df = pd.DataFrame({‘id’: [1, 2, 1, 1, 2, 1, 2, 2], ‘min_max’: [‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’, ‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’], ‘value’: [1, 20, 20, 10, 12, 3, -10, -5 ]}) id min_max value 0 1 max_val 1 1 2 max_val 20 2 1 min_val 20 3 […]

Crear un gráfico de contorno desde Pandas Group by Dataframe

Tengo siguiente Pandas Dataframe: In [66]: hdf.size() Out[66]: ab 0 0.0 21004 0.1 119903 0.2 186579 0.3 417349 0.4 202723 0.5 100906 0.6 56386 0.7 6080 0.8 3596 0.9 2391 1.0 1963 1.1 1730 1.2 1663 1.3 1614 1.4 1309 … 186 0.2 15 0.3 9 0.4 21 0.5 4 187 0.2 3 0.3 10 […]

Agrupe por una columna y encuentre la sum y el valor máximo para otra en pandas

Tengo un dataframe como este: Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889 23 2 0 13 AD3 889 0 24 3 6 BG 024 12 89 53 66 BG1 024 […]

¿Cómo contar registros únicos por dos columnas en pandas?

Tengo dataframe en pandas: In [10]: df Out[10]: col_a col_b col_c col_d 0 France Paris 3 4 1 UK Londo 4 5 2 US Chicago 5 6 3 UK Bristol 3 3 4 US Paris 8 9 5 US London 44 4 6 US Chicago 12 4 Necesito contar ciudades únicas. Puedo contar estados únicos […]