Articles of agrupados

Pandas de Python: Agregar una columna a mi dataframe que cuenta una variable

Tengo un dataframe ‘gt’ como este: org group org1 1 org2 1 org3 2 org4 3 org5 3 org6 3 y me gustaría agregar la columna ‘recuento’ a gt dataframe para los recuentos número de miembros de los grupos, resultados esperados como este: org group count org1 1 2 org2 1 2 org3 2 1 […]

Python pandas regresión lineal groupby

Estoy tratando de usar una regresión lineal en un grupo por el dataframe de pandas python: Este es el df dataframe: group date value A 01-02-2016 16 A 01-03-2016 15 A 01-04-2016 14 A 01-05-2016 17 A 01-06-2016 19 A 01-07-2016 20 B 01-02-2016 16 B 01-03-2016 13 B 01-04-2016 13 C 01-02-2016 16 C […]

Pandas consiguen filas después de groupby

Supongamos que tengo el siguiente conjunto de datos: uid iid val 1 1 2 1 2 3 1 3 4 1 4 4.5 1 5 5.5 2 1 3 2 2 3 2 3 4 3 4 4.5 3 5 5.5 A partir de estos datos, quiero agrupar primero por uid, luego obtener el último […]

clasifica dentro de groupby en pandas

Tengo un “panel de datos” típico (en términos econométricos, no objeto de panel de pandas). El dataframe tiene una columna Date y una columna ID , y otras columnas que contienen ciertos valores. Para cada Fecha, necesito clasificar de manera transversal las distintas identificaciones basadas en V1 en 10 grupos (deciles) y crear una nueva […]

¿Cómo aplicar diferentes funciones a un objeto groupby?

Tengo un dataframe como este: import pandas as pd df = pd.DataFrame({‘id’: [1, 2, 1, 1, 2, 1, 2, 2], ‘min_max’: [‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’, ‘max_val’, ‘max_val’, ‘min_val’, ‘min_val’], ‘value’: [1, 20, 20, 10, 12, 3, -10, -5 ]}) id min_max value 0 1 max_val 1 1 2 max_val 20 2 1 min_val 20 3 […]

Crear un gráfico de contorno desde Pandas Group by Dataframe

Tengo siguiente Pandas Dataframe: In [66]: hdf.size() Out[66]: ab 0 0.0 21004 0.1 119903 0.2 186579 0.3 417349 0.4 202723 0.5 100906 0.6 56386 0.7 6080 0.8 3596 0.9 2391 1.0 1963 1.1 1730 1.2 1663 1.3 1614 1.4 1309 … 186 0.2 15 0.3 9 0.4 21 0.5 4 187 0.2 3 0.3 10 […]

Agrupe por una columna y encuentre la sum y el valor máximo para otra en pandas

Tengo un dataframe como este: Name id col1 col2 col3 cl4 PL 252 0 747 3 53 PL2 252 1 24 2 35 PL3 252 4 75 24 13 AD 889 53 24 0 95 AD2 889 23 2 0 13 AD3 889 0 24 3 6 BG 024 12 89 53 66 BG1 024 […]

¿Cómo contar registros únicos por dos columnas en pandas?

Tengo dataframe en pandas: In [10]: df Out[10]: col_a col_b col_c col_d 0 France Paris 3 4 1 UK Londo 4 5 2 US Chicago 5 6 3 UK Bristol 3 3 4 US Paris 8 9 5 US London 44 4 6 US Chicago 12 4 Necesito contar ciudades únicas. Puedo contar estados únicos […]

rebanar df original después de groupby (). nlargest (x) operación

Dados los problemas con groupby() y nlargest() como se describe aquí y aquí . Estoy tratando de solucionar los problemas. Nota: por simplicidad utilicé nlargest(1) , sin embargo, podría haber cualquier cantidad de selecciones. {‘city1’: {0: ‘Chicago’, 1: ‘Chicago’, 2: ‘Chicago’, 3: ‘Chicago’, 4: ‘Miami’, 5: ‘Houston’, 6: ‘Austin’}, ‘city2’: {0: ‘Toronto’, 1: ‘Detroit’, 2: […]

Pandas: dividir el dataframe en múltiples marcos de datos según las fechas?

Tengo un dataframe con varias columnas junto con una columna de fecha. El formato de fecha es 31/12/15 y lo he establecido como un objeto de fecha y hora. Establecí la columna de fecha y hora como el índice y quiero realizar un cálculo de regresión para cada mes del dataframe. Creo que la metodología […]