Articles of group by

Agrupe por pandas dataframe y seleccione lo último en cada grupo.

¿Cómo agrupar valores de dataframe de pandas y seleccionar el último (por fecha) de cada grupo? Por ejemplo, dada una ttwig de datos ordenada por fecha: id product date 0 220 6647 2014-09-01 1 220 6647 2014-09-03 2 220 6647 2014-10-16 3 826 3380 2014-11-11 4 826 3380 2014-12-09 5 826 3380 2015-05-19 6 901 […]

Pandas Correlación Groupby

Suponiendo que tengo un dataframe similar al siguiente, ¿cómo obtendré la correlación entre 2 columnas específicas y luego agrupar por la columna “ID”? Creo que el método ‘corr’ de Pandas encuentra la correlación entre todas las columnas. Si es posible, también me gustaría saber cómo podría encontrar la correlación ‘groupby’ usando la función .agg (es […]

Guardar agrupado por resultados en archivos CSV separados

¡Tengo un código para crear grupos con datos CSV y crear nuevos archivos con esos grupos también! Leí mi archivo csv y luego trabajo con eso. El problema es cuando mi función funciona y crea los nuevos archivos con los datos, el nombre de los nuevos archivos es el nombre del grupo y no quiero […]

Python devuelve las listas de enteros continuos de la lista

Tengo una lista de enteros, y quiero generar una lista que contenga una lista de todos los enteros continuos. #I have: full_list = [0,1,2,3,10,11,12,59] #I want: continuous_integers = [[0,1,2,3], [10,11,12], [59]] Tengo lo siguiente que funciona, pero parece ser una mala manera de hacerlo: sub_list = [] continuous_list = [] for x in full_list: if […]

Python (Pandas) Agregue un subtotal en cada lvl de dataframe multiindex

Suponiendo que tengo el siguiente dataframe: abc Sce1 Sce2 Sce3 Sce4 Sce5 Sc6 Animal Ground Dog 0.0 0.9 0.5 0.0 0.3 0.4 Animal Ground Cat 0.6 0.5 0.3 0.5 1.0 0.2 Animal Air Eagle 1.0 0.1 0.1 0.6 0.9 0.1 Animal Air Owl 0.3 0.1 0.5 0.3 0.5 0.9 Object Metal Car 0.3 0.3 0.8 […]

Trazando resultados de Pandas GroupBy

Estoy empezando a aprender Pandas y estoy tratando de encontrar las formas más Pythonic (o panda-thonic?) Para hacer ciertas tareas. Supongamos que tenemos un DataFrame con las columnas A, B y C. La columna A contiene valores booleanos: el valor A de cada fila es verdadero o falso. La columna B tiene algunos valores importantes […]

Python Pandas ¿Cómo asignar los resultados de la operación grupal a las columnas en el dataframe principal?

Tengo el siguiente dataframe en IPython, donde cada fila es un stock único: In [261]: bdata Out[261]: Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210 non-null values MarketCap 21210 non-null values PriceReturn 21210 non-null values SEDOL 21210 non-null values yearmonth 21210 non-null values dtypes: float64(2), […]

Agrupar DataFrame por inicio de década utilizando pandas Grouper

Tengo un dataframe de observaciones diarias del 01-01-1973 al 12-31-2014. He estado utilizando Pandas Grouper y todo ha funcionado bien para cada frecuencia hasta ahora: quiero agruparlos por décadas 70, 80, 90, etc. Traté de hacerlo como import pandas as pd df.groupby(pd.Grouper(freq = ’10Y’)).mean() Sin embargo, esto los agrupa en 73-83, 83-93, etc.

Contar valores únicos con pandas por grupo

Necesito contar valores de ID únicos en cada domain que tengo datos ID, domain 123, ‘vk.com’ 123, ‘vk.com’ 123, ‘twitter.com’ 456, ‘vk.com’ 456, ‘facebook.com’ 456, ‘vk.com’ 456, ‘google.com’ 789, ‘twitter.com’ 789, ‘vk.com’ Intento df.groupby([‘domain’, ‘ID’]).count() Pero quiero obtener domain, count vk.com 3 twitter.com 2 facebook.com 1 google.com 1

¿Se garantiza que pandas.DataFrame.groupby sea estable?

Me he dado cuenta de que hay varios usos de pd.DataFrame.groupby seguido de una apply asumiendo implícitamente que groupby es estable , es decir, si a y b son instancias del mismo grupo, y pre-agrupación, una apareció antes de b , luego aparecerá una b antes de la agrupación también. Creo que hay varias respuestas […]