Articles of group by

pandas: groupby y pesos variables

Tengo un conjunto de datos con ponderaciones para cada observación y quiero preparar resúmenes ponderados utilizando groupby pero estoy oxidado en cuanto a la mejor manera de hacer esto. Creo que implica una función de agregación personalizada. Mi problema es cómo tratar adecuadamente los datos no de elementos, pero los datos de grupo. Quizás significa […]

Python: Obtener elemento más frecuente en la lista

Tengo una lista de tuplas, y quiero obtener la tupla más frecuente, PERO si hay “ganadores conjuntos”, debería elegir entre ellas al azar. tups = [ (1,2), (3,4), (5,6), (1,2), (3,4) ] así que quiero algo que devuelva cualquiera de los dos (1,2) o (3,4) al azar para la lista anterior

Pandas: sum columnas múltiples y obtén resultados en columnas múltiples

Tengo un “sample.txt” como este. idx ABCD cat J 1 2 3 1 x K 4 5 6 2 x L 7 8 9 3 y M 1 2 3 4 y N 4 5 6 5 z O 7 8 9 6 z Con este conjunto de datos, quiero obtener la sum en la […]

Personalizando la función rolling_apply en los pandas de Python

Preparar Tengo un DataFrame con tres columnas: “Categoría” contiene Verdadero y Falso, y he hecho que df.groupby(‘Category’) según estos valores. “Tiempo” contiene marcas de tiempo (medidas en segundos) en las que se han registrado valores “Valor” contiene los valores en sí mismos. En cada instancia de tiempo, se registran dos valores: uno tiene la categoría […]

¿Cómo obtener filas en el dataframe de pandas, con valores máximos en una columna y mantener el índice original?

Tengo un dataframe de pandas. En la primera columna puede tener el mismo valor varias veces (en otras palabras, los valores de la primera columna no son únicos). Cada vez que tengo varias filas que contienen el mismo valor en la primera columna, me gustaría dejar solo las que tienen un valor máximo en la […]

Cómo hacer esta consulta GROUP BY en el ORM de Django con anotaciones y agregados

Realmente no he asimilado la forma de traducir GROUP BY y HAVING al QuerySet.annotate y QuerySet.aggregate . Estoy tratando de traducir esta consulta SQL al lenguaje ORM SELECT EXTRACT(year FROM pub_date) as year, EXTRACT(month from pub_date) as month, COUNT(*) as article_count FROM articles_article GROUP BY year,month; que produce esto: [(2008.0, 10.0, 1L), # year, month, […]

Pandas `agg` a la lista,” AttributeError / ValueError: la función no se reduce “

A menudo, cuando realizamos operaciones groupby usando pandas, es posible que deseamos aplicar varias funciones en varias series. groupby.agg parece la forma natural de realizar estas agrupaciones y cálculos. Sin embargo, parece existir una discrepancia entre cómo se implementan groupby.agg y groupby.apply , porque no puedo agrupar a una lista usando agg . Tuple y […]

groupby – El objeto ‘DataFrame’ de TypeError no se puede llamar

Newbie aquí. Mi primera incursión me pareció bien, pero este es mi segundo uso de pandas. Al usar Pandas 0.12.0 en Windows 7, leí 2 marcos de datos de SQL One que funcionan con groupby como se esperaba, así que estoy seguro de que mi problema no es la syntax. Pero en el otro, donde […]

Cambio de nombre de los nombres de columna en Pandas Groupby función

1). Tengo el siguiente conjunto de datos de ejemplo: >>> df ID Region count 0 100 Asia 2 1 101 Europe 3 2 102 US 1 3 103 Africa 5 4 100 Russia 5 5 101 Australia 7 6 102 US 8 7 104 Asia 10 8 105 Europe 11 9 110 Africa 23 Quería […]

Error de remuestreo: no se puede reindexar un índice no único con un método o límite

Estoy usando Pandas para estructurar y procesar datos. Tengo aquí un DataFrame con fechas como índice, Id y bitrate. Quiero agrupar mis datos por Id y volver a muestrear, al mismo tiempo, fechas de tiempo que son relativas a cada Id, y finalmente mantener la puntuación de la tasa de bits. Por ejemplo, dado: df […]