Articles of pandas groupby

Pandas groupby con cuentas bin

Tengo un DataFrame que se ve así: +———-+———+——-+ | username | post_id | views | +———-+———+——-+ | john | 1 | 3 | | john | 2 | 23 | | john | 3 | 44 | | john | 4 | 82 | | jane | 7 | 5 | | jane | 8 […]

Grupo de Python Pandas por varias columnas, la media de otra – no hay grupo por objeto

Tengo algunos datos que se parecen a esto y se llaman ‘test_df’ ID Year Value Value2 0 A 2012 1 4 1 A 2012 2 5 2 A 2013 4 6 3 A 2013 5 7 4 B 2014 6 8 5 B 2014 7 4 6 B 2013 8 8 Quiero que se vea […]

Guardar agrupado por resultados en archivos CSV separados

¡Tengo un código para crear grupos con datos CSV y crear nuevos archivos con esos grupos también! Leí mi archivo csv y luego trabajo con eso. El problema es cuando mi función funciona y crea los nuevos archivos con los datos, el nombre de los nuevos archivos es el nombre del grupo y no quiero […]

Filtro de dataframe después de groupby y nunique en pandas

df.groupby(“item”)[“variable”].nunique() y devuelve un conteo único de cada objeto de item. quiero filtrar para devolver solo el recuento de “variable”> 3 condicional en el elemento Groupby … ¿hay un método?

Marcos de datos de Python de Concat basados ​​en filas únicas

Mi dataframe se lee como: df1 user_id username firstname lastname 123 abc abc abc 456 def def def 789 ghi ghi ghi df2 user_id username firstname lastname 111 xyz xyz xyz 456 def def def 234 mnp mnp mnp Ahora quiero un dataframe de salida como user_id username firstname lastname 123 abc abc abc 456 […]

Clasificación / clasificación de los pandas de Python basada en otra columna que difiere para cada entrada

Me gustaría llegar a la cuarta columna a continuación basada en los tres primeros: user job time Rank A print 1559 2 A print 1540 2 A edit 1520 1 A edit 1523 1 A deliver 9717 3 B edit 1717 2 B edit 1716 2 B edit 1715 2 B deliver 1527 1 B […]

Python (Pandas) Agregue un subtotal en cada lvl de dataframe multiindex

Suponiendo que tengo el siguiente dataframe: abc Sce1 Sce2 Sce3 Sce4 Sce5 Sc6 Animal Ground Dog 0.0 0.9 0.5 0.0 0.3 0.4 Animal Ground Cat 0.6 0.5 0.3 0.5 1.0 0.2 Animal Air Eagle 1.0 0.1 0.1 0.6 0.9 0.1 Animal Air Owl 0.3 0.1 0.5 0.3 0.5 0.9 Object Metal Car 0.3 0.3 0.8 […]

¿Las pandas encuentran la duración entre las fechas donde se cumple una condición?

Tengo un DataFrame de pandas que se ve así: ╔═══╦════════════╦═════════════╗ ║ ║ VENDOR ID ║ DATE ║ ╠═══╬════════════╬═════════════╣ ║ 1 ║ 33 ║ 01/12/2018 ║ ║ 2 ║ 33 ║ 03/12/2018 ║ ║ 3 ║ 12 ║ 01/08/2018 ║ ║ 4 ║ 12 ║ 01/15/2018 ║ ║ 5 ║ 12 ║ 01/23/2018 ║ ║ 6 […]

Pandas Dataframe: cómo agregar una columna con el número de ocurrencias en otra columna

Tengo que seguir df: Col1 Col2 test Something test2 Something test3 Something test Something test2 Something test5 Something Quiero tener Col1 Col2 Occur test Something 2 test2 Something 2 test3 Something 1 test Something 2 test2 Something 2 test5 Something 1 He intentado usar: df[“Occur”] = df[“Col1”].value_counts() Pero no ayudó. Tengo la columna Ocurrir llena […]

Python Pandas valor máximo en un grupo como una nueva columna

Estoy tratando de calcular una nueva columna que contiene valores máximos para cada uno de varios grupos. Vengo de un fondo de Stata, así que sé que el código de Stata sería algo como esto: by group, sort: egen max = max(odds) Por ejemplo: data = {‘group’ : [‘A’, ‘A’, ‘B’,’B’], ‘odds’ : [85, 75, […]