Articles of group by

groupby – El objeto ‘DataFrame’ de TypeError no se puede llamar

Newbie aquí. Mi primera incursión me pareció bien, pero este es mi segundo uso de pandas. Al usar Pandas 0.12.0 en Windows 7, leí 2 marcos de datos de SQL One que funcionan con groupby como se esperaba, así que estoy seguro de que mi problema no es la syntax. Pero en el otro, donde […]

Cambio de nombre de los nombres de columna en Pandas Groupby función

1). Tengo el siguiente conjunto de datos de ejemplo: >>> df ID Region count 0 100 Asia 2 1 101 Europe 3 2 102 US 1 3 103 Africa 5 4 100 Russia 5 5 101 Australia 7 6 102 US 8 7 104 Asia 10 8 105 Europe 11 9 110 Africa 23 Quería […]

Error de remuestreo: no se puede reindexar un índice no único con un método o límite

Estoy usando Pandas para estructurar y procesar datos. Tengo aquí un DataFrame con fechas como índice, Id y bitrate. Quiero agrupar mis datos por Id y volver a muestrear, al mismo tiempo, fechas de tiempo que son relativas a cada Id, y finalmente mantener la puntuación de la tasa de bits. Por ejemplo, dado: df […]

Remuestreo de series temporales con un determinado timedelta

Estoy usando Pandas para estructurar y procesar datos. Este es mi DataFrame: Quiero hacer un nuevo muestreo de los datos de series de tiempo y, para cada ID (nombrada aquí “3”), todas las puntuaciones de la tasa de bits, de principio a fin (begin_time / end_time). Por ejemplo, para la primera fila, quiero tener todos […]

Python – subtotales de pandas en groupby

Aquí hay una muestra de los datos que estoy usando: SCENARIO DATE POD AREA IDOC STATUS TYPE AAA 02.06.2015 JKJKJKJKJKK 4210 713375 51 1 AAA 02.06.2015 JWERWERE 4210 713375 51 1 AAA 02.06.2015 JAFDFDFDFD 4210 713375 51 9 BBB 02.06.2015 AAAAAAAA 5400 713504 51 43 CCC 05.06.2015 BBBBBBBBBB 4100 756443 51 187 AAA 05.06.2015 EEEEEEEE […]

Marco de datos de pandas para contar la matriz.

Esto debe ser obvio, pero no pude encontrar una solución fácil. Tengo pandas DataFrame como esto: actual | predicted —— + ——— Apple | Apple Apple | Apple Apple | Banana Banana | Orange Orange | Apple Quiero esto: | Apple | Banana | Orange —— + ——- + ——- + ——- Apple | 2 […]

Python – Eliminar duplicados según el valor máximo de una columna

No soy realmente bueno con los pandas, y creo que los pandas deberían resolver mi problema: tengo un archivo de texto que contiene datos ( id1 ; id2 ; value3 ; value3 ; value3 ) 1;2;30;40;20.3; 1;2;30;42;26.2; 3;5;12;55;10.7; 3;5;12;23;8.7; 3;5;12;33;11.2; 24;12;1;553;1.1; 24;12;1;23;1.9; Como resultado, quiero mantener las líneas que tienen iguales id1 , id2 , […]

¿Cómo usar pandas para agrupar los resultados de la tabla dinámica por semana?

A continuación se muestra un fragmento de mi salida de tabla dinámica en formato .csv después de usar la función pandas pivot_table: Sub-Product 11/1/12 11/2/12 11/3/12 11/4/12 11/5/12 11/6/12 GP Acquisitions 164 168 54 72 203 167 GP Applications 190 207 65 91 227 200 GPF Acquisitions 1124 1142 992 1053 1467 1198 GPF Applications […]

Pandas groupby (), agg (): ¿cómo devolver resultados sin el índice múltiple?

Tengo un dataframe: pe_odds[ [ ‘EVENT_ID’, ‘SELECTION_ID’, ‘ODDS’ ] ] Out[67]: EVENT_ID SELECTION_ID ODDS 0 100429300 5297529 18.00 1 100429300 5297529 20.00 2 100429300 5297529 21.00 3 100429300 5297529 22.00 4 100429300 5297529 23.00 5 100429300 5297529 24.00 6 100429300 5297529 25.00 Cuando uso groupby y agg, obtengo resultados con un índice múltiple: pe_odds.groupby( [ […]

Python Pandas Eligiendo Muestra Aleatoria De Grupos De Groupby

¿Cuál es la mejor manera de obtener una muestra aleatoria de los elementos de un groupby ? Como lo entiendo, un groupby es simplemente un iterable sobre grupos. La forma estándar en que lo haría para un iterable, si quisiera seleccionar N = 200 elementos es: rand = random.sample(data, N) Si intenta hacer lo anterior […]