Articles of marcos de datos de los

¿Cómo usar groupby para aplicar múltiples funciones a múltiples columnas en Pandas?

Tengo un df normal A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]], columns=[‘A’, ‘B’, ‘C’], index=[1, 2, 3, 4, 5]) Siguiendo esta receta , obtuve los resultados que quería. In [62]: A.groupby((A[‘A’] > 2)).apply(lambda x: pd.Series(dict( up_B=(xB >= 0).sum(), down_B=(xB = 0).sum(), down_C=(xC < 0).sum(), mean_C=(xC).mean(), […]

Eliminar NaNs de un pandas dataFrame

No entiendo cómo los NaN están siendo tratados en pandas, me encantaría obtener una explicación, porque la lógica me parece “rota”. Tengo un archivo csv, que estoy cargando usando leer csv. Tengo una columna de “comentarios” en ese archivo, que está vacía la mayoría de las veces. He aislado esa columna y he intentado varias […]

Pandas – devuelve un dataframe después de groupby

Tengo una pandas df : Name No A 1 A 2 B 2 B 2 B 3 Quiero agrupar por Name columna, sum de columna No y luego devolver un dataframe de 2 columnas como este: Name No A 3 B 7 Lo intenté: df.groupby([‘Name’])[‘No’].sum() pero no devuelve mi deseo de dataframe. No puedo agregar […]

¿Hay una forma sencilla de cambiar una columna de sí / no a 1/0 en un dataframe de Pandas?

Leí un archivo csv en un dataframe de pandas y me gustaría convertir las columnas con respuestas binarias de cadenas de sí / no a números enteros de 1/0. A continuación, muestro una de esas columnas (“sampleDF” es el dataframe de pandas). In [13]: sampleDF.housing[0:10] Out[13]: 0 no 1 no 2 yes 3 no 4 […]

Iterando sobre grupos en un dataframe

El problema que tengo es que quiero agrupar el dataframe y luego usar funciones para manipular los datos después de que se hayan agrupado. Por ejemplo, quiero agrupar los datos por Fecha y luego iterar a través de cada fila en los grupos de fechas para analizar una función. El problema es que Groupby parece […]

Desplazar NaNs al ​​final de sus filas respectivas

Tengo un DataFrame como: 0 1 2 0 0.0 1.0 2.0 1 NaN 1.0 2.0 2 NaN NaN 2.0 Lo que quiero conseguir es Out[116]: 0 1 2 0 0.0 1.0 2.0 1 1.0 2.0 NaN 2 2.0 NaN NaN Este es mi enfoque a partir de ahora. df.apply(lambda x : (x[x.notnull()].values.tolist()+x[x.isnull()].values.tolist()),1) Out[117]: 0 1 […]

Pandas reemplazan a nan dependiendo del tipo

En DataFrane.to_csv, logré escribir archivos csv eliminando valores nan con df = df.replace(‘None’,”) df = df.replace(‘nan’,”) pero mi problema es que con este enfoque es que todos los valores de nan serán reemplazados por qoutes: ” ¿Es posible reemplazar valores nan según el tipo? if the nan dataframe == int dont add qoutes if str […]

Pandas Reemplace NaN con una cadena en blanco / vacía

Tengo un Dataframe de Pandas como se muestra abajo: 1 2 3 0 a NaN read 1 bl unread 2 c NaN read Quiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a “” read 1 bl unread 2 c “” read

Cómo convertir datos mensuales a trimestrales en pandas.

Tengo datos mensuales. Quiero convertirlo a “períodos” de 3 meses donde q1 comienza en enero. Entonces, en el siguiente ejemplo, la agregación de los primeros 3 meses se traduciría en inicio de q2 (formato deseado: 1996q2). Y el valor de datos que resulta de reunir 3 valores mensuales es una media (promedio) de 3 columnas. […]

¿Cómo soltar la columna según el porcentaje de NAN para el dataframe?

Para ciertas columnas de df , si el 80% de la columna es NAN . ¿Cuál es el código más simple para eliminar esas columnas?