Articles of marcos de datos de los

pandas dividen el valor de la fila por la sum agregada con una condición establecida por otra celda

Hola Con la esperanza de obtener ayuda, tengo dos columnas Dataframe df as; Source ID 1 2 2 3 1 2 1 2 1 3 3 1 Mi intención es agrupar la Fuente y dividir la celda de ID por el total en función de la Fuente agrupada y adjuntar esto al dataframe original para […]

¿Cómo eliminar una columna en el dataframe de pandas basado en una condición?

Tengo un dataframe de pandas, con muchos valores NAN . ¿Cómo puedo eliminar columnas de forma que number_of_na_values > 2000 ? Intenté hacerlo así: toRemove = set() naNumbersPerColumn = df.isnull().sum() for i in naNumbersPerColumn.index: if(naNumbersPerColumn[i]>2000): toRemove.add(i) for i in toRemove: df.drop(i, axis=1, inplace=True) ¿Hay una manera más elegante de hacerlo?

¿Cómo usar groupby para aplicar múltiples funciones a múltiples columnas en Pandas?

Tengo un df normal A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]], columns=[‘A’, ‘B’, ‘C’], index=[1, 2, 3, 4, 5]) Siguiendo esta receta , obtuve los resultados que quería. In [62]: A.groupby((A[‘A’] > 2)).apply(lambda x: pd.Series(dict( up_B=(xB >= 0).sum(), down_B=(xB = 0).sum(), down_C=(xC < 0).sum(), mean_C=(xC).mean(), […]

Eliminar NaNs de un pandas dataFrame

No entiendo cómo los NaN están siendo tratados en pandas, me encantaría obtener una explicación, porque la lógica me parece “rota”. Tengo un archivo csv, que estoy cargando usando leer csv. Tengo una columna de “comentarios” en ese archivo, que está vacía la mayoría de las veces. He aislado esa columna y he intentado varias […]

Pandas – devuelve un dataframe después de groupby

Tengo una pandas df : Name No A 1 A 2 B 2 B 2 B 3 Quiero agrupar por Name columna, sum de columna No y luego devolver un dataframe de 2 columnas como este: Name No A 3 B 7 Lo intenté: df.groupby([‘Name’])[‘No’].sum() pero no devuelve mi deseo de dataframe. No puedo agregar […]

¿Hay una forma sencilla de cambiar una columna de sí / no a 1/0 en un dataframe de Pandas?

Leí un archivo csv en un dataframe de pandas y me gustaría convertir las columnas con respuestas binarias de cadenas de sí / no a números enteros de 1/0. A continuación, muestro una de esas columnas (“sampleDF” es el dataframe de pandas). In [13]: sampleDF.housing[0:10] Out[13]: 0 no 1 no 2 yes 3 no 4 […]

Iterando sobre grupos en un dataframe

El problema que tengo es que quiero agrupar el dataframe y luego usar funciones para manipular los datos después de que se hayan agrupado. Por ejemplo, quiero agrupar los datos por Fecha y luego iterar a través de cada fila en los grupos de fechas para analizar una función. El problema es que Groupby parece […]

Desplazar NaNs al ​​final de sus filas respectivas

Tengo un DataFrame como: 0 1 2 0 0.0 1.0 2.0 1 NaN 1.0 2.0 2 NaN NaN 2.0 Lo que quiero conseguir es Out[116]: 0 1 2 0 0.0 1.0 2.0 1 1.0 2.0 NaN 2 2.0 NaN NaN Este es mi enfoque a partir de ahora. df.apply(lambda x : (x[x.notnull()].values.tolist()+x[x.isnull()].values.tolist()),1) Out[117]: 0 1 […]

Pandas reemplazan a nan dependiendo del tipo

En DataFrane.to_csv, logré escribir archivos csv eliminando valores nan con df = df.replace(‘None’,”) df = df.replace(‘nan’,”) pero mi problema es que con este enfoque es que todos los valores de nan serán reemplazados por qoutes: ” ¿Es posible reemplazar valores nan según el tipo? if the nan dataframe == int dont add qoutes if str […]

Pandas Reemplace NaN con una cadena en blanco / vacía

Tengo un Dataframe de Pandas como se muestra abajo: 1 2 3 0 a NaN read 1 bl unread 2 c NaN read Quiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a “” read 1 bl unread 2 c “” read