Articles of marcos de datos de los

Iterando sobre grupos en un dataframe

El problema que tengo es que quiero agrupar el dataframe y luego usar funciones para manipular los datos después de que se hayan agrupado. Por ejemplo, quiero agrupar los datos por Fecha y luego iterar a través de cada fila en los grupos de fechas para analizar una función. El problema es que Groupby parece […]

Desplazar NaNs al ​​final de sus filas respectivas

Tengo un DataFrame como: 0 1 2 0 0.0 1.0 2.0 1 NaN 1.0 2.0 2 NaN NaN 2.0 Lo que quiero conseguir es Out[116]: 0 1 2 0 0.0 1.0 2.0 1 1.0 2.0 NaN 2 2.0 NaN NaN Este es mi enfoque a partir de ahora. df.apply(lambda x : (x[x.notnull()].values.tolist()+x[x.isnull()].values.tolist()),1) Out[117]: 0 1 […]

Pandas reemplazan a nan dependiendo del tipo

En DataFrane.to_csv, logré escribir archivos csv eliminando valores nan con df = df.replace(‘None’,”) df = df.replace(‘nan’,”) pero mi problema es que con este enfoque es que todos los valores de nan serán reemplazados por qoutes: ” ¿Es posible reemplazar valores nan según el tipo? if the nan dataframe == int dont add qoutes if str […]

Pandas Reemplace NaN con una cadena en blanco / vacía

Tengo un Dataframe de Pandas como se muestra abajo: 1 2 3 0 a NaN read 1 bl unread 2 c NaN read Quiero eliminar los valores de NaN con una cadena vacía para que se vea así: 1 2 3 0 a “” read 1 bl unread 2 c “” read

Cómo convertir datos mensuales a trimestrales en pandas.

Tengo datos mensuales. Quiero convertirlo a “períodos” de 3 meses donde q1 comienza en enero. Entonces, en el siguiente ejemplo, la agregación de los primeros 3 meses se traduciría en inicio de q2 (formato deseado: 1996q2). Y el valor de datos que resulta de reunir 3 valores mensuales es una media (promedio) de 3 columnas. […]

¿Cómo soltar la columna según el porcentaje de NAN para el dataframe?

Para ciertas columnas de df , si el 80% de la columna es NAN . ¿Cuál es el código más simple para eliminar esas columnas?

Asignar columnas de un dataframe a otro para crear una nueva columna

tengo un dataframe id store address 1 100 xyz 2 200 qwe 3 300 asd 4 400 zxc 5 500 bnm Tengo otro df2 de datos serialNo store_code warehouse 1 300 Land 2 500 Sea 3 100 Land 4 200 Sea 5 400 Land Quiero que mi dataframe final se vea como: id store address […]

Calcule el máximo en ejecución (acumulativo) para una serie en pandas

Dado: d = { ‘High’: [954, 953, 952, 955, 956, 952, 951, 950, ] } df = pandas.DataFrame(d) Quiero agregar otra columna que sea la máxima en cada índice desde el principio. Por ejemplo, la columna deseada sería: ‘Max’: [954, 954, 954, 955, 956, 956, 956, 956] Lo intenté con una función de pandas, pero […]

¿Cómo encuentro los valores más cercanos en una serie de Pandas a un número de entrada?

He visto: ¿Cómo encuentro el valor más cercano a un número dado en una matriz? ¿Cómo encuentro el elemento de la matriz más cercana a un número arbitrario (no miembro)? . Estos se relacionan con la vainilla python y no con los pandas. Si tengo la serie: ix num 0 1 1 6 2 4 […]

Python Pandas iterar sobre filas y acceder a los nombres de columna

Estoy intentando iterar sobre las filas de un dataframe de Python Pandas. Dentro de cada fila del dataframe, estoy tratando de referirme a cada valor a lo largo de una fila por su nombre de columna. Esto es lo que tengo: import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10,4),columns=list(‘ABCD’)) print df ABCD […]