Articles of dataframe de los

Rellenar los valores faltantes utilizando el relleno hacia adelante y hacia atrás en el dataframe de pandas (ffill y bfill)

Principiante con marcos de datos de panda. Tengo este conjunto de datos a continuación con valores faltantes para las columnas A y B (Test.csv): DateTime AB 01-01-2017 03:27 01-01-2017 03:28 01-01-2017 03:29 0.18127718 -0.178835737 01-01-2017 03:30 0.186923018 -0.183260853 01-01-2017 03:31 01-01-2017 03:32 01-01-2017 03:33 0.18127718 -0.178835737 Puedo usar este código para completar valores usando la […]

Cómo reasignar identificadores a números consecutivos rápidamente

Tengo un archivo csv grande con líneas que parecen stringa,stringb stringb,stringc stringd,stringa Necesito convertirlo para que los ID estén numerados consecutivamente desde 0. En este caso, lo siguiente funcionaría 0,1 1,2 3,0 Mi código actual se ve como: import csv names = {} counter = 0 with open(‘foo.csv’, ‘rb’) as csvfile: reader = csv.reader(csvfile) for […]

Suma de varias columnas de un dataframe de pandas

Así que digo que tengo la siguiente tabla: In [2]: df = pd.DataFrame({‘a’: [1,2,3], ‘b’:[2,4,6], ‘c’:[1,1,1]}) In [3]: df Out[3]: abc 0 1 2 1 1 2 4 1 2 3 6 1 Puedo sumr ayb de esa manera In [4]: sum(df[‘a’]) + sum(df[‘b’]) Out[4]: 18 Sin embargo, esto no es muy conveniente para un […]

dataframe.describe () suprime la notación científica

¿Cómo suprimo la salida de notación científica de dataframe.describe (): contrib_df[“AMNT”].describe() count 1.979680e+05 mean 5.915134e+02 std 1.379618e+04 min -1.750000e+05 25% 4.000000e+01 50% 1.000000e+02 75% 2.500000e+02 max 3.000000e+06 Name: AMNT, dtype: float64 Mis datos son de tipo float64: contrib_df[“AMNT”].dtypes dtype(‘float64’)

Compruebe si cierto valor está contenido en una columna de dataframe en pandas

Estoy tratando de verificar si un determinado valor está contenido en una columna de python. Estoy usando df.date.isin([‘07311954’]) , que no dudo en ser una buena herramienta. El problema es que tengo más de 350K filas y la salida no las mostrará todas, por lo que puedo ver si el valor está realmente contenido. En […]

Pandas, DataFrame: dividiendo una columna en múltiples columnas

Tengo el siguiente DataFrame. Me pregunto si es posible dividir la columna “datos” en varias columnas. Por ejemplo, de esto: ID datos de fecha 6 21/05/2016 A: 7, B: 8, C: 5, D: 5, A: 8 6 21/01/2014 B: 5, C: 5, D: 7 6 02/04/2013 A: 4, D: 7 7 05/06/2014 C: 25 7 […]

Sumando a través de filas de Pandas Dataframe

Tengo un DataFrame de registros que se parece a esto: stocks = pd.Series([‘A’, ‘A’, ‘B’, ‘C’, ‘C’], name = ‘stock’) positions = pd.Series([ 100, 200, 300, 400, 500], name = ‘positions’) same1 = pd.Series([‘AA’, ‘AA’, ‘BB’, ‘CC’, ‘CC’], name = ‘same1’) same2 = pd.Series([‘AAA’, ‘AAA’, ‘BBB’, ‘CCC’, ‘CCC’], name = ‘same2’) diff = pd.Series([‘A1’, ‘A2’, […]

Comparación de filas de marcos de datos de pandas (las filas tienen algunos valores superpuestos)

Tengo un dataframe de pandas con 21 columnas. Me estoy enfocando en un subconjunto de filas que tienen exactamente los mismos valores de datos de columna, excepto por 6 que son únicos para cada fila. No sé qué encabezados de columna corresponden a priori estos 6 valores. Intenté convertir cada fila en objetos de índice […]

Transformando Pandas Dataframe

¿Existe una función de pandas para transformar estos datos de modo que muestre las columnas como a, b, c, d, ey lo que esté dentro del campo de datos y las filas cuenten cuántas de las letras hay? import pandas as pd trans = pd.read_table(‘output.txt’, header=None, index_col=0) print trans >>> 1 2 3 4 0 […]

¿Convertir un dataframe de python con varias filas en una fila usando los pandas de python?

Teniendo el siguiente dataframe, df = pd.DataFrame({‘device_id’ : [‘0′,’0′,’1′,’1′,’2′,’2’], ‘p_food’ : [0.2,0.1,0.3,0.5,0.1,0.7], ‘p_phone’ : [0.8,0.9,0.7,0.5,0.9,0.3] }) print(df) salida: device_id p_food p_phone 0 0 0.2 0.8 1 0 0.1 0.9 2 1 0.3 0.7 3 1 0.5 0.5 4 2 0.1 0.9 5 2 0.7 0.3 ¿Cómo lograr esta transformación? df2 = pd.DataFrame({‘device_id’ : [‘0′,’1′,’2’], ‘p_food_1’ […]