Articles of dataframe

Fusionar marcos de datos de pandas usando la fecha como índice

Estoy tratando de fusionar dos marcos de datos (llámelos df1 y df2) de diferentes longitudes, ambas indexadas por sus fechas. El más largo de los dfs (df1) tiene todas las fechas enumeradas en el más corto de los dos (df2). He intentado combinarlos utilizando el siguiente comando: merged = df2.merge(df1, on=’Date’) , sin embargo, obtengo […]

Pandas: cambiar el nombre de una columna específica en el dataframe que tiene columnas de varios niveles

Quiero encontrar la forma de cambiar el nombre de una columna específica en un dataframe multinivel. Con estos datos: data = { (‘A’, ‘1’, ‘I’): [1, 2, 3, 4, 5], (‘B’, ‘2’, ‘II’): [1, 2, 3, 4, 5], (‘C’, ‘3’, ‘I’): [1, 2, 3, 4, 5], (‘D’, ‘4’, ‘II’): [1, 2, 3, 4, 5], (‘E’, […]

Usando los valores de una “fila” anterior en una serie de pandas

Tengo un CSV que se parece a esto (y cuando se introduce en un Dataframe de pandas con read_csv() , se ve igual). Quiero actualizar los valores en la columna ad_requests de acuerdo con la siguiente lógica: Para una fila dada, si ad_requests tiene un valor, déjelo solo. De lo contrario, déle un valor del […]

¿Cómo rest la fila anterior de la fila actual en un dataframe de pandas y la aplico a cada fila? sin usar un bucle?

Estoy usando Python3.5 y estoy trabajando con pandas. He cargado datos de stock de yahoo finance y he guardado los archivos en csv. Mis DataFrames cargan estos datos desde el csv. Esta es una copia de las diez filas del archivo csv que es mi DataFrame Date Open High Low Close Volume Adj Close 1990-04-12 […]

remodelar un dataframe pandas

supongamos un dataframe como este: df = pd.DataFrame([[1,2,3,4],[5,6,7,8],[9,10,11,12]], columns = [‘A’, ‘B’, ‘A1’, ‘B1′]) Me gustaría tener un dataframe que se parece a: qué no funciona: new_rows = int(df.shape[1]/2) * df.shape[0] new_cols = 2 df.values.reshape(new_rows, new_cols, order=’F’) por supuesto, podría pasar por encima de los datos y hacer una nueva lista de la lista, pero […]

Obtenga el producto puntual de dataframe con vector y devuelva dataframe en Pandas

No puedo encontrar la entrada en el método dot() en la documentación oficial . Sin embargo el método está ahí y puedo usarlo. ¿Por qué es esto? Sobre este tema, ¿hay una manera de calcular una multiplicación por elementos de cada fila en un dataframe con otro vector? (y obtener un dataframe nuevo?), es decir, […]

Suma acumulada invertida de una columna en pandas.DataFrame

Tengo un Pandas DataFrame con una columna booleana ordenada por otra columna y necesito calcular la sum acumulativa inversa de la columna booleana, es decir, la cantidad de valores verdaderos desde la fila actual hasta la parte inferior. Ejemplo In [13]: df = pd.DataFrame({‘A’: [True] * 3 + [False] * 5, ‘B’: np.random.rand(8) }) In […]

¿Cómo verificar si un valor está en la lista en la selección del dataframe de pandas?

Se ve feo df_cut = df_new[ ( (df_new[‘l_ext’]==31) | (df_new[‘l_ext’]==22) | (df_new[‘l_ext’]==30) | (df_new[‘l_ext’]==25) | (df_new[‘l_ext’]==64) ) ] No funciona: df_cut = df_new[(df_new[‘l_ext’] in [31, 22, 30, 25, 64])] ¿Existe una solución elegante y funcional del “problema” anterior?

¿Qué es dtype (‘O’)?

Tengo un dataframe en pandas y estoy tratando de averiguar cuáles son los tipos de sus valores. No estoy seguro de cuál es el tipo de columna ‘Test’ . Sin embargo, cuando ejecuto myFrame[‘Test’].dtype , obtengo; dtype(‘O’) ¿Qué significa esto?

Construye un dataframe pandas a partir de un archivo .fits

Tengo un archivo .fits que contiene datos. Me gustaría construir un dataframe de pandas a partir de este archivo en particular, pero no sé cómo hacerlo. data = fits.open(‘datafile’) data.info da: No. Name Type Cards Dimensions Format 0 PRIMARY PrimaryHDU 6 (12, 250000) float64 y: data[0].data.shape da: (250000, 12)