Articles of concat

Fusionar muchas cadenas json con entradas de pandas python

Resumen He creado objetos de datos que se componen de (entre otras cosas), de objetos pandas como DataFrame y Panel s. Estoy tratando de serializar estos objetos en json , y la velocidad es una consideración primordial. Ejemplo usando un pandas.Panel Digamos por ejemplo que tengo un panel así: In [54]: panel = pandas.Panel( numpy.random.randn(5, […]

Pandas: concatenar dataframe y mantener índices duplicados

Tengo dos marcos de datos que me gustaría concatenar en columnas (eje = 1) con una combinación interna. Uno de los marcos de datos tiene algunos índices duplicados, pero las filas no son duplicados, y no quiero perder los datos de esos: df1 = pd.DataFrame([{‘a’:1,’b’:2},{‘a’:1,’b’:3},{‘a’:2,’b’:4}], columns = [‘a’,’b’]).set_index(‘a’) df2 = pd.DataFrame([{‘a’:1,’c’:5},{‘a’:2,’c’:6}],columns = [‘a’,’c’]).set_index(‘a’) >>> df1 […]

Anexar el índice de nivel a columna en los pandas python

Tengo varios marcos de datos con las mismas columnas que me gustaría fusionar solo en sus índices. print df1 out[]: Value ISO Id 200001 8432000000 USD 200230 22588186000 USD 200247 4633000000 USD 200291 1188880000 USD 200418 1779776000 USD print df2 out[]: Value ISO Id 200001 1.309168e+11 USD 200230 5.444096e+10 USD 200247 9.499602e+09 USD 200291 2.089603e+09 […]

¿Por qué pd.concat cambia el tipo de datos resultante de int a float?

Tengo tres marcos de datos: marca de hora (con marcas de hora), dataSun (con marcas de hora de amanecer y anochecer), dataData (con diferentes datos de clima). La timestamp dataframe tiene el tipo de datos “int64” . timestamp.head() timestamp 0 1521681600000 1 1521681900000 2 1521682200000 3 1521682500000 4 1521682800000 Dataframe dataSun también tiene el tipo […]

Preservar el orden de las columnas – Python Pandas y Column Concat

Así que mi google-fu no parece estar haciéndome justicia con lo que parece ser un procedimiento trivial. En Pandas for Python tengo 2 conjuntos de datos, quiero fusionarlos. Esto funciona bien usando .concat. El problema es que .concat reordena mis columnas. Desde el punto de vista de la recuperación de datos, esto es trivial. Desde […]

Combinando dos archivos csv usando pandas

¿Alguien puede ver si hay algún error en mi código? Quiero que combine dos archivos csv en un archivo csv. He intentado buscar en Google y todavía no puedo fusionarlo, creará un nuevo archivo pero no mostrará nada dentro. https://stackoverflow.com/a/16266144/7624469 a.csv ID User A1 Fi A2 Ki b.csv ID User A4 Fsdi A5 Kisd La […]

pandas: concatene dos DataFrames con MultiIndexes ordenados de manera que el resultado tenga un MultiIndex ordenado

Por favor, hágame saber cómo concatenar dos DataFrames con MultiIndexes ordenados, de manera que el resultado tenga un MultiIndex ordenado. Dado que, ambos están ordenados, el algoritmo tiene que tener una complejidad lineal en términos del número total de filas en ambos DataFrames (esta es la complejidad de fusionar 2 listas ordenadas, que es lo […]

Usando pandas .append dentro de for loop

Estoy agregando filas a un dataframe de pandas dentro de un bucle for, pero al final el dataframe está siempre vacío. No quiero agregar las filas a una matriz y luego llamar al constructor DataFrame, porque mi bucle for real maneja muchos datos. También probé pd.concat sin éxito. ¿Alguien podría resaltar lo que me falta […]

pandas concat ignore_index no funciona

Estoy intentando unir los marcos de datos de la columna y tengo problemas con concat pandas, ya que ignore_index=True no parece funcionar: df1 = pd.DataFrame({‘A’: [‘A0’, ‘A1’, ‘A2’, ‘A3’], ‘B’: [‘B0’, ‘B1’, ‘B2’, ‘B3’], ‘D’: [‘D0’, ‘D1’, ‘D2’, ‘D3’]}, index=[0, 2, 3,4]) df2 = pd.DataFrame({‘A1’: [‘A4’, ‘A5’, ‘A6’, ‘A7’], ‘C’: [‘C4’, ‘C5’, ‘C6’, ‘C7’], ‘D2’: […]

Pandas concat da error ValueError: las formas del plan no están alineadas

Soy bastante nuevo en pandas, estoy intentando concatenar un conjunto de marcos de datos y recibo este error: ValueError: Plan shapes are not aligned Mi entendimiento de .concat() es que se unirá donde las columnas son las mismas, pero para aquellas que no pueden encontrar se llenará con NA. Este no parece ser el caso […]