Articles of merge

Anexar el índice de nivel a columna en los pandas python

Tengo varios marcos de datos con las mismas columnas que me gustaría fusionar solo en sus índices. print df1 out[]: Value ISO Id 200001 8432000000 USD 200230 22588186000 USD 200247 4633000000 USD 200291 1188880000 USD 200418 1779776000 USD print df2 out[]: Value ISO Id 200001 1.309168e+11 USD 200230 5.444096e+10 USD 200247 9.499602e+09 USD 200291 2.089603e+09 […]

Combinar CSVs en Python con diferentes columnas

Tengo cientos de archivos CSV grandes que me gustaría fusionar en uno. Sin embargo, no todos los archivos CSV contienen todas las columnas. Por lo tanto, necesito combinar archivos según el nombre de la columna, no la posición de la columna. Para ser claros: en el CSV combinado, los valores deben estar vacíos para una […]

¿Cómo fusiono dos archivos CSV según el campo y mantengo la misma cantidad de atributos en cada registro?

Estoy intentando fusionar dos archivos CSV basados ​​en un campo específico en cada archivo. archivo1.csv id,attr1,attr2,attr3 1,True,7,”Purple” 2,False,19.8,”Cucumber” 3,False,-0.5,”A string with a comma, because it has one” 4,True,2,”Nope” 5,True,4.0,”Tuesday” 6,False,1,”Failure” file2.csv id,attr4,attr5,attr6 2,”python”,500000.12,False 5,”program”,3,True 3,”Another string”,-5,False Este es el código que estoy usando: import csv from collections import OrderedDict with open(‘file2.csv’,’r’) as f2: reader = […]

PyPDF Merge and Write Issue

Estoy recibiendo un error inesperado al usar esto. La primera sección proviene de un script que encontré en línea, y estoy tratando de usarlo para extraer una sección particular identificada en el esquema del PDF. Todo funciona bien, excepto a la derecha en output.write(outputfile1) que dice: PdfReadError: definiciones múltiples en el diccionario. ¿Alguien más se […]

pandas – fusionando con valores perdidos

Parece que hay una peculiaridad con la función de fusión de pandas. Considera que los valores de NaN son iguales, y fusionará NaN s con otros NaN s: >>> foo = DataFrame([ [‘a’,1,2], [‘b’,4,5], [‘c’,7,8], [np.NaN,10,11] ], columns=[‘id’,’x’,’y’]) >>> bar = DataFrame([ [‘a’,3], [‘c’,9], [np.NaN,12] ], columns=[‘id’,’z’]) >>> pd.merge(foo, bar, how=’left’, on=’id’) Out[428]: id xyz […]

Fusionar diccionarios conservando valores para claves duplicadas.

Dados los diccionarios, escriba una función que devolverá un diccionario único con una lista de valores para claves duplicadas. Ejemplo: d1 = {‘a’: 1, ‘b’: 2} d2 = {‘c’: 3, ‘b’: 4} d3 = {‘a’: 5, ‘d’: 6} resultado: >>> newdict {‘c’: 3, ‘d’: 6, ‘a’: [1, 5], ‘b’: [2, 4]} Mi código hasta ahora: […]

Combinando archivos CSV por columnas

Supongamos que tengo dos archivos CSV llamados A y B en Python . A head ve como: headerNameA1,headerNameA2 1.12412424,1 1,1 1,1 1,1 La head B ve como headerNameB1,headerNameB2 1,1 1,1 1,1 1,1 Mi objective es combinar los dos en un archivo C Sin embargo, mi objective tampoco es cargarlos en la RAM, ya que son […]

Clase de Python para fusionar archivos ordenados, ¿cómo se puede mejorar esto?

Fondo: Estoy limpiando archivos delimitados por tabuladores grandes (no se pueden guardar en la memoria). Mientras limpio el archivo de entrada, construyo una lista en la memoria; cuando llega a 1,000,000 de entradas (alrededor de 1GB en la memoria) lo ordeno (usando la clave predeterminada a continuación) y escribo la lista en un archivo. Esta […]

Pandas Combina datos de filas con múltiples valores en la lista de Python para una columna

Tengo un dataframe que parece DATOS *id*, *name*, *URL*, *Type* 2, birth_france_by_region, http://abc. com, T1 2, birth_france_by_region, http://pt. python, T2 3, long_lat, http://abc. com, T3 3, long_lat, http://pqur. com, T1 4, random_time_series, http://sadsdc. com, T2 4, random_time_series, http://sadcadf. com, T3 5, birth_names, http://google. com, T1 5, birth_names, http://helloworld. com,T2 5, birth_names, http://hu. com, T3 Quiero […]

Combine los archivos SQLite en un archivo db, y la pregunta ‘comience / comience’

Esta publicación hace referencia a esta página para fusionar bases de datos SQLite. La secuencia es la siguiente. Digamos que quiero fusionar a.db y b.db. En la línea de comandos hago lo siguiente. sqlite3 a.db adjunte ‘b.db’ como toM; empezar; <- inserte en benchmark select * from toM.benchmark; cometer; <- separar la base de datos […]