Articles of merge

Combinar múltiples JSON en uno solo (Python)

Estoy buscando una manera de combinar varios JSON en uno solo. Mi salida está en este formato: [{“Nome bollettino”: “Bollettino 1”}, {“Causale”: “1”}, {“Numero”: “1”}] [{“Nome bollettino”: “Bollettino 2”}, {“Causale”: “2”}, {“Numero”: “2”}] [{“Nome bollettino”: “Bollettino 3”}, {“Causale”: “3”}, {“Numero”: “3”}] [{“Nome bollettino”: “Bollettino 4”}, {“Causale”: “4”}, {“Numero”: “4”}] [{“Nome bollettino”: “Bollettino 5”}, {“Causale”: “5”}, […]

Combina todas las bases de datos SQLite con diferentes tablas.

¿Hay una forma barata / rápida de combinar archivos db SQLite con diferentes tablas? Por ejemplo: a.db tiene solo a tabla b.db tiene solo tabla b … Quiero fusionarlos en un abcd.db que contiene todas las tablas a , b , c y d . Creo que lo que quiero es un script tan mágico: […]

Anexar el índice de nivel a columna en los pandas python

Tengo varios marcos de datos con las mismas columnas que me gustaría fusionar solo en sus índices. print df1 out[]: Value ISO Id 200001 8432000000 USD 200230 22588186000 USD 200247 4633000000 USD 200291 1188880000 USD 200418 1779776000 USD print df2 out[]: Value ISO Id 200001 1.309168e+11 USD 200230 5.444096e+10 USD 200247 9.499602e+09 USD 200291 2.089603e+09 […]

Combinar CSVs en Python con diferentes columnas

Tengo cientos de archivos CSV grandes que me gustaría fusionar en uno. Sin embargo, no todos los archivos CSV contienen todas las columnas. Por lo tanto, necesito combinar archivos según el nombre de la columna, no la posición de la columna. Para ser claros: en el CSV combinado, los valores deben estar vacíos para una […]

¿Cómo fusiono dos archivos CSV según el campo y mantengo la misma cantidad de atributos en cada registro?

Estoy intentando fusionar dos archivos CSV basados ​​en un campo específico en cada archivo. archivo1.csv id,attr1,attr2,attr3 1,True,7,”Purple” 2,False,19.8,”Cucumber” 3,False,-0.5,”A string with a comma, because it has one” 4,True,2,”Nope” 5,True,4.0,”Tuesday” 6,False,1,”Failure” file2.csv id,attr4,attr5,attr6 2,”python”,500000.12,False 5,”program”,3,True 3,”Another string”,-5,False Este es el código que estoy usando: import csv from collections import OrderedDict with open(‘file2.csv’,’r’) as f2: reader = […]

PyPDF Merge and Write Issue

Estoy recibiendo un error inesperado al usar esto. La primera sección proviene de un script que encontré en línea, y estoy tratando de usarlo para extraer una sección particular identificada en el esquema del PDF. Todo funciona bien, excepto a la derecha en output.write(outputfile1) que dice: PdfReadError: definiciones múltiples en el diccionario. ¿Alguien más se […]

pandas – fusionando con valores perdidos

Parece que hay una peculiaridad con la función de fusión de pandas. Considera que los valores de NaN son iguales, y fusionará NaN s con otros NaN s: >>> foo = DataFrame([ [‘a’,1,2], [‘b’,4,5], [‘c’,7,8], [np.NaN,10,11] ], columns=[‘id’,’x’,’y’]) >>> bar = DataFrame([ [‘a’,3], [‘c’,9], [np.NaN,12] ], columns=[‘id’,’z’]) >>> pd.merge(foo, bar, how=’left’, on=’id’) Out[428]: id xyz […]

Fusionar diccionarios conservando valores para claves duplicadas.

Dados los diccionarios, escriba una función que devolverá un diccionario único con una lista de valores para claves duplicadas. Ejemplo: d1 = {‘a’: 1, ‘b’: 2} d2 = {‘c’: 3, ‘b’: 4} d3 = {‘a’: 5, ‘d’: 6} resultado: >>> newdict {‘c’: 3, ‘d’: 6, ‘a’: [1, 5], ‘b’: [2, 4]} Mi código hasta ahora: […]

Combinando archivos CSV por columnas

Supongamos que tengo dos archivos CSV llamados A y B en Python . A head ve como: headerNameA1,headerNameA2 1.12412424,1 1,1 1,1 1,1 La head B ve como headerNameB1,headerNameB2 1,1 1,1 1,1 1,1 Mi objective es combinar los dos en un archivo C Sin embargo, mi objective tampoco es cargarlos en la RAM, ya que son […]

Clase de Python para fusionar archivos ordenados, ¿cómo se puede mejorar esto?

Fondo: Estoy limpiando archivos delimitados por tabuladores grandes (no se pueden guardar en la memoria). Mientras limpio el archivo de entrada, construyo una lista en la memoria; cuando llega a 1,000,000 de entradas (alrededor de 1GB en la memoria) lo ordeno (usando la clave predeterminada a continuación) y escribo la lista en un archivo. Esta […]