Articles of csv de

¿Cómo puedo dividir un archivo csv grande en archivos pequeños basados ​​en registros comunes de python?

Lo que quiero hacer: Lo que quiero hacer es que tengo un gran archivo .csv. Quiero dividir este gran archivo csv en muchos archivos pequeños basados ​​en los registros comunes en la columna BB que también contienen 1 en la columna HH, y todos los registros no comunes que contienen 0 en la columna HH. […]

Pandas read_csv dtype especifican todas las columnas menos una

Tengo un archivo CSV. La mayoría de sus valores quiero leer como una cadena, pero quiero leer una columna como bool si la columna con el título dado existe. Debido a que el archivo CSV tiene muchas columnas, no quiero especificar directamente en cada columna el tipo de datos y dar algo como esto: data […]

En pandas, ¿cómo leer archivos csv con listas en una columna?

Tengo un archivo csv en el que algunas columnas se parecen a esto: df = pd.DataFrame({‘a’:[[‘ID1′,’ID2′,’ID3’],[‘ID1′,’ID4′],[]],’b’:[[8.6,1.3,2.5],[7.5,1.2],[]],’c’:[[12,23,79],[42,10],[]]}) Out[1]: abc 0 [ID1, ID2, ID3] [8.6, 1.3, 2.5] [12, 23, 79] 1 [ID1, ID4] [7.5, 1.2] [42, 10] 2 [] [] [] La cosa es que cuando lo leo, con pandas.read_csv , Python considera esas columnas como cadenas. […]

UnicodeDecodeError al leer un archivo CSV en Pandas con Python para el cirílico búlgaro

Recibo UnicodeDecodeError al leer un archivo CSV en Pandas con Python. UnicodeDecodeError: el codec ‘utf-8’ no puede decodificar el byte 0xc0 en la posición 0: el byte de inicio no es válido. No hay ningún símbolo cirílico en los datos. ¿Es debido a la configuración para el cirílico búlgaro? ¿Sabes qué poner? Intenté con el […]

Analice el archivo CSV con y agregue valores, múltiples columnas

Me gustaría adaptar la publicación aquí ( Parse CSV file y agregar los valores ) para sumr varias columnas en lugar de solo una. Así que para estos datos: CITY,AMOUNT,AMOUNT2,AMOUNTn London,20,21,22 Tokyo,45,46,47 London,55,56,57 New York,25,26,27 Cómo puedo conseguir esto: CITY,AMOUNT,AMOUNT2,AMOUNTn London,75,77,79 Tokyo,45,46,47 New York,25,26,27 Tendré varios miles de columnas eventualmente, y desafortunadamente no puedo usar […]

Python – Pandas – Escribe el dataframe a CSV

Estoy tratando de escribir un archivo de datos de 4 tablas, 3 columnas y 50 filas en un csv usando pandas. Recibo el siguiente error AttributeError: ‘dict’ object has no attribute ‘to_csv’ . Creo que estoy escribiendo la syntax correctamente, pero ¿podría alguien señalar dónde mi syntax es incorrecta al intentar escribir un dataframe en […]

Cómo filtrar desde un archivo CSV usando Python Script

Tengo archivo abx.csv que tiene tres columnas. Me gustaría filtrar los datos que tienen Application como Central y escribirlos en el mismo archivo .csv User ID Name Application 001 Ajohns ABI 002 Fjerry Central 900 Xknight RFC 300 JollK QDI 078 Demik Central Necesito escribir User ID,Name,Apllication en tres columnas en el mismo archivo .csv […]

¿read_csv no lee correctamente los nombres de las columnas en este archivo?

Tengo un archivo csv de la siguiente manera: 0 5 1 10 2 15 3 20 4 25 Quiero guardarlo como un dataframe con x, y ejes como nombres, y luego trazarlo. Sin embargo, cuando asigno x , y obtengo un DataFrame desordenado, ¿qué está pasando? column_names = [‘x’,’y’] x = pd.read_csv(‘csv-file.csv’, header = None, […]

Marco de datos de pandas con encabezado de 2 filas y exportación a CSV

Tengo un dataframe df = pd.DataFrame(columns = [“AA”, “BB”, “CC”]) df.loc[0]= [“a”, “b”, “c1”] df.loc[1]= [“a”, “b”, “c2”] df.loc[2]= [“a”, “b”, “c3”] Necesito agregar una fila secundaria al encabezado df.columns = pd.MultiIndex.from_tuples(zip(df.columns, [“DD”, “EE”, “FF”])) mi df es ahora AA BB CC DD EE FF 0 ab c1 1 ab c2 2 ab c3 pero […]

Pandas leen csv fuera de memoria

Intento manipular un archivo CSV grande usando Pandas, cuando escribí esto df = pd.read_csv(strFileName,sep=’\t’,delimiter=’\t’) genera “pandas.parser.CParserError: Error tokenizing data. C error: fuera de la memoria” wc -l indica que hay 13822117 líneas, necesito agregar en este dataframe del archivo csv, ¿hay una manera de manejar esta otra división? ¿El csv en varios archivos y escribir […]