Articles of csv de

¿read_csv no lee correctamente los nombres de las columnas en este archivo?

Tengo un archivo csv de la siguiente manera: 0 5 1 10 2 15 3 20 4 25 Quiero guardarlo como un dataframe con x, y ejes como nombres, y luego trazarlo. Sin embargo, cuando asigno x , y obtengo un DataFrame desordenado, ¿qué está pasando? column_names = [‘x’,’y’] x = pd.read_csv(‘csv-file.csv’, header = None, […]

Marco de datos de pandas con encabezado de 2 filas y exportación a CSV

Tengo un dataframe df = pd.DataFrame(columns = [“AA”, “BB”, “CC”]) df.loc[0]= [“a”, “b”, “c1”] df.loc[1]= [“a”, “b”, “c2”] df.loc[2]= [“a”, “b”, “c3”] Necesito agregar una fila secundaria al encabezado df.columns = pd.MultiIndex.from_tuples(zip(df.columns, [“DD”, “EE”, “FF”])) mi df es ahora AA BB CC DD EE FF 0 ab c1 1 ab c2 2 ab c3 pero […]

Pandas leen csv fuera de memoria

Intento manipular un archivo CSV grande usando Pandas, cuando escribí esto df = pd.read_csv(strFileName,sep=’\t’,delimiter=’\t’) genera “pandas.parser.CParserError: Error tokenizing data. C error: fuera de la memoria” wc -l indica que hay 13822117 líneas, necesito agregar en este dataframe del archivo csv, ¿hay una manera de manejar esta otra división? ¿El csv en varios archivos y escribir […]

Pandas DataFrame salida final de CSV

Me pregunto cómo agregar nuevos datos de DataFrame al final de un archivo csv existente. El to_csv no menciona tal funcionalidad. Gracias de antemano.

leer línea específica en el archivo csv, python

En un archivo CSV con python podemos leer todo el archivo línea por línea o fila por fila, quiero leer una línea específica (ejemplo del número de línea 24) sin leer todo el archivo y todas las líneas.

¿Cuál es una forma muy general de leer .csv en Python y pandas?

Tengo un archivo .csv con filas con varias longitudes de columnas. import pandas as pd df = pd.read_csv(infile, header=None) devuelve el ParserError: Error tokenizing data. C error: Expected 6 fields in line 8, saw 8 error. Sé que puedo usar el names=my_cols ¿Opción en la llamada a read_csv, pero seguramente tiene que haber algo más […]

¿Puedo importar un archivo CSV e inferir automáticamente el delimitador?

Quiero importar dos tipos de archivos CSV, algunos usan “;” para delimitador y otros usan “,”. Hasta ahora he estado cambiando entre las siguientes dos líneas: reader=csv.reader(f,delimiter=’;’) o reader=csv.reader(f,delimiter=’,’) ¿Es posible no especificar el delimitador y permitir que el progtwig verifique el delimitador correcto? Las siguientes soluciones (Blender y sharth) parecen funcionar bien para archivos […]

Filtrado de contenido CSV por elementos de lista en Python

Me quedé atascado para obtener el resultado correcto de una simple pieza de código de Python (soy un principiante de Python de todos modos). Dado un archivo de entrada csv (ListInput.csv): pKT, pET, pUT, y otro archivo csv que contiene características de muchos de estos elementos (Table.csv): pBR,156,AATGGT,673,HHHTTTT, pUT,54,CCATGTACCTAT,187,PRPTP, pHTM,164,GGTATAG,971,WYT, pKT,12,GCATACAGGAC,349,, pET,87,GTGACGGTA,506,PPMK, ………… y así […]

Pandas escribiendo el dataframe en un archivo CSV

Tengo un dataframe en pandas que me gustaría escribir en un archivo CSV. Estoy haciendo esto usando: df.to_csv(‘out.csv’) Y obteniendo el error: UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\u03b1′ in position 20: ordinal not in range(128) ¿Hay alguna forma de evitar esto fácilmente (es decir, tengo caracteres Unicode en mi dataframe)? ¿Y hay una manera […]

¿Cuál es la forma más rápida de cargar un archivo csv grande en una libreta para trabajar con pandas python?

Estoy tratando de cargar un archivo csv, que es de 250 MB. Básicamente 4 millones de filas y 6 columnas de datos de series de tiempo (1min). El procedimiento habitual es: location = r’C:\Users\Name\Folder_1\Folder_2\file.csv’ df = pd.read_csv(location) Este procedimiento dura unos 20 minutos !!!. Muy preliminar he explorado las siguientes opciones Subir en trozos y […]