Articles of csv

¿Cómo detecto los campos faltantes en un archivo CSV de forma Pythonic?

Estoy tratando de analizar un archivo CSV usando el módulo csv de Python (específicamente, la clase DictReader ). ¿Hay alguna forma en Pythonic para detectar campos vacíos o faltantes y lanzar un error? Aquí hay un archivo de muestra con los siguientes encabezados: NOMBRE, ETIQUETA, VALOR foo,bar,baz yes,no x,y,z Al analizar, me gustaría que la […]

leyendo archivos csv en scipy / numpy en Python

Tengo problemas para leer un archivo csv, delimitado por tabs, en python. Yo uso la siguiente función: def csv2array(filename, skiprows=0, delimiter=’\t’, raw_header=False, missing=None, with_header=True): “”” Parse a file name into an array. Return the array and additional header lines. By default, parse the header lines into dictionaries, assuming the parameters are numeric, using ‘parse_header’. “”” […]

Python: teclas dict predeterminadas para evitar KeyError

Bastante nuevo en Python, desarrollador novato, que llama por primera vez Estoy llamando a algunos JSON y analizando datos relevantes como CSV. No puedo encontrar la manera de completar el archivo intermedio de json Dict con las teclas predeterminadas, ya que muchas están despobladas. El resultado es un error KeyError cuando bash analizar el contenido […]

Convertir un archivo csv en una lista de tuplas con python

Debo tomar un csv con 4 columnas: marca, precio, peso y tipo. Los tipos son naranja, manzana, pera, ciruela. Parámetros: Necesito seleccionar el peso más posible, pero seleccionando 1 naranja, 2 peras, 3 manzanas y 1 ciruela no excediendo el presupuesto de $ 20. No puedo repetir marcas de la misma fruta (como seleccionar la […]

Cómo leer un archivo csv con python

Estoy intentando leer un archivo csv pero no funciona. Puedo leer mi archivo csv pero cuando veo lo que leo, hay espacios en blanco entre los valores. Aqui esta mi codigo # -*- coding: iso-8859-1 -*- import sql_db, tmpl_macros, os import security, form, common import csv class windows_dialect(csv.Dialect): “””Describe the usual properties of unix-generated CSV […]

Analizar un archivo de texto plano en un archivo CSV utilizando Python

Tengo una serie de archivos HTML que se analizan en un solo archivo de texto usando Beautiful Soup. Los archivos HTML tienen un formato tal que su salida siempre es de tres líneas dentro del archivo de texto, por lo que la salida tendrá un aspecto similar al siguiente: Hello! How are you? Well, Bye! […]

Cargue y analice el archivo csv con “nueva línea universal” en python en Google App Engine

Estoy cargando un archivo csv / tsv desde un formulario en GAE, e bash analizar el archivo con el módulo csv de python. Como se describe aquí , los archivos cargados en GAE son cadenas. Así que trato a mi cadena cargada un objeto similar a un archivo: file = self.request.get(‘catalog’) catalog = csv.reader(StringIO.StringIO(file),dialect=csv.excel_tab) Pero […]

Filtro RDD basado en row_number

sc.textFile (ruta) permite leer un archivo HDFS pero no acepta parámetros (como omitir varias filas, has_headers, …). en el libro electrónico O’Reilly de “Learning Spark”, se sugiere usar la siguiente función para leer un CSV (Ejemplo 5-12. Ejemplo de carga de Python CSV) import csv import StringIO def loadRecord(line): “””Parse a CSV line””” input = […]

Crear kml desde csv en Python

Soy nuevo en Python. Estoy trabajando en archivos gps. Necesito convertir un archivo CSV que tenga todos los datos gps en un archivo kml. A continuación se muestra el código en python que estoy usando: import csv #Input the file name. fname = raw_input(“Enter file name WITHOUT extension: “) data = csv.reader(open(fname + ‘.csv’), delimiter […]

Concatenando múltiples archivos csv en un solo csv con el mismo encabezado – Python

Actualmente estoy usando el siguiente código para importar 6,000 archivos csv (con encabezados) y exportarlos a un solo archivo csv (con una sola fila de encabezado). #import csv files from folder path =r’data/US/market/merged_data’ allFiles = glob.glob(path + “/*.csv”) stockstats_data = pd.DataFrame() list_ = [] for file_ in allFiles: df = pd.read_csv(file_,index_col=None,) list_.append(df) stockstats_data = pd.concat(list_) […]