Articles of gzip

¿Cómo saber si un archivo está comprimido con gzip?

Tengo un progtwig en Python que tomará archivos de texto como entrada. Sin embargo, algunos de estos archivos pueden estar comprimidos con gzip. ¿Existe una plataforma multiplataforma, utilizable desde Python para determinar si un archivo está comprimido con gzip o no? ¿Es lo siguiente confiable o podría un archivo de texto normal ‘accidentalmente’ tener el […]

Leer de un archivo gzip en python

Acabo de hacer impuestos de gzip en python. import gzip f=gzip.open(‘Onlyfinnaly.log.gz’,’rb’) file_content=f.read() print file_content Y no tengo salida en la pantalla. Como principiante de python, me pregunto qué debo hacer si quiero leer el contenido del archivo en el archivo gzip. Gracias.

¿Cómo determinar la longitud del contenido de un archivo comprimido con gzip en Python?

Tengo un archivo comprimido grande y quiero saber el tamaño del contenido sin descomprimirlo. He intentado esto: import gzip import os with gzip.open(data_file) as f: f.seek(0, os.SEEK_END) size = f.tell() pero me sale este error ValueError: Seek from end not supported ¿Cómo puedo hacer eso? Gracias.

Python gzip: ¿hay una manera de descomprimir desde una cadena?

He leído este post tan alrededor del problema en vano. Estoy tratando de descomprimir un archivo .gz proveniente de una URL. url_file_handle=StringIO( gz_data ) gzip_file_handle=gzip.open(url_file_handle,”r”) decompressed_data = gzip_file_handle.read() gzip_file_handle.close() … pero obtengo TypeError: coerciendo a Unicode: necesito una cadena o búfer, cStringIO.StringI encontrado ¿Que esta pasando? Traceback (most recent call last): File “/opt/google/google_appengine-1.2.5/google/appengine/tools/dev_appserver.py”, line 2974, […]

Usando csvreader contra un archivo gzipped en Python

Tengo un montón de archivos CSV comprimidos con gzip que me gustaría abrir para su inspección utilizando el lector de CSV incorporado de Python. Me gustaría hacer esto sin tener que descomprimirlos manualmente en el disco. Supongo que de alguna manera quiero obtener un flujo de datos sin comprimir y pasarlo al lector CSV. ¿Es […]

Decodifique los datos comprimidos en gzip y codificados en base64 a un formato legible

Intentando decodificar datos comprimidos en gzip y codificados en base64 a un formato legible en Python3.4. import base64 import zlib original_data = ‘…jU2X0NCQ19TSEEAAAABAAA=’ #Data cut short. decoded64 = base64.b64decode(original_data) #format:b’\x16xe\x94…\xae\x9a\…’ final_decoded = zlib.decompress(decoded64) print(final_decoded) Se está recibiendo: “Error -2 mientras se prepara para descomprimir los datos: estado de flujo inconsistente”. No estoy seguro de lo […]

¿Cómo puedo leer el archivo tar.gz usando pandas read_csv con la opción de compresión gzip?

Tengo un csv muy simple, con los siguientes datos, comprimidos dentro del archivo tar.gz. Necesito leer eso en dataframe usando pandas.read_csv. AB 0 1 4 1 2 5 2 3 6 import pandas as pd pd.read_csv(“sample.tar.gz”,compression=’gzip’) Sin embargo, estoy recibiendo error: CParserError: Error tokenizing data. C error: Expected 1 fields in line 440, saw 2 […]

Enviando datos en formato gzip

He escuchado cómo los navegadores pueden recibir páginas comprimidas desde el servidor. ¿Pueden también gzip los datos del formulario que envían al servidor? Y si es posible, ¿cómo descomprimiré estos datos en el servidor? Estoy usando el módulo de aplicación web de AppEngine, pero una explicación general / punteros a tutoriales sería suficiente. He hecho […]

Python 2.5.2: lo que era en lugar de la statement ‘con’

Escribí mi código para Python 2.7 pero el servidor tiene 2.5. ¿Cómo reescribo el siguiente código para que se ejecute en Python 2.5.2? gzipHandler = gzip.open(gzipFile) try: with open(txtFile, ‘w’) as out: for line in gzipHandler: out.write(line) except: pass En este momento, cuando bash ejecutar mi script, aparece este error: Advertencia: ‘with’ se convertirá en […]

Descarga de contenido comprimido a través de HTTP usando Python

¿Cómo aprovecho la compresión de HTTP 1.1 al descargar páginas web con Python? Actualmente estoy usando el módulo urllib incorporado para descargar contenido web. Al leer la documentación no pude encontrar ninguna información que de hecho esté usando compresión. ¿Ya está integrado en urllib o hay otra biblioteca que puedo usar?