Articles of gzip

Leyendo los caracteres utf-8 de un archivo gzip en python

Estoy tratando de leer un archivo comprimido (.gz) en python y estoy teniendo algunos problemas. Usé el módulo gzip para leerlo, pero el archivo está codificado como un archivo de texto utf-8, por lo que eventualmente lee un carácter no válido y se bloquea. ¿Alguien sabe cómo leer archivos gzip codificados como archivos utf-8? Sé […]

¿Cómo protegerme de una bomba gzip o bzip2?

Esto está relacionado con la pregunta sobre las bombas zip , pero teniendo en cuenta la compresión gzip o bzip2, por ejemplo, un servicio web que acepta archivos .tar.gz . Python proporciona un módulo tarfile práctico que es conveniente de usar, pero que no parece proporcionar protección contra zipbombs. En el código Python que utiliza […]

Conversión binaria Python a hexadecimal

Estoy intentando convertir un binario que tengo en python (un objeto de búfer de protocolo comprimido con gzip) en una cadena hexadecimal en un modo de escape de cadena (por ejemplo, \ xFA \ x1C ..). He intentado tanto repr(.getvalue()) tanto como .getvalue().encode(‘string-escape’) En ambos casos, termino con una cadena que no está hecha solo […]

Python 3: gzip.open () y modos

https://docs.python.org/3/library/gzip.html Estoy considerando usar gzip.open() , y estoy un poco confundido sobre el argumento del mode : El argumento de modo puede ser cualquiera de ‘r’, ‘rb’, ‘a’, ‘ab’, ‘w’, ‘wb’, ‘x’ o ‘xb’ para modo binario, o ‘rt’, ‘at’ , ‘wt’ o ‘xt’ para el modo de texto. El valor predeterminado es ‘rb’. Entonces, […]

Descomprimiendo parte de un archivo .gz usando python

Así que aquí está el problema. Tengo un archivo sample.gz que tiene un tamaño aproximado de 60KB. Quiero descomprimir los primeros 2000 bytes de este archivo. Estoy ejecutando un error de comprobación de CRC fallido, supongo que debido a que el campo CRC de gzip aparece al final del archivo y requiere que se descomprima […]

Convertir datos comprimidos con gzip por urllib2 a HTML

Actualmente utilizo mecanizar para leer la página web de Gzip como se muestra a continuación: br = mechanize.Browser() br.set_handle_gzip(True) response = br.open(url) data = response.read() Me pregunto cómo descomprimir los datos comprimidos con gzip por urllib2 a texto HTML. req = urllib2.Request(url) opener = urllib2.build_opener() response = opener.open(req) data = response.read() if response.info()[‘content-encoding’] == ‘gzip’: […]

¿Descargar y descomprimir archivos comprimidos en la memoria?

Me gustaría descargar un archivo usando urllib y descomprimir el archivo en la memoria antes de guardarlo. Esto es lo que tengo ahora: response = urllib2.urlopen(baseURL + filename) compressedFile = StringIO.StringIO() compressedFile.write(response.read()) decompressedFile = gzip.GzipFile(fileobj=compressedFile, mode=’rb’) outfile = open(outFilePath, ‘w’) outfile.write(decompressedFile.read()) Esto termina escribiendo archivos vacíos. ¿Cómo puedo lograr lo que estoy buscando? Respuesta actualizada: […]

¿Cómo gzip comprime una cadena en Python?

¿Cómo gzip comprime una cadena en Python? gzip.GzipFile existe, pero eso es para objetos de archivo, ¿qué pasa con las cadenas sin formato?

Análisis XML alimentado comprimido en ElementTree

Estoy tratando de analizar la siguiente fuente en ElementTree en python: ” http://smarkets.s3.amazonaws.com/oddsfeed.xml ” (archivo grande de advertencia) Aquí está lo que he intentado hasta ahora: feed = urllib.urlopen(“http://smarkets.s3.amazonaws.com/oddsfeed.xml”) # feed is compressed compressed_data = feed.read() import StringIO compressedstream = StringIO.StringIO(compressed_data) import gzip gzipper = gzip.GzipFile(fileobj=compressedstream) data = gzipper.read() # Parse XML tree = ET.parse(data) […]

gzip un archivo en Python

Quiero gzip un archivo en Python. Estoy intentando usar subprocss.check_call (), pero sigue fallando con el error ‘OSError: [Errno 2] No hay tal archivo o directorio’. ¿Hay algún problema con lo que estoy tratando aquí? ¿Hay una mejor manera de gzip un archivo que usar subprocess.check_call? from subprocess import check_call def gZipFile(fullFilePath) check_call(‘gzip ‘ + […]