Articles of gzip

Cómo usar la encoding de contenido: gzip con Python SimpleHTTPServer

Estoy usando python -m SimpleHTTPServer para servir un directorio para pruebas locales en un navegador web. Algunos de los contenidos incluyen archivos de datos de gran tamaño. Me gustaría poder gzip y hacer que SimpleHTTPServer les sirva con Content-Encoding: gzip. ¿Hay una forma fácil de hacer esto?

motor de aplicación de google urlfetch gzip a cadena

Utilizando Google App Engine, estoy intentando urlfetch un archivo gzip desde una URL que contiene un archivo csv. En última instancia, me gustaría mostrar el contenido del archivo csv en mi página web. Tengo el siguiente código en este momento: #!/usr/bin/env python import webapp2 from google.appengine.api import urlfetch class Test(webapp2.RequestHandler): def get(self): self.response.headers[‘Content-Type’] = ‘text/plain’ […]

urlopen problemas al intentar descargar un archivo gzip

Voy a utilizar el volcado wiktionary con el propósito de etiquetar POS. De alguna manera se atasca al descargar. Aquí está mi código: import nltk from urllib import urlopen from collections import Counter import gzip url = ‘http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz’ fStream = gzip.open(urlopen(url).read(), ‘rb’) dictFile = fStream.read() fStream.close() text = nltk.Text(word.lower() for word in dictFile()) tokens = […]

Compresse archivo con sello de tiempo modificado

Estoy atascado con la configuración de la marca de tiempo del archivo, también según el documento gzip de python, la syntax no funciona como gzip.GzipFile(filename=outputfile,mode=’wb’,compresslevel=9,mtime=ftime) , pero cuando lo usé gzip.GzipFile(outputfile,’wb’,9,mtime=ftime) está funcionando pero excepto la marca de tiempo. def compresse_file(file,ftime): data = open(file,’rb’) outputfile = file +”.gz” gzip_file = gzip.GzipFile(outputfile,’wb’,9,mtime=ftime) gzip_file.write(data.read()) gzip_file.flush() gzip_file.close() data.close() […]

Descomprimir una carga gzip de un paquete con Python

Actualmente estoy trabajando en un progtwig que toma un archivo .pcap y separa todos los paquetes por ip usando el paquete scapy. Quiero descomprimir las cargas útiles que están comprimidas usando el paquete gzip. Puedo decir si la carga útil está comprimida porque contiene Content-Encoding: gzip Estoy tratando de usar fileStream = StringIO.StringIO(payload) gzipper = […]

¿Por qué se busca desde el final de un archivo para archivos BZip2 y no archivos Gzip?

La pregunta Estoy analizando archivos comprimidos grandes en Python 2.7.6 y me gustaría saber el tamaño del archivo sin comprimir antes de comenzar. Estoy tratando de usar la segunda técnica presentada en esta respuesta SO . Funciona para archivos con formato bzip2 pero no para archivos con formato gzip. ¿Qué tiene de diferente los dos […]

¿Cómo comprimo una carpeta con el módulo Python GZip?

Estoy creando un software de Python que comprime archivos / carpetas … ¿Cómo crearía una sección del código que solicite la entrada del usuario de la ubicación de la carpeta y luego la comprima? Actualmente tengo el código para un solo archivo pero no una carpeta llena de archivos. Por favor explique en detalle cómo […]

Escribir adjuntar solo archivos de registro gzipeados en Python

Estoy creando un servicio donde registro registros de formato de texto sin formato de varias fonts (un archivo por fuente). No tengo la intención de rotar estos registros, ya que deben estar disponibles para siempre. Para hacer esto para siempre alrededor de los archivos, espero poder gzip en fly. Como son datos de registro, los […]

Aplicar la compresión GZIP a un CSV en Python Pandas

Estoy tratando de escribir un dataframe en un archivo comprimido comprimido con gzip en pandas python, utilizando lo siguiente: import pandas as pd import datetime import csv import gzip # Get data (with previous connection and script variables) df = pd.read_sql_query(script, conn) # Create today’s date, to append to file todaysdatestring = str(datetime.datetime.today().strftime(‘%Y%m%d’)) print todaysdatestring […]

¿Cómo saber si un archivo está comprimido con gzip?

Tengo un progtwig en Python que tomará archivos de texto como entrada. Sin embargo, algunos de estos archivos pueden estar comprimidos con gzip. ¿Existe una plataforma multiplataforma, utilizable desde Python para determinar si un archivo está comprimido con gzip o no? ¿Es lo siguiente confiable o podría un archivo de texto normal ‘accidentalmente’ tener el […]