Articles of compresión

Comprimir objeto de Python en memoria

La mayoría de los tutoriales sobre la compresión de un archivo en Python implican la escritura inmediata de ese archivo en el disco sin la intervención de un objeto de Python comprimido. Quiero saber cómo encurtir y luego comprimir un objeto de Python en la memoria sin tener que escribir o leer desde el disco.

¿Cómo puedo protegerme de una bomba zip?

Acabo de leer sobre bombas zip , es decir, archivos zip que contienen una gran cantidad de datos altamente compresibles (0000000000000000000 …). Cuando se abren llenan el disco del servidor. ¿Cómo puedo detectar que un archivo zip es una bomba zip antes de descomprimirlo? ACTUALIZACIÓN ¿Puede decirme cómo se hace esto en Python o Java?

¿Script Python para minificar CSS?

Estoy buscando un script Python simple que pueda minimizar CSS como parte de un proceso de implementación de sitio web. (Python es el único lenguaje de script admitido en el servidor y los analizadores completos como CSS Utils son excesivos para este proyecto). Básicamente me gustaría jsmin.py para CSS. Un solo script sin dependencias. ¿Algunas […]

El módulo zipfile de Python no parece estar comprimiendo mis archivos

Hice una pequeña función de ayuda: import zipfile def main(archive_list=[],zfilename=’default.zip’): print zfilename zout = zipfile.ZipFile(zfilename, “w”) for fname in archive_list: print “writing: “, fname zout.write(fname) zout.close() if __name__ == ‘__main__’: main() ¡El problema es que todos mis archivos NO están COMPRIMIDOS! Los archivos tienen el mismo tamaño y, efectivamente, solo la extensión se está cambiando […]

Cómo reducir el tamaño del archivo de imagen usando PIL

Estoy usando PIL para cambiar el tamaño de las imágenes allí convirtiendo las imágenes más grandes en otras más pequeñas. ¿Hay alguna forma estándar de reducir el tamaño de archivo de la imagen sin perder demasiado la calidad? Digamos que el tamaño original de la imagen es de 100 KB, quiero reducirla a 5 o […]

¿Cómo gzip comprime una cadena en Python?

¿Cómo gzip comprime una cadena en Python? gzip.GzipFile existe, pero eso es para objetos de archivo, ¿qué pasa con las cadenas sin formato?

Crear una función de compresión en Python?

Necesito crear una función llamada comprimir que comprima una cadena reemplazando cualquier letra repetida con una letra y un número. Mi función debería devolver la versión abreviada de la cadena. He podido contar el primer personaje pero ningún otro. Ex: >>> compress(“ddaaaff”) ‘d2a3f2’ def compress(s): count=0 for i in range(0,len(s)): if s[i] == s[i-1]: count […]

Python: Reduciendo el uso de memoria del diccionario

Estoy tratando de cargar un par de archivos en la memoria. Los archivos tienen cualquiera de los 3 formatos siguientes: cadena TAB int cadena TAB flotador int TAB flotador. De hecho, son archivos ngram statics, en caso de que esto ayude con la solución. Por ejemplo: i_love TAB 10 love_you TAB 12 Actualmente, el pseudocódigo […]

¿Comprimiendo una serie de objetos JSON mientras se mantiene la lectura en serie?

Tengo un montón de objetos json que necesito comprimir, ya que está consumiendo demasiado espacio en el disco, aproximadamente 20 gigs por valor de unos pocos millones de ellos. Idealmente, lo que me gustaría hacer es comprimir cada uno individualmente y luego, cuando necesito leerlos, simplemente cargar y descomprimir iterativamente cada uno. Intenté hacer esto […]

Python descomprimir flujo de bytes?

Aquí está la situación: Obtengo documentos xml comprimidos en formato comprimido desde Amazon S3 import boto from boto.s3.connection import S3Connection from boto.s3.key import Key conn = S3Connection(‘access Id’, ‘secret access key’) b = conn.get_bucket(‘mydev.myorg’) k = Key(b) k.key(‘documents/document.xml.gz’) Los leo en archivo como import gzip f = open(‘/tmp/p’, ‘w’) k.get_file(f) f.close() r = gzip.open(‘/tmp/p’, ‘rb’) […]