Articles of archivo de

¿Qué lee sys.stdin?

Obtengo cómo abrir archivos, y luego uso con ellos las funciones integradas de Python. Pero, ¿cómo funciona sys.stdin? for something in sys.stdin: some stuff here lines = sys.stdin.readlines() ¿Cuál es la diferencia entre los dos usos anteriores en sys.stdin? ¿De dónde está leyendo la información? ¿Es a través del teclado, o todavía tenemos que proporcionar […]

El diccionario de Python cargado desde el disco ocupa demasiado espacio en la memoria

Tengo un diccionario decapado en disco con un tamaño de ~ 780 Megs (en disco). Sin embargo, cuando cargo ese diccionario en la memoria, su tamaño aumenta inesperadamente a alrededor de 6 gigabytes. ¿Hay alguna forma de mantener el tamaño en el tamaño del archivo real en la memoria también? (Quiero decir que estará bien […]

¿Cómo leer el archivo en orden inverso en python3.2 sin leer todo el archivo en la memoria?

Estoy analizando los archivos de registro en tamaño de 1 a 10 GB con python3.2, necesito buscar una línea con expresiones regulares específicas (algún tipo de marca de tiempo), y quiero encontrar el último evento. He intentado usar: for line in reversed(list(open(“filename”))) lo que resultó en un rendimiento muy malo (en los casos buenos) y […]

python: edita el archivo ISO directamente

¿Es posible tomar un archivo ISO y editar un archivo directamente en él, es decir, no desempaquetándolo, cambiando el archivo y reenvasándolo? ¿Es posible hacer 1. desde Python? ¿Cómo lo haría?

Fecha de creación y cambio de nombre del archivo Python – Solicitud de crítica

Escenario: Cuando fotografío un objeto, tomo múltiples imágenes, desde varios angularjs. Multiplicado por la cantidad de objetos que “disparo”, puedo generar una gran cantidad de imágenes. Problema: la cámara genera imágenes identificadas como, ‘DSCN100001’, ‘DSCN100002 “, etc. Críptica. Preparé un script que pedirá la especificación del directorio (Windows), así como un “Prefijo”. La secuencia de […]

espacios en blanco de escape en linux ruta y nombres de archivos

En realidad estoy limpiando mi sistema. Y como de costumbre, estoy intentando hacerlo de la manera de Python, así que estoy limpiando duplicados en mi biblioteca de Música. Y ahora estoy tratando de encontrar un patrón para re módulo para escapar de todos los espacios en blanco y caracteres especiales. Pero desafortunadamente no pude encontrar […]

Diferencia entre E / S binario y de texto en python en Windows

Sé que debo abrir un archivo binario usando “rb” lugar de “r” porque Windows se comporta de manera diferente para archivos binarios y no binarios. Pero no entiendo qué sucede exactamente si abro un archivo de forma incorrecta y por qué esta distinción es necesaria. Otros sistemas operativos parecen funcionar bien tratando ambos tipos de […]

Encuentra rápidamente las diferencias entre dos archivos de texto grandes

Tengo dos archivos de texto de 3GB, cada archivo tiene alrededor de 80 millones de líneas. Y comparten 99,9% de líneas idénticas (el archivo A tiene 60,000 líneas únicas, el archivo B tiene 80,000 líneas únicas). ¿Cómo puedo encontrar rápidamente esas líneas únicas en dos archivos? ¿Hay alguna herramienta de línea de comandos lista para […]

La forma más rápida de escribir grandes datos en un archivo.

Estoy intentando crear un real aleatorio, enteros, alfanuméricos, cadenas alfa y luego escribir en un archivo hasta que el tamaño del archivo scope 10MB . El código es el siguiente. import string import random import time import sys class Generator(): def __init__(self): self.generate_alphabetical_strings() self.generate_integers() self.generate_alphanumeric() self.generate_real_numbers() def generate_alphabetical_strings(self): return ”.join(random.choice(string.ascii_lowercase) for i in range(12)) def […]

La mejor manera de elegir un archivo aleatorio de un directorio

¿Cuál es la mejor manera de elegir un archivo aleatorio de un directorio en Python? Edit: Esto es lo que estoy haciendo: import os import random import dircache dir = ‘some/directory’ filename = random.choice(dircache.listdir(dir)) path = os.path.join(dir, filename) ¿Esto es particularmente malo, o hay una manera particularmente mejor?