Articles of glob

Encuentre un archivo en un directorio usando python por nombre parcial

Tengo un directorio con varios cientos de miles de archivos. Todos ellos siguen este formato: datetime_fileid_metadata_collect.txt Un ejemplo específico se ve así: 201405052359559_0002230255_35702088_collect88.txt Estoy intentando escribir un script que extrae y copia archivos individuales cuando todo lo que proporciono es una lista de identificadores de archivos. Por ejemplo, tengo un documento de texto fileids.txt que […]

Lea varios archivos csv y agregue un nombre de archivo como nueva columna en pandas

Tengo varios archivos csv en una sola carpeta y quiero abrirlos todos en un dataframe e insertar una nueva columna con el nombre del archivo asociado. Hasta ahora he codificado lo siguiente: import pandas as pd import glob, os df = pd.concat(map(pd.read_csv, glob.glob(os.path.join(‘path/*.csv’)))) df[‘filename’]= os.path.basename(csv) df Esto me da el dataframe que quiero, pero en […]

Python Glob.glob: un comodín para el número de directorios entre la raíz y el destino

Bueno, estoy teniendo problemas no solo con el problema en sí, sino también con tratar de explicar mi pregunta. Tengo un árbol de directorios que consta de aproximadamente 7 iteraciones, por lo tanto: rootdir/a/b/c/d/e/f/destinationdir La cosa es que algunos pueden tener 5 niveles de subdirectorio y algunos pueden tener hasta diez, como: rootdir/a/b/c/d/destinationdir o: rootdir/a/b/c/d/e/f/g/h/destinationdir […]

Usando argparse junto con sys.argv en Python

Actualmente tengo una secuencia de comandos, que utiliza el archivo globbing a través de la variable sys.argv como esta: if len(sys.argv) > 1: for filename in sys.argv[1:]: Esto funciona muy bien para procesar un montón de archivos; Sin embargo, también me gustaría usar esto con el módulo argparse . Entonces, me gustaría que mi progtwig […]

¿Cómo usar glob para leer un conjunto limitado de archivos con nombres numéricos?

¿Cómo usar glob para leer solo un conjunto limitado de archivos? Tengo archivos json con números de 50 a 20000 (por ejemplo, 50.json, 51.json, 52.json … 19999.json, 20000.json) dentro del mismo directorio. Quiero leer solo los archivos numerados del 15000 al 18000. Para hacerlo, estoy usando un globo global, como se muestra a continuación, pero […]

Globo inverso: realice una ingeniería inversa de una cadena de comodín a partir de nombres de archivos

Quiero generar una cadena de comodín a partir de un par de nombres de archivos. Una especie de globo inverso. Ejemplo: file1 = ‘some foo file.txt’ file2 = ‘some bar file.txt’ assert ‘some * file.txt’ == inverse_glob(file1, file2) ¿Utilizar difflib tal vez? ¿Se ha solucionado esto ya? Aplicación es un gran conjunto de archivos de […]

¿Por qué estoy perdiendo memoria con este bucle de python?

Estoy escribiendo un rastreador de sistema de archivos personalizado, que pasa millones de globs para procesar a través de sys.stdin. Estoy descubriendo que cuando se ejecuta el script, su uso de memoria aumenta enormemente con el tiempo y todo se detiene prácticamente. He escrito un caso mínimo a continuación que muestra el problema. ¿Estoy haciendo […]

¿Cómo listar una secuencia de imágenes de una manera eficiente? Comparación de secuencias numéricas en Python

Tengo un directorio de 9 imágenes: image_0001, image_0002, image_0003 image_0010, image_0011 image_0011-1, image_0011-2, image_0011-3 image_9999 Me gustaría poder listarlos de una manera eficiente, como esto (4 entradas para 9 imágenes): (image_000 [1-3], image_00 [10-11], image_0011- [1-3], image_9999) ¿Hay alguna forma en python, para devolver un directorio de imágenes, de manera breve / clara (sin enumerar […]

¿Cómo oculto todo excluyendo un tipo de archivo?

Estoy tratando de ocultar todos mis archivos excluyendo .exe . A continuación se esconde : archivos, exe No oculta: carpetas Quiero : ocultar carpetas, archivos No oculta: .exe import os, shutil import ctypes folder = ‘C:\\Users\\TestingAZ1’ for the_file in os.listdir(folder): file_path = os.path.join(folder, the_file) try: if os.path.isfile(file_path): ctypes.windll.kernel32.SetFileAttributesW(file_path, 2) except Exception as e: print(e) No […]

¿Más rápido que os.walk o glob?

Estoy perdiendo el tiempo con las búsquedas de archivos en python en un disco duro grande. He estado mirando os.walk y glob. Normalmente uso os.walk porque lo encuentro mucho más ordenado y parece ser más rápido (para directorios de tamaño habitual). ¿Alguien ha tenido alguna experiencia con ambos y podría decir cuál es más eficiente? […]