Articles of Extracto de

¿Cómo extraer una secuencia corta usando una ventana con un tamaño de paso específico?

El siguiente código extrae una secuencia corta en cada secuencia con el tamaño de ventana 4. ¿Cómo cambiar la ventana por el paso 2 y extraer 4 pares de bases? Código de ejemplo from Bio import SeqIO with open(“testA_out.fasta”,”w”) as f: for seq_record in SeqIO.parse(“testA.fasta”, “fasta”): i = 0 while ((i+4) ” + str(seq_record.id) + […]

¿Cómo extraer palabras literales de una cadena consecutiva de manera eficiente?

Posible duplicado: ¿Cómo dividir texto sin espacios en lista de palabras? Hay una gran cantidad de información de texto en los comentarios de las personas que se analizan a partir de html, pero no hay caracteres delimitadores en ellos. Por ejemplo: thumbgreenappleactiveassignmentweeklymetaphor . Aparentemente, hay ‘pulgar’, ‘verde’, ‘manzana’, etc. en la cuerda. También tengo un […]

¿Cómo extraer datos JSON de una respuesta que contiene un encabezado y un cuerpo?

Esta es mi primera pregunta planteada a Stack Overflow, porque normalmente puedo encontrar las soluciones a mi problema aquí, pero para esta situación en particular, no puedo. Estoy escribiendo un complemento de Python para mi comstackdor que genera llamadas REST en varios idiomas para interactuar con una API. Me autentico con los módulos socket y […]

Cómo obtener datos del elemento de inspección de una página web utilizando Python

Me gustaría obtener los datos del elemento de inspección utilizando Python. Puedo descargar el código fuente usando BeautifulSoup pero ahora necesito el texto del elemento de inspección de una página web. Apreciaría sinceramente si pudieras aconsejarme cómo hacerlo. Edición: Por elemento de inspección quiero decir, en google chrome, hacer clic con el botón derecho nos […]

Análisis de datos osm.pbf usando el módulo de GDAL / OGR python

Estoy intentando extraer datos de un archivo OSM.PBF usando el módulo GDAL / OGR de python. Actualmente mi código se ve así: import gdal, ogr osm = ogr.Open(‘file.osm.pbf’) ## Select multipolygon from the layer layer = osm.GetLayer(3) # Create list to store pubs pubs = [] for feat in layer: if feat.GetField(‘amenity’) == ‘pub’: pubs.append(feat) […]

Extraer todos los archivos con la ruta del directorio en el directorio dado

Tengo un archivo tar en el que tengo un directorio que necesito extraer en un directorio determinado. Por ejemplo: tengo un directorio TarPrefix / x / y / z en un archivo tar quiero extraerlo en un directorio de destino dado, por ejemplo: extraído / a / este directorio debe contener todos los archivos y […]

Python zipfile.extract () no extrae todos los archivos

Estoy tratando de extraer la carpeta comprimida usando el código que se encuentra aquí. def unzip(source_filename, dest_dir): with zipfile.ZipFile(source_filename) as zf: for member in zf.infolist(): words = member.filename.split(‘/’) path = dest_dir for word in words[:-1]: drive, word = os.path.splitdrive(word) head, word = os.path.split(word) if word in (os.curdir, os.pardir, ”): continue path = os.path.join(path, word) zf.extract(member, […]

Creación de un raspador web básico en Python con solo bibliotecas integradas – Python

Aprendiendo Python, estoy tratando de hacer un raspador web sin bibliotecas de terceros, para que el proceso no se simplifique para mí, y sé lo que estoy haciendo. Revisé varios recursos en línea, pero todos me han dejado confundido acerca de ciertas cosas. El html se ve algo como esto, … *lots of other tags* […]

Extraer palabras clave Meta de la página web?

Necesito extraer las palabras clave meta de una página web usando Python. Estaba pensando que esto podría hacerse usando urllib o urllib2, pero no estoy seguro. ¿Alguien tiene alguna idea? Estoy usando Python 2.6 en Windows XP

Extraer una región de una página PDF por coordenadas

Estoy buscando una herramienta para extraer una región rectangular dada (por coordenadas) de un archivo PDF de 1 página y generar un archivo PDF de 1 página con la región especificada: # in.pdf is a 1-page pdf file extract file.pdf 0 0 100 100 > out.pdf # out.pdf is now a 1-page pdf file with […]