Articles of Extracto de

Creación de un raspador web básico en Python con solo bibliotecas integradas – Python

Aprendiendo Python, estoy tratando de hacer un raspador web sin bibliotecas de terceros, para que el proceso no se simplifique para mí, y sé lo que estoy haciendo. Revisé varios recursos en línea, pero todos me han dejado confundido acerca de ciertas cosas. El html se ve algo como esto, … *lots of other tags* […]

Extraer palabras clave Meta de la página web?

Necesito extraer las palabras clave meta de una página web usando Python. Estaba pensando que esto podría hacerse usando urllib o urllib2, pero no estoy seguro. ¿Alguien tiene alguna idea? Estoy usando Python 2.6 en Windows XP

Extraer una región de una página PDF por coordenadas

Estoy buscando una herramienta para extraer una región rectangular dada (por coordenadas) de un archivo PDF de 1 página y generar un archivo PDF de 1 página con la región especificada: # in.pdf is a 1-page pdf file extract file.pdf 0 0 100 100 > out.pdf # out.pdf is now a 1-page pdf file with […]

Extraer datos de archivo tsv python

Tengo un archivo TSV, que se parece a esto: ABCDD=1;E=2 SDFGH=2;B=4 Me gustaría escribir el contenido en otro archivo tsv de esta manera. ABCDD 1 ABCDE 2 SDFGH 2 SDFGB 4 Realmente apreciaría si alguien pudiera ayudarme / insinuarme en dividir la columna 5 según lo deseado.

python beautifulsoup extrayendo texto

Me gustaría extraer el texto en negrita , que indica el último psi del tiempo de este sitio web http://app2.nea.gov.sg/anti-pollution-radiation-protection/air-pollution/psi/psi-readings-over -las últimas 24 horas . ¿Alguien sabe cómo extraer utilizando este código a continuación? También necesitaba extraer dos valores que están frente al psi del tiempo actual para calcular. Total de tres valores (últimos y […]

Usando BeautifulSoup para extraer elementos específicos de dl y dd list

Mi primera publicación de tiempo. Estoy usando BeautifulSoup 4 y python 2.7 (pycharm). Tengo una página web que contiene elementos y necesito extraer elementos específicos donde las tags sean ‘Salario:’ o ‘Fecha:’, la página contiene varias listas. El problema: parece que no puedo identificar y extraer un texto específico. He buscado en este sitio y […]

¿Cómo extraer columnas específicas de un archivo separado por espacios en Python?

Estoy intentando procesar un archivo del banco de datos de proteínas que está separado por espacios (no \ t). Tengo un archivo .txt y quiero extraer filas específicas y, de esas filas, solo quiero extraer unas pocas columnas. Necesito hacerlo en Python. Primero probé con la línea de comandos y usé el comando awk sin […]

¿Cómo extraer metadatos de una imagen usando python?

Hola, estoy trabajando en un progtwig que abrirá una imagen y luego extraerá los metadatos. ¿Cómo extraigo los metadatos usando Python? Gracias

¿Cómo extraer audio de un archivo de video usando python?

Quiero escribir un progtwig de python que pueda extraer audio de un archivo de video (por ejemplo, video.avi ). ¿Hay alguna buena biblioteca para ello? ¿Y de dónde debería empezar? Intenté usar PyMedia, pero no pude instalarlo en mi MacOSX (Mountain Lion). EDITAR: El problema es video.avi no está completamente disponible. Alguien está escribiendo en […]

Cómo extraer Raw del paquete TCP usando Scapy

Uso la función de olfato del módulo scapy. Mi filter y función prn están haciendo un gran trabajo. Pero ahora, me gustaría extraer el formato Raw del TCP packet y manejarlo con formato hexadecimal o binario. Aquí está la documentación de Packet Class en scapy. Cómo puedo hacer eso ? Intenté print packet[Raw] pero parece […]