Aprendiendo Python, estoy tratando de hacer un raspador web sin bibliotecas de terceros, para que el proceso no se simplifique para mí, y sé lo que estoy haciendo. Revisé varios recursos en línea, pero todos me han dejado confundido acerca de ciertas cosas. El html se ve algo como esto, … *lots of other tags* […]
Necesito extraer las palabras clave meta de una página web usando Python. Estaba pensando que esto podría hacerse usando urllib o urllib2, pero no estoy seguro. ¿Alguien tiene alguna idea? Estoy usando Python 2.6 en Windows XP
Estoy buscando una herramienta para extraer una región rectangular dada (por coordenadas) de un archivo PDF de 1 página y generar un archivo PDF de 1 página con la región especificada: # in.pdf is a 1-page pdf file extract file.pdf 0 0 100 100 > out.pdf # out.pdf is now a 1-page pdf file with […]
Tengo un archivo TSV, que se parece a esto: ABCDD=1;E=2 SDFGH=2;B=4 Me gustaría escribir el contenido en otro archivo tsv de esta manera. ABCDD 1 ABCDE 2 SDFGH 2 SDFGB 4 Realmente apreciaría si alguien pudiera ayudarme / insinuarme en dividir la columna 5 según lo deseado.
Me gustaría extraer el texto en negrita , que indica el último psi del tiempo de este sitio web http://app2.nea.gov.sg/anti-pollution-radiation-protection/air-pollution/psi/psi-readings-over -las últimas 24 horas . ¿Alguien sabe cómo extraer utilizando este código a continuación? También necesitaba extraer dos valores que están frente al psi del tiempo actual para calcular. Total de tres valores (últimos y […]
Mi primera publicación de tiempo. Estoy usando BeautifulSoup 4 y python 2.7 (pycharm). Tengo una página web que contiene elementos y necesito extraer elementos específicos donde las tags sean ‘Salario:’ o ‘Fecha:’, la página contiene varias listas. El problema: parece que no puedo identificar y extraer un texto específico. He buscado en este sitio y […]
Estoy intentando procesar un archivo del banco de datos de proteínas que está separado por espacios (no \ t). Tengo un archivo .txt y quiero extraer filas específicas y, de esas filas, solo quiero extraer unas pocas columnas. Necesito hacerlo en Python. Primero probé con la línea de comandos y usé el comando awk sin […]
Hola, estoy trabajando en un progtwig que abrirá una imagen y luego extraerá los metadatos. ¿Cómo extraigo los metadatos usando Python? Gracias
Quiero escribir un progtwig de python que pueda extraer audio de un archivo de video (por ejemplo, video.avi ). ¿Hay alguna buena biblioteca para ello? ¿Y de dónde debería empezar? Intenté usar PyMedia, pero no pude instalarlo en mi MacOSX (Mountain Lion). EDITAR: El problema es video.avi no está completamente disponible. Alguien está escribiendo en […]
Uso la función de olfato del módulo scapy. Mi filter y función prn están haciendo un gran trabajo. Pero ahora, me gustaría extraer el formato Raw del TCP packet y manejarlo con formato hexadecimal o binario. Aquí está la documentación de Packet Class en scapy. Cómo puedo hacer eso ? Intenté print packet[Raw] pero parece […]