Articles of HTML

HTML y BeautifulSoup: ¿cómo analizar de forma iterativa cuando la estructura no siempre se conoce de antemano?

Comencé con una estructura HTML simple, algo como esto: Gracias a la ayuda de @alecxe, pude crear este dictado JSON: {u’Outer List’: {u’Inner List’: [u’info 1′, u’info 2′, u’info 3′]}} usando su código: from bs4 import BeautifulSoup data = “””your html goes here: see the very end of post””” soup = BeautifulSoup(data) inner_ul = soup.find(‘ul’, […]

¿Cómo convierto la syntax de markdown de WMD a HTML en mi sitio?

Estoy usando django y estoy implementando WMD en mi sitio, solo me pregunto cómo convierto la syntax de reducción de marca a HTML para fines de visualización, ¿hay algún tipo de función a la que deba llamar para hacer esta conversión? ¿Cuál es la mejor manera de manejar markdown es decir. ¿guardo la marca como […]

Obtener una estructura de código HTML

Estoy usando BeautifulSoup4 y tengo curiosidad por saber si hay una función que devuelva una estructura (tags ordenadas) del código HTML. Aquí hay un ejemplo: Simple example This is a simple example of html page imprimir page.structure () : >> Intenté encontrar una solución pero no tuve éxito. Gracias

Python: cree un informe .pdf de varias páginas diseñado de forma estricta y automatizado a partir de .html

¿Cuáles son las buenas opciones basadas en Python para crear informes .pdf estrictamente diseñados a partir de .html? He adjuntado un borrador de .pdf para ilustrar los siguientes puntos: El diseño del informe está más bien diseñado estrictamente. En otras palabras “las apariencias importan”. El informe contiene gráficos vectoriales complejos (paquete: Matplotlib ). Pueden diferir […]

HTML en descomposición para enlazar texto y destino

Dado un enlace HTML como texttxt ¿Cómo puedo aislar la url y el texto? Actualizaciones Estoy usando Beautiful Soup, y soy incapaz de averiguar cómo hacerlo. yo si soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(url)) links = soup.findAll(‘a’) for link in links: print “link content:”, link.content,” and attr:”,link.attrs yo obtengo *link content: None and attr: [(u’href’, u’_redirectGeneric.asp?genericURL=/root /support.asp’)]* … […]

Recuperar texto de área de texto en matraz

Me gustaría poder escribir un texto de varias líneas en un área de texto (HTML), y recuperar este texto en python para procesarlo utilizando Flask. Alternativamente, me gustaría poder escribir un texto de varias líneas en un formulario. No tengo idea de cómo usar JS, así que eso no me ayudará. ¿Cómo voy a hacer […]

Eliminar espacios en blanco de la salida de plantillas Mako (Pilones)

Estoy usando Mako + Pylons y he notado una gran cantidad de espacios en blanco en mi salida HTML. ¿Cómo me gustaría deshacerme de él? Reddit logra hacerlo.

Guiones de Python en HTML

¿Es posible escribir scripts de Python en código HTML de manera similar a como escribes PHP entre las tags ? Me gustaría lograr que mi aplicación Python se ejecute en el navegador. gracias por ayudar

BeautifulSoup extrae XPATH o CSS Path del nodo

Quiero extraer algunos datos de HTML y luego poder resaltar los elementos extraídos en el lado del cliente sin modificar el código fuente de HTML. Y XPath o CSS Path se ve muy bien para esto. ¿Es posible extraer XPATH o CSS Path directamente desde BeautifulSoup? En este momento, uso la marca del elemento de […]

python elimina todo lo que hay entre .. any …

¿Cómo se usa Python 2.6 para eliminar todo, incluido el ….remove all …. He intentado varias maneras de usar re.sub sin ningún éxito Gracias