Articles of HTML

Cómo estructurar datos para construir fácilmente tablas HTML en Flask

Estoy tratando de crear tablas HTML a partir de datos almacenados en una tabla. Mis datos se leen de una tabla y se convierten en un dict de listas, por ejemplo: x = {‘date’:[u’2012-06-28′, u’2012-06-29′, u’2012-06-30′], ‘users’: [405, 368, 119]} Mi objective es crear una tabla HTML con la siguiente estructura para una longitud de […]

Django forma lista desplegable de modelos almacenados

Estoy tratando de crear un formulario para una biblioteca donde un usuario puede realizar 2 acciones: agregar un libro nuevo o abrir la información almacenada de uno existente. Los libros tienen 2 campos (título y autor). Cada vez que se crea un nuevo libro, se almacena en la base de datos. Cualquier libro creado anteriormente […]

¿Cómo uso BeautifulSoup4 para obtener TODO el texto antes de la etiqueta ?

Estoy tratando de raspar algunos datos para mi aplicación. Mi pregunta es que necesito algo. Aquí está el código HTML: This is a first sentence. This is a second sentence. This is a third sentence. Quiero que la salida se vea como Esta es una primera oración. Esta es una segunda oración. Esta es una […]

La mejor forma de descodificar la encoding Unicoding desconocida en Python 2.5

¿Lo tengo todo bien? De todos modos, estoy analizando un montón de html, pero no siempre sé qué encoding tiene que ser (un sorprendente número de mentira). El siguiente código muestra fácilmente lo que he estado haciendo hasta ahora, pero estoy seguro de que hay una mejor manera. Tus sugerencias serían muy apreciadas. import logging […]

¿La E-factory de lxml admite datos generados dinámicamente?

¿Hay una forma de crear las tags dinámicamente con la fábrica electrónica de lxml? Por ejemplo, recibo un error de syntax para el siguiente código: E.BODY( E.TABLE( for row_num in range(len(ws.rows)): row = ws.rows[row_num] # create a tr tag E.TR( for cell_num in range(len(row)): cell = row[cell_num] Obtuve el siguiente error: for row_num in range(len(ws.rows)): […]

Salida de imágenes a html usando python

Tengo una página web generada desde python que funciona como debería, usando: print ‘Content-type: text/html\n\n’ print “” # blank line, end of headers print ” print “” Quiero agregar imágenes a esta página web, pero cuando hago esto: sys.stdout.write( “Content-type: image/png\n\n” + file(“http://sofes.miximages.com/python/11.png”,”rb”).read() ) print ‘Content-type: text/html\n\n’ print “” # blank line, end of headers […]

Usando Python para iniciar sesión en el sitio web, complete un formulario y luego cierre sesión

Como parte de mi búsqueda para mejorar en Python, ahora bash iniciar sesión en un sitio web que frecuento, enviarme un mensaje privado y luego cerrar sesión. Hasta ahora, he logrado iniciar sesión (utilizando urllib, cookiejar y urllib2). Sin embargo, no puedo averiguar cómo llenar el formulario requerido para enviarme un mensaje. El formulario se […]

Python: Obtener texto de html usando Beautifulsoup

Estoy tratando de extraer el número de texto de clasificación de este enlace . Ejemplo de enlace de usuario de Kaggle no1 . Más claro en una imagen: Estoy usando el siguiente código: def get_single_item_data(item_url): sourceCode = requests.get(item_url) plainText = sourceCode.text soup = BeautifulSoup(plainText) for item_name in soup.findAll(‘h4’,{‘data-bind’:”text: rankingText”}): print(item_name.string) item_url = ‘https://www.kaggle.com/titericz’ get_single_item_data(item_url) El […]

Incluir archivo html en la plantilla de Jinja2

Estoy usando microframework Flask para mi servidor que usa plantillas Jinja. Tengo padre template.html y algunos childs child1.html, child2.html. Algunos de estos niños son archivos html bastante grandes y me gustaría dividirlos de alguna manera para una mejor lucidez sobre mi trabajo. el main.py: from flask import Flask, request, render_template app = Flask(__name__) @app.route(‘/’) @app.route(‘/’) […]

Python html análisis que realmente funciona

Estoy tratando de analizar algunos html en Python. Hubo algunos métodos que realmente funcionaron antes … pero hoy en día no hay nada que pueda usar sin soluciones alternativas. beautifulsoup tiene problemas después de que SGMLParser se fue html5lib no puede analizar la mitad de lo que está “ahí fuera” lxml intenta ser “demasiado correcto” […]