Articles of HTML

Inicie sesión en el sitio web utilizando solicitudes de python

Estoy intentando iniciar sesión en https://www.voxbeam.com/login utilizando solicitudes para raspar datos. Soy un principiante de python y he hecho sobre todo tutoriales, y algunos raspado web por mi cuenta con BeautifulSoup. Mirando el HTML: Entiendo que debería estar usando el método de envío y el envío de nombre de usuario y contraseña Estoy intentando esto: […]

Cómo encontrar todos los comentarios con Beautiful Soup

Esta pregunta se hizo hace cuatro años, pero la respuesta ahora está desactualizada para BS4. Quiero eliminar todos los comentarios en mi archivo html usando una hermosa sopa. Como BS4 hace que cada comentario sea un tipo especial de cadena navegable , pensé que este código funcionaría: for comments in soup.find_all(‘comment’): comments.decompose() Así que eso […]

ValueError: unichr () arg no está en el rango (0x10000) (comstackción Python estrecha)

Estoy intentando convertir la entidad html a unichar, la entidad html es 󮠖 cuando trato de hacer lo siguiente: unichr(int(976918)) Me equivoqué de que: ValueError: unichr() arg not in range(0x10000) (narrow Python build) Parece que está fuera del rango de conversión para unichar.

Comprender la función Find () en Beautiful Soup

Sé que lo que estoy tratando de hacer es simple, pero me está causando dolor. Me gustaría extraer datos de HTML utilizando BeautifulSoup. Para hacer eso necesito usar correctamente la función .find() . Aquí está el HTML con el que estoy trabajando: Ed Boon @noobde 73,599 Real 32,452 Fake Followers 69% Audit score Los valores […]

Obtención de valor de la etiqueta seleccionada usando el matraz

Soy nuevo en Flask y tengo problemas para obtener el valor de mi etiqueta de selección. He intentado request.form[‘comp_select’] que devuelve una Solicitud incorrecta. Sin embargo, cuando bash utilizar request.form.get(‘comp_select’) , mi página de devolución devuelve una lista en blanco “[]”. Mi html: Please select {% for o in data %} {{ o.name }} {% […]

¿Cómo detectar con Python si la cadena contiene código html?

¿Cómo detectar si la cadena contiene un html (puede ser html4, html5, solo parciales de html dentro del texto)? No necesito una versión de HTML, sino que si la cadena es solo un texto o contiene un html. El texto es típicamente multilínea con líneas también vacías Actualizar: entradas de ejemplo: html: I’m title Hello, […]

matplotlib – almacenar imagen en variable

Me gustaría almacenar la imagen generada por matplotlib en una variable raw_data para usarla como imagen en línea. import os import sys os.environ[‘MPLCONFIGDIR’] = ‘/tmp/’ import matplotlib matplotlib.use(“Agg”) import matplotlib.pyplot as plt print “Content-type: image/png\n” plt.plot(range(10, 20)) raw_data = plt.show() if raw_data: uri = ‘data:image/png;base64,’ + urllib.quote(base64.b64encode(raw_data)) print ” % uri else: print “No data” […]

¿Se puede insertar Python en HTML como PHP y JSP?

¿Hay alguna forma de escribir Python incrustado en HTML como lo hago con PHP o JSP?

El raspado de HTML usando lxml y las solicitudes da un error de Unicode

Estoy tratando de usar un raspador de HTML como el que se proporciona aquí . Funciona bien para el ejemplo que proporcionan. Sin embargo, cuando trato de usarlo con mi página web , recibo este error: Unicode strings with encoding declaration are not supported. Please use bytes input or XML fragments without declaration. Unicode strings […]

Python Mechanize selecciona un formulario sin nombre

Estoy intentando que mecanize seleccione un formulario de una página, pero el formulario en cuestión no tiene ningún atributo de “nombre” en el html. ¿Qué tengo que hacer? cuando trato de usar br.select_form(name = “”) Recibo errores de que ninguna forma se declara con ese nombre, y la función requiere una entrada de nombre. Solo […]