Articles of mecanizar

Python Mechanize me sigue dando ‘response_seek_wrapper’ cuando bash usar .open

No estoy seguro de lo que está pasando, ya que el script solía funcionar (antes de que perdiera el tiempo con mi python en mi sistema …) Pero cuando bash algo en la línea de import mechanize browser = mechanize.Browser() browser.open(“http://google.com”) Me sale algo como <response_seek_wrapper at 0x10123fd88 whose wrapped object = <closeable_response at 0x101232170 […]

Módulo de mecanizado Python no encontrado

Mi versión de Python es: Python 2.7 Hice un mecanismo de instalación fácil, luego intenté ejecutar un script y obtengo esto: File “test.py”, line 2, in import mechanize ImportError: No module named mechanize Si necesita cualquier otra información, hágamelo saber.

¿Cómo guardar las cookies mecanize.Browser () para archivar?

¿Cómo podría hacer que el módulo de Python se mecanice (específicamente mecanice.Browser ()) para guardar sus cookies actuales en un archivo legible? Además, ¿qué debo hacer para subir esa cookie a una página web con ella? Gracias

HTML sin procesar frente a DOM que raspa en python usando mecanizar y sopa hermosa

Estoy intentando escribir un progtwig que, como ejemplo, eliminará el precio máximo de esta página web: http://www.kayak.com/#/flights/JFK-PAR/2012-06-01/2012-07-01/1adults Primero, puedo recuperar fácilmente el HTML haciendo lo siguiente: from urllib import urlopen from BeautifulSoup import BeautifulSoup import mechanize webpage = ‘http://www.kayak.com/#/flights/JFK-PAR/2012-06-01/2012-07-01/1adults’ br = mechanize.Browser() data = br.open(webpage).get_data() soup = BeautifulSoup(data) print soup Sin embargo, el HTML en […]

CertificateError: el nombre de host no coincide

Estoy usando un proxy (detrás del firewall corporativo) para iniciar sesión en un dominio https. El apretón de manos SSL no parece ir bien: CertificateError: hostname ‘ats.finra.org:443’ doesn’t match ‘ats.finra.org’ Estoy usando Python 2.7.9 – Mecanizar y he superado todas las pantallas de inicio de sesión, contraseña y seguridad, pero se está quedando colgado de […]

El envío del formulario de Mechanze provoca un ‘Error de aserción’ en respuesta cuando se intenta .read ()

Estoy escribiendo un progtwig de rastreo web con python y no puedo iniciar sesión usando mecanizar. El formulario en el sitio se ve como: Last Name: University ID or Library Barcode: Institution: Select University —- American Catholic District of Columbia Gallaudet George Mason George Washington Georgetown Marymount Trinity        Por lo tanto, puedo configurar todo […]

¿Cómo ve los encabezados de solicitud que mecaniza está utilizando?

Estoy intentando enviar algunos datos a un formulario programáticamente. Tengo un pequeño problema por el cual al servidor no le gusta lo que le estoy enviando. Frustrantemente, no hay mensajes de error, o cualquier cosa que pueda ayudar a diagnosticar el problema, todo lo que hace es volver a la misma página en la que […]

¿Cómo arreglar la encoding en Python Mechanize?

Aquí está el código de ejemplo: from mechanize import Browser br = Browser() page = br.open(‘http://hunters.tclans.ru/news.php?readmore=2’) br.form = br.forms().next() print br.form El problema es que el servidor devuelve una encoding incorrecta (windows-cp1251). ¿Cómo puedo configurar manualmente la encoding de la página actual en mecanizar? Error: Traceback (most recent call last): File “/tmp/stackoverflow.py”, line 5, in […]

Proxy parece ser ignorado por Mechanize?

Estoy usando un proxy http y el módulo Mechanize. Inicializo el objeto de mecanizar y configuro el proxy como tal: self.br = mechanize.Browser() self.br.set_proxies({“http”: proxyAddress}) #proxy address is like 1.1.1.1:8080 Entonces abro el sitio así: response = self.br.open(“http://google.com”) Mi problema es que mecanize parece estar ignorando completamente el proxy. Si depuro e inspecciono el objeto […]

Obtención y captura de la respuesta HTTP utilizando Mechanize en Python

Estoy tratando de obtener los códigos de respuesta de Mechanize en Python. Si bien puedo obtener un código de estado 200, no se devuelve nada más (404 lanzamientos y excepción y 30x se ignora). ¿Hay alguna manera de obtener el código de estado original? Gracias