Articles of mecanizar

Emulador de navegador Python con soporte JS

Quiero tomar algunos datos de un sitio. Normalmente utilizo mechanize para tales cosas, pero ahora el sitio proporciona los datos con JS. Por desgracia, mechanize no lo soporta. ¿Qué puedo usar en su lugar?

Instalación de mecanizar para python 3.4

Estoy intentando recuperar el módulo de mecanizado para Python 3.4. ¿Alguien puede guiarme en la dirección correcta y quizás guiarme a través de los pasos que debería seguir para realizar la instalación correcta? Actualmente estoy usando Windows 10.

Python Mechanize selecciona un formulario sin nombre

Estoy intentando que mecanize seleccione un formulario de una página, pero el formulario en cuestión no tiene ningún atributo de “nombre” en el html. ¿Qué tengo que hacer? cuando trato de usar br.select_form(name = “”) Recibo errores de que ninguna forma se declara con ese nombre, y la función requiere una entrada de nombre. Solo […]

Rastreo de pantalla: evadir “HTTP Error 403: solicitud rechazada por robots.txt”

¿Hay alguna manera de sortear lo siguiente? httperror_seek_wrapper: HTTP Error 403: request disallowed by robots.txt Es la única forma de evitar esto al contactar al propietario del sitio (barnesandnoble.com). Estoy creando un sitio que les ofrecerá más ventas, no estoy seguro de por qué negarían el acceso a cierta profundidad. Estoy usando mecanizar y BeautifulSoup […]

Envío de formularios con mecanizar (Python)

Bueno, estoy intentando iniciar sesión en un sitio usando Python y mecanizar. Tengo el sitio abierto: site = br.open(“http://example.com/login.php”) Y tengo una lista de los formularios (con br.forms). <GET http://example.com/search.php application/x-www-form-urlencoded … <POST http://example.com/login.php application/x-www-form-urlencoded <SubmitControl(=Log in) (readonly)>> He estado tratando de enviar los campos de nombre de usuario y contraseña. Intenté hacerlo así: br.select_form(nr=0) […]

¿Es posible conectar un analizador de HTML más robusto a Python mecanize?

Estoy tratando de analizar y enviar un formulario en un sitio web usando mecanizar, pero parece que el analizador de formularios incorporado no puede detectar el formulario y sus elementos. Sospecho que se está asfixiando con HTML mal formado, y me gustaría intentar realizar un análisis previo con un analizador mejor diseñado para manejar HTML […]

mecanizar (python) haga clic en un enlace de tipo javascript

¿Es posible que Mecanize siga un enlace de anclaje de tipo javascript? Estoy intentando iniciar sesión en un sitio web en python usando mecanize y beautifulsoup. este es el enlace de anclaje y esto es lo que he intentado links = SoupStrainer(‘a’, id=”StaticModuleID15_ctl00_SkinLogin1_Login1_Login1_LoginButton”) [anchor for anchor in BeautifulSoup(data, parseOnlyThese=links)] link = mechanize.Link( base_url = self.url, […]

Python mecaniza javascript

Estoy tratando de usar mecanizar para obtener los precios del metro-norte de Nueva York desde este sitio: http://as0.mta.info/mnr/fares/choosestation.cfm El problema es que cuando selecciona la primera opción, el sitio utiliza javascript para completar su lista de posibles destinos. He escrito un código equivalente en python, pero parece que no consigo que todo funcione. Esto es […]

Progtwigdor Python Browser con JavaScript

Quiero realizar una captura de pantalla de un sitio web que utiliza JavaScript. No es mecanizar , el navegador web programático para Python. Sin embargo, (comprensiblemente) no interpreta javascript. ¿Hay algún navegador programático para Python que lo haga? Si no, ¿hay alguna implementación de JavaScript en Python que pueda usar para intentar crear una?

Compatibilidad con el proxy mecanizado de Python

Tengo una pregunta sobre el soporte proxy de Python Mechanize. Estoy creando una secuencia de comandos de cliente web y me gustaría insertar una función de soporte de proxy en mi secuencia de comandos. Por ejemplo, si tengo: params = urllib.urlencode({‘id’:id, ‘passwd’:pw}) rq = mechanize.Request(‘http://www.example.com’, params) rs = mechanize.urlopen(rq) ¿Cómo puedo agregar soporte proxy en […]