Articles of mecanizar

¿Mecanizar limitaciones br.submit ()?

Mi intención es enviar una consulta de búsqueda a un sitio web utilizando Mechanize y analizar los resultados utilizando BeautifulSoup. Esto se utilizará para el mismo sitio web y, por lo tanto, los nombres de los formularios, etc., pueden estar codificados. Estaba teniendo problemas con mi consulta inicial, que se muestra a continuación: importar mecanizar […]

Cómo raspar páginas aspx con python

Estoy tratando de eliminar un sitio, https://www.searchiqs.com/nybro/ (debe hacer clic en “Iniciar sesión como invitado” para acceder al formulario de búsqueda. Si busco un término de la Parte 1 como, por ejemplo, ” Andrew “los resultados tienen paginación y también, el tipo de solicitud es POST, por lo que la URL no cambia y las […]

Cambiando el enlace en Python Mecanizar.

Estoy intentando escribir un script en python que generará la lista de clasificación de mi lote. Para esto simplemente necesito cambiar el parámetro de número de rollo del enlace usando la función de elemento de inspección en el navegador web. El enlace (relativo) se ve algo así como: /academic/utility/AcademicRecord.jsp?loginCode=000&loginnumber=000&loginName=name&Home=ascwebsite Solo necesito cambiar el código de […]

Inicie sesión a través del navegador en Facebook y Google sin usar sus API, usando Python

¿Hay alguna forma de iniciar sesión a través del navegador en Facebook y Google, pero sin utilizar las API proporcionadas? Hasta ahora he intentado mechanize con cookielib , cookielib , requests y selenium , pero no obtuve ningún resultado satisfactorio. Lo más cercano que obtuve fue iniciar sesión con mechanize + cookielib pero a través […]

Python Mechanize previene la conexión: Cerrar

Estoy tratando de utilizar mecanizar para obtener información de una página web. Básicamente, tiene éxito en obtener el primer bit de información, pero la página web incluye un botón para “Siguiente” para obtener más información. No puedo averiguar cómo obtener la información adicional mediante progtwigción. Al usar los encabezados HTTP en vivo, puedo ver la […]

mecanizar abierta url python

Estoy tratando de abrir una URL usando mecanizar en python. El código se ejecuta sin errores, pero en realidad no sucede nada. ¿Qué me estoy perdiendo? Además, ¿hay una manera de configurar el navegador? Esto es Python 2.7. import mechanize url=’http://www.google.com/’ op = mechanize.Browser() # use mecahnize’s browser op.set_handle_robots(False) #tell the webpage you’re not a […]

Mecanizar Python enviar formularios no funciona

Estoy intentando escribir un simple bot que inicie sesión en mi cuenta en una página y luego comente las imágenes de otros usuarios. Sin embargo, no puedo obtener el formulario de comentarios que envía el trabajo correctamente. El formulario de comentarios se ve así: Mi código es el siguiente br.select_form(nr = 1) br.form[‘comment’] = ‘hello’ […]

Python – Mecanizar sesiones no son regonizadas

Estoy detrás de un proxy en una empresa. Y para acceder a algunos sitios internos, primero debo iniciar sesión en un sitio específico. El problema es que si me conecto a este sitio específico desde IE o FF, entonces puedo acceder a los sitios intra, no necesariamente desde el mismo navegador donde inicié sesión. Por […]

Python Mechanize: ¿cómo seleccionar una lista desplegable cuando dos tienen el mismo nombre en la página web?

El html que estoy tratando de hacer mecanizar análisis es: here go options Pero justo debajo hay otro menú desplegable, con el siguiente código: Ahora, si ayuda, no necesito seleccionar ningún valor de este último, ya que es opcional. Cuando bash br = mechanize.Browser() br.select_form(name=”form”) br[“topics[]”] = [“Internet”] Yo obtengo: mechanize._form.AmbiguityError: more than one control […]

Error “Fuera de memoria” con mecanizar

Intentaba obtener información de un sitio web página por página, básicamente esto es lo que hice: import mechanize MechBrowser = mechanize.Browser() Counter = 0 while Counter < 5000: Response = MechBrowser.open("http://example.com/page" + str(Counter)) Html = Response.read() Response.close() OutputFile = open("Output.txt", "a") OutputFile.write(Html) OutputFile.close() Counter = Counter + 1 Bueno, los códigos anteriores terminaron arrojando el […]