Articles of selenium

Descargar el archivo a través de un hipervínculo en PhantomJS usando Selenium

Estoy utilizando selenium para hacer una función de clic en un hipervínculo, que se carga en una página determinada. El script funciona para google chrome, pero no para phantomjs. ¿Por qué esto no funciona? from selenium import webdriver driver = webdriver.Chrome() #driver = webdriver.PhantomJS(executable_path = “/Users/jameslemieux/PythonProjects/phantomjs-1.9.8-macosx/bin/phantomjs”) driver.get(“http://www.youtube-mp3.org/?e=t_exp&r=true#v=hC-T0rC6m7I”) elem = driver.find_element_by_link_text(‘Download’) elem.click() driver.save_screenshot(‘/Users/jameslemieux/Desktop/Misc./test_image.png’) driver.quit() Esto funciona […]

¿Cómo configurar una cookie para un dominio específico en Selenium webdriver con python?

Hola compañeros usuarios de StackOverflow. Lo que estoy tratando de lograr es evitar que aparezcan molestos cuadros de ayuda cuando mis pruebas abren la página principal. Hasta ahora, este es el método que estoy usando para abrir la página principal: def open_url(self, url): “””Open a URL using the driver’s base URL””” self.webdriver.add_cookie({‘name’ : ‘tour.index’, ‘value’ […]

Python – Selenium en Ubuntu OSError: No es un directorio

Después de instalar Selenium en Ubuntu y agregar geckodriver a la ruta, aparece este error cuando ejecuto from selenium import webdriver driver = webdriver.Firefox() error: Traceback (most recent call last): File “”, line 1, in File “/usr/local/lib/python2.7/dist-packages/selenium/webdriver/firefox/webdriver.py”, line 135, in __init__ self.service.start() File “/usr/local/lib/python2.7/dist-packages/selenium/webdriver/common/service.py”, line 64, in start stdout=self.log_file, stderr=self.log_file) File “/usr/lib/python2.7/subprocess.py”, line 710, in […]

Uso de python con selenium para raspar páginas web dinámicas

En el sitio, hay un par de enlaces en la parte superior etiquetados como 1 , 2 , 3 y los siguientes . Si se presiona un enlace etiquetado por un número, se carga dinámicamente en algunos datos en un div contenido. Si se presiona next , va a una página con las tags 4 […]

Deshabilite el estilo en la búsqueda de Google con Selenium FirefoxDriver

El siguiente código deshabilita las hojas de estilo e imágenes en una página cargada con el controlador web de Selenium Firefox: from selenium import webdriver firefox_profile = webdriver.FirefoxProfile() firefox_profile.set_preference(‘permissions.default.stylesheet’, 2) firefox_profile.set_preference(‘permissions.default.image’, 2) driver = webdriver.Firefox(firefox_profile) driver.get(‘http://www.stackoverflow.com/’) driver.close() Funciona bien con stackoverflow.com , facebook.com , yahoo.com … pero curiosamente no con la Búsqueda de Google; solo […]

Python Selenium: Encuentra atributos de objetos usando xpath

Soy nuevo en xpath, tratando de obtener el valor del “valor” utilizando xpath: mientras que es fácil encontrar el elemento por “type=”submit” como: browser.find_elements_by_xpath(“//*[@type=’submit’]”) No he podido averiguar cómo obtener los valores que necesito, como: browser.find_elements_by_xpath(“//*[@type=’submit’]/@value”) de alguna manera da un error: expression “//*[@type=\’submit\’]/@value” is: [object Attr]. It should be an element ¿Alguna idea de […]

Acelerando hermoso

Estoy ejecutando un raspador de este sitio web del curso y me pregunto si hay una manera más rápida de raspar la página una vez que la coloqué en beautifulsoup. Lleva más tiempo del que hubiera esperado. ¿Consejos? from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.ui import Select from selenium.webdriver.support import expected_conditions as […]

Raspado con Scrapy y Selenio

Tengo una araña de chatarra que rastrea un sitio que recarga contenido a través de javascript en la página. Para pasar a la siguiente página para raspar, he estado usando Selenium para hacer clic en el enlace del mes en la parte superior del sitio. El problema es que, aunque mi código se mueve a […]

Selenium / PhantomJS plantea error

Estoy intentando ejecutar el controlador PhantomJS en Python, pero obtengo un error. He leído que debo pasar todo el camino como un argumento, pero no sirvió de nada. Aquí está el código: from selenium import webdriver # driver = webdriver.Chrome(‘D:\Python_projects\chromedriver_win32/chromedriver.exe’) # this works driver = webdriver.PhantomJS(executable_path=’D:\Python\phantomjs-2.0.0-windows\bin\phantomjs.exe’) ERROR: Traceback (most recent call last): File “path to […]

Usando selenium en el fondo

Estoy utilizando Selenium y Chrome Webdriver pero cuando ejecuto scripts se abre una ventana. ¿Hay alguna forma de que pueda acceder a Internet sin que se abra la ventana? from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome() driver.get(“https://ps.rsd.edu/public/”) elem = driver.find_element_by_name(“account”) elem.send_keys(“Username”) elem2 = driver.find_element_by_name(“pw”) elem2.send_keys(“Password”) elem.send_keys(Keys.RETURN) driver.quit() Por ejemplo, esto va […]