Articles of phantomjs

Descargar el archivo a través de un hipervínculo en PhantomJS usando Selenium

Estoy utilizando selenium para hacer una función de clic en un hipervínculo, que se carga en una página determinada. El script funciona para google chrome, pero no para phantomjs. ¿Por qué esto no funciona? from selenium import webdriver driver = webdriver.Chrome() #driver = webdriver.PhantomJS(executable_path = “/Users/jameslemieux/PythonProjects/phantomjs-1.9.8-macosx/bin/phantomjs”) driver.get(“http://www.youtube-mp3.org/?e=t_exp&r=true#v=hC-T0rC6m7I”) elem = driver.find_element_by_link_text(‘Download’) elem.click() driver.save_screenshot(‘/Users/jameslemieux/Desktop/Misc./test_image.png’) driver.quit() Esto funciona […]

Selenium / PhantomJS plantea error

Estoy intentando ejecutar el controlador PhantomJS en Python, pero obtengo un error. He leído que debo pasar todo el camino como un argumento, pero no sirvió de nada. Aquí está el código: from selenium import webdriver # driver = webdriver.Chrome(‘D:\Python_projects\chromedriver_win32/chromedriver.exe’) # this works driver = webdriver.PhantomJS(executable_path=’D:\Python\phantomjs-2.0.0-windows\bin\phantomjs.exe’) ERROR: Traceback (most recent call last): File “path to […]

Usando selenium en el fondo

Estoy utilizando Selenium y Chrome Webdriver pero cuando ejecuto scripts se abre una ventana. ¿Hay alguna forma de que pueda acceder a Internet sin que se abra la ventana? from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome() driver.get(“https://ps.rsd.edu/public/”) elem = driver.find_element_by_name(“account”) elem.send_keys(“Username”) elem2 = driver.find_element_by_name(“pw”) elem2.send_keys(“Password”) elem.send_keys(Keys.RETURN) driver.quit() Por ejemplo, esto va […]

Un sitio específico está devolviendo una respuesta diferente en Python y en Chrome

Estoy tratando de acceder a un sitio específico usando python, y no importa qué lib que use, parece que no puedo acceder a él. He probado Selenium + PhantomJS, he probado las solicitudes y urllib. Cada vez que trato de acceder al sitio desde el navegador obtengo un archivo json, y cada vez que bash […]

Probé Python BeautifulSoup y Phantom JS: TODAVÍA no puede raspar sitios web

Es posible que haya visto mis frustraciones desesperadas en las últimas semanas aquí. He estado raspando algunos datos de tiempo de espera y todavía no puedo obtener datos de estos dos sitios http://www.centura.org/erwait http://hcavirginia.com/home/ Al principio probé BS4 para Python. Código de ejemplo a continuación para HCA Virgina from BeautifulSoup import BeautifulSoup import requests url […]

Python Selenium con Phantomjs – Click Failed: ReferenceError: No se puede encontrar la variable

Estoy escribiendo una secuencia de comandos de python utilizando Selenium webdriver para obtener algunos datos de un sitio web, y estoy tratando de hacer clic en el siguiente botón de esta página web. Donde se define el botón: Next Wih el siguiente código en python URL=’http://www.nordpoolspot.com/Market-data1/Elspot/Area-Prices/ALL1/Hourly/’ nextId=”ctl00_FullRegion_npsGridView_lnkNext” browser=webdriver.PhantomJS(‘./phantomjs’) browser.get(URL) nextBtn=browser.find_element_by_id(nextId) time.sleep(5) nextBtn.click() Esto funciona bien […]

PhantomJS con error de Selenium: Mensaje: el ejecutable ‘phantomjs’ debe estar en PATH

Estoy intentando ejecutar este script: https://github.com/Chillee/coursera-dl-all Sin embargo, la secuencia de comandos falla en la session = webdriver.PhantomJS() línea session = webdriver.PhantomJS() con el siguiente error Traceback (most recent call last): File “dl_all.py”, line 236, in session = webdriver.PhantomJS() File “/home//.local/lib/python2.7/site-packages/selenium/webdriver/phantomjs/webdriver.py”, line 51, in __init__ self.service.start() File “/home//.local/lib/python2.7/site-packages/selenium/webdriver/common/service.py”, line 69, in start os.path.basename(self.path), self.start_error_message) selenium.common.exceptions.WebDriverException: […]

Python + Selenium + PhantomJS render en PDF

¿Es posible usar PhantomJS’s representación PhantomJS’s a las capacidades de PDF cuando PhantomJS se usa en combinación con Selenium y Python? (es decir, imite el page.render(‘file.pdf’) dentro de Python a través de Selenium). Me doy cuenta de que esto utiliza GhostDriver , y GhostDriver realmente no admite mucho en la forma de imprimir. Si otra […]

Evitar la descarga de CSS / otros recursos en PhantomJS / Selenium controlado por Python

Estoy intentando acelerar el webscraper de Selenium / PhantomJS en Python impidiendo la descarga de CSS / otros recursos. Todo lo que necesito para descargar es img src y las tags alt. He encontrado este código: page.onResourceRequested = function(requestData, request) { if ((/http:\/\/.+?\.css/gi).test(requestData[‘url’]) || requestData[‘Content-Type’] == ‘text/css’) { console.log(‘The url of the request is matching. […]

Uso de Selenium con Python y PhantomJS para descargar archivos al sistema de archivos

He estado lidiando con el uso de PhantomJS / Selenium / python-selenium para descargar un archivo al sistema de archivos. Soy capaz de navegar fácilmente a través del DOM y hacer clic, desplazarme, etc. Sin embargo, la descarga de un archivo está demostrando ser bastante problemática. He intentado un enfoque sin cabeza con Firefox y […]