Estoy intentando capturar el número de visitas en esta página, pero python devuelve la etiqueta sin texto.
Esto es lo que he hecho.
import requests from bs4 import BeautifulSoup r = requests.get("http://www.kijiji.ca/v-2-bedroom-apartments-condos/city-of-halifax/clayton-park-west-condo-style-luxury-2-bed-den/1016364514") soup = BeautifulSoup(r.content) print soup.find_all("span",{"class":"ad-visits"})
Los valores que está intentando raspar están rellenados por javascript, por lo que en este caso no funcionarán las requests
o los requests
se beautfulsoup
.
Tendrá que usar algo como el selenium
para obtener la salida.
from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get("http://www.kijiji.ca/v-2-bedroom-apartments-condos/city-of-halifax/clayton-park-west-condo-style-luxury-2-bed-den/1016364514") soup = BeautifulSoup(driver.page_source , 'html.parser') print soup.find_all("span",{"class":"ad-visits"})
Selenium
devolverá la fuente de la página como se representa y luego puede usar beautifulsoup
para obtener el valor
[385]