Sólo dos preguntas: ¿Cómo puedo verificar si la cadena asignada a una variable corresponde a una expresión válida de XPath? ¿Cómo puedo devolver un mensaje de error personalizado en caso de que el recurso solicitado no exista?
Quiero extraer algunos datos de HTML y luego poder resaltar los elementos extraídos en el lado del cliente sin modificar el código fuente de HTML. Y XPath o CSS Path se ve muy bien para esto. ¿Es posible extraer XPATH o CSS Path directamente desde BeautifulSoup? En este momento, uso la marca del elemento de […]
Estoy usando lxml para analizar un archivo HTML y me gustaría saber cómo puedo configurar el context de búsqueda de xpath. Lo que quiero decir es que tengo un elemento de nodo y quiero realizar una búsqueda por xpath solo dentro de este nodo como si fuera el elemento raíz. Por ejemplo, tengo un nodo […]
Desde el siguiente fragmento de código HTML: Estoy tratando de obtener el valor href de la etiqueta de link con rel valor = “shortcut icon” , estoy tratando de lograr eso usando XPath. ¿Cómo hacer eso en Python?
Estoy tratando de raspar el nuevo marcador de ESPN NBA. Aquí hay un script simple que debería devolver los tiempos de inicio de todos los juegos el 4/5/15: import requests import lxml.html from lxml.cssselect import CSSSelector doc = lxml.html.fromstring(requests.get(‘http://scores.espn.go.com/nba/scoreboard?date=20150405′).text) #xpath print doc.xpath(“//title/text()”) #print page title print doc.xpath(“//span/@time”) print doc.xpath(“//span[@class=’time’]”) print doc.xpath(“//span[@class=’time’]/text()”) #CCS Selector sel = […]
Estoy tratando de automatizar una parte de mi proyecto en el que he estado trabajando. Esta parte del proyecto debe ingresar a una página y obtener una clave generada al azar. Para obtener la clave, vaya a la página web, inicie sesión y luego presione algunos botones para obtener la nueva clave. He estado usando […]
Estoy trabajando en scrapy, estoy raspando un sitio y usando xpath para raspar elementos. Pero algunos de los div contienen javascript , así que cuando usé xpath hasta que el div id que contiene el código de javascript está devolviendo una lista vacía, y sin incluir ese elemento div (que contiene javascript) puede recuperar datos […]
Para fines educativos, estoy intentando raspar esta página gradualmente con Python y lxml , comenzando con los nombres de las películas. Por lo que he leído hasta ahora de los documentos de Python en lxml y W3Schools en XPath, este código debería mostrar todos los títulos de películas en una lista: from lxml import html […]
Estoy pasando por la práctica de selenium donde xpath se valida en Firefox xpath extesion pero no en Python Selenium . por ejemplo, vaya a aquí y aplique xpath //span[@class=’tableNode’]/text()[preceding-sibling::br and following-sibling::br] funciona en la extensión de Firefox pero no en la expresión de selenium como driver.find_elements_by_xpath(“//span[@class=’tableNode’]/text()[preceding-sibling::br and following-sibling::br]”) Excepción que estoy enfrentando Traceback (most […]
He estado jugando con la biblioteca lxml por un tiempo y tal vez no lo estoy entendiendo correctamente o me estoy perdiendo algo, pero parece que no puedo averiguar cómo editar el archivo después de detectar un determinado xpath y luego podrás escribir eso de nuevo en xml mientras analizo elemento por elemento. Digamos que […]