Articles of xpath

Expresión válida XPath

Sólo dos preguntas: ¿Cómo puedo verificar si la cadena asignada a una variable corresponde a una expresión válida de XPath? ¿Cómo puedo devolver un mensaje de error personalizado en caso de que el recurso solicitado no exista?

BeautifulSoup extrae XPATH o CSS Path del nodo

Quiero extraer algunos datos de HTML y luego poder resaltar los elementos extraídos en el lado del cliente sin modificar el código fuente de HTML. Y XPath o CSS Path se ve muy bien para esto. ¿Es posible extraer XPATH o CSS Path directamente desde BeautifulSoup? En este momento, uso la marca del elemento de […]

Lxml html xpath context

Estoy usando lxml para analizar un archivo HTML y me gustaría saber cómo puedo configurar el context de búsqueda de xpath. Lo que quiero decir es que tengo un elemento de nodo y quiero realizar una búsqueda por xpath solo dentro de este nodo como si fuera el elemento raíz. Por ejemplo, tengo un nodo […]

Obtener cierto valor de atributo usando XPath

Desde el siguiente fragmento de código HTML: Estoy tratando de obtener el valor href de la etiqueta de link con rel valor = “shortcut icon” , estoy tratando de lograr eso usando XPath. ¿Cómo hacer eso en Python?

Raspando el nuevo sitio de ESPN usando xpath

Estoy tratando de raspar el nuevo marcador de ESPN NBA. Aquí hay un script simple que debería devolver los tiempos de inicio de todos los juegos el 4/5/15: import requests import lxml.html from lxml.cssselect import CSSSelector doc = lxml.html.fromstring(requests.get(‘http://scores.espn.go.com/nba/scoreboard?date=20150405′).text) #xpath print doc.xpath(“//title/text()”) #print page title print doc.xpath(“//span/@time”) print doc.xpath(“//span[@class=’time’]”) print doc.xpath(“//span[@class=’time’]/text()”) #CCS Selector sel = […]

Mensaje: elemento no visible al hacer clic en una checkbox a través de Selenium y Python

Estoy tratando de automatizar una parte de mi proyecto en el que he estado trabajando. Esta parte del proyecto debe ingresar a una página y obtener una clave generada al azar. Para obtener la clave, vaya a la página web, inicie sesión y luego presione algunos botones para obtener la nueva clave. He estado usando […]

datos de chatarra a través de xpath de div que contiene javascript en scrapy python

Estoy trabajando en scrapy, estoy raspando un sitio y usando xpath para raspar elementos. Pero algunos de los div contienen javascript , así que cuando usé xpath hasta que el div id que contiene el código de javascript está devolviendo una lista vacía, y sin incluir ese elemento div (que contiene javascript) puede recuperar datos […]

¿Cómo raspar esta página web con Python y lxml? lista vacía devuelta

Para fines educativos, estoy intentando raspar esta página gradualmente con Python y lxml , comenzando con los nombres de las películas. Por lo que he leído hasta ahora de los documentos de Python en lxml y W3Schools en XPath, este código debería mostrar todos los títulos de películas en una lista: from lxml import html […]

Ejecutar texto () de Xpath en selenium

Estoy pasando por la práctica de selenium donde xpath se valida en Firefox xpath extesion pero no en Python Selenium . por ejemplo, vaya a aquí y aplique xpath //span[@class=’tableNode’]/text()[preceding-sibling::br and following-sibling::br] funciona en la extensión de Firefox pero no en la expresión de selenium como driver.find_elements_by_xpath(“//span[@class=’tableNode’]/text()[preceding-sibling::br and following-sibling::br]”) Excepción que estoy enfrentando Traceback (most […]

Python lxml usando iterparse para editar y generar xml

He estado jugando con la biblioteca lxml por un tiempo y tal vez no lo estoy entendiendo correctamente o me estoy perdiendo algo, pero parece que no puedo averiguar cómo editar el archivo después de detectar un determinado xpath y luego podrás escribir eso de nuevo en xml mientras analizo elemento por elemento. Digamos que […]