Articles of xpath

Python Selenium Webdriver para comprobar si el elemento NO existe lleva tiempo

Al intentar verificar después de algunas operaciones de GUI, no existe un botón (se espera que no esté presente). Estoy usando find_element_by_xpath () pero es muy lento. ¿Alguna solución de timeout?

Raspado de texto sin código javascript utilizando scrapy

Actualmente estoy configurando un montón de arañas usando scrapy. Estas arañas deben extraer solo texto (artículos, publicaciones en foros, párrafos, etc.) de los sitios de destino. El problema es: a veces, mi nodo de destino contiene una etiqueta y, por lo tanto, el texto raspado contiene código javascript. Aquí hay un enlace a un ejemplo […]

XPath: encuentra el elemento HTML por texto * plano *

Tenga en cuenta: Puede encontrar una versión más refinada de esta pregunta, con una respuesta adecuada aquí . Me gustaría usar los enlaces de Selenium Python para encontrar elementos con un texto determinado en una página web. Por ejemplo, supongamos que tengo el siguiente HTML: … This can be found This can not be found […]

¿Cómo puedo traducir esta expresión XPath a BeautifulSoup?

En respuesta a una pregunta anterior , varias personas sugirieron que usara BeautifulSoup para mi proyecto. He estado luchando con su documentación y simplemente no puedo analizarla. ¿Alguien me puede indicar la sección donde debería poder traducir esta expresión a una expresión de BeautifulSoup? hxs.select(‘//td[@class=”altRow”][2]/a/@href’).re(‘/.a\w+’) La expresión anterior es de Scrapy . Estoy tratando de […]

Cómo seleccionar un elemento con xenium de Selenium Python

Considere el siguiente HTML: abc Quiero hacer clic en abc, pero el div contenedor puede cambiar, por lo que driver.get_element_by_xpath(“//div[@id=’a’]/div/a[@class=’click’]”) no es lo que quiero Lo intenté: driver.get_element_by_xpath(“//div[@id=’a’]”).get_element_by_xpath(.//a[@class=’click’]”) Pero esto no funcionaría con anidación más profunda. ¿algunas ideas?

selenium cómo obtener el contenido de href dentro de alguna clase específica

Estoy tratando de recuperar los datos de la página web que tiene el html a continuación helloworld Mi objective es analizar “# / word / 1 /” Lo que hice es target = self.driver.find_element_by_class_name(‘someclass’) print target print target.text print target.get_attribute(“css=a@href”) print target.tag_name pero las salidas son helloworld None div Lo intenté de muchas maneras, parece […]

¿Cómo hago clic en un botón en un formulario utilizando Selenium y Python 2.7?

Estoy tratando de crear un progtwig Python que revise periódicamente un sitio web para una actualización específica. El sitio está protegido y se requieren múltiples clics para llegar a la página que quiero monitorear. Desafortunadamente, estoy atascado tratando de averiguar cómo hacer clic en un botón específico. Aquí está el código del botón: He intentado […]

¿Qué biblioteca de Python pura debo usar para raspar un sitio web?

Actualmente tengo un código Ruby usado para raspar algunos sitios web. Estaba usando Ruby porque en ese momento estaba usando Ruby on Rails para un sitio, y tenía sentido. Ahora estoy tratando de trasladar esto a Google App Engine, y seguir atascado. He portado Python Mechanize para trabajar con Google App Engine, pero no es […]

Cómo extraer el atributo xml usando Python ElementTree

Por: text ¿Cómo obtengo el “valor”? xml.findtext(“./bar[@key]”) Lanza un error.

¿Cómo hago coincidir el contenido de un elemento en XPath (lxml)?

Quiero analizar HTML con lxml usando expresiones XPath. Mi problema es coincidir con el contenido de una etiqueta: Por ejemplo, dada la Example elemento que puede coincidir con el atributo href usando .//a[@href=’http://something’] pero dada la expresion .//a[.=’Example’] o incluso .//a[contains(.,’Example’)] lxml lanza la excepción ‘predicado de nodo inválido’. ¿Qué estoy haciendo mal? EDITAR: Código […]