Articles of xpath

Python Selenium: Encuentra atributos de objetos usando xpath

Soy nuevo en xpath, tratando de obtener el valor del “valor” utilizando xpath: mientras que es fácil encontrar el elemento por “type=”submit” como: browser.find_elements_by_xpath(“//*[@type=’submit’]”) No he podido averiguar cómo obtener los valores que necesito, como: browser.find_elements_by_xpath(“//*[@type=’submit’]/@value”) de alguna manera da un error: expression “//*[@type=\’submit\’]/@value” is: [object Attr]. It should be an element ¿Alguna idea de […]

¿Cómo encontrar elementos XML a través de XPath en Python de una manera independiente del espacio de nombres?

ya que tuve este problema molesto por segunda vez, pensé que preguntar ayudaría. A veces tengo que obtener elementos de documentos XML, pero las formas de hacerlo son incómodas. Me gustaría conocer una biblioteca de Python que haga lo que quiero, una forma elegante de formular mis XPaths, una forma de registrar los espacios de […]

scrapy xpath selector repite datos

Estoy intentando extraer el nombre y la dirección del negocio de cada listado y exportarlo a un -csv, pero estoy teniendo problemas con el csv de salida. Creo que bizs = hxs.select (“// div [@ class = ‘listing_content’]”) puede estar causando los problemas. yp_spider.py from scrapy.spider import BaseSpider from scrapy.selector import HtmlXPathSelector from yp.items import […]

Cómo tratar con comillas simples en xpath

Tengo una línea en la que verifico si existe un determinado elemento de texto parcial en la página. self.b.find_element_by_xpath(“.//*[contains(text(), ‘%s’)]” % item_text) Por lo tanto, es posible que item_text tenga una comilla simple en la cadena. Por ejemplo, “Hanes Men’s Graphic ” . Se convierte en self.b.find_element_by_xpath(“.//*[contains(text(), ‘Hanes Men’s Graphic ‘)]”) En ese caso me […]

Python xpath no funciona?

Bien, esto está empezando a volverme un poco loco. He probado varias bibliotecas xml / xpath para Python, y no puedo encontrar una manera simple de obtener un elemento “título” que apeste. El último bash se ve así (usando Amara): def view(req, url): req.content_type = ‘text/plain’ doc = amara.parse(urlopen(url)) for node in doc.xml_xpath(‘//title’): req.write(str(node)+’\n’) Pero […]

Página web de Cant Scrape con Python Requests Library

Estoy tratando de obtener información de una página web (enlace a continuación) usando las solicitudes en python; sin embargo, los datos HTML que veo en mi navegador no parecen existir cuando me conecto a través de la biblioteca de solicitudes de python. Ninguna de las consultas de xpath devuelve ninguna información. Soy capaz de usar […]

Sitios web dynamics de Scrapy de Python

Estoy intentando raspar una página web muy simple con la ayuda de Scrapy y sus selectores xpath, pero por alguna razón los selectores que tengo no funcionan en Scrapy pero sí funcionan en otras utilidades de xpath Estoy tratando de analizar este fragmento de código HTML: Chapter 1: Friend Chapter 2: Karaoke Chapter 3: The […]

Python: Selenium xpath para encontrar elementos con caracteres que no distinguen entre mayúsculas y minúsculas?

Soy capaz de hacer esto search = “View List” driver.find_elements_by_xpath(“//*/text()[normalize-space(.)=’%s’]/parent::*” % search) pero lo necesito para ignorar y hacer coincidir todos los elementos con texto como: “VieW LiSt” o “view LIST” search = “View List” driver.find_elements_by_xpath(“//*/lower-case(text())[normalize-space(.)=’%s’]/parent::*” % search.lower()) Lo de arriba no parece funcionar. lower-case() está en XPATH 1.0

¿Por qué no funciona xpath al procesar un documento XHTML con lxml (en python)?

Estoy probando contra el siguiente documento de prueba: hi there Si analizo el documento usando lxml.html, puedo obtener el IMG con un xpath muy bien: >>> root = lxml.html.fromstring(doc) >>> root.xpath(“//img”) [] Sin embargo, si analizo el documento como XML e bash obtener la etiqueta IMG, obtengo un resultado vacío: >>> tree = etree.parse(StringIO(doc)) >>> […]

Cómo extraer el texto de los resultados de búsqueda de duckduckgo usando Selenium Python

Estoy tratando de obtener las descripciones de enlaces de pato de pato de los resultados de búsqueda utilizando lo siguiente: results=browser.find_elements_by_xpath(“//div[@id=’links’]/div/div/div[2]”) description=[] for result in results: description.append(result.text) Recibo el error ‘lista’ objeto no tiene atributo ‘texto’. Pude usar un método similar para obtener los títulos de los resultados de búsqueda, pero por alguna razón no […]