Articles of xpath

atributo de valor para lxml.html

Aquí está mi código: from lxml.html import fromstring #code print fromstring(s).xpath(‘/html/body/div[3]/div/div[2]/div/form/input[4]’) La salida es [] ¿Cómo puedo dar salida al valor? ¿Algún atributo para esto? Gracias.

Necesito xpath genérico para el siguiente código html

A continuación se muestra el código HTML para el que necesito un XPath único. Type White List Black List Necesito algo como [@label = ‘Lista blanca’] para no tener que escribir múltiples xpaths en mi código. Quiero pasar valores como Lista blanca y Lista negra desde una función.

No hacer clic en todas las tabs y no hacer bucles una vez

Estoy tratando de hacer clic en las tabs de la página web como se ve a continuación. Desafortunadamente, solo parece hacer clic en algunas de las tabs a pesar de la xpath correcta y correcta en la inspección de Chrome. Solo puedo asumir que no está haciendo clic en todas las tabs porque no se […]

encontrar xth td con td contiene en el mismo tr xpath python

Mi página tiene una tabla con 11 columnas, dado el valor de texto para la columna 2, quiero hacer clic en la columna 11 (botón de flecha) para la misma fila. Mi DOM se ve así: ` … … … grp1 … … 200 … … … … … <ul class=”dropwd” <input class=”a-act a-menu-button” type=”button” […]

Cómo hacer clic en un botón javascript con Selenium

¿Cómo hago clic en el botón de tamaño y agrego al carrito con el controlador web de Selenium y python? Esto es para el sitio web a continuación http://store.nike.com/us/en_us/pd/dri-fit-cool-tailwind-stripe-running-shirt/pid-10739300/pgid-11072108 Por favor, avíseme si hay algo que deba pegar aquí relacionado con el botón de tamaño.

scrapy no puede rastrear todos los enlaces en una página

Estoy tratando de rastrear un sitio web ajax http://play.google.com/store/apps/category/GAME/collection/topselling_new_free Quiero obtener todos los enlaces dirigidos a cada juego. Inspecciono el elemento de la página. Y se ve así: cómo se ve la página, así que quiero extraer todos los enlaces con el patrón / tienda / aplicaciones / detalles? Id = pero cuando ejecuté los […]

¿Cómo configurar la consulta XPath para el análisis de HTML?

Aquí hay un código HTML de http://chem.sis.nlm.nih.gov/chemidplus/rn/75-07-0 en Google Chrome que deseo analizar el sitio web para algún proyecto. Names and Synonyms ↔ Name of Substance “ Acetaldehyde Escribí una secuencia de comandos de Python para ayudarme a hacer tal cosa agarrando el nombre debajo de una de las secciones, pero simplemente no devuelve el […]

Cómo encontrar hijos directos de elemento en lxml

Encontré un objeto con clase específica: THREAD = TREE.find_class(‘thread’)[0] Ahora quiero obtener todos los elementos que son sus hijos directos. Estoy cansado: THREAD.findall(“p”) THREAD.xpath(“//div[@class=’thread’]/p”) Pero todos esos elementos devuelven todos los elementos dentro de este , no importa si ese es su padre más cercano o no. ¿Cómo puedo hacer que funcione? Editar: Muestra html: […]

Raspando desde javascript usando Scrapy

Necesito raspar el contenido con la etiqueta javascript usando scrapy de la siguiente manera: attribute={“pid”:”123″,”title”:”abc”,”url”:”http://example.com”,”date”:”2014-07-31 14:56:39 CDT”,”channels”:[“test”],”tags”:[],”authors”:[“james Catcher”]}; Puedo extraer el contenido usando xpath response.xpath(‘id(“script-id”)//text()’).extract() Salida [u’\nattribute = {“pid”:”123″,”title”:”abc”,”url”:”http:/example.com”,”date”:”2014-07-30 15:34:10 “,”channels”:[“test”],”tags”:[],”authors”:[“james Watt”]};\n(function( ){\n var s = document.createElement(\’script\’);\n s.async = true;\n s.type = \’text/javascript\’;\n s.src = document.location.protocol + \’//d8rk54i4mohrb. cloudfront.net/js/reach.js\’;\n (document.getElementsByTagName(\’head\’)[0] || document.getElementsByTagName(\’body\’)[0]).appendChild(s);\n})();\n”] ¿Cómo puedo obtener […]

Cómo raspar los elementos cargados a través de un botón “ver más” con Scrapy

Aquí está la inspección del botón Ver más en un sitio web. Puedo rastrear a través de los datos que se muestran en el sitio web, pero quiero de alguna manera que pueda rastrear a través de los elementos que están ocultos detrás del botón Ver más. ¿Cómo puedo hacer eso? View More Products.. Mi […]