Articles of lxml

¿Por qué estoy recibiendo este ImportError?

Tengo una aplicación tkinter que estoy comstackndo en un .exe través de py2exe . En el archivo de configuración, lo he configurado para que incluya lxml , urllib , lxml.html , ast y math . Cuando ejecuto python setup.py py2exe en una consola CMD, se comstack bien. Luego voy a la carpeta dist ha creado, […]

Python lxml findall con múltiples espacios de nombres

Estoy tratando de analizar un documento XML con múltiples espacios de nombres con lxml, y estoy atascado en obtener el método findall () para devolver algo. Mi XML: 100_0000100004_3788_Resource-0.customId_WSx Data Precip Type 60 Valid 2016-04-20T12:40:00Z Mi código: from lxml import etree from pprint import pprint RSPxmlFile = ‘/home/user/Desktop/100_0000100004_3788_20160420144011263_records.xml’ with open (RSPxmlFile, ‘rt’) as f: tree […]

Cómo eliminar todos los atributos del elemento

Cómo eliminar todos los atributos de los elementos específicos a lo largo del documento. Estoy intentando algo como esto: from bs4 import UnicodeDammit from lxml import html content = open(“source.html”).read() document = UnicodeDammit(content, is_html=True) parser = html.HTMLParser(encoding=document.original_encoding) root = html.document_fromstring(content, parser=parser) for attr in root.xpath(‘.//table/@*’): del attr.attrib Aquí estoy intentando eliminar todos los atributos de […]

Cómo escapar correctamente de comillas simples y dobles

Tengo un objeto HTMLParser de lxml etree con el que estoy intentando construir xpaths para afirmar xpaths, los atributos de xpath y el texto de esa etiqueta. Encontré un problema cuando el texto de la etiqueta tiene comillas simples (‘) o comillas dobles (“) y he agotado todas mis opciones. Aquí hay un objeto de […]

error del selector de importación de scrapy.selector

No puedo hacer lo siguiente: from scrapy.selector import Selector El error es: Archivo “/Desktop/KSL/KSL/spiders/spider.py”, línea 1, desde scrapy.selector import Selector ImportError: no se puede importar el nombre Selector Es como si LXML no estuviera instalado en mi máquina, pero sí lo está. Además, pensé que este era un módulo predeterminado integrado en scrapy. ¿Tal vez […]

Scrapy: no se puede crear un proyecto

Tuve problemas al instalar scrapy respecto a lxml pero luego encontré algo de información sobre stackoverflow. Basándome en esa información, hice un sudo easy_install lxml con un error. Creo que el scrapy se instaló: La razón por la que llegué a ese juicio es que rechazo lo que podría hacer a continuación: Python 2.7.5 (default, […]

python setuptool ¿cómo puedo agregar dependencia para libxml2-dev y libxslt1-dev?

Mi aplicación necesita lxml> = 2.1, pero para instalar lxml es necesario instalar libxml2-dev libxslt1-dev, de lo contrario, genera un error al instalar el lxml. ¿hay alguna manera de usar la herramienta de configuración de python? Puedo dar esto como dependencia en mi setup.py …

Función de documento () LXML y XSL

Hola tengo los siguientes archivos: merge.py: from lxml import etree xml_input = etree.XML(open(‘a.xml’, ‘r’).read()) xslt_root = etree.XML(open(‘merge.xsl’, ‘r’).read()) transform = etree.XSLT(xslt_root) print str(transform(xml_input)) merge.xsl: a.xml: b.xml: Los 4 archivos están en el mismo directorio, cuando llamo a merge.py, recibí el error: lxml.etree.XSLTApplyError: Cannot resolve URI string://__STRING__XSLT__/b.xml Alguna idea ? en lo que hago mal?

¿Cómo obtener XML en bruto de nuevo desde lxml?

Estoy usando el siguiente código para localizar un div: parser = etree.HTMLParser() tree = etree.parse(StringIO(page), parser) div = tree.xpath(“//div[@class=’content’]”)[0] Mi único problema es que, después de hacer esto, no quiero confiar en lxml para extraer el contenido de dicho div: solo quiero recuperar el XML sin formato que contiene el div. ¿Es esto factible o […]

PYTHON: Cómo agregar un nodo raíz a un XML

Tengo un archivo xml se ve algo como esto …. Quiero agregar la raíz en la parte superior del elemento ‘A’. Encontré una manera de agregar elementos a la raíz. Pero ¿Cómo cambiar la raíz existente y agregar sobre ella usando python? Después de agregar la raíz al xml debería verse así ….