Articles of lxml

Eliminando los atributos del espacio de nombres de Python de un lxml.objectify.ObjectifiedElement

Posible duplicado: Cuando se utiliza lxml, ¿se puede representar el XML sin atributos de espacio de nombres? ¿Cómo puedo eliminar los atributos de python de un lxml.objectify.ObjectifiedElement ? Ejemplo: In [1]: from lxml import etree, objectify In [2]: foo = objectify.Element(“foo”) In [3]: foo.bar = “hi” In [4]: foo.baz = 1 In [5]: foo.fritz = […]

eliminar ciertos atributos de las tags HTML

¿Cómo puedo eliminar ciertos atributos como id, estilo, clase, etc. del código HTML? Pensé que podía usar el módulo lxml.html.clean , pero resultó que solo puedo eliminar los atributos de estilo con Clean(style=True).clean_html(code) . Prefiero no usar expresiones regulares para esta tarea (los atributos podrían cambiar). Lo que me gustaría tener: from lxml.html.clean import Cleaner […]

Instalando lxml en virtualenv para windows

Recientemente comencé a usar virtualenv y me gustaría instalar lxml en este entorno aislado. Normalmente usaría el instalador binario de Windows, pero quiero usar lxml en este virtualenv (no globalmente). La instalación de PIP no funciona para lxml, por lo que no sé qué puedo hacer. He leído que la creación de enlaces simbólicos puede […]

Cómo depurar lxml.etree.XSLTParseError: error de expresión no válida

Estoy intentando averiguar por qué lxml no puede analizar un documento XSL que consiste en un documento “raíz” con varios xml:include s. Me sale un error: Traceback (most recent call last): File “s.py”, line 10, in xslt = ET.XSLT(ET.parse(d)) File “xslt.pxi”, line 409, in lxml.etree.XSLT.__init__ (src/lxml/lxml.etree.c:151978) lxml.etree.XSLTParseError: Invalid expression Eso me dice dónde está el […]

Expresión válida XPath

Sólo dos preguntas: ¿Cómo puedo verificar si la cadena asignada a una variable corresponde a una expresión válida de XPath? ¿Cómo puedo devolver un mensaje de error personalizado en caso de que el recurso solicitado no exista?

error de importación debido a bs4 vs BeautifulSoup

Estoy tratando de usar el lxml compatible con lxml y me está dando un error: from lxml.html.soupparser import fromstring Traceback (most recent call last): File “”, line 1, in File “/Library/Python/2.7/site-packages/lxml/html/soupparser.py”, line 7, in from BeautifulSoup import \ ImportError: No module named BeautifulSoup Tengo bs4 instalado. ¿Cómo soluciono este problema?

No se puede instalar lxml en Windows, error fatal C1083: No se puede abrir el archivo de inclusión: ‘libxml / xmlversion.h’

Python noob, por favor ten paciencia conmigo. Usé el instalador de Python para v3.5.1 de www.python.org. Mi intención era usar Scrapy para ejecutar algunos scripts. pip install scrapy falló, al igual que easy_install scrapy y otros. Rastreé el error a una instalación defectuosa de lxml. Aquí está el registro de errores. Incluso he intentado easy_installing […]

Lxml html xpath context

Estoy usando lxml para analizar un archivo HTML y me gustaría saber cómo puedo configurar el context de búsqueda de xpath. Lo que quiero decir es que tengo un elemento de nodo y quiero realizar una búsqueda por xpath solo dentro de este nodo como si fuera el elemento raíz. Por ejemplo, tengo un nodo […]

lxml no agrega nuevas líneas al insertar un nuevo elemento en un xml existente

Tengo un gran conjunto de archivos xml existentes, y estoy tratando de agregar un elemento a todos ellos (son pom.xml para varios proyectos de Maven, y estoy tratando de agregar un elemento principal a todos). El siguiente es mi código exacto. El problema es que el resultado final de xml en pom2.xml tiene el elemento […]

¿Cómo crear un nodo de texto con lxml?

Estoy usando lxml y python para manipular archivos xml. Quiero crear un nodo de texto sin tags preferiblemente, en lugar de crear un nuevo Element y luego agregarle un texto. ¿Cómo puedo hacer eso? Podría encontrar un equivalente de esto en el paquete xml.dom.minidom de python llamado createTextNode , por lo que me preguntaba si […]