Articles of lxml

Velocidad del algoritmo de análisis XML de Python

Actualmente estoy analizando un gran archivo XML de la siguiente forma en una aplicación web de Python-Flask en Heroku: li 1 content li 2 content li 1 content li 2 content li 1 content li 2 content li 1 content li 2 content El código que utilizo para analizarlo, analizarlo y mostrarlo a través de […]

lxml cssselect Parsing

Tengo un documento con los siguientes datos: 1. A domesticated carnivorous mammal (Canis familiaris) related to the foxes and wolves and raised in a wide variety of breeds. Y quiero obtener todo dentro de la clase ds-list (sin las tags y ). Actualmente mi código es doc.cssselect(‘div.ds-list’) , pero todo esto se recupera en la […]

Problemas de espacio de nombres XHTML con cssselect en lxml

Tengo problemas al usar cssselect con un XHTML (o XML con espacio de nombres). Aunque la documentación dice cómo usar el espacio de nombres en csselect, no lo entiendo: cssselect namespaces Mi cadena de entrada XHTML: Teststylesheet /**/ Mi guión de Python: parser = etree.XMLParser() tree = etree.fromstring(xhtmlstring, parser).getroottree() for style in CSSSelector(“style”)(tree): print “HAVE […]

PYTHON 2.6 XML.ETREE para generar comillas simples para atributos en lugar de comillas dobles

Tengo el siguiente código: #!/usr/bin/python2.6 from lxml import etree n = etree.Element(‘test’) n.set(‘id’,’1234′) print etree.tostring(n) la salida generada es pero quiero alguien puede ayudar?

Obtén todos los enlaces de HTML usando lxml

Quiero descubrir todas las URL y su nombre en una página html usando lxml. Puedo analizar la url y puedo averiguar esto, pero ¿hay alguna manera fácil de encontrar todos los enlaces de url usando lxml?

lxml usa el espacio de nombres en lugar de ns0, ns1,

Acabo de comenzar con los conceptos básicos de lxml y estoy atascado con los espacios de nombres: necesito generar un xml como este: <CityModel xmlns:bldg="http://www.opengis.net/citygml/building/2.0" 1000 Usando el siguiente código: from lxml import etree cityModel = etree.Element(“cityModel”) cityObject = etree.SubElement(cityModel, “cityObjectMember”) bldg = etree.SubElement(cityObject, “{http://schemas.opengis.net/citygml/building/2.0/building.xsd}bldg”) function = etree.SubElement(bldg, “{bldg:}function”) function.text = “1000” print etree.tostring(cityModel, pretty_print=True) […]

Cómo manejar la adición de elementos y sus padres usando xpath.

Ok, tengo un caso en el que necesito agregar una etiqueta a otra etiqueta dada una xpath. Ejemplo xml: > Quiero agregar una etiqueta a ambos activos. Sin embargo, al segundo recurso le falta la etiqueta , que quiero agregar. Cada etiqueta de activo se almacena en una variable (por ejemplo, node1, node2). Tengo la […]

No se puede pasar un objeto lxml etree a un proceso separado

Estoy trabajando en un proyecto para analizar varios archivos xml simultáneamente en Python usando lxml. Cuando inicializo el proceso, quiero que mi clase principal realice un trabajo en el XML antes de que pase el objeto etree al proceso, pero encuentro que cuando el objeto etree llega al nuevo proceso, la clase sobrevive pero el […]

Python: agregar atributos de esquema xml con lxml

He escrito un script que imprime todos los archivos .xml en el directorio actual en formato xml, pero no puedo averiguar cómo agregar los atributos xmlns a la etiqueta de nivel superior. La salida que quiero obtener es: Sin embargo, aquí está la salida que estoy recibiendo: Aquí está mi guión: import lxml.etree import lxml.builder […]

Usando pyKML para analizar documentos KML

Estoy usando el módulo pyKML para extraer coordenadas de un archivo KML dado. Mi código de Python es el siguiente: from pykml import parser fileobject = parser.fromstring(open(‘MapSource.kml’, ‘r’).read()) root = parser.parse(fileobject).getroot() print(xml.Document.Placemark.Point.coordinates) Sin embargo, al ejecutar esto, obtengo el siguiente error: ValueError: Unicode strings with encoding declaration are not supported. Please use bytes input or […]