Articles of xml parsing

xml.etree.ElementTree obtiene la profundidad del nodo

El XML: http://example.com/Labs Labs http://example.com/Labs/Email Email http://example.com/Labs/Email/How_to How-To http://example.com/Labs/Social Social http://example.com/Tests Tests http://example.com/Tests/Email Email http://example.com/Tests/Email/How_to How-To http://example.com/Tests/Social Social El código: // rexml is the XML string read from a URL from xml.etree import ElementTree as ET tree = ET.fromstring(rexml) for node in tree.iter(‘page’): for url in node.iterfind(‘url’): print url.text for title in node.iterfind(‘title’): print title.text.encode(“utf-8”) […]

obtener todos los padres de nodo XML utilizando Python

para este xml 124 A type a Active 125 B type b Active 126 C type c Active 109449 D type d Active Cómo puedo obtener todos los padres de un nodo usando lxml etree en python. Salida esperada: entrada orgid = 126, devolverá a todos los padres como, {‘A’:124,’B’:125,’C’:126}

convertir XML a Python dict

Estoy tratando de hacer una clase de dictado para procesar un xml pero me atasco, realmente me quedo sin ideas. Si alguien pudiera orientar sobre este tema sería genial. código desarrollado hasta el momento: class XMLResponse(dict): def __init__(self, xml): self.result = True self.message = ” pass def __setattr__(self, name, val): self[name] = val def __getattr__(self, […]

Busque de forma recursiva las combinaciones de padres primarios y cree un árbol en Python y XML

Estoy tratando de atravesar estos datos XML llenos de relaciones padre-> hijo y necesito una forma de construir un árbol. Cualquier ayuda sería realmente apreciada. Además, en este caso, ¿es mejor tener atributos o nodos para la relación padre -> hijo? En el script de Python, esto es lo que tengo. ¿Mi cerebro está frito […]

¿Cómo analizar correctamente utf-8 xml con ElementTree?

Necesito ayuda para comprender por qué el análisis de mi archivo xml * con xml.etree.ElementTree produce los siguientes errores. * Mi archivo de prueba xml contiene caracteres árabes. Tarea: Abrir y analizar el archivo utf8_file.xml . Mi primer bash: import xml.etree.ElementTree as etree with codecs.open(‘utf8_file.xml’, ‘r’, encoding=’utf-8′) as utf8_file: xml_tree = etree.parse(utf8_file) Resultado 1: UnicodeEncodeError: […]

Solo devolviendo el texto de los elementos en xpath (python / lxml)

Tengo una estructura XML como esta: mytree = “”” 1 2 3 “”” Actualmente estoy usando xpath en Python lxml para capturar los nodos: >>> from lxml import etree >>> info = etree.XML(mytree) >>> print info.xpath(“/path/to/nodes/info”) [, , ] >>> for x in info.xpath(“/path/to/nodes/info”): print x.text 1 2 3 Esto es genial, pero ¿hay una […]

Analizar XML desde URL en objeto python

El sitio web de goodreads tiene esta API para acceder a los ‘estantes:’ https://www.goodreads.com/review/list/20990068.xml?key=nGvCqaQ6tn9w4HNpW8kquw&v=2&shelf=toread Devuelve XML. Estoy tratando de crear un proyecto django que muestre libros en un estante de esta API. Estoy buscando para saber cómo (o si hay una forma mejor que) de escribir mi vista para poder pasar un objeto a mi […]

Cómo leer el encabezado XML en Python

¿Cómo puedo leer el encabezado de un documento XML en Python 3? Idealmente, usaría el módulo defusedxml ya que la documentación indica que es más seguro , pero en este punto (después de horas de intentar resolver esto), me conformaría con cualquier analizador. Por ejemplo, tengo un documento (en realidad es de un ejercicio) que […]

Análisis de tags XML en blanco con LXML y Python

Al analizar documentos XML en el formato de: Blue Chevy Camaro Yo uso el siguiente código: carData = element.xpath(‘//Root/Foo/Bar/Car/node()[text()]’) parsedCarData = [{field.tag: field.text for field in carData} for action in carData] print parsedCarData[0][‘Color’] #Blue Este código no funcionará si una etiqueta está vacía, como por ejemplo: Blue Chevy Usando el mismo código que el anterior: […]

extraer texto de documentos xml en python

Este es el documento XML de muestra: Everyday Italian Giada De Laurentiis 2005 300.00 Harry Potter J K. Rowling 2005 625.00 Quiero extraer el texto sin especificar los elementos, ¿cómo puedo hacer esto, porque tengo 10 documentos de este tipo? Lo quiero porque mi problema es que el usuario está ingresando una palabra que no […]