Articles of elementtree

¿Debería boost el uso de la memoria cuando se usa ElementTree.iterparse () cuando se despejan () árboles?

import os import xml.etree.ElementTree as et for ev, el in et.iterparse(os.sys.stdin): el.clear() La ejecución de lo anterior en el volcado RDF de la estructura ODP da como resultado un aumento de la memoria. ¿Porqué es eso? Entiendo que ElementTree aún genera un árbol de análisis, aunque con los nodos secundarios clear() ed. Si esa es […]

Python + Expat: Error en & # 0; entidades

He escrito una pequeña función, que utiliza ElementTree y xpath para extraer el contenido de texto de ciertos elementos en un archivo xml: #!/usr/bin/env python2.5 import doctest from xml.etree import ElementTree from StringIO import StringIO def parse_xml_etree(sin, xpath): “”” Takes as input a stream containing XML and an XPath expression. Applies the XPath expression to […]

¿Múltiples nodos de texto en ElementTree de Python? Generación de HTML

Estoy usando ElementTree para generar algo de HTML, pero me he topado con el problema de que ElementTree no almacena texto como un nodo, sino como las propiedades de text y tail de Element . Este es un problema si quiero generar algo que requiera varios nodos de texto, por ejemplo: text1 text2 text3 text4 […]

Archivo XML DATEXII a DataFrame en Python

Los últimos días he estado intentando abrir y leer un determinado archivo XML (en formato DATEXII), pero hasta ahora no he tenido éxito. Se trata de datos de tráfico del sitio web de datos abiertos de NDW (Banco de datos holandés para datos de tráfico y tráfico), hipervínculo para la fuente de los archivos XML. […]

Quedando sin memoria usando Python ElementTree

EDIT: Cualquier persona que llegue a esto en el futuro, la solución que utilicé fue cambiar a cElementTree. No solo se ejecuta con menos memoria, es significativamente más rápido. Esto funciona en archivos de hasta 600 mb de tamaño, más grandes que eso y me quedo sin memoria (tengo una máquina de 16 gb). ¿Qué […]

Buscar y reemplazar texto en elementtree

Soy muy nuevo en progtwigción y python. Estoy tratando de encontrar y reemplazar un texto en un archivo xml. Aquí está mi archivo xml Installation To install SDK, perform the tasks mentioned in the following table. ln -s /sim/user_id/.VirtualBox $home/.VirtualBox Necesito reemplazar todas las entradas de “caja virtual” con “Xen”. Para esto probé Elementtree. Pero […]

Cambiar valor en elemento hijo específico

Tengo algunos problemas con mi guión. Primero quiero asegurarme de que el usuario haya dado el nombre correcto. Por ejemplo, si escribiera “Nombre”, no debería coincidir con nada en mi xml. Si tuviera que escribir “NameY”, debería coincidir con el nombre de stack y no con ninguna otra cosa (por ejemplo, “NameX no debe coincidir). […]

Python leyó xml con elementos secundarios relacionados

Tengo un archivo xml con esta estructura: 2014-01-10T12:22:39.166Z 2014-03-11T13:51:31.480Z 2013-01-10T12:22:39.166Z 2013-03-11T13:51:31.480Z Quiero tener dos salidas de este xml: 1- visita incluyendo el número de serie, así que escribí: import pandas as pd import xml.etree.ElementTree as ET tree = ET.parse(filename) root=tree.getroot() visits=pd.DataFrame() for general in root.iter(‘general’): for child in root.iter(‘serialNumber’): visits=visits.append({‘startDateTime’:general.find(‘startDateTime’).text , ‘endDateTime’: general.find(‘endDateTime’).text, ‘serialNumber’:child.attrib[‘value’] }, […]

tags html mayúsculas codificadas en lxml

Estoy analizando un archivo html utilizando lxml.html …. El archivo html contiene tags con mayúsculas y minúsculas. Una parte de mi código se muestra a continuación: response = urllib2.urlopen(link) html = response.read().decode(‘cp1251’) content_html = etree.HTML(html_1) first_link_xpath = content_html.xpath(‘//TR’) print (first_link_xpath) Una pequeña parte de mi archivo HTML se muestra a continuación: <!–Meta Data:–> Entonces, cuando […]

¿Cómo analizar el archivo XML por lxml, obtener elemento y atributo?

Tengo una descripción xml como esta: {{date_started|escape}} {{date_sold|escape}} {{name|escape}} {{brand_name|escape}} {{speed_value}} {{by_route|escape}} {{strength_value|escape}} {{frequency|escape}} Escribo una función parse_car usando Python, para analizar desde una cadena use el formato anterior: def parse_car(etree): NS = “{http://example.com/vocab/xml/cars#}” CODES_NS = “{http://example.com/codes/}” return {‘date_started’ : etree.findtext(‘%sdateStarted’ % NS), ‘date_stopped’ : etree.findtext(‘%sdateStopped’ % NS), ‘name’: etree.findtext(‘%sname’ % NS), ‘brand_name’: etree.findtext(‘%sbrandName’ % […]