Articles of xml parsing

¿Cómo puedo obtener un elemento de un archivo XML con un atributo que tenga un valor específico?

Archivo XML: … ¿Cómo seleccionar u obtener el objeto “Nodo” con el atributo “nombre” que tiene un valor como “nodo3” (o cualquier valor específico)? Actualmente estoy usando xml.etree.ElementTree from xml.etree import ElementTree document = ElementTree.parse( ‘filename.xml’ ) nodes = document.find( ‘Node’) for node in nodes: if node.attribute(‘name’) == “node3”: print(“found”) break ¿Hay mejor manera de […]

Odoo ParseError: “Definición de vista no válida Detalle del error: no se encontró el modelo

Por favor, desde ayer estoy intentando instalar un módulo en Odoo 9 pero recibí este error: Odoo ParseError: “Invalid view definition Error detail : Model not found:employee.register Context of error : View `employee.form` [view_id: 547, xml_id: n/a, model: employee.register, parent_id: n/a] None” while parsing /opt/odoo/addons/lci_gestpaie_tic/views/employee.xml:7, near employee.form employee.register Aquí está la estructura de mis módulos […]

Importando un archivo XML grande a Neo4j con Py2neo

Tengo un problema al importar un archivo XML muy grande con 36196662 líneas. Estoy tratando de crear una base de datos de Neo4j Graph de este archivo XML con Py2neo . View post on imgur.com y el código de My Python para importar los datos xml a Neo4j es así: from xml.dom import minidom from […]

Python leyó xml con elementos secundarios relacionados

Tengo un archivo xml con esta estructura: 2014-01-10T12:22:39.166Z 2014-03-11T13:51:31.480Z 2013-01-10T12:22:39.166Z 2013-03-11T13:51:31.480Z Quiero tener dos salidas de este xml: 1- visita incluyendo el número de serie, así que escribí: import pandas as pd import xml.etree.ElementTree as ET tree = ET.parse(filename) root=tree.getroot() visits=pd.DataFrame() for general in root.iter(‘general’): for child in root.iter(‘serialNumber’): visits=visits.append({‘startDateTime’:general.find(‘startDateTime’).text , ‘endDateTime’: general.find(‘endDateTime’).text, ‘serialNumber’:child.attrib[‘value’] }, […]

Encontrar todas las tags y atributos en un HTML

Soy un novato y estoy viendo el código HTML por primera vez. Para mi investigación, necesito saber el número de tags y atributos en una página web. Miré varios analizadores y encontré que Beautiful Soup era una de las más preferidas. El siguiente código (tomado de Parsing HTML usando Python ) muestra la forma de […]

Escribir con lxml sin emitir espacios en blanco incluso cuando pretty_print = True

Estoy utilizando la biblioteca lxml para leer una plantilla xml, insertar / cambiar algunos elementos y guardar el xml resultante. Uno de los elementos que estoy creando sobre la marcha utilizando los métodos etree.Element y etree.SubElement : tree = etree.parse(r’xml_archive\templates\metadata_template_pts.xml’) root = tree.getroot() stream = [] for element in root.iter(): if isinstance(element.tag, basestring): stream.append(element.tag) # […]

La biblioteca lxml de Python no puede analizar & lt; y & gt;

Tengo un XSLT con javascript que usa “& lt;” y “& gt;” dentro de bucle function example() { var trs = document.getElementsByTagName(“tr”); for (var i = 0; i < trs.length; i++) { } } Estoy usando la biblioteca PYTHON LXML para generar HTML usando XSLT y XML. import lxml.etree as ET xml = ET.parse(‘sample.xml’) xslt […]

Analizar un archivo de texto XML grande (~ 40GB) en python

Tengo un archivo XML que quiero analizar con Python. ¿Cuál es la mejor manera de hacer esto? Tomar en memoria todo el documento sería desastroso, necesito leerlo de alguna manera un solo nodo a la vez. Soluciones XML existentes que conozco: árbol de elementos minixml pero me temo que no van a funcionar del todo […]

xml analizando en python usando ElementTree

Soy muy nuevo en Python y necesito analizar algunos archivos XML sucios que primero necesitan ser desinfectados. Tengo el siguiente código de python: import arff import xml.etree.ElementTree import re totstring=”” with open(‘input.sgm’, ‘r’) as inF: for line in inF: string=re.sub(“[^0-9a-zA-Z/\s=!-\”\”]+”,””, line) totstring+=string data=xml.etree.ElementTree.fromstring(totstring) print data file.close que analiza: 26-FEB-1987 15:01:01.79 cocoa el-salvadorusauruguay &#5;&#5;&#5;CT &#22;&#22;&#1;f0704&#31;reute uf […]

xml.etree.ElementTree obtiene la profundidad del nodo

El XML: http://example.com/Labs Labs http://example.com/Labs/Email Email http://example.com/Labs/Email/How_to How-To http://example.com/Labs/Social Social http://example.com/Tests Tests http://example.com/Tests/Email Email http://example.com/Tests/Email/How_to How-To http://example.com/Tests/Social Social El código: // rexml is the XML string read from a URL from xml.etree import ElementTree as ET tree = ET.fromstring(rexml) for node in tree.iter(‘page’): for url in node.iterfind(‘url’): print url.text for title in node.iterfind(‘title’): print title.text.encode(“utf-8”) […]