Articles of xml parsing

Análisis: Cadena a XML

se supone que mi API debe tomar una cadena y convertirla en formato XML. Pero constantemente estoy recibiendo este error: ParseError: etiqueta no coincidente: línea 1, columna 764 XML Implementado a través de: tree = ET.ElementTree(ET.fromstring(kk.strip())) Estoy seguro de que mi cadena XML contiene todas las tags coincidentes y está formateada, ¡¡pero aún falta algo […]

BeautifulSoup contando tags sin analizarlas profundamente dentro de ellas

Pensé en lo siguiente mientras escribía una respuesta a esta pregunta . Supongamos que tengo un archivo xml profundamente nested como este (pero mucho más nested y mucho más largo): Some content … and so forth El problema con len(soup.find_all(“section”)) es que, al hacer find_all(“section”) , BS sigue buscando profundamente en una etiqueta que sé […]

Encuentre todos los nodos por atributo en XML usando Python 2

Tengo un archivo XML que tiene muchos nodos diferentes con el mismo atributo. Me preguntaba si es posible encontrar todos estos nodos utilizando Python y cualquier paquete adicional como minidom o ElementTree.

Árbol de elementos de Python: extraer texto de un elemento, eliminando tags

Con ElementTree en Python, ¿cómo puedo extraer todo el texto de un nodo, eliminando las tags de ese elemento y manteniendo solo el texto? Por ejemplo, digamos que tengo lo siguiente: Some example text Quiero devolver Some example text . ¿Cómo voy a hacer esto? Hasta ahora, los enfoques que he tomado han tenido resultados […]

Python para analizar un archivo XML no estándar

Mi archivo de entrada es en realidad múltiples archivos XML que se agregan a un archivo. (Es de Google Patents ). Tiene debajo de la estructura: … … … Python xml.dom.minidom no puede analizar este archivo no estándar. ¿Cuál es una mejor manera de analizar este archivo? No estoy debajo del código tiene buen rendimiento […]

Python cómo quitar los espacios en blanco de los nodos de texto xml

Tengo un archivo xml de la siguiente manera My Name My Address La etiqueta tiene nuevas líneas adicionales. ¿Hay alguna forma rápida en Pythonic para recortar esto y generar un nuevo xml? Encontré esto pero recorta solo lo que está entre las tags y no el valor https://skyl.org/log/post/skyl/2010/04/remove-insignificant-whitespace-from-xml-string-with-python/ Actualización 1 – Manejar el siguiente xml […]

Python: acceda a los niños nesteds en un archivo xml analizado con ElementTree

Soy nuevo en el análisis XML. Este archivo xml tiene el siguiente árbol: FHRSEstablishment |–> Header | |–> … |–> EstablishmentCollection | |–> EstablishmentDetail | | |–>… | |–> Scores | | |–>… |–> EstablishmentCollection | |–> EstablishmentDetail | | |–>… | |–> Scores | | |–>… pero cuando accedo a él con ElementTree y […]

¿Cómo almacenar de manera eficiente este documento XML analizado en la base de datos MySQL usando Python?

A continuación se muestra el archivo XML: book.xml Sample XML Book Benjamin Smith A First Chapter B 783 . Third Chapter B 59 . XML Master John Doe C Second Chapter K 54 . Third Chapter K 328 . Seventh Chapter K 265 . Ninth Chapter K 356 . A continuación se muestra el código […]

Diferencia entre si y si no es Ninguno

Al escribir un código de análisis XML, recibí la advertencia: FutureWarning: The behavior of this method will change in future versions. Use specific ‘len(elem)’ or ‘elem is not None’ test instead. donde utilicé if : para verificar si se encontró un valor para un elemento dado. ¿Alguien puede explicar la diferencia entre if : vs […]

Extrae elementos del archivo XML usando Python

El siguiente enlace nos da la lista de ingredientes en la lista de recipientes. Me gustaría extraer los nombres del ingrediente y guardarlo en otro archivo usando python. http://stream.massey.ac.nz/file.php/6087/Eva_Material/Tutorials/recipebook.xml Hasta ahora he intentado usar el siguiente código, pero me da la receta completa, no los nombres de los ingredientes: from xml.sax.handler import ContentHandler import xml.sax […]