Articles of xml

¿Cómo analizar un archivo sitemap.xml utilizando XmlFeedSpider de scrapy?

Estoy tratando de analizar los archivos sitemap.xml usando scrapy, los archivos del mapa del sitio son como los siguientes con muchos más nodos url . http://www.site.com/page.html http://www.site.com/thumb.jpg http://www.example.com/video123.flv http://www.example.com/videoplayer.swf?video=123 here is the page title and an awesome description 302 2011-02-24T02:03:43+02:00 w00t awesome omgwtfbbq kthxby Miré la documentación relacionada de la trompa y escribí el siguiente […]

Velocidad del algoritmo de análisis XML de Python

Actualmente estoy analizando un gran archivo XML de la siguiente forma en una aplicación web de Python-Flask en Heroku: li 1 content li 2 content li 1 content li 2 content li 1 content li 2 content li 1 content li 2 content El código que utilizo para analizarlo, analizarlo y mostrarlo a través de […]

¿Cómo puedo guardar un documento de Word editado con Python?

Estoy intentando crear un script que puede extraer el XML de un documento de Word, modificarlo y, finalmente, guardar el nuevo documento de Word, todo utilizando Python. Aquí está el código que usé, que fue efectivamente robado desde aquí : import zipfile import os import tempfile import shutil def getXml(docxFilename): zip = zipfile.ZipFile(open(docxFilename,”rb”)) xmlString = […]

Analizar un archivo xml y almacenarlo en una base de datos

¿Existe una forma genérica / automática en R o en python para analizar archivos xml con sus nodos y atributos, generar tablas mysql automáticamente para almacenar esa información y luego rellenar esas tablas?

Parse updateinfo.xml

He estado intentando analizar el archivo updateinfo.xml de Amazon para mi proyecto universitario en Python. Un archivo de ejemplo es el siguiente: AL2012-2014-001 Amazon Linux 2012.03 – AL2012-2014-001: important priority package update for libxml2 important Package updates are available for Amazon Linux that fix the following vulnerabilities: CVE-2012-5134: A heap-based buffer underflow flaw was found […]

PYTHON 2.6 XML.ETREE para generar comillas simples para atributos en lugar de comillas dobles

Tengo el siguiente código: #!/usr/bin/python2.6 from lxml import etree n = etree.Element(‘test’) n.set(‘id’,’1234′) print etree.tostring(n) la salida generada es pero quiero alguien puede ayudar?

Análisis de xml en Python usando una clase de elemento personalizado

Me gustaría analizar un documento xml utilizando el módulo xml.etree.ElementTree de Python. Sin embargo, quiero que todos los elementos en el objeto del árbol resultante tengan algunos métodos de clase que defino. Esto sugiere crear mi propia subclase de la clase de elemento de Python, pero me cuesta decirle al analizador que use mi propia […]

Convertir el marcado HTML en un documento RTF

Tengo un documento XML que contiene contenido HTML incrustado que estoy intentando convertir en un archivo de salida RTF. Tengo los elementos XML decorados con , , y otras tags HTML, que me gustaría transferir al RTF generado. Esto es lo que funciona a partir de ahora: Obtenga el contenido de la etiqueta XML como […]

Crea un archivo XML con python iterando sobre listas

Estoy tratando de obtener un archivo xml que tenga este aspecto para poder importarlo en un libro de calificaciones moodle: 1 100 0 1 101 4 1 102 10 2 100 0 2 101 4 2 102 10 He intentado escribir algo de código en python, y después de estudiar detenidamente la documentación, lo mejor […]

Lea XML jerárquico (en forma de árbol) en un dataframe de pandas, conservando la jerarquía

Tengo un documento XML que contiene una estructura jerárquica, parecida a un árbol, vea el ejemplo a continuación. El documento contiene varias tags (solo copié una de ellas por comodidad). Cada tiene algunos datos asociados ( id , status , priority ) por sí mismo. Además, cada puede contener uno o más hijos que nuevamente […]