Articles of Dom

Cómo agregar encabezado xml al objeto dom

Estoy usando xml.dom.minidom de Python, pero creo que la pregunta es válida para cualquier analizador DOM. Mi archivo original tiene una línea como esta al principio: Esto no parece ser parte del dominio, por lo que cuando hago algo como dom.toxml (), la cadena resultante no tiene línea al principio. ¿Cómo puedo añadirlo? ejemplo de […]

¿Cómo almacenar de manera eficiente este documento XML analizado en la base de datos MySQL usando Python?

A continuación se muestra el archivo XML: book.xml Sample XML Book Benjamin Smith A First Chapter B 783 . Third Chapter B 59 . XML Master John Doe C Second Chapter K 54 . Third Chapter K 328 . Seventh Chapter K 265 . Ninth Chapter K 356 . A continuación se muestra el código […]

Pasando objetos de Django a Javascript DOM

Estoy tratando de pasar un conjunto de consultas de Django a una plantilla con javascript. He intentado diferentes enfoques para resolver esto: 1. Enfoque normal: Javascript se complica al intentar analizar el objeto debido a la nomenclatura [& gt Object: ID & lt, & gt Object: ID & lt, …] Django View django_list = list(Some_Object.objects.all()) […]

Encontrar un subnodo DOM no recursivo en Python usando BeautifulSoup

¿Hay alguna forma de encontrar un subnodo DOM no recursivo en Python usando BeautifulSoup ? Por ejemplo, considere analizar un archivo pom.xml : com.parent parent 1.0-SNAPSHOT ../pom.xml 2.0.0 com.parent.somemodule some_module jar 1.0-SNAPSHOT Some Module … Si quiero obtener groupId en el nivel superior (específicamente project->groupId , no project->parent->groupId ), uso: with open(pom) as pomHandle: soup […]

Eliminando tags span de la sopa BeautifulSoup / Python

Tengo una sopa en Python así: Title: Info Title2: Info2 Me gustaría que se vea así: Title: Info Title2: Info2 ¿Hay una manera de hacer esto con bs4?

Cómo analizar HTML con formato incorrecto en python, usando bibliotecas estándar

Hay tantas bibliotecas html y xml integradas en Python , que es difícil de creer que no hay soporte para el análisis HTML en el mundo real. He encontrado un montón de excelentes bibliotecas de terceros para esta tarea, pero esta pregunta es sobre la biblioteca estándar de python. Requisitos: Utilice solo componentes de la […]

¿Cómo puedo asegurarme de que algunos elementos HTML estén cargados para Selenium + Python?

Desde este enlace, asumo que el DOM debe cargarse como un todo al principio en la RAM. ¿Cómo funciona / se carga DOM? (en HTML) Pero luego lo pruebo en Selenium con una excepción de tiempo de espera. Parece que incluso la excepción de tiempo de espera está activada, ya se pueden encontrar algunos elementos, […]

Pasando por HTML DOM en Python

Estoy buscando escribir una secuencia de comandos de Python (usando 3.4.3) que toma una página HTML de una URL y puede ir a través del DOM para tratar de encontrar un elemento específico. Actualmente tengo esto: #!/usr/bin/env python import urllib.request def getSite(url): return urllib.request.urlopen(url) if __name__ == ‘__main__’: content = getSite(‘http://www.google.com’).read() print(content) Cuando imprimo contenido, […]

Script de Python para eliminar todos los comentarios del archivo XML

Estoy tratando de construir un script en python que tome un documento XML y elimine todos los bloques de comentarios de él. Intenté algo a lo largo de las líneas de: tree = ElementTree() tree.parse(file) commentElements = tree.findall(‘//comment()’) for element in commentElements: element.parentNode.remove(element) Hacer esto produce un error extraño de python: “KeyError: ‘()’ Sé que […]

Obtener valor de elemento con minidom con Python

Estoy creando una interfaz gráfica de usuario para la API de Eve Online en Python. He sacado con éxito los datos XML de su servidor. Estoy tratando de tomar el valor de un nodo llamado “nombre”: from xml.dom.minidom import parse dom = parse(“C:\\eve.xml”) name = dom.getElementsByTagName(‘name’) print name Esto parece encontrar el nodo, pero la […]