Articles of parsing

A Python ElementTree no le gustan los dos puntos en el nombre de la instrucción de procesamiento

El siguiente código: import xml.etree.ElementTree as ET xml = ”’\ ”’ root = ET.fromstring(xml) xml2 = xml.replace(‘LazyComment ‘, ‘LazyComment:’) print(xml2) try: root2 = ET.fromstring(xml2) except ET.ParseError: print(“\nERROR in xml2!!!\n”) xml3 = xml2.replace(‘testCaseConfig’, ‘testCaseConfig xmlns:Blah=”http://www.w3.org/TR/html4/”‘, 1) print(xml3) try: root3 = ET.fromstring(xml3) except ET.ParseError: print(“\nERROR in xml3!!!\n”) raise Da esta salida: ERROR in xml2!!! ERROR in xml3!!! […]

Python3, descarga el archivo desde la URL haciendo clic en el botón

Necesito descargar el archivo de un enlace como este https://freemidi.org/getter-13560 Pero no puedo usar urllib.request o la biblioteca de requests porque descarga html, no midi. ¿Hay alguna solución? Y también aquí está el enlace con el botón mismo enlace.

Reemplazar enlaces HTML con texto

¿Cómo reemplazar enlaces con anclajes en html (python)? por ejemplo entrada: Hello link text1 and link text2 ! Quiero un resultado con la etiqueta p guardada (solo una etiqueta eliminar): Hello link text1 and link text2 !

Conversión simple de CSV a XML – Python

Estoy buscando una manera de automatizar la conversión de CSV a XML. Aquí hay un ejemplo de un archivo CSV, que contiene una lista de películas: Aquí está el archivo en formato XML: War, Thriller DVD 2003 PG 10 Talk about a US-Japan war Anime, Science Fiction DVD 1989 R 8 A schientific fiction Anime, […]

analizar la cadena de consulta con urllib en Python 2.4

Usando Python2.4.5 (¡no preguntes!) Quiero analizar una cadena de consulta y obtener un dictado a cambio. ¿Tengo que hacerlo “manualmente” como sigue? >>> qs = ‘first=1&second=4&third=3’ >>> d = dict([x.split(“=”) for x in qs.split(“&”)]) >>> d {‘second’: ‘4’, ‘third’: ‘3’, ‘first’: ‘1’} No encontré ningún método útil en urlparse .

Coincidencia de expresiones regulares de múltiples líneas en AWK. && operador?

No estoy seguro si el operador de && trabaja en expresiones regulares. Lo que estoy tratando de hacer es hacer coincidir una línea de manera que comience con un número y tenga la letra ‘a’ Y la siguiente línea comience con un número y tenga la letra ‘b’ Y la siguiente línea … letra ‘c’ […]

¿Tengo un error en mi gramática o en la herramienta de generación de analizador?

La siguiente es una gramática del formato EBNF (en su mayoría, la syntax real se documenta aquí ) para la que estoy intentando generar un analizador: expr = lambda_expr_list $; lambda_expr_list = [ lambda_expr_list “,” ] lambda_expr; lambda_expr = conditional_expr [ “->” lambda_expr ]; conditional_expr = boolean_or_expr [ “if” conditional_expr “else” conditional_expr ]; boolean_or_expr = […]

Profundidad máxima de recursión superada. Multiprocesamiento y bs4

Estoy tratando de hacer que un analizador use beautifulSoup y multiprocesamiento. Tengo un error: RecursionError: máxima profundidad de recursión superada Mi código es: import bs4, requests, time from multiprocessing.pool import Pool html = requests.get(‘https://www.avito.ru/moskva/avtomobili/bmw/x6?sgtd=5&radius=0’) soup = bs4.BeautifulSoup(html.text, “html.parser”) divList = soup.find_all(“div”, {‘class’: ‘item_table-header’}) def new_check(): with Pool() as pool: pool.map(get_info, divList) def get_info(each): pass if […]

¿Dificultad de este trabajo en particular usando pyparsing? (principiante)

Tengo la tarea de hacer eso. Estoy seguro de que Python y pyparsing realmente podrían ayudar, pero todavía soy demasiado novato con la progtwigción para tomar una decisión inteligente sobre qué tan difícil será la implementación completa y si vale la pena intentarlo. Es cierto que será un infructuoso fregadero del tiempo. La tarea es […]

¿Cómo obtengo un conjunto de reglas gtwigticales de Penn Treebank usando python y NLTK?

Soy bastante nuevo en NLTK y Python. He estado creando análisis de oraciones utilizando las gramáticas de los juguetes que figuran en los ejemplos, pero me gustaría saber si es posible usar una gramática aprendida de una parte del Penn Treebank, por ejemplo, en lugar de solo escribir la mía o usar el juguete. gramáticas? […]