Articles of parsing

“Deparsing” una lista utilizando pyparsing

¿Es posible dar a pyparsing una lista analizada y hacer que devuelva la cadena original?

PyParsing: ¿Qué hace Combine ()?

Cuál es la diferencia entre: foo = TOKEN1 + TOKEN2 y foo = Combine(TOKEN1 + TOKEN2) Gracias. ACTUALIZACIÓN : Según mi experimentación, parece que Combine() es para terminales, donde se intenta construir una expresión para que coincida, mientras que plain + es para no terminales. Pero no estoy seguro.

¿Método para analizar el campo Cc del texto del encabezado del correo electrónico?

Tengo el texto sin formato de un campo de encabezado de CC que se ve así: friend@email.com, John Smith ,”Smith, Jane” ¿Hay módulos de batalla probados para analizar esto correctamente? (¡bonificación si está en Python! el módulo de correo electrónico simplemente devuelve el texto sin formato sin ningún método para dividirlo, AFAIK) (también bonificación si […]

convertir XML a Python dict

Estoy tratando de hacer una clase de dictado para procesar un xml pero me atasco, realmente me quedo sin ideas. Si alguien pudiera orientar sobre este tema sería genial. código desarrollado hasta el momento: class XMLResponse(dict): def __init__(self, xml): self.result = True self.message = ” pass def __setattr__(self, name, val): self[name] = val def __getattr__(self, […]

Obtenga el primer enlace en un artículo de Wikipedia que no esté entre paréntesis

Así que me interesa esta teoría de que si vas a un artículo aleatorio de Wikipedia, haz clic en el primer enlace que no esté entre paréntesis repetidamente, en el 95% de los casos terminarás en el artículo sobre Filosofía . Quería escribir un script en Python que haga la búsqueda del enlace para mí […]

¿Cómo analizar el texto reestructurado en python?

¿Hay algún módulo que pueda analizar el texto reestructurado en un modelo de árbol? ¿Puede hacer esto docutils o sphinx?

Descarga CSV directamente en Python CSV parser

Estoy tratando de descargar el contenido CSV de morningstar y luego analizar su contenido. Si inyecto el contenido HTTP directamente en el analizador CSV de Python, el resultado no tiene el formato correcto. Sin embargo, si guardo el contenido HTTP en un archivo (/tmp/tmp.csv) y luego importo el archivo en el analizador csv de python’s, […]

Acceda a los elementos analizados utilizando Pyparsing

Tengo un montón de frases que necesito analizar y convertir al código de búsqueda de expresiones regulares correspondiente. Ejemplos de mis oraciones – LINE_CONTAINS phrase one BEFORE {phrase2 AND phrase3} AND LINE_STARTSWITH Therefore we -Esto significa en la línea, phrase one viene en algún lugar antes de phrase2 y phrase3 . Además, la línea debe […]

Analizador Vcard con Python

Estoy analizando la información de mi vcard (copiada en un archivo txt) para extraer name:number y ponerla en un diccionario. Muestra de datos COMENZAR: VCARD VERSIÓN: 2.1 N: MEO; Apoio ;;; FN: Apoio MEO TEL; CELULA; PREF: 1696 TEL; CELULAR: 162 00 FIN: VCARD COMENZAR: VCARD VERSIÓN: 2.1 N: estrangeiro; Apoio MEO; no ;; FN: […]

Convertir un pdf a texto / html en python para que pueda analizarlo

Tengo el siguiente código de muestra donde descargo un pdf del sitio web del Parlamento Europeo sobre una propuesta legislativa determinada: EDITAR: Acabo de recibir el enlace y enviarlo a la herramienta de conversión en línea de adobes (consulte el código a continuación): import mechanize import urllib2 import re from BeautifulSoup import * adobe = […]