Articles of parsing

¿Se puede modificar un archivo de gramática ANTLR para que lo use PLY?

Quiero crear un progtwig en Python que use PLY para analizar archivos de Javascript, no encontré ninguna fuente de analizadores que implementen el ECMAScript, reglas de Javascript que usan PLY. Lo único que encontré fueron algunos archivos de gramática ANTLR para analizar javascript y ecmascript: http://www.antlr.org/grammar/1153976512034/ecmascriptA3.g http://www.antlr.org/grammar/1206736738015/JavaScript.g ¿Se pueden adaptar los archivos de gramática ANTLR […]

Cómo analizar un archivo HTML con una tabla usando Python

Tengo un archivo html con tabla (es grande, por lo que solo se proporciona un código de ejemplo). Quiero recuperar los valores en tablas. Probé la biblioteca HTMLParser desde python. Comencé a codificar como abajo. Luego encontré que el atributo “clase” es el mismo que la palabra clave definida por el sistema. Así que me […]

Analizar registros CSV en una lista de Clases

Mi primera publicación en StackOverflow, ¡aunque he sido lectora desde hace algunos años! Estoy usando Python para sanear y analizar volcados de datos CSV de curvas IV. Mi problema básico es el formato que me da el registrador de datos: cada pocos minutos, en una única instancia en el tiempo, toma alrededor de 100 mediciones […]

¿Hay un Python equivalente a DateTime.TryParse () de C #?

¿Hay un equivalente a DateTime.TryParse() C # en Python? Me refiero al hecho de que evita lanzar una excepción, no al hecho de que adivine el formato.

Análisis de una matriz de datos que contiene HH: MM: SS.mmm veces usando numpy.loadtxt

Sé que puedo hacer algo como numpy.loadtxt(‘data.txt’, dtype={‘names’: (‘time’, ‘magnitude’), ‘formats’: (‘S12’, ‘f8’)}) Pero esto me da los tiempos como una cuerda. ¿Cómo puedo manipularlo en un flotador?

Python: Modificar valores en el archivo eml (encabezado de correo electrónico)

Me gustaría tener cambios en las direcciones de correo electrónico de los campos “Para” y “Desde” usando Python. Hasta ahora lo hice siguiendo el que está trabajando para leer el campo requerido. Cualquiera por favor sugiera, Cómo hacer cambios en ellos. from email.parser import Parser fp = open(‘2.eml’, ‘r+’) headers = Parser().parse(fp) # Make changes […]

NLTK: ¿Cómo atravieso una frase nominal para devolver la lista de cadenas?

En NLTK, ¿cómo atravieso una oración analizada para devolver una lista de cadenas de frases nominales? Tengo dos objectives: (1) Cree la lista de frases de nombre en lugar de imprimirlas usando el método ‘traverse ()’. Actualmente utilizo StringIO para grabar la salida del método traverse () existente. Esa no es una solución aceptable. (2) […]

ParseError: no está bien formado (token no válido) usando cElementTree

Recibo cadenas xml de una fuente externa que puede contener contenido contribuido por usuarios no saneados. La siguiente cadena xml dio un ParseError en cElementTree : >>> print repr(s) ‘dddddddd\x08\x08\x08\x08\x08\x08_____’ >>> import xml.etree.cElementTree as ET >>> ET.XML(s) Traceback (most recent call last): File “”, line 1, in ET.XML(s) File “”, line 106, in XML ParseError: […]

Expresiones recursivas con pyparsing

Estoy tratando de averiguar cómo hacer una expresión asociativa a la izquierda donde las expresiones recursivas (no encerradas en nada) son posibles. Por ejemplo, me gustaría hacer: expr + OP + expr que analiza 2 operaciones como 1 x 2 x 3 en (expr OP expr) OP expr result. Si trato de evitar que el […]

¿Cómo analizar archivos de texto complejos utilizando Python?

Estoy buscando una forma sencilla de analizar archivos de texto complejos en un DataFrame de pandas. A continuación se muestra un archivo de muestra, cómo quiero que se vea el resultado después del análisis, y mi método actual. ¿Hay alguna forma de hacerlo más conciso / rápido / más python / más legible? También he […]