Articles of parsing

Expresiones recursivas con pyparsing

Estoy tratando de averiguar cómo hacer una expresión asociativa a la izquierda donde las expresiones recursivas (no encerradas en nada) son posibles. Por ejemplo, me gustaría hacer: expr + OP + expr que analiza 2 operaciones como 1 x 2 x 3 en (expr OP expr) OP expr result. Si trato de evitar que el […]

¿Cómo analizar archivos de texto complejos utilizando Python?

Estoy buscando una forma sencilla de analizar archivos de texto complejos en un DataFrame de pandas. A continuación se muestra un archivo de muestra, cómo quiero que se vea el resultado después del análisis, y mi método actual. ¿Hay alguna forma de hacerlo más conciso / rápido / más python / más legible? También he […]

analizador parsimonioso – error al intentar analizar la gramática de la tarea

Estoy usando el Parsimonious Parser de Python para intentar construir un intérprete para un lenguaje simple que estoy diseñando. Vi este video tutorial que fue muy útil, y ahora estoy modificando lentamente el código para que coincida con mis propias reglas. Estoy atascado en una regla de asignación originalmente definida como: def assignment(self, node, children): […]

Código fuente analizando (Python) Enfoque: ¿Sopa hermosa, lxml, diferencia html5lib?

Tengo un código fuente HTML grande que me gustaría analizar (~ 200,000) líneas, y estoy bastante seguro de que hay algún formato pobre en todo. He estado investigando algunos analizadores, y parece que Beautiful Soup, lxml, html5lib son los más populares. Al leer este sitio web, parece que lxml es el más usado y el […]

Analizando consultas SPARQL

Necesito probar una cierta propiedad estructural de un par de millones de consultas SPARQL, y para eso necesito la estructura de la statement WHERE . Actualmente estoy tratando de usar fyzz para hacer esto, pero desafortunadamente su documentación no es muy útil. Analizar consultas es fácil, el problema es que no he podido recuperar la […]

Análisis de llamadas de funciones anidadas mediante pyparsing

Estoy tratando de usar pyparsing para analizar las llamadas de función en la forma: f(x, y) Eso es fácil. Pero como se trata de un analizador de descendencia recursiva, también debería ser fácil de analizar: f(g(x), y) Eso es lo que no puedo conseguir. Aquí hay un ejemplo resumido: from pyparsing import Forward, Word, alphas, […]

Cómo convertir string int JSON en int real con json.loads

Estoy intentando convertir una cadena que representa un objeto JSON en un objeto JSON real utilizando json.loads pero no convierte los enteros: (en la cadena inicial, los enteros son siempre cadenas) $> python Python 2.7.9 (default, Aug 29 2016, 16:00:38) [GCC 4.2.1 Compatible Apple LLVM 7.3.0 (clang-703.0.31)] on darwin Type “help”, “copyright”, “credits” or “license” […]

¿Cuál es la mejor herramienta para analizar los archivos de registro?

Uso grep para analizar mis registros de aplicaciones comerciales, pero está limitado en el sentido de que necesito rastrear visualmente a través de la salida para ver qué sucedió, etc. Me pregunto si Perl es una mejor opción? ¿Algún buen recurso para aprender el registro y el análisis de cadenas con Perl? También creo que […]

¿Cómo puedo verificar la existencia de atributos y tags en XML antes de analizar?

Estoy analizando un archivo XML a través de Element Tree en python y escribiendo el contenido en un archivo cpp. El contenido de las tags de los niños será variante para diferentes tags. Por ejemplo, la primera etiqueta de evento tiene una etiqueta de fiesta como secundaria, pero la segunda etiqueta de evento no tiene. […]

Análisis de HTML con Python 2.7: HTMLParser, SGMLParser o Beautiful Soup?

Quiero realizar algunos HTMLParser pantalla con Python 2.7, y no tengo contexto para las diferencias entre HTMLParser , HTMLParser o Beautiful Soup. ¿Están todos tratando de resolver el mismo problema, o existen por diferentes razones? ¿Cuál es la más simple, la más robusta y cuál (si la hay) es la opción predeterminada? Además, avíseme si […]