Articles of expresiones regulares de

Función de Python para buscar cadenas entre dos marcadores

Estoy buscando construir una función de cadena para extraer el contenido de la cadena entre dos marcadores. Devuelve una lista de extracción. def extract(raw_string, start_marker, end_marker): … function … return extraction_list Sé que esto se puede hacer usando expresiones regulares, pero ¿es esto rápido? Esto se llamará miles de millones de veces en mi proceso. […]

¿Parseando el protocolo FIX en expresiones regulares?

Necesito analizar archivos de registro que contengan mensajes de protocolo FIX. Cada línea contiene información de encabezado (marca de tiempo, nivel de registro, punto final), seguida de una carga útil FIX. He usado expresiones regulares para analizar la información del encabezado en grupos con nombre. P.ej: <?P\d{2}/\d{2}/\d{2} \d{2}:\d{2}:\d{2}.\d{6}) (?\d{4}/\d{1,2})\s*(?P\w*)\s*(?P\w*)\s* Luego llego a la carga útil […]

¿La mejor manera de reemplazar \ x00 en las listas de python?

Tengo una lista de valores de un archivo PE analizado que incluye / x00 bytes nulos al final de cada sección. Quiero poder eliminar los bytes / x00 de la cadena sin eliminar todas las “x” del archivo. He intentado hacer .replace y re.sub, pero no tanto éxito. Utilizando Python 2.6.6 Ejemplo. import re List […]

Imprimir letras en un patrón específico en Python

Tengo la siguiente cuerda y la partí: >>> st = ‘%2g%k%3p’ >>> l = filter(None, st.split(‘%’)) >>> print l [‘2g’, ‘k’, ‘3p’] Ahora quiero imprimir la letra g dos veces, la letra k una vez y la letra p tres veces: ggkppp ¿Como es posible?

Transforma una cadena separada por comas en una lista pero ignora las comillas entre comillas

¿Cómo convierto “1,,2’3,4′” en una lista? Las comas separan los elementos individuales, a menos que estén entre comillas. En ese caso, la coma se incluirá en el elemento. Este es el resultado deseado: [‘1’, ”, ‘2’, ‘3,4’] . Una expresión regular que encontré en otro hilo para ignorar las citas es la siguiente: re.compile(r”'((?:[^,”‘]|”[^”]*”|'[^’]*’)+)”’) Pero […]

Eliminar comentarios hash que no están dentro de comillas

Estoy usando python para revisar un archivo y eliminar cualquier comentario. Un comentario se define como un hash y cualquier cosa a la derecha, siempre que el hash no esté dentro de comillas dobles . Actualmente tengo una solución, pero parece subóptima: filelines = [] r = re.compile(‘(“.*?”)’) for line in f: m = r.split(line) […]

Python – Regex – Cómo encontrar una cadena entre dos conjuntos de cadenas

Considera lo siguiente: Foo1 Home Extract Sitemap ¿Cómo harías para eliminar la línea de sitemap con expresiones regulares en python ? Sitemap Se puede usar lo siguiente para sacar las tags de anclaje. ‘//i’ Sin embargo, hay múltiples tags de anclaje. ¿También hay varios hotlink (s), así que tampoco podemos usarlos?

Python – Reemplace el carácter no-ascii en la cadena (»)

Necesito reemplazar en una cadena el carácter “» “con un espacio en blanco, pero sigo recibiendo un error. Este es el código que uso: # -*- coding: utf-8 -*- from bs4 import BeautifulSoup # other code soup = BeautifulSoup(data, ‘lxml’) mystring = soup.find(‘a’).text.replace(‘ »’,”) UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter u ‘\ […]

Expresión regular de Python: ¿por qué esto no funciona?

Esto no me da ni un error ni una respuesta. re.sub(‘\\.(\\W|\\.)*[o0](\\W|[o0])*’, ‘*’, ‘……………………………………’) ¿Por qué se comporta así? Además, si reduzco la cantidad de “períodos”, entonces funciona. Gracias.

Edición de elementos en una lista en python

¿Cómo elimino un carácter de un elemento en una lista? Ejemplo: mylist = [’12:01′, ’12:02′] Quiero eliminar los dos puntos de las marcas de tiempo en un archivo, por lo que puedo convertirlos más fácilmente en un tiempo de 24 horas. Ahora mismo estoy tratando de recorrer los elementos de la lista y buscar el […]