Articles of expresiones regulares de

Python encuentra subcadenas entre ciertos caracteres usando expresiones regulares y replace ()

Supongamos que tengo una cadena con muchas cosas aleatorias como la siguiente: strJunk =”asdf2adsf29Value=five&lakl23ljk43asdldl” Y estoy interesado en obtener la subcadena que se encuentra entre ‘Valor =’ y ‘&’, que en este ejemplo sería ‘cinco’. Puedo usar una expresión regular como la siguiente: match = re.search(r’Value=?([^&>]+)’, strJunk) >>> print match.group(0) Value=five >>> print match.group(1) five […]

Regex / código para eliminar “FWD”, “RE”, etc., del asunto del correo electrónico

Dado el asunto del correo electrónico, me gustaría limpiarlo, deshacerme de “Re:”, “Fwd” y otros elementos no deseados. Entonces, por ejemplo, “[Fwd] Re: Jack and Jill’s Wedding” debería convertirse en “Jack and Jill’s Wedding”. Alguien debe haber hecho esto antes, así que espero que puedas indicarme que luche con expresiones regulares o códigos probados. Aquí […]

expresión regular de Python insertando un espacio entre la puntuación y las letras

Supongo que la mejor manera de hacerlo es con expresiones regulares, pero no sé cómo hacerlo. Estoy tratando de analizar una cadena y poner un espacio entre las letras y la puntuación solamente. Quiero mantener los signos de puntuación juntos. Como ejemplo si tengo la cadena “¡¡¡sí!!!” Quiero terminar con “si”, “!!!”. Si tengo la […]

Python – Comprueba si los últimos caracteres de una cadena son números

Básicamente quiero saber cómo haría esto. Aquí hay una cadena de ejemplo: string = “hello123” Me gustaría saber cómo verificar si la cadena termina en un número y luego imprimir el número en que termina la cadena. Sé que para esta cadena determinada puede usar expresiones regulares para determinar si termina con un número, luego […]

Hashtable / dictionary / map lookup con expresiones regulares

Estoy tratando de averiguar si hay una manera razonablemente eficiente de realizar una búsqueda en un diccionario (o un hash, o un mapa, o como lo llame su idioma favorito) donde las teclas son expresiones regulares y las cadenas se comparan con la juego de llaves Por ejemplo (en la syntax de Python): >>> regex_dict […]

Python re.sub () anclaje de principio de línea

Considere la siguiente cadena multilínea: >> print s shall i compare thee to a summer’s day? thou art more lovely and more temperate rough winds do shake the darling buds of may, and summer’s lease hath all too short a date. re.sub() reemplaza toda la aparición de and con AND : >>> print re.sub(“and”, “AND”, […]

Alternativa al cuantificador posesivo en python

Estoy tratando de hacer coincidir todas las apariciones del Article cadena seguido de un número (uno o más dígitos) que no están seguidos por un paréntesis de apertura. En Sublime Text, estoy usando la siguiente expresión regular: Article\s[0-9]++(?!\() para buscar la siguiente cadena: Article 29 Article 30(1) que no coincide con el Article 30(1) (como […]

Buscar y reemplazar -. Sub (reemplazo, cadena ) – no funciona con caracteres especiales

Estoy aprendiendo Python y Regex y hago algunos ejercicios simples. Aquí tengo una cadena y quiero reemplazar caracteres especiales con código html. El código es el siguiente: str= ‘\nAxes.hist\tPlot a histogram.\nAxes.hist2d\tMake a 2D histogram plot.\nContours\nAxes.clabel\tLabel a contour plot.\nAxes.contour\tPlot contours.’ p = re.compile(‘(\\t)’) p.sub(”, str) p = re.compile(‘(\\n)’) p.sub(”, str) Este código deja los caracteres especiales […]

Escribir un analizador para expresiones regulares.

Incluso después de años de progtwigción, me avergüenza decir que nunca he comprendido las expresiones regulares. En general, cuando un problema requiere una expresión regular, por lo general puedo (después de referirme a la syntax) crear una adecuada, pero es una técnica que utilizo cada vez más a menudo. Entonces, para enseñarme y entender correctamente […]

Extraer cadena entre comillas divididas en varias líneas en Python

Tengo un archivo que contiene varias entradas. Cada entrada es de la siguiente forma: “field1″,”field2″,”field3″,”field4″,”field5” Se garantiza que todos los campos no contienen comillas, sin embargo, pueden contener,. El problema es que field4 se puede dividir en varias líneas. Así que un archivo de ejemplo puede verse como: “john”,”male US”,”done”,”Some sample text across multiple lines. […]