Articles of regex

Cómo extraer números de líneas que coincidan con una expresión regular en un archivo de texto

Estoy realizando un proyecto de traducción automática estadística en el que necesito extraer números de línea de un archivo de texto con etiqueta POS que coincida con una expresión regular (cualquier verbo frasal no separado con la partícula ‘out’) y escribir los números de línea a un archivo (en python). Tengo esta expresión regular: ‘\ […]

Dividir el archivo del diario en varios archivos usando Python

Guardo un archivo diario de notas técnicas. Cada entrada tiene la marca de tiempo así: # Monday 02012-05-07 at 01:45:20 PM This is a sample note Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris […]

buscando un patrón de cadena coincidente desde la columna del dataframe en pandas de Python

tengo un dataframe como el de abajo name genre satya |ACTION|DRAMA|IC| satya |COMEDY|BIOPIC|SOCIAL| abc |CLASSICAL| xyz |ROMANCE|ACTION|DARMA| def |DISCOVERY|SPORT|COMEDY|IC| ghj |IC| Ahora quiero consultar el dataframe para poder obtener las filas 1,5 y 6.i: quiero encontrar | IC | Con solo o con cualquier combinación de otros géneros. Hasta ahora puedo hacer una búsqueda exacta […]

Cómo agregar tags a las palabras negadas en cadenas que siguen “no”, “no” y “nunca”

¿Cómo agrego la etiqueta NEG_ a todas las palabras que siguen not , no y never hasta el siguiente signo de puntuación en una cadena (utilizada para el análisis de sentimientos)? Supongo que se podrían usar expresiones regulares, pero no estoy seguro de cómo. Entrada: It was never going to work, he thought. He did […]

Coincidencia de estados y ciudades con posiblemente múltiples palabras

Tengo una lista de Python como los siguientes elementos: [‘Alabama[edit]’, ‘Auburn (Auburn University)[1]’, ‘Florence (University of North Alabama)’, ‘Jacksonville (Jacksonville State University)[2]’, ‘Livingston (University of West Alabama)[2]’, ‘Montevallo (University of Montevallo)[2]’, ‘Troy (Troy University)[2]’, ‘Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]’, ‘Tuskegee (Tuskegee University)[5]’, ‘Alaska[edit]’, ‘Fairbanks (University of Alaska Fairbanks)[2]’, ‘Arizona[edit]’, ‘Flagstaff (Northern Arizona […]

¿Puedo encontrar un elemento usando expresiones regulares con Python y Selenium?

Necesito hacer clic en una lista desplegable y hacer clic en un elemento oculto con ella. el html será generado por javascript y no sabré el id o el nombre de la clase pero sabré que tendrá una frase en él. ¿Puedo encontrar un elemento por expresiones regulares y luego hacer clic en él con […]

expresión regular para ipaddress y mac address

¿Alguien puede sugerirme la expresión regular para la dirección IP y la dirección MAC? estoy usando python y django por ejemplo, http: // [ipaddress] /SaveData/127.0.0.1/00-0C-F1-56-98-AD/ Para la dirección de Mac intenté seguir pero no funcionó ([0-9A-F]{2}[:-]){5}([0-9A-F]{2}) ^([0-9A-F]{2}[:-]){5}([0-9A-F]{2})$

Cuándo usar re.compile

Tenga paciencia conmigo, no puedo incluir mi progtwig de más de 1,000 líneas, y hay un par de preguntas en la descripción. Así que tengo un par de tipos de patrones que estoy buscando: #literally just a regular word re.search(“Word”, arg) #Varying complex pattern re.search(“[0-9]{2,6}-[0-9]{2}-[0-9]{1}”, arg) #Words with varying cases and the possibility of ending […]

Expresión regular de Python para que coincida con las secuencias de escape VT100

Estoy escribiendo un progtwig Python que registra la interacción del terminal (similar al progtwig de script ), y me gustaría filtrar las secuencias de escape VT100 antes de escribir en el disco. Me gustaría usar una función como esta: def strip_escapes(buf): escape_regex = re.compile(???) # <— this is what I'm looking for return escape_regex.sub('', buf) […]

Expresión regular para eliminar saltos de línea.

Soy un completo novato en Python, y estoy atascado con un problema de expresiones regulares. Estoy tratando de eliminar el carácter de salto de línea al final de cada línea en un archivo de texto, pero solo si sigue una letra minúscula, es decir, [az] . Si el final de la línea termina en minúscula, […]