Articles of expresiones regulares de

Transforma una cadena separada por comas en una lista pero ignora las comillas entre comillas

¿Cómo convierto “1,,2’3,4′” en una lista? Las comas separan los elementos individuales, a menos que estén entre comillas. En ese caso, la coma se incluirá en el elemento. Este es el resultado deseado: [‘1’, ”, ‘2’, ‘3,4’] . Una expresión regular que encontré en otro hilo para ignorar las citas es la siguiente: re.compile(r”'((?:[^,”‘]|”[^”]*”|'[^’]*’)+)”’) Pero […]

Eliminar comentarios hash que no están dentro de comillas

Estoy usando python para revisar un archivo y eliminar cualquier comentario. Un comentario se define como un hash y cualquier cosa a la derecha, siempre que el hash no esté dentro de comillas dobles . Actualmente tengo una solución, pero parece subóptima: filelines = [] r = re.compile(‘(“.*?”)’) for line in f: m = r.split(line) […]

Python – Regex – Cómo encontrar una cadena entre dos conjuntos de cadenas

Considera lo siguiente: Foo1 Home Extract Sitemap ¿Cómo harías para eliminar la línea de sitemap con expresiones regulares en python ? Sitemap Se puede usar lo siguiente para sacar las tags de anclaje. ‘//i’ Sin embargo, hay múltiples tags de anclaje. ¿También hay varios hotlink (s), así que tampoco podemos usarlos?

Python – Reemplace el carácter no-ascii en la cadena (»)

Necesito reemplazar en una cadena el carácter “» “con un espacio en blanco, pero sigo recibiendo un error. Este es el código que uso: # -*- coding: utf-8 -*- from bs4 import BeautifulSoup # other code soup = BeautifulSoup(data, ‘lxml’) mystring = soup.find(‘a’).text.replace(‘ »’,”) UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter u ‘\ […]

Expresión regular de Python: ¿por qué esto no funciona?

Esto no me da ni un error ni una respuesta. re.sub(‘\\.(\\W|\\.)*[o0](\\W|[o0])*’, ‘*’, ‘……………………………………’) ¿Por qué se comporta así? Además, si reduzco la cantidad de “períodos”, entonces funciona. Gracias.

Edición de elementos en una lista en python

¿Cómo elimino un carácter de un elemento en una lista? Ejemplo: mylist = [’12:01′, ’12:02′] Quiero eliminar los dos puntos de las marcas de tiempo en un archivo, por lo que puedo convertirlos más fácilmente en un tiempo de 24 horas. Ahora mismo estoy tratando de recorrer los elementos de la lista y buscar el […]

Encontrar palabras después de la palabra clave en python

Quiero encontrar las palabras que aparecen después de una palabra clave (especificadas y buscadas por mí) e imprimir el resultado. Sé que debo usar Regex para hacerlo, y lo probé también, así: import re s = “hi my name is ryan, and i am new to python and would like to learn more” m = […]

Extraer patrones de acrónimos de cadena usando expresiones regulares

Tengo este problema: list_= [“blabla SPA words JR words. , words”,”words words !! words srl words. DT words”,”words words IBM words words.”] Me gustaría tener: [‘SPA’, ‘J.R’] [‘srl’, ‘DT’] [‘IBM’] Encontré esta increíble solución Buscando acrónimos usando Regex en Python que devuelve: [‘SP’, ‘J.’] [‘sr’, ‘DT’] [‘IBM’] ¿Cómo puedo usar esa solución en mi situación? […]

Eliminar puntos al final de las oraciones en python

Tengo oraciones como esta: “esto es una prueba. 4.55 y 5.000”. Quiero eliminar el punto al final de las oraciones, pero no entre números. Mi salida debe ser: “esta es una prueba 4.55 y 5.000”. Probé las siguientes opciones, pero no obtuve la salida requerida: wordList = “this is a test. 4.55 and 5,000.” pattern3 […]

extracción de grados de temperatura (celcius o fahrenheit) de la cuerda

Estoy usando (char.*?char2) para extraer subpartes que comienzan con char1 y que terminan con char2 desde una cadena. Ahora quiero extraer información de temperatura, por ejemplo (40 ° C, -30 ° C, 80 ° F) de una cuerda. En este caso, mi expresión regular debe definir el carácter inicial con cualquier carácter de dígito teniendo […]