Articles of findall

Expresión regular de Python Findall *

No puedo entender el siguiente comportamiento del código. >>> import re >>> text = ‘been’ >>> r = re.compile(r’b(e)*’) >>> r.search(text).group() ‘bee’ #makes sense >>> r.findall(text) [‘e’] #makes no sense Leí algunas preguntas y respuestas ya existentes sobre la captura de grupos y todo. Pero todavía estoy confundido. ¿Podría alguien explicarme por favor?

¿Cómo me aseguro de que re.findall () se detenga en el lugar correcto?

Aquí está el código que tengo: a=’aaaaaa2aaa3′ import re re.findall(r'(.*)’, a) El resultado es: [(‘title’, ‘aaaaaa2aaa3’, ‘/title’)] Si alguna vez diseñé un rastreador para obtener títulos de sitios web, podría terminar con algo como esto en lugar de un título para el sitio web. Mi pregunta es, ¿cómo limito findall a un solo ?

Cómo extraer cadenas dentro de comillas simples usando el script de Python

Tener un conjunto de cadena de la siguiente manera text:u’MUC-EC-099_SC-Memory-01_TC-25′ text:u’MUC-EC-099_SC-Memory-01_TC-26′ text:u’MUC-EC-099_SC-Memory-01_TC-27′ Estos datos los he extraído de un archivo Xls y convertidos en string , ahora tengo que Extraer los datos que están dentro de comillas simples y ponerlos en una lista. esperando una salida como [MUC-EC-099_SC-Memory-01_TC-25, MUC-EC-099_SC-Memory-01_TC-26,MUC-EC-099_SC-Memory-01_TC-27] Gracias por adelantado.

Regex backreference findall no funciona

Recientemente he estado usando expresiones regulares en un progtwig. En este progtwig los utilicé para encontrar palabras en una lista de palabras que coincidían con un determinado RE. Sin embargo, cuando intenté hacer una referencia a este progtwig, obtuve un resultado interesante. Aquí está el código: import re pattern = re.compile(r”[abcgr]([az])\1[ldc]”) string = “reel reed […]

Límite de palabras con expresiones regulares: no se pueden extraer todas las palabras

Necesito extraer doble Male-Cat : a = “Male-Cat Male-Cat Male-Cat-Female” b = re.findall(r'(?:\s|^)Male-Cat(?:\s|$)’, a) print (b) [‘Male-Cat ‘] c = re.findall(r’\bMale-Cat\b’, a) print (c) [‘Male-Cat’, ‘Male-Cat’, ‘Male-Cat’] Necesito extraer los tiempos de los árboles Male-Cat : a = “Male-Cat Male-Cat Male-Cat” b = re.findall(r'(?:\s|^)Male-Cat(?:\s|$)’, a) print (b) [‘Male-Cat ‘, ‘ Male-Cat’] c = re.findall(r’\bMale-Cat\b’, a) […]

¿Por qué re.findall no es específico en la búsqueda de elementos de triplete en una cadena? Pitón

Así que tengo cuatro líneas de código seq= ‘ATGGAAGTTGGATGAAAGTGGAGGTAAAGAGAAGACGTTTGA’ OR_0 = re.findall(r’ATG(?:…){9,}?(?:TAA|TAG|TGA)’,seq) Déjame explicarte lo que estoy tratando de hacer primero. . . Lo siento si esto es confuso pero voy a hacer mi mejor esfuerzo para explicarlo. Así que estoy buscando secuencias que comiencen con ‘ATG’ seguido de unidades de 3 de cualquier palabra […]

Capturando grupos nombrados en expresiones regulares con re.findall

Cuando intentaba responder esta pregunta: regex para dividir% de edades y valores en python noté que tenía que reordenar los grupos del resultado de findall. Por ejemplo: data = “””34% passed 23% failed 46% deferred””” result = {key:value for value, key in re.findall(‘(\w+)%\s(\w+)’, data)} print(result) >>> {‘failed’: ’23’, ‘passed’: ’34’, ‘deferred’: ’46’} Aquí el resultado […]

Python – re.findall devuelve un resultado no deseado

re.findall(“(100|[0-9][0-9]|[0-9])%”, “89%”) Esto devuelve solo el resultado [89] y necesito devolver el total del 89%. ¿Alguna idea de cómo hacerlo por favor?

Beautiful Soup findAll no los encuentra a todos

Estoy tratando de analizar un sitio web y obtener información con BeautifulSoup.findAll pero no los encuentra todos .. Estoy usando python3 el código es este #!/usr/bin/python3 from bs4 import BeautifulSoup from urllib.request import urlopen page = urlopen (“http://mangafox.me/directory/”) # print (page.read ()) soup = BeautifulSoup (page.read ()) manga_img = soup.findAll (‘a’, {‘class’ : ‘manga_img’}, limit=None) […]

Módulo de Python ElementTree: Cómo ignorar el espacio de nombres de los archivos XML para ubicar el elemento coincidente cuando se usa el método “buscar”, “buscar todo”

Quiero usar el método de “findall” para localizar algunos elementos del archivo xml de origen en el módulo ElementTree. Sin embargo, el archivo xml de origen (test.xml) tiene espacio de nombres. Trunco ​​parte del archivo xml como muestra: Updates 9/26/2012 10:30:34 AM All Rights Reserved. newlicense.htm N El código de ejemplo de python está debajo: […]