Articles of regex

Cadena regex dos desajustes Python

¿Cómo puedo ampliar el código a continuación para poder explorar todas las instancias en las que tengo 2 desajustes o menos entre mi subcadena y la cadena principal? SSQP : SSQP Cadena para coincidir con: SSPQQQQPSSSSQQQSSQPSPSQSSQPSSQPPSSSSQPSPSQSSQPSSSSQPSPSQSSQPSSSSQPSPSQ Aquí hay un ejemplo donde solo se incorpora una posible discrepancia: >>> s = ‘SSPQQQQPSSSSQQQSSQPSPSQSSQPSSQPPSSSSQPSPSQSSQPSSSSQPSPSQSSQPSSSSQPSPSQ’ >>> re.findall(r'(?=(SSQP|[AZ]SQP|S[AZ]QP|SS[AZ]P|SSQ[AZ]))’, s) [‘SSQQ’, […]

Utilice el método de cadena de Pandas ‘contiene’ en una serie que contiene listas de cadenas

Dada una serie de Pandas simple que contiene algunas cadenas que pueden constar de más de una oración: In: import pandas as pd s = pd.Series([‘This is a long text. It has multiple sentences.’,’Do you see? More than one sentence!’,’This one has only one sentence though.’]) Out: 0 This is a long text. It has […]

Dividir texto en oraciones

Deseo dividir el texto en oraciones. ¿Alguien puede ayudarme? También necesito manejar abreviaturas. Sin embargo, mi plan es reemplazar estos en una etapa anterior. Señor -> señor import re import unittest class Sentences: def __init__(self,text): self.sentences = tuple(re.split(“[.!?]\s”, text)) class TestSentences(unittest.TestCase): def testFullStop(self): self.assertEquals(Sentences(“XX”).sentences, (“X.”,”X.”)) def testQuestion(self): self.assertEquals(Sentences(“X? X?”).sentences, (“X?”,”X?”)) def testExclaimation(self): self.assertEquals(Sentences(“X! X!”).sentences, (“X!”,”X!”)) […]

Detecta las URL en una cadena y envuélvelas con la etiqueta “<a href …"

Estoy buscando escribir algo que parece que debería ser lo suficientemente fácil, pero por alguna razón me cuesta mucho entenderlo. Estoy buscando escribir una función de python que, cuando se pasa una cadena, pasará esa cadena de nuevo con encoding HTML en torno a las URL. unencoded_string = “This is a link – http://google.com” def […]

Separe el nombre de la calle del número de la calle

Estoy tratando de separar los nombres de las calles de los números de las calles que tienen estos patrones: “calle 12” — nombre: calle, número: 12 “street12” — nombre: street, número: 12 “calle 12a” — nombre: calle, número: 12a “street12a” — nombre: calle, número: 12a ¿Cuál es la expresión regular para obtener el nombre de […]

Estoy usando expresiones regulares de Python de una manera criminal ineficiente

Mi objective aquí es crear un lenguaje de plantilla muy simple. En este momento, estoy trabajando para reemplazar una variable con un valor como este: Esta entrada: La web Debe producir esta salida: La Web Esta es una variable de prueba Lo tengo funcionando. Pero mirando mi código, estoy ejecutando varias expresiones regulares idénticas en […]

Mirada negativa hacia adelante.

Me gustaría hacer una expresión regular para hacer coincidir una secuencia de bytes cuando la cadena ’02 d0 ‘no se produce en una posición específica en la cadena. La posición en la que no puede aparecer esta cadena de dos bytes son las posiciones de los bytes 6 y 7 que comienzan con el byth […]

Expresiones regulares de Python, busque el dominio de correo electrónico en la dirección

Sé que soy un idiota, pero no puedo sacar el dominio de esta dirección de correo electrónico: ‘blahblah@gmail.com’ Mi salida deseada: ‘@gmail.com’ Mi salida actual: . (es solo un caracter de periodo) Aquí está mi código: import re test_string = ‘blahblah@gmail.com’ domain = re.search(‘@*?\.’, test_string) print domain.group() Esto es lo que creo que dice mi […]

Uso de expresiones regulares para reemplazar datos de archivos

Con un poco de ayuda de aquí , tengo esto funcionando casi exactamente de la manera que quiero. Ahora necesito poder agregar la capacidad de eliminar datos de un archivo antes de que se comparen los archivos . La razón de esto es que las cadenas, “datos”, que estoy eliminando se diferencian cada vez que […]

¿Cómo compruebo si una cadena solo contiene caracteres alfanuméricos y guiones?

La cadena que estoy probando puede coincidir con [\w-]+ . ¿Puedo probar si una cadena se ajusta a esto en Python, en lugar de tener una lista de los caracteres no permitidos y probar eso?