Articles of split

dividir un archivo fasta y cambiar el nombre en base a la primera línea

Tengo un archivo enorme con el siguiente contenido: nombre de archivo: input.txt >chr1 jdlfnhl dh,ndh dnh. dhjl >chr2 dhfl dhl dh;l >chr3 shgl sgl >chr2_random dgld Necesito dividir este archivo de tal manera que obtenga cuatro archivos separados de la siguiente manera: archivo 1: chr1.fa >chr1 jdlfnhl dh,ndh dnh. dhjl archivo 2: chr2.fa >chr2 dhfl […]

Divide cadena por salto de línea o período con expresiones regulares de Python

Tengo una cadena: “””Hello. It’s good to meet you. My name is Bob.””” Estoy tratando de encontrar la mejor manera de dividir esto en una lista dividida por puntos y saltos de línea: [“Hello”, “It’s good to meet you”, “My name is Bob”] Estoy bastante seguro de que debería usar expresiones regulares, pero, como no […]

Cómo dividir la línea en un carácter ASCII no imprimible en Python

¿Cómo puedo dividir una línea en Python en un carácter ASCII no imprimible (como el signo de menos largo hexadecimal 0x97, Octal 227)? No necesitaré al personaje en sí. La información después se guardará como una variable.

Obtenga información de la última línea de una instrucción if else dentro de un bucle for de Python

No creo que esto sea posible, pero pensé que preguntaría por si acaso. Así que estoy tratando de escribir un progtwig de python con eficiencia de memoria para analizar archivos que normalmente tienen más de 100 conciertos. Lo que estoy tratando de hacer es usar un bucle for para leer en una línea, dividir en […]

¿Cómo dividir un archivo XML de forma simple en Python?

Tengo un código Python para analizar un archivo XML como se detalla aquí . Entiendo que los archivos XML son conocidos por acaparar recursos del sistema cuando se manipulan en la memoria. Mi solución funciona para archivos XML más pequeños (por ejemplo, 200 KB y tengo un archivo de 340 MB). Comencé a investigar la […]

Python shlex.split (), ignora las comillas simples

¿Cómo, en Python, puedo usar shlex.split() o similar para dividir cadenas, conservando solo comillas dobles? Por ejemplo, si la entrada es “hello, world” is what ‘i say’ entonces la salida sería [“hello, world”, “is”, “what”, “‘i”, “say'”] .

expresiones regulares u otra forma de obtener datos de una línea con entrada variable

en python, estoy tratando de obtener datos de una línea. Las líneas parecen: 1. cpasite=5 nsubl=4 cpatypes=3,4,5,6 2. cpasite=6 nsubl=2 cpatypes=7,8 3. cpasite=7 nsubl=4 cpatypes=9,10 4. cpasite=8 nsubl=2 cpatypes=11,12 5. cpasite=9 nsubl=6 cpatypes=13,14,15,16,17,18 Lo he expresado de la siguiente manera: pattern=r'(\d+)\. \s* cpasite=(.*)\s* nsubl=(.*)\s* cpatypes=(.*)’ El problema es que necesito esos sitios (por ejemplo, 3,4,5,6) […]

Divida una columna de pandas en dos según un delimitador que puede no existir en todos los valores

Una de las columnas de mi dataframe se ve algo como esto: [application] blah/3.14 xyz/5.2 abc … … (representando software / versión) Estoy tratando de lograr algo como esto: [application] [name] [ver] blah/3.14 blah 3.14 xyz/5.2 xyz 5.2 abc abc na <– this missing value can be filled in with a string too … … […]

pandas dividen la lista en columnas con expresiones regulares

Tengo una lista de cadenas: content 01/09/15, 10:07 – message1 01/09/15, 10:32 – message2 01/09/15, 10:44 – message3 Quiero un dataframe, como date message 01/09/15, 10:07 message1 01/09/15, 10:32 message2 01/09/15, 10:44 message3 Teniendo en cuenta el hecho de que todas mis cadenas en la lista comienzan en ese formato, solo puedo dividir por, pero […]

Cadena dividida en Python basada en expresiones regulares

¿Cuál es la mejor manera de dividir una cadena como “HELLO there HOW are YOU” en mayúsculas (en Python)? Así que terminaría con una matriz como: results = [‘HELLO there’, ‘HOW are’, ‘YOU’] EDITAR: Yo he tratado: p = re.compile(“\b[AZ]{2,}\b”) print p.split(page_text) Aunque no parece funcionar.