Articles of bioinformatics

Biopython: ¿Cómo evitar secuencias de aminoácidos particulares de una proteína para trazar el gráfico de Ramachandran?

He escrito una secuencia de comandos de python para trazar el ‘Diagtwig de Ramachandran’ de la proteína ubiquitina. Estoy usando biopython. Estoy trabajando con archivos pdb. Mi guión es el siguiente: import Bio.PDB import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt phi_psi = ([0,0]) phi_psi = np.array(phi_psi) pdb1 =’/home/devanandt/Documents/VMD/1UBQ.pdb’ for model […]

Pandas: .groupby (). Tamaño () y porcentajes

Tengo un DataFrame que se origina a partir de una df.groupby().size() , y se ve así: Localization RNA level cytoplasm 1 Non-expressed 7 2 Very low 13 3 Low 8 4 Medium 6 5 Moderate 8 6 High 2 7 Very high 6 cytoplasm & nucleus 1 Non-expressed 5 2 Very low 8 3 Low […]

¿Cómo puedo obtener nombres de rango taxonómico de taxid?

Esta pregunta está relacionada con: ¿Cómo obtener identificaciones taxonómicas específicas para el reino, phylum, clase, orden, familia, género y especie de taxid? La solución dada allí funciona pero me gustaría tener los nombres de cada ID taxonómico para los rangos definidos. He encontrado esto en ete3 que puede hacer el trabajo: names = ncbi.get_taxid_translator(lineage) print […]

Uso de expresiones regulares para transformar datos en un diccionario en Python

Tengo un conjunto de datos con secuenciación con formato FASTA , básicamente como esto: >pc284 ATCGCGACTCGAC >pc293 ACCCGACCTCAGC Quiero utilizar cada etiqueta como clave en el diccionario y almacenar el gen como un valor. Este es el código que tengo, pero realmente no está haciendo nada: import re fileData = open(‘d.fasta’, ‘r’) myDict = dict() […]

Rastreo en el algoritmo Smith-Wateman con penalización por brecha afín

Estoy intentando implementar el algoritmo de Smith-Waterman para la alineación de la secuencia local utilizando la función de penalización de espacio afín. Creo que entiendo cómo iniciar y calcular las matrices requeridas para calcular las puntuaciones de alineación, pero no tengo ni idea de cómo rastrear para encontrar la alineación. Para generar las 3 matrices […]

Filtrado de un archivo CSV en Python

He descargado este archivo csv , que crea una hoja de cálculo con información genética. Lo importante es que en las columnas HLA-* , hay información de genes. Si el gen tiene una resolución demasiado baja, p. Ej., DQB1*03 , la fila debería eliminarse. Si los datos son una resolución demasiado alta, por ejemplo, DQB1*03:02:01 […]