Miguel Ángel Gutierrez Medina Osvaldas Vainauskas Javier Ferrer Gómez
Implementación de un método de análisis de un grupo de proteínas similares a una dada, usando delta-blast como herramienta para identificación de similitudes. El objetivo es sugerir anotaciones GO y rutas KEGG a partir de las asociadas de proteínas similares. Solo se podrán sugerir resultados soportados por un porcentaje de identidad mínimo y un grado de apoyo mínimo. Ambos valores serán especificados por el usuario en tiempo de ejecución. Un apoyo 10 significa que al menos 10 secuencias deben tener esa anotación GO o la ruta KEGG asociada.
usage: find_annotations.py [-h] [-f FILE] [protein] min_identity min_support
Find similar proteins using Delta Blast and suggests GO annotations and KEGG
routes associated to them.
positional arguments:
protein Protein to analyze
min_identity Minimum identity score to consider (Default: 75)
min_support Minimum support degree to consider (amount of
sequences sharing an annotation (Default: 10)
optional arguments:
-h, --help show this help message and exit
-f FILE, --file FILE Specify dblast output file with list of similar
proteins
- Realiza un Delta Blast o lee un archivo de resultado de Delta Blast.
- Busca las IDs en UniProt
- Extrae los términos GO
- Extrae las KEGG Ids
- Busca las Ids KEGG en la base de datos KEGG
- Recupera los Pathways KEGG
- Dibuja un diagrama con los términos GO y KEGG
Requiere pipenv
.
pip install pipenv
Después de clonar el repo, ir al directorio raíz y ejecutar: pipenv install
para crear el entorno e instalar todas las dependencias.