![Page 1: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/1.jpg)
DESARROLLO E IMPLEMENTACIÓN DE UNA PLATAFORMA BIOINFORMÁTICA
PARA ANÁLISIS RNA-SEQ BASADA EN GALAXY
Autores: Cristian Alejandro Rojas Luis Miguel Gutierrez
Dirigido por: M.Sc Nelson Enrique Vera
![Page 2: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/2.jpg)
Agenda❏ Introducción❏ Formulación del problema❏ Metodología❏ Resultados❏ Conclusiones❏ Trabajos futuros
![Page 3: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/3.jpg)
INTRODUCCIÓN
![Page 4: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/4.jpg)
Convenio IGUN-CECAD
![Page 5: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/5.jpg)
Artículos GeneradosIGUN
❏ The Transcriptome of the Caribbean Reef-building Coral Diploria strigosa Reveals a Highly Complex Immune Repertoire.
❏ THE TRANSCRIPTOME OF Hydractinia symbiolongicarpus REVEALS A COMPLEX IMMUNE SYSTEM.
U. Distrital❏ Automatic BLAST for Massive Sequencing - ABMS, Proceedings of the
2nd Colombian Congress on Computational Biology and Bioinformatics (CCBCOL).
❏ MAFA: A web based software to automate functional annotation of genomes and transcriptomes. Tecnura.
![Page 6: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/6.jpg)
Ponencias
❏ LACCEI 2013, Cancún-México, Automatic BLAST for Massive Sequencing - ABMS
❏ CCBCOL 2013, Manizales-Colombia, Presentation and Evaluation of ABMS (Automatic Blast for Massive Sequencing)
❏ IWBBIO 2014, Granada-España, Massive Automatic Functional Annotation MAFA
![Page 7: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/7.jpg)
FORMULACIÓN DEL PROBLEMA
![Page 8: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/8.jpg)
Evolución de la secuenciaciónMétodo de Sanger: Secuenciación por Dideoxinucleótidos
NGS - Next Generation Sequencing: High-throughput sequencing
Datos tomados de: http://www.the-scientist.com/?articles.view/articleNo/15939/title/DNA-Sequencing-Industry-Sets-its-Sights-on-the-Future/
U$2400 por1M bases
U$0.05 - U$0.15 Por 1M bases
Hasta 52.5 Kbases por corrida
Hasta 600 Gbases por corrida
![Page 9: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/9.jpg)
RNA-Seq
Aplicaciones clínicas y biomédicas.Facilitar estudio de otros organismos.
Datos tomados de: http://www.rna-seqblog.com/rna-seq-library-prep-introduction/
El RNA-Seq es un poderoso método de descubrimiento, perfilamiento y cuantificación de transcritos de ARN.
![Page 10: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/10.jpg)
Principales dificultades de un análisis RNA-Seq
![Page 11: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/11.jpg)
Principales dificultades de un análisis RNA-Seq
❏ Se requiere de computación de alto desempeño para su ejecución.
❏ Herramientas no amigables para el usuario.❏ Formatos de entrada y salida confusos para un
usuario final.❏ El usuario debe saber e integrar etapas del
proceso.
![Page 12: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/12.jpg)
Formulación del problema
¿Cómo diseñar y desarrollar una herramienta que integre, automatice y facilite el análisis de
de datos transcriptómicos?
![Page 13: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/13.jpg)
Justificación
Nuevas áreas de investigaciónFortalece estudio de mecanismos de respuesta inmune en varios organismos.
![Page 14: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/14.jpg)
Objetivo generalDesarrollar una plataforma bioinformática basada en Galaxy orientada al análisis de datos RNA-Seq de acuerdo a las necesidades del Grupo de Inmunología Evolutiva (GIE) del Instituto de Genética de la Universidad Nacional (IGUN), haciendo uso del Centro de Cómputo de Alto Desempeño de la Universidad Distrital (CECAD).
![Page 15: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/15.jpg)
Objetivos específicos❏ Estudiar los procesos que hacen parte de un análisis RNA-
Seq.❏ Diseñar un pipeline que automatice los procesos
normalmente usados en un análisis RNA-Seq.❏ Integrar herramientas bioinformáticas requeridas para
realizar un análisis RNA-Seq.❏ Desplegar en producción la plataforma desarrollada en un
servidor del CECAD para el público en general y así fortalecer la imagen de investigación de la Universidad Distrital.
![Page 16: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/16.jpg)
METODOLOGÍAEstudio de
requerimientos
Diseño de arquitectura y selección de herramientas
Implementación, configuración, personalización e integración de herramientas a la plataforma
Acondicionamiento de infraestructura
DocumentaciónEvaluación
Procesos necesarios para RNA-Seq y requerimientos de la plataforma
Listado de herramientas a integrar
Equipo con herramientas instaladas
Plataforma funcional
Documentación técnica y de usuario
Satisfacción de requerimientos y cuadro comparativo.
![Page 17: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/17.jpg)
Análisis de requerimientos❏ Reuniones con los investigadores del IGUN.❏ Se evidenciaron las siguientes necesidades principales:
❏ Soporte de todos los procesos de análisis transcriptómico.
❏ Interfaz de usuario amigable.❏ Contar con gestión de usuarios.
![Page 18: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/18.jpg)
Selección de herramientas❏ Búsqueda de herramientas bioinformáticas disponibles
para cada proceso. Revisión de bibliotecas digitales (Pubmed), journals y foros dedicados a bioinformática.
❏ Selección de herramientas por su aceptación en la comunidad científica.
❏ Búsqueda de plataforma base que permitiera la solución del problema formulado.
![Page 19: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/19.jpg)
RESULTADOS
![Page 20: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/20.jpg)
Flujo de trabajo
![Page 21: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/21.jpg)
Arquitectura general
![Page 22: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/22.jpg)
Módulo de preprocesamiento
![Page 23: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/23.jpg)
Módulo de preprocesamiento
![Page 24: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/24.jpg)
Módulo de mapeo
![Page 25: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/25.jpg)
Módulo de Mapeo
![Page 26: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/26.jpg)
Módulo de ensamblaje
![Page 27: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/27.jpg)
Módulo de ensamblaje
![Page 28: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/28.jpg)
Módulo de anotación
![Page 29: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/29.jpg)
Módulo de anotación
![Page 30: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/30.jpg)
Módulo de expresión diferencial
![Page 31: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/31.jpg)
Módulo de expresión diferencial
![Page 32: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/32.jpg)
Módulo de estimación de abundancia
![Page 33: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/33.jpg)
Módulo de estimación de abundancia
![Page 34: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/34.jpg)
Utilidades
● Samtools○ Organización, mezcla, indexación.
● CummeRbund○ Acceso, exploración, graficación.
● EMBOSS: Transeq○ Traduce secuencias a péptidos
![Page 36: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/36.jpg)
Trabajos futuros
● Escalabilidad horizontal○ Sistema distribuido
● Herramientas ○ Aprendizaje de máquina
![Page 37: Desarrollo e implentación de una plataforma bioinformática para el análisis RNA-Seq](https://reader033.vdocuments.pub/reader033/viewer/2022042617/5595a2931a28ab34748b45d1/html5/thumbnails/37.jpg)
Conclusiones● Se logró diseñar un pipeline que automatiza los procesos que hacen parte
de un análisis RNA-Seq, a partir del estudio de dichos procesos.
● Se desarrolló y puso en producción un software que Integra herramientas bioinformáticas requeridas para realizar un análisis RNA-Seq.
● Se encontraron posibles trabajos futuros para mejorar la eficiencia de la plataforma y ampliar el área de trabajo en bioinformática.