aula teórica de transcritômica
TRANSCRIPT
Aula Biologia Molecular Computacional
Transcritômica
Julio Sosa - Lucas Silva
03/09/2015
..um pouco de história..
Sequenciamento Maxam-Gilbert (1976-77)
Matthews & van Holde. Bioquímica 2da ed. 1998
Sequenciamento Sanger (1977)
Next-Generation Sequencing Platforms. Elaine R. Mardis (2013)
..sempre da para melhorar..
Ventagens:
- Não há necessidade de radioatividade - Um câmera no final do gel monitora as sequências- Quatro reações numa “lane”
Novas tecnologías..
Novas tecnologías (omics)
R.Q. Wu et al. J DENT RES 2010;90:561-572
O transcriptoma é o conjunto completo de transcritos (RNAs) de uma célula, e as respectivas quantidades.
Porque é importante compreender o transcriptoma ?
● Interpretar os elementos funcionais do genoma
● Revelar os constituintes moleculares de células e tecidos nos diferentes estágios de desenvolvimento
● Compreender os elementos presentes no desenvolvimento de doenças.
..o que é Transcritoma..?
http://www.nature.com/nmeth/journal/v6/n11s/full/nmeth.f.268.html
● Métodos baseados em Hidridização (Microarrays)
..métodos de estudo..
● Métodos baseados em sequenciamento tradicional (Sanger)
● Métodos baseados em sequenciamento de nova geração (Next Generation Sequencing): RNA-Seq
..métodos de estudo..
● Métodos baseados em sequenciamento tradicional (Sanger)
● Métodos baseados em sequenciamento de nova geração (Next Generation Sequencing): RNA-Seq
..métodos de estudo..
GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)
Diferentes tecnologias (NGS)
GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)
GS FLX 454 HiSeq 2500 5500xl SOLiD(ROCHE) (ILLUMINA) (ABI)
Ion TORRENT Pacific Biosciences Oxford Nanopore
Diferentes tecnologias (NGS)
Sequenciamento NGS.. em maior detalhe
Secuenciamiento NGS.. en mayor detalle
Secuenciamiento NGS.. en mayor detalle
Secuenciamiento NGS.. en mayor detalle
Secuenciamiento NGS.. en mayor detalle
Illumina
454 (ROCHE)
NGS no mundohttp://omicsmaps.com/
Genômica na era NGS
Genome Research Limited
Ventagens:
- Construção librarias para sequenciamento
* Sem clonagem in vivo, transformação, etc
Ventagens:
- Construção livrarias para sequenciamento
* Sem clonagem in vivo, transformação, etc
- Sequenciamento “array-based”
* Maior grado de paralelismo que sequenciamento basado em capilaridade
• de novo sequencing• Whole genome re-sequencing• Targeted sequencing• Population genomics• Diagnostics• Cancer genomics• Ancient genomes• Metagenomics• RNA sequencing• Chip-seq• Genomic Epidemiology• anything with DNA
Aplicações
..novas tecnologias..
..novas tecnologias.. novos desafios..!
Image courtesy of Lincoln Stein
..novas tecnologias.. novos desafios..!
(Pennisi, Science 2011)
..novas tecnologias.. novos desafios..!
..novas tecnologias.. novos desafios..!
..dos desafios.. nace uma nova area.. a Bioinformática
Pipeline geralControle qualidade Montagem
de novoCom referência
Sequenciamento
de novoCon referencia
Haas and Zody, 2010 Nature Biotechnology 25, 421-423
Pipeline geralControle qualidade Montagem
de novoCom referência
Sequenciamento
de novoCon referencia
Pipeline geralControle qualidade Montagem
Sequenciamento
de novoCon referencia
Nossa referência!!
Pipeline geralControle qualidade Montagem
Sequenciamento
Pipeline geralControle qualidade Montagem
de novoCom referência
Sequenciamento
..quais são suas aplicações..?
Pipeline geralControle qualidade Montagem
de novoCom referência
Sequenciamento
- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico
RNA
Pipeline generalControl calidad Montaje
de novo Con referencia
- Identificação SNPs- CNVs- Indels
Secuenciamiento
DNA
- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico
RNA
Pipeline generalControl calidad Montaje
de novo Con referencia
- Identificação SNPs- CNVs- Indels
Secuenciamiento
DNA RB1 ZFP57
SMAD4 TP53 BRCA1
- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico
RNA
Pipeline generalControl calidad Montaje
de novo Con referencia
- Identificação SNPs- CNVs- Indels
Secuenciamiento
DNA RB1 ZFP57
SMAD4 TP53 BRCA1
- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico
RNA
Pipeline generalControl calidad Montaje
de novo Con referencia
- Identificação SNPs- CNVs- Indels
Secuenciamiento
DNA RB1 ZFP57
SMAD4 TP53 BRCA1
Biomarcadores molecularesDiagnósticoTerapia!!!
- Identificação sitios splicing- Anotação ncRNAs- Análise expressão diferencial- Enriquecimiento gênico
RNA
Pipeline generalControl calidad Montaje
de novo Con referencia
- Identificação SNPs- CNVs- Indels
Secuenciamiento
DNABiomarcadores molecularesDiagnósticoTerapia!!!
BIOINFORMÁTICA
RNA-SEQ Workflow.. ¿cadê a bioinformática?
..desde as sequências..
..como vem as sequências..?Formato FASTQ
Controle qualidade
Controle qualidade
Como encontrar genes diferencialmente expressos?
BWT-Burrows-Wheler Transform
-ORDENAÇÃO-APENAS 2X MAIS MEMÓRIA
Mapping
•Bowtie or Maq mapping identify transcribed known or novel exons•Longer (e,g. 100bp)paired-end libraries are better
Estrutura dos genes
CHR1.FASTA
Onde é o início do gene mesmo?
E o gene? Onde está?
GENE TRANSFER FORMAT (GTF)
Um gene no triste mundo real!
Montando genes utilizando dados de transcriptoma
cufflinks
pont
os in
tere
ssan
tes
Checando genes diferencialmente expressosTratamento gene A 10 FPKMControle gene A 1 FPKM
log2(tratamento/controle)
10 vezes maior! log2 = 3.32
UP
DOWN
Método simples! retirar valores que cruzam um cut-off X
Assumindo que o experimento de rna-seq segue uma normal. A probabilidade de uma medida divergir em mais que um desvio padrão é de mais de 68%! Isso em um caso IDEAL( ou um Chinês pipetando)
Distribuicao de poisson para "pobres" mortais
Poisson (média e desvio simétricos)
Variação em duas replicatas
microarray!
DEseq2 (ajustando variáveis (m, s) )
genesdiferencialmenteexpressos
Antes eu tinha um gene! E agora tenho 1000….
Busca por motivos