![Page 1: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/1.jpg)
Polimorfismos de nucleotídeos únicos em
espécies poliplóides
Ramon Oliveira VidalEmail: [email protected]
Doutorando em Genética e Biologia MolecularSub área: Bioinformática
Orientador: Gonçalo A.G. Pereira
LGE
- L
abor
atór
io d
e G
enôm
ica
e E
xpre
ssão
@ramonvidal
![Page 2: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/2.jpg)
Marcadores Moleculares◦ Marcadores por Hibridação◦ Marcadores por Amplificação
Polimorfismos X mutações SNPs
◦ Origem◦ Aplicações◦ Haplótipos◦ Genotipagem◦ Identificando os SNPs (em genomas e transcriptomas)
Sanger 454 Solexa
Taxa de evolução Identificação de SNPs em Coffea arabica
Tópicos da Apresentação
![Page 3: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/3.jpg)
Fenótipo Propriedades observáveis de um indivíduo, que
se desenvolveram sob a influência de: genótipo do indivíduo fatores ambientais
Fenótipo e Genótipo
Genótipo Constituição genética de um organismo
como revelada pela análise genética e molecular, ou seja, o conjunto completo de genes, tanto dominantes e recessivos.
![Page 4: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/4.jpg)
Qualquer característica morfológica ou molecular que diferencia indivíduos, e que seja facilmente detectável
Marcadores
![Page 5: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/5.jpg)
É um fenótipo de fácil identificação, normalmente determinado por um único alelo.
Características fenotípicas de fácil identificação visual são utilizadas como marcadores morfológicos desde os tempos de Mendel
Marcadores Morfológicos
![Page 6: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/6.jpg)
Polimorfismo detectado na seqüência de DNA
Vantagens:
- Não é objeto de influências ambientais;
- Praticamente ilimitado em número;
Maior desvantagem é a necessidade de técnicas e
equipamentos mais complexos.
Marcadores de DNA (moleculares)
![Page 7: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/7.jpg)
Reprodutibilidade; Amplamente distribuído através do genoma;
Poder de discriminação; Ausência de influências ambientais; Barato; Fácil de mensurar
Características Desejáveis aos marcadores moleculares
![Page 8: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/8.jpg)
Diplóide: Constituído por duas cópias (homólogos) de cada cromossomo.
Alelo: As formas alternativas de um caráter genético encontrado em um determinado locus de um cromossomo.
Homozigotos: Um organismo diplóide com alelos idênticos de um determinado gene em ambos os cromossomos homólogos.
Heterozigotos :Um organismo diplóide com alelos diferentes de um determinado gene em ambos os cromossomos homólogos.
Alguns conceitos básicos
![Page 9: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/9.jpg)
Diplóide
Haplóide
Alelos
homozigoze
heterozigoze
![Page 10: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/10.jpg)
Hibridação◦ RFLP – (Restriction Fragment Length
Polymorphism)◦ Minissatélites – VNTR –(Variable Number of
Tandem Repeats)
Amplificação de DNA◦ RAPD – (Random Amplified Polymorphic DNA)◦ SCAR (Sequence Characterized Amplified Regions)
ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)
Tipos de marcadores
![Page 11: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/11.jpg)
RFLP – Restriction Fragment Length Polymorphism
![Page 12: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/12.jpg)
RFLP – Restriction Fragment Length Polymorphism
![Page 13: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/13.jpg)
RAPD - Random Amplified Polymorphic DNA
Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do
primer.• Surgimento de um novo
sítio.• Ao comprimento da
região amplificada entre sítios de primer
![Page 14: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/14.jpg)
Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.
Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente
Microssatélites – SSR (Simple Sequence Repeats)
![Page 15: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/15.jpg)
Primers específicos (20 a 30 pb).
Diferentes números de elementos simples repetidos.
Cada segmento amplificado de tamanho diferente representa um alelo diferente do mesmo loco
Microssatélites – SSR (Simple Sequence Repeats)
![Page 16: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/16.jpg)
Genótipos na eletroforese
![Page 17: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/17.jpg)
Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de
DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a
alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie
Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou
populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e
recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou
cabelos crespo◦ Resultado de processos naturais ou induzidos por agentes
externos (como vírus ou radiação).
Polimorfismos genéticos X Mutações genéticas
![Page 18: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/18.jpg)
Polimorfismos genéticos X Mutações genéticas
Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%
C T T A G C T T
C T T A G T T T
Polimorfismo
C T T A G C T T
C T T A G T T T
Mutação
94%
6%
99.9%
0.1%
![Page 19: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/19.jpg)
TAAAAAT
TAACAAT
TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT
TAAAAAT TAACAAT
TAAAAAT
• Polimorfismos foram mutações que se propagaram ao longo de gerações
Polimorfismos genéticos X Mutações genéticas
![Page 20: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/20.jpg)
Single Nucleotide Polymorphism, ou SNP ("snip"):
◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.
SNPs
![Page 21: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/21.jpg)
SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs
SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.
Single Nucleotide Polymorphism
![Page 22: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/22.jpg)
SNPs em menor quantidade em genes do que em regiões não-
codificantes
Menor quantidade de SNPs nos cromossomos sexuais (humano).
Dentro de um único cromossomo, SNPs podem se concentrar em
uma região específica, geralmente implicando uma região de
interesse ou de pesquisa.
Em média, ocorrem a cada 300~600 nucleotídeos (humano).
Genes com maior pressão para modificação tem maior frequência
de SNP (resistência, adaptação, interação parasita-hospedeiro,
etc)
Distribuição dos SNPs
![Page 23: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/23.jpg)
Intra espécie◦Diversidade entre os indivíduos de uma
mesma espécie◦Reflete os SNPs entre os alelos (espécies
diplóides) Inter espécies
◦Diversidade entre espécies diferentes
SNPs intra/inter específicos
![Page 24: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/24.jpg)
Não-codificantes Codificantes
Sinônimas Não-sinônimas
conservativas Não-conservativas
Classificação dos SNPTransições
Purina<->PurinaPirimidina<->Pirimidina
TransversõesPurina<->Pirimidina
![Page 25: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/25.jpg)
Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.
Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que
apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados
juntos.◦ Podem servir como marcadores de doença
genética. ◦ A análise de haplótipos é útil na identificação
de eventos de recombinação.
![Page 26: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/26.jpg)
Blocos de haplótipos Dentro de um bloco haplótipo, acontece
pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são
passados juntos nas gerações futuras
![Page 27: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/27.jpg)
haplótipos Um haplótipo é um conjunto de SNP no
mesmo cromossomo
SNP1 SNP2 SNP3
-A C T T A G C T T-
-A A T T T G C T C-
-A C T T T G C T C-
Haplotype 2
Haplotype 3
C A T
A T C
C T CHaplotype 1
SNP1 SNP2 SNP3
![Page 28: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/28.jpg)
Zonas de recombinação e Blocos de haplótipos
Recombinationhotspots
Chromosome
Haplotypeblocks
C1 C2 C1S1
S2
S3
S4
S5
S1
S2
S3
S4
S5
SNP loci
Haplotype patterns : Major allele
: Minor allele
SNP loci
C2
I1 I2
![Page 29: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/29.jpg)
SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a
diversidade de fenótipos. Um SNP individual ou um bloco haplótipo
pode servir de indicação para◦ características agronômicas◦ doenças◦ etc
Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.
Blocos de Haplótipos
![Page 30: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/30.jpg)
O genoma de cada indivíduo contém distintos padrões de SNPs
Pessoas podem ser agrupadas de acordo com esse perfil
Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de
SNPs e respostas específicas a tratamentos
Genotipagem e utilizando SNPs como marcadores
![Page 31: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/31.jpg)
Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...
Alinhamento de sequências Identificação de Discrepâncias
Identificação de SNPs através da análise de sequencias
![Page 32: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/32.jpg)
Encontrando SNPs: Mineração de SNPs baseados no sequenciamento
(Sanger tradicional)
Sequenciamento De DNA
mRNA
cDNALibrary
ESTOverlap
Genomic
BACLibrary
RRSLibrary
BACOverlap
ShotgunOverlap
![Page 33: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/33.jpg)
Fragment DNA
DNA from multiple individuals
Sequence and Reassemble (known sequence) Assembly with other overlapping
GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC
mismatches = SNPs
Encontrando SNPs: Mineração de SNPs baseados no sequenciamento
![Page 34: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/34.jpg)
Base-calling Contig assembly
Sequence viewing
Polymorphism tagging
Relatório de polimorfismos
Genotipagem individual
Polymorphism detection
PolyPhred
Consed
Analysis
Sequenciamento Phred PhrapAmplificação do DNA5’ 3’
Vários indivíduos
![Page 35: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/35.jpg)
SNP Discovery - Sanger sequencing (EST)
![Page 36: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/36.jpg)
SNP Discovery - Diploids (heterozygous loci)
![Page 37: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/37.jpg)
Sequenciamentos de Nova geração para a
identificação de SNPs
![Page 38: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/38.jpg)
Método Sanger foi o único utilizado por 30 anos
Sanger processa em paralelo 96 sequencias enquanto NGS processa milhões de sequencias a um custo 6X menor.
Problemas:◦ Fidelidade dos dados◦ Tamanho dos reads◦ Custo da infraestrutura◦ Manipular grandes volumes de dados
Sanger vs NGS
![Page 39: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/39.jpg)
Problemas do tamanho da sequência
Sequencias curtas não mapeiam unicamente em um lugar no genoma.
Solução #1: Reads longos. Solução #2: Reads pareados.
ACTTAAGGCTGACTAGC TCGTACCGATATGCTG
![Page 40: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/40.jpg)
Sequenciamentos de Nova Geração
![Page 41: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/41.jpg)
![Page 42: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/42.jpg)
Necessário ter uma montagem de referência
Mapeamento dos reads na referencia
Coberturas médias necessárias:
◦ Solexa - 100X, 454 - 10X
Análise estatística para validar discrepâncias com base na
redundância dos dados
Muitos Softwares disponíveis
Desenvolvimento de algorítmos para aumentar velocidade
de processamento
Ferramentas para descoberta de SNPs em reads curtos
![Page 43: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/43.jpg)
http://seqanswers.com/wiki/Special:BrowseData
![Page 44: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/44.jpg)
SNP Discovery: Goal
sequencing errors SNP
![Page 45: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/45.jpg)
![Page 46: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/46.jpg)
![Page 47: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/47.jpg)
SNP Discovery
AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA
strain 1
strain 2
strain 3
haploid
individual 1
individual 3
individual 2
diploid
AACGTTCGCATAAACGTTCGCATA
AACGTTAGCATAAACGTTAGCATAAACGTTAGCATA
AACGTTAGCATAAACGTTAGCATAAACGTTCGCATAAACGTTCGCATA
AACGTTCGCATAAACGTTCGCATAAACGTTCGCATAAACGTTCGCATA
AACGTTAGCATAAACGTTAGCATA
![Page 48: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/48.jpg)
Para inferir uma taxa de evolução a um gene são estimados o KA e o KS
KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos
KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos
Taxa de Evolução – kaks ou dn/ds
![Page 49: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/49.jpg)
Exemplo:
Prolina:◦CCT◦CCA◦CCG◦CCC
Um sítio sinônimo e dois não sinônimos
![Page 50: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/50.jpg)
A taxa KA/KS é uma medida clássica da evolução de
maneira global num gene
KA/KS << 1 indica que uma substancial proporção de
mudanças de aminoácidos devem ter sido eliminadas
por seleção de purificação.
KA/KS > 1 indica seleção adaptativa ou positiva
KA/KS (dn/ds)
![Page 51: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/51.jpg)
NG: Nei, M. and Gojobori, T. (1986) - Faster LWL: Li, W.H., et al. (1985) LPB: Li, W.H. (1993) and Pamilo, P. and
Bianchi, N.O. (1993) MLWL (Modified LWL), MLPB (Modified LPB):
Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)
KaKs_calculator - Métodos
![Page 52: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/52.jpg)
A taxa de KAKS em humanos e chimpanzes é de 0,23.
Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior
![Page 53: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/53.jpg)
Identificação de SNPs e haplótipos na poliplóide Coffea
arábica
![Page 54: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/54.jpg)
Objetivos principais Identificar e caracterizar SNPs em
sequências de EST Identificar os haplótipos com base nos
padrões de SNPs Identificar kaks
Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora
![Page 55: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/55.jpg)
Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima
equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do
que Coffea arabica, em particular a doenças e pragas.
![Page 56: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/56.jpg)
Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente
(1mya) entre Coffea eugenoides e Coffea canephora
Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.
Qualidade da bebida excelente.
![Page 57: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/57.jpg)
Poliploidia
![Page 58: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/58.jpg)
Softwares
CAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL
![Page 59: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/59.jpg)
A montagem
95% similaridade por 100bp◦Previnir agrupamento de parálogos
Remover clusters com menos de 4 ESTs
Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados
![Page 60: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/60.jpg)
QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs
◦ Filtros◦ Reconstrução de haplótipos
Detecção de polimorfismos sinônimos e não sinônimos com o FASTY
Construir Banco de dados com os dados gerados.
![Page 61: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/61.jpg)
Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra
alélicos Cada alelo é representado com mais de
uma sequencia. ◦ Excluindo SNPs singlets
Classificação dos SNPs como intra ou inter espécies
![Page 62: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/62.jpg)
Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um
mesmo alelo Tem os mesmos nucleotídeos nos sítios
polimorficos. Utiliza métodos matemáticos para
minimizar falsas reconstruções de haplótipos
Exclui haplótipos formados por apenas uma sequencia
![Page 63: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/63.jpg)
Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do
SNP em cada alelo com relação às regiões de alta e baixa qualidade
O score de confiabilidade é o menor valor Descartados valores abaixo de 2
![Page 64: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/64.jpg)
![Page 65: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/65.jpg)
![Page 66: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/66.jpg)
Identificação de SNPs não-sinônimos Fasty
◦ Produz menores alinhamentos em sequencias de baixa qualidade
Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs
em regiões UTR Kaks Calculator
![Page 67: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/67.jpg)
The database
![Page 68: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/68.jpg)
Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos
homeologos Contribuição de cada ancestral de arabica
no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para
mudança Genes com maior pressão seletiva para
estabilização Artigo submetido e em revisão
Resultados
![Page 69: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/69.jpg)
LGE - BioinformáticaGenômica, Transcriptômica, Biologia Sintética,
Biologia de Sistemashttp://www.lge.ibi.unicamp.br
![Page 70: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/70.jpg)
Projetos
![Page 71: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/71.jpg)
Projetos
![Page 72: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/72.jpg)
Projetos
![Page 73: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/73.jpg)
Projetos
![Page 74: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/74.jpg)
Projetos
![Page 75: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/75.jpg)
Projetos
![Page 76: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/76.jpg)
Projetos
![Page 77: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/77.jpg)
Projetos
![Page 78: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/78.jpg)
Projetos
![Page 79: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/79.jpg)
Projetos
![Page 80: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/80.jpg)
O LGE
![Page 81: Ramon Oliveira Vidal Email: ramon.vidal@gmail.comramon.vidal@gmail.com Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador:](https://reader035.vdocuments.pub/reader035/viewer/2022062219/552fc12e497959413d8d3985/html5/thumbnails/81.jpg)