seleção de modelos de substituição de nucleotídeos ii
Post on 02-Jul-2022
2 Views
Preview:
TRANSCRIPT
1
Seleção de modelos de substituição de nucleotídeos − II
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Objetivos: Compreender como escolher entre diferentes modelos de substituição que competem entre si para explicar os dados de sequências alinhadas.
2
Seleção de modelos de substituição II
1. Teste da razão das verossimilhanças
345
3
10.1 Modelos de evolução e reconstrução filogenética
Inferência estatística: processo pelo qual conclusões são tiradas de dados que estão sujeitos a variação aleatória, por exemplo, erros de observação ou erros de amostragem. 345
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
4
tij etp α4
41
41)( −−=t
ii etp α4
43
41)( −+=
Probabilidades de substituição no modelo de Jukes−Cantor
A G
TC
α
α
αα αα
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
5
A G
TC
α
α
ββ ββ
TGCA ππππ ===
A G
TC
α
α
αα αα
TGCA ππππ ===1 2 3 4
3451. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
6
10.2 Ajuste de modelos
3471. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
7
• Testes (hierárquicos) da razão das verossimilhanças [hLRT]
• Critério de informação
• Bayesiano
Enfoques para a seleção de modelos de evolução
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
),,,( ντθMDPL ∝347
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
Sequência 1 — A A T C G A G C C A T A G C G
Sequência 2 — A A C A G A C A C A G T C C G
Sequência n — A A C A G A C A C A G T C C G
M
Dados, amostra − alinhamento
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
A G
TC
Modelo de evolução
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
11
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
ãosubstituiç de taxas nas variaçãoosnucleotíde entre ãosubstituiç de taxas
osnucleotíde de sfrequênciaotransversã:transiçãorazão
θ
Vetor de parâmetros do modelo de evolução
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
12
1 2 3 4
Topologia da árvore
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
13
Vetor de comprimento dos ramos
1 2 3 4
ν1 ν2
ν3 ν4 ν5 ν6
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
iν
νν
νM2
1
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
14
10.3 Testes (hierárquicos) da razão das verossimilhanças [hLRT ]
3481. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
15
( ) ( )⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
−+⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
+= −−
434214434421ijii p
t
p
t eeL αα 44 1161ln731
161ln8ln
Função de verossimilhança
αt — número esperado de substituições por sítio
ln L
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
16
Estatística do teste da razão
das verossimilhanças
Λ− log201 loglog2 LL −
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
17
86,7675log 0 −=L
Peixe
Rã Humano
Pássaro
Rato
A G
TC
α
α
αα αα
TGCA ππππ ===
Peixe
Rã Humano
Pássaro
Rato
α
α
αα αα
A G
TC
TGCA ππππ ≠≠≠
08,7667log 1 −=L
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
18348
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
19348
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
20
• Estatística do teste da razão das
verossimilhanças, −2 log Λ, pode ser
comparada à distribuição χ2 com 3
graus de liberdade
−2 log Λ = 17,56 > valor crítico = 7,18
Hipótese alternativa explica os dados
significativamente melhor que a
hipótese nula
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
21
• Testes (hierárquicos) da razão das verossimilhanças [hLRT]
– Comparação de dois modelos
– Modelos hierárquicos
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
22
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II
23
10.4 Critério de informação
3492. Critério de informação
Seleção de modelos de substituição II
24
• Critério de informação de
Akaike
– Medida da distância entre o
modelo verdadeiro e o modelo
estimado
KlAIC 22 +−=2. Critério de informação
Seleção de modelos de substituição II
25351
2. Critério de informação
Seleção de modelos de substituição II
26
1)1(2
−−+
+=KnKKAICAICc
3512. Critério de informação
Seleção de modelos de substituição II
27
• Critério de informação
– Comparação simultânea de todos os modelos
– Comparação de modelos hierárquicos e não-hierárquicos
2. Critério de informação
Seleção de modelos de substituição II
28
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II
29
10.5 Enfoque Bayesiano
)(
)(
j
iij MDP
MDPB =
3. Enfoque Bayesiano
351
Seleção de modelos de substituição II
30
αt — número esperado de substituições por sítio
ln L
)(
)(
j
iij MDP
MDPB =
3. Enfoque Bayesiano
351
Seleção de modelos de substituição II
313. Enfoque Bayesiano
351
Seleção de modelos de substituição II
323. Enfoque Bayesiano
351
Seleção de modelos de substituição II
333. Enfoque Bayesiano
351
Seleção de modelos de substituição II
34
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II
top related