parcimônia e medidas de suporte
DESCRIPTION
Parcimônia e medidas de suporte. Almir R. Pepato. O problema. Para cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula:. - PowerPoint PPT PresentationTRANSCRIPT
Parcimônia e medidas de suporte
Almir R. Pepato
O problemaPara cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula:
Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.
Número de clados
Enraizada(2n-3)!/(2n-2(n-2)!)
Não-enraizada(2n-5)!/(2n-3(n-3)!)
2 1 13 3 14 15 35 105 156 954 1057 10,395 9548 135,135 10,3959 2,027,025 135,13510 34,459,425 2,027,025
O problema
Métodos de inferência
A- Algoritmos- Uma série de passos que conduzem à árvore filogenética.
A1-Análises de agrupamento (UPGMA)A2- Neighbour Joining
B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas.
B1- Máxima ParcimôniaB2- Máxima VerossimilhançaB3- Evolução MínimaB4- Mínimos Quadrados
C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.
Parcimônia
De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia)
William de Ockham (1288-1347 ou 1348)“entia non sunt multiplicanda praeter necessitatem”
Parcimônia
Função objetiva da parcimônia:
Parcimônia
Parcimônia de Fitch
Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo.
1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore).
C
A
GC
A
Parcimônia de Fitch
C
A
G
C
A
Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras:
A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore;
B- Se então nesse caso não se acrescenta nada ao comprimento da árvore.
Comprimento: 3
X
Y
Z
1
1
0W 1
Generalizando... Parcimônia de Sankoff
A C G T
A 0 1 1 1
C 1 0 1 1
G 1 1 0 1
T 1 1 1 0
Parcimônia de Fitch
A B C D
A 0 1 2 3
B 1 0 1 2
C 2 1 0 1
D 3 2 1 0
Parcimônia de Wagner, caracteres ordenados:A-B-C-D
A B C D
A 0
B 1 0
C 2 1 0
D 3 2 1 0
Parcimônia de Dollo, caracteres ordenados:A-B-C-D
As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações.
Generalizando... Parcimônia de Sankoff
Algoritmos de busca
A
B C
1
2a
Árvore inicial, três espécies ao acaso.
A
B DC
A
BD C
A
B CD
2b 2c
E
E
EE
E
Adiciona-se o próximo táxon (D) (três árvores):
Adiciona-se o quinto táxon(E) (15 árvores)....
Impraticável para um número maior de terminais!!!!!
Nearest-neighbor interchanges (NNI)
Subtree pruning and regrafting (SPR)
Tree bisection and reconnection (TBR)
Algoritmos de Busca
Novas TecnologiasRatchet:
Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído.
Tree fusing (TF):
Troca de sub-grupos idênticos entre árvores diferentes.
Sectorial Seaches (SS):Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.
Novas Tecnologias
Tree Drifting (DFT): Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da Relative Fit Difference (RFD) e a diferença de comprimento entre a nova e a velha solução.
RFDAB = (F–C)/F
F = Soma das diferenças de passosnas duas árvores (A e B) quemelhor ajusta (fit) a árvore A
C = Soma dos caracteres quemelhor ajustam (fit) a árvore B
ÍndicesÍndice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por:
CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore
CI= 6*100/7 = 85,7
Índices
ÍndicesÍndice de retenção (RI):
RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados
SuporteBootstrap
SuporteBootstrap
Suporte
Suporte de Bremer:
Quanta homoplasia é necessária para derrubar um clado?
Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.
Problemas com a Parcimônia
Qual método empregar?
Huelsenbeck et al., 1996
Qual método empregar?
Huelsenbeck et al., 1996