bäume und baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 ein ungewurzelter baum kann...
TRANSCRIPT
![Page 1: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/1.jpg)
1
BäumeundBaumrekonstruktion
![Page 2: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/2.jpg)
2
Ganzallgemein:BäumerepräsentierendieBeziehungenzwischenDingen1underzählen(häufig)Geschichten!
1e.g.betweenmembersofafamily
![Page 3: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/3.jpg)
3
DieInterpretationvonBäumenisteigentlicheinfach!
➢ EinAufspaltungsereignisimBaumspalteteineparentaleEntitätinzweiKind-Entitäten.
➢ DieAbfolgederAufspaltungsereignisseimBaumbestimmtdieVerwandtschaftschaftsverhältnissederuntersuchtenEntitäten.
➢ JenäheranderGegenwarteinAufspaltungsereignisliegt,destonähersinddiedarausresultierendenEntitätenmiteinanderverwandt.
SchimpansealsunsernächsterVerwandter
Zeit
![Page 4: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/4.jpg)
4
DieRekonstruktionphylogenetischerVerwandtschaftsverhältnisseinFormeinesBaumesals
bioinformatischesProblem
DiePhylogenetikliefertAntwortenauffolgendeFragen➢ WienahesinddieuntersuchtenArten/Sequenzenmiteinander
verwandt?➢ WanninderevolutionärenGeschichtesindbestimmteEreignisse
(z.B.Arbildung)passiert?
siesagtabernichtsausüber
➢ SinddieuntersuchtenArten/Sequenzenmiteinanderverwandt?1
Phylogenetik:DieAnalyseevolutionärerVerwandtschaftsverhältnissezwischenGruppenvonOrganismenmittelsderAnalysemorphologischerDatenoderMolekularerSequenzen.
1BittevergleichenmitderEinschränkungwelcheSequenzenmanalignierendarf!
![Page 5: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/5.jpg)
5
time
AA
AA AA
AAAAAA AA AAAAAA AA
AA AA AA AA
UnsereGrundannahme:DieanalysiertenEntitäten(Sequenzen/Arten)sindentlangeinesBaumesevolviert.
![Page 6: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/6.jpg)
6
time
AA
AA AA
AAAAAA AA AAAAAA AA
AA AA AA AA
WieschaffenwiresnunimRückblickdieReihenfolgederAufspaltungsereignissezurekonstruieren?
?
![Page 7: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/7.jpg)
7
PhylogenetischeBäume:TerminologieundKonzepte
![Page 8: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/8.jpg)
8
NotationenfürBäume
Blatt/Taxon/OperationalTaxonomicUnit(OTU)
GA B C D E F
4
32
1
Bifurkation
internerKnoten
internerAst
externerAst
Multifurkation
GewurzelterBaum
A
B
CD
E
F
G
leafs/taxa
bifurcation
internalnode/vertex
internalbranch/edge
multifurcation
externalbranch/edge
1 2
3 4
Unrootedtree1
Wurzel
time
1Hier,dieenglischenBegriffe.Achtung,esfehltdieWurzelunddamitdieRichtungderZeit!
![Page 9: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/9.jpg)
9
WieinterpretiertmanPolytomien?
A B C
Weiche Polytomie
Es gibt nur Bifurkationen im Baum – Die internen Kanten sind so kurz, dass keine verwertbare evolutionäre Änderung beobachtbar ist. Entsprechend kann das wahre Aufspaltungsmuster nicht rekonstruiert werden.
A B C
Harte Polytomie
Aus einer anzestralen Linie sind gleichzeitig 3+ Linien entstanden.
![Page 10: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/10.jpg)
10
UngewurzelteBäume(EinnichtganzsointuitivesKonzept1)
EinetrivialeAussage:DerBaumhatkeineWurzel.
EinenichtsotrivialeKonsequenz:ImBaumgibteskeineAussagehinsichtlichderRichtungindieZeitfließt.
Achtung:InvielenFällenwirdbeiderVerwendungundInterpretationvonBäumenaberimplizitvoneinemgewurzeltenBaum
ausgegangen…11AberdiemeistenProgrammezurBaumrekonstruktionliefernnurungewurzelteBäume!
WirkönnenalsonichtzwischenVor-undNachfahreunterscheiden!
![Page 11: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/11.jpg)
11
WirverdeutlichendasProblem:
WelchesTaxonistdernächsteVerwandtevond?• a• b• c• ab• ac• bc• abc
Wir können nicht entscheiden – Die Antwort hängt davon ab wo die Wurzel liegt!
Achtung: Unabhängig von der Position der Wurzel kann d nicht am nächsten verwandt zu a oder b sein.
![Page 12: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/12.jpg)
12
EinungewurzelterBaumkannvielegewurzelteBäumeerzeugen
DieAnzahlmöglichergewurzelterBäumeergibtsichausderZahlderÄsteimungewurzeltenBaum.
MankannungewurzelteBäumenachträglichwurzeln,z.B.mittelseinerAußengruppe1(Bittebeachten,dieAußengruppeselbstistnichtdargestelltnurdieresultierende
Wurzel)
1EineAußengruppeisteinTaxonvondemmanaprioriweiss,dassessichzuerstinderPhylogenieabgespaltenhat.
![Page 13: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/13.jpg)
13
€
b(n) =(2n− 5)!2n−3(n− 3)!
€
b(10) = 2027025
€
b(55) = 2.9 ×1084
€
b(100) =1.7 ×10182
WievielemöglichenBäumegibtes1?
1DiesesBeispielgiltfürungewurzelteBäume.FürgewurzelteBäumeerhöhtmandieAnzahlderTaxaum1,dieWurzel.
![Page 14: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/14.jpg)
14
AAAA
AAAAAA AA
AA AA AA
AAAAAA AA
AA AA
RekonstruktionderAufspaltungs-ReihenfolgederevolutionärenEntitäten(Taxa).
Ziel: Wir wollen die Taxa zuerst vereinigen, die sich zuletzt einen gemeinsamen Vorfahren geteilt haben. Wir wollen also im Rückblick Zeiträume rekonstruieren.
![Page 15: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/15.jpg)
15
AAAA
AAAAAA AA
AA AA AA
AAAAAA AA
AA AA
OhneVeränderungderCharakteristikadereinzelnenTaxaistesallerdingsunmöglichdieReihenfolgederAufspaltungsereignissezurekonstruieren!
AA
Merke:WirkönnennichtZeitselbstmessen,sondernurdaswasentlangdieserZeitpassiertist!
?
![Page 16: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/16.jpg)
16
time
AA
TA AG
TTTCTC TT TGGGGG TG
TC TT GG TG
UmAufspaltungsereignissezurekonstruierenbrauchenwirVeränderungvonCharakteristika.
![Page 17: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/17.jpg)
17
time
AATA AGGG TG
TCTCTCTC TTTT TTTT GGGGGGGG TGTG TGTG
AA->TA AA->AG
TA->TC TA->TT AG->GG AG->TG
TC TT
Dieser Baum erklärt die Daten mit 6 Substitutionen…aber es gibt mehr als eine Möglichkeit
UnterschiedezwischenCharakteren(Veränderungen1)lieferndieInformationfürdiePhylogenie-Rekonstruktion.
1 wir arbeiten in den Beispielen mit Substitutionen
![Page 18: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/18.jpg)
18
time
AATA AGGG TG
TCTCTCTCTTTT TTTTGGGGGGGG TGTG TGTG
AA->TA AA->AG
TA->TT AG->TG
TC TT
TA->GAGA->GG
AG->TGTG->TC
Dieser Baum erklärt die Daten mit 8 Substitutionen! Ist er besser oder schlechter als der vorherige Baum?
UnterschiedezwischenCharakteren(Veränderungen)lieferndieInformationfürdiePhylogenie-Rekonstruktion.
![Page 19: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/19.jpg)
19
Wennwirnicht-beobachteteEreignisserekonstruieren,verwendenwirmeistensdas(intuitive)PrinzipdermaximalenSparsamkeit1
Occam’s‚Razor’(GesetzderSparsamkeit)besagt:
Pluralitas non est ponenda sine necessitate.
Komplexität sollte nicht ohne Notwendigkeit angenommen werden
William of Ockham, 1285-1347/49
1engl.MaximumParsimony
Das Prinzip besagt schlicht, von zwei gegenüberstehenden Hypothesen zur Erklärung von Beobachtungen sollte man die einfachere Erklärung bevorzugen2.
2 Achtung, hierbei handelt es sich nur um eine generelle Arbeitsanweisung ohne definierten Gültigkeitsbereich.
![Page 20: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/20.jpg)
20
MitdemPrinzipdermaximalenSparsamkeithabenwirdieerstevondreiMöglichkeitenzurBaum-Rekonstruktion.
FindedenBaum,derdieDatenmitdergeringsten
AnzahlanVeränderungenerklärt
![Page 21: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/21.jpg)
21
RekonstruktionvonphylogenetischenBäumenmittelsMaximumParsimony:DieDatenmatrixistindenmeistenFälleneinAlignment.
Taxon 1 2 3 4 5 6 7 8 9
S1 C G C A C T G T T
S2 C G C A C T G T T
S3 T G A A C T G C T
S4 C G G A C T G C T
![Page 22: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/22.jpg)
22
Prinzip: Finde für jede Alignment-Spalte den Baum der die niedrigste Anzahl von Veränderungen benötigt, um das Spalten-Muster1 (engl. site pattern) zu erklären! Wähle schließlich den Baum, der die Anzahl der Veränderungen über das gesamte Alignment minimiert.
ReconstruktionphylogenetischerBäume:Maximumparsimony
1MusterausdenBuchstabendesAlphabetsindieserSpalte.
Taxon 1 2 3 4 5 6 7 8 9
S1 C G C A C T G T T
S2 C G C A C T G T T
S3 T G A A C T G C T
S4 C G G A C T G C T
![Page 23: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/23.jpg)
23
Taxon 1 2 3 4 5 6 7 8 9
S1 C G C A C T G T T
S2 C G C A C T G T T
S3 T G A A C T G C T
S4 C G G A C T G C T
S1: C
S3: T
S2: C
S4: CS1: C
S4: C
S3: T
S2: C
RekonstruktiondesMaximumParsimonyBaumes:EvaluierefürjedeinformativeSpalteallemöglichenBäume
substitution
S1: C
S2: C
S3: T
S4: C
S1: C
S2: C
S3: A
S4: GS1: C
S3: A
S2: C
S4: GS1: C
S4: G
S3: A
S2: C
S1: T
S2: T
S3: C
S4: CS1: T
S3: C
S2: T
S4: CS1: T
S4: C
S3: C
S2: T
2konstanteSpaltensinduninformativ!
?2
![Page 24: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/24.jpg)
24
Taxon 1 2 3 4 5 6 7 8 9
S1 C G C A C T G T T
S2 C G C A C T G T T
S3 T G A A C T G C T
S4 C G G A C T G C T
S1
S2
S3
S4S1
S3
S2
S4S1
S4
S3
S2
1 + 2 + 1 = 4 Substitutionen
1 + 2 + 2 = 5 Substitutionen
1 + 2 + 2 = 5 Substitutionen
Der MP Baum!
DerMaximumParsimonyBaumistder,derdieAnzahlderVeränderungenüberdasgesamteAlignmentminimiert
![Page 25: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/25.jpg)
25
1. Das Parsimonie-Konzept wird in der Regel als Modell-frei betrachtet!
2. Tatsächlich wird nichts modelliert aber der Algorithmus macht eine sehr starke Annahme: Veränderungen sind selten und Rückmutationen geschehen nicht. Diese Annahme selbst ist allerdings ein implizites ‚Modell‘.
3. Annahme 2 trifft in der Regel auf morphologische Daten zu. Allerdings wird sie von biologischen Sequenzen-Daten häufig verletzt1
4. MP ist eigentlich eine Methode zur Baum-Evaluierung, nicht zur Baum-Rekonstruktion...
EinigezusammenfassendeAspektezumThema“MaximumParsimony”
1 vgl. Vorlesungsinhalte zur Modellierung von Sequenzevolution
![Page 26: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/26.jpg)
26
DistanzenundderenVerwendungzurBaum-Rekonstruktion
FindedenBaumderdiegeringste
AnzahlanVeränderungen
erfordert
RekonstruierendenBaumderdenbesten‘Fit’aneinepaarweiseDistanzmatrixliefert
![Page 27: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/27.jpg)
27
seq 1 a g c t t a c c t g t t a c tseq 2 c g t a a a t t t c c c g a tseq 3 c g c a a g t t t c c c g a tseq 4 c a c t t a t t a g t c a a c
€ Seq 1 Seq 2 Seq 3Seq 2 11Seq 3 2Seq 4
RekonstruktionvonphylogenetischenBäumen:Distanz DiepaarweiseDistanzzwischenSequenzenapproximiertdieZeit,diediese
Sequenzengetrenntevolvieren
![Page 28: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/28.jpg)
28
seq 1 a g c t t a c c t g t t a c tseq 2 c g t a a a t t t c c c g a tseq 3 c g c a a g t t t c c c g a tseq 4 c a c t t a t t a g t c a a c
Seq 1 Seq 2 Seq 3Seq 2 11Seq 3 11 2Seq 4 8 10 9
€
Phylogenie-RekonstruktionDistanz-basierteMethoden
![Page 29: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/29.jpg)
29
ErstelleeinenBaumTmitAstlängenL(b)sodassdieSummederAstlängenzwischen zwei beliebigen Blättern möglichst nahe an die gemessenenpaarweisenDistanzenkommen.
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
Dmeasured S3,S4( )≈ L(1)+ L(2)+ L(3)+ L(4)
Phylogenie-RekonstruktionDistanz-basierteMethoden
S3 S4S2 S1
L(1)
L(2)L(3)
L(4)
![Page 30: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/30.jpg)
30
Distanz-basierteBaumrekonstruktionentsprichteinerhierarchischenClusteranalyse
-Metrik-
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
S3 S4S2 S1
L(1)
L(2)L(3)
L(4)
EineMetrikisteineFunktion,diejezweiElementendesRaumseinennichtnegativenreellenWertzuordnet,derdenAbstandderbeidenElementevoneinanderrepräsentiert.
![Page 31: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/31.jpg)
31
HierarchischeClusteranalyse-Metrik-
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
S3 S4S2 S1
L(1)
L(2)L(3)
L(4)
SeiXeinebeliebigeMenge.EineAbbildung
heißtMetrikaufX,wennfürbeliebigeElementex,yundzvonXdiefolgendenAxiomeerfülltsind:
d :X×X→R
z
x y
positive Definiertheit:Symmetrie:Dreiecks-Ungleichung:
![Page 32: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/32.jpg)
32
Thealgorithmusesapair-wisedistancematrixtoclustertheelementsinarootedtree.Ateachstep,thenearesttwoclustersarecombinedintoahigher-levelcluster.ThedistancebetweenanytwoclustersXandYistakentobetheaverageofalldistancesbetweenpairsofobjectsxinXandyinY,thatis,themeandistancebetweenelementsofeachcluster.
1 1
S2 S3
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
€
d(X,Y) =1
X × Yd x,y( )
y∈Y∑
x∈X∑
a) Matrix of pair-wise distancesb) Formula to compute the distances between clusters
r
time
S1 S44 4
4.1251.125
d((S2,S3),(S1,S4))=¼*(11+11+10+9)=10.25
Typicalclusteringalgorithms:UPGMA(UnweightedPairGroupMethodsusingarithmeticAverages)
![Page 33: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/33.jpg)
33
Ourassumptionssofar(makesuretounderstandthem!)
1) Thedataevolvedalongaclock-likeevolvingtree.2) Thepair-wiseevolutionarydistanceswerefairlyaccuratelyestimatedfrom
thedata.3) Itisforthisreasonthatwecanusethedistancematrixfortree
reconstruction.4) Anyalgorithmwilltypicallyuseonlyadistancematrixasinputandwill
produceatreeignoringtheprevious3points!
1thisisatreeinwhichthedistancebetweenallleafsandtherootarethesame.Itissometimesreferredtoas‘clock-like’tree.
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
S3 S4S2 S1
L(1)
L(2)L(3)
L(4)
Henceweneedtotestwhetheragivendistancematrixcanberepresentedona(ultrametric1)tree.
![Page 34: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/34.jpg)
34
A distance matrix (di,j), i,j=1....n, is representable as a clock-like tree, if and only if
for all triples (A,B,C)
€
d(A,B) ≤max d(A,C),d(B,C){ }
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
• 2 <= max(11,11)
• 11<=max(11,2)
• 11<=max(11,2)
S2(A) S3(B) S1(C)
S2(A) S3(C) S1(B)
S2(A) S3(C) S1(B)
Theorem: The ultrametric inequality
![Page 35: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/35.jpg)
35
A distance matrix (di,j), i,j=1....n, is representable as a clock-like tree, if and only if
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
• 2 <= max(11,11); 11<=max(11,2);11<=max(11,2)
• 2<=max(9,10);9<=max(2,10);10<=max(2,9)
• 11<=max(8,9);9<=max(11,8);8<=max(11,9)
S2 S3 S1
S2 S3 S4
S3 S4 S1
Theorem: The ultrametric inequality
for all triples (A,B,C)
€
d(A,B) ≤max d(A,C),d(B,C){ }
![Page 36: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/36.jpg)
36
A distance matrix (di,j), i,j=1....n, is representable as a clock-like tree, if and only if
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
(S1,S2,S3): 11 <= max(11,2); 11 <= max(11,2); 2 <= max(11,11)
(S2,S3,S4):2 <= max(9,10); 9 <= max(2,10); 10 <= max(2,9)
(S1,S2,S4):11 <= max(8,9); 8 <= max(11,9); 9 <= max(11,8)
Not suitable for UPGMA!
Theorem: The ultrametric inequality
for all triples (A,B,C)
€
d(A,B) ≤max d(A,C),d(B,C){ }
![Page 37: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/37.jpg)
37
A distance matrix (di,j), i,j=1....n, is representable as a tree, if and only if
d(A,B)+d(C,D) ≤max d(A,C)+d(B,D),d(A,D)+d(B,C){ }for all A,B,C,D ∈ 1,2,...,n{ }
A
B
D
C
2.5
3.5
2
2.5
8.5
Ismydistancematrixrepresentableasatree?Theorem:Four-Point-Condition
![Page 38: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/38.jpg)
38
A distance matrix (di,j), i,j=1....n, is representable as a tree, if and only if
for all
S1 S2 S3
S2 11
S3 11 2
S4 8 10 9
(S1,S2,S3,S4):11+9 <= max(11+10,8+2)
(S1,S2,S3,S4):11+10 <= max(11+9,8+2)
(S1,S2,S3,S4):8+2 <= max(11+10,11+9)
Not representable as a tree!
Theorem:Four-Point-Condition
d(A,B)+d(C,D) ≤max d(A,C)+d(B,D),d(A,D)+d(B,C){ }A,B,C,D ∈ 1,2,...,n{ }
![Page 39: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/39.jpg)
39
Bascially,wehavethreedifferentmeanstoreconstructphylogenetictreesfromsequencedata
Findtreethatrequirestheleastnumberofchanges
Findthetreethatmostlikelygaverisetothe
data
Reconstructthebestfittingtreefromapair-wisedistancematrix
![Page 40: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/40.jpg)
40
EvolutionarymodelsareoftendescribedusingasubstitutionratematrixQandcharacterfrequenciesΠ.1
€
Q =
− a a aa − a aa a − aa a a −
⎛
⎝
⎜ ⎜ ⎜ ⎜
⎞
⎠
⎟ ⎟ ⎟ ⎟
A C G T
€
πA = πG = πC = πT =14
Modelingsequenceevolution
JukesandCantor(1969)cameupwiththesimplestsubstitutionmodelforDNAsequences(JC69):allsubstitutionratesarethesame,andallnucleotidesoccurwiththesamefrequency
1rememberthelecture“ModelingSequenceEvolution”
![Page 41: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/41.jpg)
41
EvolutionarymodelsareoftendescribedusingasubstitutionratematrixQandcharacterfrequenciesΠ.
€
Q=
− a b ca − d eb d − fc e f −
⎛
⎝
⎜ ⎜ ⎜ ⎜
⎞
⎠
⎟ ⎟ ⎟ ⎟
A C G T
€
Π = πA,πC,πG,πT( )
FromQandΠwereconstructasubstitutionprobabilitymatrixPwherePij(t)istheprobabilityofchangingitojintimet.
Modelingsequenceevolution
![Page 42: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/42.jpg)
42
Computingprobabilitiesforobservingagivencharacterpairingi,jaftertimet
A C G T
Pii (t) =14+34e−4at
Now,wecandefinetheprobabilitytoobserveanysitepatterninapairwisealignmentgiventimet
Pdiff (t) =341−e−4αt( )
Q=
−3α α α αα −3α α αα α −3α αα α α −3α
⎛
⎝
⎜⎜⎜⎜
⎞
⎠
⎟⎟⎟⎟
Substitutionmatrix
P(t) =
14+34e−4αt 1
4−e−4αt 1
4−e−4αt 1
4−e−4αt
14−e−4αt 1
4+34e−4αt 1
4−e−4αt 1
4−e−4αt
14−e−4αt 1
4−e−4αt 1
4+34e−4αt 1
4−e−4αt
14−e−4αt 1
4−e−4αt 1
4−e−4αt 1
4+34e−4αt
⎛
⎝
⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜
⎞
⎠
⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟
Probabilitymatrix
![Page 43: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/43.jpg)
43
S‘: GATCCTGAGAGAAATAAACS: GGTCCTGACAGAAATAAAC
m:alignmentlengthSi:characteratpositioniinsequenceSS’i:characteratpositioniinsequenceS’
Withthelikelihoodfunction,wecannowcomputethelikelihoodthatsequenceSchangestosequenceS’intimet
Thisvaluedenotestheprobabilitytoobservethesitepattern(alignmentcolumn)atpositioniinthealignment.Moreprecisely,itistheprobabilitythatnucleotideSihasbeensubstitutedbynucleotideS’iaftertimet.
![Page 44: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/44.jpg)
44
S‘: GATCCTGAGAGAAATAAACS: GGTCCTGACAGAAATAAAC
Log-LikelihoodsurfaceunderJC69
*Note,sincetheproductsofprobabilitiesquicklybecomeverysmall,thelikelihoodistypicallycomputedandgiveninlog-scale(log-likelihood).
time(insubst.persite)
WecannowcomputethelikelihoodthatShaschangedtoS’foranygiventimeintervaltandidentifythetimeforwhichL(t|S->S’)*ismaximal.
![Page 45: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/45.jpg)
45
Givenatreewithbranchlengthsandsequencesforallnodes,thecomputationoflikelihoodvaluesisstraightforward.Usuallynosequencesareavailablefortheinnernodes(ancestralsequences).Hencewehavetoevaluateeverypossiblelabelingattheinnernodes!
foreverycolumninthealignment.
Butthereisaquickerway…
Treelikelihoods
![Page 46: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/46.jpg)
46
1 2
5 3 4
6
A 0
C 1
G 0
T 0
A 0
C 0
G 1
T 0 A 0
C 1
G 0
T 0
A 0
C 1
G 0
T 0
A
C
G
T A
C
G
T
d1 d2
d3 d4
k
1 …C…
2 …G…
3 …C…
4 …C…
with dx = 0.1 ∀ x∈ 1,.., 5{ }, and Pij (0.1) =0.91 if i = j
0.03 for each i ≠ j
⎧⎨⎪
⎩⎪
d5
€
L5(i) = [L(C) × PiC (d1)] × [L(G) × PiG (d2)],∀ i ∈{A,C,G,T}
Calculatingtreelikelihoods
1
1hereyoucomputethepartiallikelihoodL5(i)foreachancestralnucleotideiinnode5ofthetree,giventhedatainkandthemodel
Note,theseprobabilitiesdonotchangeasthebasesare
observedinthedata!
Forasinglesitepatternkandagiventreewecompute:
Note,theseprobabilitiesDOchangewithiandd,andarespecifiedbythesubstitution
model!
partiallikelihoods
![Page 47: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/47.jpg)
47
1 2
5 3 4
6
A 0
C 1
G 0
T 0
A 0
C 0
G 1
T 0 A 0
C 1
G 0
T 0
A 0
C 1
G 0
T 0
A 0.0009
C 0.0273
G 0.0273
T 0.0009 A
C
G
T
d1 d2
d3 d4
k
1 …C…
2 …G…
3 …C…
4 …C…
Forasinglesitepatternkandagiventree:
with dx = 0.1 ∀ x∈ 1,.., 5{ }, and Pij (0.1) =0.91 if i = j
0.03 for each i ≠ j
⎧⎨⎪
⎩⎪
d5
€
L5(i) = [L(C) × PiC (d1)] × [L(G) × PiG (d2)],∀ i ∈{A,C,G,T}
Calculatingtreelikelihoods
L5(A) = [1×PAC(0.1)]×[1×PAG(0.1)]=1×0.03×1×0.03= 0.0009
L5(C) = [1×PCC(0.1)]×[1×PCG(0.1)]=1×0.91×1×0.03= 0.0273
L5(G)andL5(T)arecomputedanalogously
partiallikelihoods
![Page 48: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/48.jpg)
48
A 0.0000025
C
G
T
Forasinglesitepatternkandagiventree:
€
L6(i) = Lv( j ) × Pij (dv)j ={A,C,G,T}∑
⎡
⎣ ⎢ ⎢
⎤
⎦ ⎥ ⎥ v={3,4,5}
∏ ,∀ i ∈{A,C,G,T}
1 2
5 3 4
6
A 0
C 1
G 0
T 0
A 0
C 0
G 1
T 0 A 0
C 1
G 0
T 0
A 0
C 1
G 0
T 0
A 0.0009
C 0.0273
G 0.0273
T 0.0009
d1 d2
d3 d4
k
1 …C…
2 …G…
3 …C…
4 …C…
d5
with dx = 0.1 ∀ x∈ 1,.., 5{ }, and Pij (0.1) =0.91 if i = j
0.03 for each i ≠ j
⎧⎨⎪
⎩⎪
Calculatingtreelikelihoods
*
*Note,thevrepresentsthenodesforwhichthepartiallikelihoodshavealreadybeencomputed.Thesumindicatesthatyousumoverallpossibleinternallabels.Note,thatforleafnodestheprobabilityoftheobservednucleotideis1andthatoftheothernucleotidesis0!Hence,fornodes3and4thereisnoneedtocomputeasum!
L6 (A) =[L5(A)×PAA(0.1)]×[L3(C)×PAC(0.1)]×[L4 (C)×PAC(0.1)]+[L5(C)×PAC(0.1)]×[L3(C)×PAC(0.1)]×[L4 (C)×PAC(0.1)]+[L5(G)×PAG(0.1)]×[L3(C)×PAC(0.1)]×[L4 (C)×PAC(0.1)]+[L5(T)×PAT (0.1)]×[L3(C)×PAC(0.1)]×[L4 (C)×PAC(0.1)]= [(0.0009× 0.91])+ (0.0273× 0.03)+ (0.0273× 0.03)+ (0.009× 0.03)]× 0.03× 0.03= 0.002727×0.03× 0.03= 0.0000025
LikelihoodofnucleotideAatnode6incolumnk!
![Page 49: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/49.jpg)
49
A 0.0000025
C 0.0212954
G 0.0000231
T 0.0000025
Forasinglesitepatternkandagiventree:
€
L6(i) = Lv( j ) × Pij (dv)j ={A,C,G,T}∑
⎡
⎣ ⎢ ⎢
⎤
⎦ ⎥ ⎥ v={3,4,5}
∏ ,∀ i ∈{A,C,G,T}€
L5(i) = [L(C) × PiC (d1)] × [L(G) × PiG (d2)],∀ i ∈{A,C,G,T}
1 2
5 3 4
6
A 0
C 1
G 0
T 0
A 0
C 0
G 1
T 0 A 0
C 1
G 0
T 0
A 0
C 1
G 0
T 0
A 0.0009
C 0.0273
G 0.0273
T 0.0009
d1 d2
d3 d4
k
1 …C…
2 …G…
3 …C…
4 …C…
d5
with dx = 0.1 ∀ x∈ 1,.., 5{ }, and Pij (0.1) =0.91 if i = j
0.03 for each i ≠ j
⎧⎨⎪
⎩⎪
Calculatingtreelikelihoods
L(k) = π i × L6 (i) = 0.005331; mit π i = 0.25∀i ∈ {A,G,C,T}i={A,C,G,T}∑
Thisisthesitelikelihoodofthepatternkgiventhetree
*
*Note,thevrepresentsthenodesforwhichthepartiallikelihoodshavealreadybeencomputed.Thesumindicatesthatyousumoverallpossibleinternallabels.
![Page 50: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/50.jpg)
50
1 CCG
2 GGC
3 CCC
4 CCC
Foranalignmentoffoursequencesandlengthm=3thelikelihoodisthen1 2
5 3 4
6
CCG GGC
CCC CCC0.1 0.1
0.1
0.1
0.1
0.0053310.0053310.005331
L(T) = L(k)k=1
m
∏ = 0.0053312 ×0.005331
= 0.000000152
lnL(T) = lnL(k) = −15.7k=1
m∑
orthelog-likelihoodis
Calculatingtreelikelihoods
![Page 51: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/51.jpg)
51
Buildingandevaluatingatreeissimple:e.g.stepwiseinsertionstartingfroma4-taxontree
Searching tree space is a bit more complicated…
![Page 52: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/52.jpg)
The missing bit: Tree evaluation using Bayes theorem
So far we have computed
i.e. the likelihood of the data D given the tree T and the parameter vector Θ.
However, what we are interested in most of the times is the likelihood of T and Θ given D, i.e.€
P(D |Τ,Θ)
€
P(Τ,Θ |D)
![Page 53: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/53.jpg)
The missing bit: Tree evaluation using Bayes theorem
So far we have computed
i.e. the likelihood of the data D given the tree T and the parameter vector Θ.
However, what we are interested in most of the times is the likelihood of T and Θ given D, which is given by Bayes’ theorem€
P(D |Τ,Θ)
€
P(Τ,Θ |D) =P(D |Τ,Θ)*P(Τ,Θ)
P(D)
prior information on the probability of a given hypothesis (T, Θ)
total probability of the data considering all hypotheses. This is the problematic bit!
![Page 54: Bäume und Baumrekonstruktion - uni-frankfurt.de · 2018. 8. 15. · 12 Ein ungewurzelter Baum kann viele gewurzelte Bäume erzeugen Die Anzahl möglicher gewurzelter Bäume ergibt](https://reader033.vdocuments.pub/reader033/viewer/2022060917/60aa1e9d99b1c51bf513a18e/html5/thumbnails/54.jpg)
Finding the best tree is highly problematic!
1. Exhaustive Search: evaluates every possible tree and hence an optimal solution is guaranteed. Limit: 10-12 taxa
2. Branch and Bound: excludes parts from the tree space from the search where the optimal tree cannot be found. Guarantees to find the optimal tree.
3. Heuristics: Can be applied to large taxon sets but does not guarantee an optimal solution
To be told on another day….