系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/phylogenyestimation...系統推定論の原理と方法...

49
系統推定論の原理と方法 生物の系統発生を推論するロジック 三中 信宏 MINAKA Nobuhiro 独立行政法人 農業環境技術研究所 生態系計測研究領域 上席研究員 東京大学大学院 農学生命科学研究科 生物・環境工学専攻 教授[生態系計測学] 東京農業大学大学院 農学研究科 客員教授[応用昆虫学] mailto:[email protected] http://twitter.com/leeswijzer http://cse.niaes.affrc.go.jp/minaka/ http://d.hatena.ne.jp/leeswijzer/

Upload: others

Post on 12-Jul-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

系統推定論の原理と方法̶ 生物の系統発生を推論するロジック ̶

三中 信宏MINAKA Nobuhiro

独立行政法人 農業環境技術研究所 生態系計測研究領域 上席研究員

東京大学大学院 農学生命科学研究科 生物・環境工学専攻 教授[生態系計測学]

東京農業大学大学院 農学研究科 客員教授[応用昆虫学]

mailto:[email protected]

http://twitter.com/leeswijzer

http://cse.niaes.affrc.go.jp/minaka/

http://d.hatena.ne.jp/leeswijzer/

Page 2: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

東京大学大学院 農学生命科学研究科 生物・環境工学専攻 研究セミナー(25 October 2006)

データ

系統樹

統計学的問題誤差,信頼性,モデル選択 etc.

数学的問題スタイナー問題グラフ理論, etc.

離散構造 = 推定量

Page 3: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

日本生物地理学会第 62回年次大会シンポジウム〈進化と系譜:ツリー,ネットワーク,視覚言語リテラシー〉

(8 April 2007,立教大学)

系統推定論

進化生物学

歴史科学

統計科学

離散数学

生物学哲学 認知科学系統樹の哲学

系統樹の科学

Page 4: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 5: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 6: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 7: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 8: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 9: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

最節約基準

尤度基準

ベイズ基準

 ・・・・・・

Page 10: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

最節約法による

系統関係の推定

Page 11: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 12: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 13: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 14: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 15: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 16: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 17: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 18: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 19: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 20: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 21: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 22: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

ベイズ事後分布を求めるモデルが複雑になると計算量が膨大になる

[例]分子系統樹のベイズ推定

v1

v2

v3v4

v5 v6

パラメータ群 樹形:τ 枝長:v 置換遷移確率:θ サイト間変異:α

������� ���������������

��� ������������

������� ��

��

������������ ����������������������

樹形の事後分布

推定対象

対象外(撹乱母数)

撹乱母数は期待値計算で消去

樹形の尤度

樹形の事前分布

配列データ X

多重積分の重荷

組合せ論的爆発

Page 23: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

ベイズ事後分布を求めるマルコフ連鎖モンテカルロ法(MCMC)という最終兵器

������� ���������������

��� ������������

事後確率分布

事後確率

パラメータ 1

パラメータ2

パラメータ初期値を無作為に与え,マルコフ過程を用いて事後確率分布を系統的にサンプリングし,定常状態になるまで探索させる.

マルコフ連鎖モンテカルロ法(Markov chain Monte Carlo: MCMC)

初期値

定常状態

酔歩状態

慣らし過程(burn-in)

事後確率分布計算

Page 24: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

東京大学大学院農学生命科学研究科集中講義三中信宏:「保全生態学特論」(May-June 2007,東京大学)

系統樹推定ソフトウェアいろいろ

Phylogeny Programs (PHYLIP Website) ※ポータルサイト

 http://evolution.genetics.washington.edu/phylip/software.html

・PAUP* 4.0b10(http://paup.csit.fsu.edu/)

・MacClade 4.08(http://macclade.org/macclade.html)

・Mesquite 1.12(http://mesquiteproject.org/mesquite/mesquite.html)

・MrBayes 3.1.2(http://mrbayes.csit.fsu.edu/)

・Modeltest 3.7(http://darwin.uvigo.es/software/modeltest.html)

・SplitTree 4(http://www.splitstree.org/)

・TreeMap 2.0(http://taxonomy.zoology.gla.ac.uk/~mac/treemap/)

MP

MP

MPML

ML

Bayes

Model selecti

on

Network

NJ

Co-phylogen

y

Page 25: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 26: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

どの系統推定法を使えばいいか?・距離法 計算速い/単一解/情報損失(よくまちがう)/距離尺度が重要

・最節約法 速度ほどほど/形質なんでもオッケー/複数解/まちがうことあり(Felsenstein Zone)

・最尤法 速度遅い/分子データのみ/進化モデル依存/まちがうことあり(Farris Zone)

・ベイズ法 成長株/速度遅い(最尤法よりマシ)/事前確率あやしい/収束の判断に苦しむ

Page 27: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 28: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

パラメトリック統計学

ノンパラメトリック統計学

計算機統計学

統計学世界

Page 29: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

パラメトリック系統学

ノンパラメトリック系統学

計算機系統学

系統学世界

Page 30: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

パラメトリック系統学

ノンパラメトリック系統学

計算機系統学

系統学世界

MLBayesian MCMC

MPモデルなし

複雑モデル

超複雑モデル

Page 31: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

高次の「最節約原理」がある

距離法(最小進化法)最節約法(分岐分析)最尤法ベイズ法……

アブダクションのための単純性基準

Page 32: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 33: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 34: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 35: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 36: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

なお続く,

「方法」をめぐる論争

(五十年戦争か)

B. Kolaczkowski & J. W. Thornton (2004)

Page 37: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 38: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

MP > ML, Bayes

Page 39: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

M. Spencer et al. (2005), MBE, 22(5)

No!

Page 40: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

E. Mossel & E. Vigoda (2005)

MisleadingBayesian MCMC

Page 41: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

系統推定を誤らないためには―― ・形質を増やす  (→どの系統推定法でも大丈夫) ・端点(OTU)を増やす  (→計算時間のかかる最尤法・   ベイズ法はダメ)

Page 42: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

6

NJ

MP

ML

Page 43: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 44: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 45: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 46: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中
Page 47: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

「ツリー」から「高次グラフ」へ

1) 系統ネットワーク 超立方体の部分構造としての網状系統樹

2) タングルド・ツリー 共進化・生物地理・遺伝子系譜のマッピング

3) スーパーツリー 個々の系統樹からの統合系統樹の推論

Page 48: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

共有される問題状況

絡み合う系統樹を解きほぐす

Page 49: 系統推定論の原理と方法cse.naro.affrc.go.jp/minaka/cladist/PhylogenyEstimation...系統推定論の原理と方法 生物の系統発生を推論するロジック 三中

5