windows qtl cartographerによるqtl解析の留意点windows qtl...

5
Windows QTL CartographerによるQTL解析の留意点 誌名 誌名 育種学研究 = Breeding research ISSN ISSN 13447629 巻/号 巻/号 101 掲載ページ 掲載ページ p. 11-14 発行年月 発行年月 2008年3月 農林水産省 農林水産技術会議事務局筑波産学連携支援センター Tsukuba Business-Academia Cooperation Support Center, Agriculture, Forestry and Fisheries Research Council Secretariat

Upload: others

Post on 16-Mar-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Windows QTL CartographerによるQTL解析の留意点

誌名誌名 育種学研究 = Breeding research

ISSNISSN 13447629

巻/号巻/号 101

掲載ページ掲載ページ p. 11-14

発行年月発行年月 2008年3月

農林水産省 農林水産技術会議事務局筑波産学連携支援センターTsukuba Business-Academia Cooperation Support Center, Agriculture, Forestry and Fisheries Research CouncilSecretariat

育種学研究 10:11-14 (2008)

ノート

Windows QTL Cartographerによる QTL解析の留意点

高橋秀和

秩回県立大学生物資源科学部,秩田市, 干010-0195

QTL analysis using the Windows QTL Cartographer

Hidekazu Takahashi

Faculty 01 Bioresource Sciences, Akita Prφctural University, Akita 010-0195, Japan

キーワード

遺伝効果, QTL解析, Windows QTL Cartographer

1.はじめに

QTL (Quantitative Trait Locus,量的形質遺伝子座)解

析とは,マーカーとの連鎖を利用して QTLの染色体上の

位置と遺伝効果を推定する方法である 量的形質には複

数の QTLが関与する場合が多いため分離集団における個

体の遺伝子型は多様になる さらに環境による変動が加

わるので質的形質のように各個体の遺伝子型を類推する

ことが困難とされてきた.しかし, DNAマーカ一利用に

よる詳細な連鎖地図が作られるようになり, これらを利

用した QTLの検出が可能になった (Ta此 sley1993).

QTL解析は MAPMAKER/QTL(Lincoln et al. 1993)や

MAPL (鵜飼ら 1995)をはじめとする解析ソ フトの開発

により急速に普及した最近ではアメリカノースカロラ

イナ州立大学の Wanget al. (2006)が開発した Windows

QTL Cartographerによる QTL解析の論文が数多く報告さ

れるようになり,容易な操作性と様々な解析法が組み込

まれている点がその理由としてあげられる. しかし, こ

れらの解析法は,統計遺伝学に習熟した研究者には最適

な選択肢や条件検討の機会を提供するが,それ以外の研

究者にと っては逆にその違いが理解できず,誤った操作

法や解釈を導くことも予想される.

本稿では Windows QTL Cartographer Version 2.5

(WinQTLCart, 2007年 8月 21日公開版)の Interval

Mapping (1M)法, Composite Interval Mapping (CIM)法

および MultipleInterval Mapping (MIM)法の統計モデ、ル

(以後モデルと呼ぶ)および検出原理について解説する

次に既に報告しているオオムギ品種 HarringtonとTR306

の倍加半数体 (DH)150系統の形質データ (深播耐性:

DT, Takahashi et al. 2001)を再解析し各解析法の問題

編集委員:矢野昌裕

2007年 5月 14日受領 2007年 11月 12日受理Correspondence: h-takahashi@akita

点とその対処法を検討する.なお WinQTLCartの基本操

作については Wanget al. (2006),あるいは中道 (2004)

を参照されたい.また, WinQTLCartの変更可能な設定

値は,特に説明のない場合,すべて初期値を使用した.

2. QTL解析法の選択

Interval Mapping (1M)法

連鎖地図上の各検定部位において l個の QTLが存在す

ると仮定して隣接するマーカーの遺伝子型をもとに各個

体の QTLの遺伝子型を類推し,その QTLの遺伝効果で

各個体の表現型値のばらつきを説明するモデルを考える

のが 1M法である.この解析法では,検定部位に QTLが

存在しないと仮定したモデ、ルと比較して, QTLが存在す

ると仮定したモデ、ルが表現型値のばらつきをより良く説

明できる統計的な尺度として LODスコアを用いる.ま

た,表現型値のばらつきの中で検定部位に仮定した l個

の QTLで説明できない部分はすべて誤差に含める

Composite Interval Mapping (CIM)法

1M法と同様に連鎖地図上の各検定部位において l個の

QTLが存在すると仮定して表現型値のばらつきを説明す

るモデルを考えるが, 品f法において誤差に含めていた検

定部位以外に存在する QTLの遺伝効果に対してもマー

カーの遺伝子型を基準に考慮するのが CIM法であるこ

の解析法では検定部位以外の QTLの遺伝効果を取り除い

て QTLを検索するため,連鎖する 2個の QTLを分離し

て検出できる場合もある.また,誤差の分散が 1M法に

比べて小さくなるため, 1M法では誤差の分散に紛れて

検出されなかった遺伝効果の小さい QTLについても検出

可能となる

Multiple Interval Mapping (MIM)法

1M法を複数の QTU こ拡張した解析法で,検出された

12

QTLをモデルに含めて新たな QTLを段階的に検出する

のが MIM法である.最終的には複数の QTLとそれらの

交互作用を含むモテ、ノレを考え,表現型値のばらつきを最

も良く説明できるモテ、ルを決定する.この解析法では形

質への関与が示唆された複数の QTLを同時にモデルに含

めるため,形質の遺伝構成を 1M法や CIM法よりも明確

にすることが可能となる.

3. QTLの検出,およびQTLの位置と遺伝効果

の推定

1M法および CIM法では, LODスコ ア(対数尤度)が

大きいモデ、ルほど良いとする 「最尤原理」を用いるので,

LODスコアを結んだ曲線のピー クとな った検定部位に

QTLが存在すると仮定したモデ、ルが各個体の表現型値の

ばらつきを良く説明できることを意味する この LOD曲

線がピークとな った検定部位の有意性は,検定部位の

しODスコアと後述する LODスコアの闘値との比較によ

り判断し,闘値を超える LODスコアの検定部位および

そのモデ、ルから QTLの位置と遺伝効果が推定される.

MIM法では, モデノレ選択規準のひと つの手法である

BIC (Bayesian Information Criterion,ベイズ情報量規準)に

よって QTしを検出しそのモデ‘ルから QTLの位置と遺

伝効果が推定される BICはより簡略 (QTLや交互作用

が少なし、)で‘表現型値への適合度の高いモデ、ルを選択す

るための統計量 (規準)であり, この値が小さいモデル

ほど良いとされる BIC統計量は,パラメータ (QTLや

交互作用)数が多くなるとモデ、ルの対数尤度は大きくな

る 「最尤原理」 とパラメータ数が少ないモデルほど良い

とする 「けちの原理Jで構成され,両者のバランスを取っ

ている.このバランスを調整するために, WinQTLCartで

は, パラメータ数に対する 6種のペナルティーが用意さ

れている. QTLの検出では検定部位に QTLが「存在し

ない」と仮定したモデ、ノレと 「存在する」と仮定したモデ

ルの BIC統計量の比較によって判断し,後者の BIC統計

量が小さければ後者のモデルが選択され,検定前のモデ

ルに QTLが追加される.個々の QTL聞の交互作用の検

出では,交互作用が 「ない」と 「ある」のモデ、ルの BIC

統計量が比較される.

MIM法の手順として QTLの検出と検証, QTLの位置

の最適化および個々の QTL聞の交互作用の検出と検証を

l巡とする操作を QTLが検出されなくなるまで繰り返し

行う必要がある (Zenget al. 1999, Wang et al. 2006).さら

に MIM法による QTLの検出には初期モデ、ルの設定が影

響することもあるので,本稿では Zenget al. (1999)に

従い CIM法で検出された QTLを初期モデ、ル と し はじ

めにそのモデ、ルを検証してから QTLの検出を行った.し

かし,モデル選択規準に対する適当な統計的有意水準を

設定することが困難であり, WinQTLCartにおいては選

択されたモデルが他の全てのモデルに比べて真に良いモ

高橋

デ、ルであるか否かを判断するための有意性検定は用意さ

れていない.

4. QTLの闇値(いきち)の設定

闘値が不当に高く設定されると QTLの検出力は低下す

るが,不当に低く設定されると偽の QTLが多数検出され

る個々の形質データに適合する闇値の設定が不可欠で三

1M 法および CIM 法の闘値は初期設定で LOD=2.5

(LR = 11.5)とされているが,誤った (第 l種の過誤)QTL

の検出を防ぐためにも並びかえ検定 (permutationtest)に

よる闘値の設定が必要である WinQTLCartでは有意水

準 α=0.05,繰返し数 1,000回の条件での闘値の設定を勧

めている この並びかえ検定とは,表現型値の無作為な

並びかえで表現型値とマーカーの遺伝子型の相関を取り

除き, QTLが存在しない状況での LODスコアの分布を

調べて, QTLの闘値を算出する実験的な手法である.

前述したように, MIM法では選択されたモテ、ルに対す

る有意性検定は用意されていないが,モデ、ルに含まれる

個々の QTLについては,その QTLを含むモデル(選択

されたモデノレ)とその QTLを除いたモデルの尤度から

LODスコアが算出される.この MIM法における LODス

コアは,個々の QTLについてモデ、ルに含まれる他のQTL

の効果を考慮したうえで算出された値であるため, 1M法

や CIM 法で用いられる~びかえ検定による闘値の設定は

適当ではない.そのため MlM法では有意性検定を用い

た個々の QTLの信頼性の評価は困難であるが, MIM法

においても LODスコアは個々の QTLの信頼性の目安に

はなるであろうなお並びかえ検定による闘値の意義に

ついての詳細は Churchilland Doerge (1994)を, MIM法

の闘値の考え方については Kaoet al. (1999)を参照され

たい.

5. オオムギ倍加半数体のデータを用いた再解析の

結果と解釈

図 lに 1M法 (上段),CIM法 (中段)および MIM法

(下段)による LOD曲線を示した.縦軸に LODスコア

を,横軸にはオオムギの 7本の染色体の連鎖地図 (距離)

を示した MAPMAKER/QTL(1M法)によって供試デー

タの QTLは 1Hおよび 5H染色体に検出されている

(Takahashi et al. 2001). これらの QTLの位置は 1M法に

よる LOD曲線のピークの位置とほぼ一致した CIM法

では 1M法で検出された QTL(qDT-I-1および qDTふ 2)

に加え l個の QTL(qDT・7・2)が検出された 1M法およ

びCIM法の LODの闘値 (並びかえ検定,α=0.05,1,000

回)はともに LOD=2.7であった.MIM法 (ペナノレテ ィー

1 : BlC-MO)では CIM 法で検出された 3個の QTLに加

え,新たに 6個の QTしが検出された.M1M法による LOD

曲線の IHおよび2H染色体のピーク (20および 50cM付

Windows QTL Cartographerによる QTL解析 13

lJ~福kbk/kk:l~LLbLJbL

1 H (140cM) 2H (198cM) 3H (151cM) 4H (157cM) 5H (230cM) 6H (158cM) 7H (183cM)

図 1. Interval Mapping (1M)法.Composite Interval Mapping (CIM)法および Multiple

lnterval Mapping (MIM)法による LOD曲線の比較

供試データは Takahashiet al. (2001)のオオムギの DH系統(150系統)の深播

耐性 (DT)の解析結果を用いた

縦軸に LODスコアを,横軸にオオムギの 7本の染色体に対応する連鎖地図

(Kosambi 関数)を示す.

染色体の左側に短腕(右側に長腕)を示し,短腕端部の 7 ーカ一位置 (0cM)に

矢頭を. 50 cM毎に目盛りを付す

1M法および CIM法では水平の点線で閥値 (LOD=2.7)を示した.

近)は,本稿では QTLとして検出されなかった.これら

は QTLの検出過程では候補のモデルとされたが,検証過

程で選択されなかったモデルであったので, これ以降の

QTLの検出を行わなかった.

表 1に各解析法で検出された QTLの遺伝効果を示す

1M法および CIM法で検出された QTLは. MIM法では

寄与率が 6.1%以上であったが. qDT-l-lおよび qDT司 5・2.

の相加効果はモデル(検定部位以外の遺伝効果の影響)

の違いにより 1M法.CIM法および MIM法の順に小さく

なったまた,個々の QTLの遺伝効果が独立であればそ

れらの共分散は理論的に 0となるが,共分散が生じたた

め寄与率 (qDT-2-1.-1.0%)が負値となる場合もあった

寄与率が 4.1%以下の QTL(qDTふ 1.qDT-4・1.qDTふ l

および qDT-7-1)の位置は 1M法および CIM法において

闘値に至らなかった LOD曲線のピークの位置とほぼ一

致した(図1).qDT-2-2の寄与率は 7.8%であったが.IM

法および C1M法では検出されなかった これは.qDT・2・

2は相加効果の方向の異なる qDT-2-1と連鎖するので.IM

法では 2個の QTLを分離できず l個の LOD曲線のピー

クが闘値に至らなかった. CIM法では 2個の QTLは分

離できたがし、ずれの LOD曲線のピークも闇値に至らな

かったので検出されなかったと考えられる.

1M法や CIM法に比べてより複雑なモデ、ルを考慮する

MIM法では,より多数の QTLや交互作用を含むモデル

が誤って選択される可能性もあり ,選択されたモデ、ルの

有意性を検定する統計的なツールが提供されていないの

で.BIC統計量のベナルティー設定を変更して QTしの再

検出を行い,選択されたモデルの信頼性の評価を試みた.

BIC統計量のペナルティー設定を変更して QTLを再検出

すると,ペナルティーの大きさ(I: B1じM1< 4: BIC-M2 < 5 : BIC-M3)によって検出される QTLの数は異な

り,ペナルティー 4(BIC-M2)では 6個の QTL(交互作

用 1個)が,ペナルティー 5(BIC-M3)では 3個の QTL

が検出された(表1)

以上のよ うに.MIM法の解析結果の解釈において,

WinQTLCartでは選択されたモデルの信頼性は直接的に

は評価されないので. B1C統計量のペナルティー設定の

変更あるいは CIM法などで検出された QTLによる有意

性検定を担保に個々の QTLの信頼性を示すことが必要と

考える.

6. おわりに

1M法およびCIM法では遺伝効果の小さい QTLは誤差

の分散に紛れて検出され難い.MIM法では信頼性の規準

が確立されていない,あるいは負値の寄与率が表示され

る問題点がそれぞれあげられる.その対処法として,前

述した複数の解析法による解析結果を比較して各問題点

を補償しあうことが有効と考える 例えば. Mano et al

(2007)のように CIM法と MIM法を並記することもひと

つの対処法である MIM法における闘値の設定が今後の

研究で確定されれば,量的形質を支配する遺伝子座の全

体像を明らかにする解析法となることが期待される し

かし解析によって存在が示唆された QTLの真偽について

高橋14

3種 (1M,C1M法および阻M法)の解析法による QTLの位置と遺伝効果の推定表 1

寄与率的

qDT-I-I IH 125 3.7 4.8 11.8

2 qDT-5-2 5H 230 13.5 -8.4 35.2

C1M (LOD=2.7)

相加効果))LOD2) 位置(cM)])染色体QTL 番号解析法(閥値)

1M (LOD=2.7)

'l

nxu

fo

54

f

h

崎、du

RU

'

I

Q

J

今、Jnk

U

4

‘dn

。。A守

4

1J

foaA守

l

e

AYAU

3

nU勾

3

F

、d

'l

吋4

'

I

H

H

H

'lp

、J

re

t-吋ノ旬

,,“

'l

,、J勾,,

T

T

T

D

D

D

nuanu1nu1

'l

今4

司、ザ

・5…M

・I…M 7.5

-1.0

7.8

3.4

2.9

2.8

32.2

4.1

6.1

3.5

2.6

合計 72.0

3.4

2.8

-5.0

-2.6

-1.9

-2.1

-7.6

-2.8

3.7

(3.5)

(-2.0)

4.2

1.1

3.3

3.0

1.7

1.8

18.9

2.7

5.6

1.8

1.4

III

101

112

129

153

61

230

48

153

H

H

H

H

H

H

H

H

H

tI

ウ&

-

J

A

斗戸、d

p

、J

勾/

勺J

qDT_I_I1.4,5

qDT-2・I1

qDT・2・21

qDT-3-11.4

qDT・4-11

qDT・5・11.4

qDT _5_21.4.5

qDT-7-11,4

qDT-7-21人5

qDT-2-1 xqDT-2-21

qDT-3-1 xqDT-7-11.4

'I

内ノ匂

J

a

斗ベd

fO

J

oony

])位置 (cM)は短腕端部のマーカーからの地図距離を示し,Kosambi関数を用いた2)LODは最尤法によるスコア.

3)相加効果は雌性由来の対立遺伝子の作用方向を正と定義する カッコ 内は交互作用による効果.4)寄与率は解析した分離集団 (DH系統)の表現型分散に占める各 QTLの逃伝効果の寄与する割合(%)

を示す5)QTLの右肩にモデル選択に用いたペナルティー (1,4またはめを示す.

引用文献

Churchill, G.A. and R.W. Doerge (1994) Genetics 138: 963-971

Kao, C.-H., Z.-B. Zeng and R.D. Teasdale (1999) Genetics 152:

1203-1216.

Lincoln, S., M. Daly and E.S. Lander (1993) Mapping genes controlling

quantitative岡市 usingMAPMAKER/QTL version 1.1: a tutorial

and reference manual, 2nd edn. Whitehead Institute for Biometri-

cal Research, Cambridge, Mass.

Mano, Y., F. Omori, T. Takamizo, B. Kindiger, R.McK. Bird, C.H.

Loaisiga and H. T紘ahashi(2007) Plant Soi1295: 103ー113

中道礼一郎 (2004)ショウジョウパエ性櫛数関連遺伝子の探察

QTLマッピングー, “実践生物統計学一分子から生態まで'¥

東京大学生物測定学研究室編,朝倉書庖,東京, 81-96

Tak油 ashi,H., K. Sato and K. Takeda (2001) Euphytica 122: 37-43.

Tanksley, S.D. (1993) Annu. Rev. Genet. 27: 205-233

鵜飼保雄・大津 良・斉藤彰・林武司 (1995)育雑 45:139-142

Wang, S., C.J. Basten and Z.-B. Zeng (2006) Department ofStatistics,

NoロhCarolina State University, Raleigh, NC, USA. http://

statgen.ncsu.edulqtlcarもWQTLCart.htm.

Zeng, Z.-B., C.-H. Kao and C.J. Basten (1999) Genet. Res. Camb. 74:

279-289.

は,戻し交配等によ って遺伝的背景をより揃えたうえで,

実験的な検証が必要であるこ とは言うまでもない 本稿

がより多くの研究者のお役に立てば幸いである.

謝辞

本稿に供試したデータは著者の学位論文(岡山大学大

学院自然科学研究科)の抜粋であり,岡山大学資源生物

科学研究所教授 武田和義博士の研究室において実施し

た実験から得られたものである.本稿の審査にあたり 2

名の査読者ならびに編集委員の独立行政法人農業生物資

源研究所 QTLゲノ ム育種研究セ ンタ ー長 矢野昌裕博士

にご、指導いただいた また,本稿をまとめるにあたり元

東京大学農学部教授 鵜飼保雄博士,秋田県立大学生物

資源科学部教授 赤木宏守博士ならびに独立行政法人農

業 ・食品産業技術総合研究機構畜産草地研究所飼料作物

育種研究チーム 間野吉郎博士から的確なアドバイスを

いただいた. ここに記して感謝の意を表する.