windows qtl cartographerによるqtl解析の留意点windows qtl...
TRANSCRIPT
Windows QTL CartographerによるQTL解析の留意点
誌名誌名 育種学研究 = Breeding research
ISSNISSN 13447629
巻/号巻/号 101
掲載ページ掲載ページ p. 11-14
発行年月発行年月 2008年3月
農林水産省 農林水産技術会議事務局筑波産学連携支援センターTsukuba Business-Academia Cooperation Support Center, Agriculture, Forestry and Fisheries Research CouncilSecretariat
育種学研究 10:11-14 (2008)
ノート
Windows QTL Cartographerによる QTL解析の留意点
高橋秀和
秩回県立大学生物資源科学部,秩田市, 干010-0195
QTL analysis using the Windows QTL Cartographer
Hidekazu Takahashi
Faculty 01 Bioresource Sciences, Akita Prφctural University, Akita 010-0195, Japan
キーワード
遺伝効果, QTL解析, Windows QTL Cartographer
1.はじめに
QTL (Quantitative Trait Locus,量的形質遺伝子座)解
析とは,マーカーとの連鎖を利用して QTLの染色体上の
位置と遺伝効果を推定する方法である 量的形質には複
数の QTLが関与する場合が多いため分離集団における個
体の遺伝子型は多様になる さらに環境による変動が加
わるので質的形質のように各個体の遺伝子型を類推する
ことが困難とされてきた.しかし, DNAマーカ一利用に
よる詳細な連鎖地図が作られるようになり, これらを利
用した QTLの検出が可能になった (Ta此 sley1993).
QTL解析は MAPMAKER/QTL(Lincoln et al. 1993)や
MAPL (鵜飼ら 1995)をはじめとする解析ソ フトの開発
により急速に普及した最近ではアメリカノースカロラ
イナ州立大学の Wanget al. (2006)が開発した Windows
QTL Cartographerによる QTL解析の論文が数多く報告さ
れるようになり,容易な操作性と様々な解析法が組み込
まれている点がその理由としてあげられる. しかし, こ
れらの解析法は,統計遺伝学に習熟した研究者には最適
な選択肢や条件検討の機会を提供するが,それ以外の研
究者にと っては逆にその違いが理解できず,誤った操作
法や解釈を導くことも予想される.
本稿では Windows QTL Cartographer Version 2.5
(WinQTLCart, 2007年 8月 21日公開版)の Interval
Mapping (1M)法, Composite Interval Mapping (CIM)法
および MultipleInterval Mapping (MIM)法の統計モデ、ル
(以後モデルと呼ぶ)および検出原理について解説する
次に既に報告しているオオムギ品種 HarringtonとTR306
の倍加半数体 (DH)150系統の形質データ (深播耐性:
DT, Takahashi et al. 2001)を再解析し各解析法の問題
編集委員:矢野昌裕
2007年 5月 14日受領 2007年 11月 12日受理Correspondence: h-takahashi@akita
点とその対処法を検討する.なお WinQTLCartの基本操
作については Wanget al. (2006),あるいは中道 (2004)
を参照されたい.また, WinQTLCartの変更可能な設定
値は,特に説明のない場合,すべて初期値を使用した.
2. QTL解析法の選択
Interval Mapping (1M)法
連鎖地図上の各検定部位において l個の QTLが存在す
ると仮定して隣接するマーカーの遺伝子型をもとに各個
体の QTLの遺伝子型を類推し,その QTLの遺伝効果で
各個体の表現型値のばらつきを説明するモデルを考える
のが 1M法である.この解析法では,検定部位に QTLが
存在しないと仮定したモデ、ルと比較して, QTLが存在す
ると仮定したモデ、ルが表現型値のばらつきをより良く説
明できる統計的な尺度として LODスコアを用いる.ま
た,表現型値のばらつきの中で検定部位に仮定した l個
の QTLで説明できない部分はすべて誤差に含める
Composite Interval Mapping (CIM)法
1M法と同様に連鎖地図上の各検定部位において l個の
QTLが存在すると仮定して表現型値のばらつきを説明す
るモデルを考えるが, 品f法において誤差に含めていた検
定部位以外に存在する QTLの遺伝効果に対してもマー
カーの遺伝子型を基準に考慮するのが CIM法であるこ
の解析法では検定部位以外の QTLの遺伝効果を取り除い
て QTLを検索するため,連鎖する 2個の QTLを分離し
て検出できる場合もある.また,誤差の分散が 1M法に
比べて小さくなるため, 1M法では誤差の分散に紛れて
検出されなかった遺伝効果の小さい QTLについても検出
可能となる
Multiple Interval Mapping (MIM)法
1M法を複数の QTU こ拡張した解析法で,検出された
12
QTLをモデルに含めて新たな QTLを段階的に検出する
のが MIM法である.最終的には複数の QTLとそれらの
交互作用を含むモテ、ノレを考え,表現型値のばらつきを最
も良く説明できるモテ、ルを決定する.この解析法では形
質への関与が示唆された複数の QTLを同時にモデルに含
めるため,形質の遺伝構成を 1M法や CIM法よりも明確
にすることが可能となる.
3. QTLの検出,およびQTLの位置と遺伝効果
の推定
1M法および CIM法では, LODスコ ア(対数尤度)が
大きいモデ、ルほど良いとする 「最尤原理」を用いるので,
LODスコアを結んだ曲線のピー クとな った検定部位に
QTLが存在すると仮定したモデ、ルが各個体の表現型値の
ばらつきを良く説明できることを意味する この LOD曲
線がピークとな った検定部位の有意性は,検定部位の
しODスコアと後述する LODスコアの闘値との比較によ
り判断し,闘値を超える LODスコアの検定部位および
そのモデ、ルから QTLの位置と遺伝効果が推定される.
MIM法では, モデノレ選択規準のひと つの手法である
BIC (Bayesian Information Criterion,ベイズ情報量規準)に
よって QTしを検出しそのモデ‘ルから QTLの位置と遺
伝効果が推定される BICはより簡略 (QTLや交互作用
が少なし、)で‘表現型値への適合度の高いモデ、ルを選択す
るための統計量 (規準)であり, この値が小さいモデル
ほど良いとされる BIC統計量は,パラメータ (QTLや
交互作用)数が多くなるとモデ、ルの対数尤度は大きくな
る 「最尤原理」 とパラメータ数が少ないモデルほど良い
とする 「けちの原理Jで構成され,両者のバランスを取っ
ている.このバランスを調整するために, WinQTLCartで
は, パラメータ数に対する 6種のペナルティーが用意さ
れている. QTLの検出では検定部位に QTLが「存在し
ない」と仮定したモデ、ノレと 「存在する」と仮定したモデ
ルの BIC統計量の比較によって判断し,後者の BIC統計
量が小さければ後者のモデルが選択され,検定前のモデ
ルに QTLが追加される.個々の QTL聞の交互作用の検
出では,交互作用が 「ない」と 「ある」のモデ、ルの BIC
統計量が比較される.
MIM法の手順として QTLの検出と検証, QTLの位置
の最適化および個々の QTL聞の交互作用の検出と検証を
l巡とする操作を QTLが検出されなくなるまで繰り返し
行う必要がある (Zenget al. 1999, Wang et al. 2006).さら
に MIM法による QTLの検出には初期モデ、ルの設定が影
響することもあるので,本稿では Zenget al. (1999)に
従い CIM法で検出された QTLを初期モデ、ル と し はじ
めにそのモデ、ルを検証してから QTLの検出を行った.し
かし,モデル選択規準に対する適当な統計的有意水準を
設定することが困難であり, WinQTLCartにおいては選
択されたモデルが他の全てのモデルに比べて真に良いモ
高橋
デ、ルであるか否かを判断するための有意性検定は用意さ
れていない.
4. QTLの闇値(いきち)の設定
闘値が不当に高く設定されると QTLの検出力は低下す
るが,不当に低く設定されると偽の QTLが多数検出され
る個々の形質データに適合する闇値の設定が不可欠で三
1M 法および CIM 法の闘値は初期設定で LOD=2.5
(LR = 11.5)とされているが,誤った (第 l種の過誤)QTL
の検出を防ぐためにも並びかえ検定 (permutationtest)に
よる闘値の設定が必要である WinQTLCartでは有意水
準 α=0.05,繰返し数 1,000回の条件での闘値の設定を勧
めている この並びかえ検定とは,表現型値の無作為な
並びかえで表現型値とマーカーの遺伝子型の相関を取り
除き, QTLが存在しない状況での LODスコアの分布を
調べて, QTLの闘値を算出する実験的な手法である.
前述したように, MIM法では選択されたモテ、ルに対す
る有意性検定は用意されていないが,モデ、ルに含まれる
個々の QTLについては,その QTLを含むモデル(選択
されたモデノレ)とその QTLを除いたモデルの尤度から
LODスコアが算出される.この MIM法における LODス
コアは,個々の QTLについてモデ、ルに含まれる他のQTL
の効果を考慮したうえで算出された値であるため, 1M法
や CIM 法で用いられる~びかえ検定による闘値の設定は
適当ではない.そのため MlM法では有意性検定を用い
た個々の QTLの信頼性の評価は困難であるが, MIM法
においても LODスコアは個々の QTLの信頼性の目安に
はなるであろうなお並びかえ検定による闘値の意義に
ついての詳細は Churchilland Doerge (1994)を, MIM法
の闘値の考え方については Kaoet al. (1999)を参照され
たい.
5. オオムギ倍加半数体のデータを用いた再解析の
結果と解釈
図 lに 1M法 (上段),CIM法 (中段)および MIM法
(下段)による LOD曲線を示した.縦軸に LODスコア
を,横軸にはオオムギの 7本の染色体の連鎖地図 (距離)
を示した MAPMAKER/QTL(1M法)によって供試デー
タの QTLは 1Hおよび 5H染色体に検出されている
(Takahashi et al. 2001). これらの QTLの位置は 1M法に
よる LOD曲線のピークの位置とほぼ一致した CIM法
では 1M法で検出された QTL(qDT-I-1および qDTふ 2)
に加え l個の QTL(qDT・7・2)が検出された 1M法およ
びCIM法の LODの闘値 (並びかえ検定,α=0.05,1,000
回)はともに LOD=2.7であった.MIM法 (ペナノレテ ィー
1 : BlC-MO)では CIM 法で検出された 3個の QTLに加
え,新たに 6個の QTしが検出された.M1M法による LOD
曲線の IHおよび2H染色体のピーク (20および 50cM付
Windows QTL Cartographerによる QTL解析 13
lJ~福kbk/kk:l~LLbLJbL
1 H (140cM) 2H (198cM) 3H (151cM) 4H (157cM) 5H (230cM) 6H (158cM) 7H (183cM)
図 1. Interval Mapping (1M)法.Composite Interval Mapping (CIM)法および Multiple
lnterval Mapping (MIM)法による LOD曲線の比較
供試データは Takahashiet al. (2001)のオオムギの DH系統(150系統)の深播
耐性 (DT)の解析結果を用いた
縦軸に LODスコアを,横軸にオオムギの 7本の染色体に対応する連鎖地図
(Kosambi 関数)を示す.
染色体の左側に短腕(右側に長腕)を示し,短腕端部の 7 ーカ一位置 (0cM)に
矢頭を. 50 cM毎に目盛りを付す
1M法および CIM法では水平の点線で閥値 (LOD=2.7)を示した.
近)は,本稿では QTLとして検出されなかった.これら
は QTLの検出過程では候補のモデルとされたが,検証過
程で選択されなかったモデルであったので, これ以降の
QTLの検出を行わなかった.
表 1に各解析法で検出された QTLの遺伝効果を示す
1M法および CIM法で検出された QTLは. MIM法では
寄与率が 6.1%以上であったが. qDT-l-lおよび qDT司 5・2.
の相加効果はモデル(検定部位以外の遺伝効果の影響)
の違いにより 1M法.CIM法および MIM法の順に小さく
なったまた,個々の QTLの遺伝効果が独立であればそ
れらの共分散は理論的に 0となるが,共分散が生じたた
め寄与率 (qDT-2-1.-1.0%)が負値となる場合もあった
寄与率が 4.1%以下の QTL(qDTふ 1.qDT-4・1.qDTふ l
および qDT-7-1)の位置は 1M法および CIM法において
闘値に至らなかった LOD曲線のピークの位置とほぼ一
致した(図1).qDT-2-2の寄与率は 7.8%であったが.IM
法および C1M法では検出されなかった これは.qDT・2・
2は相加効果の方向の異なる qDT-2-1と連鎖するので.IM
法では 2個の QTLを分離できず l個の LOD曲線のピー
クが闘値に至らなかった. CIM法では 2個の QTLは分
離できたがし、ずれの LOD曲線のピークも闇値に至らな
かったので検出されなかったと考えられる.
1M法や CIM法に比べてより複雑なモデ、ルを考慮する
MIM法では,より多数の QTLや交互作用を含むモデル
が誤って選択される可能性もあり ,選択されたモデ、ルの
有意性を検定する統計的なツールが提供されていないの
で.BIC統計量のベナルティー設定を変更して QTしの再
検出を行い,選択されたモデルの信頼性の評価を試みた.
BIC統計量のペナルティー設定を変更して QTLを再検出
すると,ペナルティーの大きさ(I: B1じM1< 4: BIC-M2 < 5 : BIC-M3)によって検出される QTLの数は異な
り,ペナルティー 4(BIC-M2)では 6個の QTL(交互作
用 1個)が,ペナルティー 5(BIC-M3)では 3個の QTL
が検出された(表1)
以上のよ うに.MIM法の解析結果の解釈において,
WinQTLCartでは選択されたモデルの信頼性は直接的に
は評価されないので. B1C統計量のペナルティー設定の
変更あるいは CIM法などで検出された QTLによる有意
性検定を担保に個々の QTLの信頼性を示すことが必要と
考える.
6. おわりに
1M法およびCIM法では遺伝効果の小さい QTLは誤差
の分散に紛れて検出され難い.MIM法では信頼性の規準
が確立されていない,あるいは負値の寄与率が表示され
る問題点がそれぞれあげられる.その対処法として,前
述した複数の解析法による解析結果を比較して各問題点
を補償しあうことが有効と考える 例えば. Mano et al
(2007)のように CIM法と MIM法を並記することもひと
つの対処法である MIM法における闘値の設定が今後の
研究で確定されれば,量的形質を支配する遺伝子座の全
体像を明らかにする解析法となることが期待される し
かし解析によって存在が示唆された QTLの真偽について
高橋14
3種 (1M,C1M法および阻M法)の解析法による QTLの位置と遺伝効果の推定表 1
寄与率的
qDT-I-I IH 125 3.7 4.8 11.8
2 qDT-5-2 5H 230 13.5 -8.4 35.2
C1M (LOD=2.7)
相加効果))LOD2) 位置(cM)])染色体QTL 番号解析法(閥値)
1M (LOD=2.7)
'l
nxu
fo
勺
,
吋
54
弓
f
h
崎、du
RU
'
I
Q
J
今、Jnk
U
4
‘dn
一
一
。。A守
内
4
1J
foaA守
l
e
AYAU
今
3
nU勾
3
F
、d
・
'l
吋4
'
I
H
H
H
'lp
、J
司
re
t-吋ノ旬
今
,,“
'l
,、J勾,,
T
T
T
D
D
D
nuanu1nu1
'l
今4
司、ザ
・5…M
・I…M 7.5
-1.0
7.8
3.4
2.9
2.8
32.2
4.1
6.1
3.5
2.6
合計 72.0
3.4
2.8
-5.0
-2.6
-1.9
-2.1
-7.6
-2.8
3.7
(3.5)
(-2.0)
4.2
1.1
3.3
3.0
1.7
1.8
18.9
2.7
5.6
1.8
1.4
III
101
112
129
153
61
230
48
153
H
H
H
H
H
H
H
H
H
tI
ウ&
ヲ
-
弓
J
A
斗戸、d
p
、J
勾/
勺J
qDT_I_I1.4,5
qDT-2・I1
qDT・2・21
qDT-3-11.4
qDT・4-11
qDT・5・11.4
qDT _5_21.4.5
qDT-7-11,4
qDT-7-21人5
qDT-2-1 xqDT-2-21
qDT-3-1 xqDT-7-11.4
'I
内ノ匂
内
J
a
斗ベd
fO
勾
J
oony
])位置 (cM)は短腕端部のマーカーからの地図距離を示し,Kosambi関数を用いた2)LODは最尤法によるスコア.
3)相加効果は雌性由来の対立遺伝子の作用方向を正と定義する カッコ 内は交互作用による効果.4)寄与率は解析した分離集団 (DH系統)の表現型分散に占める各 QTLの逃伝効果の寄与する割合(%)
を示す5)QTLの右肩にモデル選択に用いたペナルティー (1,4またはめを示す.
引用文献
Churchill, G.A. and R.W. Doerge (1994) Genetics 138: 963-971
Kao, C.-H., Z.-B. Zeng and R.D. Teasdale (1999) Genetics 152:
1203-1216.
Lincoln, S., M. Daly and E.S. Lander (1993) Mapping genes controlling
quantitative岡市 usingMAPMAKER/QTL version 1.1: a tutorial
and reference manual, 2nd edn. Whitehead Institute for Biometri-
cal Research, Cambridge, Mass.
Mano, Y., F. Omori, T. Takamizo, B. Kindiger, R.McK. Bird, C.H.
Loaisiga and H. T紘ahashi(2007) Plant Soi1295: 103ー113
中道礼一郎 (2004)ショウジョウパエ性櫛数関連遺伝子の探察
QTLマッピングー, “実践生物統計学一分子から生態まで'¥
東京大学生物測定学研究室編,朝倉書庖,東京, 81-96
Tak油 ashi,H., K. Sato and K. Takeda (2001) Euphytica 122: 37-43.
Tanksley, S.D. (1993) Annu. Rev. Genet. 27: 205-233
鵜飼保雄・大津 良・斉藤彰・林武司 (1995)育雑 45:139-142
Wang, S., C.J. Basten and Z.-B. Zeng (2006) Department ofStatistics,
NoロhCarolina State University, Raleigh, NC, USA. http://
statgen.ncsu.edulqtlcarもWQTLCart.htm.
Zeng, Z.-B., C.-H. Kao and C.J. Basten (1999) Genet. Res. Camb. 74:
279-289.
は,戻し交配等によ って遺伝的背景をより揃えたうえで,
実験的な検証が必要であるこ とは言うまでもない 本稿
がより多くの研究者のお役に立てば幸いである.
謝辞
本稿に供試したデータは著者の学位論文(岡山大学大
学院自然科学研究科)の抜粋であり,岡山大学資源生物
科学研究所教授 武田和義博士の研究室において実施し
た実験から得られたものである.本稿の審査にあたり 2
名の査読者ならびに編集委員の独立行政法人農業生物資
源研究所 QTLゲノ ム育種研究セ ンタ ー長 矢野昌裕博士
にご、指導いただいた また,本稿をまとめるにあたり元
東京大学農学部教授 鵜飼保雄博士,秋田県立大学生物
資源科学部教授 赤木宏守博士ならびに独立行政法人農
業 ・食品産業技術総合研究機構畜産草地研究所飼料作物
育種研究チーム 間野吉郎博士から的確なアドバイスを
いただいた. ここに記して感謝の意を表する.