質量分析計によるメタボローム解析パイプラインの...

32
質量分析計によるメタボローム解析パイプラインの 紹介と化合物の同定・アノテーションの定義付け 草野都 1 、中林亮 1 、岡咲洋三 1 、及川彰 1 斉藤和季 1,2 1 理化学研究所CSRS 2 千葉大学・大学院薬学研究院 2013/9/12 Miyako Kusano (RIKEN CSRS) バイオインフォマティクス講習会 1 第31回日本植物細胞分子生物学会(札幌)大会・シンポジウム 北海道大学 高等教育推進機構

Upload: others

Post on 05-Jun-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

質量分析計によるメタボローム解析パイプラインの紹介と化合物の同定・アノテーションの定義付け

草野都1、中林亮1、岡咲洋三1、及川彰1、斉藤和季1,2

1理化学研究所CSRS2千葉大学・大学院薬学研究院

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会1

第31回日本植物細胞分子生物学会(札幌)大会・シンポジウム北海道大学 高等教育推進機構

メタボロミクスの歴史

概念のポイント:代謝物群の量的・質的なパターンは複雑な生物システムの状態を反映する

• Metabolomicsのさきがけ“Quantitative analysis of urine vapor and breath by gas-Liquid partition chromatography” by Robinson and Pauling (1971)

• Metabolomeの登場“Systematic functional analysis of the yeast genome” by Oliver et al. (1998)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会2

植物の生産する代謝物の多様性と化学構造植物メタボロームの複雑さ

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会3

植物界全体のメタボローム

動物

シロイヌナズナ

・存在する酵素および化学反応から推定される代謝物総数: 20万種生産可能

約5000種類

約2500種類(ヒト)

植物の生産する代謝物の多様性と化学構造代謝物群の物理化学的性質

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会4

Molecular weight

親水性

脂肪酸

アミノ酸

二次代謝物(中性物質)

水溶性ビタミン類

核酸

揮発性物質油用性ビタミン類

極性膜脂質

補酵素

テルペノイド類

大小

フラボノイド類

有機酸

糖類

メタボロミクスに用いる機器分析理研の非ターゲット分析プラットフォーム

5

異なる物質分離技術+高性能TOF質量分析計⇒代謝物測定を広範囲にサポート可能

生データ行列バイオインフォマティクス

一次代謝物揮発性物質

極性二次代謝物極性膜脂質

イオン性物質

UPLC-Q-TOF-MS CE-TOF-MSGC-TOF-MS

データ解析

メタボロミクスに用いる機器分析機器の組み合わせによる測定範囲のカバー率

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会6

Molecular weight

親水性

フラボノイド類

脂肪酸

アミノ酸

有機酸

二次代謝物(中性物質)

糖類水溶性ビタミン類

核酸

揮発性物質油用性ビタミン類

極性膜脂質

補酵素

テルペノイド類

大 (< 2000)小 (>= 16)

GC-MS

LC-MS

CE-MS

メタボロミクスに用いる機器分析機器の組み合わせによる測定範囲のカバー率

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会7

Molecular weight

親水性

大 (< 2000)小 (>= 16)

GC-MS

LC-MS

CE-MSESI

EI

EI(誘導体化後)

GC-MS

LC-MS CE-MS

メタボロミクスに用いる機器分析超高分解能質量分析計

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会8

FT-ICR-MS

高極性二次代謝物群

高分解能、精密質量測定(< 1 ppm) による組成式分析が可能に

GC-HRT-TOF-MS

揮発性成分等

メタボロミクスに用いる機器分析生成イオンの品質

• 感度(sensitivity)

• 分解能(resolution)

• 検出限界(detection limit)

• 信号対雑音比(signal-to-noise ratio, S/N)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会9

質量分析計のスペックに依存

メタボロミクスに用いる機器分析検出限界とS/N比-メタボロミクスでの定義

• 検出限界

The lower limit of quantification (LLOQ)

The limit of detection (LOD)

• メタボロミクスでのLLOQおよびLOD

S/N > 10 for LLOQ

S/N > 3 for LOD

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会10

加えて、化合物ピークが濃度依存的に直線性=定量性を示すことが重要

代謝物ピークの定量性判定法マトリックス効果

• マトリックス効果とは?

分析対象成分と共に存在する夾雑成分の影響により、分析対象成分のピーク形状が変動する現象

メタボロミクスでは、非常に大きな問題

• イオン化法によるマトリックス効果ESI >> EI

• 広義では、ケミカルノイズもマトリックス効果に含まれる

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会11

代謝物ピークの定量性判定法標準物質による定量法の限界

• 代謝物を定量するには・・・

標準物質を用いて検量線を引く必要あり

• メタボロミクスの場合

測定対象が数百ピーク

標準物質が入手できないものあり

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会12

代謝物ピークの定量性判定法抽出物を使った検量線の作成

• 2種類の植物抽出物を異なる濃度で混合

【利点】異なるサンプル間でピークの濃度の違いが分かる未同定ピークについても検量線を作成可能

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会13

代謝物ピークの定量性判定法混合抽出物の全イオンクロマトグラム

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会14

Pure fruit

(100:0)

Pure leaf

(0:100)

50:50 mix

(50:50)

+

代謝物ピークの定量性判定法抽出物の疑似濃度勾配調製

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会15

Two samples with stepwise concentration gradients

X = Y: 蓄積量が同じピークX < Y: Yで蓄積量が多いピークX > Y: Xで蓄積量が多いピーク

化合物ピークが濃度依存的に直線性=定量性を示す

代謝物ピークの定量性判定法マトリックス効果の判別

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会16

Two samples with stepwise concentration gradients

化合物ピークが濃度依存的に直線性=定量性を示さないマトリックス効果

疑似濃度勾配抽出物内の代謝物ピークのレスポンス評価のためのモデル選択

• 理想的なレスポンスは、混合比に依存したロジスティック曲線(ケースb)

これを検出するための非線形回帰モデルを適用

(Five-parameter log-logistic (5-LL) model )

• 実際に検出されるレスポンスは、各点のスムージングで検出可能

Loess regression modelの適用2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会17

2つの非線形回帰モデルによる定量性評価

• 検出されたピーク強度を5-LLおよびLoessでフィッティング後、ピーク強度について相関係数R2を計算

• 良好な場合:高いR25-LL値&高いR2

Loess値

• 悪い場合A:低いR25-LL値&高いR2

Loess値

マトリックス効果の影響を受けている可能性大

• 悪い場合B:低いR25-LL値&低いR2

Loess値

蓄積量が非常に低いかノイズの影響を受けている

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会18

実行例

2013/9/12 19

実で蓄積量多い:83/224 ピーク (37%)

葉で蓄積量多い:42/224 ピーク (19%)

他のピークは変化なし(p < 0.05)

良好な場合

悪い場合A

悪い場合B

実行例ー良好な場合

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会20

fruit < leaffruit > leaf

実行例ー悪い場合A

2013/9/12 21

m/z 277 and 307

m/z 154,

254 and

256

ピーク抽出プログラムで抽出したピークレスポンス (b, c)

SMを使ったピークレスポンス (d, e)

実行例ー悪い場合B

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会22

ピークレスポンスのばらつき大 (21%)

ピークレスポンスのばらつき小(0.6%)

fruit = leafpoor detection

performance

未知・既知化合物の同定・アノテーションのための定義代謝物同定のレベル

1. Identified compounds 同定 ‘Known knowns’

2. Putatively annotated compounds 注釈 ‘Known knowns’

3. Putatively characterized compound class 化合物の種類‘Known unknowns’

4. Unknown compounds 未同定化合物 ‘Unknown unknowns’

Cf. Metabolomics Standards Initiative (MSI)内のChemical Analysis Working Group (CAWG)による定義付け (2007)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会23

未知・既知化合物の同定・アノテーションのための定義レベル1および2の違い

• レベル1: Identified compounds

• メタボロミクスでは新規化合物でないことが多い

• 標準物質(市販もしくは単離したもの)による保持時間およびMSスペクトル比較が必須

どちらか片方のみの場合はレベル2となる

• 新規化合物の場合は、物理化学的性質の記載が必須

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会24

未知・既知化合物の同定・アノテーションのための定義レベル1および2の違い

• レベル2: Putatively annotated compounds

• 対象化合物の公共・市販スペクトルライブラリとの比較によるスペクトル類似度により決定

• 文献値もしくは外部研究室のデータ比較はこのレベルとなる

• 標準物質を用いた比較ができない場合もこのレベルとなる

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会25

未知・既知化合物の同定・アノテーションのための定義レベル3

• レベル3:Putatively characterized compound class

• 対象化合物が持つ特徴的な物理化学的性質もしくはスペクトルの類似性による分類例1.二糖類に特徴的なMSスペクトルをもつピーク(GC-MS)名前はつかないが、二糖類として分類

例2.アントシアニン類の特徴的なUVスペクトル(LC-PDA) 名前はつかないが、アントシアニン類として分類

Cf. 以下の情報を明記する必要あり保持時間(指標)、MSスペクトル内の特徴的なイオン、MS/MSデータ(あれば)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会26

未知・既知化合物の同定・アノテーションのための定義レベル4

• レベル4:Unknown compounds• ノイズとの区別が重要• そのために、検出データ内で、(1)他のピークと分離していること(2)定量性があることが確認されなければならない

Cf. 以下の情報を明記する必要あり保持時間(指標)、MSスペクトル内の特徴的なイオン、MS/MSデータ(あれば)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会27

分析ネットワークへの分析依頼時のポイント

• 機器選定• 分析対象が完全な非ターゲットによる分析か、ある程度化合物クラスが決まっているか?

• 十分な数の生物学的繰り返し実験数があるか?• レベル4の未知化合物の構造推定はどのプラットフォームでも困難

• 実験期間• 依頼を受けてから結果をお返しするのに、時間がかかることが多いので、あらかじめご了承ください

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会28

分析ネットワークで得たデータの解釈の仕方について

• 基本的にデータ行列の構成はどのプラットフォームでも同じ

「化合物ピーク」 x 「正規化後のピーク強度」

• 化合物同定のレベルについては、使用している器機により異なる

研究成果の重要な部分で使用する場合は担当者に確認を取ることをお勧めします

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会29

GC-TOF-MS分析結果の例

• 化合物同定レベル• 各ピーク強度は、カスタムスクリプトで直線性があるかどうかを評価し、90%以上のものだけを使用しています

• 全てMSスペクトルデータをマニュアルで確認しています

I, identified (レベル1)

A, annotated (レベル2)

M1, Mass Spectral Tag from MPIMP (レベル4)

M2, RIKEN Mass Spectral Tag (レベル4)

U, Unidentified (レベル4もしくはノイズ)

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会30

まとめ

• メタボロミクスの技術基盤が化合物・イオン分離技術に頼っているため、複数の機器分析の組み合わせが重要

• 検出ピークの評価には、バイオインフォマティクスが不可欠

• メタボロミクスでの化合物同定には、4つのレベルが存在する

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会31

謝辞

• 理研CSRS

• 福島敦史研究員 (バイオインフォマティクス)

• 小林誠TS (GC-MS)

• 森哲哉TS (LC-MS)

• 佐々木亮介TS (CE-MS)

• 高野耕司TS (LC-MS)

• SMC

• Dr. T. Moritz

• Umea Univ

• Dr. J. Par

• Dr. H. Stenlund

2013/9/12 Miyako Kusano (RIKEN CSRS)

バイオインフォマティクス講習会32