仮想化技術を利用した解析環境の構築 - pdbj ·...

32
仮想化技術を用いたNMRデータの統合的解析環境 大阪大学 蛋白質研究所: 小林直宏 1

Upload: others

Post on 10-Sep-2019

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 仮想化技術を用いたNMRデータの統合的解析環境

    大阪大学 蛋白質研究所: 小林直宏

    1

  • 1.仮想化技術を利用した解析環境の構築 2.化学シフトデータベースとその応用 3.PDBj-BMRBにより開発されたツール群の紹介

    2

  • 仮想化技術を利用した解析環境の構築

    3

  • 1

    4

    40

    400

    4000

    40000

    400000 800000

    トラ

    ンジ

    スタ

    1970 1980 1990 2000 2010

    計算機の高速化、マルチコア化は急速に進む

    Core-i7/5/3ファミリーの登場

    Ivy Bridge プロセスルール:32nm 3次キャッシュ: 8MB 仮想化対応: VT-x,VT-d 2~4コア

    4

  • 仮想化のメリット 少電力化、省スペース化が期待できる 仮想サーバーを冗長的に運用することで耐障害性向上が期待できる バックアップ、復元の操作が容易(仮想OSイメージをコピーすればいい) 研究支援プログラムなど長期運用が可能 ハードウエアの寿命、故障等の心配から解放される・・・? 一度OSイメージのイメージが出来れば他の仮想環境への 移行は比較的簡単

    仮想化のデメリット 何でも仮想化出来るわけではない(特殊デバイス、OSのタイプなど) Windows, MacOSXなどライセンス的に難しいものは対応が困難 非常に高いマシンスペックを必要とする OSイメージのバックアップなどに大量のストレージを消費する

    現在稼働中のマシンの仮想化は大変難しい P2Vソフトを利用すればよいが、そう簡単ではない・・・

    ライセンスの扱いには特に注意が必要です! 5

  • 高速なサーバー Xeon 560番台、6-Core X 2 (12-Core) 32GB メモリ 256GB SSD (~300MB/sec) 2TB RAID1+0 / 2TB RAID1+0 mirror ホストOS:CentOS 5.7-64bit / Xen

    高速な仮想クライアント Core i7-2600 (4-Core) 12GBメモリ 128G SSD (~400MB/sec) 1TB ソフトウエアRAID1 USB3.0 (~300MB/sec) ホストOS:Windows7-64bit / VirtualBox

    具体的な仮想化解析環境の設定事例

    コア数、搭載メモリも多めに ストレージの転送速度も重要

    6

  • Institute for Protein Research firewall

    FTP

    BMRB Web

    BMRB Mirror

    SMS DEP

    ADIT-NMR

    DATA Serv.

    サーバー群を仮想化する前の構成

    Internet 7

  • サーバー群仮想化による耐障害性の強化

    8

  • 多くの解析用アプリケーションをインストールした 仮想OSイメージにより環境設定の手間を省く

    CentOS6.2-32bit/64bit + VirtualBox (Xen, KVM) NMRPipe, MagRO-NMRView, CcpNmr, MolMol, SPARTA+, ShiftX *Cyana, Xplor-NIH, CNS CS-ROSETTA, HADDOCK *Amber12, Gromacs, *Gaussian

    * 商用に付きライセンスを購入する必要があります

    9

  • 仮想化技術による解析とデータベース登録支援

    サーバー

    仮想サーバー

    仮想クライアント

    デスクトップ

    NMR装置

    NMR測定データ

    Xen, VirtualBoxの解析環境 モニターを募集しています

    BMRB PDB

    公共データベース

    データ交換

    データ交換

    データ交換

    10

  • 化学シフトデータベースとその応用

    11

  • 化学シフト:生体高分子のNMRデータとして最も重要なパラメータ

    誘引効果 環電流効果

    その他 動力学的状態の変化 化学交換、同位体効果、Strong couplingなど

    水素結合

    化学構造依存性

    12

  • 化学シフト、シグナル帰属データの利用先は

    リガンド滴定実験

    15N核緩和によるダイナミックス解析

    立体構造決定

    配向試料の残余双極子

    13

  • NMRデータベースの運用・開発とその連携

    Osaka University Programmer / Sysadmin.

    Takeshi Iwata

    University of Wisconsin-Madison Programmer / Sysadmin.

    Dimitiri Maziuk

    Tool dev. Kent Wenger

    研究者の要望を元に、互いに連携しながら機能の向上を目的に開発を行なっている。

    14

  • BMRB (BioMagResBank): 生体高分子NMRデータベース

    NMR構造は年間500件以上 BMRBエントリーは600件以上 のペースで増え続けている

    2011年12月末の時点で NMR構造は約9,200件

    BMRBエントリーは約7,600件 に達している

    0

    10,000

    20,000

    30,000

    40,000

    50,000

    60,000

    70,000

    80,000

    20112009

    20072005

    20032001

    19991997

    19951993

    1991

    NMR structure All

    0

    1,000

    2,000

    3,000

    4,000

    5,000

    6,000

    7,000

    8,000

    9,000

    10,000

    20112009

    20072005

    20032001

    19991997

    19951993

    1991

    NMR structure BMRB

    15

  • SPARTA: 主鎖側鎖2面角から化学シフト(1HN, 15N, 13CO, 13Cα and 13Cβ)

    Shen Y. and Bax Ad J. Biomol NMR (2007)

    Target 3D structure

    Predicted chemical shifts, 1HN, 15Nα, 1Hα, 13C', 13Cα and 13Cβ

    Tri-peptide set

    200 proteins Chemical shifts from BMRB

    Structures from RCSB

    Tri-peptide database

    24,000 tri-peptides

    φ, ψ and χ1 angles

    2nd chemical shifts

    Ring current effect

    Chemical shift similarity score H-bond effect

    H N

    C H H

    N

    H C

    C

    H N

    C H

    =

    C O

    =

    C O

    =

    O

    16

  • 化学シフトから主鎖2面角へ: TALOS/TALOS+

    1HN, 15N, 13CO, 13Cα +13Cβ

    2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350

    立体構造から化学シフトへ: SPARTA/SPARTA+

    1HN, 15N, 13CO, 13Cα +13Cβ

    2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350

    PDB

    BMRB

    φ、ψ2面角 類似検索

    立体構造座標

    PDB

    BMRB

    類似検索

    17

  • 化学シフトから立体構造へ:

    1HN, 15N, 13CO, 13Cα +13Cβ

    2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350

    化学シフトをよく満たすフラグメントを検索

    3D 構造

    フラグメントのアセンブリ 化学シフトをよく満

    たすアセンブリを選択

    CS-ROSETTA Shen, Y. et al., Proc. Natr. Acad. Sci. (2008)

    18

  • 化学シフトの更なる応用: 過渡的中間対構造のモデリング

    A Transient and Low-Populated Protein-Folding Intermediate at Atomic Resolution D. M. Korzhnev, T. L. Religa, W Banachewicz, A. R. Fersht and L. E. Kay

    19

  • Neudecker, P. et al., Nature (2012)

    20

  • CS-ROSETTAをNMR構造の検証に使う

    1HN, 1Hα, 15Nα, 13Cα, 13C’, 13Cβ

    の化学シフトによるCS-ROSETTA構造 NOEベースの立体構造と重ね合わせ (主鎖RMSD: 1.4Å)

    NOEベースの構造決定とは異なる原理で立体構造が得られるためチェーンフォールドの正しさを検証できる

    Mizuno et al., JMB 2011

    21

  • 3.PDBj-BMRBにより開発されたツール群の紹介

    22

  • MagRO-NMRView: NMRデータ解析とデータベース登録支援

    MagRO-NMRViewがサポートする 複雑なNMR実験データの構造 GUIによるNMRデータの解析と登録準備の 支援機能

    一般登録データ1050件の化学シフト 理研より登録された550件の化学シフト

    SPARTA+を用いてNMR構造と化学シフトの整合性を確認 Kobayashi, et al., 2012 J Biomol NMR in press

    23

  • 間違った側鎖帰属

    no_NOE, bad contact L14:2HB-L14:HN viol_level: -0.440 no_NOE, bad contact L14:2HB-F29:HN viol_level: -1.339 no_NOE, bad contact F91:HA-F91:HN viol_level: -0.212 no_NOE, bad contact F91:2HB-F91:HN viol_level: -0.043 no_NOE, bad contact L14:3HB-C92:HN viol_level: -2.447 no_NOE, bad contact W102:HZ2-L14:HG viol_level: -0.222 no_NOE, bad contact F29:2HB-L141:HD1 viol_level: -0.354 no_NOE, bad contact F29:3HB-L141:HD1 viol_level: -0.591 no_NOE, bad contact W102:HE3-L31:HG viol_level: -0.810 no_NOE, bad contact I106:3HG1-L31:HG viol_level: -2.083 no_NOE, bad contact F29:2HB-F29:HD1 viol_level: -3.712 ... ... no_NOE, bad contact W102:HZ3-F29:3HB viol_level: -1.296 no_NOE, bad contact F80:HZ-F91:2HB viol_level: -2.903 no_NOE, bad contact L14:3HB-F91:3HB viol_level: -2.990 no_NOE, bad contact F80:HZ-F91:3HB viol_level: -2.435 no_NOE, bad contact F91:HD1-F91:3HB viol_level: -1.487

    正しい側鎖帰属

    MagRO-Mol: NMR構造、NOE解析データの表示

    24

  • 2つに分かれているのは明白だが...ちょっと分かりにくい

    -2.5

    -2

    -1.5

    -1

    -0.5

    0

    0.5

    1

    1.5

    2

    2.5

    -2.5 -1.5 -0.5 0.5 1.5 2.5

    多次元尺度構成法で2次元にembedしたmap明確なクラスターが2つ見える

    fit_robot: マルチドメイン構造に対しても構造重ね合わせを自動実行

    25

  • MagRO_Validation: NMR構造の決定精度を化学シフトのみから評価する方法確立の試み

    NMR構造がどの程度確からしいか、客観的な評価法は 現在まで確立されていない

    < なるべくNOE以外の要素で評価させる > ・NMR構造のクオリティー 主鎖コンホメーションの正常さ 側鎖ロタマーの正常さ 分子の水和、水素結合、VdW衝突 ・立体構造から逆算された予測化学シフトとのずれ

    構造決定の自動化が困難になる 手作業で構造決定する場合もいつ終わって良いか分からない

    26

  • NOEピークテーブル、化学シフトテーブルのみから 立体構造を高精度に決定できる定番ソフトウエア 化学シフト帰属ミス、不完全さに対して非常に高い耐性を示す

    NOE完全自動帰属構造計算プログラム:CYANAについて

    0.0

    5.0

    10.0

    15.0

    20.0

    25.0

    1 21 41 61 81 101 121 141 161 181 201

    0.0

    1.0

    2.0

    3.0

    4.0

    5.0

    6.0

    7.0

    8.0

    人為ミスを含むCYANA計算

    化学シフ

    トテー

    ブルの

    不完全

    さ(

    %)

    正解構造

    とのず

    れRMSD(A)

    27

  • MagRO_Validationのベンチマーク CYANAは化学シフトテーブルでの

    疎水残基側鎖間で入れ違いミス(swap)に非常に弱い

    0.0

    2.0

    4.0

    6.0

    8.0

    10.0

    12.0

    1 41 81 121 161 201 241 281 321 361

    single double triple

    quad

    2つのNMR構造について 化学シフト帰属ミスを人工的に発生

    (1ペア~4ペアまでのswap) Randomに疎水残基の帰属をswap

    400個の帰属テーブルをもとに 400回のCYANA計算を実行

    良い構造から悪い構造まで人為的に多数発生させる 人為ミスを含むCYANA計算

    正解構造

    との

    ずれRMSD(A)

    α-Helixリッチなタンパク質 (151残基)

    BMRB-ID: 10035 PDB-ID: 1WK1

    α/β構造混在型タンパク質 (151残基)

    BMRB-ID: 10036 PDB-ID: 1Wlm

    <CYANA計算の詳細>

    NOE peak list (15N, 13C-edited NOESY)

    φψ角制限 (TALOSによる予測)

    水素結合距離制限

    Val, Leuメチルシグナルの立体特異帰属 28

  • MagRO_Validationの性能

    7.0

    12.0

    17.0

    22.0

    27.0

    0.0 1.0 2.0 3.0 4.0

    横軸:正解構造とのずれRMSD(A)

    -8.5

    -7.5

    -6.5

    -5.5

    -4.5

    -3.5

    -2.5

    -1.5

    -0.5

    0.0 1.0 2.0 3.0 4.0

    MagRO_Validation Score

    bacbone normality score

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.0 1.0 2.0 3.0 4.0

    SPARTA+ score

    SPARTA+による評価 WHATCHECKによる評価

    MagRO_Validationによる評価

    SPARTA+によるNMR構造から HN, Cα, Hα, Cβ, Hβ, COの化学シフトの逆算を行う評価法では十分な精度が得られない WHATCHECKは良い性能を示しているが 2.0Å以上の良い構造を正しく評価できていない MagRO_Validationは2.0Å以上の良い構造を より正確に評価できている

    29

  • ツール群の公開サイト: NMRToolBox

    googleなどで "BMRB osaka" を検索してください

    30

  • 謝辞

    阪大蛋白研

    すべて敬称略

    PDBj-BMRB: 藤原敏道、児嶋長次郎、岩田武史、高橋あみ 構造プロテオミクス:池上貴久 情報プロテオミクス:中村春木

    Daron Standley 阪大微生物研 サントリー生有研 菅瀬謙治 理化学研究所 木川隆則 医薬基盤研究所 赤木謙一 広島大学 楯真一 立命館大学 北原亮 京都大学 片平正人、永田崇

    米ウィスコンシン大学 BMRB: Eldon Ulrich, John Markley

    31

  • ご清聴ありがとうございました

    32

    スライド番号 1スライド番号 2スライド番号 3スライド番号 4スライド番号 5スライド番号 6スライド番号 7スライド番号 8スライド番号 9仮想化技術による解析とデータベース登録支援スライド番号 11スライド番号 12スライド番号 13NMRデータベースの運用・開発とその連携スライド番号 15スライド番号 16スライド番号 17スライド番号 18スライド番号 19スライド番号 20スライド番号 21スライド番号 22MagRO-NMRView: NMRデータ解析とデータベース登録支援スライド番号 24スライド番号 25スライド番号 26スライド番号 27スライド番号 28スライド番号 29スライド番号 30スライド番号 31スライド番号 32