仮想化技術を利用した解析環境の構築 - pdbj ·...
TRANSCRIPT
-
仮想化技術を用いたNMRデータの統合的解析環境
大阪大学 蛋白質研究所: 小林直宏
1
-
1.仮想化技術を利用した解析環境の構築 2.化学シフトデータベースとその応用 3.PDBj-BMRBにより開発されたツール群の紹介
2
-
仮想化技術を利用した解析環境の構築
3
-
1
4
40
400
4000
40000
400000 800000
トラ
ンジ
スタ
数
1970 1980 1990 2000 2010
計算機の高速化、マルチコア化は急速に進む
Core-i7/5/3ファミリーの登場
Ivy Bridge プロセスルール:32nm 3次キャッシュ: 8MB 仮想化対応: VT-x,VT-d 2~4コア
4
-
仮想化のメリット 少電力化、省スペース化が期待できる 仮想サーバーを冗長的に運用することで耐障害性向上が期待できる バックアップ、復元の操作が容易(仮想OSイメージをコピーすればいい) 研究支援プログラムなど長期運用が可能 ハードウエアの寿命、故障等の心配から解放される・・・? 一度OSイメージのイメージが出来れば他の仮想環境への 移行は比較的簡単
仮想化のデメリット 何でも仮想化出来るわけではない(特殊デバイス、OSのタイプなど) Windows, MacOSXなどライセンス的に難しいものは対応が困難 非常に高いマシンスペックを必要とする OSイメージのバックアップなどに大量のストレージを消費する
現在稼働中のマシンの仮想化は大変難しい P2Vソフトを利用すればよいが、そう簡単ではない・・・
ライセンスの扱いには特に注意が必要です! 5
-
高速なサーバー Xeon 560番台、6-Core X 2 (12-Core) 32GB メモリ 256GB SSD (~300MB/sec) 2TB RAID1+0 / 2TB RAID1+0 mirror ホストOS:CentOS 5.7-64bit / Xen
高速な仮想クライアント Core i7-2600 (4-Core) 12GBメモリ 128G SSD (~400MB/sec) 1TB ソフトウエアRAID1 USB3.0 (~300MB/sec) ホストOS:Windows7-64bit / VirtualBox
具体的な仮想化解析環境の設定事例
コア数、搭載メモリも多めに ストレージの転送速度も重要
6
-
Institute for Protein Research firewall
FTP
BMRB Web
BMRB Mirror
SMS DEP
ADIT-NMR
DATA Serv.
サーバー群を仮想化する前の構成
Internet 7
-
サーバー群仮想化による耐障害性の強化
8
-
多くの解析用アプリケーションをインストールした 仮想OSイメージにより環境設定の手間を省く
CentOS6.2-32bit/64bit + VirtualBox (Xen, KVM) NMRPipe, MagRO-NMRView, CcpNmr, MolMol, SPARTA+, ShiftX *Cyana, Xplor-NIH, CNS CS-ROSETTA, HADDOCK *Amber12, Gromacs, *Gaussian
* 商用に付きライセンスを購入する必要があります
9
-
仮想化技術による解析とデータベース登録支援
サーバー
仮想サーバー
仮想クライアント
デスクトップ
NMR装置
NMR測定データ
Xen, VirtualBoxの解析環境 モニターを募集しています
BMRB PDB
公共データベース
データ交換
データ交換
データ交換
10
-
化学シフトデータベースとその応用
11
-
化学シフト:生体高分子のNMRデータとして最も重要なパラメータ
誘引効果 環電流効果
その他 動力学的状態の変化 化学交換、同位体効果、Strong couplingなど
水素結合
化学構造依存性
12
-
化学シフト、シグナル帰属データの利用先は
リガンド滴定実験
15N核緩和によるダイナミックス解析
立体構造決定
配向試料の残余双極子
13
-
NMRデータベースの運用・開発とその連携
Osaka University Programmer / Sysadmin.
Takeshi Iwata
University of Wisconsin-Madison Programmer / Sysadmin.
Dimitiri Maziuk
Tool dev. Kent Wenger
研究者の要望を元に、互いに連携しながら機能の向上を目的に開発を行なっている。
14
-
BMRB (BioMagResBank): 生体高分子NMRデータベース
NMR構造は年間500件以上 BMRBエントリーは600件以上 のペースで増え続けている
2011年12月末の時点で NMR構造は約9,200件
BMRBエントリーは約7,600件 に達している
0
10,000
20,000
30,000
40,000
50,000
60,000
70,000
80,000
20112009
20072005
20032001
19991997
19951993
1991
NMR structure All
0
1,000
2,000
3,000
4,000
5,000
6,000
7,000
8,000
9,000
10,000
20112009
20072005
20032001
19991997
19951993
1991
NMR structure BMRB
15
-
SPARTA: 主鎖側鎖2面角から化学シフト(1HN, 15N, 13CO, 13Cα and 13Cβ)
Shen Y. and Bax Ad J. Biomol NMR (2007)
Target 3D structure
Predicted chemical shifts, 1HN, 15Nα, 1Hα, 13C', 13Cα and 13Cβ
Tri-peptide set
200 proteins Chemical shifts from BMRB
Structures from RCSB
Tri-peptide database
24,000 tri-peptides
φ, ψ and χ1 angles
2nd chemical shifts
Ring current effect
Chemical shift similarity score H-bond effect
H N
C H H
N
H C
C
H N
C H
=
C O
=
C O
=
O
16
-
化学シフトから主鎖2面角へ: TALOS/TALOS+
1HN, 15N, 13CO, 13Cα +13Cβ
2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350
立体構造から化学シフトへ: SPARTA/SPARTA+
1HN, 15N, 13CO, 13Cα +13Cβ
2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350
PDB
BMRB
φ、ψ2面角 類似検索
立体構造座標
PDB
BMRB
類似検索
17
-
化学シフトから立体構造へ:
1HN, 15N, 13CO, 13Cα +13Cβ
2 Q CA 55.080 2 Q CB 30.760 2 Q HN 8.900 2 Q C 175.920 2 Q HA 5.249 2 Q N 123.220 .... 72 R HN 8.580 72 R HA 4.301 72 R N 123.420 72 R C 175.350 72 R CA 55.610 72 R CB 31.350
化学シフトをよく満たすフラグメントを検索
3D 構造
フラグメントのアセンブリ 化学シフトをよく満
たすアセンブリを選択
CS-ROSETTA Shen, Y. et al., Proc. Natr. Acad. Sci. (2008)
18
-
化学シフトの更なる応用: 過渡的中間対構造のモデリング
A Transient and Low-Populated Protein-Folding Intermediate at Atomic Resolution D. M. Korzhnev, T. L. Religa, W Banachewicz, A. R. Fersht and L. E. Kay
19
-
Neudecker, P. et al., Nature (2012)
20
-
CS-ROSETTAをNMR構造の検証に使う
1HN, 1Hα, 15Nα, 13Cα, 13C’, 13Cβ
の化学シフトによるCS-ROSETTA構造 NOEベースの立体構造と重ね合わせ (主鎖RMSD: 1.4Å)
NOEベースの構造決定とは異なる原理で立体構造が得られるためチェーンフォールドの正しさを検証できる
Mizuno et al., JMB 2011
21
-
3.PDBj-BMRBにより開発されたツール群の紹介
22
-
MagRO-NMRView: NMRデータ解析とデータベース登録支援
MagRO-NMRViewがサポートする 複雑なNMR実験データの構造 GUIによるNMRデータの解析と登録準備の 支援機能
一般登録データ1050件の化学シフト 理研より登録された550件の化学シフト
SPARTA+を用いてNMR構造と化学シフトの整合性を確認 Kobayashi, et al., 2012 J Biomol NMR in press
23
-
間違った側鎖帰属
no_NOE, bad contact L14:2HB-L14:HN viol_level: -0.440 no_NOE, bad contact L14:2HB-F29:HN viol_level: -1.339 no_NOE, bad contact F91:HA-F91:HN viol_level: -0.212 no_NOE, bad contact F91:2HB-F91:HN viol_level: -0.043 no_NOE, bad contact L14:3HB-C92:HN viol_level: -2.447 no_NOE, bad contact W102:HZ2-L14:HG viol_level: -0.222 no_NOE, bad contact F29:2HB-L141:HD1 viol_level: -0.354 no_NOE, bad contact F29:3HB-L141:HD1 viol_level: -0.591 no_NOE, bad contact W102:HE3-L31:HG viol_level: -0.810 no_NOE, bad contact I106:3HG1-L31:HG viol_level: -2.083 no_NOE, bad contact F29:2HB-F29:HD1 viol_level: -3.712 ... ... no_NOE, bad contact W102:HZ3-F29:3HB viol_level: -1.296 no_NOE, bad contact F80:HZ-F91:2HB viol_level: -2.903 no_NOE, bad contact L14:3HB-F91:3HB viol_level: -2.990 no_NOE, bad contact F80:HZ-F91:3HB viol_level: -2.435 no_NOE, bad contact F91:HD1-F91:3HB viol_level: -1.487
正しい側鎖帰属
MagRO-Mol: NMR構造、NOE解析データの表示
24
-
2つに分かれているのは明白だが...ちょっと分かりにくい
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
-2.5 -1.5 -0.5 0.5 1.5 2.5
多次元尺度構成法で2次元にembedしたmap明確なクラスターが2つ見える
fit_robot: マルチドメイン構造に対しても構造重ね合わせを自動実行
25
-
MagRO_Validation: NMR構造の決定精度を化学シフトのみから評価する方法確立の試み
NMR構造がどの程度確からしいか、客観的な評価法は 現在まで確立されていない
< なるべくNOE以外の要素で評価させる > ・NMR構造のクオリティー 主鎖コンホメーションの正常さ 側鎖ロタマーの正常さ 分子の水和、水素結合、VdW衝突 ・立体構造から逆算された予測化学シフトとのずれ
構造決定の自動化が困難になる 手作業で構造決定する場合もいつ終わって良いか分からない
26
-
NOEピークテーブル、化学シフトテーブルのみから 立体構造を高精度に決定できる定番ソフトウエア 化学シフト帰属ミス、不完全さに対して非常に高い耐性を示す
NOE完全自動帰属構造計算プログラム:CYANAについて
0.0
5.0
10.0
15.0
20.0
25.0
1 21 41 61 81 101 121 141 161 181 201
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
人為ミスを含むCYANA計算
化学シフ
トテー
ブルの
不完全
さ(
%)
正解構造
とのず
れRMSD(A)
27
-
MagRO_Validationのベンチマーク CYANAは化学シフトテーブルでの
疎水残基側鎖間で入れ違いミス(swap)に非常に弱い
0.0
2.0
4.0
6.0
8.0
10.0
12.0
1 41 81 121 161 201 241 281 321 361
single double triple
quad
2つのNMR構造について 化学シフト帰属ミスを人工的に発生
(1ペア~4ペアまでのswap) Randomに疎水残基の帰属をswap
400個の帰属テーブルをもとに 400回のCYANA計算を実行
良い構造から悪い構造まで人為的に多数発生させる 人為ミスを含むCYANA計算
正解構造
との
ずれRMSD(A)
α-Helixリッチなタンパク質 (151残基)
BMRB-ID: 10035 PDB-ID: 1WK1
α/β構造混在型タンパク質 (151残基)
BMRB-ID: 10036 PDB-ID: 1Wlm
<CYANA計算の詳細>
NOE peak list (15N, 13C-edited NOESY)
φψ角制限 (TALOSによる予測)
水素結合距離制限
Val, Leuメチルシグナルの立体特異帰属 28
-
MagRO_Validationの性能
7.0
12.0
17.0
22.0
27.0
0.0 1.0 2.0 3.0 4.0
横軸:正解構造とのずれRMSD(A)
-8.5
-7.5
-6.5
-5.5
-4.5
-3.5
-2.5
-1.5
-0.5
0.0 1.0 2.0 3.0 4.0
MagRO_Validation Score
bacbone normality score
0.2
0.3
0.4
0.5
0.6
0.7
0.0 1.0 2.0 3.0 4.0
SPARTA+ score
SPARTA+による評価 WHATCHECKによる評価
MagRO_Validationによる評価
SPARTA+によるNMR構造から HN, Cα, Hα, Cβ, Hβ, COの化学シフトの逆算を行う評価法では十分な精度が得られない WHATCHECKは良い性能を示しているが 2.0Å以上の良い構造を正しく評価できていない MagRO_Validationは2.0Å以上の良い構造を より正確に評価できている
29
-
ツール群の公開サイト: NMRToolBox
googleなどで "BMRB osaka" を検索してください
30
-
謝辞
阪大蛋白研
すべて敬称略
PDBj-BMRB: 藤原敏道、児嶋長次郎、岩田武史、高橋あみ 構造プロテオミクス:池上貴久 情報プロテオミクス:中村春木
Daron Standley 阪大微生物研 サントリー生有研 菅瀬謙治 理化学研究所 木川隆則 医薬基盤研究所 赤木謙一 広島大学 楯真一 立命館大学 北原亮 京都大学 片平正人、永田崇
米ウィスコンシン大学 BMRB: Eldon Ulrich, John Markley
31
-
ご清聴ありがとうございました
32
スライド番号 1スライド番号 2スライド番号 3スライド番号 4スライド番号 5スライド番号 6スライド番号 7スライド番号 8スライド番号 9仮想化技術による解析とデータベース登録支援スライド番号 11スライド番号 12スライド番号 13NMRデータベースの運用・開発とその連携スライド番号 15スライド番号 16スライド番号 17スライド番号 18スライド番号 19スライド番号 20スライド番号 21スライド番号 22MagRO-NMRView: NMRデータ解析とデータベース登録支援スライド番号 24スライド番号 25スライド番号 26スライド番号 27スライド番号 28スライド番号 29スライド番号 30スライド番号 31スライド番号 32