protein-rna interaction prediction

35
Structural Prediction of Protein-RNA Interaction by Computational Docking with Propensity-based Statistical Potentials 2010/10/12 論文輪講 M2 大上 雅史 Laula Pérez-Cano, Albert Solernou, Carles Pons, Juan Fernández-Recio BIOCOMPUTING 2010 Proceedings of the Pacific Symposium Kamuela, Hawaii, USA, 4 - 8 January 2010 Pac Symp Biocomput. 2010, 293-301.

Upload: masahito-ohue

Post on 14-Jun-2015

1.251 views

Category:

Technology


4 download

TRANSCRIPT

Page 1: Protein-RNA Interaction Prediction

Structural Prediction of Protein-RNA Interaction

by Computational Docking

with Propensity-based Statistical Potentials

2010/10/12 論文輪講

M2 大上 雅史

Laula Pérez-Cano, Albert Solernou, Carles Pons, Juan Fernández-Recio

BIOCOMPUTING 2010

Proceedings of the Pacific Symposium

Kamuela, Hawaii, USA, 4 - 8 January 2010

Pac Symp Biocomput. 2010, 293-301.

Page 2: Protein-RNA Interaction Prediction

内容に入る前に

Page 3: Protein-RNA Interaction Prediction

• ドッキングソフトPyDOCK開発チーム

– FTDockがベース

– CAPRIでも結構強い• FTDockが元

Fernandezらについて

3

Grosdidier, S., Pons, C., Solernou, A., & Fernández-Recio, J. (2007).

Prediction and scoring of docking poses with pyDock. Proteins, 69(4), 852-8.

doi: 10.1002/prot.21796.

Cheng, T. M., Blundell, T. L., & Fernandez-Recio, J. (2007).

pyDock: electrostatics and desolvation for effective scoring of rigid-body

protein-protein docking. Proteins, 68(2), 503-15.

doi: 10.1002/prot.21419.

Pons, C., Solernou, A., Perez-Cano, L., Grosdidier, S., & Fernandez-Recio, J. (2010).

Optimization of pyDock for the new CAPRI challenges: Docking of homology-

based models, domain-domain assembly and protein-RNA binding. Proteins, 1-7.

doi: 10.1002/prot.22773.

References

Page 4: Protein-RNA Interaction Prediction

Introduction

Page 5: Protein-RNA Interaction Prediction

• この研究のテーマ「タンパク質-RNA間相互作用」

• この研究でやったこと

→ドッキングのための新しい残基-リボ核酸ペアワイズスコアの開発

– FFT-based rigid body dockingを想定

• ドッキングで大量生成したデコイに対してこのスコアを用いて評価(フィルタリング)する

イントロダクション

5

Page 6: Protein-RNA Interaction Prediction

• タンパク質-RNA間相互作用が重要

– だが利用可能な構造はまだまだ少ない

– 計算機による構造ベースの研究も少ない

• ドッキング研究

– Protein-ProteinやProtein-Ligandに比べて事例が圧倒的に少ない

– 最近のCAPRIのターゲットにRNAが出現

イントロダクション

6

Page 7: Protein-RNA Interaction Prediction

• CAPRIにおけるPyDockチーム

– Protein-RNAドッキングで2位

• Ligand-RMSD = 3.8Å

– 課題・限界も見い出された

• フレキシブルさの考慮

• Protein-RNAのためにチューニングされたスコアリングパラメータが必要

イントロダクション

7

Page 8: Protein-RNA Interaction Prediction

• Protein-RNA複合体の相互作用面の情報等から相互作用の特徴の理解を目指した研究

– 水素結合の全原子統計的ポテンシャル

• Rosetta(リガンドドッキングシステム)を使ってdecoy生成,near nativeとそうでないのを比較してチューニング

イントロダクション

[3] Chen, Y., Kortemme, T., Robertson, T., Baker, D., & Varani, G.

(2004). A new hydrogen-bonding potential for the design of

protein-RNA interactions predicts specific contacts and

discriminates decoys. Nucleic acids research, 32(17), 5147-62.

doi: 10.1093/nar/gkh785.

8

Page 9: Protein-RNA Interaction Prediction

• 統計的ポテンシャルに関する研究(一部)

イントロダクション

[12] Lejeune, D., Delsaux, N., Charloteaux, B., Thomas, A., &

Brasseur, R. (2005). Protein-nucleic acid recognition: statistical

analysis of atomic interactions and influence of DNA structure.

Proteins, 61(2), 258-71. doi: 10.1002/prot.20607.

[9] Ellis, J. J., Broom, M., & Jones, S. (2007). Protein – RNA

Interactions : Structural Analysis and Functional Classes.

Bioinformatics, 911(December 2006), 903-911.

[13] Jeong, E., Kim, H., Lee, S., & Han, K. (2003). Discovering the

interaction propensities of amino acids and nucleotides from protein-

RNA complexes. Molecules and cells, 16(2), 161-7.

9

Page 10: Protein-RNA Interaction Prediction

• 類似の論文

イントロダクション

[6] Pérez-Cano, L., & Fernández-Recio, J. (2010). Optimal protein-RNA

area, OPRA: a propensity-based method to identify RNA-binding sites

on proteins. Proteins, 78(1), 25-35. doi: 10.1002/prot.22527.

10

Page 11: Protein-RNA Interaction Prediction

Methods

Page 12: Protein-RNA Interaction Prediction

Pairwise residue-ribonucleotide interface propensities

提案手法

p :アミノ酸の種類(1~20)

q :RNAの種類(1~4)

NIpq :相互作用面の(p, q)ペアの数

(4Å以内に1個でも互いの原子があればカウント)

NSp/q :表面残基/RNAの数

(ASA>0.1Å2でカウント)

12282のnon-redundant protein-RNA interaction を利用

Page 13: Protein-RNA Interaction Prediction

• 自由エネルギーの形に変換

Pairwise p-q interface propensities

※ RT=0.59 kcal/mol

13

Page 14: Protein-RNA Interaction Prediction

• 手順

– FTDockで10000個のデコイ生成

• 静電的相互作用丌使用,1.2ÅGrid

– デコイiに対するfinal score

ドッキングへの利用

14

Page 15: Protein-RNA Interaction Prediction

評価実験~使用データ

unbound proteinはboundと95%以上の配列類似性のもの,unbound RNAは85%

15

Page 16: Protein-RNA Interaction Prediction

• RNAのRMSDで評価

– タンパク質のCαをフィッティング

– RNA全原子でRMSDを計算

– near-native solutionは10Å以下(CAPRI基準)

• 特定のdecoy中に含まれるNNS数の割合をランダム生成と比較

評価実験~評価方法

16

Page 17: Protein-RNA Interaction Prediction

Results

Page 18: Protein-RNA Interaction Prediction

– アルギニン(R),リジン(K),ヒスチジン(H)がよくいる

– RNA側では変化はあまり見られない→残基が重要

interface propensities

favorable pair disfavored

18

Page 19: Protein-RNA Interaction Prediction

interface propensities

Protein-RNAの相互作用では静電的効果が重要

※Protein-Proteinではdesolvation/hydrophobic effectが重要

RNAの負電荷がタンパク質のRNA binding siteで重要な効果を発揮している

19

Page 20: Protein-RNA Interaction Prediction

Protein-RNA rigid-body docking and scoring

・fnat is the fraction of RNA-protein contacts that is also found in the

native (target) structure

・fnon-nat is the fraction of RNA-protein contacts that is found, but that is

not present in the native (target) structure

・FTDock&Propensity はスコアの和(重み付けなし)

10,000個のFTDock生成decoy中にNNSがあったもの(12複合体中7複合体)

20

Page 21: Protein-RNA Interaction Prediction

1

10

100

1000

10000

FTDock Propensity FTDock&Propensity

Best

near-

nati

ve r

an

k 1WSU

2PJP

1LNG

1E7K

1WPU

2QUX

2JEA

Protein-RNA rigid-body docking and scoring

21

Page 22: Protein-RNA Interaction Prediction

1

10

100

1000

10000

FTDock FTDock&Propensity

Best

near-

nati

ve r

an

k 1WSU

2PJP

1LNG

1E7K

1WPU

2QUX

2JEA

Protein-RNA rigid-body docking and scoring

22

Page 23: Protein-RNA Interaction Prediction

• 組合せて使うとよくなる

– FTDockと相補的に働いている?

– 3つの例ではFTDockとPropensityのどちらかに10位以下がいる

Protein-RNA rigid-body docking and scoring

23

Page 24: Protein-RNA Interaction Prediction

Example of successful prediction

PDB id : 2QUX

(Propensityで1位が当たったやつ)

unbound protein vs. bound RNA

RMSD = 8.7Å

タンパク質表面での位置が結構近いから良いんじゃね

シアン:予測マゼンタ:X-ray

24

Page 25: Protein-RNA Interaction Prediction

Discussion

Page 26: Protein-RNA Interaction Prediction

• 関連研究と比較

– favored残基は全てにおいて共通→アルギニン(R)とリジン(K)

• この論文で見られたヒスチジン(H)は環境によっては正電荷として機能するので重要

– 相手RNAによって変化• R-UとK-Aが特に強い

• この論文では相手RNAによる変化は殆ど無いと結論

– トリプトファン(W)とチロシン(Y)も割と関係している• 特にRNA側がAかUのとき

他のpropensity score

26

母集団の大きさがでかい(282 nr PRIを使用)から,他よりも一般の複合体に適用するときでは良いはず

Page 27: Protein-RNA Interaction Prediction

27

他のpropensity score

[16]Treger, M., & Westhof, E. (2001). Statistical analysis of atomic

contacts at RNA-protein interfaces. Journal of molecular recognition :

JMR, 14(4), 199-214. doi: 10.1002/jmr.534.

[9] Ellis, J. J., Broom, M., & Jones, S. (2007). Protein-RNA

interactions: structural analysis and functional classes. Proteins,

66(4), 903-11. John Wiley & Sons. doi: 10.1002/prot.21211.

Page 28: Protein-RNA Interaction Prediction

28

他のpropensity score

[15]Jones, S., Daley, D. T., Luscombe,

N. M., Berman, H. M., & Thornton, J.

M. (2001). Protein-RNA interactions:

a structural analysis. Nucleic acids

research, 29(4), 943-54.

Page 29: Protein-RNA Interaction Prediction

29

[13]Jeong, E., Kim, H., Lee, S., & Han, K. (2003). Discovering the

interaction propensities of amino acids and nucleotides from protein-

RNA complexes. Molecules and cells, 16(2), 161-7. Retrieved from

http://www.ncbi.nlm.nih.gov/pubmed/14651256.

他のpropensity score

Page 30: Protein-RNA Interaction Prediction

30

性能比較

[16]

[9]

[15]

1/7

2/7

4/7

10,000decoyをテキトウに順位付け100回平均

Page 31: Protein-RNA Interaction Prediction

• 2つのことが結論づけられた

– Protein-RNAの特異性の決定要因がほとんどProteinの残基にある

– 統計ポテンシャルの予測値はデータベースの大きさに依る

• ドッキング性能

– Protein-Proteinよりは悪い

– が,1E7Kと1WPUはProtein-Proteinより良い

31

まとめると

Page 32: Protein-RNA Interaction Prediction

• Protein-RNAドッキング

– FTDockだけでもそこそこ良い結果のものが出る

• 「top10にNNSがいる率」が高い

• PPDではそんなに高くならない

→(Elecを使ってないことから)

Protein-RNAでは形状相補性が(PPDより)さらに重要なのでは

※ただし良くなったのはbound RNA

32

まとめると

1

10

100

1000

10000

FTDock Propensity FTDock&Propensity

Best

near-

nati

ve r

an

k 1WSU

2PJP

1LNG

1E7K

1WPU

2QUX

2JEA

Page 33: Protein-RNA Interaction Prediction

Conclusions

Page 34: Protein-RNA Interaction Prediction

• Protein-RNAドッキングのための新しい手法を提案

– 新しいpairwise propensity scoreを提案

– FTDockの形状相補性と組合せて良い結果を得た• RNAがbound構造ならかなり良い

• Protein-RNAドッキングの戦略

– 剛体ドッキングの実行

– 形状相補性とpropensityでranking,上位数100を抽出

– 制限距離(?)などの情報でrankingを改良

• bottleneck

– 利用可能なunbound構造の少なさ• homology-basedモデルのRNA構造の利用を

考える必要がある

34

Summary

Page 35: Protein-RNA Interaction Prediction

• Protein-DNA pairwise propensityの開発

– Protein-RNAと似た結果になりそう

– DNA結合位置の予測やドッキングに応用したい

35

Future work