タンパク質相互作用の コンピュータによる予測と解析

18
タタタタタタタタタタ タタタタタタタタタタ タタタタタタタタタタタタタタ タタタタタタタタタタタタタタ タタタタタタタタタ タタタタタタタタタ タタタタタタタタタタタタタタタタ タタタタタタタタタタタタタタタタ タタタタタタ タタタタタタ

Upload: yan

Post on 17-Jan-2016

54 views

Category:

Documents


0 download

DESCRIPTION

タンパク質相互作用の コンピュータによる予測と解析. 京都大学化学研究所 バイオインフォマティクスセンター 阿久津研究室. 研究の目的. 目的: 生命の構築原理、動作原理を数理的に解明 CD-ROM 1 枚程度に個性の違いまで含めて人間を再構成できる情報がどのように格納されているのか、その原理を解明 方針: 数理的原理に基づく生命情報解析手法                および 生命システムの数理的理解. タンパク質相互作用. タンパク質どうしが互いに相互作用(結合)することで機能を果たすものがたくさんある。 タンパク質の役割の例. 遺伝子転写制御. - PowerPoint PPT Presentation

TRANSCRIPT

タンパク質相互作用のタンパク質相互作用のコンピュータによる予測と解析コンピュータによる予測と解析

京都大学化学研究所京都大学化学研究所バイオインフォマティクスセンターバイオインフォマティクスセンター

阿久津研究室阿久津研究室

研究の目的研究の目的目的:目的: 生命の構築原理、動作原理を数理的に解生命の構築原理、動作原理を数理的に解明明– CD-ROM 1CD-ROM 1 枚程度に個性の違いまで含めて人間を再枚程度に個性の違いまで含めて人間を再

構成できる情報がどのように格納されているのか、そ構成できる情報がどのように格納されているのか、その原理を解明の原理を解明

方針:方針:数理的原理に基づく生命情報解析手法数理的原理に基づく生命情報解析手法               および               および                生命システムの数理的理解生命システムの数理的理解

タンパク質相互作用タンパク質相互作用タンパク質どうしが互いに相互作用(結合)タンパク質どうしが互いに相互作用(結合)することで機能を果たすものがたくさんある。することで機能を果たすものがたくさんある。タンパク質の役割の例タンパク質の役割の例

DNAプロモータ領域 遺伝子

1個づつではプロモータ領域に

付くことが出来ない .

プロモータ領域 遺伝子DNA

新しいタンパク質の生成

遺伝子転写制御遺伝子転写制御

相互作用するタンパク質の予測相互作用するタンパク質の予測何をするのかわかっていないタンパク質はた何をするのかわかっていないタンパク質はたくさんある。くさんある。– 1個づつ調べていくのはたいへん。1個づつ調べていくのはたいへん。コンピュータを使って予測できないか?コンピュータを使って予測できないか?– 手がかり手がかり

既にタンパク質相互作用がわかっているタンパク質既にタンパク質相互作用がわかっているタンパク質ゲノム配列ゲノム配列

タンパク質相互作用の予測タンパク質相互作用の予測タンパク質

アミノ酸配列

特徴的な部分配列

部分配列間の相互作用

特徴的な部分配列として、特徴的な部分配列として、 InterPro InterPro データデータベースに登録してあるベースに登録してあるドメインドメインを使用する。を使用する。

タンパク質ドメインタンパク質ドメイン

ドメイン ドメイン

タンパク質相互作用の予測タンパク質相互作用の予測相互作用する組 . 相互作用しない組 .

?

タンパク質相互作用の予測タンパク質相互作用の予測相互作用する組 . 相互作用しない組 .

相互作用の確率モデル相互作用の確率モデルモデル モデル (Deng et al., 2002)(Deng et al., 2002)① ① 2つのタンパク質が相互作用す2つのタンパク質が相互作用す

る。る。 少なくとも1つのドメインのペ少なくとも1つのドメインのペ

アが 相互作用する。アが 相互作用する。② ② ドメイン間の相互作用は互いにドメイン間の相互作用は互いに

独 立とする。独 立とする。

D1

D2

D3

D2 D4

P2P1

LPBNLPBN

確率モデルからの変形確率モデルからの変形 LPBN LPBN 線形計画問題線形計画問題

テストデータに対する正答率テストデータに対する正答率

core: 45334533 のより信頼性ののより信頼性の     高いデータ     高いデータfull: 91599159 のデータのデータ

LPBNLPBN

EMEM, Assoc

計算機環境計算機環境– Xeon 2.8 GHzXeon 2.8 GHz– 線形計画問題の線形計画問題の

求解に使ったプ求解に使ったプログラムログラム : glpsol: glpsol

DIP DIP データベース データベース (Xenarios et al., 2002)(Xenarios et al., 2002)– 学習に 学習に 2/3 2/3 、テストに 、テストに 1/3 1/3 を使用。 を使用。

タンパク質間相互作用の強度タンパク質間相互作用の強度同じタンパク質のペアについて、何度も同じ同じタンパク質のペアについて、何度も同じ実験が繰り返される。 実験が繰り返される。 相互作用の強度相互作用の強度 ρρijij : : タンパク質ペア タンパク質ペア ((PPii,,PPjj) )

について、相互作用が観測された数の割合。について、相互作用が観測された数の割合。

– KKijij : : タンパク質ペア タンパク質ペア ((PPii,,PPjj) ) について、相互作用について、相互作用が観測された数。が観測された数。

– MMijij : : タンパク質ペア タンパク質ペア ((PPii,,PPjj) ) に対する全実験回数。に対する全実験回数。

LPNMLPNM

タンパク質ペアが相互作用する確率 タンパク質ペアが相互作用する確率 Pr(Pr(PPijij=1) =1)

とと強度強度 ρρijij の差を線形計画法を使い最小化すの差を線形計画法を使い最小化する。る。

テストデータについての結果(数値デーテストデータについての結果(数値データ)タ)

ASNM

EM

LPNM

Association

LPNMLPNM ASNMASNM EMEM ASSOASSOCC

平均誤差平均誤差 0.03080.0308 0.04050.0405 0.2950.295 0.2770.277CPU CPU 時時間間(秒)(秒)

1.201.20 0.00770.0077 1.621.62 0.00880.0088

YIP YIP データベース データベース (Ito e(Ito et al., 2001, 2002)t al., 2001, 2002)– IST (Interaction Sequence IST (Interaction Sequence

Tag)Tag)– タンパク質のペア数:タンパク質のペア数: 11

586586– 学習に 学習に 4/5 4/5 、テストに 、テストに

1/5 1/5 を使用。を使用。計算機環境計算機環境– Xeon 2.8 GHzXeon 2.8 GHz– 線形計画問題の解法器線形計画問題の解法器 : g: g

lpsollpsol

タンパク質間相互作用予測システムタンパク質間相互作用予測システム

ドメイン間相互作用の確率 ドメイン間相互作用の確率 Pr(Pr(DDmnmn=1) =1) を上のを上の各手法を使って推定。各手法を使って推定。推定した推定した Pr(Pr(DDmnmn=1) =1) を用いて、上の確率モデを用いて、上の確率モデルより、知りたいタンパク質間の相互作用のルより、知りたいタンパク質間の相互作用の確率を推定する。確率を推定する。

タンパク質名( swissprot データベース)

タンパク質に含まれるドメイン名( InterPro データベース)

タンパク質のアミノ酸配列( FASTA 形式)

Flavocytochrome B2 (P00175) Flavocytochrome B2 (P00175) とのとの相互作用確率の推定結果相互作用確率の推定結果

大学院生募集(修士、博士)大学院生募集(修士、博士)京都大学大学院 情報学研究科 知能情報学専攻 バイ京都大学大学院 情報学研究科 知能情報学専攻 バイオ情報ネットワーク分野 オ情報ネットワーク分野 入試入試– 2007年2月(修士、博士)2007年2月(修士、博士)– 2007年8月(修士、博士)2007年8月(修士、博士)– 専攻のホームページ専攻のホームページ

http://www.ist.i.kyoto-u.ac.jp/http://www.ist.i.kyoto-u.ac.jp/

研究室ホームページ研究室ホームページ– http://www.bic.kyoto-u.ac.jp/takutsu/index_J.htmlhttp://www.bic.kyoto-u.ac.jp/takutsu/index_J.html

研究室の見学を随時受付けています。研究室の見学を随時受付けています。– E-mail : [email protected] : [email protected]