in silico drug discovery with fams and chooseld

18
FAMS FAMS chooseLD chooseLD を用いたインシリコ創薬パイプライン を用いたインシリコ創薬パイプライン [ [ 中央大学共同研究プロジェクト 中央大学共同研究プロジェクト 2013 2013 年度 年度 -2015 -2015 年度 年度 ] ] 中央大学理工学部物理学科 田口善弘 共同研究者 中央大学理工学部生命科学科 岩舘満男 北里大学薬学部名誉教授 梅山秀明 (中央大学共同研究員) (株)インシリコサイエンス

Upload: y-h-taguchi

Post on 16-Jul-2015

347 views

Category:

Science


0 download

TRANSCRIPT

FAMSFAMSととchooseLDchooseLDを用いたインシリコ創薬パイプラインを用いたインシリコ創薬パイプライン

[[中央大学共同研究プロジェクト 中央大学共同研究プロジェクト 20132013年度年度-2015-2015年度年度]]

中央大学理工学部物理学科 田口善弘

共同研究者

中央大学理工学部生命科学科 岩舘満男北里大学薬学部名誉教授 梅山秀明(中央大学共同研究員)

(株)インシリコサイエンス

1 「主成分分析を用いた教師なし学習による変数選択」とは何か

2 インシリコ創薬への応用例

 2.1 3種類の自己免疫疾患に共通するプロモーターメチル化異常を起こしている遺伝子の探索およびその結果に基づいたインシリコ創薬

 2.2 食道上皮がんにおけるSNP特異的なDNAメチル化の探索とその結果に基づいたインシリコ創薬

 2.3 マウスモデルを用いたPTSD由来の心疾患におけるmicroRNA発現異常を伴う標的遺伝子発現異常の探索とその結果に基づいたインシリコ創薬

 2.4 ヒト小細胞肺がんセルラインのリプログラミング実験における、プロモーターメチル化異常を伴う遺伝子発現異常の探索とインシリコ創薬の可能性

3 終わりに

1 「主成分分析を用いた教師なし学習による変数選択」とは何か

目的: サンプルのラベル情報なしに変数選択を行う

通常:「健常者と患者のオミックスデータがある。差が大きい変数を選択して診療・診断に使おう」

この戦略の弱点:「実は患者の方が有意にコーヒー愛好家が多く、選んだ変数は「患者と健常者」の区別ではなく「コーヒー愛好家かそうでないか」の区別をする変数だった」がありうる。

✖ ✖✖

✖ ✖✖

✖✖ ✖

✖✖ ✖✖

✖✖ ✖

✖ 患者○ 健常者赤 コーヒー愛好家青 コーヒー愛好家以外

コーヒー愛好家判別変数

変数A

変数B

変数Aと変数Bが「真の患者vs健常者」判別変数になりうるがこれは「一個(=コーヒ ー 愛 好 家 判 別 変数)でそこそこできているのだから」という理由で誤って見逃されるかもしれない

教師なし変数選択は可能か?

20サンプル

A群10個体 B群10個体

10

90

100

変数

100変数中10変数「だけ」が2群で差がある

サンプルのラベル情報「無し」で100変数の方を主成分分析

第二主成分

第一主成分

二群に差のある変数が外れ値として抽出される

サンプル

第一主成分

第一主成分への各サンプルの寄与を見ると2群できっちり分かれている。ラベリング情報無しでもきっちり2群で差があるような第一主成分が自動的に構成されるので、これに沿った「外れ値」に相当する変数を選択すれば少ない変数で2群を区別できるようになる⇒教師なし変数選択が可能な理由

しかし、現実はこんなに単純じゃないだろう。うまく行くのか?

2 インシリコ創薬への応用例 2.1 3種類の自己免疫疾患に共通するプロモーターメチル化

異常を起こしている遺伝子の探索およびその結果に基づいたインシリコ創薬

目的:3種類の自己免疫疾患共通のプロモーターメチル化異常の探索全身性エリマトーデス(SLE),関節リュウマチ(RA)、皮膚筋炎(DM)一卵性双生児(健常vs患者)+性別年齢一致健常者2名 5セット✕(Javierre et al, Genome Res. (2010) )

全身性トリマトーデス(SLE)

第三主成分

第二主成分

第二主成分

○:SLE双子 +:健常1△:健常双子  :健常2✕

患者側が非メチル化

関節リウマチ(RA)

第三主成分

第二主成分

第二主成分

皮膚筋炎(DM)

第三主成分

患者側が非メチル化

患者側が♂非メチル化    ♀メチル化

それぞれで選択された遺伝子の過半数が共通⇒複数の自己免疫疾患に対するプロモーターメチル化異常の検出

(世界初)

AIM2,CARD15,CD82,CSF1R,CSF3,CSF3R,DHCR24,ERCC3,GRB7,HG

F,HOXB2,IFNGR2,LCN2,LMO2,LTB4R,MMP14,MMP8,MPL,PADI4,

PECAM1,PI3,RARA,S100A2,SEPT9,SLC22A18,SPI1,SPP1,STAT5A,

SYK,TIE1,TM7SF3,TRIP6,VAMP8

chooseLDによるインシリコ創薬 in DrugBank

北里大学薬学部梅山研で開発されたin silico drug discovery tool

創薬対象化合物データベース

SYK

Nilotinib(kinase inhibitor)

SYKの発現にはNilotinib耐性が必要という既報あリ(Gioia et al, Blood, 2011)

log10

Ki

Ki

相関係数 ー0.58(P=0.03)

FP

Ascore

実験値(SYK阻害剤 in ChEMBL)との比較

CSF1R,SYK,MMP8,MMP14,LCN2について、DrugBankの中から既知の阻害剤との類似性をTanimoto Indexでフィルタリ ン グ し た 1 0 0 0程度の 化合物 をFPAScoreでランキングした

 2.2 食道上皮がんにおけるSNP特異的なDNAメチル化の探索とその結果に基づいたインシリコ創薬

食道上皮がん患者30人

血液 周辺組織 食道がん

genotype

DNA メチル化

(Yang et al, PLoS ONE 2010)

SNPアレイ

教師なし学習による変数選択第

二主

成分

第一主成分

Gen

otyp

eD

NA

メチ

ル化

SNPを主成分分析で2次元に埋め込み

第一主成分 第二主成分

がん

△ 隣接組織

◯ 血液

ALK,EGLN3,NUAK1についてDrugBankから既知の阻害剤とのTanimoto係数が0.2以上である化合物約1000個をFPAScoreでランキングを行った。

ALKALK上位10位上位10位

ALK 7-Hydroxystaurosporine(抗悪性腫瘍剤)

2.3 マウスモデルを用いたPTSD由来の心疾患におけるmicroRNA発現異常を伴う標的遺伝子発現異常の探索とそ

の結果に基づいたインシリコ創薬

 ス トレス を 与えた マ ウ ス の 心臓のス トレス を 与えた マ ウ ス の 心臓の miRNAmiRNAとと mRNAmRNAの 発 現の 発 現データを解析。データを解析。 miRNAmiRNAの発現と負相関しているの発現と負相関している mRNAmRNAを教師を教師なし学習を用いた変数選択で特定。心筋関連の遺伝子が多なし学習を用いた変数選択で特定。心筋関連の遺伝子が多数 選 択 さ れ た 。 そ の 中 か ら数 選 択 さ れ た 。 そ の 中 か ら fabp3fabp3を 標 的 に イ ン シ リ コ 創 薬 をを 標 的 に イ ン シ リ コ 創 薬 を行った。行った。

 2.4 ヒト小細胞肺がんセルラインのリプログラミング実験における、プロモーターメチル化異常を伴う遺伝子発現異常の探

索とインシリコ創薬の可能性

ヒト小細胞肺がんセルラインのリプログラミング実験からプロヒト小細胞肺がんセルラインのリプログラミング実験からプロモーターメチル化とモーターメチル化と mRNAmRNAの発現が負相関している遺伝子をの発現が負相関している遺伝子を教 師 な し 学 習 を 用 い た 変 数 選 択 で 特定 。教 師 な し 学 習 を 用 い た 変 数 選 択 で 特定 。 TGFBI,S100A6, TGFBI,S100A6, CSRP1, CLDN11, PRKCDBP, CRIP1,CSRP1, CLDN11, PRKCDBP, CRIP1,の6つを特定した。の6つを特定した。

3.おわりにエピゲネティックなオミックス情報の統合解析によって疾患原因遺伝子を推定して遺伝子の立体構造を予測し、インシリコ創薬を行うパイプラインを確立した。WETでの結果の確認が今後の課題である。

この研究は中央大学共同研究プロジェクトの他、※科研費新領域「スパースモデリングの深化と高次元データ駆動科学の創成」公募研究採択課題「変数選択安定性を重視した変数選択を用いたオミックス疾患バイオマーカー探索」2014ー15年度※科研費基盤研究B「網羅的解析手法を用いた腫瘍及び細胞分化関連miRNAの生命情報学的同定技術の開発」2011年度ー13年度にも支援されている。