40th mtg in nibio

17
2015/1/30 40回統合DBミーティング Integrated MTG in NIBIO 1

Upload: maori-ito

Post on 15-Jul-2015

78 views

Category:

Health & Medicine


0 download

TRANSCRIPT

Page 1: 40th MTG in NIBIO

2015/1/30

第40回統合DBミーティングIntegrated MTG in NIBIO

1

Page 2: 40th MTG in NIBIO

本日の予定

• Sagace– アクセス解析

– 進捗報告

– 新規追加DBについて

• 医薬基盤研内のデータのRDF化

– 副作用データ→化合物→発現上昇/下降遺伝子の取得について

– Open TG-GATEsのRDFのSchema修正について

2

Page 3: 40th MTG in NIBIO

進捗報告

• PDBjでマークアップされたRDFa Liteを

検索結果に表示(開発版)

3

Page 4: 40th MTG in NIBIO

新規追加候補DB

• Genetics Home Reference

• がん研究データベース

• 化学物質の有毒性評価書

• VaDE

• 病理コア画像

• NBRP-Rat

• じん肺データベース

• 腰痛データベース

4

Page 5: 40th MTG in NIBIO

医薬基盤研内のデータのRDF化

• 「***という副作用が報告された医薬品において,ラット/マウスに投与後,発現が上昇した遺伝子/下降した遺伝子」

• 上記を実行するアプリケーションを作成

5

Page 6: 40th MTG in NIBIO

SIDERのSchema (抜粋)

6

Page 7: 40th MTG in NIBIO

Open TG-GATEsのSchema(抜粋)

7

Page 8: 40th MTG in NIBIO

データの統合

8

Page 9: 40th MTG in NIBIO

イメージ図

9

Page 10: 40th MTG in NIBIO

実際に行ったこと

• 遺伝子発現のデータはOpen TG-GATEsのRDFに直接紐付けられていなかった。

• 実験条件を以下に固定– Repeat, Rat, in vivo, Liver, Middle, 15 day

• 遺伝子発現の上昇・下降条件を固定し,Toxygatesで使用しているプログラム経由で取得。– 条件:p-valueが小さい上位50位のうち

– log2foldの値 > 2 :上昇

– log2foldの値 < -2 :下降

10

Page 11: 40th MTG in NIBIO

Open TG-GATEsのSchema(抜粋)

11

Page 12: 40th MTG in NIBIO

SPARQLで確認

SELECT distinct ?gene ?compound

WHERE {

#from Open TG-GATEs

?exp dbowl:pubchem ?pubchem;

toxico:compound_name ?compound;

toxico:up_regulated_gene ?gene.

#from SIDER

?drug sider_vocab:pubchem-compound-id ?pubchem;

sider_vocab:side-effect ?side.

?side dcterms:title “headache"@en.

}

12

Page 13: 40th MTG in NIBIO

アプリケーション化

• PHPで実装

• 副作用の文字をクエリとして受け取り,その文字列をそのまま,SPARQLに投げる。

• JSONで結果を受け取り,その結果をパースして表示する。

13

SELECT distinct ?gene ?compound

WHERE {

#from Open TG-GATEs

?exp dbowl:pubchem ?pubchem;

toxico:compound_name ?compound;

toxico:up_regulated_gene ?gene.

#from SIDER

?drug sider_vocab:pubchem-compound-id ?pubchem;

sider_vocab:side-effect ?side.

?side dcterms:title "'.$keyword.'"@en.

}

Page 14: 40th MTG in NIBIO

デモ

14

Page 15: 40th MTG in NIBIO

Open TG-GATEsのSchema

の修正• 現在のRDFの問題点

– 実験条件とサンプルの情報が1つのRDFにまとめられている。

– 外部のRDFとの親和性が低い。• RDFのSchemaが分からないと統合しにくい。

– 文法上の間違いがある。

• 目標

– 修正して,ダウンロード可能な状態にする。

– アプリケーションでも利用しやすい状態にする。

15

Page 16: 40th MTG in NIBIO

16

Schemaの修正(素案)

Page 17: 40th MTG in NIBIO

今後の予定

• 次回 2月20日(金) or 27日(金)

• 国内版 BioHackathon

– 2月2日〜6日

17