シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/scinets_ria143i/tutorial... ·...

10
Page 1 of 10 シロイヌナズナフェノーム統合データベース入門 Last update: 11 Nov. 2013 目次 1. はじめに .................................................................................................................................................................... 1 2. データベースの概要 .................................................................................................................................................. 1 2.1 理研シロイヌナズナ変異株フェノームデータベース ........................................................................................ 2 2.2 植物フェノームデータベース ............................................................................................................................ 3 3. クイックスタート:表現型データベースから必要な情報を取得 ................................................................................ 4 3.1 注目表現型に関与する遺伝子の検索 ................................................................................................................. 4 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索 ................................................ 6 4.より複雑な推論検索................................................................................................................................................... 8 4.1 遺伝子データベースを起点とした遺伝子-表現型検索: 遺伝子の未知の役割を推論 ........................................... 8 1. はじめに フェノームは生物の様々な性質、環境条件、観測方法などに応じて変化する表現型観察情報であり、その 活用は今後のオミックス科学の発展に必須である。しかし、これまでは、様々なデータベースから必要なフ ェノーム情報を網羅的に収集したり関連情報を解析したりといった作業は必ずしも容易ではなかった。その ような問題を解決するには、オントロジーによって表現型情報を標準化し、他のオミックス情報との関連性 もまた統一的な方法で示す必要がある。 我々はシロイヌナズナのフェノーム情報を、独自の統合データベースプラットフォームである RIKEN BASE 上で公開した。RIKEN BASE Semantic Web technology を基盤として構築されている。また、 その他にも高速推論検索システム PosMed など、いくつかのユニークな機能が利用可能である。 2. データベースの概要 RIKEN BASE 上にはシロイヌナズナ フェノームを扱う二つのデータベー スが統合されている。それぞれの DB からは関連するオミックス情報や書 誌情報に対応する他のデータベース へのリンクが設定されており、容易に 関連情報を収集できる(右図参照)。 本節ではそれぞれの DB の概略を説明 する。

Upload: others

Post on 23-May-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 1 of 10

シロイヌナズナフェノーム統合データベース入門

Last update: 11 Nov. 2013

目次 1. はじめに .................................................................................................................................................................... 1

2. データベースの概要 .................................................................................................................................................. 1

2.1 理研シロイヌナズナ変異株フェノームデータベース ........................................................................................ 2

2.2 植物フェノームデータベース ............................................................................................................................ 3

3. クイックスタート:表現型データベースから必要な情報を取得 ................................................................................ 4

3.1 注目表現型に関与する遺伝子の検索 ................................................................................................................. 4

3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索 ................................................ 6

4.より複雑な推論検索 ................................................................................................................................................... 8

4.1 遺伝子データベースを起点とした遺伝子-表現型検索: 遺伝子の未知の役割を推論 ........................................... 8

1. はじめに

フェノームは生物の様々な性質、環境条件、観測方法などに応じて変化する表現型観察情報であり、その

活用は今後のオミックス科学の発展に必須である。しかし、これまでは、様々なデータベースから必要なフ

ェノーム情報を網羅的に収集したり関連情報を解析したりといった作業は必ずしも容易ではなかった。その

ような問題を解決するには、オントロジーによって表現型情報を標準化し、他のオミックス情報との関連性

もまた統一的な方法で示す必要がある。

我々はシロイヌナズナのフェノーム情報を、独自の統合データベースプラットフォームである RIKEN

BASE上で公開した。RIKEN BASEは Semantic Web technologyを基盤として構築されている。また、

その他にも高速推論検索システム PosMedなど、いくつかのユニークな機能が利用可能である。

2. データベースの概要

RIKEN BASE上にはシロイヌナズナ

フェノームを扱う二つのデータベー

スが統合されている。それぞれの DB

からは関連するオミックス情報や書

誌情報に対応する他のデータベース

へのリンクが設定されており、容易に

関連情報を収集できる(右図参照)。

本節ではそれぞれのDBの概略を説明

する。

Page 2: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 2 of 10

2.1 理研シロイヌナズナ変異株フェノームデータベース

URL: http://database.riken.jp/db/arabidopsis_mutant_phenome

内容:

理研で開発されたシロイヌナズナ変異体のフェノーム

変異体それぞれの表現型情報。表現型は Plant Ontologyおよび PATOの語彙により標準化さ

れている(たとえば “rosette leaf:round”)。

変異体それぞれの遺伝的変異情報

特徴: 理研では多くのシロイヌナズナミュータントラインを開発し公開してきた。特にDs tagging line,

activation tagging lines, and FOX-hunting lines については、開発したそれぞれの変異体についてゲ

ノム・フェノームそれぞれの情報が蓄積されている。これらの変異体についてはそれぞれの研究チーム

によって独自のデータベースが公開されているが、我々はそれらのオリジナルデータのオントロジーに

よる標準化を進め、さらに RDFデータとして統合している。

Page 3: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 3 of 10

2.2 文献由来植物フェノームデータベース

URL: http://database.riken.jp/db/curated_plant_phenome

内容:

公表論文のキュレーションによって収集したシロイヌナズナの表現型情報をオントロジーで標準

化したもの

表現型変異との関連性が示唆される遺伝的変異(表現型-AGI codeの関連付け情報)

表現型変異が観察された環境条件

上記情報の根拠として参照された論文の書誌情報

特徴:

これまでに、表現型-遺伝的変異の関連付け情報を 820件収集した。形態変異、ストレス応答、種

子生産性など多様な表現型情報が含まれる。

各々の表現型データは、論文内の表現型の記述の注意深い読解に基づきオントロジーによって標準

化したものである。表現型変異が観察される環境条件も可能な限り収集され、これらもオントロジ

ーで標準化されている。本 DBで使用したオントロジーは次ページの表のとおりである。

Ontology Covered field Example Reference

organ flower

developmental stage flowering

 Plant Trait Ontology (TO) developmental stage flowering time Youens-Clark et al. 2011

 The ontology of phenotypic

qualities (PATO)physical quality increased length Mungall et al. 2010

biological process nitrogen fixation

cellular component chloroplast

molecular function glycerate kinase activity

 Plant Environment Ontology

(EO)environmental condition long day length regimen  Jaiswal et al. 2002

 Chemical Entities of

Biological Interest (ChEBI) chemical compound sugar Hastings et al. 2013

 Gene Ontology (GO)  Ashburner et al. 2000

 Plant Ontology (PO) Cooper et al. 2013

Page 4: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 4 of 10

3. クイックスタート:表現型データベースから必要な情報を取得

ここでは、いくつか簡単な例題を挙げてデータベースの使用法を説明する。i

3.1 注目表現型に関与する遺伝子の検索

1. 文献由来植物フェノームデータベース http://database.riken.jp/db/curated_plant_phenome を開き、

ページ上部にあるメニューの「表現型の変異」をクリックする。

2. ページ最上部の検索窓にキーワード(ここでは delayed flowering)を入力する(上図左上)。

3. 検索ボタンを押すと、ヒットした表現型一覧が画面下部に表示される(上図下)。

Page 5: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 5 of 10

4. リンク(たとえば”delayed whole plant flowering stage in environment of long day length regimen”)

をクリックすると、表現型と遺伝子の対応関係をまとめた新しい表が出現する(上図右上)。これらが、

我々が文献をキュレーションしてまとめた遺伝子・表現型間の関連付け情報である。

5. この一つ(たとえば”delayed whole plant flowering stage in environment of long day length regimen

for AT1G26830”)をクリックすると、このデータとリンクしている、対応遺伝子、参考文献などの情

報を見ることができる(上図)。参考文献の欄は PubMedへのリンクとなっており、この遺伝子-表現

型関連付けの根拠となった原記載にアクセスしてこのアノテーションの妥当性を直接チェックできる。

Page 6: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 6 of 10

3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

注目した表現型から関連するシロイヌナズナ変異体を検索する例を以下に示す。

1. 理研シロイヌナズナ変異体フェノームデータベース

http://database.riken.jp/db/arabidopsis_mutant_phenome にアクセスする。

2. ページ中央のメニューからキーワードを指定する。ページ中央のメニューでは、データが収録されてい

る器官名を選択できる(上図)。「Show subcategories」をクリックすると、収録されている表現型の

器官別の表現型の詳細な一覧を見ることができ、そこから検索対象を簡単に選択できる。ここでは例と

して flower:abnormal,shape にチェックマークを入れ、searchボタンをクリックする。

このメニューを使う代わりに、キーワードをページ上部の検索ワード入力ボックスに入力して「検

索」ボタンをクリックし、表現型のリストを見ることもできる。

Page 7: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 7 of 10

3. 新しく表示されたページ中には、「"観察された表現型" が flower:abnormal,shape の シロイヌナズ

ナ変異株観察情報が一覧表として表示される(上図下)。指定の表現型を示す様々な種類の変異体が存

在することがわかる。ここでは、Fox line系統の変異体の一つである F06248の観察情報を見ることに

する。表中の F06248_obs_5 (FOX hunting)のリンクをクリックしてみる。

Page 8: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 8 of 10

4. 新たに出現した表の中の「オリジナルデータベースの表現型情報」欄の「関連情報を見る」をクリック

すると、変異体の開発元が公開しているオリジナルの情報を見ることができる(上図)。また、「観察

された表現型」の「関連情報を見る」をクリックすると、同じ表現型変異を持つ他の変異系統のバイオ

リソースの存在も確認できる。ここで挙げた例では、Fox lineで 41種類、Ds tagging lineで 3種類の

変異体が「花の形が異常」という表現型を共有していることが分かる。

このように、異なる手法で作出され別個のオリジナルデータベースに収録されている変異株の情報を、統合

データベース上では同列に探し出すことができる。

4.より複雑な検索

RIKENBASEには、表現型情報だけでなく各種オミックスデータを扱うデータベースも統合されている。

複数のデータベース間で横断的な検索により、オミックスデータ間での未知の関連性を探し出すことができ

る。

4.1 遺伝子データベースを起点とした遺伝子-表現型検索: 遺伝子の未知の役割を推論

ここでは前項で示したよりは少し複雑な検索手順を例示する。The Database of Plant Phenomeと A.

thaliana locus DB を用いて、ユーザーが注目したシロイヌナズナ遺伝子について関連表現型データを検索

し、当該遺伝子の生物学的な役割についての理解を深める試みである。

ここでは abscisic acid beta-glucosidaseをコードする遺伝子を例にとり、そこから関連する表現型を検索

してみたい。アブシジン酸は乾燥耐性にかかわる植物ホルモンであり、乾燥などのストレスに対応して合成

され、乾燥耐性の実現に重要な役割を演じていることが知られている。本酵素はその合成過程に関与するこ

とが分かっている。

Page 9: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 9 of 10

1. TAIR locus DB (http://database.riken.jp/item/crib102u0i)にアクセスする。

2. 遺伝子を検索するためのキーワード(例: abscisic acid beta-glucosidase)をページ上部のボックスに入力

する(上図上)。

3. 「検索」ボタンを押すと、ヒットした遺伝子のリスト(ここでは AT1G52400一件のみ)が出現する(上

図下)。

4. リストの中から調べたい TAIR locus ID (ここでは AT1G52400)のリンクをクリックする。

5. 新しく表示された表中の「“変異遺伝子” が AT1G52400 の 表現型-遺伝子」という項目が、文献キュ

レーションによって示された関連表現型の情報である。この項にある「関連情報を見る」ボタンをクリ

ックする。

Page 10: シロイヌナズナフェノーム統合データベース入門metadb.riken.jp/dbfiles/SciNetS_ria143i/tutorial... · Page 6 of 10 3.2 注目表現型の変異が観察されているバイオリソース(ナズナ変異体)の検索

Page 10 of 10

6. 表現型-遺伝子の関連付け情報が、それぞれの根拠となった参照文献を伴ってリストアップされる(上

図)。それぞれの参照文献をクリックすると新たに表示されるページに文献の雑誌名などの書誌情報や

要旨などが表示される。表の上部に「オリジナルサイト」として PubMedへのリンクが表示される。ユ

ーザーは元論文を直接参照して、データベース上で提示された情報の妥当性をチェックできる。

上記例では、乾燥耐性と関連の深い分子名や酵素名をもとに遺伝子を検索し、その遺伝子が気孔の運動に関

係していることを確かめた。よく知られているように気孔は植物体の水分調整に直接関係しており、アブシ

ジン酸が気孔の開閉運動にも関与していることもわかっている。ヒットした遺伝子は確かに乾燥ストレスへ

の応答性に関連深い遺伝子と考えられる。この例はすでに注目されている遺伝子-表現型の関係性を追認し

たものともいえるが、同様なアプローチでまだ誰も注目していない遺伝子の生物学的な役割に着目し、新た

な研究テーマに結び付けることも可能である。

i RIKENBASEには日本語版と英語版の二つの画面モードがあり、一部のデータベースでは両者間で表示

内容が異なっている。本ガイドブックでは日本語版に沿って説明する。画面表示が日本語モードになってい

ない場合は画面右上部の JAPANESEのリンクをクリックして表示を切り替えて頂きたい。