バイオインフォマティックス概論授業予定 · web...

54
1

Upload: others

Post on 22-Sep-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1

Page 2: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

H29 バイオインフォマティックス概論授業予定

(授業の進み具合によって変更の可能性があります)

黒字は、講義による解説。青字はウェブを使った実習を示します。黄色の網掛けは、重要なキーワード

第 1 回 10 月 3 日 授業概要説明

Bioinformatics とは?

ゲノム-遺伝子-mRNA-タンパク質の関係の復習(DVD)

さまざまなデータベース・ゲノムデータベースに触れてみる

第 2 回 10 月 10 日 配列データベースについての解説

配列データベースからの塩基配列とアミノ酸配列の取り出し方

配列エントリーの見方

ヒト全ゲノム解読プロジェクトについての解説(1/3)

ヒトゲノムプロジェクトの歴史・戦術

連鎖地図作製

宿題(1):配布

第 3 回 10 月 17 日 ホモロジー検索(BLAST 検索)についての解説

BLAST 検索の実習(1/2)(BLASTP)

結果の見方

ヒト全ゲノム解読プロジェクトについての解説(2/3)

BAC ライブラリーの作製、整列化

第 4 回 10 月 24 日 BLAST 検索の実習(2/2)(BLASTN, BLASTX, TBLASTX)

ヒト全ゲノム解読プロジェクトについての解説(3/3)

BAC ライブラリーのショットガンシーケンス

配列のアセンブリー、コード配列の予測(アノテーション)

宿題(2):配布

第 5 回 10 月 31 日 MapViewer の利用:生物毎のゲノムデータベースを使った BLAST 検索

Whole genome shotgun sequence によるゲノム解読

配列解読から明らかになったヒトゲノムの特徴

“宿題(1):提出”

第 6 回 11 月 7 日 配列アライメントについての解説

ペアワイズアライメントの実際

2

Page 3: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

多重配列アライメントの作成と見方(CLUSTALW)

分子系統樹について

第 7 回 11 月 14 日 分子系統樹の作成

分子系統樹から分かること

ゲノム構造の変化と生物進化

ゲノムの重複、遺伝子の重複と遺伝子レパートリーの増加

オルソログとパラログの発生

遺伝子の並行進化

宿題(3)配布

第 8 回 11 月 21 日 代謝経路データベース(KEGG)の利用

KEGG を使った演習

例:データベースを使って、dopamine の合成経路、合成部位、作用

機序、薬剤等について情報収集する

宿題(2)提出

第 9 回 11 月 28 日 論文の構成、総説の内容

研究計画立案、レポート・論文作成に必要な文献情報収集

文献検索(PubMed, 大学図書館 On line journals)

EndNote について

宿題(4)配布

第 10 回 12 月 5 日 酒井義文先生(本学工学研究科情報科学出身)による解説

last 検索、ClustalW、分子系統樹のアルゴリズムと原理

(鈴木:分子生物学会に出席)

3

Page 4: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

第 11 回 12 月 12 日 タンパク質の構造についての解説(シグナルペプチド、疎水・親水性プロット、

ドメイン構造)

ウェブサイトを使ったタンパク質の構造解析

塩基配列からアミノ酸配列への変換

分子量と等電点の予測

シグナルペプチドの予測

ドメイン構造の予測

糖鎖結合部位の予測

“宿題(3)提出”

第 12 回 12 月 19 日 バイオデータベースの利用(遺伝子の機能、発現、遺伝子疾患)

OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)

21世紀の分子生物学:ポストゲノム

次世代シーケンス解析-シーケンシングの原理

次世代シーケンスで読み取られたリードの情報処理(遺伝研パイプライン)

宿題(5)配布

12 月26日 休講

第 13 回 1 月 9 日 ゲノムブラウザEnsembl Genome Browser の利用

ゲノム塩基配列をゲノムデータベースから取り出す

取り出したプロモーター配列から転写因子が結合する Consensus 配列を検索す

次世代シーケンス解析-利用 (1/4)ゲノム解読(参照ゲノム有=リシーケンス.新規=de novo シーケンス)

トランスクリプトーム解析

次世代シーケンス解析-利用 (2/4)De novo ゲノムシーケンスの遺伝形質解析への応用

トランスクリプトーム解析の生物研究への応用

“宿題(4)提出”

4

Page 5: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

第 14 回 1 月 16 日 ポストゲノム研究-1

次世代シーケンス解析-利用 (3/4)Exome 解析:エクソンのみに絞って配列を比較することによる、遺伝形質

の原因遺伝子の同定(一遺伝子の変異でメンデル遺伝する遺伝子疾患)Genome Wide Association Study (GWAS): SNP マーカーを使っ

た遺伝形質の責任遺伝子の同定(複数遺伝子が関与している場合)

次世代シーケンス解析-利用 (4/4):RAD シーケンス:簡便で高速なゲノム全体にわたる SNP マーカーの収集と

遺伝形質の責任遺伝子の同定 → マーカーアシスト育種(農林水産に有効)

ポストゲノム研究-2

比較ゲノム(Comparative Genomics)

進化に伴う染色体構造の変化(繰り返し配列の発生、シンテニー領域)

CNE(Conserved Noncoding element):進化的に隔たった生物間で高

度に保存された非翻訳領域(特に重要な転写調節領域)

プログラムを使ってシンテニーを調べる

プログラムを使って CNE を調べる

第 15回

最終回

1 月23日 ポストゲノム研究-3

ゲノム編集(遺伝子編集)技術

CRISPR/Cas9 によるゲノム編集についての動画を使った説明

プログラムを使ってオフターゲットのないターゲット配列を設計する

ゲノム編集の農学、医療への応用

“宿題(5)提出”

授業評価

推薦図書とおもだったウェブサイトはこのファイルの最後に掲示してあります。

5

Page 6: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

10 月 3 日(第 1 回)

講義

1) 授業の予定と進め方

2) 「バイオインフォマティックス」とは?

3) 遺伝子の構造についての復習:パワーポイントのファイルを参照

4) 遺伝子、転写、翻訳の復習(DVD を使って)

5) ゲノムデータベース(動物、植物、菌類、バクテリア)をのぞいてみる

6) どのようなデータベースが利用できるか

使用する DVD:講談社ブルーバックス B1582「見てわかる DNA のしくみ」

今日は第一回目の授業ですので、最初に今年の授業予定を紹介します。この授業は、コンピューターを使った

実習と講義で進めます。実習では、ウェブ上で公開されているデータベースや配列解析プログラムを使います。

現在では、多様な生物のゲノム配列が解読され、配列は一般にも利用できるように整備されています。どのよ

うな生物でゲノム解読が行われているのか、ウェブサイト(NCBI, Ensembl)を使って少しのぞいてみましょう。

また生物学、分子生物学、農学研究に利用できるデータベースにどのようなものがあるかを紹介します。

なおこのテキストでは、その日の授業で行う講義内容とコンピューターを使った実習について、操作方法を含

めて簡単に説明してあります。必要に応じて、コピー、プリントアウトして下さい。講義で使うパワーポイント

の図はプリントしたものを資料として配布します。毎回、翌週のプリントを配ります。このテキストと配布資料

を使って、予習・復習して下さい。

————————————————————————————————

実習

2 つのウェブサイトを開いて、どのような生物でゲノム情報が利用できるか調べてみよう

1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/2. Ensembl Genome Browser: http://asia.ensembl.org/index.html

6

Page 7: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

10 月 10 日(第 2 回)

今日の授業内容

1. 実習:データベースからのアミノ酸配列、塩基配列の取り出し方

2. 実習:配列エントリーに示されている情報について

3. 講義:ゲノム解読プロジェクト(1/2)

実習

塩基配列・アミノ酸配列の収集

配列データベースから必要なタンパク質のアミノ酸配列、遺伝子の塩基配列の取り出し方を実習します.

アミノ酸の取り出し方

使用するウェブサイト:NCBI.

先頭ページ右側にある Popular Resources の中の「Protein」を使用する.

あるいは左上(All databases)から選ぶことも可能.

キーワードによる検索

例:cow, prionでキーワード検索してみよう

cow, prion と関連するタンパク質が多数リストされるが、先頭の 2 つが目的の配列

タンパク質名(青字)をクリックすると配列エントリーが表示される(見方は配付資料を参

照)

FASTA をクリックすると配列が FASTA formatで表示される

配列は、別のファイルにコピーできる.Graphics では、タンパクの構造が表示される

Identical Proteinsでは、別の名前が付けられている同一タンパク質が表示される

Related Sequences では、関連するタンパク質が表示される

FASTA format

塩基配列とアミノ酸配列のファイルフォーム

「>」で始まる1行がコメント(遺伝子名や任意の番号やコメント)を記述するために用意されてお

り、続く2行目から塩基配列あるいはアミノ酸配列を記述する。最後に改行して「//」を記載し、1

つの配列の記述が完了する(記号「//」はなくてもよい)ホモロジー検索、多重アライメント、分子系統樹作成等で使うフォーム.>NP_001258555.1 major prion protein preproprotein [Bos taurus]

MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQP

7

Page 8: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

HGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGG

YMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDI

KMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG

//

塩基配列の取り出し方

使用するウェブサイト:NCBI. Popular Resources の中の「Nucleotide」を使用する

1. キーワードによる検索

例:cow, prionでキーワード検索してみよう

cow, prion の配列だけでなく、関連遺伝子も多数検索されてくるため、必要な配列を見つけ

る必要がある.Bos taurus prion (PRNP), mRNA が今回、欲しい配列である.上の遺伝子質名をクリックすると配列エントリーが表示される(データの見方は配付資料を参

照のこと)

FASTA をクリックすると配列が FASTA formatで表示される

配列は、別のファイルにコピーできる.Graphicでは、ゲノム上の位置が表示される

2.アクセッション番号による検索

accession number=DDBJ/EMBL/GenBank国際塩基配列データベースにおいて各登録単位(エ

ントリー;各遺伝子)に発行されるエントリー識別子(entry identification, ID)を指す。

例:NM_001271626(entry identification, ID)で検索してみよう

なお表示結果の詳細な説明は、次のサイトで閲覧できます。

http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

配列エントリーに示されているデータ

遺伝子名、生物名、学名、遺伝子座、遺伝子クローニングを行った論文リスト、翻訳開始・終了点、ド

メイン構造、塩基配列、アミノ酸配列(配付資料では、zebrafish, prion (NM_205586)を使って説明し

てあります)

講義

ヒトゲノム解読プロジェクト (1/3)

国際研究プロジェクトによるヒトゲノム計画 (Human Genome Project) は 1990年に着手され、13年後の 2003年に解読完了が宣言されました.ヒトゲノム計画は、階層的ショットガン法と呼ばれる手法で行われま

した。すなわち連鎖地図の作成から BAC クローンの整列化の過程を経たのち、染色体上にマップされた BAC ク

ローンをショットガン法で解読し、染色体レベルにまで塩基配列を繋ぐという過程を経て、ゲノム塩基配列の完

8

Page 9: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

全解読にまで到達しました。このプロジェクトの間に塩基配列の解析能力(DNA シークエンサー)は大幅にアッ

プし、同時に塩基配列をつなぎ合わせるコンピューターの処理能力も著しく進歩したことにより、連鎖地図作製

を省略して、全ゲノムをいきなりショットガン法で読むことが可能となりました.民間企業のシエラ社は、数年

のあいだに全ゲノムショットガン法によりヒトゲノムを解読することに成功しました。最終的には、国際研究プ

ロジェクトとシエラ社の間で協議の結果、解読成果が同時に公表されました.

ヒトゲノム計画の終了と前後して、多くの生物で全ゲノム解読プロジェクトが始められ、最近では、次世代

シーケンサーの登場により、数ヶ月でゲノム解読が可能となりました.そのため、既に数百種の動物で全ゲノム

配列の解読が終了し、現在も新しい生物のゲノム解読が次々に完了しています.

ゲノム情報は、遺伝子の機能解析の有力なツールになることは言うまでもありませんが、生物間でゲノム構造

を比較することにより、無脊椎動物から脊椎動物の進化の過程で起こったゲノム構造の変化等も明らかになりま

した.また哺乳類の中でも単孔類(カモノハシ)、有袋類(オポッサム)から有胎盤類に至る進化の過程や、ま

たチンパンジーとヒトでの知能の差をゲノム構造の進化の観点から議論されています.

全ゲノム塩基配列が利用できるという条件のもとで、進められる遺伝子機能やゲノム研究がポストゲノム研究

です.既に家畜や野菜や穀物植物のゲノムもほとんどの種で解読されています。農学でも新しい研究分野を開拓

するためには、ゲノム情報を有効に利用できるがどうかが、極めて重要な素養となります.

ゲノム解読には、階層的ショットガン法と全ゲノムショットガン法の 2通りの方法があり、現在では全ゲノム

ショットガン法が主流となっています。またこの数年の間に、次世代シーケンサー (NGS)が実用化され、既にゲ

ノム解読は NGS を使って、全ゲノムショットガン法で解読するのが主流となっています.NGS によるシーケン

スの超高速化により、様々な生物でゲノム解読が行われています.NGS の原理と利用法については授業の後半で

解説します.

**********************************************************************ゲノム解読プロジェクトで解析されたゲノム DNA 配列情報は、NCBI と Ensemblで一般に利用できるよう

整備されています。遺伝子の染色体上の位置や類似遺伝子の検索には NCBI が便利です。ゲノムの塩基配列を

データベースから取り出す場合には、NCBI あるいは Ensembl を使います。NCBI と Ensembl の使い方

は、授業で実習します。ゲノム情報がいかに強力なツールになるかを体験し、実感してもらおうと考えてい

ます。

————————————————————————————————ゲノム解読の歴史的な背景と、ゲノム解読の方法論を理解してもらうために、授業では階層的ショットガン法

で解読されたヒトゲノムプロジェクトを例にしてゲノム解読の道筋を解説します.もはや、歴史を振り返るよう

な感もありますが、ゲノムを理解するのにもよいので3回に分けて解説します。

ヒト全ゲノム塩基配列解読の行程(1/3)

1) 連鎖地図

2) BAC ライブラリー作製

3) BAC ライブラリー整列化(物理地図)

4) ショットガンシークエンス

5) アセンブル

6) アノテーション

9

Page 10: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

10 月 17 日(第 3 回)

今日の授業内容

1.実習:ホモロジー検索 BLASTP

2.実習:検索結果の見方

3.講義:ゲノム解読プロジェクト(2/3)

実習

ホモロジー検索(BLAST 検索)1/2

 遺伝子やゲノムを扱う研究で使用する機会が最も多いプログラムが、塩基配列やアミノ酸配列のホモロジー

(相同性)検索プログラムです.実験で新しい塩基配列が得られた時に、遺伝子を同定するために、最初に行う

操作が相同性検索でだからです.相同性検索により、クローニングした遺伝子が、データベースに登録されてい

るどの遺伝子と類似しているかを調べることができます.

次世代シークエンス解析で得られた配列をゲノム配列にマップする際にも BLAST 検索が用いられます.ゲノ

ム解読されている生物であれば、100bp の短い配列(次世代シーケンサーの解析では、1 リードは 100-120bp)でもゲノムのどの位置にあるかを調べることもできます.また次世代シークエンス解析を使ったトラ

ンスクリプトーム解析(組織に発現する遺伝子を網羅的に配列解読と遺伝子名の特定、発現量の解析ができる)

では、解読した配列はホモロジー(相同性)検索の BLASTXで遺伝子名が判別されます.

 授業では、BLAST (Basic Local Alignment Search Tool)プログラムを用います。今日は、塩基配列・

アミノ酸配列のデータベース、問い合わせ配列とデータベースの組合せ、各組合せで使う BLAST プログラムに

ついて説明します.そのあとテスト配列(アミノ酸配列)を使って、実際に BLAST 検索を行います.

ホモロジー(homology)検索、とは?

問い合わせ配列(query sequence)に対し、類似した配列をデータベースから探し出す操作.最も高頻度

に利用されるバイオインフォマティックスの手法のひとつ.

検索内容:

例)実験でクローニングした遺伝子の種類を特定する。それがコードするアミノ酸配列がデータベース

に登録されている遺伝子、蛋白質のどれと、またどの程度類似するか?

遺伝子配列データベース:GenBank, DDBJ, EMBL

最も広く利用されており、検索が高速なプログラムが BLAST(Basic Local Alignment Search Tool)です(昔、FAST と言うプログラムも使われていたが、現在はほとんど見かけない)

--------------------------------------------------------――――――――――――――――――-------------検索の組合せ          問い合わせ配列 対 データベース

10

Page 11: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

----------------------------------------------------――――――――――――――――――-----------------BLASTN           塩基配列 対 塩基配列データベース

BLASTP           アミノ酸配列 対 アミノ酸配列データベース

BLASTX  塩基配列(アミノ酸配列に置換) 対 アミノ酸配列データベース

TBLASTN           アミノ酸配列 対 塩基配列データベース(アミノ酸配列に置換)

TBLASTX 塩基配列(アミノ酸配列に置換) 対 塩基配列データベース塩基配列(アミノ酸配列に置換)

----------------------------------------------------――――――――――――――――――-----------------

配列の種間変異の激しい遺伝子の場合(サイトカイン等)、塩基配列を BLASTN 検索しても相同遺伝子が

データベースから検出されないことがある.その場合でも、BLASTX なら相同遺伝子がヒットすることが多

い.そのため、塩基配列で相同遺伝子を検索する場合、一般に BLASTN よりも BLASTXが用いられる.

**************************************************************************

BLAST 検索の原理 1. ホモロジーが観察される配列間の局所アライメントには、多くの場合、ギャップを含まない保存領域が存在

する。BLASTでは、そのような局所保存領域(ワード)をまず高速に検索する。

2. 一致したワードからアライメントを配列に沿ってそれぞれの方向に拡張していき、スコアが増加するまで

続ける。拡張処理は、スコアの増加が止まり、伸ばす前のベストスコアより減少し始めた時に終了する。こ

の時点で、HSP (high-scoring segment pair)と呼ばれる、大きな配列領域が見つかる。この時点でギャッ

プがあるとそこから先には伸長していない。

3. 一般に、アミノ酸配列と塩基配列にはギャップが生じているため、HSP のみでは類似領域の検索として不

十分である。そこで、BLASTでは、HSP において対応する位置に存在する 1組の記号のペアを適切に選び、

類似度の高い領域はこのペアを含むものと仮定して、動的計画法と呼ばれる方法を用いて類似領域を探索す

る。HSP から選んだペアを起点として探索範囲を狭く取ることによって、類似度の最適性は保証されない

ものの、従来の動的計画法と比較して高速な類似領域の探索を実現している。

(詳細は、12 月 5 日に酒井先生が解説します。)

スコアアミノ酸配列の場合:BLOSUM62 スコア(アミノ酸の組合せによって値が決められている)

塩基配列の場合:値は同じ塩基、異なる塩基の組合せでのみ決められている

     ————————————————————————————————

BLASTP 実習

>test_DNA_sequence-1(私の研究グループで単離した遺伝子で、既にデータベースに登録済みである:由

来生物 zebrafish.遺伝子名 charon、機能=内臓・脳の非対称性制御)とアミノ酸配列を下に示しました。

試しにこのアミノ酸配列でBLASTP 検索してみよう.

BLASTP の操作手順

11

Page 12: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1.NCBI 先頭ページ右上 Popular Resources から BLAST を選択する。Basic BLAST に上記 5種類の BLAST プログラムのアイコンがある.

2.protein blast を ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す る 。

Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST)は、デフォルトのままでよい.

3.BLAST のボタンを押して、検索を開始する。

>test_DNA_sequence-1(zebrafish_charon)_protein-seq

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPA

FLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTV

HNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

データベースに登録されている

PSI-BLASTP, PHI-BLAST: 比較的最近開発されたプログラムで、系統的に離れた生物あるいは関連遺

伝子を検索する場合に利用する.種間の保存性が低い遺伝子の場合に利用価値が高い.

検索結果の見方:

グラフィックの次に示されている数値の説明

E-value:検索結果は、Query 配列と相同性を示す配列のアライメント結果が表示される。e-value は、検索に使ったデータベースのなかで、Query の局所配列と検索配列の組合わせが、偶

然にみつかる個数を示す。相同性が高いほど、値は 0 に近づく(最も重要なデータ:蛋白質の場

合、e-5あたりが関連遺伝子か、そうでないかを判断する基準となる)。検索結果の数値のうち、

最も重要である.

Total score (bits): 検索されてきた局所配列の長さをビット形式で示したもの。値が大きいほど、

相同性を示す領域が長い。

Query cover: 問合せ配列の全長のうち、検索配列と配列が一致している領域の%

Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率

アライメントの添えられている数字

Identities:アミノ酸配列で、相同領域のなかで一致しているアミノ酸の比率

Positives: アミノ酸配列の場合に、一致しているアミノ酸+化学的に類似するアミノ酸の比率

Gaps:アライメントされた配列で、片一方で欠損している塩基あるいはアミノ酸の総計

講義

12

Page 13: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ヒト全ゲノム塩基配列解読の行程(2/3)

1) 連鎖地図・物理地図(Radiation hybrid panel)2) BAC ライブラリー作製

3) BAC ライブラリーの整列化

4) ショットガンシークエンス

5) アセンブル

6)アノテーション

完全長 cDNA 配列解読プロジェクト、EST(expressed sequence tags)プロジェクトについての解説

13

Page 14: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

10 月 24 日(第 4 回)

今日の授業内容

1.実習: BLAST 検索(BLASTN, BLASTX, TBLASTX)

2.講義:ゲノム解読プロジェクト(3/3)

実習ホモロジー検索(BLAST 検索)2/2

BLASTN 実習

blastn を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう

BLASTN の検索手順

1.NCBI、Popular Resources の中から BLAST を選択する。Basic BLAST に上記 5種類の

BLAST プログラムのアイコンがある。

2.nucleotide blast をクリックする。

「Database」が、デフォルトでは nucleotide collection (nr/nt)で、このままでよい。

注 意 : Program selection で somewhat similar sequences (blastn) を選択する 。

3.塩基配列(FASTA format)を枠内にコピーする。

4.BLAST のボタンを押して、検索を開始する。

>test_DNA_sequence-1(zebrafish_charon)

AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTC

TTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCG

CTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGA

ACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGA

AATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTG

CGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAA

AAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATA

ACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCG

GAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCG

CGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCAAAGTTCAG

AACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

>test_DNA_sequence-1(zebrafish_charon)_protein-seq

14

Page 15: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPA

FLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTV

HNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

Blastn の 利用例:

とりあえず調べたい遺伝子が、既知のどの遺伝子に類似するか?を調べる時等に使う。ただし、

生物間で変異の激しい遺伝子(実習で使う charon が一例)の場合には、Blastnでは相同遺伝子

が十分に検索されてこないことがあるので、遺伝子を特定するためには、次の Blastx を使う方

がよい。

次世代シーケンス解析で得られた断片(100bp)をゲノムにマップする時は Blastn を用いる。

同じ遺伝子の配列>test_DNA_sequence-1(zebrafish_charon)なのに、blastp と blastnで検索され

てくる遺伝子・蛋白質の数が違うことに注意!(その理由を理解して下さい)

BLASTX 実習

blastX を使って、>test_DNA_sequence-1 の相同遺伝子を検索してみよう

blastx の特性:

このプログラムでは、遺伝子がコードするアミノ酸配列と相同性の高い蛋白質を探す。問い合わ

せ塩基配列は、一度 6 フレームで翻訳され、翻訳された配列がアミノ酸配列データベースに対し

て検索にかけられている。--- タンパクの配列で BLASTP 検索した時と同じ検索結果が得られて

いる

 アミノ酸置換の激しい遺伝子の相同性検索に非常に有効

 進化的に離れた生物から相同遺伝子を探す場合にも有効

次世代シーケンサーを使った de novo トランスクリプトーム解析で得られた配列を同定する

場合、BLASTX が使用される

ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、 >test_DNA_sequence-1(zebrafish_charon)配列を問合せ配列にして、blastn, blastx 検索を行い、得られるデータの違いを理解しよう.

TBLASTN 実習

tblastx を使って、>test_DNA_sequence-1 の相同性検索を試してみよう

tblastx の特性:

問い合わせの塩基配列、データベースの塩基配列とも3フレームで翻訳され、検索にかけられて

いる。

15

Page 16: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Tblastx の利用例:

単離した遺伝子がコードするアミノ酸配列と相同性の高いアミノ酸配列をコードする塩基配列を

探す。配列の変異が激しい遺伝子種の場合に有効。

練習

PCNA は DNA 複製で働くタンパク質で、バクテリアからヒトまで配列の保存性が非常に高い。この

配列でBLASTN 検索して、>test_DNA_sequence-1 の検索結果との違いを考えてみよう。

対象生物をイネに限定して、イネゲノムに相同遺伝子が存在するか調べてみよう。また、バクテリア

のゲノムで試してみよう。

>zebrafish_PCNA_cDNA

ACTTTAGTTCCTCCTACTCCAAACTAAGAAAGCAGCACAATGTTTGAGGCACGTCTGGTTCAGGGATCTATCCTTAAGAAGG

TCCTGGAGGCTCTGAAAGACCTGATCACCGAGGCTTGCTGGGATGTGAGCTCGTCGGGCATTTCTCTGCAGAGTATGGACTC

CTCTCATGTGTCTCTGGTGCAGCTGACGCTCCGGAGTGACGGGTTCGACTCCTACCGCTGCGACAGAAACCTAGCCATGGGG

GTCAATCTGAGCAGCATGTCGAAGATTCTGAAGTGTGCTGGAAATGAAGACATCCAGACACTTAGAGCTGAAGACAATGCTG

ACACGCTGGCACTGGTCTTTGAAGCTCAAAATCAGGAGAAAGTGTCCGACTATGAGATGAAACTGATGGATCTGGATGTGGA

GCAGCTTGGCATTCCAGAGCAGGAATACAGTTGTGTGGTGAAGATGCCGTCGGGTGAGTTTGCCCGCATCTGCAGGGATCTG

TCACAGATTGGTGATGCTGTCATGATCTCGTGTGCCAAGGATGGCGTGAAGTTCTCTGCTAGCGGAGAGCTGGGCACAGGCA

ACATCAAGCTCTCACAGACCAGCAATGTCGACAAGGAGGATGAAGCGGTAACAATTGAGATGAATGAGCCAGTGCAGCTCAT

TTTTGCATTGAACTACCTGAACTTCTTCACCAAGCCAACTCCTCTGTCCAGAACGGTCACACTTAGAATGTCCGCACATATT

CCACTAGTGGTTGAGGACAAAATTGCAGACCTTGAACACGTAAAATATTACCTGGCGCCCCAGATCGAGGATGAAGAGTCCT

CCTAATCCAAGCAGAAGAGCGAAGCCTGTCATCTGTGGGATTTTCATTCTGCAACTCAGAAGTTATTGCATAGATGTTTTGG

GAAAATGCATTTTATTACTCAGTGTCTGCTGTGGTTTCCAGTTCAATGGATTCCCGATTGTGACCCTCTAAAGCCATTACAT

ATCATTGGCAGAATTGCGGGCGCACTTATTAAATGATGGTAGTTTGGGCCTTAGCTTTACCAGGCGCTCCGTGGGCTGAATC

TAGAGTGCTCTCATGTACATACTCCACATTCAGTCTTGTTTTTCTCCCTTTTTGCCGTTGTCCTCTTGTGTCCATTTCAGGT

TTTGTCCAACTGCTCATTCCAATGTGTAGATAATTGTCTGTAAATATGCTAATTGGACACCGTTCATCCAGTCAACCCGTAA

TAAAACTGTTGTATCGG

>zebrafish_PCNA_Protein

MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRSDGFDSYRCDRNLAMGVNLSSMSKILKCA

GNEDIITLRAEDNADALALVFETLNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAK

DGVKFSASGELGTGNIKLSQTSNVDKEDEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGH

VKYYLAPKIDEESS

16

Page 17: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

講義

ヒト全ゲノム塩基配列解読の行程(3/3)

1) 連鎖地図・物理地図(Radiation hybrid panel)2) BAC ライブラリー作製

3) BAC ライブラリーの整列化

4) ショットガンシークエンス

5) アセンブル

6)アノテーション

完全長 cDNA 配列解読プロジェクト、EST(expressed sequence tags)プロジェクトについての解説

17

Page 18: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

10 月 31 日(第5回)

今日の授業内容

1.実習: NCBI のゲノムデータベース(Map Viewer)での BLAST 検索

2.講義:Whole genome shotgun sequence

3.講義:ゲノム解読で分かったヒトゲノムの特性

実習—NCBI Map Viewer の利用—

NCBI の Map Viewerではゲノム解読が行われた生物種ごとに、遺伝子の染色体上の位置を調べることや、

BLAST 検索を行うことができます。授業では、Map Viewer を使って、4 つの使用法を実習します。

NCBI Map Viewer の利用(1/4)

—遺伝子の染色体上の位置を調べるー

1.NCBI 先頭ページ All resources の中から Map Viewer を選択する

2.ゲノム塩基配列が公開されている分類に分けて生物種一覧が表示される: tools に虫眼鏡マーク

(遺伝子の染色体上の位置を調べる)と B マーク(BLAST 検索)がある

3.虫眼鏡マークをクリック

4.Search for の枠に遺伝子名を記入し、リターンキー(or Find)を押す

5.遺伝子の位置が染色体上に赤く示される。下の Map element を選択すれば、より詳細なゲノム情

報が表示される。

ヒト染色体における遺伝子の位置(遺伝子座)を検索してみよう

練習:sonic hedghog (shh)を検索してみよう

1.NCBI で Map Viewer を開ける

2.Homo sapiens (human)の Tools に虫眼鏡マークを選択

3.Search for に shh を記入して、Return4.Map element のなかから SHH(NM_000193.2)を選んでクリック

5.shh の染色体上の位置、周辺の遺伝子が表示される

6.Zoom out、Zoom in してみよう

7.SHH をクリックすると、SHH 遺伝子のイントロン・エクソン構造、変異による病状等

についての情報が得られる

8.OMIM (OMIM は KEGG にもリ ン ク ), HGNC (HUGO nomenclature committee; HUG0=human genome organization) を開けると、変異による異常や分子構造の特性に

関する情報が得られる

18

Page 19: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ウシ、ニワトリ、ゼブラフィッシュでも shhでキーワード検索してみよう

 NCBI Map Viewer の利用(2/4)

—さまざまな生物のゲノムデータベースの利用—

 NCBI, Map Viewerでは、バクテリアから植物、哺乳類に至るまで多様な生物のゲノム情報が利用できます。

ヒトが持っている遺伝子の相同遺伝子を進化的にたどって、どの生物にまで存在しているかと言う疑問について

も、BLAST 検索によって調べることができます。

練習:ヒトの増殖細胞核抗原(PCNA: proliferating nuclear antigen)の相同遺伝子をイネゲノム(Oryza

sativa (japonica cultivar-group))、バクテリアから探してみよう。

 マウスビタミンD受容体の相同遺伝子が、ショウジョウバエ、原生動物(アメーバー)、イネに存在するかど

うかも試してみよう。

バクテリアのゲノム検索では、small genome に入り、種を指定し、検索する。

>human_pcna

MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE

DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS

ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI

EDEEGS

NCBI Map Viewer の利用(3/4)

—特定の生物のゲノムに存在する遺伝子ファミリーのメンバーの検索—

 多くの遺伝子には、生物進化の過程で共通の遺伝子から派生した兄弟遺伝子が存在します。またそのメンバー

は進化に伴って増える傾向にあります。マウスならマウスのゲノムに対して、あるメンバーでゲノムを検索する

ことにより、進化的に関連して部分的にでも共通の配列を持つメンバーを全て検索することができます。今回は

マウスゲノムに存在する核レセプターファミリーのメンバー、及び G タンパク共役受容体のメンバーを探す操作

を実習します。

練習:マウスゲノムに核受容体ファミリーのメンバーが幾つ存在するか?

1.NCBI の Map Viewer(ページ下、POPULAR)を開ける

2.Mus musculus の Tools から B ( BLAST ) を選択3.mouse_vitamin_D_receptor の配列を枠にコピーし、Program から BLASTP を選択

し、Begin Search をクリック

4.マウスゲノムに存在する核レセプターファミリーの全てのメンバーが検索されてくる。

60種類あまり存在することが分かる

19

Page 20: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

5.上の方にある Genome View をクリックしてみよう:検索されてきた遺伝子の染色体

上の位置が表示される

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITK

DNRRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHH

KTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDP

SVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMS

WDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAI

QDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNE

IS

G-protein coupled receptor のメンバーで試してみよう。

>human_MC4R

MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIA

KNKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSL

LSIAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMAS

LYVHMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCF

MSHFNLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY

練習:ショウジョウバエのゲノムには、核受容体ファミリーのメンバーが幾つ存在するでしょうか?

ホヤ(Ciona intestinalis)でも検索してみよう

  NCBI Map Viewer の利用(4/4)

—次世代シーケンス解析で得られた配列の染色体へのマッピング—

 最も汎用されている次世代シーケンサーである Illumina2000では、一度の解析で 100b の断片配列が約

4000万個得られます。ゲノム解析が行われている生物では、このような短い断片でも染色体にマッピングで

きます。さらに参照ゲノムと塩基配列の違いがあるかどうか、遺伝子疾患の原因が解析された個人のゲノム

に存在しているかどうかも判定可能です。

練習:

BLAST 検索で human を選択して、次の配列をゲノムにマッピングしてみよう。

>human_100bp_fragment

CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCCA

CTTTGAAAAAGAAAACAA

20

Page 21: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

11 月 7 日(第6回)

今日の授業内容

1.実習:配列アライメント

2.講義:分子系統樹について

講義

 2 つ以上の塩基配列あるいはアミノ酸配列の一致度を調べる場合、 アライメントプログラムを使います。タン

パク質の場合、異なる生物間でアミノ酸配列をアライメントすることにより、保存性の高い領域を特定すること

ができます。系統的に隔たった生物間(例えば、マウスとゼブラフィッシュ、あるいはマウスと酵母の関係等)

で保存性が高い領域は、タンパク質の機能で重要な役割を持った領域であると考えられます。またシステイン残

基は、タンパク質の高次構造に深く関わるジスルフィド(S-S)結合を作る場合が多いため、保存されていること

が多く、異なる生物のタンパク質をアライメントすることで重要で保存されたジスルフィド結合の位置を予測で

きます。

 ClustalW プログラムを使うと、多重(マルチプル)アライメントの結果から分子系統樹を作成できます。分子

系統樹では、遺伝子の種間あるいは同種間における進化的関係を予測することができます。種間の進化的関係で

は、異なる生物間における相同遺伝子(オーソログ)を同定することが可能です。同種間で関連遺伝子の系統樹

を作成すると、遺伝子ファミリーのメンバーの進化的関係が分かります。またモデル生物(マウス、ゼブラ

フィッシュ)の配列を分子系統樹に加えることで、研究対象の遺伝子に対するモデル生物のオーソログを検索し

モデル生物の情報からから、研究対象の遺伝子の機能についておおよその情報を得ることができます。

 授業では、ペアワイズアライメント(2つの配列を比較)、マルチプルアライメント(3つ以上の配列を比

較)および分子系統樹の作成(来週)を実習します。

配列アラインメント

配列アラインメントとは、配列中で同じ並び方をしている文字列を探すことである。同一もしくは似た文字

は同じ列に置き、同一でない文字は同じ列に不一致として置くか、ギャップを入れる。

ペアワイズアラインメント (pairwise alignment):2つの配列の比較

大域的アラインメント (global pairwise alignment)局所的アラインメント (local pairwise alignment)

多重配列アラインメント (multiple alignment):3つ以上の配列の比較

************************************************************************

21

Page 22: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

実習

Alignment

Pairwise alignment

1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/(Internet explorer を使って EBIで検索)

2)Services の中から Proteins を選択。→左下の See all tools を開け、リストの中から EMBOSS を選

Local alignment → Matcher (protein)

2 つの枠内に配列をペーストして Submit

練習:

下の gnrh(gonadotropin-releasing hormone; 生腺腺刺激ホルモン)からヒトとゼブラフィシュを選ん

でアラインメントを実行してみよう。

次に、ヒトとホヤ(Ciona)で実行してみよう

Global alignment → Needle (protein)

Needle, Protein を選択し 2 つの枠内に配列をペーストして Submit

練習:上と同じ入力を行い、結果の違いを理解しよう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

22

Page 23: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

GNRH: 生腺刺激ホルモン放出ホルモン.視床下部で合成され、下垂体門脈経路を介して下垂体前葉に運ばれ、生腺

刺激ホルモンである黄体形成ホルモン(LH)と濾法刺激ホルモン(FSH)の産生と放出を促進する神経性ペ

プチドホルモン. ホルモン前駆体として合成されたあと酵素により切断され、ヒトでは HWSYGLRPG ペプチドが

ホルモンとして機能する。

Ciona: カタユレイボヤ(ホヤの仲間で日本の研究グループによってゲノムシークエンスが解読された)

講義分子系統樹:Phylogenetic tree, Evolutionary tree

分子系統樹(進化系統樹)(molecular phylogenetic tree, evolutionary tree)塩基配列やアミノ酸配列を基に分岐位置と分岐時間を推定し、構築された系統樹

近接接合法 (neighbor-joining method): 距離行列法で作成する分子系統樹の作成方法で、生物分

野で最も一般的に利用される。

キーワード

節、枝、クラスター (cluster)あるいはクレード(clade)Outgroup、Bootstrap value(ブーツストラップ値)、Evolutionary distance

分子系統樹の利用

(1) 遺伝子の同種間、異種間での系統関係の解析

(2) 遺伝子ファミリーに属するメンバーの系統関係の解析

(3) 重複遺伝子の重複時期と進化的関係の解析

(4) 種や系統の進化的関係の推定

 分子系統樹から、様々な情報を読み取ることができます。異なる生物達の関連(ホモログ)遺伝子で分子系統

樹を作製すると、遺伝子の進化的関係を予測することができます。またミトコンドリア DNA の配列を使うと、人

種の類縁関係や進化的関係を解析することが可能です。授業では、分子系統樹の作製方法とデータの見方を講義

します。

実習

分子系統樹の作製

ClustalW を使った Multiple alignmen と分子系統の作成

1) 使用するウェブサイト ClustalW   http://clustalw.genome.jp/

2) Fasta formatで並べた配列を枠内にペーストし、execute multiple alignment を押す(各種ボタ

23

Page 24: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ンはデフォルトでよい)

練習:下の gnrh (gonadotropin-releasing hormone)のうち、>ciona_gnrh1(ホヤ)を除く

配列でアラインメントを実行してみよう。次に、>ciona_gnrh1 を入れてアラインメントを実

行し、結果を比べてみよう。

上に Multiple sequence alignments の結果が表示される。

その下にある select tree menuで表示形式を選択して、Exec をクリックする

表示形式、N-J tree branch length と Unrooted dendrogram の結果を比較してみ

よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

このサイトでの検索結果では、Bootstrap value, evolutionary distance の値は表示されない。

DDBJ の ClustalW を使えば、これらの値が求められる。ただし、また結果の図形を表示するために、Tree

View と言う無料ソフトをダウンロードする必要がある。教室のコンピューターでは、ソフトウェアのダウ

ンロードはためらわれるので、各自のパソコンでDDBJ を試して下さい。

あるいは、ClustalX のプログラムをダウンロードして解析する(下記URL)。

http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php

NCBI を使った Multiple alignment と系統樹の作成

24

Page 25: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1. NCB→BLAST→下にある Multiple Alignment を選択

2. 枠内に配列を Fasta formatでコピー

3. Align をクリックして検索

4. 検索画面上の Phylogenetic Tree をクリック

5. Evolutionary distance を反映した系統樹が表示される

6. Tools から Layout、Radial tree を選択すると無根系統樹が表示される

プログラムには、2007年に開発された、COBALT: constraint-based alignment tool for multiple protein sequences が使われている

25

Page 26: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

11 月 14 日(第 7 回)

実習

分子系統樹の作成

ショウジョウバエ(Drosophila)の hedgehog タンパク質に対する、マウス(Mus musculus)とツメガエ

ル(Xenopus tropicalis)の類似遺伝子を検索して分子系統樹を作成する。

配列はメモ帳(Text ファイル)にコピーする。

手順は以下のように行う

1.ショウジョウバエ(Drosophila)の hedgehog タンパク質のアミノ酸配列を、protein データベース

からキーワード検索する(Accession number: AAF56102)。FASTAボタンを押すと、FASTA フォームの

配列が表示される。アミノ酸配列を Word にコピーする。>名前を付けて、Fasta format とする(スペー

スと数字は、検索時に削除されて計算されるので、そのままにしてもかまわない)。

2.マウスの hedgehog ホモログを検索して、配列を取り出す

NCBI 先頭ページ下側 Features にある Map viewerでマウス Mus musculus の B (blast)ボタンをクリッ

ク。マウスゲノムに対する BLAST が開くので、Bastp を選択して検索する(マウスゲノムにコードされる

全てのタンパク質アミノ酸情報に対して検索)。

 検索により表示された3種類の hedgehog の配列を取り出す。取り出し方は、Accession番号をクリッ

クし、表示された配列情報ページの上にある FASTAボタンを押す。FASTA フォームの配列が表示されるで、

コピーする。

3.Xenopus の hedgehog ホモログを検索して、配列を取り出す

Map viewerでXenopus tropicalis を選ぶ。以下、2の操作と同じ。

4.ClustalW(http://clustalw.genome.jp/)を使って、枠内に7つの遺伝子の全配列をコピーし、マル

チプルアライメントを実施する。マウスと Xenopus の間で配列の保存性を注意深くみて、保存性の特徴を

理解する。

5.分子系統樹を作成する。N-J tree branch length と Unrooted dendrogram の結果を比較

4の結果とあわせて、Outgroup, Paralog, Ortholog の関係を理解する。ヒト遺伝子間のパラログよりも 、

ヒトと Xenopus のオルソログ間の方が保存性の高いことに注意 。これは祖先遺伝子が重複して2つの遺伝

子(パラログとなる)を形成し、そのあとに種分化が起こったためである。

講義

26

Page 27: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

オルソログとパラログ、ホモログの関係について

 無脊椎動物から脊椎動物への進化の過程で、全ゲノム(全ての染色体)の重複(whole genome duplication: WGD)が 2 回起こっています。そのため原索動物(ナメクジウオ等が含まれ、無脊椎動物のなかで脊椎動物に最

も近い)で 1種類であった遺伝子は、一度 4 つに数が増えています(遺伝子によっては 4 つに増えたあと、4 つ

とも残っているもの、1 つ消失して 3 つが残っているもの、2 つ消失して 2 つが残っているもの、3 つが消失し

て 1種類だけ残っているものもあります)。一つの遺伝子から、ゲノム重複により誕生した重複産物の種内での

関係はパラログ(Paralog)と呼ばれます。現存の脊椎動物(円口類を除く)は 2 回のゲノムの重複が起こってか

ら、多様な種に分岐しています。そのため、脊椎動物の生物種間で相同な重複遺伝子が存在しており、それらは

(Ortholog)と呼ばれ、パラログと区別されます。オルソログの関係にある遺伝子は、種が異なっても(例えば

哺乳類と魚類)機能が良く保存されています。一方、パラログの関係にある遺伝子では、機能分担が起こってい

ます。オルソログとパラログとの関係は、分子系統樹を作製することにより理解できます。ホモログ(関連遺伝

子)は、共通祖先から発生した遺伝子の総称で、オルソログとパラログもホモログに含まれます。

 オルソログとパラログの関係を理解するために、生物の進化の歴史、遺伝子重複の歴史について解説します。

また hedgehog 遺伝子をモデルとして、分子系統樹を作製し、ホモログとパラログの関係を説明します。

 無脊椎動物から脊椎動物に進化する過程で発生したゲノム重複について少し詳しく説明します。hox 遺伝子、

核内受容体遺伝子を例にして、ゲノムに刻まれた遺伝子重複の歴史を解説します(ここでは、配付資料を参考に

して説明します)。

11 月 21 日(第 8 回)

実習

代謝経路データベースの利用

 無料で公開されている代謝経路のデータベースとして最も充実しているのが、京都大学化学研究所が統括して

いる KEGG (Kyoto Encyclopedia of Genes and Genomics)である。代謝経路のマップを調べることが

できるだけでなく、遺伝子の機能、配列、タンパク質の立体構造も検索できる。クローニングした遺伝子がどの

ような代謝経路で機能しているか、あるいは代謝異常のメカニズムなども調べることができる。

 またさまざまな化合物(抗生物質等)や市販の医薬品の構造、薬理作用、副作用を検索することもできる。遺

伝子や化合物の機能や相互作用を調べる場合、またレポート作成等にも役立つと思う。日本語表記のサイトも利

用できる。授業では、KEGG の使い方を実習します。

 最近、KEGG MEDICUS と名付けられた、医薬品・疾患・パスウェーの統合データベースが公開されている。

疾患・医薬品・環境物質など社会的ニーズの高いデータを、ゲノム情報を基盤とした生体システム情報といて統

合したリソースで、研究者だけでなく、医療従事者や一般の人にも情報を提供している。

KEGG ブラウザ:http://www.genome.jp/kegg/pathway.html

KEGG Pathway を開けてみよう。パスウェーの項目は、以下ように分類されている。

1. Metabolism;代謝経路(ビタミン A, retinol metabolism, の代謝経路を調べてみよう。代謝産物を

27

Page 28: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

示す がアクティブで構造等が表示される。また代謝を司る酵素名もアクティブで、配列情報等が表示◯される)

2. Genetic Information Processing;遺伝子から蛋白質合成経路・蛋白の修飾と分解・ゲノムの修復

等(homologous recombination と non-homologous end-joining の経路を比較してみよう)

3. Environmental Information Processing;細胞内シグナル伝達経路・分泌性シグナル因子を介し

た細胞間相互作用(TGF-beta の細胞内伝達系を調べてみよう。発現の促進と抑制(アゴニスト)の関

係が分かる)

4. Cellular Processes:細胞の活動、細胞分裂サイクル等(Oocyte meiosis(卵母細胞減数分裂)を調

べてみよう)

5. Organismal system;免疫系・内分泌制御経路等(GnRH、生殖腺刺激ホルモン放出ホルモン、の内

分泌経路を調べてみよう)

6. Human Deseases:発ガン経路・代謝異常等(Melanoma, プリオン病, diabetes(1型糖尿病、2型糖尿病)の発症経路を調べてみよう)

7. Drug Development:抗生物質・薬剤の化学構造(penicillin, antidepressants を調べてみよう。合

成経路、薬剤の分解酵素等も表示される)

遺伝子のキーワードでパスウェーを検索する時の操作は下記の通り(遺伝子名からパスウェーに入る)

練習に shh; sonic hedgehog のシグナルパスウェーを見よう

1. 先頭ページで KEGG PATHWAT をクリック

2. 枠に shh を入力して GO3. shh 遺伝子が関与するパスウェー(Entry)が複数表示される

4. 試しに map04340 を選択してみよう。

5. パスウェーが拡大される。各遺伝子がアクティブで、配列・機能情報にリンクしている。

6. 上の HEDGEHOG SIGNALLING PATHWAY を選択すると、このシグナルの説明を見ることができ

る。

練習に estradiol の合成経路を調べてみよう

1. 先頭ページで KEGG PATHWAT をクリック

2. 枠に estradiol を入力して GO3. estradiol が関与するパスウェー(Entry)が複数表示される

4. Steroid hormone biosynthesis をあけると cholesterol からの合成経路を見られる

5. 反応を触媒する酵素名がアクティブで反応系、配列等の情報を見ることができる

6. また各代謝産物の化学構造も表示できる

遺伝子の化合物の構造を検索する時の操作は下記の通り

練習に ampicillin の構造を調べてみよう

1. 先頭ページで KEGG DRUG をクリック

2. 枠に ampicillin を入力して GO

28

Page 29: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

3. Entry を選択すると構造等が見られる

KEGG の BLAST 検索を使って、調べたい遺伝子・タンパク質が乗っているパスウェーを検索することもで

きる.

1. KEGG2 先頭ページの GENES をクリック。BLAST を開ける。

2. 例として、下の塩基配列(私達の研究グループがウナギからクローニングした遺伝子でまだ

データベースには登録していない)でBLASTX 検索してみよう

>test_DNA_sequence-2

ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGCC

TGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGACA

AGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGGCGT

CCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACTCGTG

TGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAAGGGCT

ATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGAAGACTC

AGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTCATGACTC

AAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAGATATGATT

CAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCACTGTTGGAC

CAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACCCAAGAAGTAA

ACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCCTTTTGGGGAAC

AGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGACGACCTGAAGCAA

AGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGAATACTGTTAAAAT

GATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

1. ゼブラフィッシュDre のエントリーを開けてみよう

2. Pathway を開けてみよう。検索した遺伝子のパスウェー上の位置が分かる

KEGG MEDICUS

利用できるサービス

・ KEGG MEDICUS 医薬品情報

・ KEGG MEDICUS 疾患情報

・ KEGG MEDICUS 医薬品相互作用

・ KEGG BRITE 医薬品分類

・ KEGG お薬情報

KEGG MEDICUS を開けて、Imatinib と言う医薬品でキーワード検索してみよう

29

Page 30: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

以下工事中

講義

タンパク質の構造についての解説各種プログラムを使うことにより、タンパク質の構造的特徴を予測することができます。今日の授業では、シグ

ナルペプチド、ドメイン構造について解説したあと、テスト配列を使って実際にこれら構造の検索( 分子量、等

電点、シグナルペプチド、疎水性・親水性領域、ドメイン構造)を行います。

 代表的なドメイン構造(モチーフ)検索サイトには、イギリスのサンガー研究所が公開している Pfam があり

ます。

シグナルペプチド

分泌性の蛋白質の N末端に存在する、15-30残基の疎水性アミノ酸から構成されたシグナル配列。分泌前に、シ

グナルペプチダーゼによって切断される。

タンパク質のドメイン(モチーフ)構造

ドメイン構造(=モチーフ):タンパク質のアミノ酸配列のなかで、特有な性質を持った領域。分子の構造上あ

るいは機能上一つのまとまりを持つ領域。

ドメイン構造の例

細胞膜レセプター:リガンド結合ドメイン、細胞膜貫通ドメイン、チロシンキナーゼドメイン、リン

酸化ドメイン

核レセプター:リガンド結合ドメイン、DNA 結合ドメイン

実習

塩基配列のアミノ酸配列への変換

してみます。コンピューター操作に慣れるようにして下さい。今回は、魚類の cDNA ライブラリーからクロー

ニングされた cDNA クローンの全長配列(5’UTR, CDS, 3’UTR を含んでいる)を使って実習します。

5’UTR(5’非翻訳領域), CDS(コード配列), 3’UTR(3’非翻訳領域)

塩基配列(>test_DNA_sequence-1)をアミノ酸配列に変換してみよう

1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/

30

Page 31: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

2)使用するアイコン:Open Reading Frame Finder (ORF finder )open reading frame = 蛋白質をコードする塩基配列の読み取り枠

あるいは、Epaxy の Translatehttps://web.expasy.org/translate/

ORF finder による検索手順1. NCBI のウェブサイトを開き、左上Resource List (A-Z)をクリック

2. Open reading frame finder(ORF finder)を開ける

3.アミノ酸配列に変換する

配列(FASTA format)を枠内に配列をコピーする

OrfFindボタンを押す

青で示された部分が、予想されるアミノ酸配列

(センス、アンチセンス鎖の3フレームでの翻訳結果が示される)

通常、一番長いフレームがタンパク質のコード配列である

青のバーをクリックする=塩基配列とアミノ酸配列が表示される

4.推定されたアミノ酸配列を取り出すには

Acceptボタンを押す

Viewボタンを押す:アミノ酸配列データと諸情報が示されている

アミノ酸配列をテキストファイル等にコピーする

>test_DNA_sequence-1(zebrafish_charon)

AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTTC

TTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGGCG

CTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGACGA

ACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTTCAGA

AATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAAACCTG

CGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGAGCGAAA

AAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACAGCGCATA

ACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCCCTCCAGCG

GAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCACCTGCGCCG

CGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGCCAAAGTTCAG

AACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

//

Epaxy の Translate による検索手順

タンパク質の構造解析では、ヨーロッパの研究機関のウェブサイトが充実している。特に Swiss Institute of

31

Page 32: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Bioinformatics、Sanger 研究所(イギリス)のサイトは、利用価値が高い。前者は、ExPASy (Bioinformatics Resource Portal)、後者は Pfam(ドメイン解析)を公開している。また European Bioinformatics Institute (EBI)でも、タンパク質の構造解析プログラムを公開している。

1. Epaxy をあける

2. 左の Visual guide の、DNA をクリック

3. Translate を選択

4. 枠内に塩基配列のみコピーし、Translate sequence をクリックして検索

基本構造の解析

タンパク質の分子量・等電点の予測:

1) ExPASy (http://ca.expasy.org/)を開ける。

2) Category のなかの Proteomics を開ける

3) Tools から Compute PI/Mw を選択

4) 下記の> zebrafish_Charonで検索してみよう。アミノ酸配列を枠内にコピーする(配列のみ:この

プログラムでは>で始まる行はコピーしない)。Click here to computepI/Mwボタンをクリックする。

5) 検索結果:Theoretical pI/Mw: 10.00 (等電点)/ 27073.04(分子量)

>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN

SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA

AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL

IVEECKCETSSEEAKVQNTDMFNL

//

(ゼブラフィッシュCharon:分泌型のシグナルタンパク質)

疎水性・親水性領域の解析:

1)ExPASy Proteomics tools (http://ca.expasy.org/) を開ける 2)Category の Proteomics を開ける

3)Tools から Prot Scale を選択

4)アミノ酸配列を枠内にコピーする。Hphob. / Kyte &Doolittle(デフォルト状態:疎水性/親水性

解析で最も利用されているプログラム)を選択する。

5)>zebrafish_fgfr1で試してみよう

6)Submitボタンを押す

7)結果:グラフのプラスが疎水性、マイナスが親水性を示す. fgfr1では、アミノ末端側の疎水領域はシ

グナルペプチドの部分。中央の疎水領域は、細胞膜貫通ドメインである。

>zebrafish_fgfr1

32

Page 33: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRND

QMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVPAS

KTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLDVVE

RSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEMEVLQ

IRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSSAKKSD

FNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLVLGKPLG

EGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGPLYVIVEF

AAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTEDNVMKIAD

FGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELFKLLKEGHRM

DRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSSTCSSGEDSVFS

HDAGADEPCLPKFPPHPNRGVAFKKR

(FGF受容体:細胞内にチロシンキナーゼドメインを持った膜貫通型細胞膜受容体・FGF=fibroblast growth factor/繊維芽細胞増殖因子:創傷治癒、培養条件下で繊維芽細胞の分裂を促進する。胚発生では

中胚葉誘導に関与する)

シグナルペプチドの検索

タンパク質のシグナルペプチドの予測:

1)SignalP 3.0 Server (http://www.cbs.dtu.dk/services/SignalP/)を開ける(デンマークの

Technical University が公開)

2)>zebrafish_Charonで検索してみよう。アミノ酸配列を枠内にコピーする。Submitボタンをク

リックする。

練習:下のアミノ酸配列でも検索してみよう

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDN

RRHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYD

PTYADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDL

SPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDY

KYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQT

YIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

(ビタミンD受容体は、核に移行する蛋白質なのでシグナルペプチドはない)

ドメイン構造の検索

タンパク質のドメイン構造の予測-1:Pfam を使う(ドメイン検索で最も利用されている:機能ドメインを探

すのに便利)

33

Page 34: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

今日は、下のマウスのビタミンD受容体で検索します。

1) Pfam (http://pfam.sanger.ac.uk/)(イギリスのサンガー研究所)を開ける

2) SEQUENCE SEARCH ボタンを押す

3) 枠内にアミノ酸配列(試しに>mouse_vitamin_D_receptor)をコピーし、Go を押す

4) みつかったドメイン構造がグラフィックで上に図示される。

5) 下には各ドメインの説明が表示される。

6) 一番右の Show/hide alignment を押すと、データベースに納められているドメイン配列と問い合

わせ配列のアライメントが表示される

7) ドメインネーム(上のグラフィックも同様)がアクティブで、それを押すと、ドメインの説明、立体

構図が表示される

8) 右上のグラフィックツールのうち、crystallographic structures を押すと、みつかったタンパク質の

高次構造がグラフィックで示され、詳細な構造の説明も表示される。PBD ID を押すと、タンパク質の

高次構造(アルファへリックス構造等)が表示される。

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRN

VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILTD

EEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLSFS

GDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDD

QIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAI

CIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKL

TPLVLEVFGNEIS

(ビタミンD受容体;核タンパク質受容体ファミリーのメンバーで、骨形成等に関与する)

終わった人は、次のタンパク質で検索してみよう:

ゼブラフィッシュ・FGF レセプター

等鎖結合部位の予測

Asn-Xaa-Ser/Thr タイプの等鎖結合部位の予測プログラム

http://www.cbs.dtu.dk/services/NetNGlyc/

3D 構造データベースの閲覧

NCBI の利用

NCBI の Resource List の中にある Structure (Molecular Modelling Database)を使うと、タンパク質構造デー

タベースに納められている 3D 構造を閲覧することができます。

↓NCBI homepage

34

Page 35: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

↓Resource List から Structure (Molecular Modelling Database)を選択↓左カラムの Search を選択

↓Search の枠にタンパク質明を入力して検索(試しに prion, VDRで検索してみよう)

PDB (Protein Data Bank) の利用

www.pdb.org上のアイコンから macromolecule を指定してキーワード検索(試しに prion, VDRで検索してみよう)

3D 構造だけでなく、遺伝子の機能の解説も添えられている

NCBI blastp による検索

Blastpでデータベースを Protein Data Bank を選択して検索する(上の Protein Data Bank に登録され

ている高次構造の分かっているタンパク質に対して blastp 検索が行われる)

配列類似遺伝子で高次構造の解析されているタンパク質が表示される。右の Accessionボタンを押すと、

データが表示される。右に 3D 構造が図示される。

35

Page 36: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

11 月 28 日(第 9 回)

講義

配列情報と文献の検索

 研究計画を立てる場合、その研究に関連した過去の論文をリストアップして、既に報告されている成果を調べ

ておくことが大変重要です。この操作により、これから進める研究テーマについて、研究がどこまで進んでいる

のか、何が分かっていないのかを調べる訳です。そして未知の生物現象を解明するのに、最も有効な計画を立案

します。もちろん研究で遺伝子を扱う場合、その遺伝子の配列、これまでに分かっている性質を調べておくこと

も重要です。この検索操作をちゃんとしておかないと、「せっかく得られた実験成果が既に報告されていた」と

言うような悲惨なことも起きかねません。

 また卒業論文や投稿用論文の作成時には、緒言に研究の歴史と背景、研究内容の意義を述べ、考察では実験結果

と既知の成果を比較検討し、研究で得られた新しい知見について議論します。論文を仕上げる時にも、関連論文

を収集して精査する必要があります。文献以外にも、クローニングした遺伝子と関連遺伝子とのアライメントを

行うことや、分子系統樹を作成するのに関連遺伝子をデータベースから引き出してくることが必要となることが

あります。

 例えば、自分の研究でウシやブタなどの家畜、あるいは作物で遺伝子をクローニングしたとします。遺伝子機

能に関する研究が進んだ現在では、モデル生物(マウス、ニワトリ、ゼブラフィシュ、ショウジョウバエ、線虫

酵母、シロイズナズナ等)のどれかで相同遺伝子の機能が解析され、論文の形で出版されていることが多いと言

えます。その論文を読めば、クローニングした遺伝子の持つ機能の概要を知ることができます。データベースを

利用すれば、この様な情報も簡単に収集できます。遺伝子を BLAST 検索し、モデル生物の相同性の高い遺伝子配

列を探し、そこから文献情報を探すことが可能です。

 今日は、研究計画を立てる時や論文を書く際、クローニングされた遺伝子に関連する論文の検索、研究や論文

作成で必要な論文の検索方法を実習します。

文 献 の 検 索 に は 、 ( 1 ) NCBI の PuBMed 、 ( 2 ) 大 学 の 図 書 館 の オ ン ラ イ ン ジ ャ ー ナ ル 、

(3)Scopus(Elsevier社の有料検索システム)が利用できます。PuBMed の使い勝手が最近非常によくなった

ので、ほとんどのことは PuBMedですみます。従って、PuBMed の使い方を中心に演習し、大学の図書館のオン

ラインジャーナルについて少し解説を加えます。

文献検索を使う目的には、下記のように幾つかのシチュエーションに分かれます。いずれも PuBMedで可能です。

1. 特定の論文をダウンロードしたい。

2. ある研究者がどのような論文を出版しているか知りたい

3. ある生物現象に関する論文をもれなく調べたい。

4. 作成中の論文の考察に必要な論文を探したい

5. 扱う遺伝子に関連する論文を調べたい。

36

Page 37: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

実習

文献の検索

使用するウェブサイト:NCBI

使用するアイテム: PubMed

上の枠の下にある Advancedボタンを使う。

左の All Fieldsボタンをクリックすると、著者名、出版年度、タイトル中のワード、Abstract中の

ワード、Journal(雑誌)名で検索できるシステムになっている。これらをうまく使うと必要な文献を

うまく検索することが可能である。それぞれについて授業では実習します。東北大学図書館が購読契約

している雑誌、あるは Plos One のような on-line journalであれば、検索結果のページから論文の pdfファイルをとりだして、プリントやダウンロードができます。

1. 特定の論文をダウンロードしたい。

例えば、山中先生がノーベル賞をもらうことになった iPS細胞の論文を探してみよう。

Author: Yamanaka ShinyaJournal: Cell

2. ある研究者がどのような論文を出版しているか知りたい

例えば、私と研究室の助教の横井さんの共著論文を探してみよう。

Author: Suzuki TohruAuthor: Yokoi Hayato

3. ある生物現象に関する論文をもれなく調べたい。論文の考察に関連する論文を探したい。

例えば、魚類の iPS細胞に関する論文が出版されているか?

Title/Abstract: FishTitle/Abstract: iPS cell

成長ホルモンの日周リズムに関する論文を知りたい

Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm

4. 扱う遺伝子に関連する論文を調べたい。

例えば、癌遺伝子 Brca2 に関する論文を調べたい。

Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish

37

Page 38: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

BLAST 検索結果から、検索した遺伝子に関する文献情報を収集することもできます。リストアップされてきた遺

伝子の名称がアクティブで、それをクリックすると配列情報に加えて、 PUBMED の番号を添えた形で関連の論文

もリストアップされています。PUBMED番号をクリックすると文献情報に入ることができます。

test_sequence-1で試してみよう。

>test_sequence-1(zebrafish_charon)_peptide

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFPA

FLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETVTV

HNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI

「電子ジャーナル」へのアクセスの方法

東北大学ホームページ→東北大学付属図書館→電子ジャーナルリスト(学内者限定)→雑誌名のキーワード

検索 OR アルファベット順で検索→volume, page入力・検索

38

Page 39: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1.講義: 論文の構成、文献データベース

2.実習:文献検索(PubMed)

鈴木不在(分子生物学会に出席)のため酒井先生が代わりに下記の内容で授業を行います。

配列のアラインメント手法とBLAST検索の原理

・配列のアラインメントとは

・全域アラインメントと局所アラインメント

・アミノ酸置換行列

・動的計画法に基づく局所アラインメントの求め方

・BLASTはどのように検索を行っているのか

(動的計画法との違いと、それにともなう利点、問題点)

進化系統樹とCLASTAL Wで用いられている近隣結合法の原理

・種の進化モデル

・分子時計仮説

・ウルトラメトリック木と加法木

・UPGMA法

・近隣結合法

以上について概説する。

同内容の詳細については3年前期「生物生産情報処理概論」にて講義する。

39

Page 40: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

12 月 5 日(第 10 回)

講義

講義:次世代シーケンス解析の原理

次世代シーケンス解析について

 次世代シーケンス解析は、この数年で実用化された DNA シークエンス解析技術で、その原理は従来の

サンガー法を基礎とした蛍光シークエンサーとは異なり、ガラス基盤(フローセル)に固着したプライ

マーを鋳型にして(ブリッジ PCR)、基板上で1塩基の伸長反応ごとに結合した塩基を蛍光検出します

(Sequence by synthesis)。ナノ技術により、1mm四方で万単位のシークエンス解析が可能です。

最も汎用されている Illumina社の HiSeq2500では、1 リードのリード長は 125bp と短いですが、シー

ケンサーを一度動かすと(1ラン)で 80億リードが読まれます。つまり 1 ランで、1000 Gbp(ギガ

=10億)の配列が得られることになります。ヒトのゲノムサイズは約 3 Gbp なので、その x300 が読ま

れることになります。現在では、個人のゲノム解読も可能です。

従来の蛍光シーケンサーでは、1 ランで 700bp のリードが 96、総計約 67kb の塩基配列が得られる

のに比べると、オーダーが千万単位違います。つまり次世代シーケンサーが 1台で、蛍光シーケンサー

の千万台分の解析能力があるわけです。HiSeq2500では、ペアエンドのシークエンス解析(約 300bpの断片を両側から 125bp 読む)が可能です.シングルエンドのシーケンス解析に比べ、ペア情報は配列

をコンティグに繋ぐ時に非常に有用になります。従って、de novo genome sequencing, de novo transcriptome 解析にはペアエンドのシークエンス解析が必須である。

 世代シーケンサーは 1台が数億円するため、研究室で購入することは非現実的ですが、依頼解析が随分

廉価となり、すでに農学研究でも汎用されています。農学が対象とする生物も、ほぼ全ての種のゲノム

解読が終わっています。今後は系統間の塩基配列の違いを調べ、遺伝形質と配列との関係を解析すること

が重要になると思われます。

 ここで注意しなければならないことは、1 レーンあたり 125bp の配列断片が約 7億個得られると言う

ことで、その解析はとうてい人の手に負えるはずはなく、コンピューター解析技術が必須です。ゲノム

にしても cDNA の配列を読むにしても、最初に 125bp の配列断片から重なり合う部分を探して、配列を

コンティグにつなげる必要があります。配列解析のバイオインフォマティックスは現在非常に重要に

なっており、まだ人材不足の状況です。とりあえずは、遺伝研のパイプライン等を使えば、普通に必要

な解析は誰にでもできますが。

 授業では、(1)次世代シーケンサーの塩基配列解読原理、(2)次世代シーケンス解析の利用方法に

ついて講義します。

次世代シーケンサーの解析原理等は、国立遺伝学研究所 先端ゲノミクス推進センターのホームページが

参考になる

http://genome.nig.ac.jp/glossary/glossary11.html

40

Page 41: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

12 月 12(第 11)

講義ポストゲノム研究

様々な生物のゲノム配列が解読されるようになり、ゲノム配列を使った新しい研究がスタートしています。ゲ

ノム配列が利用できると言う前提のもとに始まる研究がポストゲノム研究です。その内容は、遺伝子の機能解析

生物進化、遺伝子疾患の原因遺伝子の探索など多岐にわたります。この授業では、3 つのトピックスについて紹

介します。

ポストゲノム研究-1

比較ゲノム学:進化に伴うゲノム構造の変化

 進化的に隔たった多様な生物でゲノム解読が行われたことにより、種内のパラログの検索、また異なる生

物間でオルソログを比較すること、遺伝子ファミリーのメンバーを比較することが可能になりました。また

染色体上の遺伝子の配列を系統的に離れた生物間で比較することにより、それらの共通祖先生物の染色体構造

を推定することが可能となっています。比較ゲノムは、このように生物間でゲノムを比較して、進化を論じ

る研究分野です。授業では、哺乳類と魚類の比較ゲノムを紹介します。

 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。脊椎動物は、大部分の魚類を含

む条鰭類、それとシーラカンス・肺魚および四肢動物を含む総鰭類の2つのグループに大別されます。条鰭類

と総鰭類は4億5千年前に分岐しました。フグとヒトのゲノム構造を比較することにより、4億 5千年前に

生きていた総鰭類と条鰭類の共通祖先(もちろん現存しない)のゲノム構造が明らかとなり、その後のゲノ

ム構造の変化が解明されました。解析の結果、脊椎動物のゲノムの進化について、次のような予想もされて

いなかった結果が得られました。

(1) 4億 5千年前に生きていた総鰭類と条鰭類の共通祖先は12組の染色体を持っていた。

(2) 総鰭類では条鰭類と分かれた直後に、ゲノムに大量のレトロウィルスが挿入され、ゲノムサイズが

大きくなった。その後染色体間の転移と融合(ミキシング)が頻繁に起こった。

(3) 条鰭類では総鰭類と分かれた直後に、ゲノムの倍化(脊椎動物の誕生から数えると3度目)が起こっ

た。重複した遺伝子の大部分は片方がゲノムから脱落したが、約 20%の遺伝子は倍加したまま現在

でも機能遺伝子として働いている。そのため、ゲノム上の遺伝子数は条鰭類の方が総鰭類よりも

20%程多い。このような遺伝子数の増加が、魚類に形態や環境適応の多様性をもたらしたのではな

いかと考えられている。また条鰭類では染色体へのレトロウィルスの挿入はわずかであり、染色体

のミキシングもわずかである。

 また、無脊椎動物でも進化的に重要な位置にあるホヤやナメクジウオのゲノム解読が行われ、哺乳類でも

多数の生物のゲノムが解読されています。生物間でゲノムを比較することにより、臭覚受容遺伝子が無脊椎動

物から脊椎動物の進化の過程で遺伝子数を増加してきたことが、明らかになっています。また胎盤の進化で

は、レトロトランスポゾン由来の遺伝子が重要な役割を果たしているという、意外な事実も示唆されていま

す。またヒトとチンパンジーでは、塩基の置換率はたった 1.23%ですが、反復配列の挿入がヒトの方がかな

41

Page 42: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

り多いことが分かりました。このように挿入配列は、以前考えられていたようなたんなるガラクタではない

ことが分かってきました。

シンテニー

 異なる脊椎動物(例えば、ヒト-マウス、ヒト-フグ)を過去に遡ると、共通祖先が存在します。共通祖先から分

岐したあと、それぞれの系で転座と融合が起こっているが、小さなブロック単位で見ると遺伝子の並びが一致す

る領域があります。染色体上で遺伝子の並びが一致している状態は、シンテニーと呼ばれます。全ゲノムが解読

されるとゲノム全体を生物間で比較することが可能となり、シンテニーの様子が明らかとなります。

 ヒトとマウスを比べると、哺乳類同士のため、明瞭にシンテニーの保存状態が見て取れます。

 一方、魚類では四肢動物と分かれてから直後に全ゲノムの重複が起こっているため、魚類の染色体はヒトやマ

ウスの染色体に対して2重のシンテニーを示す特徴があります。

12 月 19(第 12)

講義

次世代シーケンスで読み取られたリードの情報処理

トランスクリプトーム解析(RNA 配列の解析)

ゲノムシーケンス

HiSeq2000だと一つのリード長は 100bp、HiSeq2500だと 125bpで、依頼解析に出すと、1 サンプルあた

りギガオーダーのリードが USB にコピーされて送られてきます。日本では、次世代シーケンス解析を広く普及す

るために、遺伝学研究所により、次世代シーケンスのリードを情報処理するプログラム(Pipeline)が、ウェブ上で

無料で利用できるように整備されています。有料のプログラムの場合、半年契約で 50万円あまりと高額です。解

析は、大型コンピューターが必要なので、クラウドシステムで、配列を Pipelineで送り、遺伝研のコンピュー

ターで情報処理され、数日後に解析データが送られてくるシステムになっています。

シーケンスのサンプルは、ゲノム DNA の場合と組織・細胞に発現する mRNA(cDNA)に大別されます。また、

解析の対象生物は、参照ゲノムのある生物、新規にシークエンスする生物に分かれます。参照ゲノムのある生物

では、ゲノム配列のデータベースとcDNA のデータベースが準備されているので、ゲノム DNA、RNA のリード

ともに参照配列に直接マップすることができます。ゲノム DNAであれば、サンプル間で、SNPや配列の挿入・

欠損を見いだすことが可能です(ゲノムリシーケンス)。RNAであれば、各cDNA にマップされるリード数をカ

ウントとして、サンプル間で比較することにより、組織に発現する全遺伝子を同定するとともに、サンプル間で

現量を比較することが可能です(トランスクリプトーム解析)。参照ゲノムのない生物の場合、リードを一度、アセンブルする必要があります。これも遺伝研の Pipelineで実

行できます。ゲノムの場合、現在だと HiSeq2500 のリードを繋いだ Contig に、PacBio の次世代シーケンス解

析のリード(約 10kb)を併用することでかなり長い Scaffold にまでつなぎ合わすことが可能です(de novo ゲノム

シーケンス)。RNA の場合、リードをアセンブルして得られる Contig がコードする遺伝子を BLASTX により同定

しますが、この操作も Pipeline の Maser が全てやってくれます。さらに KEGG の代謝パスウェーへの GO(gene

42

Page 43: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ontology)アノテーションも同時に実行してくれます。

授業では、これらの技術を使って行われた研究成果について幾つか紹介します。

実習

—ゲノム塩基配列をデータベースから取り出す—

Ensembl Genome Brower

Ensembl Genome Brower(ゲノムデータの統括サイト)は、Sanger 研究所・EBI が管理するゲノムデータ

ベースです。最大の特徴は、必要な遺伝子、あるいは染色体領域のゲノム塩基配列を取り出すことができること

にあります。cDNA を特異的に増幅する PCR プライマーの設計、CRIPR-Cas9 を使ったゲノム編集、ノックアウ

トマウスの相同組換えに用いる配列、GFP を使ったレポーター遺伝子作製用のプロモーター配列が必要な場合な

どで、Ensembl を使ってゲノム配列を取り出すことになります。実習では、Ensembl の説明と実際の配列の取

り出し方を教えます。

また、ゲノム配列、全遺伝子のコード配列、全蛋白質のアミノ酸配列もダウンロードすることが可能で、それ

らを使って自前でバイオインフォマティックス解析を行うことができます。

「使用法-1」

Ensembl を使って、試しにマウスの sonic hedgehog(shh)のゲノム配列を取り出してみます。

1.下記のウェブサイトを開ける

http://www.ensembl.org/index.html (ensemblでキーワード検索)2.生物種を指定する

マウスを選択

3.検索項目から gene を選び、遺伝子名(shh)をボックスに入れて検索

4.リストアップされてきた複数の遺伝子から、shh をクリック(ESMSUSG000000002633)する

染色体上の地図が表示される

5.左側のツールボックスの中から Sequence を選択してクリック

6.配列が表示される(エクソンは赤字で肌色の背景、エクソン間の黒字の部分はイントロン、第一エクソンよ

り上流はプロモーター領域の一部である)

7.戻って、Location からもゲノム構造を検索することができる

8.左側にある Export dataで、範囲を選択して配列を取り出すことができる(範囲を指定して、より長いプロ

モーター配列を取りですことができる)

「使用法-2」

ゲノム配列、全遺伝子のコード配列、全蛋白質のアミノ酸配列をダウンロードする

43

Page 44: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA)からダウンロード可能

44

Page 45: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1 月 9(第 13 回)

次世代シーケンスを使ったゲノムシークエンスにより、これまでの連鎖解析では同定困難であった疾患や

形質の原因遺伝子を見つけ出すことが可能となっています。最近の報告例を使って、紹介します。

Whole genome association study (WGAS)

コントロール群と実験群(表現形質:例えば左利き)で、全ゲノムにわたって SNP の出現頻度を比較

する。表現型の責任遺伝子近傍の SNPでは表現型集団で一致度が高くなるので、それを検出することで

責任遺伝子のゲノム上の位置を特定する。

Exome 解析

 メンデル遺伝する 1 遺伝子によるレアな遺伝子疾患の場合、コード領域の変異によりアミノ酸の置換が

起こっていることが多い。この技術では、ゲノムのエクソンのみ配列を解読することで、患者に特異的な

塩基置換、InDelを検出することで、遺伝子疾患の責任遺伝子を特定する。総エクソンの塩基配列は、

ゲノムの 1%程度なので、解析量が少なくてすむ。場合によっては、5名程度の患者を解析するだけで、

原遺伝子が特定される例もある。

Rad-Seq

 ゲノムを特定の制限酵素で消化し、消化断片の末端を次世代シーケンスで解析し、SNAP を検出する。

通常の NGS ゲノム解読ではランダムに断片化するので、集団間でリードを直接比較することは不可能で

あるのに対し、Rad-Seq の場合には、制限酵素の切り口がそろっているので、ゲノム全体にわたって

リードを高速かつ間便に系統間ですることが可能である。農林水産での品種の解析に有効だと思われる。

バイオデータベースの利用

 遺伝子の機能を知りたい場合には、ポストゲノムのモデル生物(マウス、ゼブラフィッシュ、シロイズナズナ

等)の検索サイトが重宝します。これらは、バイオデータベースと呼ばれます。モデル生物のなかでも、特にマ

ウスとゼブラフィッシュのデータベースが充実しており、遺伝子の機能だけでなく発現パターン(遺伝子が何時

どの組織で、どれだけの量が発現するか)、遺伝子ノックアウトやノックダウンの表現型もデータベース化され

ており、遺伝子名のキーワード検索でデータを入手することが可能です。

 ヒトの遺伝子機能と遺伝子疾患のデータベースとして NCBI に OMIM(Online Menderian Inheritance in Man)が公開されています。遺伝子名でキーワード検索すると、遺伝子の機能、遺伝子疾患が存在する場合には 、

配列変異と疾患の表現型を知ることが可能です。

 マウスのデータベース(MGI: mouse genome informatics)の特徴として、遺伝子ごとにノックアウトマウ

スの表現型がデータベース化されており、表現型から遺伝子の機能を調べることができます。マウスのデータ

ベースでは、遺伝子の正確なマップポジション(連鎖地図、ゲノム配列上)等も示されています。

 ゼブラフィッシュのデータベース(ZFIN:zebrafish Organism Data Base)には、in situ ハイブリダイ

ゼーションによる発現解析のデータが写真で掲載されており、遺伝子発現に関する組織レベルの情報を得ること

45

Page 46: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ができる特徴があります。脊椎動物中であればオルソログ遺伝子(異なる生物の同一遺伝子)の発現パターンは

類似していることが多いので、マウス、ウシやニワトリを研究対象にする場合でも参考となります。

論文や単行書を読んで機能が分からない遺伝子(タンパク質)がでてきた時には、それらの遺伝子の機能を調

べる必要があります。このようなときには NCBI の OMIM (Online Mendelian Inheritance in Man) とマ

ウス・ゼブラフィッシュのウェブサイトを使うと情報を得ることができます。授業では、これらのサイトの使い

方と特徴について説明します。

OMIM の使い方

ヒトで分かっている遺伝子の機能を詳細に記述している。関連文献もリスとされている。

1. NCBI を開け、左上の All List (A-Z)から Online Menderian Inheritance in Man (OMIM)を選択する。

2. 枠内に遺伝子名を入力して検索

練習に growth hormone(成長ホルモン)を検索してみよう

growth hormone 遺伝子および関連遺伝子の配列変異によって起こる症候群のリストが表記される。遺

伝子の機能、変異に伴う疾患、タンパク質の構造、関連論文を調べることができる。

MGI, ZFIN の使い方

ポストゲノム研究のモデル生物のウェブサイトを利用してみよう。これまでの研究によって明らかにされている

遺伝子の機能が検索できる。

1.マウス(MGI)

mouse genome informatics:  http://www.informatics.jax.org/1. 先頭ページの QuickSearch の枠内に遺伝子名を入力する

2. 入力した遺伝子の情報、遺伝子改変マウスがリストされる

試しに Pax6(眼の発生の上流にある転写因子)を入力してみよう

Pax6 と言うワードを含む遺伝子リストが表示される。Pax6 を選択する

得られる情報

Symbol/Name/ID:遺伝子の正式名称、略記

Synonyms:同義語(別名)

Genetic map:遺伝子の連鎖地図上の位置

Sequence Map:遺伝子の物理地図上の位置

Mammalian Homology:哺乳類の相同・類似遺伝子

Sequences:ゲノム塩基配列・cDNA 塩基配列・アミノ酸配列情報

Phenotypes; ノックアウトマウスの表現型。遺伝子の生物機能が分かる

Polymorphism: 系統間で見られる配列多型。SNPs(1塩基多型)等

46

Page 47: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Gene Ontology (GO):遺伝子の機能、構造

Expression:発現する組織のリスト

Protein Domains:転写産物が持つドメイン構造のリスト

References:関連文献

2.ゼブラフィッシュ(ZFIN)

The Zebrafish Model Organism Database:http://zfin.org/1. Genes/Makers/Clones を開ける

2. Name/Symbol に遺伝子名を入力して検索

試しに pax6 と入力して検索してみよう。

魚類で単独に起こったゲノム重複のため pax6a と pax6b がある

Symbol-nameでは遺伝子の各種情報が表記される

Expressionでは、遺伝子発現のデータが表記される

Phenotypeでは、ノックダウンとノックアウトの表現型が表記される

Locationでは、染色体上の位置が表記される

47

Page 48: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1 月 16 日(第 14 回)

ポストゲノム研究(3)

—機能ゲノム学—

- ゲノムを比較して遺伝子の発現調節機構を探る -

 ポストゲノム研究の重要なテーマとして、全ての遺伝子の機能を調べることに加えて、遺伝子の転写調節に重

要な配列領域を見つけることがあります。転写調節領域は遺伝子が何時、何処で、どれだけ発現されるかと言う

情報をコードしていることから、生物の形態や環境適応の多様性の背景にあるゲノム情報は、タンパク質コード

領域よりもむしろ転写調節領域に存在する場合が多いものと予想できます。

 特に胚発生など生物の基本的な生命現象に関係する遺伝子(例えば sonic hedghogや Pax 遺伝子)の転写調節

領域は、生物間で強く保存される傾向にあります。ゲノム情報を利用することにより、遺伝子発現に必須の領域

を検索したり、生物間で変異が起こっている領域を見つけだし、それらの機能や生物学的意味を解析する研究分

野は、機能ゲノム学と呼ばれます。授業では、ヒトとフグの非コード領域の比較から、遺伝子の転写調節に重要

な領域(CNE; conserved non-coding elements)を見つけだした研究事例を紹介します。

実習今日は、これまでの実習の復習を行います。

lefty と言う名前の遺伝子を材料にして復習をしましょう:

lefty の機能の検索

メンバーの同定

遺伝子の発現パターン

ヒトとゼブラで分子系統樹を作製

メンバーの進化的関係を推定しよう

48

Page 49: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1 月 16 日(第 14 回)

転写調節領域のコンセンサス結合配列の予測-

講義遺伝子の発現調節機構

 遺伝子は、特定の細胞また時期に必要量だけ発現するように調節されています。例えば、ペプシノーゲンの発

現は胃に限定されており、筋肉や脳では決して発現しないように制御されています。発生に関係する遺伝子のな

かには、魚類の孵化酵素のように一生のうち孵化時に一度だけ発現する遺伝子もあります。このような発現調節

に関する情報は、ゲノムのコード領域ではなく、その近辺に存在する転写調節領域(エンハンサー領域)にコー

ドされています(5’上流にある場合が多いが、3’下流にあるものやイントロンにある遺伝子も存在する)。具体

的には、転写因子が結合するコンセンサス結合配列がその情報と言うことになります。転写因子は、ゲノムの決

まった配列を認識して結合します。その配列がコンセンサス結合配列です。コンセンサス結合配列は、 6-20 塩基

ほどの短い配列です。転写調節領域には、複数個のコンセンサス配列が存在し、複数の転写因子が結合・解離す

ることにより、遺伝子の転写を精密に調節しています。講義では転写調節のメカニズムについて解説し、実習で

転写調節領域のコンセンサス配列を検索します。

実習マウスの sonic hedghog 遺伝子の 5’上流域の転写調節領域の配列をゲノムデベースから取り出し、コンセンサ

ス結合配列を予測してみます。

コンセンサス結合配列の検索には幾つかのプログラムがありますが、実習では TFSearch を用います。

http://www.cbrc.jp/research/db/TFSEARCHJ.html

問題:マウスの sonic hedghog(shh)遺伝子の転写調節領域の配列をゲノムデータベースから取り出し、コ

ンセンサス結合配列を予測する。

(1)最初にゼブラフィッシュの sonic hedghog 遺伝子の 5’上流域の転写調節領域の配列をゲノムデベース

から取り出します。

1) Emsembl (http://www.ensembl.org/index.html)を開けます

2) 対象性物から mouse を選択

3) 検索項目から gene を選び、shhで検索

4) 検索結果のページにある shh のアクセッションをクリック

5) 左側ボタンの Sequence をクリックすると、ゲノム配列が表示される

6) 第1エクソン(赤字)から上流の配列(転写調節領域)をメモ帳にコピーする( -40 b あたりに TATA box (TATA(A/T)A(A/T))が存在することが分かる。その約 40b上流には CAAT Box (GCCAATCT)が配置す

る)

49

Page 50: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

(2)次に、MOTIF Search を開ける

(http://www.cbrc.jp/research/db/TFSEARCHJ.html)

7) 上の枠に任意の名前を入力する

8) 下の枠に塩基配列をコピー、分類を脊椎動物とし、Exec をクリック

注意:コンセンサス配列は、ほとんどの場合 6-10b程の短い配列であり、加えてある程度の配列のバリエーショ

ンを許容します。そのため予想された配列には、実際には転写因子と相互作用しない配列が高い比率で含まれま

す。検索結果は、目安程度に考えて下さい。実際のコンセンサス配列を同定するためには、分子生物学の技術

(ゲルシフトアッセイ、ルシフェラーゼをレポーターにしたプロモーター解析等)を使って実験的に検証する必

要があります。

50

Page 51: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

1 月 10 日(13 回)

1.ゲノム解読で明らかになったヒトゲノムの特徴、医療への利用についても簡単に紹介します

ポストゲノム研究-2

次世代シーケンスを使ったゲノムシークエンスにより、これまでの連鎖解析では同定困難であった疾患や形質

の原因遺伝子を見つけ出すことも可能となっています。この技術は、 whole genome association study (WGAS)と呼ばれます。最近の報告例を使って、WGAS について紹介します。

また、ゲノムの多様性(多型性)をもたらす配列変化についても説明し、配列の多様性が動物の形質とリンク

している例を紹介します。

実習発現データベースを使ったシミュレーション実験(1)

- digital differential display -  ゲノム解読プロジェクトの進められている生物では、EST (expressed sequence tags) の塩基配列解読プロ

ジェクトも並行して進められています。EST プロジェクトでは、組織あるいは細胞種ごとに、cDNA ライブラ

リーから無作為にクローンを選んで配列(5’, 3’末端のワンパスシークエンス)を解析しています。EST データ

ベースでは、同定された遺伝子種とその数値(何個検出されたか)が組織あるいは細胞種ごとに整理されていま

す。従ってデータには、各組織に発現している遺伝子種と遺伝子ごとの相対的な発現強度が反映されていること

になります。これらのデータは、トランスクリプトーム (Transcriptome) と呼ばれます。このデータを利用する

ことにより、調べたい組織に発現している遺伝子の種類と発現強度、組織間で発現強度の異なる遺伝子を調べる

ことができます。コンピューターで遺伝子発現を調べる操作は、digital differential display と呼ばれます。授

業では次の例題を使って、digital differential display の操作を実習します。

例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる

ウシの乳腺で発現する遺伝子種とその強度は?

例題2.2つの細胞種で発現量が異なる遺伝子を調べる

マウスの ES細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる遺伝子は?

例題3.ある生物の2つの器官で発現量が異なる遺伝子を調べる

マウスの小脳 (Cerebellum) と大脳皮質 (Cortex) で発現量の異なる遺伝子は?

51

Page 52: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Digital differential display (DDD)のページの開け方

NCBI の Transcriptome 情報を使う - Digital differential display

1. NCBI の先頭ページにある All Resources から、Digital differential display (DDD) を選択

例題1.生物の各器官で発現する遺伝子の種類と発現強度を調べる

ウシの乳腺(mammary gland)で発現する遺伝子種とその強度は?

手順

1. Species を Bos taurus に選択、continue をクリック

2. 組織名(Mammary gland)の ID番号をクリック。発現強度の強い遺伝子から順に表記される。TMPは、100万個の mRNA当たりに出現する個数を示す。

例題2.ある生物の2つの器官・細胞で発現量が異なる遺伝子を調べる

マウスの ES細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で発現量の異なる遺伝子は?

1.Species を Mus musculus に選択、continue をクリック

2.まず A(ここでは Embryonic stem cells)の ID番号(15703, 15704, 15705)を選択、上の枠内に名

前(ES cells)と記入し、continue を押す

3.B の組織( こ こでは Blastocytes ) の ID(850, 875, 1021, 10026) を チ ェ ッ ク し 、枠内 に名前

(Blastocytes)と記入し、continue を押す

4. A と Bで発現強度が有意に異なる遺伝子が、表示される

1 月 17 日(第 14 回:最終回)

講義次世代シーケンサーの応用について 2 例紹介します。

1. RANA-seq: Transcriptome 解析(mRNA の発現プロファイルの解析、サンプル間比較)

2. Rad –seq: ゲノム全体をカバーする簡便な SNP マーカーの収集

2 つの方法とも農学分野の研究に非常に有効です。

RANA-seq:組織に発現している遺伝子をほぼ全て網羅的に同定することができます。また各遺伝子の発現量

(組織にm RNA が何コピー発現しているか)も数値化されます。従って、組織の遺伝子発現プロファイルが明ら

かになるだけでなく、2 つのサンプル(例えば、対照区と実験区)で発現している全遺伝子の発現量を比較する

ことができます。

Rad –seq:通常のゲノムシーケンスでは、精製したゲノム DNA を物理的に 300bp程度に切断して、断片の両側

から 100bp をシーケンスします。物理的に切断するので断片は完全にランダムなゲノム断片となります。Rad –seqでは、決まった 4 塩基あるいは 6 塩基の配列を認識して切断する制限酵素でゲノムを断片化し、断片の両側

から 100bp をシーケンスします。異なる系統でも、同じ部位でゲノムが切断されるので、断片の配列を 2 系統で

直接比較(アライメント)することが可能となります。100bp の中に存在する SNP を同定でき、ゲノム全体に

わたって SNP をまんべんなく収集することが可能です。高密度な SNP マーカーが短時間で一挙に得られるため、

52

Page 53: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

品種間の遺伝的差異や形質の連鎖解析に有効に利用できます。

53

Page 54: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

ポストゲノム研究(1)

—ゲノムに存在する全ての遺伝子の機能を調べる

 全ゲノム塩基配列の解読のあとにくる最も重要な研究課題として、ゲノムに存在する全ての遺伝子の機能解

明があげられます。遺伝子の機能を解析するストラテジーは、大きく分けるとフォワードジェティクス

(Forward Genetics: 順遺伝学)とリバースジェネティクス(Reverse Genetics: 逆遺伝学)に分けること

ができます。マウス、ゼブラフィッシュ、ショウジョウバエ、線虫はこれらポストゲノム研究のモデル生物

として用いられています。

 リバースジェネティクスは、遺伝子の生体内での機能を解明するための最も直接的な方法で、遺伝子の機能

を破壊し、発生や器官形成、代謝、行動に表れる表現型を解析し、表現型から遺伝子の機能を解明します。遺

伝子の機能破壊の方法には、遺伝子ノックダウンあるいは遺伝子ノックアウトの2つがあります。上のモデ

ル生物ではいずれも、遺伝子破壊による全遺伝子の機能解明プロジェクトが進められています。線虫と魚類

は、アンチセンス技術を個体レベルで適応できる点で、遺伝子機能解析に圧倒的に有利です。特に線虫は、

RNAi法で簡単に遺伝子機能を破壊できることから、ゴール(全遺伝子の機能解明)に最も近いと言えます。

線虫では機能破壊により寿命が延びると言うような興味深い遺伝子も見つかっています。

 遺伝子機能を解明するうえで、ノックアウトマウスは重要な役割を果たしていますが、 ES細胞で相同組み

換えにより遺伝子破壊を行い、その ES細胞を胚移植してノックアウト個体を作製するには、1年あまり必要

です。最近、TALEN法、CRISPR/Cas9法とよばれる新しいノックアウトとノックイン技術が開発されてい

ます。卵生の魚類やカエルでは、受精卵にコンストラクとの RNA を顕微注入するだけで遺伝子のノックアウ

トが可能です。また TALEN法は原理的には、遺伝子疾患の原因である変異遺伝子の配列を正常に治癒させる

ことも可能です。iPS技術と組み合わせると遺伝子治療への発展が期待できます。授業では簡単に TALEN法と CRISPR/Cas9法の原理を解説します。

 

以下工事中

以下、今年使用しなかった過去の資料

講義

 脊椎動物の中ではゼブラフィッシュが、モルフォリノオリゴを使ったアンチセンス技術で遺伝子機能を破

壊できる点で、遺伝子機能の解析が容易だと言えます。具体的には、顕微注入によりアンチセンスモルフォ

リノオリゴを受精卵に注入し、発生で現れる表現型(体に表れる異常)を調べることで、遺伝子機能を解析す

ることが可能です。ただしこの方法で解析できるのは、受精後 2 日以内に働く遺伝子に限られ、成人病に関連

するような遺伝子等の機能は解析不能です。ゼブラフィッシュのウェブサイト(ZFIN)では、誰にでも機能

破壊実験を行うことができるように、各遺伝子の機能破壊に必要なモルフォリノオリゴの塩基配列が掲載さ

れています。

54

Page 55: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

 一方、フォワードジェティクスでは、点変異を誘導する化学変異源(ENU. Ethyl nitrosourea)により突

然変異体のライブラリーをまず作製します。様々な表現型の突然変異体が得られますが、この時点では突然変

異体でどの遺伝子に変異が起こっているのか(原因遺伝子、責任遺伝子)は明らかでありません。フォワード

ジェティクスでは、遺伝マーカー(主にマイクロサテライト)との連鎖解析により、原因遺伝子を連鎖地図

にマップし、組換え率が 0.1%程度のマーカーが見つかるまで連鎖解析を進めます。見つかった近隣マーカー

近くの変異体ゲ

ノムを解読し、突然変異により塩基置換が起こっている場所を探し出します。この方法は、ポジショナルク

ローニングと呼ばれます。

データベースを使った遺伝子機能の検索

ENTREZ

NCBI の全データベース(配列、文献、遺伝子発現、SNP 等々)に納められている情報から、キーワード検

索により関連情報を網羅的に検索できるサイト

ENTREZ の利用

NCBI (http://www.ncbi.nlm.nih.gov/) には、キーワードで全てのデータベースを一挙に検索するツール

ENTREZ があります。ENTREZでキーワード検索すると、配列情報、文献情報、OMIM、OMIA、立体構造等々の

データがもれなく検索されてきます。ENTREZ を利用すれば、タンパク質の構造や遺伝病等に関する情報を一挙

に入手することができ、非常に便利な検索システムといえます。

ENTREZ の使い方

・ 開け方:NCBI の先頭ページ All databesesで、枠内空欄のまま Search をクリック

・ 枠内に遺伝子名(略字等)を入力して検索

・ 調べた遺伝子について NCBI のデータベースにある情報が全て表示される(数字はデータベースに納められて

いる情報の数を示す)

55

Page 56: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

講義

推薦図書

ゲノム関連

「ゲノム」岡崎康司/坊農秀雅監訳・メディカル・サイエンス・インターナショナル社(9,500円)

「ゲノム研究実験ハンドブック」辻本豪三、田中利男・羊土社(6,500円)

「大規模ゲノム解析とポストシークエンス時代の遺伝子機能解析」林崎良英監修・中山書店(3,600円)

「比較ゲノムから読み解く生命システム」藤山秋佐夫監修・秀潤社(4,000円)

バイオインフォマティックス関連

「バイオインフォマティックス基礎講義-一歩進んだ発想をみがくために」岡崎康司/坊農秀雅 監訳・メディ

カル・サイエンス・インターナショナル社(3,900円)

「バイオインフォマティックスがわかる」菅原秀明・羊土社(4,200円)

「ゲノム情報はこう活かせ」岡崎康司/坊農秀雅・羊土社(4,410円)

「即活用のためのバイオインフォマティックス入門」広川貴次/美宅成樹著・中山書店(3,500円)

「バイオデータベースとウェブツールの手とり足とり活用法」中村保一ら編集・羊土社(3,800円)

「できるバイオインフォマティックス」広川貴次/美宅成樹著・中山書店(3,500円)

  「バイオインフォマティックス」メディカル・サイエンス・インターナショナル社(9,500円)

  「バイオリソース&データベース活用術」秀潤社(4,600円)

  「バイオインフォマティクス事典」日本バイオインフォマティクス学会編集・共立出版(14,000円)

ウェブサイト

研究室home page      http://www.agri.tohoku.ac.jp/bioinfor/index-j.html=========================================================================

文献検索、塩基配列、ホモロジー検索、ORF finder、Map viewer 等

NCBI http://www.ncbi.nlm.nih.gov/(National Center for Biotechnology Information)

塩基配列、ホモロジー検索、分子系統樹作成、シークエンス登録等

DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html(DNA Data Bank of Japan)

塩基配列、ホモロジー検索、タンパク質の構造(ドメイン・モチーフ検索等)解析

EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)

ゲノム配列のデータベース

56

Page 57: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

Ensembl           http://www.ensembl.org/index.html=======================================================================

分子系統樹作成

ClustalW http://clustalw.genome.jp/=======================================================================

タンパク質・遺伝子の機能検索

オントロジー http://www.geneontology.org/ http://www.pir.uniprot.org/ドメイン・モチーフ検索 http://www.ebi.ac.uk/Information/シグナルペプチドの予測 http://www.cbs.dtu.dk/services/SignalP/3D 立体構造の予測、DNA の翻訳 http://ca.expasy.org/ノックアウトマウスの表現型 http://www.informatics.jax.org/=======================================================================

転写調節領域のモチーフ検索

転写因子の結合部位予測        http://www.cbrc.jp/research/db/TFSEARCHJ.html======================================================================

代謝経路

KEGG http://www.genome.jp/kegg/pathway.html=======================================================================

ゲノム研究のモデル生物

マウス http://www.informatics.jax.org/ツメガエル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミドリフグフグゲノムデータベース http://www.genoscope.cns.fr/externe/tetranew/トラフグフグゲノムデータベース http://fugu.biology.qmul.ac.uk/トラフグフグゲノムデータベース

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブラフィッシュ http://zfin.org/

http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/

http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlショウジョウバエ http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線虫 http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp

57

Page 58: バイオインフォマティックス概論授業予定 · Web view授業では、哺乳類と魚類の比較ゲノムを紹介します。 フグとヒトは、進化的観点から見ると脊椎動物系統樹の両端に位置します。

酵母 http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/

=======================================================================

cDNA, EST 情報

マウス cDNA http://fantom3.gsc.riken.jp/index.htmlアフリカツメガエル EST http://xenopus.nibb.ac.jp/メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウレイボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html

=========================================================================

microarray に関する情報

ヒト繊維芽細胞 http://genome-www.stanford.edu/serum/data.htmlショウジョウバエ http://genome.med.yale.edu/Lifecycle/

=========================================================================

その他

http://genes.mit.edu/GENSCAN.htmlhttp://www.tigr.org/software/microarray.shtmlhttp://motif.genome.jp/http://www.rcsb.org/pdb/

=============================================================

58