2020年度暫定版バイオインフォマティクス基礎演習マニュ...

1

バイオインフォマティクス基礎演習マニュアル

2020 年度版

日程

基礎演習 1 回： 10 月 23 日演習及び課題

基礎演習 2 回： 10 月 28 日課題

レポート： 11 月 11 日までに所定の書式でメール提出

場所

講義と同じ。各自のパソコンを持参すること。演習項目

1．配列情報の取得と確認（2-4 ページ）

NCBI のデータベースを利用キーワード検索など配列情報を確認する

https://www.ncbi.nlm.nih.gov/

2．相同性検索（5-6 ページ）

NCBI の BLAST を利用オーソログ遺伝子の配列情報（アミノ酸配列、ｍＲＮＡの全塩基配列、翻訳領

域と非翻訳領域の塩基配列 [開始コドンと終止コドン] など）を取得する

https://blast.ncbi.nlm.nih.gov/Blast.cgi

3．マルチプルアライメント（多重配列比較）と分子系統樹の作成（7-8 ページ）

ゲノムネットの ClustalW を利用

https://www.genome.jp/ja/

4．課題レポートについて（9-10 ページ）

データベース検索の実践

今回は実際にインターネットに公開されているデータベースを用いて、配列解析の演習を行います。通常

は自分で新規に取得・決定した塩基配列またはアミノ酸配列に関して解析しますが、ここでは化学科の化学

実験で扱うヒトのアルデヒドデヒドロゲナーゼ 2（Aldehyde dehydrogenase 2; ALDH2）を例として解析を行うこ

とにします。

注1）以下では OS を Windows と仮定して話を進めますが、インターネットブラウザとテキストエディタが使えれば OSは何でもかまいません。

注2）以下では必要なことのみ示しています。示されていない項目については各サーバーのデフォルトのまま用いてください。なお、実際に自分で課題を解くときなどには、必要に応じてここに示していない項目も変更するよう

に。

注3）検索などに日本語は使えません。

バイオインフォマティクス基礎演習

2

1．配列情報の取得と確認

研究者が決定した塩基配列は米国の National Center for Biotechnology Information（NCBI）の

GenBank、欧州の European Bioinformatics Institute（EBI）の EMBL、日本の国立遺伝学研究所の

DDBJ（DNA Data Bank of Japan）が協力して構築している網羅的塩基配列データベース

（DDBJ/EMBL/GenBank）に登録されます。これらのデータベースは当初独立に構築されましたが、

現在では毎日データ交換を行って内容を統一しており、どれかのデータベースに登録すれば自動

的にすべてのデータベースで公開されるようになっています。それゆえ、このデータベースからヒト

ALDH2（Aldehyde dehydrogenase 2）の mRNA の配列とアミノ酸配列を取得できます。

【手順】

1. NCBI（National Center for Biotechnology Information）のトップページにアクセスする。

https://www.ncbi.nlm.nih.gov/

2. 「ALL Databases」タグから「Protein」を選び、キーワードを入力する（たとえば、human ALDH2）。その後、「Search」ボタンをクリックする。

3. 検索結果が表示される。

リストの一番上にある「ALDH2 [Homo sapiens]」をクリックする。

（検索する時期によっては違うエントリーが上位に表示されるかもしれない。選択したデータ

が 517 アミノ酸の「Accession:CAG33272.1」であることを確認）

3

4. 517 アミノ酸残基の ALDH2 のデータが表示される。データベースの構造（特に「FEATURES」フィールドの情報）を詳細に確認する。

～

～

～

～

注 4）主なリンク先の見方は、次ページに説明してあります。

後でじっくり見ることになるので、先に時間のかかる相同性検索(5 ページ)を行ってください。

注 5）配列データを表示させたとき「This sequence has been updated. See current version.」と表示

されることがあります。その場合は指示に従って新しい最新データを取得するように。


4

【参考】配列情報の確認 -- 前ページからの続き

左側のカラムがデータベース、右側のカラムは種々のリンク先メニューになっている。

左側のカラム（個別のデータベース）

・「FASTA」をクリックするとマルチプルアライメント等に使える配列の書式で出力される。後で利用するため、「>CAG33272.1 ALDH2 [Homo sapiens]」行とアミノ酸配列を Word 等のファイルにコピーして、解析用の配列ファイルを作っておく（7 ページ参照、データ一覧は１１ページ）。

右側のカラム（種々のリンク先；図は前ページにもある）

右カラムのメニューをクリックして、種々のデータを確認する。

有用なリンクが多数あるので、下記以外にもいろいろ試してみる。

塩基配列を入手する

・「Reference sequence information」の下の「RefSeq genomic sequence」をクリックするとゲノム

ＤＮＡの情報が得られる（参考程度）。「RefSeq mRNA」から mRNA の情報が得られる

・「Reference sequence information」の下の「RefSeq protein isoforms」をクリックするとアイソザイム

が表示される。パラログや選択的スプライシングの例などが表示される。表示されるデータのチェ

ックを入れ、1 対 1 の BLAST 等の操作が行える。

・「Related information」の下の「Encoding mRNA」や「Nucleotide」からも翻訳領域の塩基配列など

が得られる。

相同性の高い配列を入手する

・「Homologs of the ALDH2 gene」の下をクリックすると、他の生物のホモログ一覧が表示される。

HomoloGene の画面になる。・「Protein Alignments」の下の「Show Multiple Alignment」をクリックすると、マルチプルア

ライメントの結果が表示される。系統樹の作成はおそらくできないため、手動でのマル

チプルアライメントは 7 ページの方法で行う。

・「Protein Alignments」の下の「Show Pairwise Alignment Scores」をクリックすると、1 対

1 で検索した塩基配列とアミノ酸配列の一致度が表示される。

5

2．相同性検索入手した塩基配列やアミノ酸配列と似通った配列をデータベースから探索することを「相同性検

索」と呼びます。どのような相同性をもとに探索するか（「一致度は少し悪くても長い範囲で相同性

があるもの」とか「短いけれども完全に一致するもの」など）に応じて用いる検索プログラムが異なりま

す。ここでは一例として最もよく使われる BLAST を用いて検索します。

注６）以下ではアミノ酸配列を用いて話を進めて行きます。塩基配列でも基本的な操作は同じですが、検索プログラムやデータベースなどは適切なものに指定しなおしてください。また、各項目の詳細はオンライン

ヘルプを参照してください。

【手順】 1. 配列データの画面で、右カラムのメニュー上方にあ

る「Run BLAST」をクリックする。（表示している配列データを用いて BLAST が実行される）

2. BLAST 画面が表示される。検索したいデータの Accession 番号や gi 番号、あるいは FASTA 形式の配列データ（7 ページ参照）をペーストする。今回の場合、自動的に、選択した Human ALDH2 の「CAG33272.1」が入力されている。

（次ページ 3．以降の BLAST 検索がうまくいかない場合は、上図赤枠内の「CAG33272.1」を削除し、代わりに前ページで作成した FASTA 書式のアミノ酸配列をペーストする。「>CAG33272.1 ALDH2 [Homo sapiens]」行を忘れないように）


6

3. 「Databese」から「Reference proteins (refseq_protein)」を選択し、画面下方の「Show results in a new window」にチェックを入れてから、「BLAST」ボタンをクリックする。別ウインドウで BLAST 検索が始まる。結果が表示されるまで数分かかる。

注７） BLAST 検索は時間がかかるため、終わるまで 4 ページの操作を行います。ブラウザの元のタブか

新しいウインドウを開いて行うとよい。

4. 表示される結果の上位から学名などの情報を頼りに欲しい情報を取得する。

一番右の「Accession」欄の登録番号をクリックすると、配列データが得られる。図の上の「Alignments」タブに 1 対 1 のアライメントの結果が表示されるので確認するように。

7

3．マルチプルアライメント（多重配列比較）と分子系統樹の作成

塩基配列またはアミノ酸配列を共通する部分ができるだけ多くなるように整列させることを一般に

「アライメント」と呼びます。このうち配列が 3 つ以上の場合を「マルチプルアライメント」と呼び、近縁関係や進化系統の解析などに応用されています。ここでは、六種の生物由来の ALDH2 のアミノ酸配列を「ClustalW」を用いてアライメントし、進化系統樹を書かせてみます。ClustalW は NCBI にもありますが、分子系統樹作成機能がない（クライアント側に TreeView をインストールして描かせる）ため、今回は京都大学バイオインフォマティクスセンターが運営するゲノムネットのサーバーを用いま

す。【手順】 1. BLAST 検索でヒットしたデータのうち、Rattus norvegicus (NP_115792.1)、Bos taurus

（NP_001068835.1）、Ailuropoda melanoleuca （XP_002913100.1）ともう二種（例えば Vulpes

vulpes （XP_025874684.1）と Delphinapterus leucas （XP_022406389.1））の ALDH2 のアミノ酸配列を入手し、FASTA 書式のファイルを作成する（Human とあわせて六種）。

注 8） NCBI の配列データや検索結果など画面で「FASTA」をクリックすると、下のように FASTA 書式で

配列情報が表示されます（4 ページも参照）。

>CAG33272.1 ALDH2 [Homo sapiens]

MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPFTGEVICQVAE

GDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLD

(中略)

VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMSGS

GRELGEYGLQAYTEVKTVTVKVPQKNS

マルチプルアライメントに使える配列データには種々の書式があり、ここでは「FASTA」書式を採用しま

す。FASTA 書式は、1 行目に「>000000」行、改行後 1 文字表記の配列情報となります。

000000 の部分はマルチプルアライメントや分子系統樹の結果に表示されます。

ただし、１行目にスペースを入れるとそれ以降は無視されるため、スペースを入れたいときは「_」などの

記号文字を挿入します。全角文字は使えません。

1 行目行頭に >CAG… を > Human_CAG33272.1 のように生物種名（ここでは「Human_」）を挿入しておくと、分子系統樹が見やすくなります（分子系統樹の例は１２ページ）。

入力データ書式の例（１１ページにフルデータあり） >Human_CAG33272.1 ALDH2 [Homo sapiens]

MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPSTGEVICQVAE …（略）…

>Rat_NP_115792.1 aldehyde dehydrogenase, mitochondrial precursor [Rattus norvegicus]

MLRAALSTARRGPRLSRLLSAAATSAVPAPNQQPEVFCNQIFINNEWHDAVSKKTFPTVNPSTGEVICQV …（略）…

>Cattle_NP_001068835.1 aldehyde dehydrogenase, mitochondrial precursor [Bos taurus]

MLRAVALAAARLGPRQGRRLLSAATQAVPTPNQQPEVLYNQIFINNEWHDAVSKKTFPTVNPSTGDVICH …（略）…

>Panda_XP_002913100.1 PREDICTED: aldehyde dehydrogenase, mitochondrial [Ailuropoda melanoleuca]

MLRTAALAAAGLGPSLGRRLLSAAATQAVPAPNQQPEVFYNQIFINNEWHDAVSKKTFPTINPSTGEVIC …（略）…

>Red_fox_XP_025874684.1 aldehyde dehydrogenase, mitochondrial [Vulpes vulpes]

MLRAAALAAAGLRPRLGRRLLSAASSQAVPAPNQQPEVFYNQIFINNEWHDAVSKKTFPTINPSTGEVIC …（略）…

>Beluga_whale_XP_022406389.1 aldehyde dehydrogenase, mitochondrial [Delphinapterus leucas]


8

MLRAVVLAAARPCQGRRLLSAAATPAVPAPNQQPEVFYNKIFINNEWHDSVSKKTFPTINPSTGDVICHV …（略）…

2. ゲノムネットの ClustalW のページ（https://www.genome.jp/tools-bin/clustalw）にアクセスする。

3. 「 Enter your sequences (with labels) below (copy & paste):」に整列させたい

配列データ（例えば FASTA 書式）をペーストする。

4. 「Protein」が選択されているのを確認してから（塩基配列でマルチプルアライメ

ントするときは「 DNA 」を選択する）

「Execute Multiple Alignment」をクリック

する。

5. 結果を確認する。配列は相同性の高い順番に出力される。配列内の「－」はギ

ャップ（欠失）を示している。整列された配列の下の「＊」は完全に

保存された（一致する）残基を、「：」およ

び「．」は性質が類似した残基を示して

いる（フルデータ例は１２ページ）。

6. 最下方の「Select tree menu」のリストから、広く用いられている近隣結合法の一種である「BIOＮJ)」を選択し、「Exec」をクリックする。

7. しばらく待つと、分子系統樹が新しいウインドウに表示されるので、画像ファイル（レポート作成ソフトで利用可能なファイル）を取得する。枝の長さは分岐後の時間の長さを示している。

9

（１３ページに例あり） 4．課題

1. 前項までの演習に加えて、前項までで利用した六種（ヒト、ラット、ウシ、パンダ、および任意の二種）のアミノ酸配列をコードしている mRNA の全塩基配列を入手し、全 mRNA のマルチプルアライメントと分子系統樹を作成せよ（非翻訳領域を含む mRNA の塩基配列を利用すること）。

2. 各自興味のあるタンパク質を 1 種類選び、適当な生物種（１０種）のオーソログ遺伝子由来のアミノ酸配列とそれぞれをコードしている mRNA の全塩基配列（非翻訳領域を含む）を入手し、両者のマ

ルチプルアライメントと分子系統樹を作成せよ。

配列データ選択における注意事項

1. BLAST 検索や注釈付きデータベースより、分子系統樹を作成するために意味のある配列データを取得する。

2. 極端に長いまたは短い配列を避ける。マルチプルアライメントの結果をよく吟味する。選択した配列データの組み合わせを替えるなどして、何度も解析し直し、適切なデータを所得する。

3. 繰返し配列を含むデータの解析は難しい。 4. オーソログ遺伝子の配列情報を選択する。

レポートについて

書式: Word などで A4 縦サイズで作成し、PDF 形式で出力（Word ファイルは不可）

ファイル名： bioinfo_氏名

10-20 ページにまとめること

配列情報には等幅フォントを使用、その他のフォントは MS 明朝を基本とする

宛先： ashida ＠広島大学のドメイン（芦田嘉之）

件名： bioinfo_氏名

締切: 2020 年 11 月 1１日（水）

送信元のメールアドレスは @hiroshima-u.ac.jp ドメインを利用すること（本人認証）。

ケータイアドレス、フリーメール不可。

レポート全体

・目的、方法、結果、考察

レポートは目的、方法、結果、考察などの項目に分けて、2 遺伝子分まとめて作成すること。

アミノ酸配列と塩基配列の解析結果の比較や、mRNA のマルチプルアライメントの開始コドンと終止コド

ンを明示して翻訳領域と非翻訳領域の相同性の比較をするなど、すべての結果について統合的に考

察すること。


10

方法

・目的の遺伝子の取得方法を明示すること（遺伝子の取得方法や考え方は多数ある。最大のポイント）

・すべての配列情報（塩基配列、アミノ酸配列）の ID の一覧表を作成すること

（第三者が解析の再現ができるように）

結果

・2 種類の遺伝子（ALDH2 と任意）の解析結果を一緒にまとめる

・考察しやすいように結果を作る

アミノ酸配列と塩基配列の比較翻訳領域と非翻訳領域の比較

・マルチプルアライメント

等幅フォントを使用し、段組、行間、フォントサイズを工夫してコンパクトに

ｍＲＮＡの場合、開始コドンと終止コドンを明示（色付け、枠挿入など）

ALDH2 遺伝子において、ヒトのｍRNA だけ長いため、ヒト部分しかないマルチプルアライメントは

カットしてもよい。

・分子系統樹

比較しやすいようにレイアウトを工夫し、ページをまたがらないよう 1 枚にまとめる

考察

・2 種類の遺伝子の解析結果を統合的に考察（結果を考察しやすいようにまとめることも重要）

基礎課題 5 の 1 から 3 も含める

1．アミノ酸配列と塩基配列の解析結果の比較

2．ｍＲＮＡのマルチプルアライメントの図の中に開始コドンと終止コドンを明示して翻訳領域と

非翻訳領域の相同性の比較

3．すべてのマルチプルアライメントの結果から「保存」領域の探索とその意味の考察

・目的遺伝子の探索方法や考え方の考察

・分子系統樹だけでなく、マルチプルアライメントの結果も（こちらがメイン）解析し、考察

・ＤＮＡ、遺伝子、ゲノムなどの用語を正しく使い、遺伝子の構造、体細胞分裂と減数分裂の違い、

獲得形質の遺伝、遺伝子頻度の変化、適応進化などの概念など、すべての小試験（基礎課題 1 回から

基礎課題４回）の内容を考慮すること

11

ALDH2 アミノ酸配列によるマルチプルアライメント用のアミノ酸配列データの例

（このデータはレポートに入れる必要はないが、使ったデータのＩＤ一覧は「方法」に入れておくこと）

>Human_CAG33272.1 ALDH2 [Homo sapiens]

MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWHDAVSRKTFPTVNPFTGEVICQVAE

GDKEDVDKAVKAARAAFQLGSPWRRMDASHRGRLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLD

MVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVMKV

AEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLK

RVTLELGGKSPNIIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSRVVGN

PFDSKTEQGPQLDETQFKKILGYINTGKQEGAKLLCGGGIAADRGYFIQPTVFGDVQDGMTIAKEEIFGP

VMQILKFKTIEEVVGRANNSTYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMSGS

GRELGEYGLQAYTEVKTVTVKVPQKNS

>Rat_NP_115792.1 aldehyde dehydrogenase, mitochondrial precursor [Rattus norvegicus]

MLRAALSTARRGPRLSRLLSAAATSAVPAPNQQPEVFCNQIFINNEWHDAVSKKTFPTVNPSTGEVICQV

AEGNKEDVDKAVKAAQAAFQLGSPWRRMDASDRGRLLYRLADLIERDRTYLAALETLDNGKPYVISYLVD

LDMVLKCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVM

KVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAGAAIASHEDVDKVAFTGSTEVGHLIQVAAGSSN

LKRVTLELGGKSPNIIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYDEFVERSVARAKSRVV

GNPFDSRTEQGPQVDETQFKKILGYIKSGQQEGAKLLCGGGAAADRGYFIQPTVFGDVKDGMTIAKEEIF

GPVMQILKFKTIEEVVGRANNSKYGLAAAVFTKDLDKANYLSQALQAGTVWINCYDVFGAQSPFGGYKMS

GSGRELGEYGLQAYTEVKTVTVKVPQKNS

>Cattle_NP_001068835.1 aldehyde dehydrogenase, mitochondrial precursor [Bos taurus]

MLRAVALAAARLGPRQGRRLLSAATQAVPTPNQQPEVLYNQIFINNEWHDAVSKKTFPTVNPSTGDVICH

VAEGDKADVDRAVKAARAAFQLGSPWRRMDASERGRLLNRLADLIERDRTYLAALETLDNGKPYIISYLV

DLDMVLKCLRYYAGWADKYHGKTIPIDGDYFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVV

MKVAEQTPLTALYVANLIKEAGFPPGVVNVIPGFGPTAGAAIASHEDVDKVAFTGSTEVGHLIQVAAGKS

NLKRVTLELGGKSPNIIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYAEFVERSVARAKSRV

VGNPFDSRTEQGPQVDETQFKKVLGYIKSGKEEGAKLLCGGGAAADRGYFIQPTVFGDVQDGMTIAKEEI

FGPVMQILKFKSMEEVVGRANNSKYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKL

SGSGRELGEYGLQAYTEVKTVTVRVPQKNS

>Panda_XP_002913100.1 aldehyde dehydrogenase, mitochondrial [Ailuropoda melanoleuca]

MLRTAALAAAGLGPSLGRRLLSAAATQAVPAPNQQPEVFYNQIFINNEWHDAVSKKTFPTINPSTGEVIC

QVAEGDKEDVDRAVKAARAAFQLGSPWRRMDASDRGRLLNRLADLIERDRTYLAALETLDNGKPYVTSYL

VDLDMVLKCFRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVV

VMKVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAGAAIASHEDVDKVAFTGSTEVGHLVQVAAGN

SNLKRVTLELGGKSPNIIMSDADMNWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYSEFVERSVARAKSR

VVGNPFDSQTEQGPQVDETQFKKVLGYIKSGKDEGAKLLCGGGAAADRGYFIQPTVFGDVQDSMTIAREE

IFGPVMQILKFKTIEEVIGRANNSKYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYK

MSGSGRELGEYGLQAYTEVKTVTVKVPQKNS

>Red_fox_XP_025874684.1 aldehyde dehydrogenase, mitochondrial [Vulpes vulpes]

MLRAAALAAAGLRPRLGRRLLSAASSQAVPAPNQQPEVFYNQIFINNEWHDAVSKKTFPTINPSTGEVIC

QVAEGDKEDVDKAVKAARAAFQLGSPWRRMDASDRGRLLNRLADLIERDRTYLAALETLDNGKPYVISYL

VDLDMVLRCLRYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVI

VMKVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAGAAIASHEDVDKVAFTGSTEVGHLIQVAAGN

SNLKRVTLELGGKSPNIIMSDADMNWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYAEFVERSVARAKSR

VVGNPFDSQTEQGPQVDETQFKKILGYIKSGKEEGAKLLCGGGAAADRGFFIQPTVFGDVQDSMTIAKEE

IFGPVMQILKFKTIEEVIGRANNSKYGLAAAVFTKDLDKANYLSQALQAGTVWINCYDVFGAQSPFGGYK

MSGSGRELGEYGLQAYTEVKTVTIKVPQKNS

>Beluga_whale_XP_022406389.1 aldehyde dehydrogenase, mitochondrial [Delphinapterus leucas]

MLRAVVLAAARPCQGRRLLSAAATPAVPAPNQQPEVFYNKIFINNEWHDSVSKKTFPTINPSTGDVICHV

AEGDKEDVDRAVKAARAAFQLGSPWRRMDASKRGWLLNRLADLIERDRTYLAALETLDNGKPYVISYLVD

LDMVLKCLRYYAGWADKYHGKTIPIDGDYFSYTRHEPVGVCGQIIPWNFPLLMQAWKLGPALATGNVVVM

KVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAGAAVASHEDVDKVAFTGSTEVGHLIQTAAGNSN

LKRVTLELGGKSPNIIMSDADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYTEFVERSVARARSRVV

GNPFDSRTEQGPQVDETQFKKVLGYIKSGKEEGAKLLCGGGAAADRGYFIQPTVFGDVQDGMTIAKEEIF

GPVMQILKFKTIEEVVGRANNSKYGLAAAVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKLS

GSGRELGEYGLQAYTEVKTVTVKVPQKNS


12

ALDH2 アミノ酸配列によるマルチプルアライメント例

Cattle_NP_001068835.1 MLRAVALAAARLGPRQG-RRLLSAATQAVPTPNQQPEVLYNQIFINNEWH

Beluga_whale_XP_022406389.1 MLRAVVLAAARPCQGR--RLLSAAATPAVPAPNQQPEVFYNKIFINNEWH

Panda_XP_002913100.1 MLRTAALAAAGLGPSLGRRLLSAAATQAVPAPNQQPEVFYNQIFINNEWH

Red_fox_XP_025874684.1 MLRAAALAAAGLRPRLGRRLLSAASSQAVPAPNQQPEVFYNQIFINNEWH

Human_CAG33272.1 ----MLRAAARFGPRLGRRLLSAAATQAVPAPNQQPEVFCNQIFINNEWH

Rat_NP_115792.1 -MLRAALSTARRGPRLSR-LLSAAATSAVPAPNQQPEVFCNQIFINNEWH

::* * :*:: ***:*******: *:********

Cattle_NP_001068835.1 DAVSKKTFPTVNPSTGDVICHVAEGDKADVDRAVKAARAAFQLGSPWRRM

Beluga_whale_XP_022406389.1 DSVSKKTFPTINPSTGDVICHVAEGDKEDVDRAVKAARAAFQLGSPWRRM

Panda_XP_002913100.1 DAVSKKTFPTINPSTGEVICQVAEGDKEDVDRAVKAARAAFQLGSPWRRM

Red_fox_XP_025874684.1 DAVSKKTFPTINPSTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRM

Human_CAG33272.1 DAVSRKTFPTVNPFTGEVICQVAEGDKEDVDKAVKAARAAFQLGSPWRRM

Rat_NP_115792.1 DAVSKKTFPTVNPSTGEVICQVAEGNKEDVDKAVKAAQAAFQLGSPWRRM

*:**:*****:** **:***:****:* ***:*****:************

Cattle_NP_001068835.1 DASERGRLLNRLADLIERDRTYLAALETLDNGKPYIISYLVDLDMVLKCL

Beluga_whale_XP_022406389.1 DASKRGWLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLDMVLKCL

Panda_XP_002913100.1 DASDRGRLLNRLADLIERDRTYLAALETLDNGKPYVTSYLVDLDMVLKCF

Red_fox_XP_025874684.1 DASDRGRLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLDMVLRCL

Human_CAG33272.1 DASHRGRLLNRLADLIERDRTYLAALETLDNGKPYVISYLVDLDMVLKCL

Rat_NP_115792.1 DASDRGRLLYRLADLIERDRTYLAALETLDNGKPYVISYLVDLDMVLKCL

***.** ** *************************: **********:*:

Cattle_NP_001068835.1 RYYAGWADKYHGKTIPIDGDYFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

Beluga_whale_XP_022406389.1 RYYAGWADKYHGKTIPIDGDYFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

Panda_XP_002913100.1 RYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

Red_fox_XP_025874684.1 RYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

Human_CAG33272.1 RYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

Rat_NP_115792.1 RYYAGWADKYHGKTIPIDGDFFSYTRHEPVGVCGQIIPWNFPLLMQAWKL

********************:*****************************

Cattle_NP_001068835.1 GPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNVIPGFGPTAG

Beluga_whale_XP_022406389.1 GPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAG

Panda_XP_002913100.1 GPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAG

Red_fox_XP_025874684.1 GPALATGNVIVMKVAEQTPLTALYVANLIKEAGFPPGVVNIIPGFGPTAG

Human_CAG33272.1 GPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAG

Rat_NP_115792.1 GPALATGNVVVMKVAEQTPLTALYVANLIKEAGFPPGVVNIVPGFGPTAG

*********:******************************::********

Cattle_NP_001068835.1 AAIASHEDVDKVAFTGSTEVGHLIQVAAGKSNLKRVTLELGGKSPNIIMS

Beluga_whale_XP_022406389.1 AAVASHEDVDKVAFTGSTEVGHLIQTAAGNSNLKRVTLELGGKSPNIIMS

Panda_XP_002913100.1 AAIASHEDVDKVAFTGSTEVGHLVQVAAGNSNLKRVTLELGGKSPNIIMS

Red_fox_XP_025874684.1 AAIASHEDVDKVAFTGSTEVGHLIQVAAGNSNLKRVTLELGGKSPNIIMS

Human_CAG33272.1 AAIASHEDVDKVAFTGSTEIGRVIQVAAGSSNLKRVTLELGGKSPNIIMS

Rat_NP_115792.1 AAIASHEDVDKVAFTGSTEVGHLIQVAAGSSNLKRVTLELGGKSPNIIMS

**:****************:*:::*.***.********************

Cattle_NP_001068835.1 DADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYAEFVERSVARAKSR

Beluga_whale_XP_022406389.1 DADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYTEFVERSVARARSR

Panda_XP_002913100.1 DADMNWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYSEFVERSVARAKSR

Red_fox_XP_025874684.1 DADMNWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYAEFVERSVARAKSR

Human_CAG33272.1 DADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDIYDEFVERSVARAKSR

Rat_NP_115792.1 DADMDWAVEQAHFALFFNQGQCCCAGSRTFVQEDVYDEFVERSVARAKSR

****:*****************************:* **********:**

Cattle_NP_001068835.1 VVGNPFDSRTEQGPQVDETQFKKVLGYIKSGKEEGAKLLCGGGAAADRGY

Beluga_whale_XP_022406389.1 VVGNPFDSRTEQGPQVDETQFKKVLGYIKSGKEEGAKLLCGGGAAADRGY

Panda_XP_002913100.1 VVGNPFDSQTEQGPQVDETQFKKVLGYIKSGKDEGAKLLCGGGAAADRGY

Red_fox_XP_025874684.1 VVGNPFDSQTEQGPQVDETQFKKILGYIKSGKEEGAKLLCGGGAAADRGF

Human_CAG33272.1 VVGNPFDSKTEQGPQLDETQFKKILGYINTGKQEGAKLLCGGGIAADRGY

Rat_NP_115792.1 VVGNPFDSRTEQGPQVDETQFKKILGYIKSGQQEGAKLLCGGGAAADRGY

********:******:*******:****::*::********** *****:

Cattle_NP_001068835.1 FIQPTVFGDVQDGMTIAKEEIFGPVMQILKFKSMEEVVGRANNSKYGLAA

Beluga_whale_XP_022406389.1 FIQPTVFGDVQDGMTIAKEEIFGPVMQILKFKTIEEVVGRANNSKYGLAA

Panda_XP_002913100.1 FIQPTVFGDVQDSMTIAREEIFGPVMQILKFKTIEEVIGRANNSKYGLAA

Red_fox_XP_025874684.1 FIQPTVFGDVQDSMTIAKEEIFGPVMQILKFKTIEEVIGRANNSKYGLAA

Human_CAG33272.1 FIQPTVFGDVQDGMTIAKEEIFGPVMQILKFKTIEEVVGRANNSTYGLAA

Rat_NP_115792.1 FIQPTVFGDVKDGMTIAKEEIFGPVMQILKFKTIEEVVGRANNSKYGLAA

**********:*.****:**************::***:******.*****

Cattle_NP_001068835.1 AVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKLSGSGRELGE

Beluga_whale_XP_022406389.1 AVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKLSGSGRELGE

Panda_XP_002913100.1 AVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMSGSGRELGE

Red_fox_XP_025874684.1 AVFTKDLDKANYLSQALQAGTVWINCYDVFGAQSPFGGYKMSGSGRELGE

Human_CAG33272.1 AVFTKDLDKANYLSQALQAGTVWVNCYDVFGAQSPFGGYKMSGSGRELGE

Rat_NP_115792.1 AVFTKDLDKANYLSQALQAGTVWINCYDVFGAQSPFGGYKMSGSGRELGE

***********************:****************:*********

Cattle_NP_001068835.1 YGLQAYTEVKTVTVRVPQKNS

Beluga_whale_XP_022406389.1 YGLQAYTEVKTVTVKVPQKNS

Panda_XP_002913100.1 YGLQAYTEVKTVTVKVPQKNS

Red_fox_XP_025874684.1 YGLQAYTEVKTVTIKVPQKNS

Human_CAG33272.1 YGLQAYTEVKTVTVKVPQKNS

Rat_NP_115792.1 YGLQAYTEVKTVTVKVPQKNS

*************::******

図 ALDH2 アミノ酸配列による分子系統樹の例図 ALDH2 mRNA 塩基配列による分子系統樹の例

13

ALDH2 mRNA 塩基配列によるマルチプルアライメント例(終止コドン付近の一部、翻訳領域と非翻訳領域を比較)

Panda_XM_002913054.4 CATGACTATCGCCAGGGAGGAGATCTTTGGGCCAGTGATGCAGATCCTGA

Red_fox_XM_026018899.1 CATGACTATCGCCAAGGAGGAGATCTTTGGGCCAGTGATGCAGATCCTGA

Cattle_NM_001075367.1 CATGACCATCGCAAAGGAGGAGATCTTTGGGCCAGTGATGCAGATTCTGA

Beluga_whale_XM_022550681.2 CATGACCATCGCAAAGGAGGAGATCTTTGGGCCAGTGATGCAGATTCTGA

Human_NM_000690.4 CATGACCATCGCCAAGGAGGAGATCTTCGGGCCAGTGATGCAGATCCTGA

Rat_NM_032416.1 CATGACCATCGCCAAGGAGGAGATCTTCGGACCAGTGATGCAGATCCTCA

****** ***** * ************ ** ************** ** *

Panda_XM_002913054.4 AGTTCAAGACCATAGAGGAAGTCATTGGGAGAGCCAACAATTCCAAGTAT

Red_fox_XM_026018899.1 AGTTCAAGACCATAGAGGAAGTTATTGGGAGAGCCAATAATTCCAAGTAT

Cattle_NM_001075367.1 AGTTCAAGAGCATGGAGGAAGTCGTCGGGAGAGCCAACAATTCCAAGTAC

Beluga_whale_XM_022550681.2 AGTTCAAGACCATAGAGGAAGTCGTTGGGAGAGCCAACAATTCCAAGTAC

Human_NM_000690.4 AGTTCAAGACCATAGAGGAGGTTGTTGGGAGAGCCAACAATTCCACGTAC

Rat_NM_032416.1 AATTCAAGACCATTGAGGAGGTTGTGGGGCGAGCCAATAATTCCAAGTAC

* ******* *** ***** ** * *** ******* ******* ***

Panda_XM_002913054.4 GGGCTGGCTGCAGCTGTCTTCACCAAGGACTTGGACAAGGCCAATTATCT

Red_fox_XM_026018899.1 GGGCTGGCTGCAGCTGTCTTCACCAAGGACTTGGACAAAGCCAATTATCT

Cattle_NM_001075367.1 GGGCTGGCTGCAGCTGTCTTCACGAAGGACTTGGACAAGGCCAATTACCT

Beluga_whale_XM_022550681.2 GGGCTGGCCGCAGCTGTCTTCACAAAGGACTTGGACAAGGCCAATTATCT

Human_NM_000690.4 GGGCTGGCCGCAGCTGTCTTCACAAAGGATTTGGACAAGGCCAATTACCT

Rat_NM_032416.1 GGGCTGGCTGCCGCTGTCTTCACAAAGGACCTGGACAAGGCCAATTACCT

******** ** *********** ***** ******* ******** **

Panda_XM_002913054.4 GTCCCAAGCCCTGCAGGCTGGCACTGTGTGGGTCAACTGCTATGATGTGT

Red_fox_XM_026018899.1 GTCCCAAGCCCTCCAGGCTGGCACTGTGTGGATCAACTGCTATGATGTAT

Cattle_NM_001075367.1 GTCCCAGGCCCTCCAGGCTGGCACTGTGTGGGTCAACTGCTATGACGTGT

Beluga_whale_XM_022550681.2 GTCCCAAGCCCTCCAGGCTGGCACCGTGTGGGTCAACTGCTATGATGTGT

Human_NM_000690.4 GTCCCAGGCCCTCCAGGCGGGCACTGTGTGGGTCAACTGCTATGATGTGT

Rat_NM_032416.1 GTCCCAAGCTCTGCAGGCTGGGACTGTGTGGATCAACTGCTACGATGTGT

****** ** ** ***** ** ** ****** ********** ** ** *

Panda_XM_002913054.4 TCGGGGCCCAGTCACCGTTTGGTGGCTACAAGATGTCTGGGAGCGGCCGG

Red_fox_XM_026018899.1 TTGGGGCCCAGTCACCATTCGGTGGCTACAAGATGTCTGGGAGTGGCCGG

Cattle_NM_001075367.1 TTGGGGCCCAGTCGCCGTTCGGTGGCTACAAGCTGTCTGGGAGTGGCCGG

Beluga_whale_XM_022550681.2 TTGGGGCCCAGTCACCGTTTGGTGGCTACAAGCTGTCTGGGAGCGGCCGG

Human_NM_000690.4 TTGGAGCCCAGTCACCCTTTGGTGGCTACAAGATGTCGGGGAGTGGCCGG

Rat_NM_032416.1 TTGGGGCCCAGTCCCCATTTGGTGGCTATAAGATGTCGGGGAGCGGCAGG

* ** ******** ** ** ******** *** **** ***** *** **

Panda_XM_002913054.4 GAGCTAGGAGAGTATGGGCTGCAGGCATACACCGAAGTGAAAACTGTCAC

Red_fox_XM_026018899.1 GAGCTGGGAGAGTATGGGTTGCAGGCATACACGGAAGTGAAAACTGTCAC

Cattle_NM_001075367.1 GAGCTGGGGGAATACGGGCTGCAGGCGTACACCGAAGTGAAGACCGTCAC

Beluga_whale_XM_022550681.2 GAGCTGGGAGAGTATGGGCTGCAGGCATACACTGAAGTGAAAACTGTCAC

Human_NM_000690.4 GAGTTGGGCGAGTACGGGCTGCAGGCATACACTGAAGTGAAAACTGTCAC

Rat_NM_032416.1 GAGCTGGGCGAGTATGGCCTGCAGGCCTACACGGAAGTGAAGACGGTCAC

*** * ** ** ** ** ******* ***** ******** ** *****

Panda_XM_002913054.4 GGTCAAAGTGCCTCAGAAGAACTCCTGAAGAACCGGGCCGACTCCCTCCC

Red_fox_XM_026018899.1 GATCAAAGTGCCTCAGAAGAACTCCTAAAGAACTCCACCAGCTCCCTCAC

Cattle_NM_001075367.1 AGTCAGAGTTCCTCAGAAGAACTCCTAAAGAACCACGCTGGCTTTCTTAC

Beluga_whale_XM_022550681.2 AGTCAAAGTTCCTCAGAAGAACTCATAAAGAACCATGCTGGCTTT---AC

Human_NM_000690.4 AGTCAAAGTGCCTCAGAAGAACTCAT-AAGAATCATGCAAGCTTCCTCCC

Rat_NM_032416.1 CGTCAAAGTGCCACAGAAGAACTCGTAAAGTGGCGTGCAGGCTTC----C

*** *** ** *********** * *** * ** *

Panda_XM_002913054.4 TCATCCAGCAGCGGAGG--CCAAGGACATCAGCCGCAAAACCAAAAAAAA

Red_fox_XM_026018899.1 TCATCCAGCGACTGAGG--TCAAGGACATCAGCAGCAAAACCAAGAAAAA

Cattle_NM_001075367.1 TCATCCAGTAATGGAAGGCTCA--GAGATCAGCCACAAGACCAAGAAAAA

Beluga_whale_XM_022550681.2 TCATCCAGTGATGGAAAGTTCAAGGAGATAAGCAACAAAACCAAGAAAAA

Human_NM_000690.4 TCAGCCATTGATGGAAAGTTCAGCAAGATCAGCAACAAAACCAAGAAAAA

Rat_NM_032416.1 TCAGCCAGCGCCCAAAAACCCAACAAGATCCTGAGAAAAGCCACCACCAA

*** *** * ** * ** ** *** * **

Panda_XM_002913054.4 TGACGCTTGCATGCTGAAAGTCTTAAAAGAGAAATTCTCTCACA--AATC

Red_fox_XM_026018899.1 TGACGCTTGCACACGAAAAGTCTCAAGAGAGAAATTCGCTCATAG-AATC

Cattle_NM_001075367.1 TGACCCTTGCACGCTAAAGGTCTCAAAAGAGAAACTCTGCCAGAAGAATC

Beluga_whale_XM_022550681.2 TGACCGTTGCATGCTAAAGGTCTCAAAAGAGAAATTCTGCCAGAAAAATC

Human_NM_000690.4 TGATCCTTGCGTGCTGAATATCTGAAAAGAGAAATTTTTCCTACAAAATC

Rat_NM_032416.1 --------GCACACTGCGCCTGCCAAGAGA-AAACCCCTTCACCAAAGCG

** * * ** *** *** * *

Panda_XM_002913054.4 TCTTG-ATCAAGAAAGTCTCAGACCTTGAATTGATAGATGGGG-TAGGTG

Red_fox_XM_026018899.1 TCTTG-ATCAAGAAAGTCCCAGATTTTGAATTGGTAAATGGGGGTGGGTG

Cattle_NM_001075367.1 TCTTGGATCAAGAAAGTTCC----TTC----CAATACACGGGC-TAGGTG

Beluga_whale_XM_022550681.2 TTTTGGATCAAGAAAGTTCCAGAATTTGAATCAATAAATAGGG-TGGGTG

Human_NM_000690.4 TCTTGGGTCAAGAAAGTTCTAGAATTTGAATTGATAAACATGGTGGGTTG

Rat_NM_032416.1 TCTTGGGCCAAGAAAGT--CAGGATTT-----GATAAACAGGGCAGGGTT

* *** ********* * ** * * * *

Panda_XM_002913054.4 --TGGGGCA--GAGTACCGGGAAAGCCTTTTACACGCCAGCAGTACTACT

Red_fox_XM_026018899.1 --CAGGGCAAAGAGTACAGGGAGAGCCTTTTACCCTGCAACAGTACTACT

Cattle_NM_001075367.1 --TGGGGCAAAGGGTACATGGAAAGCCTTTTACACTGCAATACTGCTACT

Beluga_whale_XM_022550681.2 --TGGGACAAAGGGTATATGGAAAGCCTTTTAAACTGCAACAATACTACT

Human_NM_000690.4 GCTGAGGGTAAGAGTATATGAGGAACCTTTTAAACGACAACAATACTGCT

Rat_NM_032416.1 -----GGTGGGCGGTGTGTGGGGAGCATCCCAGTAAACTGGGGAAGGGAG

* ** * * * * * *

Panda_XM_002913054.4 ---AGCTTTCAGGCTGATTTTTTCAAAACTAGATTCAAATATCTTATCCT

Red_fox_XM_026018899.1 GCTAGGTTTCAGGCTGATTTTT-CAAAACTAGATTCAAATGTCTTATCTT

Cattle_NM_001075367.1 ---AGCTTTCAAAGTGACTTTC-CA----CAGATTCAAATATCTCATTCT

Beluga_whale_XM_022550681.2 ---AGCTTTCAGGGTGATCTTT-CAAAGATAGATTCAAATATCTCATCCA

Human_NM_000690.4 ---AGCTTTCAGGATGATTTTT-AAAAAATAGATTCAAATGTGTTATCCT

Rat_NM_032416.1 ---GAGCTCTGTGCAGACTACC--ACGCGCACGCACACACG-CTCACTGG

* ** * * ** * * *

Panda_XM_002913054.4 TTCCATCTGATAGAC----TTCTGTAACTTGCCTTTATGGGGGAACAAAA

Red_fox_XM_026018899.1 GTCCATCTGGTATCC----TTCTGTAACTTGCCCTTGTGGGGAAACAAAA

Cattle_NM_001075367.1 GTCCATCTGACACACTTCCTTCTGTAATTTGCCTTAACGGG--AAGGAAA

Beluga_whale_XM_022550681.2 TTCCATCTGAAACAC----TTCTGTAACTTGCCTTAATGGGGGAAGAAAA

Human_NM_000690.4 CTC--TCTGAAACGCT---TCCTATAACTCGAGTTTATAGGGGAAGAAAA

Rat_NM_032416.1 GTCCTTCTGTGCTGGA---TGCTGGTTCCACCCTCAGTGCTTAAACAAAT

** **** * ** ** **

Panda_XM_002913054.4 AGCCATTGTTCATACTTGTACTAACAGGTCGGGGCAACAGCTAGTGCCTT

Red_fox_XM_026018899.1 AGCTATTGTTTATCCTTGTACTAACAAGTTGGGGCAACAACTAGTGCCTT

Cattle_NM_001075367.1 AGCCATTGTTGACCGCTCTACTATCA--TTGAGGCAACAGCTAGCACCTT

Beluga_whale_XM_022550681.2 AGCCATTGTTTACCACTGTTCCATCT--TTGAAGTAGCAACTAGCACCTT

Human_NM_000690.4 AGCTATTGTTTACAATTATATCACCA--TTAAGGCAACTGCTA-CACCCT

Rat_NM_032416.1 GAGCAATAAA----------------------------------------

* *

・終止コドンを赤字で表示

・左カラムの翻訳領域（終止コドンまで）と右カラムの非翻訳領域（終止コドン以降）の相同性（*の数の比較）

コドンの相同性と対応するアミノ酸の比較

見やすくするため、コドン単位でスペース挿入。対応するアミノ酸はコドンの１塩基目の位置。

３～６、９、１１、１４、１５、１７コドンはコドンの３塩基目にのみ相違がある。

２、７コドンの Lでは、１塩基目に相違がある。ここまでの例はいずれもアミノ酸置換のない変異。

１８コドンは１塩基目に相違があり、V I 置換（疎水性アミノ酸同士）。

１９コドンは２塩基目に相違があり、K R 置換（塩基性アミノ酸同士）

Panda_XM_002913054.4 GAG CTA GGA GAG TAT GGG CTG CAG GCA TAC ACC GAA GTG AAA ACT GTC ACG GTC AAA GTG CCT CAG AAG AAC TCC TGAAGAACCGGGCCGACTC

Red_fox_XM_026018899.1 GAG CTG GGA GAG TAT GGG TTG CAG GCA TAC ACG GAA GTG AAA ACT GTC ACG ATC AAA GTG CCT CAG AAG AAC TCC TAAAGAACTCCACCAGCTC

Cattle_NM_001075367.1 GAG CTG GGG GAA TAC GGG CTG CAG GCG TAC ACC GAA GTG AAG ACC GTC ACA GTC AGA GTT CCT CAG AAG AAC TCC TAAAGAACCACGCTGGCTT

Beluga_whale_XM_022550681.2 GAG CTG GGA GAG TAT GGG CTG CAG GCA TAC ACT GAA GTG AAA ACT GTC ACA GTC AAA GTT CCT CAG AAG AAC TCA TAAAGAACCATGCTGGCTT

Human_NM_000690.4 GAG TTG GGC GAG TAC GGG CTG CAG GCA TAC ACT GAA GTG AAA ACT GTC ACA GTC AAA GTG CCT CAG AAG AAC TCA T-AAGAATCATGCAAGCTT

Rat_NM_032416.1 GAG CTG GGC GAG TAT GGC CTG CAG GCC TAC ACG GAA GTG AAG ACG GTC ACC GTC AAA GTG CCA CAG AAG AAC TCG TAAAGTGGCGTGCAGGCTT

*** * ** ** ** ** ** *** ** *** ** *** *** ** ** *** ** ** * * ** ** *** *** *** ** * *** * **

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Panda_XP_002913100.1 E L G E Y G L Q A Y T E V K T V T V K V P Q K N S

Red_fox_XP_025874684.1 E L G E Y G L Q A Y T E V K T V T I K V P Q K N S

Cattle_NP_001068835.1 E L G E Y G L Q A Y T E V K T V T V R V P Q K N S

Beluga_whale_XP_022406389.1 E L G E Y G L Q A Y T E V K T V T V K V P Q K N S

Human_CAG33272.1 E L G E Y G L Q A Y T E V K T V T V K V P Q K N S

Rat_NP_115792.1 E L G E Y G L Q A Y T E V K T V T V K V P Q K N S

* * * * * * * * * * * * * * * * * : : * * * * * *

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25


14

動物、昆虫、植物、酵母などからデータを取ってくると、興味深い分子系統樹が得られる。

ALDH2 アミノ酸配列を利用した分子系統樹

NCBI より ALDH2 のオーソログ遺伝子由来のアミノ酸配列を取得し、分子系統樹を作成した。

図「N-J Tree with branch length」で作成した分子系統樹

講義でも取り上げた Cytochrome c アミノ酸配列を利用した分子系統樹

>Homo_sapiens_NP_061820.1 cytochrome c [Homo sapiens]

>Canis_lupus_NP_001183974.1 cytochrome c [Canis lupus familiaris]

>Bos_taurus_NP_001039526.1 cytochrome c [Bos taurus]

>Mus_musculus_NP_031834.1 cytochrome c, somatic [Mus musculus]

>Rattus_norvegicus_NP_036971.1 cytochrome c, somatic [Rattus norvegicus]

>Gallus_gallus_NP_001072946.1 cytochrome c [Gallus gallus]

>Xenopus_tropicalis_NP_988895.1 cytochrome c, testis-specific [Xenopus tropicalis]

>Drosophila_melanogaster_NP_477176.1 cytochrome c proximal, isoform A [Drosophila melanogaster]

>Anopheles_gambiae_XP_310154.1 AGAP009537-PA [Anopheles gambiae str. PEST]

>Caenorhabditis_elegans_NP_506156.1 Probable cytochrome c 2.2 [Caenorhabditis elegans]

>Saccharomyces_cerevisiae_NP_012582.1 cytochrome c isoform 1 [Saccharomyces cerevisiae S288C]

>Kluyveromyces_XP_455841.1 uncharacterized protein KLLA0_F16929g [Kluyveromyces lactis]

>Eremothecium_gossypii_NP_985907.1 AFR360Wp [Eremothecium gossypii ATCC 10895]

図「BIONJ」で作成した Cytochrome c アミノ酸配列を利用した分子系統樹

2020年度 暫定版 バイオインフォマティクス 基礎演習マニュ...

Documents

2020年度暫定版バイオインフォマティクス基礎演習マニュ...