ビタミン d 受容体レスポンスエレメントの 効率的...

30
2005 年度 秋 卒業論文 ビタミン D 受容体レスポンスエレメントの 効率的探索法 An Efficient Approach for Seeking Vitamin D Receptor Response Elements 研究指導 東海大学 菊池 浩明 助教授 東海大学 電子情報学部 情報メディア学科 1ADM1202 松前 ひろみ

Upload: others

Post on 22-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

2005 年度 秋 卒業論文

ビタミン D受容体レスポンスエレメントの 効率的探索法

An Efficient Approach for Seeking Vitamin D Receptor

Response Elements

研究指導

東海大学 菊池 浩明 助教授

東海大学 電子情報学部 情報メディア学科

1ADM1202 松前 ひろみ

Page 2: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

2

第 1章 はじめに........................................................................................................................ 3

第 2 章 分子生物学とビタミン D受容体........................................................................... 4

2.1. はじめに................................................................................................................4 2.2. 分子生物学基礎用語の定義 ..................................................................................4 2.3. 核内受容体について..............................................................................................6

第 3章 データ解析................................................................................................................... 9

3.1. 使用データについて ...............................................................................................9 3.2. 解析手法 ........................................................................................................... 11 3.3. 実装プログラム...................................................................................................12

第 4章 結果および考察....................................................................................................... 20

4.1. 結果...................................................................................................................20 4.2 考察...................................................................................................................27

第 5章 参考文献.................................................................................................................... 29

第 6 章 謝辞.............................................................................................................................. 30

Page 3: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

3

第 1章 はじめに

近年、バイオインフォマティクスという言葉をしばしば耳にする。バイオインフォマティクスとは日

本語では生命情報学と訳される、生命科学と情報工学や情報科学が融合した学際領域の学問の

ことであり、主に遺伝子や生体内のタンパク質の情報を計算機で解析することを目的としている。

生物の遺伝情報である DNAは A,T,G,C の 4つの塩基配列の暗号で示されており、その情報量は

莫大なものである。それゆえに大量の情報を効率よく処理し、またその中から意味のある情報だ

けを抜き出してくるには、計算機を利用したアプローチが最適である。

このように生物の生体内には非常に多くの情報が含まれており、その中でも細胞の核内におけ

る遺伝子とタンパク質群の働きは、多くの疾病に関わっているにもかかわらず完全には解明され

ていない。核内における分子活動の中でも最初に研究が進められたのは、ビタミン D(VD)と、ビタ

ミン Dと特異的に結合するビタミンD受容体(VDR)である。VDRは DNA上のビタミンDレスポンス

エレメント(VDRE)と結合し、特定の遺伝子の転写を活性化する働きを担っている。この VDR が正

常に機能しないと遺伝型くる病を発症することが知られているが、VDRE をもつ遺伝子は少数しか

分かっていない。これらについて解明が進めば、それぞれの遺伝子に特有の疾病のみに有効な

ゲノム創薬が期待される。

そこで本研究では、計算機を用いてヒトのゲノム情報から VDRE 候補遺伝子配列を検出するア

ルゴリズムを実装し、配列以外の情報も用いてより可能性の高い少数の VDRE 候補配列を抽出

することを目的とする。

Page 4: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

4

第 2章 分子生物学とビタミン D受容体

2.1. はじめに

バイオインフォマティクスを研究する上で、分子生物学の基礎知識は不可欠である。そこで

本研究に関連する用語について以下で定義する。

2.2. 分子生物学基礎用語の定義

- DNA

全ての生物の遺伝子は DNA(デオキシリボ核酸)という物質から成り立っている。

DNAは生物の遺伝情報の保持を担っている。DNAは 4種類の塩基、アデニン(A),

チミン(T), グアニン(G),シトシン(C) が、2 本の螺旋を形成して成り立っている。A

は T と、Gは C とのみ結合する。これを相補的な塩基対という。

- 遺伝子

DNA のなかでタンパク質を作るなどの生物の遺伝的形質を規定する因子単位を遺

伝子という。

- ゲノム

1細胞あたりの全DNA、或いは全ての遺伝情報の総和をゲノムという。ヒトをはじめ

とした真核生物のゲノムの中には、遺伝子以外の部分も含まれているため、全遺

伝子の総和がゲノムとはいえないので注意が必要である。

- 複製

DNAの役目は情報を保管するだけであり、細胞分裂時などにDNA自身をコピーす

ることを複製という。

- 転写

DNAの遺伝情報を利用するにはRNA(リボ核酸)という物質に置き換える。このDNA

から RNA に遺伝情報をわたす作業を転写という。

Page 5: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

5

- 翻訳

RNA 上の塩基配列はアミノ酸配列として読み替えられ、生体を形作るタンパク質合

成に利用される。この作業を翻訳という。

- セントラルドグマ

DNAからRNAが合成され、RNAからタンパク質が合成される、これら一連の流れを

セントラルドグマという。(図 2.1)

図 2.1 セントラルドグマ

DNA RNA タンパク質

複製

転写 翻訳

Page 6: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

6

2.3. 核内受容体について

2.3.1. 核内受容体

細胞の核の中で遺伝子の発現を調節する受容体。受容体は特定の物質(これをリ

ガンドという)と結合し、特定の塩基配列をもった DNA部分(これをレスポンスエレメ

ントという)と結合して標的とする遺伝子の転写を調節する役割を担う。

レスポンスエレメント

標的遺伝子

図 2.3 受容体と標的遺伝子

mRNA

タンパク質

標的遺伝子を刺激

DNA

核外

核内

核内受容体とリガンド

図 2.2 受容体の基本構造

受容体 リガンド

リガンド結合部位

Page 7: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

7

2.3.2. ビタミン D受容体(VDR)

2.3.2.1. ビタミン D受容体(Vitamin D Receptor)

核内受容体の1つ。リガンドはビタミンD。DNA上に存在するビタミンDレスポンスエ

レメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

2.3.2.2. VDRE

VDRE の塩基配列は、ヒト8種類、ラット7種類、マウス3種類、イエイヌ3種類、ヨ

ーロッパミツバチ1種類、チンパンジー3種類の合計23個、それに加えコンセンサ

ス配列(既知の VDRE から求められた基本配列)については既知である。

VDRE のコンセンサス配列は、

AGGTCA x x x AGGTCA

という形をとることが知られている。前半部分(上流という)の配列と、後半部分

(下流という)の配列の間に、任意の3塩基(以下本稿ではxxxと表すこととする)を挟

みこむことを特徴としている。また、上流と下流の配列が同じような配列を Direct

Repeat(DR)といい、VDRE のコンセンサス配列は DirectRepeat-3(DR3) と表現され

る。

また DRのほかにも Inverted Parindrome(IP)と呼ばれる形を VDRE は取ることが

知られている。IP は、上記コンセンサス配列を用いて説明すると以下のような流れ

で変換される。

Page 8: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

8

(1) 上流部分の配列に対し相補をとり(すなわち A と T、C と G とそれぞれ変換

する)

(2) さらに相補を取った上流部分の配列を、逆さから読むように変換する。

(3) 下流部分の配列はそのままにしておく。

上記コンセンサス配列を IP に変換した結果は以下のように表される。

TGACCT x x x AGGTCA

T C TC GA

T G TA CC

A G AG CT

T C TC GA

Page 9: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

9

第 3章 データ解析

本章ではデータとそのデータを利用した解析手法について解説する。

3.1. 使用データについて

本研究では、遺伝子情報に関して、公開データあるいは既知のデータを利用した。以下に

そのデータを挙げる。

A) ビタミン D誘導体により発現が変化したヒト遺伝子群(153 個)[2]

参考文献[2]にて、Affymetrix 社で提供されている Gene チップに対し、ビタミン D 誘導

体を投与後に、なんらかの発現が見られたヒト頭頸部の扁平上皮癌由来の細胞から

とった遺伝子のリスト。

B) NCBI ヒト遺伝子の塩基配列情報(http://www.ncbi.nlm.nih.gov/)

National Center for Biotechnology Information(NCBI)は、アメリカの公的機関で、医学

をはじめとした生命科学に関する膨大な情報をデータベース化して一般に広く公開し

ている。本研究では、必要なヒト遺伝子の塩基配列データについて、データベース上

からクローラーを作成して取得した。

Page 10: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

10

C) 既知のヒト・チンパンジー・マウス・ラット・イエイヌ・ヨーロッパミツバチの VDRE(24

個)[1]

VDRE 生物種

VDRE が見つかっ

た遺伝子名 上流 挟み込み 下流 type

ヨーロッパミツバチ aMyHC AGGACA AAG AGGGGA DR3

cCAII AGGGCA TGG AGTTCG DR3

clntβ GAGGCA GAA GGGAGA DR3 イエイヌ

cPTH GGGTCA GGA GGGTGT DR3

hCYP24 AGTTCA CCG GGTGTG DR3

hD9k TGCCCT TCCTTATGG GGTTCA IP9

hGH GGGTCA ACA GTGGGA DR3

hNaPi GGGGCA GCA AGGGCA DR3

GGGTGA ACG GGGGCA DR3 hOC

GGGTGA CTCACC GGGTGA DR3

Hp21 AGGGAG ATT GGTTCA DR3

ヒト

hPTH GGTTCA AAG CAGACA DR3

mD28k GGGGGA TGTG AGGAGA DR4

mOPN GGTTCA CGA GGTTCA DR3 マウス

mPit-1 TGAACT CTCA TGAACT DR4

チンパンジー pOPN GGGTCA TAT GGTTCA DR3

rANF AGGTCA TGA AGGACA DR3

rCYP24 GGTTCA GCG GGTGCG DR3

rD9k GGGTGT CGG AAGCCC DR3

GGGTGA ATG AGGACA DR3 rOC

TGCACT GGGTGAATG AGGACA IP9

rPTHrP1 AGGTTA CTC AGTGAA DR3

ラット

rPTHrP2 GGTGGA GAG GGGTGA DR3

コンセンサス配列 consensus AGGTCA XXX AGGTCA DR3

表 3.1 参考文献[1]に掲載されている既知の VDRE 一覧

D) Affymetrix 社のマイクロアレイデータ(http://www.ncbi.nlm.nih.gov/ )

NCBI が公開している、マイクロアレイの発現データで、マイクロアレイ技術とは遺伝子

の発現量を調べることができる手法である。本研究では GDS181, GDS422, GDS596 と

いう ID のヒトの遺伝子発現に関するデータを使用した。

Page 11: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

11

3.2. 解析手法

3.2.1. データ A の塩基配列について、データ B から、本来の遺伝子部分の塩基配列に加えて、

それぞれの遺伝子の上流部分 2500 塩基を追加して取得した。これは、既知の VDRE が

全て、上流 2000塩基以内に見つかっているためで、念のためさらに 500塩基加えて取得

した。この作業は、シェルスクリプトで書かれたクローラーで行った。その結果、データ A

の153個のうち、144個の遺伝子について塩基配列をFasta形式のファイルで取得するこ

とができた(結果 1)。9 個の遺伝子に関しては、塩基配列がまだ公開されていなかったた

め見つからなかった。

3.2.2. データCの VDRE配列に対して、DRであるものは IPに、IP であるものはDRに変換を施

した(プログラム A のメソッド(2))。新たに生成された配列と、元の VDRE 配列、合計 48 個

を VDRE 候補配列とした(結果 2)。

3.2.3. プログラムAにおいて正規表現を用いて、オリジナルの配列および、上記変換を施した配

列を、挟み込む塩基数は 3~9塩基対として結果 1のデータに対して取得した。結果 2の

配列を 14 箇所にて検出された(結果 3)。

3.2.4. ビタミン Dに関係する遺伝子は似たような発現パターンを示しているだろうという仮定のも

とに 、データ D をデータマイニングにかけた 。使用したソフ トウ ェアは 、

Cluster(http://rana.lbl.gov/EisenSoftware.htm)で、K-means を使用し、20 ノードに分類し

た(結果 4)。

3.2.5. 結果 3 で抽出された VDRE 候補が見つかった遺伝子を、結果 4上で検出した(結果 5)。

Page 12: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

12

3.3. 実装プログラム

3.3.1. 使用言語について

使用言語は主に Java を利用した。Java にはバイオインフォマティクスに必要な API、

BioJava が公開されており、一部にこれを利用した。また必要に応じて Perl や shell スクリ

プトを使用したプログラムも書いた。

3.3.2. BioJava について

BioJava(http://www.biojava.org/index.html)とは、生物データを処理するためのオープン

ソースの Java ライブラリであり、バイオインフォマティクスにおけるオープンソースの開発

を目的とする Open Bioinformatics Foundation(http://www.open-bio.org/)によって開発支

援されている。2005 年 7 月 13 日現在、バージョン 1.4 までが公式リリースされているが、

本研究開始時には、1.4 のプレリリース版であるバージョン 1.4pre1 までしか公開されてい

なかったので、本研究では BioJava 1.4pre1 を用いた。

BioJava では主にシークエンス操作に関するライブラリが用意されている。たとえば、生物

の塩基配列データは何種類かのフォーマット形式でデータベース上に保存されているが、

BioJava のファイル入出力処理では各々のファイル形式に依存せずに中身のデータを扱

うことができる。

また DNA 塩基配列は、A、T、C、G の4つのアルファベットで表されるが、BioJava を用い

るとそれらのアルファベットは文字列型としてではなく、DNA のアミノ酸のオブジェクトとし

て扱うことができる。図 3.1 で示すように、塩基配列が格納されたファイル内には、塩基配

列としてのアルファベットと、関連情報(たとえば遺伝子名など)のアルファベットが混在し

ているので、文字列とアミノ酸とを区別できるようになることは配列処理に大いに役立つ。

Page 13: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

13

図 3.1 fasta 形式の塩基配列データをテキストエディタで表示

fasta 形式では、一行目に遺伝子に関する情報(染色体番号、染色体における位置情報、

塩基配列の読み取り方向、生物種など)が格納されている。2行目以降から塩基配列デー

タになり、以後 70 字ごとに改行が入るようなフォーマットになっている。

Page 14: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

14

3.3.3. プログラム A:正規表現によるシークエンス検索プログラム

本プログラムは、対象となる VDRE 塩基配列(データ C)と、その配列を基に VDRE 塩基配

列候補を作成し、塩基配列データを格納した fasta 形式のデータ(結果1で取得されたも

の)内から検索することを目的とする。ここで、データ C には、VDRE の名前、その塩基配

列と、その配列のタイプ(DR/IP か、上流と下流の間に何塩基をはさむか)に関する情報が

格納されているとする。すなわち、結果1の fastaデータとデータCを入力すると、データC、

及びそれを DR のものは IP に、IP のものは DR に変換された配列について、入力された

fasta ファイルの中から検出する。

本プログラムは、大別して以下の 3つのメソッドから成り立つ。

(1) カレントディレクトリに存在するfastaファイルを探し出し、その一覧を配列に格納し、ま

たカレントディレクトリに存在する検索対象配列(データ C)を読み込むメソッド。

(2) 読み込んだデータ Cから、配列のタイプを抽出し、逆の配列へ変換するメソッド。

(3) 作成した配列のリスト(結果 2)を元に、結果 1 のデータから該当する箇所を正規表現

で検出するメソッド。

Page 15: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

15

(1)カレントディレクトリに存在する fasta ファイルを探し出し、その一覧を配列に格納し、ま

たカレントディレクトリに存在する検索対象配列(データ C)を読み込むメソッド。

図 3.2 fasta を読むメソッド

Method: Fasta-Reading

ディレクトリ内にfasta形

式のファイルがあるか

開始

Fastaファイル名一覧を取得

NO YES

終了

Page 16: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

16

(2)読み込んだデータ C から、配列のタイプを抽出し、逆の配列へ変換するメソッド。配列

変換には BioJava のオブジェクトを利用する。

図 3.3 配列の変換を行うメソッド

Method: MakingSequence

listVDRE.txtのVDRE配

列は、DRである

開始

DRの配列をIPに変換

NO YES

終了

IPの配列をDRに変換

元からIPであるものに加えてIP

配列のリストを作成

元からDRであるものに加えてDR

配列のリストを作成

Page 17: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

17

図 3.4 BioJava を用いて、DR を IP に変換し、IP 配列のリストを作成

DR→IP(BioJava) 開始

塩基配列の上流部分に対して、相補を取

り、さらに逆さから読ませるメソッドを利用

してIPに変換

終了

塩基配列をSequenceオブジェクトに変換

し、DNA塩基配列として認識させる

変換済み上流配列と、無変換の下流配

列を組み合わせて、IP配列候補とする

Page 18: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

18

図 3.5 BioJava を用いて、IP を DR に変換し、DR配列のリストを作成

IP→DR(BioJava) 開始

塩基配列の上流部分に対して、相補を取

り、さらに逆さから読ませるメソッドを利用

し、DRへ戻す

終了

塩基配列をSequenceオブジェクトに変換

し、DNA塩基配列として認識させる

変換済み上流配列と、無変換の下流配

列を組み合わせて、DR配列候補とする

Page 19: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

19

(3) 作成した配列のリスト(結果 2)を元に、結果 1 のデータから該当する箇所を正規表現

で検出するメソッド。間に挟みこむ塩基数は3~9塩基で検索する。見つかった配列は、配

列名やタイプ、位置情報などともにテキストファイルに出力する。

図 3.6 配列を正規表現で検出する

Method: SequenceSearch 開始

作成したDRとIPリストの配列について、

正規表現を用いて検索する

終了

fastaファイルをオープンし、塩基配列デ

ータを文字列として読み込む(BioJava)

検索結果をテキストファイルに出力する

Page 20: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

20

第 4章 結果および考察

4. 本章では、第 3章 解析手法において抽出した結果から考察を行う。

4.1. 結果

4.1.1. 結果 3

データ Aに

おける発現

別分類

Gene ID 遺伝子名 検出された

VDRE

VDRE 上

流配列

VDRE 下

流配列

遺伝子の開

始位置から

計った位置

配列のタイプ 挟込

み数

D3 220 ALDH1A3 Hp21 ctccct gggtgt -346 IP 変換 8

D4 1000 CDH2 mPit-1 tgaact tgaact -1316 変換せず(DR) 6

U2 1258 CNGB1 hGH gggtca gtggga -933 変換せず(DR) 6

U3 1992 SERPINB1 rPTHrP2 ggtgga gggtga -1729 変換せず(DR) 5

D3 2013 EMP2 rPTHrP2 ggtgga gggtga -2145 変換せず(DR) 3

D4 3014 H2AFX aMyHC aggaca agggga -2184 変換せず(DR) 3

D4 3856 KRT8 aMyHC aggaca agggga -110 変換せず(DR) 8

D4 4232 MEST hPTH tgaacc cagaca -2029 IP 変換 3

D5 4502 MT2A aMyHC aggaca agggga -342 変換せず(DR) 6

D2 4837 NNMT cPTH tgaccc gggaga -347 IP 変換 8

U4 5654 PRSS11 rPTHrP2 ggtgga gggtga -1984 変換せず(DR) 4

U4 5754 PTK7 rOC gggtga aggaca -2295 変換せず(DR) 7

D3 6279 S100A8 rOC(9) agtgca aggaca -633 DR 変換 4

U3 7869 SEMA3B cPTH tgaccc gggtgt -33 IP 変換 3

図 4.1 検出された VDRE 候補

Page 21: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

21

合計 14 個の遺伝子において VDRE 候補が見つかった(図 4.1)。うち、元の VDRE を変換

せずにそのままの形で見つかったものは、9 個であった。

図 4.1 について説明すると、文献[2]ではデータ A を発現パターン別に分類しており、それ

が最左の項目である。発現が上がっているものは、上がり方が顕著なほうから U1~U4、

発現が下がっているものは、下がり方が顕著なほうから D1~D5 までに分けられる。とり

わけ上昇しているもののうちU1~U3、減少しているもののうちD1~D2は、明らかな変化

を遂げておりビタミン D との関連性が示唆されるものである。

また、GeneID とは、それぞれの遺伝子に固有に振り分けられた IDであり、NCBI の DBで

管理されている。遺伝子名とは候補配列が見つかったヒト遺伝子の名前である。遺伝子

の開始位置から計った位置とは、遺伝子塩基配列開始地点からさかのぼって何塩基目

にあるかをマイナス値で示している。配列のタイプとは、既知の VDRE と全く同じものは

「変換せず(元の繰り返しタイプ)」、IP から DR に変換されて見つかったものは「DR 変換」、

DR から IP に変換されて見つかったものは「IP 変換」と表している。

4.1.2. 結果 5

20個のノードに、発現データ別にクラスタリングされた結果が、以下の図4.2、4.3、4.4であ

る。GeneID は、ノード内で発見されたデータ A の遺伝子である。青色で示した箇所が、結

果 3で抽出された遺伝子のGeneID であるが、14 個のうち 7個しかノード内では見つかっ

ていない。

GDS181(95A)

ノード ノード内に分類された List 遺伝子の GeneID

1 4610 1551 4837 1551 1551 1551 1646

2 6317

3

4 3965 5770 8638 3727 3727 834

5 2203 2878 8644

6 7020

7 1591 7424 4314 4322 2650 8821 9982 7328 1382 650 7851 6352 4610

8 1130 4291 8900 3371

9 667 220 2669

10 4232 649 1082 5672

Page 22: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

22

11 899 34 890 10212 891 990 3014 7296 2305 891 990 890 1164 2030 9173 5033 9972

12 3434 6397 3983 7844 54861 604 9926 5295 5295 4780 3434 373 51083

13 5138 10410 6405 7004 1830 8519 8519 2869 3575 6352 6352

14 136 4747 10381 2281 9665 6447 4330 5653

15

16 8870 1382 4053 9338 4071 654 1305 5784 5654 5654 2013 4192 650 2202 3339 6414 687 654

17 3727 8204 1992

18 11167 1847 10628 5770 942 2771 2539 2869

19 3627 4046 240

20 4072 84775 10105 1512 27237

図 4.2 GDS181 内のデータ A と、結果 3 で抽出された遺伝子(青色) の GeneID

GDS422(U-95A)

ノード ノード内に分類された List 遺伝子の GeneID

1 2203 1591 4072 2878

2 51083 7328 27237 4610

3 4232 6352 6352 6352 240 5138 8519 834 4046 2650

4 2030 4322 34 5033 687

5 2539 8900 3434 1382 5295 5295 1551 9338 7844 11167 3434 7296 8821

6 4837 7004 604 4314 4330

7 1382 220

8 1551 1551 1551

9 4291 3983

10 4747 6447 9665 10381

2771 3727 6397 5770 1512 3727 3727 3371 3339 942 6405 649 1847

11

2669 10410 9982 4780 8519 5784 5770 7851

12 54861 4192 3014 3575 6317 9972 9926

13 10105 6414 1646 8644 84775

14 2281 373 136 5653 5654 5654

15

16

8870 1305 2869 4071 4053 650 654 2013 9173 8638 2869 1992 650

17

2202 7424 3627 654

18 5672 8204 1082 10628 7020 3965 1830 899 4610 2305

19 667 891 10212 890 1164 1130 890 891

20 990 990

Page 23: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

23

図 4.3 GDS422 内のデータ A と、結果 3 で抽出された遺伝子(青色) の GeneID

GDS596(133A)

ノード GeneID ノード GeneID ノード GeneID ノード GeneID

1 4071 3339 5 990 10 6352 15

2 6 1305 7004 6405 11 4610 16 834 3772

3 7 12 17 664

4 8 13 18

5 9 14 2539 19 6405 810

20

図 4.4 GDS596 内のデータ A と、結果 3 で抽出された遺伝子(青色) の GeneID

Page 24: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

24

また、データマイニングの結果をデータAによる発現量ごと、とりわけU1~U3、D1~D2に

注目して分類に分けてみると以下のようになった。

Cluster

D1

D2

U1

U2

U3

図 4.5 発現パターン色対応表

GDS181(95A)

ノード U1~U3/D1~

D2 の割合 List 遺伝子の GeneID

1 28.57% 4610 1551 4837 1551 1551 1551 1646

2 100.00% 6317

3 0.00%

4 66.67% 3965 5770 8638 3727 3727 834

5 66.67% 2203 2878 8644

6 0.00% 7020

7 61.54% 1591 7424 4314 4322 2650 8821 9982 7328 1382 650 7851 6352 4610

8 25.00% 1130 4291 8900 3371

9 33.33% 667 220 2669

10 0.00% 4232 649 1082 5672

899 34 890 10212 891 990 3014 7296 2305 891 990 890 1164

11 23.53%

2030 9173 5033 9972

12 61.54% 3434 6397 3983 7844 54861 604 9926 5295 5295 4780 3434 373 51083

13 18.18% 5138 10410 6405 7004 1830 8519 8519 2869 3575 6352 6352

14 75.00% 136 4747 10381 2281 9665 6447 4330 5653

15 0.00%

8870 1382 4053 9338 4071 654 1305 5784 5654 5654 2013 4192 650

16 33.33%

2202 3339 6414 687 654

17 100.00% 3727 8204 1992

18 25.00% 11167 1847 10628 5770 942 2771 2539 2869

19 0.00% 3627 4046 240

20 20.00% 4072 84775 10105 1512 27237

図 4.6 GDS181 のクラスタリング結果を発現パターンからみる

Page 25: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

25

GDS422(U-95A)

ノード U1~U3/D1~

D2 の割合 List 遺伝子の GeneID

1 50.00% 2203 1591 4072 2878

2 0.00% 51083 7328 27237 4610

3 20.00% 4232 6352 6352 6352 240 5138 8519 834 4046 2650

4 40.00% 2030 4322 34 5033 687

5 53.85% 2539 8900 3434 1382 5295 5295 1551 9338 7844 11167 3434 7296 8821

6 80.00% 4837 7004 604 4314 4330

7 50.00% 1382 220

8 0.00% 1551 1551 1551

9 50.00% 4291 3983

10 75.00% 4747 6447 9665 10381

2771 3727 6397 5770 1512 3727 3727 3371 3339 942 6405 649 1847

11 57.14%

2669 10410 9982 4780 8519 5784 5770 7851

12 42.86% 54861 4192 3014 3575 6317 9972 9926

13 60.00% 10105 6414 1646 8644 84775

14 42.86% 2281 373 136 5653 5654 5654

15 0.00%

16 0.00%

8870 1305 2869 4071 4053 650 654 2013 9173 8638 2869 1992 650

17 47.06%

2202 7424 3627 654

18 10.00% 5672 8204 1082 10628 7020 3965 1830 899 4610 2305

19 12.50% 667 891 10212 890 1164 1130 890 891

20 0.00% 990 990

図 4.7 GDS422 のクラスタリング結果を発現パターンからみる

Page 26: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

26

GDS596(133A)

ノード U1~U3/D1~D2 の割合 List 遺伝子の GeneID

1 50.00% 4071 3339

6 0.00% 990

7 100.00% 1305 7004 6405

10 0.00% 6352

11 0.00% 4610

14 0.00% 2539

16 100.00% 834 3772

17 0.00% 664

19 50.00% 6405 810

図 4.8 GDS133A のクラスタリング結果を発現パターンからみる

上の図では、太字で示した箇所が結果 3 の VDRE 候補である。また、データ A の遺伝子のうち、

U1~U3、D1~D2 に属するものの割合を示した。このうち 50%以上 60%未満が緑色、60%以上のも

のがピンク色で示してある。

Page 27: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

27

4.2 考察

まず、結果 3の図 4.1 であるが、注目すべき点は 2箇所ある。

オリジナルの VDRE の配列をもつもので、さらに発現量が明らかに変化しているのは、

遺伝子名 CNGB1 と SERPINB1 であった。なお CNGB1は能動輸送に、SERPINB1 は免

疫系にかかわる遺伝子である。

図 4.9 VDRE 候補 1

また、VDREのうちcPTHを IP変換したものに注目してみると、2箇所で見つかっており、

いずれも上昇と減少という違いはあるものの、発現が大きく変化しているものである。

データ Aに

おける発現

別分類

Gene

ID

遺伝子

検出され

た VDRE

VDRE の

上流配列

VDRE の下

流配列

遺伝子の開

始位置から計

った位置

配 列 の

タイプ

挟込

み数

D2 4837 NNMT cPTH tgaccc gggaga -347 IP 変換 8

U3 7869 SEMA3B cPTH tgaccc gggtgt -33 IP 変換 3

図 4.10 VDRE 候補 2

なお、NNMT は肝臓で働く遺伝子であり、SEMA3B は免疫系で働く抗体の遺伝子であ

る。

これらの遺伝子については、その妥当性について、生物学的実験により確認してみる必

要性がある。

データ Aに

おける発現

別分類

Gene

ID 遺伝子名

検出された

VDRE

VDRE の上

流配列

VDRE の下

流配列

遺伝子の

開始位置

から計った

位置

配列のタイプ

挟み

込み

U2 1258 CNGB1 hGH gggtca gtggga -933 変換せず(DR) 6

U3 1992 SERPINB1 rPTHrP2 ggtgga gggtga -1729 変換せず(DR) 5

Page 28: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

28

さらにこれらの結果を結果 5 に照らし合わせてみると、ヒト遺伝子全体における発現量

のクラスタリング結果、とビタミン Dに関わる遺伝子のあいだには相関性がないことがわ

かった。本研究で使用した発現データ(データ D ) は、数年前の古いデータであるので、

新しいデータでのクラスタリングを今後試してみる必要性がある。

Page 29: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

29

第 5章 参考文献

[1] S. Yamada, et al, “Vitamin D Receptor”, in Z. Hochberg ed.: “Vitamin D and Rickets”,

pp.50-68, Karger, Basel, 2003.

[2] R. Lin, et al, “Expression Profiling in Squamous Carcinoma Cells Reveals Pleiotropic Effects

of Vitamin D3 Analog EB1089 Signaling on Cell Proliferation, Differentiation, and Immune

System Regulation”, Molecular Endocrinology, vol.16(6), pp.1243-56, 2002.

Page 30: ビタミン D 受容体レスポンスエレメントの 効率的 …windy.mind.meiji.ac.jp/paper/2004/Vitamin/thesis.pdfレメント(Vitamin D Response Element)と結合し、標的遺伝子の転写を促進する。

30

第 6章 謝辞

本研究を完遂するにあたり、暖かいご指導を受け賜りました、東海大学電子情報学

部情報メディア学科菊池浩明助教授ならびに情報科学科の中西祥八郎教授には心か

ら感謝の意を表します。

この研究は東京医科歯科大学生体材料工学研究所において行われたものであり、

そこでの研究にあたってご指導いただきました増田正教授、福岡豊助教授、山本恵子

助教授、稲岡秀検助手には心から感謝いたします。また東海大学から同研究所への橋

渡しをしてくださった同研究所の三林浩二教授、小川充洋助手には心から感謝いたしま

す。

最後に、研究生活を通じてさまざまな助言をしていただいた、東海大学中西研究室、

菊池研究室、内田研究室、そして東京医科歯科大学生体材料工学研究所の皆々様に

は深く御礼申し上げます。