利用染色質免疫沉澱定序資料研究 tr4 核受體結合位

1
利利利利利利利利利利利利利利利 TR4 利利 利利利 Uncovering TR4 Binding Motif using Chromatin Immuno-Precipitation Sequencing Data 利利利利 : 利利利 利利利利 利利利利 利利利 、、、 利利利利 : 利利利利利 利利 利利利利 孤孤孤TR4(testicular orphan nuclear receptor 4) 孤孤孤孤孤孤孤 孤孤孤孤 ,體 孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤 、、。 孤孤孤孤孤孤孤孤孤孤孤孤 孤孤 TR4 孤 ChIP-seq 孤孤 孤孤 TR4 孤 DNA 孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤 MEME- ChIP 孤 孤孤孤孤孤 體, Motif 孤孤孤孤孤孤 TR4 binding motif 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤 TR4 孤 孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤 ,。 [1-4] 1. 孤孤 TR4 孤 ChIP-seq 孤孤孤孤孤 TR4 孤 DNA 孤孤孤孤孤孤孤孤孤孤孤孤 2. 孤孤 MEME ChIP 孤 孤孤孤孤孤 體, Motif 3. 孤孤 TR4 binding motif 孤孤孤孤孤 利利利利 孤孤孤孤 TR4 孤 孤孤孤孤孤孤孤 孤孤孤孤孤 體, TR4 孤孤孤孤孤 Motif 孤孤孤孤孤孤 孤孤孤 ,一 TR4 孤孤孤 孤孤孤孤孤孤孤孤孤 利利利利利利 孤孤孤孤孤 TR4 孤孤孤孤TR4 孤孤孤孤孤 DNA 孤孤孤孤 100 孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 548,514 孤 孤孤孤孤 blast 孤孤孤孤孤 孤孤孤孤孤 ChIP-seq 孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤 孤孤孤 體,體。, MEME 孤孤孤孤 ChIP-seq 孤孤 孤孤孤 motif 孤孤孤孤孤孤孤孤孤孤孤 TR4 binding motif 孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤[5.6] 孤孤孤孤孤孤孤孤孤孤孤孤孤孤3.1 TR4 孤孤孤孤孤孤 (http://140.126.132.67/phpadmin) 孤孤孤孤孤孤孤 孤孤孤孤 TR4 孤孤孤 孤孤孤孤 ChIP-seq 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 TR4 孤孤孤孤 孤孤孤孤 32bp 孤孤孤 548,514 孤3.2 孤孤孤孤 A) Run_blast.php: 孤孤孤孤 blast 孤孤 TR4 ChIP-seq 孤孤孤孤孤孤孤GRCh37p10[7] 孤孤孤孤孤孤孤孤 孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤 體。 result.txt 孤 B)Seperate-dnaseq.php: 孤孤孤孤孤 孤孤 GRCh37p10 孤孤孤孤孤孤孤 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤 體,。 C) get_dnaseq.php: 孤 ChIP-seq 孤孤 (TR4 孤孤孤孤 ) 孤孤孤孤孤 孤孤孤孤孤 體, 孤孤孤孤孤 32bp 孤孤孤 100bp( 孤孤孤 ) 孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤 。體。 D) 孤孤孤孤孤孤孤 CHIP-result 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤 chrN 孤孤孤孤孤孤孤 TR4 孤孤孤孤孤孤 孤孤孤孤孤 孤孤孤孤孤 體, 100bp 孤 ChIP 孤孤孤孤孤 3.3 MEME 孤孤孤孤 ChIP 孤孤 (http://meme.nbcr.net/meme/cgi-bin/meme-chip.cgi) 孤孤 get_dnaseq.php 孤孤孤孤 ChIP 孤孤 (100bp) Excel 孤孤孤 孤孤孤孤 孤孤孤孤孤孤孤孤 TR4 孤孤孤孤孤孤孤 孤孤孤孤孤孤 TR4 孤孤孤孤孤 FASTA 孤孤 孤孤孤 MEME 孤孤孤孤 孤孤 孤孤孤孤孤孤孤孤孤 motif 孤 孤孤 motif 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 : 孤孤孤孤 E-value 孤孤 10 - 50 孤孤孤孤孤孤 10 孤 孤孤孤孤 TR4 孤孤孤孤孤 motif 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤 孤孤TR4 孤孤孤孤孤孤孤孤孤 孤孤孤孤 一、體 TR4 孤孤 DNA 孤孤孤 利利利利 3.4 孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 ,。 A) 孤孤孤孤孤孤孤孤孤孤 (http://gene.hpa.gov.tw/index.php? mo=DiseasePaper&action=paper1_cate&cate=Set1) B) 孤孤孤孤孤 -- 孤孤孤孤孤孤 孤孤 (http://www.genes-at-taiwan.com.tw/genehelp/dbIndex.asp) 孤孤孤孤孤孤 孤孤孤孤孤孤 TR4 孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤 MEME-ChIP 孤孤孤孤孤 motif 孤孤孤 motife 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 motif 孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤A) LRPPRC: TR4 孤孤孤孤孤孤孤 孤孤孤孤 孤孤孤孤孤孤孤孤 孤孤孤孤 Leigh 孤孤孤 (Leigh Syndrome,LS) 孤孤孤 孤孤孤 孤孤孤孤 孤孤 TR4 孤孤孤孤 孤孤孤孤孤 motif 孤 孤孤孤 孤孤 AGAGTTCTCGGTATTTTTACTAGT TGGCC 孤孤 C[CT](2)T[CG]C[CG] [AC]C[GA] [TA]CCTGGGA 孤 孤孤孤孤 孤 孤孤Leigh Syndrome,LS MEME-ChIP Motif Overview 孤孤孤 motif 孤孤孤B) PALB2:TR4 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 (Fanconi anemia, complementation group N) 孤 孤孤 孤孤 孤 孤孤孤孤孤孤孤孤 「」 , 孤 90% 孤孤孤孤孤孤孤孤孤 孤孤孤 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 。,。 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤 motif 孤 A[GC]TC[TA]T[TC][CG]A[GC]AG [AC][TG][TC][CG][CG][GC] [GT]CT[AC]CTT[CT] [CA]GGC CTCCTCCACTTCCGC TCCAGGTGGCCCACT( 孤孤孤 ) 孤 孤孤Fanconi anemia, complementation group N MEME-ChIP Motif Overview 孤孤孤 motif 孤孤孤孤孤C) SRP72: 孤孤孤孤孤孤孤孤 TR4 孤孤孤孤孤 孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤 (Bone marrow failure, familial) 孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤 ,一體。 孤孤孤孤TR4 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 孤孤孤 孤TR4 孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 TR4 孤孤孤孤孤孤孤孤孤孤孤 motif: ( 孤孤孤 ) GGCTGAAGACACTCCCAACTCGGCGACGC T TAGCAATCATCGACTTCCTCCTCCT CTTGG 孤孤Bone marrow failure, familial MEME-ChIP Motif Overview 孤孤孤 motif 孤孤孤孤孤 利利利利利 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤 ,, TR4 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤 孤孤孤孤孤 。, 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤 ,, TR4 孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 TR4 孤孤孤孤孤孤孤孤 孤孤孤孤 TR4 孤孤孤孤孤 motif 孤孤孤孤孤孤孤孤 motif 孤 孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 一體 motif 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤 ,, TR4 孤孤孤孤利利 孤孤孤孤孤孤孤 TR4 孤孤孤 孤孤孤 ChIP-seq 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 TR4 孤孤 32bp 孤孤 孤孤孤 100bp 孤孤孤孤孤 PHP 孤孤孤孤 孤孤孤 TR4 孤 DNA 孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤 TR4 孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤 548,514 孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 TR4 孤孤孤孤孤 利利 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 ,, MEME-ChIP 孤孤孤 孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤 。, 孤孤 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤 ,,一,體 孤孤 孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 。,,,一 孤孤 孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤孤 孤孤孤孤孤孤 孤孤孤孤孤孤孤孤孤 ,,體。 利利利利 1. Du, L., et al., Evidence for orphan nuclear receptor TR4 in the etiology of Cushing disease. Proc Natl Acad Sci U S A, 2013. 110(21): p. 8555- 60. 2. Hwang, S.B., J.P. Burbach, and C. Chang, TR4 orphan receptor crosstalks to chicken ovalbumin upstream protein-transcription factor and thyroid hormone receptor to induce the transcriptional activity of the human immunodeficiency virus type 1 long-terminal repeat. Endocrine, 1998. 8(2): p. 169-75. 3. Lee, Y.F., et al., Identification of direct repeat 4 as a positive regulatory element for the human TR4 orphan receptor. A modulator for the thyroid hormone target genes. J Biol Chem, 1997. 272(18): p. 12215-20. 4. O'Geen, H., et al., Genome-wide binding of the orphan nuclear receptor TR4 suggests its general role in fundamental biological processes. BMC Genomics, 2010. 11: p. 689. 5. Viens, A., et al., Use of protein biotinylation in vivo for chromatin immunoprecipitation. Anal Biochem, 2004. 325(1): p. 68-76. 6. 孤孤孤 , 孤孤孤 , 孤孤孤 , Discovering TR4 Nuclear Receptor Binding Information from ChIP-seq Data. 2012 孤孤孤孤孤孤孤孤孤孤 , 2012: p. 1-6. 7. Genome Reference Consortium Human Build 37 patch release 10 (GRCh37.p10) . 2012/08/31]; Available from: http://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.22/. 利利利利利利利利利利利利利利利利利利 利利利利PROJ2013-BIOINFO-9907

Upload: aderyn

Post on 15-Jan-2016

51 views

Category:

Documents


1 download

DESCRIPTION

利用染色質免疫沉澱定序資料研究 TR4 核受體結合位 Uncovering TR4 Binding Motif using Chromatin Immuno-Precipitation Sequencing Data 專題組員 : 呂姿穎、李懿容、林佳穎、柯鈺彤 指導老師 : 董其樺老師. 摘要. 主要成果. 孤核受體 TR4(testicular orphan nuclear receptor 4) ,部分參與生物體的代謝調節、胚胎發育、細胞分化和基因表達 。 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 利用染色質免疫沉澱定序資料研究 TR4 核受體結合位

利用染色質免疫沉澱定序資料研究 TR4核受體結合位

Uncovering TR4 Binding Motif using Chromatin Immuno-Precipitation Sequencing

Data專題組員 : 呂姿穎、李懿容、林佳穎、柯鈺彤

指導老師 : 董其樺老師

摘要

研究目的

孤核受體 TR4(testicular orphan nuclear receptor 4),部分參與生物體的代謝調節、胚胎發育、細胞分化和基因表達。本專題研究接續前人的研究,利用 TR4之ChIP-seq資料,定位出 TR4在 DNA上結合的位置並加以擴充長度,再利用 MEME-ChIP軟體,找出可能的 Motif。最後我們探討TR4 binding motif與致病基因之間的關係,推論出當 TR4出現異常時,會導致人類產生何種疾病。 [1-4]

1.利用 TR4之 ChIP-seq資料定位出 TR4在 DNA上結合的位置及調控的基因2.使用 MEME ChIP軟體,找出可能的 Motif3.探討 TR4 binding motif與致病基因

研究動機 為了確定 TR4在體內的結合位置,我們將找出 TR4後端位置和Motif,就能夠更進一步了解 TR4在生物體內扮演多重要的角色。

專題進行方式 前人建立的 TR4資料庫中, TR4結合部位之 DNA序列共約 100多萬筆,其中我們只選擇位於某個基因上游的資料,共 548,514筆。接著利用 blast的快速比對,分別將這些 ChIP-seq之序列找出在人類染色體上對應的位置,之後將其結果分別依照染色體編號寫入至檔案紀錄之。接著,再使用 MEME網站輸入 ChIP-seq序列,建立出 motif。最後我們探討較具意義的 TR4 binding motif、會影響的基因及可能致病的關聯性。 [5.6]專題製作流程步驟如下圖二所示。

3.1 TR4相關資料蒐集(http://140.126.132.67/phpadmin) 根據前人的研究,所建立的 TR4資料庫,挑選所有 ChIP-seq資料中只結合在某特定基因上游的 TR4結合序列,長度皆為 32bp。總數共548,514筆。3.2 撰寫程式A) Run_blast.php:用以執行 blast,比對 TR4 ChIP-seq序列在人類基因體 GRCh37p10[7]中出現在哪個染色體上的位置。將比對結果記錄在得到 result.txt。B)Seperate-dnaseq.php:將人類基因體序列 GRCh37p10檔案透過此程式,將序列依照染色體編號區分成出多個檔案,以利下個程式的執行。C) get_dnaseq.php: 將 ChIP-seq序列 (TR4結合部位 ) 對應在基因體上的序列,延長其範圍,從 32bp擴充至 100bp(如圖三 ) 。序列結果依照染色體編號分別記錄下來。 D) 最後得到儲存在 CHIP-result資料夾裡的各個以染色體區分的檔案chrN。每個檔案裡記錄 TR4結合在該染色體上的位置,以及其長度100bp的 ChIP序列為何。

3.3 MEME網站分析 ChIP序列(http://meme.nbcr.net/meme/cgi-bin/meme-chip.cgi) 根據 get_dnaseq.php中所獲得 ChIP序列 (100bp),經 Excel排序後,每個染色體裡各挑選前三十名 TR4影響最多的基因,每筆基因蒐集TR4結合序列成 FASTA格式,再利用 MEME網頁工具分析,建立成無間隔的序列 motif。 依照 motif的統計數據及出現次數,挑選出合適的結果。挑選的標準為 : 統計數據 E-value小於 10-50 、出現次數大於 10次。最後討論 TR4蛋白質結合 motif和可能影響之下游的致病基因。

圖二、專題步驟流程圖

圖三、 TR4結合部位擴展示意圖

圖一、孤核受體 TR4結合 DNA示意圖

主要成果

3.4 疾病探討我們透過以下兩個網頁搜尋疾病名稱,協助我們了解致病基因及相關知識。A) 衛生福利部國民健康署  (http://gene.hpa.gov.tw/index.php?mo=DiseasePaper&action=paper1_cate&cate=Set1)

B) 疾病資料庫 --罕見遺傳疾病一點通(http://www.genes-at-taiwan.com.tw/genehelp/dbIndex.asp)

 根據結果觀察,我們發現多個 TR4作用位置之序列呈現高度保留性,可被MEME-ChIP網站偵測出 motif。而這些 motife又與特定的罕見疾病有關。以下我們針對其中統計數據與出現次數較顯著的 motif以及影響下游重要的致病基因作結果討論。

A) LRPPRC: TR4可能調控此基因。此致病基因若發生基因異常,則會導致 Leigh症候群 (Leigh Syndrome,LS)的產生。根據我們的發現,這種 TR4結合位置,可能呈現的 motif型樣有兩種。 AGAGTTCTCGGTATTTTTACTAGTTGGCC以及 C[CT](2)T[CG]C[CG][AC]C[GA] [TA]CCTGGGA(如圖四)。

圖四、 Leigh Syndrome,LS MEME-ChIP Motif Overview。可能的 motif共兩種。B) PALB2:TR4的調控在該基因上游

若產生異常,將可能導致胰臟癌的發生(Fanconi anemia, complementation group N)。胰臟癌是一種「高度惡性的疾病」 , 有90%的病人無法以手術根除治療。死亡率極高,此疾病是在美國是排名第四大癌症。在我們的研究結果中顯示,其可能的 motif為 A[GC]TC[TA]T[TC][CG]A[GC]AG [AC][TG][TC][CG][CG][GC][GT]CT[AC]CTT[CT][CA]GGC、 CTCCTCCACTTCCGC TCCAGGTGGCCCACT(如圖五 ) 。

圖五、 Fanconi anemia, complementation group N MEME-ChIP Motif Overview。可能的 motif型樣共兩種。 C) SRP72: 此基因也可能受到 TR4

結合異常時而致病,其基因會導致骨髓造血缺陷 (Bone marrow failure, familial)。此遺傳疾病又稱「再生障礙貧血症」,其中一個引起的因素是先天性體質。根據我們的推測, TR4與此基因的上游位置結合,可能會調控此基因。若 TR4有先天性的異常,亦可能導致此疾病的發生。結果發現,此 TR4結合部位共有兩種可能的 motif:( 如圖六 ) GGCTGAAGACACTCCCAACTCGGCGACGCT 、 TAGCAATCATCGACTTCCTCCTCCTCTTGG

圖六、 Bone marrow failure, familial MEME-ChIP Motif Overview。可能的 motif型樣共兩種

評估與展望  除了前文所舉的例子之外,我們找出五個以上的致病基因,皆有 TR4在其

上游結合。根據我們的推測,這些致病基因產生異常後,會導致罕見疾病,有部分原因可能正是 TR4的調控出現。我們認為人類致病基因與 TR4調控變異是有相關的,並且找出 TR4結合部位的 motif。未來可以利用這些 motif進一步去搜尋基因體是否有其他位置符合這些 motif,進而深入了解這些遺傳疾病的發生原因,也了解 TR4的重要性。結語

 根據前人建立的 TR4資料庫,我們將 ChIP-seq資料中只結合在某特定基因上游的 TR4序列 32bp長度擴充至 100bp。本專題透過 PHP程式撰寫,定位出 TR4在 DNA上結合的位置及調控的基因,再進一步的探討 TR4異常時導致人類產生何種疾病,在這 548,514筆序列裡,我們找到五個以上罕見疾病可能與 TR4調控有關。銘謝

 製作專題期間,在董老師耐心指導下,使我們學會了 MEME-ChIP的使用。在製作過程中,有問題也有耐心的考驗,組員之間的互相互助,董老師總是耐心的教導著我們每一個步驟的重要,且指導我們如何學會使用軟體的方便與功能性。因為大家的高度互動,提升了彼此之間的感情,使我們在專題期間,有問題共同解決且不拖延任何一點能夠利用的時間,在專題裡不僅僅學到了本科系專業知識,也學到了團體之間的相處及互助。參考文獻

1. Du, L., et al., Evidence for orphan nuclear receptor TR4 in the etiology of Cushing disease. Proc Natl Acad Sci U S A, 2013. 110(21): p. 8555-60.2. Hwang, S.B., J.P. Burbach, and C. Chang, TR4 orphan receptor crosstalks to chicken ovalbumin upstream protein-transcription factor and thyroid hormone receptor to induce the transcriptional activity of the human immunodeficiency virus type 1 long-terminal repeat. Endocrine, 1998. 8(2): p. 169-75.3. Lee, Y.F., et al., Identification of direct repeat 4 as a positive regulatory element for the human TR4 orphan receptor. A modulator for the thyroid hormone target genes. J Biol Chem, 1997. 272(18): p. 12215-20.4. O'Geen, H., et al., Genome-wide binding of the orphan nuclear receptor TR4 suggests its general role in fundamental biological processes. BMC Genomics, 2010. 11: p. 689.5. Viens, A., et al., Use of protein biotinylation in vivo for chromatin immunoprecipitation. Anal Biochem, 2004. 325(1): p. 68-76.6. 紀郁祥 , 曾景宏 , 陳敬凱 , Discovering TR4 Nuclear Receptor Binding Information from ChIP-seq Data. 2012年第七屆專題成果報告 , 2012: p. 1-6.7. Genome Reference Consortium Human Build 37 patch release 10 (GRCh37.p10). 2012/08/31]; Available from: http://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.22/.

中華大學生物資訊學系系統開發專題報告專題編號: PROJ2013-BIOINFO-9907