biophysics and computational biology 生物物理與 計算生物 national central university...

28
Biophysics and Computational Biology 生生生生生生生生生 National Central University 國國國國國國國國國 國國國 Computational Biology Lab oratory 生生生生生生生 CBL@NCU 2002 January 24

Post on 19-Dec-2015

255 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

Biophysics and Computational Biology生物物理與計算生物

National Central University國立中央大學物理系

李弘謙Computational Biology Laboratory

計算生物實驗室CBL@NCU

2002 January 24

Page 2: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

There are 24 humanchromosomes

Human has 23 chromosomesThere are 24 humanchromosomes

人類有 二十四種 染色體

CBL@NCU

Page 3: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

基因體 (Genome) – 四種“字母”編成的生命書

基因體 (Genome) – 四種“字母”編成的 生命書

DNA - 兩條大分子串 形成的雙螺旋

四種大分子 - A,C,G,T

大分子串 - 四種“字母” 編成的文章

基因體 – 染色體所有的 DNA

CBL@NCU

Page 4: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

The Human Genome Project人類基因工程

• 1988 美國(國家衛生院與能源部)開始•目標 –給人類及其他重要生物基因體排序–發展其他相關科技–注意相關倫理、法律、社會問題

•預計 2005 年完成人類基因體排序

CBL@NCU

Page 5: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

排序完成的基因序列近年以爆炸性成長

(As of 2002 January 13)

Mill

ions

of

base

pai

rs o

f D

NA

Mill

ions

of

sequ

ence

s

排序完成的基因序列近年以爆炸性成長

CBL@NCU

Page 6: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

已完成排序的大基因體1995-2002 – About 35 bacterial genomes; 細菌 0.5-5 Mb; hundreds to 2000 genes1996 April – Yeast (Saccharomyces cerevisiae) 12 Mb, 5,500 genes 酵母1998 Dec. -Worm (Caenorhabditis elegans) 97 Mb, 19,000 genes 線蟲2000 March - Fly (Drosophila melanogaster) 137 Mb, 13,500 genes 果蠅2000 Dec. - Mustard (Arabidopsis thaliana) 125 Mb, 25,498 genes 芥末2000 June – Human (Homo sapiens) 1st rough draft2001 Feb 15/16 – Human, “working draft” 人類 3000 Mb, 35,000~40,000 genes

已完成排序的大基因體

CBL@NCU

Page 7: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

人類基因序列在 2001 年 2月完成排序初稿

CBL@NCU

Page 8: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

人類基因工程的公眾智慧財產原則

•智慧財產屬於公眾•工程中所取得的數據以及相關資訊 快速上載於互聯網的資料庫中•無約束供任何人下載

有電腦、能上網就可以作研究

CBL@NCU

Page 9: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

研究現代生命科學的三種方法

•in vivo 在活體裡•in vitro 在試管中•in silico 在電腦中

CBL@NCU

Page 10: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

在電腦中研究生命科學

“It is much easier to teach biology to people from a math, physics or computer-science background than to teach a biologist how to code well.” - Nature, February 15, 2001, p963

Life Science in silico

用電腦研究生命科學

[biology] 生物 + [computer-science] 電腦 + [math & physics] 數理

CBL@NCU

Page 11: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

•資訊 – 大量生命序列數據存在網路資料庫中– DNA 序列、 蛋白質序列–資料庫軟體、資料採礦、演算法

•物理 – 生命體就是一部巨大又非常複雜的機器–運作法則、系統模型

•計算–序列分析 (基因認識、分子演化等)–系統模擬計算 (蛋白質折疊、藥物設計等)

Bioinformatics 生物資訊Biophysics 生物物理

Computational Biology 計算生物

CBL@NCU

Page 12: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

• 生物演化– 分子演化、親緣樹、生物共同祖先

• 基因與疾病– 基因晶片、數理分析

• 蛋白質結構– 物理實驗、理論模型、計算模擬

• 蛋白質(群)組織與功能• 疾病預防及治療

– 基因改良、農作物• 藥物設計

– 蛋白質與大分子的結合

人類基因工程給我們什麼?

CBL@NCU

Page 13: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

• 只有極極少數的 DNA 序列能有生命表現• DNA 是演化的執行地• 演化是機會主義無頭雞的行走

– DNA 隨機突變、複製– 無孔不入– 多數走進死巷

• 演化的結果常常很奇怪– 例:眼睛

• 生命是基因載體,是演化的試驗場– 適者生存、物種淘汰

生命的目的是保護基因?

CBL@NCU

Page 14: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

視網膜

眼球的視神經在視網膜前拉向眼後時造成盲點奇怪的演化結果 :

CBL@NCU

Page 15: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

視網膜 受光管

光源

視網膜:電線向光光管背光

CBL@NCU

Page 16: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

比較蛋白質 / DNA 序列可找出基因 / 物種的親緣關係

簡化生命樹 人類

酵母

大腸桿菌人類 / 線蟲 / 果蠅核受體蛋白質親緣樹

CBL@NCU

真細菌

真核生物

古細菌

Page 17: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

真細菌 真核生物 古細菌

10億年前

20億年前

30億年前

40億年前WF Doolittle, Proc. Natl. Acad. Sci. USA, Vol. 94, pp. 12751–12753 (1997)

最早期的細胞演化

CBL@NCU

Page 18: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

細菌全基因體的“碎形”表示

CBL@NCU+北京理論物理所

以算核甘出現次數的方法將基因體圖像畫

每個基因體的“像”都不一樣

Page 19: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

有很多方法比較生命序列的異同有很多方法比較生命序列的異同

簡化生命樹紅:序列比對法 黑:寡核甘酸頻率法

真細菌

真核生物古細菌

CBL@NCU+內蒙古大學

Page 20: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

細菌食、色不分• 有性生物:進食與生殖過程

中 DNA 重組截然不同– 重組 : 有性生殖過程中,配子減數分裂時,雌、雄染色體DNA交換的動作

• 細菌的食物就是 DNA

• 有些細菌(如嗜血桿菌)用吃進的 DNA 與自己的 DNA 重組

• 有性生殖的原型?– 怎麼來的?– 如何演化成真的有性生殖?

Haemophilus influenzae 嗜血桿菌

CBL@NCU+ University of British Columbia

Page 21: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

蛋白質是最微妙微小的機器 • 生命的執行者

– 催化、繁衍、新陳代謝、結構、運動– 蛋白質本身的製造 – 演化競技場的競技者

• 直徑約五奈米( 5x10-9m )– 約為頭髮直徑的萬分之一

• 完全自動– 組裝、尋找受體、執行繁雜的任務– 完成任務後機器的拆散

• 每人每天製造及拆散成千上萬個不同的蛋白質• 蛋白質不正常導致疾病

CBL@NCU

Page 22: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

蛋白質是一條項鍊折成的機器• 項珠是 (20 種 )氨基酸• 有特定的形狀

– 做什麼事、長什麼樣

• 蛋白質折疊錯誤會導致疾病– 狂牛症、艾茲海墨症、帕肯森症

• 研究蛋白質折疊成形是物理與計算生物的大題目– 在 10億 flop/秒的 PC 上要算一百萬天

HIV逆轉錄脢(562個氨基酸 )

CBL@NCU

Page 23: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

用晶格模型研究蛋白質折疊

• 以離散的晶格代替連續的空間

• 以 n 色珠代表 20 種氨基酸

• 以“項鍊”代表蛋白質序列

• 電腦模擬折疊

未折疊氨基酸鍊

已折疊蛋白質

CBL@NCU+國家高速計算中心

Page 24: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

超大型分佈計算模擬蛋白質折疊

V. Pande, Stanford University

(利用許多 PC使用者的螢幕保護程式作計算)

CBL@NCU+ Stanford University

Page 25: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

DNA是不簡單的彈簧黎璧賢老師實驗室

外加力

相對長度延伸

CBL@NCU

Z- 型

S- 型

B- 型

B- 型

Z- 型

S- 型

Page 26: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

•細胞膜是雙磷脂層•表面像緊密的浮萍•與細胞外面交通的 管道由各種膜蛋白 質組成

陳方玉老師實驗室

細胞膜與膜蛋白質

Page 27: Biophysics and Computational Biology 生物物理與 計算生物 National Central University 國立中央大學物理系 李弘謙 Computational Biology Laboratory 計算生物實驗室

用 DNA 的熱運動來測軟物質的黏彈性

Laser tweezers

Wall

DNA Amplitude A(t)

Polymersphere

• 可以變化外加張力重複測量。實驗數據多,精準度可以提高。

• 可以分別分析不同尺度 (波長 )的黏彈性。

• 對各方向性質不同的材質 (如液晶 ),可以就指定方向測量。

陸駿逸老師實驗室