—— 揭开生命的奥秘 孙 啸 程 璐

85
—— 揭揭揭揭揭揭揭

Upload: cosmo

Post on 06-Jan-2016

153 views

Category:

Documents


0 download

DESCRIPTION

第七讲 人类基因组研究. —— 揭开生命的奥秘 孙 啸 程 璐. 人类基因组计划. HGP(Human Genome Projects) 1 、 HGP 简介 2 、 HGP 的主要任务 3 、 HGP 对人类的重要意义 4 、 HGP 进展与未来 5 、 我国对人类基因组计划的贡献 6 、 功能基因组学 7 、 基因组相关的伦理学问题 8 、 HGP 对生物信息学提出挑战. 1 、 HGP 简介. - PowerPoint PPT Presentation

TRANSCRIPT

—— 揭开生命的奥秘孙 啸

程 璐

人类基因组计划HGP(Human Genome Projects)

1 、 HGP简介2 、 HGP的主要任务3 、 HGP对人类的重要意义4 、 HGP进展与未来5 、我国对人类基因组计划的贡献66 、、功能基因组学功能基因组学77 、、基因组相关的伦理学问题基因组相关的伦理学问题8 、 HGP对生物信息学提出挑战

1 、 HGP 简介• 人类基因组计划是由美国科学家于 1985 年率

先提出、于 1990 年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一价值达 30 亿美元的人类基因组计划。这一计划旨在为 30 多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息 。

• 曼哈顿计划• 阿波罗计划

科学家的胆略科学家的胆略• 诺贝尔奖获得者 Renato Dulbecco 于 1986 年发

表短文《肿瘤研究的转折点:人类基因组测序》( Science, 231: 1055 - 1056 )。

• 文中指出:如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。…… 从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对 DNA 的详细知识而得到巨大推动。”

什么是基因组 (Genome)

• 基因组就是一个物种中所有基因的整体组成

• 人类基因组有两层意义:—— 遗传信息—— 遗传物质

• 从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。

人类染色体

为什么选择人类的基因组进行研究?

• 人类是在“进化”历程上最高级的生物• 认识自身• 掌握生老病死规律• 疾病的诊断和治疗• 了解生命的起源

在人类基因组计划中,包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。

HGP 的诞生• 1984 年 12 月 Utah 州的 Alta,White R 受美国能源部的委托,主持召开了一

个小型会议,讨论 DNA 重组技术的发展及测定人类整个基因组的 DNA 序列的意义。

• 1985 年 6 月,在美国加州举行了一次会议,美国能源部提出了“人类基因组计划”的初步草案。

• 1986 年 6 月,在新墨西哥州讨论了这一计划的可行性。随后美国能源部宣布实施这一草案。

• 1987 年初,美国能源部与国家医学研究院( NIH )为“人类基因组计划”下拨了启动经费约 550万美元, 1987 年总额近 1.66 亿美元。同时,美国开始筹建人类基因组计划实验室。    

• 1989 年美国成立“国家人类基因组研究中心”。诺贝尔奖金获得者J.Waston 出任第一任主任。

• 1990 年,历经 5 年辩论之后,美国国会批准美国的“人类基因组计划”于10 月 1 日正式启动。美国的人类基因组计划总体规划是:拟在 15 年内至少投入 30 亿美元,进行对人类全基因组的分析。

HGP 诞生过程中的质疑

• 计划的必要性问题• 计划的现实性问题• 科学研究领域的选择问题• 为什么不选择基因组小的或有经济意义的生物• 认为“制图”是在沙漠里建公路,“测序”是把“垃圾”分类,选择“模式动物”是拼凑“诺亚方舟”。

HGP 的目的

• 解码生命• 了解生命的起源• 了解生命体生长发育的规律• 认识种属之间和个体之间存在差异的起因•认识疾病产生的机制以及长寿与衰老等生命现象•为疾病的诊治提供科学依据。

2 、 HGP 的主要任务

• 遗传图谱

• 物理图谱

• 序列图谱

• 转录图谱

• 遗传图谱( genetic map )又称连锁图谱(linkage map) ,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于 1% )的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率, 1%的重组率称为 1cM )为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。

遗传图谱 - 孟德尔的“新生”

间期

前期 I

同源染色体形成配对

中期 I

晚期 I发生交换

前期 II中期 II

晚期 II末期 II

配子

遗传连锁图:通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离,一 般 用 厘 摩( cM ,即每次减数分裂的重组频率为 1% )表示。

物理图谱 - 路标与路轨

• 物理图谱( physical map )是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的 DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。

1998 年完成了具有 52,000 个序列标签位点 (STS) ,并覆盖人类基因组大部分区域的连续克隆系的物理图谱。

敲碎基因组,分析研究内容所处的染色体位置敲碎基因组,分析研究内容所处的染色体位置

细菌人工染色体(80~300 kb)酵母人工染色体(数百~ 2000 kb)

中心粒一对紧密相邻的标志

一对相邻较远的标志

染色体图

基因转录图谱 - 生命的乐谱

• 转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。

对基因转录表达产物 mRNA 互补的 cDNA (其片段称为表达序列标签, EST )进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)。

序列图谱 - 重中之重

• 随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。 DNA 序列分析技术是一个包括制备 DNA 片段化及碱基分析、 DNA 信息翻译的多阶段的过程。通过测序得到基因组的序列图谱

大规模基因组测序大规模基因组测序

Megabace 测 序仪 3700 测 序

大规模测序基本策略大规模测序基本策略

逐个克隆法:对连续克隆系 中排定 的 BAC 克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)

全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国 Celera公司)

运用计算机软件进行序列拼接运用计算机软件进行序列拼接

• 通过对进化不同阶段的生物体基因组序列的比较,发现基因组结构组成和功能调节的规律。

模式生物体的研究模式生物体的研究

利用酵母、线虫、果蝇、大肠杆菌斑马鱼、小鼠等模式生物体进行基因的剔除或转基因的研究,从而在整体水平认识基因的功能。

酵母

大肠杆菌

果蝇

线虫

小鼠

3 、 HGP 对人类的重要意义

HGP 对医学的影响– 发现新的致病基因– 发展一些复杂疾病的早期基因诊断方法,如“肿瘤

基因组解剖计划” – 通过基因治疗解决传统方法无法解决的疑难杂症– 疾病易感基因的识别及对风险人群进行生活方式、环境因子的干预

– 人类基因组多样性与个体化医学

我爸爸给你爸

爸开过同样的

药!

这就是遗传!

所有的疾病,都可以说是基因病

“ 基因病”概念:– 基因相关论:所有疾病都与人类基因有关;– 基因修饰论:所有药物都是通过修饰基因本

身结构、改变基因的表达调控、影响基因产物的功能而起作用的;

– 基因的外调性;– 基因的多态性。

• 人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。

• 单基因病:" 定位克隆 " 和 " 定位候选克隆 " 的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。

通过定位克隆技术寻找疾病基因的过程

• 多基因疾病:心血管疾病、肿瘤、糖尿病、神经

精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病,是目前疾病基因研究的重点。

• 健康相关研究是人类基因组计划的重要组成部分,并于 1997 年相继提出了: " 肿瘤基因组解剖计划 "

“环境基因组学计划 "

HGP 对生物技术的影响

– 基因工程药物:分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体;

– 诊断和研究试剂产业:基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型;

– 对细胞、胚胎、组织工程的推动:胚胎和成

年期干细胞、克隆技术、器官再造。

HGP 对制药业的影响

–筛选新药和药物的靶点,分析药理过程;

– 进行药物设计,对基因蛋白产物的高级结构分析、预测、模拟药物作用“口袋”

– 个体化的药物治疗:药物基因组学

基因组学、生物信息学与新药研制

未来的药物研究过程将是基于生物信息知识挖掘的过程

数据处理和关联分析

发现药物作用对象

确定靶目标分子

针对靶目标进行合理的

药物设计

HGP 对社会经济的重要影响

– 生物产业与信息产业是一个国家的两大经济支柱

– 发现新功能基因的社会和经济效益– 转基因食品– 转基因药物(如减肥药,增高药)

• 生物的进化史,都刻写在各基因组的“天书”上– 草履虫是人的亲戚—— 13 亿年;– 人是由 300~ 400万年前的一种猴子进化来

的;– 人类第一次“走出非洲”—— 200万年的古猿;

– 人类的“夏娃”来自于非洲,距今 20万年——第二次“走出非洲”?

HGP 对生物进化研究的影响

HGP带来的负面作用

• 侏罗纪公园不只是科幻故事• 种族选择性灭绝性生物武器• 基因专利战• 基因资源的掠夺战• 基因与个人隐私

DNA Report

我这辈子没戏了!

个人隐私!

基因注定论?

4 、 HGP 进展与未来• 整个完成的时间提前到了 2003 年,比原计

划提前了两年。而原订于 2001 年完成的人类基因组的基本构图也提前一年,在 2000年 6 月 26 日由美国总统克林顿与英国首相布莱尔联合宣布完成,这一天也因此成为人类历史上“值得载入史册的一天”。

• 后基因组计划,即功能基因组计划的开始。   

人类单倍体基因组人类单倍体基因组

含 30 亿 碱基对 (bp) 的 DNA 序列。 编码序列约占 3% ,非编码序列约占 97% 。 包括约 4 ~ 10 万个基因,分布于 22 条常染色体和

X 、 Y性染色体。

5 、我国对人类基因组计划的贡献• 1994 年,我国 HGP 在吴旻、强伯勤、陈竺、杨焕明的倡导下启动,最初由国家自然科学基金会和 863 高科技计划的支持下,先后启动了“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”;

• 1998 年在国家科技部的领导和牵线下, 1998 年在上海成立了南方基因中心;

• 1999 年在北京成立了北方人类基因组中心;• 1999 年 7 月在国际人类基因组注册,得到完成人类 3号

染色体短臂上一个约 30Mb区域的测序任务,该区域约占人类整个基因组的 1%。

国际人类基因组国际人类基因组测序任务分配情况测序任务分配情况

6/1-8/31/99No Center Region Size(Mb)

Actual K Genbank KrProjected Kr4/1-11/30/99

Proj Accum.Mr. 4/99-3/00

1 Sanger Centre 1,6,9,10,13,20,22,X 850 1300 941 4200 >12

2 WIBR (Clones from Wash U) 837 296 2900 8

3 Wash U 2,3,4,7,11,15,18,Y 900 865 559 2300 7.9

4 JGI 5,16,19 250 687 461 2100 6.4

5 Baylor 1,2,3,X 230 462 261 660 3.1

6 Riken 21,18,11q 160 136 195 520 2.1

7 IMB 8,21,X 50 180 32 180 1.5

8 Genoscope Most of 14 85 100 118 300 1.4

9 U. Wash (Olson)

10 Beijing 3p 30 12.5 12.5 >100 0.5

11 GTC (Smith) 10 50 5 150 0.45

12 MPIMG 17,21,X 6.9 40 12 40 0.3

13 GBF 21, reg of 9 6 50 0.3

14 Stanford (Davis) 8 23 137 0.29

15 Keio 2,6,8,22,21 30 11 75 110 0.23

16 U. Wash (Hood LAB) 14,15 2671 27 40 0.17

Total 2671Mb 4663Kr 2950Kr 13687Kr 32.64Mr

人类基因组 人类基因组 1%1% 测序计划测序计划• 1999 年 9 月 1 日:国际公共领域测序计划接纳中国,杨焕明教授领回任务;

• 1999 年 11 月 12 日:科技部中国生物工程开发中心、中科院生命科学和生物技术局、“ 863” 计划生物领域专家委员会召开“参加国际人类基因组计划并完成 1%基因组测序工作”专家讨论会,决定“ 863” 计划出资3000万元,中科院出资 1000万元;

• 1999 年 11 月 29 日:科技部下达对国家人类基因组北、南方研究中心和中国科学院遗传所拨款通知,中科院同时下达专项经费。

遗传病基因克隆重大突破遗传病基因克隆重大突破

夏家辉教授实验室夏家辉教授实验室19981998年克隆了高频耳聋疾病基因年克隆了高频耳聋疾病基因

20012001年上海和北京科学家发现年上海和北京科学家发现遗传性乳光牙本质遗传性乳光牙本质 IIII 型基因型基因

又一次成功!

—— 水稻基因研究

66 、功能基因组学、功能基因组学

• 基因组 DNA 测序:人类对自身基因组认识的第一步。

• 功能基因组学:从基因组信息与外界环境相互作用的高度,阐

明基因组的功能。• 功能基因组学的研究内容:

– 人类基因组 DNA 序列变异性研究– 基因组表达调控的研究– 模式生物体的研究– 生物信息学

基因组表达及调控的研究基因组表达及调控的研究

• 在全细胞的水平,识别所有基因组表达产物:– mRNA : c DNA 阵列– 蛋白质:二维电泳 — 质谱

• 研究生物大分子相互作用:阐明基因组表达在发育过程中的时、空的整体调控网络。

• 蛋白质组学:高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。

基因芯片

基因芯片示意

人类基因组芯片 (Genetic Files)

美国总统克林顿在 1998年 10 月对全国的演讲中指出 :“ 未来十二年 , 基因芯片将为我们一生中的疾病预防指点迷津”。

–特定基因检测

–突变检测

– 多态性分析

– 基因表达谱

基因芯片的应用

•生物信息学的工具•基因相关性研究•基因功能•药物设计和开发•潜在反义试剂开发•个体化医疗•身份识别•基因诊断•其他与生物有关的领域

二二维维电电泳泳图图

77 、基因组相关的伦理学问题、基因组相关的伦理学问题

要不是你的基因告了密,

我们本可以录用你。

有关问题• “ 基因是人类的共同财产”

VS “ 人类基因组实际上是个人的”

• 基因有无好坏之分? “致病基因” VS “ 必备基因”

• 致病基因携带者都是病人吗?

• 能不能用于优生? 这涉及种族问题

• 是否必须进行基因检查? 隐私问题

HGP伦理、法律和社会影响研究( 1 )利用和解释遗传信息时如何保护隐私和达到公正?

( 2 )如何处理“知情同意”等问题?( 3 )如何保护隐私?

原则• 防止“遗传歧视”• 保护个人和家庭基因隐私

基因专利问题

人类基因组 DNA 序列数据的自由共享• 人类基因组 DNA 序列是全人类的共同遗产,应该由全

人类所共享;• 对基因组基础数据的垄断,将给人类利益和科学发展带来不良后果;公共领域测序计划的贡献( 24 小时内释放序列数据)

基因专利• 新发现的基因是否可以申请专利?

– 被发现的基因序列,一旦经过分离或者纯化后就成为一种新产品

– 各国政府和主流科学界观点• 基因专利热潮已兴起

8 、 HGP 对生物信息学提出挑战 随着实验数据和可利用信息急剧增加,信息的管理和分析成为 HGP 的一项重要的工作

发现生物学规律,

解读生物遗传密码认识生命的本质

研究基因组数据之间的关系

分析现有的基因组数据

利用数学模型和人工智能技术

人类基因组多态性及其应用

• 基因组与环境相互作用• 基因多态性或突变的产生总是与环境的作用分不开的• 研究环境因素对人体健康的影响 —— 个体易感性

现代人群的不均一性传统人群和民族的划分

体质学特征语言文化历史背景其他特征

问题:现代人群的起源?人群间的相互关系?人群间差别的生物医学意义和遗传学基础?

人类基因组多样性计划人类基因组多样性计划

人类基因组多样性计划总目标人类基因组多样性计划总目标使用新技术研究基因组的遗传学,并结合历史使用新技术研究基因组的遗传学,并结合历史学、考古学和语言学等准确地定义世界上不同学、考古学和语言学等准确地定义世界上不同人群的起源。人群的起源。

意义:• 理解人类的进化史• 理解群体和个体间疾病易感性和其他生物学性状差异的遗传学基础

• 发展基于群体和个体遗传学特点的医学• 反对种族主义,维护世界和平

DNA 多态性

序列多态性 (SNPs – 单碱基多态性 )

同源染色体 5-GGTTTACACCTAA-

同源染色体 5-GTTTTAAACCGAA-

长度多态性 (VNTR - 可变的串联重复顺序 )

同源染色体 5-AATCAATCAATC-

同源染色体 5-

AATCAATCAATCAATCAATC--

DNA长度多态性分类

核心序列较长者(如大于 8bp )常称为小卫星DNA ,或称可变数目串联重复序列( VNTR )

核心序列较短者(如 2-5bp )常称为微卫星DNA ,或称短串联重复序列( STR )

可变数目串联重复 VNTR

微卫星多态性

• 遗传信息变异是所有基因组的共同特征。不同个体、群体在疾病易感性、对环境理、化、生、致病因子反应性和其他性状上的差别,都与基因组序列中的变异有关,这些变异最常见的形式是单核苷酸多态性( SNP )。

• 人类基因组中 SNP 的数目约为 3百万- 1千万。

单碱基多态性

人类遗传多态性的意义

• 与性状相关;• 与疾病相关,可用于预测发病风险;• 个体医学发展的基础;• 可作为遗传标志,用于疾病连锁诊断;• 作为个人身份识别标识用于法医学。

药物基因组学药物基因组学

大部分药物代谢酶有遗传多态性

遗传性状

遗传多态性在身份识别方面的应用

• 公安司法系统——罪犯及受害人的身份识别 及亲 子鉴定;

• 部队 —— 伤亡士兵的身份识别;

• 保安 —— 个人 DNA 身份证,用于人员识别;

Jeffreys 和 DNA 指纹

1985 年Jeffreys

应用 RFLP

进行亲子鉴定 ,创建DNA 指纹分析方法

何为 RFLP?

限制性片段长度多态性(Restriction Fragment Length Polymorphism, RFLP)

何为 DNA 指纹?

用一种或几种限制性内切酶切割基因组DNA ,用探针杂交并放射自显影。

DNA 指纹用于罪犯识别 DNA 指纹用于亲子鉴定

90 91 92 93 94 95 96

DNA 指纹向微卫星

(STR ,短的串联重复区域 ) 过渡

VNTR用于个体识别的原理

为什么 STR 可用于个人识别?

小李 老刘 张三

2-3 3-3 2-4

STR 用于亲子鉴定原理

父 子 母

2-3 3-4 2-4

亲子鉴定的 D8S384分型 被控男 子 母 对照 母 子 被控男 对照

7-9 5-7 5-8 5-10 6-11 8-11 7 9

亲子鉴定实例遗传标记 被控父亲 母亲 孩子 PI

TH01 9-10 9-10 9-10 1.8904VWA 17-17 16-18 16-17 3.3113FES 11-13 11-11 11-13 2.6882D19S400 12-12 12-13 12-13 2.0263D19S253 11-12 12-13 11-13 5.2521D8S1179 13-18 14-15 15-18 12.6263D21S1409 7-7 10-11 7-102.5157D21S2055 17-20 18-26 17-18 4.2315D5S818 7-9 8-10 8-9 2.3545D7S820 6-10 7-7 6-7 3.3324FGA 18-22 20-24 18-20 8.9278

累积父权指数 =2684954.3717 相对父权概率 〉 99.99%

烟头 STR分析

系统 检材 嫌疑人 1 嫌疑人 2 嫌疑人 3 嫌疑人 4

TH01 7-9 7-9 7-9 6-9 7-9

VWA 14-17 15-17 14-17 15-19 14-18

FES 11-12 12-13 11-12 10-11 10-12

• 3 个系统累积符合概率大于 99%

此案件 1997 年在华西医科大学法医学系鉴定

• 中华民族的人群• 56 个民族(汉族和 55 个正式确定的少数民族)

• 203 种语言,源于 6 个不同的语系(汉-藏、苗-瑶、侗傣、阿尔泰、南亚、南岛)

• 汉族占 93.6% ,少数民族大多数居住于边疆地区

我国人类基因组学研究我国人类基因组学研究

中国人群的遗传学关系

中国人群的遗传学关系• 主要成果:证实中国人群可分为南、北两大组,

两者之间有明显的基因融汇;提出了东亚人群可能起源于东南亚、而东亚现代智人与其他各大洲现代人群都起源于 10 - 20万年前 "走出非洲 " 的群体的观点。