—— 揭开生命的奥秘 孙 啸 程 璐
DESCRIPTION
第七讲 人类基因组研究. —— 揭开生命的奥秘 孙 啸 程 璐. 人类基因组计划. HGP(Human Genome Projects) 1 、 HGP 简介 2 、 HGP 的主要任务 3 、 HGP 对人类的重要意义 4 、 HGP 进展与未来 5 、 我国对人类基因组计划的贡献 6 、 功能基因组学 7 、 基因组相关的伦理学问题 8 、 HGP 对生物信息学提出挑战. 1 、 HGP 简介. - PowerPoint PPT PresentationTRANSCRIPT
人类基因组计划HGP(Human Genome Projects)
1 、 HGP简介2 、 HGP的主要任务3 、 HGP对人类的重要意义4 、 HGP进展与未来5 、我国对人类基因组计划的贡献66 、、功能基因组学功能基因组学77 、、基因组相关的伦理学问题基因组相关的伦理学问题8 、 HGP对生物信息学提出挑战
1 、 HGP 简介• 人类基因组计划是由美国科学家于 1985 年率
先提出、于 1990 年正式启动的。美国、英国、法国、德国、日本和我国科学家共同参与了这一价值达 30 亿美元的人类基因组计划。这一计划旨在为 30 多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息 。
• 曼哈顿计划• 阿波罗计划
科学家的胆略科学家的胆略• 诺贝尔奖获得者 Renato Dulbecco 于 1986 年发
表短文《肿瘤研究的转折点:人类基因组测序》( Science, 231: 1055 - 1056 )。
• 文中指出:如果我们想更多地了解肿瘤,我们从现在起必须关注细胞的基因组。…… 从哪个物种着手努力?如果我们想理解人类肿瘤,那就应从人类开始。……人类肿瘤研究将因对 DNA 的详细知识而得到巨大推动。”
什么是基因组 (Genome)
• 基因组就是一个物种中所有基因的整体组成
• 人类基因组有两层意义:—— 遗传信息—— 遗传物质
• 从整体水平研究基因的存在、基因的结构与功能、基因之间的相互关系。
为什么选择人类的基因组进行研究?
• 人类是在“进化”历程上最高级的生物• 认识自身• 掌握生老病死规律• 疾病的诊断和治疗• 了解生命的起源
在人类基因组计划中,包括对五种生物基因组的研究:大肠杆菌、酵母、线虫、果蝇和小鼠,称之为人类的五种“模式生物”。
HGP 的诞生• 1984 年 12 月 Utah 州的 Alta,White R 受美国能源部的委托,主持召开了一
个小型会议,讨论 DNA 重组技术的发展及测定人类整个基因组的 DNA 序列的意义。
• 1985 年 6 月,在美国加州举行了一次会议,美国能源部提出了“人类基因组计划”的初步草案。
• 1986 年 6 月,在新墨西哥州讨论了这一计划的可行性。随后美国能源部宣布实施这一草案。
• 1987 年初,美国能源部与国家医学研究院( NIH )为“人类基因组计划”下拨了启动经费约 550万美元, 1987 年总额近 1.66 亿美元。同时,美国开始筹建人类基因组计划实验室。
• 1989 年美国成立“国家人类基因组研究中心”。诺贝尔奖金获得者J.Waston 出任第一任主任。
• 1990 年,历经 5 年辩论之后,美国国会批准美国的“人类基因组计划”于10 月 1 日正式启动。美国的人类基因组计划总体规划是:拟在 15 年内至少投入 30 亿美元,进行对人类全基因组的分析。
HGP 诞生过程中的质疑
• 计划的必要性问题• 计划的现实性问题• 科学研究领域的选择问题• 为什么不选择基因组小的或有经济意义的生物• 认为“制图”是在沙漠里建公路,“测序”是把“垃圾”分类,选择“模式动物”是拼凑“诺亚方舟”。
• 遗传图谱( genetic map )又称连锁图谱(linkage map) ,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于 1% )的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率, 1%的重组率称为 1cM )为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。
遗传图谱 - 孟德尔的“新生”
间期
前期 I
同源染色体形成配对
中期 I
晚期 I发生交换
前期 II中期 II
晚期 II末期 II
配子
遗传连锁图:通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离,一 般 用 厘 摩( cM ,即每次减数分裂的重组频率为 1% )表示。
物理图谱 - 路标与路轨
• 物理图谱( physical map )是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的 DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。
1998 年完成了具有 52,000 个序列标签位点 (STS) ,并覆盖人类基因组大部分区域的连续克隆系的物理图谱。
敲碎基因组,分析研究内容所处的染色体位置敲碎基因组,分析研究内容所处的染色体位置
细菌人工染色体(80~300 kb)酵母人工染色体(数百~ 2000 kb)
中心粒一对紧密相邻的标志
一对相邻较远的标志
染色体图
序列图谱 - 重中之重
• 随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。 DNA 序列分析技术是一个包括制备 DNA 片段化及碱基分析、 DNA 信息翻译的多阶段的过程。通过测序得到基因组的序列图谱
大规模测序基本策略大规模测序基本策略
逐个克隆法:对连续克隆系 中排定 的 BAC 克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)
全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国 Celera公司)
• 通过对进化不同阶段的生物体基因组序列的比较,发现基因组结构组成和功能调节的规律。
模式生物体的研究模式生物体的研究
利用酵母、线虫、果蝇、大肠杆菌斑马鱼、小鼠等模式生物体进行基因的剔除或转基因的研究,从而在整体水平认识基因的功能。
3 、 HGP 对人类的重要意义
HGP 对医学的影响– 发现新的致病基因– 发展一些复杂疾病的早期基因诊断方法,如“肿瘤
基因组解剖计划” – 通过基因治疗解决传统方法无法解决的疑难杂症– 疾病易感基因的识别及对风险人群进行生活方式、环境因子的干预
– 人类基因组多样性与个体化医学
所有的疾病,都可以说是基因病
“ 基因病”概念:– 基因相关论:所有疾病都与人类基因有关;– 基因修饰论:所有药物都是通过修饰基因本
身结构、改变基因的表达调控、影响基因产物的功能而起作用的;
– 基因的外调性;– 基因的多态性。
• 人类疾病相关的基因是人类基因组中结构和功能完整性至关重要的信息。
• 单基因病:" 定位克隆 " 和 " 定位候选克隆 " 的全新思路,导致了亨廷顿舞蹈病、遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。
• 多基因疾病:心血管疾病、肿瘤、糖尿病、神经
精神类疾病(老年性痴呆、精神分裂症)、自身免疫性疾病,是目前疾病基因研究的重点。
• 健康相关研究是人类基因组计划的重要组成部分,并于 1997 年相继提出了: " 肿瘤基因组解剖计划 "
“环境基因组学计划 "
HGP 对生物技术的影响
– 基因工程药物:分泌蛋白(多肽激素,生长因子,趋化因子,凝血和抗凝血因子等)及其受体;
– 诊断和研究试剂产业:基因和抗体试剂盒、诊断和研究用生物芯片、疾病和筛药模型;
– 对细胞、胚胎、组织工程的推动:胚胎和成
年期干细胞、克隆技术、器官再造。
• 生物的进化史,都刻写在各基因组的“天书”上– 草履虫是人的亲戚—— 13 亿年;– 人是由 300~ 400万年前的一种猴子进化来
的;– 人类第一次“走出非洲”—— 200万年的古猿;
– 人类的“夏娃”来自于非洲,距今 20万年——第二次“走出非洲”?
HGP 对生物进化研究的影响
4 、 HGP 进展与未来• 整个完成的时间提前到了 2003 年,比原计
划提前了两年。而原订于 2001 年完成的人类基因组的基本构图也提前一年,在 2000年 6 月 26 日由美国总统克林顿与英国首相布莱尔联合宣布完成,这一天也因此成为人类历史上“值得载入史册的一天”。
• 后基因组计划,即功能基因组计划的开始。
人类单倍体基因组人类单倍体基因组
含 30 亿 碱基对 (bp) 的 DNA 序列。 编码序列约占 3% ,非编码序列约占 97% 。 包括约 4 ~ 10 万个基因,分布于 22 条常染色体和
X 、 Y性染色体。
5 、我国对人类基因组计划的贡献• 1994 年,我国 HGP 在吴旻、强伯勤、陈竺、杨焕明的倡导下启动,最初由国家自然科学基金会和 863 高科技计划的支持下,先后启动了“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构和功能研究”;
• 1998 年在国家科技部的领导和牵线下, 1998 年在上海成立了南方基因中心;
• 1999 年在北京成立了北方人类基因组中心;• 1999 年 7 月在国际人类基因组注册,得到完成人类 3号
染色体短臂上一个约 30Mb区域的测序任务,该区域约占人类整个基因组的 1%。
国际人类基因组国际人类基因组测序任务分配情况测序任务分配情况
6/1-8/31/99No Center Region Size(Mb)
Actual K Genbank KrProjected Kr4/1-11/30/99
Proj Accum.Mr. 4/99-3/00
1 Sanger Centre 1,6,9,10,13,20,22,X 850 1300 941 4200 >12
2 WIBR (Clones from Wash U) 837 296 2900 8
3 Wash U 2,3,4,7,11,15,18,Y 900 865 559 2300 7.9
4 JGI 5,16,19 250 687 461 2100 6.4
5 Baylor 1,2,3,X 230 462 261 660 3.1
6 Riken 21,18,11q 160 136 195 520 2.1
7 IMB 8,21,X 50 180 32 180 1.5
8 Genoscope Most of 14 85 100 118 300 1.4
9 U. Wash (Olson)
10 Beijing 3p 30 12.5 12.5 >100 0.5
11 GTC (Smith) 10 50 5 150 0.45
12 MPIMG 17,21,X 6.9 40 12 40 0.3
13 GBF 21, reg of 9 6 50 0.3
14 Stanford (Davis) 8 23 137 0.29
15 Keio 2,6,8,22,21 30 11 75 110 0.23
16 U. Wash (Hood LAB) 14,15 2671 27 40 0.17
Total 2671Mb 4663Kr 2950Kr 13687Kr 32.64Mr
人类基因组 人类基因组 1%1% 测序计划测序计划• 1999 年 9 月 1 日:国际公共领域测序计划接纳中国,杨焕明教授领回任务;
• 1999 年 11 月 12 日:科技部中国生物工程开发中心、中科院生命科学和生物技术局、“ 863” 计划生物领域专家委员会召开“参加国际人类基因组计划并完成 1%基因组测序工作”专家讨论会,决定“ 863” 计划出资3000万元,中科院出资 1000万元;
• 1999 年 11 月 29 日:科技部下达对国家人类基因组北、南方研究中心和中国科学院遗传所拨款通知,中科院同时下达专项经费。
66 、功能基因组学、功能基因组学
• 基因组 DNA 测序:人类对自身基因组认识的第一步。
• 功能基因组学:从基因组信息与外界环境相互作用的高度,阐
明基因组的功能。• 功能基因组学的研究内容:
– 人类基因组 DNA 序列变异性研究– 基因组表达调控的研究– 模式生物体的研究– 生物信息学
基因组表达及调控的研究基因组表达及调控的研究
• 在全细胞的水平,识别所有基因组表达产物:– mRNA : c DNA 阵列– 蛋白质:二维电泳 — 质谱
• 研究生物大分子相互作用:阐明基因组表达在发育过程中的时、空的整体调控网络。
• 蛋白质组学:高通量解析蛋白质的高级结构,是连接基因组功能研究和新药开发的桥梁。
–特定基因检测
–突变检测
– 多态性分析
– 基因表达谱
基因芯片的应用
•生物信息学的工具•基因相关性研究•基因功能•药物设计和开发•潜在反义试剂开发•个体化医疗•身份识别•基因诊断•其他与生物有关的领域
有关问题• “ 基因是人类的共同财产”
VS “ 人类基因组实际上是个人的”
• 基因有无好坏之分? “致病基因” VS “ 必备基因”
• 致病基因携带者都是病人吗?
• 能不能用于优生? 这涉及种族问题
• 是否必须进行基因检查? 隐私问题
HGP伦理、法律和社会影响研究( 1 )利用和解释遗传信息时如何保护隐私和达到公正?
( 2 )如何处理“知情同意”等问题?( 3 )如何保护隐私?
原则• 防止“遗传歧视”• 保护个人和家庭基因隐私
基因专利问题
人类基因组 DNA 序列数据的自由共享• 人类基因组 DNA 序列是全人类的共同遗产,应该由全
人类所共享;• 对基因组基础数据的垄断,将给人类利益和科学发展带来不良后果;公共领域测序计划的贡献( 24 小时内释放序列数据)
基因专利• 新发现的基因是否可以申请专利?
– 被发现的基因序列,一旦经过分离或者纯化后就成为一种新产品
– 各国政府和主流科学界观点• 基因专利热潮已兴起
8 、 HGP 对生物信息学提出挑战 随着实验数据和可利用信息急剧增加,信息的管理和分析成为 HGP 的一项重要的工作
发现生物学规律,
解读生物遗传密码认识生命的本质
研究基因组数据之间的关系
分析现有的基因组数据
利用数学模型和人工智能技术
人类基因组多样性计划总目标人类基因组多样性计划总目标使用新技术研究基因组的遗传学,并结合历史使用新技术研究基因组的遗传学,并结合历史学、考古学和语言学等准确地定义世界上不同学、考古学和语言学等准确地定义世界上不同人群的起源。人群的起源。
意义:• 理解人类的进化史• 理解群体和个体间疾病易感性和其他生物学性状差异的遗传学基础
• 发展基于群体和个体遗传学特点的医学• 反对种族主义,维护世界和平
DNA 多态性
序列多态性 (SNPs – 单碱基多态性 )
同源染色体 5-GGTTTACACCTAA-
同源染色体 5-GTTTTAAACCGAA-
长度多态性 (VNTR - 可变的串联重复顺序 )
同源染色体 5-AATCAATCAATC-
同源染色体 5-
AATCAATCAATCAATCAATC--
DNA长度多态性分类
核心序列较长者(如大于 8bp )常称为小卫星DNA ,或称可变数目串联重复序列( VNTR )
核心序列较短者(如 2-5bp )常称为微卫星DNA ,或称短串联重复序列( STR )
可变数目串联重复 VNTR
• 遗传信息变异是所有基因组的共同特征。不同个体、群体在疾病易感性、对环境理、化、生、致病因子反应性和其他性状上的差别,都与基因组序列中的变异有关,这些变异最常见的形式是单核苷酸多态性( SNP )。
• 人类基因组中 SNP 的数目约为 3百万- 1千万。
单碱基多态性
亲子鉴定实例遗传标记 被控父亲 母亲 孩子 PI
TH01 9-10 9-10 9-10 1.8904VWA 17-17 16-18 16-17 3.3113FES 11-13 11-11 11-13 2.6882D19S400 12-12 12-13 12-13 2.0263D19S253 11-12 12-13 11-13 5.2521D8S1179 13-18 14-15 15-18 12.6263D21S1409 7-7 10-11 7-102.5157D21S2055 17-20 18-26 17-18 4.2315D5S818 7-9 8-10 8-9 2.3545D7S820 6-10 7-7 6-7 3.3324FGA 18-22 20-24 18-20 8.9278
累积父权指数 =2684954.3717 相对父权概率 〉 99.99%
烟头 STR分析
系统 检材 嫌疑人 1 嫌疑人 2 嫌疑人 3 嫌疑人 4
TH01 7-9 7-9 7-9 6-9 7-9
VWA 14-17 15-17 14-17 15-19 14-18
FES 11-12 12-13 11-12 10-11 10-12
• 3 个系统累积符合概率大于 99%
此案件 1997 年在华西医科大学法医学系鉴定
• 中华民族的人群• 56 个民族(汉族和 55 个正式确定的少数民族)
• 203 种语言,源于 6 个不同的语系(汉-藏、苗-瑶、侗傣、阿尔泰、南亚、南岛)
• 汉族占 93.6% ,少数民族大多数居住于边疆地区
我国人类基因组学研究我国人类基因组学研究
中国人群的遗传学关系• 主要成果:证实中国人群可分为南、北两大组,
两者之间有明显的基因融汇;提出了东亚人群可能起源于东南亚、而东亚现代智人与其他各大洲现代人群都起源于 10 - 20万年前 "走出非洲 " 的群体的观点。