基因组学与医学 genomics and medicine 吴坤陆 [email protected] 分子生物学研究中心
TRANSCRIPT
第 一 节基因组学 (Genomics)
一、基因组学概念及范畴
二、结构基因组学三、功能基因组学
四、比较基因组学
一、基因组学概念及范畴
(一)基因组学的提出
基因组 (genome)
泛指一个有生命体、病毒或细胞器的全部遗传物质;在真核生物,基因组是指一套染色体(单倍体) DNA 。
1. 病毒基因组
DNA 病毒
RNA 病毒
多数为双链 (ds) 、环状或线性
多数为单链 (ss) 、线性
噬菌体 phiX174 1977 , Sanger
单链环状 DNA 病毒
5386nt5386nt
2500 氨基酸
乙型肝炎病毒( HBV )
聚合酶
HBsAg
HBcAg
开环部分双链 DNA 病毒
乙型肝炎病毒基因组乙型肝炎病毒基因组-- 开环部分双链 DNA
聚合酶
HBsAg
HBcAg
.
禽流感病毒 (H5N1) avian influenza A virus
单链 RNA 病毒
8 节段 -ssRNA
血凝素( HA )神经氨酸酶( N)
人类免疫缺陷病毒 (HIV)( human Immunodeficiency virus )
逆转录病毒(单链 RNA 病毒)
RNA
2. 原核生物基因组
细菌染色体DNA
质粒 DNA
以大肠杆菌( Escherichia coli )为例
类核( nucleoid ):细菌染色体在 细胞内形成的一个致密区域
大肠杆菌细胞结构
nucleoid
质粒 plasmid
由一条环状双链 DNA 分子组成, 通常只有一个 DNA 复制起点。
大肠杆菌染色体 DNA
大肠杆菌
4000K
3000K
2000K
1000K
0OriC
TerC
4639221bp
质粒 DNA
质粒是存在于细菌染色体外的,具有自主复制能力的环状双链 DNA 分子;大小为几 kb 。
3. 真核生物基因组
染色体DNA 线粒体 DNA
1 2 3 4 5 6 7 8 9 10 11 12
13 14 15 16 17 18 19 20 21 22 X Y
人类染色体基因组
人类线粒体基因组
2 个 rRNA 基因和 22 个 tRNA 基因, 13 个编码蛋白质基因,编码序列占 93% 。
基因组学 (genomics)
就是发展和应用 DNA 制图、测序新技术以及计算机程序,分析生命体(包括人类)全部基因组结构及功能。
(二)基因组学的概念
基因组学包括 3 个不同的亚领域
亚领域 内容
结构基因组学 整个基因组的 遗传制图、物理制图、 DNA 测序 功能基因组学 认识、分析整个基因组所包含的 基因、非基因序列及其功能
比较基因组学 比较不同物种的整个基因组,增 强 对 各 个 基 因 组 功 能 及 发 育 相 关性的认识
人类基因组计划:( Human genome project,HGP )
HGP 的内容就是制作高分辨率的人类遗传图和物理图,最终完成人类和其它重要模式生物全部基因组 DNA 序列测定,因此 HGP 属于结构基因组学范畴。
Initial sequencing and analysis of the human genome
International Human Genome Sequencing Consortium
NATURE VOL 409 15 FEBRUARY 2001 860-921
The Sequence of the Human Genome
16 FEBRUARY 2001 SCIENCE VOL 291 1304-1351
Celera Genomics
人类染色体 DNA 大小
Chr. Mb
(一)物理制图
(二)遗传制图
(三)基因组 DNA 序列测定
(四)创建计算机分析管理系统
HGP 包括以下研究内容
绘制物理图谱( physical map ): 利用已知序列的 DNA 片段为基因组分区,位点距离用 bp 表示。
作图标志称为序列标志位点( sequence tagged sites,STSs )。
(一)物理制图( physical mapping )
克隆载体:
Cosmid (粘粒)
YAC (酵母人工染色体)
BAC (细菌人工染色体)
Y 号
绘制遗传图谱( genetic map ):
利用人类基因组中自然存在的一些特殊位点作为遗传标志,确定标志位点在一条染色体 DNA 上的线性排列顺序,标志位点间的距离用 cM 表示 。
(二)遗传制图( genetic mapping )
遗传标志: RFLP (限制性片段长度多态性) VNTR (可变数目串联重复序列) STR (短串联重复序列) SNP (单核苷酸多态性)
A
E
D
b
A
E
d
B
A
E
d
b
D
B
A
E
两对等位基因之间重组互换的频率即遗传距离
10cM 10%
1. 遗传图谱( genetic map )
Chromosome Male Female
1 1.12 1.762 0.78 1.403 0.86 1.304 0.67 1.40
物理图距离( Mb )与遗传学距离 ( cM ) 的对应关系
cM / Mb
(三)基因组 DNA 序列测定人类基因组的全部核苷酸 (3X109) 排列顺序
DNA 测序基本步骤
• 限制性内切酶将大片段 DNA切成小的片段• 小片段插入(连接)到测序载体中• 用测序仪对小片段 DNA 测序• 超级计算机分析测序结果,进行拼接得到 一致序列
DNA
切下的片段插入(连接)到载体中
叠连群测序后得出一致序列
大量的重叠片段
gtatgtacatttttaaaatctcattttaaaaggccagttaaaatgg
gtatgtacatttttaa
ttttaaaatctcattttaa
tttaaaaggccagtta
agttaaaatgg
• 大肠杆菌 (Escherichia coli)•酿酒酵母 (Saccharomyces cerevisiae)•拟南芥 (Arabidopsis thaliana)•秀丽小杆线虫 (Caenorhabditis elegans)•果蝇 (Drosophila melanogaster)• 小鼠 (Mus musculus)
模 式 生 物
(四)创建计算机分析管理系统
主要的人类基因组数据库
欧洲生物信息学研究所EMBL: http://www.embl.org/
美国国家生物技术信息中心NCBI: http://www.ncbi.nih.gov/
日本国立遗传学研究所DDBJ: http://www.ddbj.nig.ac.jp/
HGP 主要任务及内容 主要任务 内容
物理制图 确定染色体上诸如限制性内切( physical mapping ) 核酸酶识别位点,或序列标志 位点( STSs )等的位置图。 遗传制图 确定标志位点在一条染色体( physical mapping ) 上的线性排列顺序。标志位点 间的图距以遗传学距离表示, 单位为分摩尔根( cM )
基因组 DNA 序列 测定人类 24 条染色体的、由 3X109 个核苷酸组成的全部 DNA 序列,绘制人类基因组图谱。
通过 HGP获得的广泛基因组信息组成了结构基因组学的基本内容,是开展功能基因组学的研究的基础;
同时为详尽研究每一个单基因遗传病提供“平台”,并将成为复杂的多基因遗传病研究的发端。
HGP 的意义
完成一个生物体全部基因组测序后即进入后基因组测序阶段——详尽分析序列,描述基因组所有基因的功能,包括研究基因的表达及其调控模式,这就是功能基因组学。
三、功能基因组学 ( functional genomics )
(一)鉴定 DNA 序列中的基因
(二)同源搜索设计基因功能
(三)实验性设计基因功能
(四)描述基因表达模式
主要具体内容包括以下方面
(一)鉴定 DNA 序列中的基因
对基因组序列进行注释,包括鉴定和描述推测的基因、非基因序列及其功能。
同源基因在进化中来自共同的祖先,通过核苷酸序列或氨基酸序列的同源性比较推测基因组内相似功能的基因。
(二)同源搜索设计基因功能
(三)实验性设计基因功能
对基因进行缺失或剔除,观察表型变化推测基因功能。
(四)描述基因表达模式
转录组 (transcriptome): 一个细胞内的一套 mRNA 转录物,包含了某一环境条件、某一生命阶段、某一生理或病理 (功能 )状态下,生命体的细胞或组织所表达的基因种类和水平。 这一研究领域叫转录组学(transcriptomics) 。
转录组学的研究方法-DNA芯片技术
蛋白质组 (proteom) : 一个细胞内的全套蛋白质,反映了特殊阶段、环境、状态下细胞或组织在翻译水平的蛋白质的表达谱。 这一研究领域叫蛋白质组学(proteomics) 。
双向电泳( two dimension electrophoresis,2-DE ): 蛋白质具有等电点和分子量的特异性,将蛋白质混合物在电荷(等电聚焦, IEF )和 分 子 量 ( 变 性 聚 丙 烯 酰 胺 凝 胶 电泳, SDS-PAGE )两个水平上进行分离。
蛋白质组学的研究方法
Moleculars
Ions
生物质谱技术 Mass Spectrometry : 通过测定样品离子的质荷比( m/z )
来进行成分和结构分析。
功能基因组学研究策略及主要内容鉴定 ( 注释 )基因 : 通过“ORF搜索”,发现理论性蛋白 质编码序列
分析基因功能 : 利用计算机进行同源搜索,根据已 知序列、进化相关性,发现重要的 蛋白质功能域。也可对 DNA 序列进 行突变或剔除后,结合功能、表型 变化的实验鉴定基因功能
描述基因表达模式 : 采用 DNA微点阵进行整体基因表达 谱 -- 转录组分析;采用蛋白质或 多肽微点阵、改进的双向电泳结 合飞行质谱技术分析蛋白质表达 谱 ---- 蛋白质组分析。
四、比较基因组学
比较基因组学 (comparative
genomics)涉及比较不同物种的整个基因组,
以便深入理解每个基因组的功能和进化关系。
进化树(系统发生树)
• “微型人”• 生理系统与人非常相似• 90% 的基因与人类同源
小鼠
(Mus musculus)
基因共线性
The Relation between Genomics and Medicine
第 二 节
基因组学与医学关系
医学相关问题
结构基因组学
功能基因组学
蛋白质组学
基因组计划的应用
疾病的分子机制:病原 ,病理和预后, 疾病的易感性, 遗传与环境的影响。
分子诊断:疾病的预测 , 药物耐受性, 疾病的分型。
分子治疗:药物靶 , 基因治疗
一、基因病的概念
人类疾病大致分为三类:(一)单基因病 (二)多基因病 (三)获得性基因病
基因病:以基因组学为基础,从疾病 和健康的角度考虑,人类疾 病大多直接或间接地与基因 相关。
二、疾病相关基因的鉴定
(一)检测人类基因变异或突变
(二)疾病时基因组差异表达分析
(三)染色体制图定位及疾病相关基因克隆
(一)检测人类基因变异或突变
单链构象多态性 (SSCP) 、
限制性片段长度多态性(RFLP) ,
变性梯度电泳 (DGGE) ,
单核苷酸多态性( SNPs )
等位型 1
等位型 2
单核苷酸多态性( single nucleotide polymorphism, SNP )
在人类两个个体之间大约每500—1000bp就有一个碱基差异,如果一个碱基位置发生的变异在上%以上的人群存在,这个位点就被定义为 SNP 位点。
寡核苷酸杂交分析SNP 和等位基因特异寡核苷酸杂交
(二)疾病时基因组差异表达分析
某一疾病或综合征基因组与正常基因组表达差异的比较。
DNA芯片检测的差异表达谱
(三)染色体制图定位及疾病相关基因克隆
疾病基因定位:
染色体原位杂交、染色体畸形分析、 连锁分析。
疾病相关基因的克隆:
已掌握疾病相关基因或及其产物的确切信息;已掌握与疾病可能相关的基因预测资料;对疾病相关基因毫无所知。
疾病相关基因克隆策略: 功能基因克隆 候选基因克隆 定位基因克隆 定位 -候选基因克隆。
三、基因组学与肿瘤病因学
致癌因子引起 DNA损伤,可引起突变,如果关键基因功能改变,导致细胞异常增殖而发生肿瘤。
鉴定隐性癌基因(肿瘤抑制基因)和显性癌基因。
制图策略,鉴定标志物。
肿瘤基因组解剖工程,基因重排常导致癌基因失活。
http://cgap.nci.nih.gov/