基因组进化中的遗传学问题

87
1 基基基基基基基基 基基基 基基基 基基基基基基基基基基 Email: [email protected] 2011. 8.1. 基基

Upload: lucas-tillman

Post on 02-Jan-2016

81 views

Category:

Documents


0 download

DESCRIPTION

基因组进化中的遗传学问题. 陈建群 南京大学生命科学学院 Email: [email protected] 2011. 8.1. 银川. Outline. 一、进化生物学与遗传学简介 二、进化基因组学所关注的遗传学问题: 研究实例 1. 基因组中突变机制的研究 2. 基因组中密码子的排列规律及进化意义. 一、进化生物学与遗传学简介. 两门学科在起点上非常相近. 1859 年,达尔文发表了“ The Origin of Species” - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 基因组进化中的遗传学问题

1

基因组进化中的遗传学问题

陈建群南京大学生命科学学院

Email: [email protected]. 8.1. 银川

Page 2: 基因组进化中的遗传学问题

2

Outline

一、进化生物学与遗传学简介

二、进化基因组学所关注的遗传学问题: 研究实例 1. 基因组中突变机制的研究

2. 基因组中密码子的排列规律及进化意义

Page 3: 基因组进化中的遗传学问题

3

一、进化生物学与遗传学简介

Page 4: 基因组进化中的遗传学问题

4

1822-1884

1809-1882

两门学科在起点上非常相近1859 年,达尔文发表了“ The Origin of Species”

1865 年,孟德尔发表了 “ Experiments on Plant Hybridization”

Page 5: 基因组进化中的遗传学问题

5

• 进化生物学主要研究:地球上生命的历史是怎样的?什么原因导致了物种的进化和多样性?The origin of species from a common descent and descent of species, as well as their change, multiplication and diversity over time.

• 遗传学主要研究:生命信息是如何代代相传并在性状上有所差异的?genes, heredity, and variation in living organisms

研究主体的研究尺度有所不同

研究尺度

不同物种

单个物种

Page 6: 基因组进化中的遗传学问题

6

群体遗传学将经典遗传学与进化生物学联系到一起

1900-1915 ,孟德尔遗传学说与物种进化间的相关性存在很大争议 群体思想:

一个生物群体是由同种而又互有差异的个体所组成 它是达尔文全部理论 ( 特别是自然选择学说 ) 的前提 但达尔文不知道什么是群体的遗传结构——黑匣子 孟德尔遗传理论的重新发现使该黑匣子逐渐被打开

1918-1930s ,群体遗传学的发展使得人们认识到遗传与进化间的联系,进化论和遗传学走向结合。

两门学科在发展过程中密切相关 (1)

Page 7: 基因组进化中的遗传学问题

7

群体遗传学将经典遗传学与进化生物学联系到一起

1930s-1940s ,现代综合论 (The Modern Synthesis)形成,包含了达尔文的大部分思想,并从遗传结构的角度给群体以新的诠释——进化生物学的里程碑

进化是渐变的过程 所有的进化现象都可用合适的遗传机制来解释 自然群体中存在的遗传多样性是进化的重要条件 自然选择和遗传漂变都是引起性状演变的机制

但遗传多样性的物质基础究竟是什么呢?当时尚不明确 !

两门学科在发展过程中密切相关 (2)

Page 8: 基因组进化中的遗传学问题

8

分子遗传学1910, Morgan发现基因 ( 遗传信息的传递单位 ) 位于染色体上1944,肺炎球菌的转化实验1952,噬菌体感染实验1953, DNA双螺旋结构被发现随后, DNA能以自身为模板合成 mRNA(基因表达 )mRNA被翻译为蛋白质,其中涉及到遗传密码子 ( 基因翻译 )有丝分裂与减数分裂,遗传突变与重组

分子进化学不同物种间同源基因的 DNA序列与蛋白质序列有所变化进化的分子基础:突变,重组,转座中性学说 vs. 选择学说

分子时代的来临

证明 DNA 是真正的遗传物质

Page 9: 基因组进化中的遗传学问题

9

基因组时代:人类基因组计划的启动和完成( 1989-2003) 之前:先确定表型,再定位基因,研究其遗传模式 ( 正向 ) 之后:先确定候选基因,再研究其功能 ( 反向 )

进化基因组学: 比较不同物种、不同种群或不同个体的基因组差异 发现新的功能基因或结构,理解功能的遗传学基础 探讨功能变化和物种进化的机制

基因组时代的来临

Page 10: 基因组进化中的遗传学问题

10

1. 基因组的结构、大小、组织形式怎样变化?越高等的生物,其基因组结构越合理吗?

2. 新功能基因如何产生?基因重复,外显子重排,逆转座,

可移动原件插入,水平基因转移3. 突变是一切进化的基础,它的产生机制有哪些?

碱基突变,插入 / 缺失突变, 复制错配,修复错配,物理化学因素…4. 基因表达的调控机制如何演化,对物种的适应能力有何影响?

转录水平的差异,密码子使用,蛋白质合成效率的差异5. 还有更多……

进化基因组学所关注的遗传学问题

Page 11: 基因组进化中的遗传学问题

11

Outline

一、进化生物学与遗传学简介

二、进化基因组学所关注的遗传学问题: 研究实例 1. 基因组中突变机制的研究

2. 基因组中密码子的排列规律及进化意义

Page 12: 基因组进化中的遗传学问题

12

The basis of phenotypes

表型差异的基础The cause of genetic diseases引起遗传性疾病

The basis of selection and evolution

选择与进化的基础

为什么要研究突变?

Page 13: 基因组进化中的遗传学问题

13

突变的基本类型

Single nucleotide polymorphism (SNP)

Insertion/deletion (s) (Indel)

Structural variation, Copy number variation

Q: 丰富的遗传变异从何而来?( 变异的来源并非十分清楚 )

Page 14: 基因组进化中的遗传学问题

14

一、 SNP 与 Indel 的相关性研究(真核)

二、 SNP-Indel 相关性在原核生物中的验证

三、 Indel 在拟南芥基因组中的分布模式

四、 Insertion DNA 的杂合状态促进异源重组

Tian et al. 2008 Nature; Sun et al. 2008 Mol.Bio.Evo; Zhang et al. 2008 MGG; Zhu et al. 2009 Mol.Bio.Evo;

Chen et al.2009 Mol.Bio.Evo

基因组中突变机制的研究

Page 15: 基因组进化中的遗传学问题

15

现象:在很多真核基因组中, SNP 与 Indel 突变会发生在一起。

问题: Indel 与 SNP 有无相关性 ? 如果有相关性,其原因是什么 ?

Relationship between Indel and selection? Relationship between Indel and variation hotspot? Indel effect on nucleotide divergence?

一、 SNP 与 Indel 突变的相关性研究

Page 16: 基因组进化中的遗传学问题

16

材料与方法:

Page 17: 基因组进化中的遗传学问题

17

全基因组比对 : Human vs. chimpanzee, Human vs. rhesus macaque, mouse vs. rat, rice Nipponbare vs. 93-11, yeast S288C vs. RM11-1a, yeast S288C vs. YJM789

3318 Mb 高质量序列排序,标记 indel ,将其周围区域划分为多个窗口,统计每个窗口内单碱基突变的累积量 Nucleotide divergence (D)

考察 D 值与 d1 、 d2 两个变量的关系: d1 :每个窗口到其最近 indel 的距离 d2 :两个 indel 间的距离反映出区域内 indel 的密度

材料与方法

Page 18: 基因组进化中的遗传学问题

18http://www.natureprotocols.com/2008/09/22/aligndb_a_computational_protoc.php

Page 19: 基因组进化中的遗传学问题

19

Result and discussion

Relationship Indel-SNP

Distance to indel

indel density

Indel size

Page 20: 基因组进化中的遗传学问题

20

Distance to indels

Indel density

Page 21: 基因组进化中的遗传学问题

21

每个窗口到其最近 indel 的距离 d1

当 d1=0 , indel 所在的窗口( 100bp )单碱基突变累积的 D 值 >0.015;随着距离的增加,每个窗口内单碱基突变数逐渐下降。

与 indel 距离越近, SNP 数越高。

结果 1 :距离影响 SNP 累积

Page 22: 基因组进化中的遗传学问题

22

The effect of distance to indel on D

Nucleotide divergence (D) as a function of distance to nearest indel (d1) and reciprocal of indel density (d2)

以 indel

为中心的突变率的分

Page 23: 基因组进化中的遗传学问题

23

两个 indel 间的距离近时 (200-399bp),窗口内的单碱基突变累积的 D 值就高; 随着 indel 间的距离增加 (indel 密度下降 ) ,同一窗口 ( 如 L0或 R0) 的 D 值也越来越低。indel 的密度与SNP 数正相关

——叠加效应 ?

结果 2 : Indel 密度影响 SNP 累积

Page 24: 基因组进化中的遗传学问题

24

结果 3 : Indel 大小影响 SNP 累积

Indel 越大, SNP 越高

Page 25: 基因组进化中的遗传学问题

25

结果: 1. 与 Indel 越近, SNP 越高 ;2. Indel 越密集, SNP 越高 ;3. Indel 越大, SNP 越高 .

Relationship Indel-SNP

Distance to Indel

Indel Density

Indel Size

Page 26: 基因组进化中的遗传学问题

26

What did we observe? • The distance to indel, indel density & indel size

affect nucleotide divergence (D) • Indel was the center of the distribution of mutation-rate• Each indel independently affected the surrounding areas.

Page 27: 基因组进化中的遗传学问题

27

Cause of the mutation-rate change?

potential factors1. Selection2. Regional-difference of

DNA突变热点区域内 SNP 与 Indel 各

自发生,即 Indel 并不影响其周围 SNP 的积累

Our hypotheses 3. Indel induced mutationindel 的存在会通过某种机制影响

周围 SNP 的积累

Indel is a MARKER of mutation hotspots

Indel is a CAUSE of mutation

Page 28: 基因组进化中的遗传学问题

28

1. selection?(1) Coding(a) and non-coding(b) regions

ba

Page 29: 基因组进化中的遗传学问题

29

Co

din

g(a) an

d n

on

-cod

ing

(b) reg

ion

s

Page 30: 基因组进化中的遗传学问题

30

(2) Intron regions of chr1(Human vs. Chimp)

Conclusion 1:Selection is not the cause.

Page 31: 基因组进化中的遗传学问题

31

2. Regional-difference of DNA

1) Is Indel a MARKER of mutation hotspots?

2) The effect of paralogous sequences and transposons

3) The effect of recombination

Page 32: 基因组进化中的遗传学问题

32

1) Is indel a MARKER of a mutable segment or a CAUSE of mutation?

• Indel is a MARKER of mutation hotspots------Regional-difference

• Indel is a CAUSE of mutation------Indel induced mutation

• There is a simple 3-species test which can discriminate between MARKER vs. CAUSE

Page 33: 基因组进化中的遗传学问题

33

Polarize indels

The gaps in two-sequence alignments

Nip.

93-11

Deletion in Nip.?Insertion in 93-11?

How to judge ?

O. nivara

Deletion in Nip.

Page 34: 基因组进化中的遗传学问题

34

Polarize indels

The gaps in two-sequence alignments

Nip.

93-11

Insertion in 93-11

O. nivara

Page 35: 基因组进化中的遗传学问题

35

Polarize base substitutions

The substitutions in two-sequence alignments

Mutation in Nip. or 93-11?

Nip. C G A T T G C C T G G A G C A A G G G G G C

93-11 C G A T T G C A T G G A G T A A G G G G G C

Page 36: 基因组进化中的遗传学问题

36

O. nivara C G A T T G C C T G G A G T A A G G G G G C

Nip. C G A T T G C C T G G A G C A A G G G G G C

93-11 C G A T T G C A T G G A G T A A G G G G G C

Polarize base substitutions

The substitutions in two-sequence alignments

Mutation in 93-11

Mutation in Nip.

Page 37: 基因组进化中的遗传学问题

37

3-species test

区域差异

Indel 诱变

Page 38: 基因组进化中的遗传学问题

38

Results of 3-species test

Page 39: 基因组进化中的遗传学问题

39

如何验证两种假说?Three-lineage test 预测:• Regional difference : Dindel = Dnon-indel

• Indel-induced mutation :Dindel > Dnon-indel

T G C T G A T T C T G C G A

Reference sequence

Seq1

Seq2

A C C A G T T T C A G A C T

A C T A C T C A A A C A C T

Dindel 1 Dindel 3

Dindel 2Dno-indel 1

Dno-indel 2

Dno-indel 3

Page 40: 基因组进化中的遗传学问题

40

在所有 4 个数据集中,都发现:

Dindel > Dnon-indel

(indel 周围150bp 区域内)

此结果支持 Indel诱变假说

结果 4 : Dindel > Dnon-indel

Page 41: 基因组进化中的遗传学问题

41

Paralogous sequences and transposons

旁系同源序列与转座子的影响:在 Paralog 和 TE( transposon element )含量不同的区域,以 indel为中心的突变率的分布的模式都存在,且比较一致。说明这一现象不是由 Paralog 或 TE造成的假象。

Page 42: 基因组进化中的遗传学问题

42

可能的机制

Indel 的存在会使杂合子在减数分裂时期形成未配对的loop (一个等位基因含有 indel ,另一个没有 indel )。从机制上讲,这种杂合状态可能成为细胞中突变修复机制的作用位点,从而在修复过程中引入更多的单碱基突变。

Indel 周围:颠换频率 增高转换频率 减弱

Tian et al. 2008 Nature

Page 43: 基因组进化中的遗传学问题

43

Estimating the relative increase计算突变效应 : indel 对周围序列有 5 倍的诱变作用

Page 44: 基因组进化中的遗传学问题

44

The effect of recombination

在不同重组率的区域, indel 诱变的作用都存在,并且这一效应与重组率不相关。重组有可能影响 indel 诱变,但决不是这一现象的原因。

Page 45: 基因组进化中的遗传学问题

45

Possible molecular mechanism

杂合体内同源染色体配对Homologous chromosome pair in heterozygotes

DNA 修复系统的目标Target of DNA repairing system

改变 DNA 双链中的张力Change the tension of DNA strands

Page 46: 基因组进化中的遗传学问题

46

The intrinsic factor of genomic mutation

• 外因: radiation, chemical, UV• 内因: indel

Page 47: 基因组进化中的遗传学问题

47

Conclusion

• 以 indel 为中心的突变率的分布• 在杂合体中 indel 对于其周围序列有诱变作用

,突变率大约会升高 5 倍• Indel 诱变是一种普遍的突变机制,并且在创

造遗传差异中起着重要作用

Page 48: 基因组进化中的遗传学问题

48

Page 49: 基因组进化中的遗传学问题

49

二、 Indel-SNP 相关性在原核生物中的验证

数据:73 bacterial species, 262 genomes

至少两个 strain 被完全测序(以便相互比较)

结果: Indel 与 SNP 同样相关

2 : Indel 越密集, SNP 越高1 : Indel 周围 SNP 高

Page 50: 基因组进化中的遗传学问题

50

Three-lineage Test: 验证两种假说

结果 3 :Dindel > Dnon-indel

同样支持 Indel 诱变假说

Zhu et al. 2009 MBE26 species (至少 3 strains )182 comparisons

Page 51: 基因组进化中的遗传学问题

51

三、 Indel 在拟南芥基因组中的分布模式

问题:真核生物和原核生物的数据都表明 Indel 会在其周围诱变SNP ,那么, Indel 是如何产生的?(多种机制,非常复杂) 重复序列导致的 slippage mutation ; 特殊的错误率高的 DNA 复制酶; 重组; 转座子插入 ……首先研究 Indel 在基因组中的分布 : 拟南芥 Columbia (Col) & Landsberg erecta (Ler): 92.1 MbPopulation dataset: 1215 loci in 96 accessions, 63.7 Mb

Page 52: 基因组进化中的遗传学问题

52

绝大多数( ~86% )的 Indel 长度在 1-10 bp

绝大多数( ~83% )的 Indel 位于非编码区

Page 53: 基因组进化中的遗传学问题

53

Indel 的出现频率

Indel 在 repeat 区的出现频率更高 , 长度也更长Col vs. Ler:

Repeat region : 2.24 indels/kb ; 17.08bp/indel

Non-repeat region: 1.01 indels/kb ; 6.65bp/indel

有研究认为: repeat 区域更容易发生复制错误或遭受双链断裂,产生 Indel 。 (McDonald et al. 2011)

Indel 在 population data 中出现的频率更高Col vs. Ler data: 1.01 indels/kb

96 accession data : 4.48 indels/kb

说明不同个体间产生的 indel ,大多数不会在群体中被固定下来。

Zhang et al. 2008 MGG

Page 54: 基因组进化中的遗传学问题

54

四、 Insertion DNA 的杂合状态促进异源重组

问题:

基因组中广泛存在的 Indel 在减数分裂时是否会促进异源重组?

单拷贝 双拷贝

Page 55: 基因组进化中的遗传学问题

55

实验方法

1. 载体构建

利用前人已经建立的重组结构 (Gherbi et al. 2001)

Page 56: 基因组进化中的遗传学问题

56

3. 检测重组率

共筛选大于 6million F2 个体如果重组发生, GUS 基因恢复,植物体将显色 (图 b , c )

实验方法

2. 转基因,得到纯合子和杂合子

转基因株系自交,得到纯合子

与野生型( Col )杂交,得到转基因片段的 Insertion 杂合子

Page 57: 基因组进化中的遗传学问题

57

结果: Insertion 杂合子的重组率提高 13 倍

说明 Indel 所在位置在减数分裂时会成为重组的热点

有丝分裂时,杂合子比纯合子的重组率要低( 1/5 – 1/3 ) Sun et al. 2008 MBE

Page 58: 基因组进化中的遗传学问题

58

实例研究 1 总结

1. 真核与原核数据都证明:基因组中 Indel 与 SNP 的发生相关;离 Indel 越近, Indel 越密集, SNP 越多。

2. Three-lineage 比较法发现:存在 Indel 的分支积累了更多的 SNP ,从而支持 Indel 诱变假说。

3. Indel 本身在基因组中的发生机制较为复杂,拟南芥数据表明 Indel 在 repeat 区域发生的几率较高。

4. Insertion DNA 在未配对的杂合状态下,能够提高减数分裂时的重组率( 10 倍以上)。

5. 分子隔离……

Page 59: 基因组进化中的遗传学问题

59

实例研究 1 总结: Indel 存在特殊遗传行为——非对称特性: 突变效应、重组效应、隔离效应

Insertion

Flank Flank

Flank Flank

1. 造成更多 DNA 复制和修复错误 造成局部突变热点(高突变率) (Nature 2008)

2. 自由配对 促进非等位重组 (Mol Bio Evol 2008)

3. 对周围序列的张力 干扰重组,造成局部遗传隔离

Page 60: 基因组进化中的遗传学问题

60

Outline

一、进化生物学与遗传学简介

二、进化基因组学所关注的遗传学问题: 研究实例 1. 基因组中突变机制的研究

2. 基因组中密码子的排列规律及进化意义

Page 61: 基因组进化中的遗传学问题

61

基因组中密码子的排列规律及进化意义

基因表达(蛋白合成)的调控机制涉及到两个层次:

转录

翻译

遗传密码

Page 62: 基因组进化中的遗传学问题

62

背景:密码子具有简并性

• 61 种密码子一共对应 20 种不同的氨基酸• 18 个氨基酸可以被 2个或 2 个以上的密码子编码

Q: 不同基因组或基因,如何选择密码子?

Page 63: 基因组进化中的遗传学问题

63

背景:密码子偏性

定义: 基因或基因组中同义密码子使用频率上的不均匀性关于密码子偏性的一些认知: 1 )很多物种(尤其是生长迅速的单细胞生物)会拥有一套最优密码子; 2 )相对于低表达基因,这些物种的高表达基因会更多地使用最优密码子,缩短翻译过程中 tRNA识别这些密码子所花费的时间或能量,提高蛋白质合成的效率 3 )最优密码子的确定与其基因组中的 tRNA成分及相应识别能力相关;但很少有研究关注:同义密码子在基因中的排列规律

Page 64: 基因组进化中的遗传学问题

64

基因中,同义密码子随机排列吗?

有序排列

随机排列

Q :同义密码子的排列有规律吗?

假设基因 A 中含有 14 个 Gly 密码子,分布在基因中不同的位置

GGG

GGA

GGC

GGT

每个位置上的 Gly将如何选择它的密码子?

414 种可能

Page 65: 基因组进化中的遗传学问题

65

Q :如何统计偏离随机选择的程度?

基因 A , 14 个 Gly 密码子,分布在基因中不同的位置

这里可以统计密码子对的频率:GGA-GGA: 2/13; GGA-GGT: 2/13GGT-GGT: 2/13; GGT-GGC: 2/13GGC-GGC: 4/13; GGC-GGA: 1/13其他 10 种配对为 0

Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly

GGA GGA GGA GGT GGT GGC GGC GGC GGA GGT GGT GGC GGC GGC

依此统计所有基因,得到所有配对的实际发生频率

所有配对的预期发生频率 = 相应两个密码子发生频率的乘积。

偏离程度 = (实际频率 -预期频率) /标准差( SD )

大于 3 SD 为极显著

Page 66: 基因组进化中的遗传学问题

66

共 tRNA 的密码子排列时倾向在一起

Cannarozzi G et al. 2010 Cell

真核中发现的规律

Page 67: 基因组进化中的遗传学问题

67

共 tRNA 的密码子排列在一起,有助于提高蛋白质合成效率

为什么会这样有序排列?

酵母中 GFP 基因表达实验表明:有序排列的GFP 基因整体合成效率比随机排列的 GFP 基因高 ~30% 。

Cannarozzi G et al. 2010 Cell

Page 68: 基因组进化中的遗传学问题

68

Stapulionis and Deutscher 1995 PNAS

60 S

40 S

提出的假说: tRNA 回收使用模型

与传统认知的差别:

核糖体上,氨基酸转移后的 tRNA 并不彻底离开,而是很快投入下一次的使用

Cannarozzi G et al. 2010 Cell

Page 69: 基因组进化中的遗传学问题

69Qiu et al. 2004

那么, Bacteria 呢?

Page 70: 基因组进化中的遗传学问题

70Grosjean H et al. 2010

原核 vs. 真核:不同的 tRNA 组成与识别策略

Page 71: 基因组进化中的遗传学问题

71

Questions?

1 )原核生物中密码子的排列有规律吗?

2 )其模式与真核相同吗?

3 )不同物种间,是否有差异?

Page 72: 基因组进化中的遗传学问题

72

首先,以 E. coli 基因组作分析:

• Precise information about CDS.• Well annotated• mRNA expressivity data• Sufficiently investigated tRNA gene

copies• and modification patterns

研究对象

Page 73: 基因组进化中的遗传学问题

73

Ala GCC GCT GCA GCG tRNA copy OptimalGCC 12.68 -2.95 -5.69 -4.63 Ala-GGC 2

GCT -0.55 9.91 3.29 -8.99 Ala-AGC NP

GCA -5.89 5.69 9.23 -6.15 Ala-TGC 3

GCG -6.19 -8.85 -4.67 15.56 Ala-CGC NP GCG

Gly GGC GGT GGA GGG tRNA copy OptimalGGC 9.87 -0.78 -9.22 -5.56 Gly-GCC 4 GGC

GGT -2.46 9.44 -3.74 -6.28 Gly-ACC NP

GGA -9.16 -4.20 15.47 6.75 Gly-TCC 1

GGG -3.33 -8.41 6.25 11.63 Gly-CCC 1

Pro CCC CCT CCA CCG tRNA copy OptimalCCC 11.31 6.73 -0.612 -9.00 Pro-GGG 1CCT 5.68 7.22 4.65 -9.77 Pro-AGG NPCCA 0.25 3.72 7.04 -6.58 Pro-TGG 2

CCG -9.10 -9.882 -6.77 15.59 Pro-CGG 1 CCG

Thr ACC ACT ACA ACG tRNA copy OptimalACC 12.43 -3.29 -13.23 -2.50 Thr-GGT 2 ACC

ACT -2.42 8.75 3.024 -6.01 Thr-AGT NP

ACA -13.82 3.35 19.51 0.25 Thr-TGT 1

ACG -2.65 -5.23 -0.37 7.57 Thr-CGT 1

Val GTC GTT GTA GTG tRNA copy OptimalGTC 3.80 -1.02 -1.25 -1.23 Val-GAC 2

GTT -0.38 10.32 5.77 -12.18 Val-AAC NP

GTA -3.03 6.03 4.66 -5.76 Val-TAC 5

GTG -0.61 -11.87 -6.90 15.15 Val-CAC NP GTG

Ile ATC ATT ATA tRNA copy Optimal

ATC 14.39 -6.77 -14.33 Ile-GAT 3 ATC

ATT -6.29 7.26 -3.00 Ile-AAT NP

ATA -15.16 -2.04 37.43 Ile-TAT NP

密码子对:

实际发生频率 vs. 预期频率

偏离 3 SD 以上为极显著

Page 74: 基因组进化中的遗传学问题

74

E. Coli 中密码子配对模式同一密码子常常前后配对出现,其频率极显著地超过预期频率:如对 Ala丙氨酸而言, GCC-GCC , GCT-GCT , GCA-GCA , GCG-GCG 都趋同排列。

第一优势配对(共 59对)

同时,一些氨基酸中 A 和 T 结尾或 A 和 G 结尾的密码子也常常前后配对出现,其频率也高于预期频率:如Ala丙氨酸中的 GCA-GCT, GCT-GCA 。

第二优势配对(共 22对)

Page 75: 基因组进化中的遗传学问题

75

1 )原核生物中密码子的排列有规律吗?

确实存在规律 (第一优势配对;第二优势配对)

Answer to Question 1

Page 76: 基因组进化中的遗传学问题

76

配对模式与 tRNA 的相关性

按照共 tRNA模式,会期望 C-T 或 A-G 配对更多出现。实际上则是 A-T 配对更多的出现。

按照共 tRNA模式,各种配对出现的频率应该相同。实际上则是有优势配对出现。

Page 77: 基因组进化中的遗传学问题

77

Answer to Question2

2 )其模式与真核相同吗?在 E. coli 中,同义密码子配对模式显然

不符合共 tRNA 的模式。

其它的细菌呢?

Page 78: 基因组进化中的遗传学问题

78

1) 第一优势配对 : 59 identical codon pairs

2) 第二优势配对: 22 A-T 或 A-G pairs

ⅱ) A- and G-ending codon pairs from

Arg2, Arg4, Gly and Leu2

ⅰ) A- and T-ending codon pairs

Ala, Ile, Leu4, Pro, Ser4, Thr, and Val

773 genomes :同义密码子配对模式

为什么会存在第二优势配对呢?

Page 79: 基因组进化中的遗传学问题

79

tRNA 的摆动修饰与配对方式可能相关

(1) 5-carboxymethoxyuridine modification of wobble uridine (cmo5U) in six families:

Ala, Leu4, Pro, Ser4, Thr, and Val

tRNAs with wobble-U exhibit an equally high affinity with A- and T-ending codons. (Ran and Higgs. 2010. Mol Biol Evol)

(2) 5-methylaminomethyluridine modification of wobble-U (mnm5U) in three families:

Arg2, Gly and Leu2

Page 80: 基因组进化中的遗传学问题

80

>70% 物种的基因组具备很有序的密码子排列

510个物种中,第一优势配对超过 50%( 30/59)有373种

说明:很多细菌基因组中,采用了提高密码子排序性的策略,来提高翻译效率。

Page 81: 基因组进化中的遗传学问题

81

但有些物种的密码子排列有序程度较低

Mycobacterium leprae 麻风分支杆菌(寄生病菌)密码子有序排列程度远远低于其近缘物种。

Rickettsia sp.

立克次氏体属(胞内寄生)该属中绝大多数物种,在密码子排列上有序程度极低

Page 82: 基因组进化中的遗传学问题

82

Answer to Question3

3 )不同物种间,这种模式是否有差异?

大多数物种基因组都存在类似的密码子有序排列模式; 少数(寄生)物种密码子排列的有序性较低。可能发生在一个属中的个别物种,也有可能发生在整个属的物种中。

Page 83: 基因组进化中的遗传学问题

83

细菌基因组中确实存在同义密码子对有序排列现象。 相同密码子常常前后配对出现,其实际发生频率显著偏

离其期望频率; 另外,一些 A , T 或 A , G 结尾的同义密码子也会配对出现,其频率也常 显著偏离期望值,这可能与相应 tRNA经摆动修饰后识别密码子的能力有关。

虽然大多数细菌物种具备较高水平的密码子有序性排列,也有些细菌物种放弃了这一策略对基因表达效率的调控,这应该与这些物种的生活方式相关(如寄生)。

实例研究 2 总结

Shao et al. Submitted

Page 84: 基因组进化中的遗传学问题

84

1. 基因组的结构、大小、组织形式怎样变化?越高等的生物,其基因组结构越合理吗?

2. 新功能基因如何产生?基因重复,外显子重排,逆转座,

可移动原件插入,水平基因转移3. 突变是一切进化的基础,它的产生机制有哪些?

碱基突变,插入 / 缺失突变, 复制错配,修复错配,物理化学因素…4. 基因表达的调控机制如何演化,对物种的适应能力有何影响?

转录水平的差异,密码子使用,蛋白质合成效率的差异5. 还有更多……

回顾 : 进化基因组学所关注的遗传学问题

Page 85: 基因组进化中的遗传学问题

85

结束语

1. 生物信息从有序向无序变化的能力超乎想象( Indel 诱发更多的变异)

2. 生物信息从无序向有序变化的能力也超乎想象(密码子有序排列提高蛋白合成效率)

Page 86: 基因组进化中的遗传学问题

86

研究人员 D.Tian (田大成 ) , Q. Wang(王强 ),

L.Zhu (朱柳村 ) , X.Sun(孙小芹 ),

B.Wang (王斌 ) , Z.Shao(邵珠卿 ),

Hitoshi Araki, Joy Bergelson , Martin Kreitman, Thomas Nagylaki

Page 87: 基因组进化中的遗传学问题

87

谢谢!谢谢!