第六讲 分 学 概念...

75
中科院研究生物理有机化学课程,2011年10月 第六讲 第六讲 概念 概念 子力概念和方子力概念和方授课教师 王任小 授课教师 王任小 研究员 研究员 授课教师王任小 授课教师王任小 研究员 研究员 中国科学院上海有机化学研究所 中国科学院上海有机化学研究所 中国科学院上海有机化学研究所 中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, CAS Shanghai Institute of Organic Chemistry, CAS

Upload: others

Post on 03-Nov-2019

16 views

Category:

Documents


0 download

TRANSCRIPT

中科院研究生物理有机化学课程,2011年10月

第六讲第六讲分 学 概念 法分 学 概念 法分子力学的概念和方法分子力学的概念和方法

授课教师 王任小授课教师 王任小 研究员研究员授课教师:王任小授课教师:王任小 研究员研究员

中国科学院上海有机化学研究所中国科学院上海有机化学研究所中国科学院上海有机化学研究所中国科学院上海有机化学研究所Shanghai Institute of Organic Chemistry, CASShanghai Institute of Organic Chemistry, CAS

授课提纲授课提纲

一.分子力场的概念 (chapter 2 6).分子力场的概念 (chapter 2.6)

力场能量函数的构成

简 简化的分子力场

构象分析方法二.构象分析方法

结构优化方法

构象采样方法

构象聚类方法 构象聚类方法

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 2

参考教材参考教材

Eric V. Anslyn, Dennis A. Dougherty, Modern Ph i l O i Ch i t U i it S iPhysical Organic Chemistry, University Science Books, Sausalito, California, 2006.

补充参考教材补充参考教材:Andrew R. Leach, Molecular Modeling: Principles and Applications 2nd Ed Prentice Hall 2001

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 3

and Applications, 2nd Ed., Prentice Hall, 2001.

I. Introduction to Molecular MechanicsI. Introduction to Molecular Mechanics

结构 性质Structures Properties

能量EnergiesEnergies

Quantum Mechanics(量子力学)

Molecular Mechanics(分子力学)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 4

VBT or MOT?VBT or MOT?

价键理论 分子轨道理论

HOMO-2

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 5

LUMO HOMO

A Brief History of Molecular MechanicsA Brief History of Molecular Mechanics

1930年:D. H. Andrews 提出分子力学的原始思想

1940s-50s:分子力场模型的初步建立以及发展

1970s-80s:分子力场开始用于研究蛋白质和核酸分子 1970s-80s:分子力场开始用于研究蛋白质和核酸分子

1982:第一本关于分子力学的专著:Molecular Mechanics, by U. Burkert and N L AllingerBurkert and N. L. Allinger.

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 6

Prof. Norman L. Allinger

Molecular MechanicsMolecular Mechanics

分子力学(Molecular Mechanics) 认为在分子中原子间存在化学分子力学( ) 认为在分子中原子间存在化学键,具有标准的键长、键角等,分子内还存在非键相互作用。分子调整自身构象以尽量给出原子位置的最佳排布。

分子力学方法中能量函数的导出也采用Born–Oppenheimer近似。与量子力学方法所不同的是:分子力学研究分子中原子的排布 而不考虑电研究分子中原子的排布,而不考虑电子构型等细节,认为电子构型对体系能量的贡献包含在每个原子中。能量的贡献包含在每个原子中

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 7

Force FieldForce Field

分子力学使用力场(force field)来计算分子体系的势能。不同的力场使用不同的势能函数,但是大同小异,一般包括以下几项:

EEEEEE vdwelectorsionbendstretchtotal EEEEEE

Estretch: 键伸缩能

E d : 范德华相互作用

Evdw: 范德华相互作用

Ebend: 键角弯曲能 Etorsion: 扭转角扭转能Eelec: 静电相互作用

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 8

Nonbonded interactionsBonded interactions

Bond StretchingBond Stretching

每种类型的化学键具有特定的平衡键长,键长如果偏离该数值将导致体系能量升高 各种分子 通常使用谐振势 数来描述键

Force constant

将导致体系能量升高。各种分子力场通常使用谐振势函数来描述键伸缩势能:

Hook’s law

Morse potential

2Equilibrium bond length

2)( .01 rraer eDE

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 9

Bond StretchingBond Stretching

为了克服谐振势函数的固有缺点,某些分子力场中使用含非谐项的势能 数来更好地模拟M 势 数的势能函数来更好地模拟Morse势函数:

Quadratic (二次项)

Er Morse potential

Cubic (三次项)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 10

r

Angle BendingAngle Bending

每种类型的键角具有特定的平衡键角,键角如果偏离该数值将导致体系能量升高 各种力场通常也采用谐振势函数来描述键角的导致体系能量升高。各种力场通常也采用谐振势函数来描述键角的弯折能:

Force constant

Equilibrium bond angle

含非谐项的势能函数:

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 11

Torsion TermTorsion Term

The simplest form for a torsional potential function is as following, h h f ld f h b d B 1where n is the foldness of the barrier, and B = 1.

Barrier height Torsional angle

k nB

kE cos1

2

Foldness

If B = +1, energy minimum is the staggered form; whereas if B = 1 energy minimum is the eclipsed form

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 12

if B = -1, energy minimum is the eclipsed form.

Torsion TermTorsion Term

In the case of ethane, n = 3 and B = +1:

nBk

E cos12

2

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 13

Torsion TermTorsion Term

Some force fields use expanded torsional potential, in which each i i d h i f ld f ld d h f ldtorsion is treated as having one-fold, two-fold, and three-fold

components.

3cos12cos1cos1 321 BVBVBVE

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 14

Van der Waals InteractionVan der Waals Interaction

Lennard-Jones “6-12” potential functionp

Pauli repulsion London dispersion

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 15

Electrostatic InteractionElectrostatic Interaction

静电相互作用可用点电荷的库仑公式来计算:

库 算

由量子化学的计算结果推导而来(Mulliken电荷等)

计算部分电荷分布的方法:

量子 学 计算 推导 来( 荷等)

经验方法:由原子的电负性等数值推导而来(Gasteiger-Marsili Method 等) 。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 16

Method 等) 。

Distance Cutoff in NonDistance Cutoff in Non--Bonded InteractionsBonded Interactions

非键相互作用的计算量大约正比于N2,此处N 为该体系中的原子总数。

For a molecule consisting of 30 atoms, there may be a total of C2

30 = 30 29 / 2 = 435 atom pairs to consider;

For a molecule consisting of 3000 atoms, there may be C23000

= 3000 2999/2 = 4.5 X 106 atom pairs!

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 17

p

Distance Cutoff in NonDistance Cutoff in Non--Bonded InteractionsBonded Interactions

为了减少计算量,在使用分子力场计算非键相互作用时常常采离截断值( 值 ff) 原 离大 定 截断值时 该用距离截断值(阈值, cutoff): 当原子间距离大于规定的截断值时,该

原子对间的非键相互作用忽略不计。

For van der Waals interactions: cutoff = 8‾10 angstrom. For electrostatic interactions: cutoff = 14‾16 angstrom.

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 18

An Example: The AMBER An Example: The AMBER Force FieldForce Field

AMBER力场所使用的势能函数

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 19

几种常见的分子力场几种常见的分子力场

MM2 / MM3 / MM4 (By Normal Allinger): 适用于有机小分子体系

MMFF (By Thomas Halgren):适用于有机小分子体系

CHARMm (By Martin Karplus):生物大分子体系 & 有机小分子

AMBER (By Peter Kollman):生物大分子体系 & 有机小分子

OPLS-AA (By Bill Jorgensen) :生物大分子体系 & 有机小分子

T. HalgrenM. Karplus W. Jorgensen P. KollmanN. Allinger

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 20

gp gg

需要注意的问题:力场的势能零点需要注意的问题:力场的势能零点

分子力场计算出来的能量到底是什么能量?

假设一个分子其键长、键角和扭转角都采取标准值,且其原子间的范德华相互作用和静电相互作用能都为零,这样的分子其势能为零 这样的“理想分子”代表了分子力场的能量零点 即分子力为零。这样的 理想分子 代表了分子力场的能量零点,即分子力场的参考态。

vdwelectorsionbendstretchtotal EEEEEE

请思考:如果一个分子的力场能量为零,这个分子就可以认为是该力场的参考态么?

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 21

参考态么?

需要注意的问题:交叉能量项需要注意的问题:交叉能量项

分子的不同运动形式之间实际上是联系在一起的。为了更准确描 分 真实情 “交 ”( t )来描地描述分子振动的真实情况,可以引入“交叉项”(cross term)来描

述各种不同运动形式之间的耦合。

甲醛分子的简正振动模式

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 22

甲醛分子的简正振动模式

需要注意的问题:交叉能量项需要注意的问题:交叉能量项

angle-anglebond-angle bond-torsion angle-torsion

键长-键角交叉能量项: ))(( 00/ bbkE bb

))(( kE键角 键角交叉能量项

nbbkE bb cos)( 0/ 键长-扭转角交叉能量项:

))(( 0,220,11/ 2121 kE键角-键角交叉能量项:

nbbkE bb cos)( 0/键长 扭转角交叉能量项:

nkE cos)( 0/ 键角-扭转角交叉能量项:

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 23

First & SecondFirst & Second--Generation Force FieldsGeneration Force Fields

First‐generation force fields: contain only diagonal terms and use h i f ti MM2 AMBER CHARM UFF MMFFharmonic functions, e.g. MM2, AMBER, CHARMm, UFF, MMFF

Second‐generation force field: contain explicit off‐diagonal terms (cross terms) and use anharmonic functions, e.g. MM3/MM4, CFF93, EFF

Stretching Bending Torsion

Stretching I / II II II

Bending I / II II

Torsion I / II

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 24

需要注意的问题:氢键的处理方法需要注意的问题:氢键的处理方法

氢键与其他非键相互作用有所不同:氢键的形成必须在 定 离 角度 内发 类型原 形成氢在一定的距离和角度之内发生;不同类型原子之间形成氢键的距离限制以及角度限制是不尽相同的。

X H Y-- +

X H Y~1.1 Å 1.5~2.1 Å

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 25

需要注意的问题:氢键的处理方法需要注意的问题:氢键的处理方法

不同的分子力场中对于氢键的处理方法也有所不同。例如,在AMBER 中氢 为类 范德华 作 式AMBER力场中氢键能量项处理为类似范德华相互作用的形式:

CHARMm力场中氢键能量项的形式则为:

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 26

Parameterization of Force FieldParameterization of Force Field

分子力场的基本构成要素包括势能函数的表达式及其使用的参数。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 27

Parameterization of Force FieldParameterization of Force Field

分子力场参数可以来源于对光谱测量结果和分子晶体结构的分析。

谱 相 性质导 伸缩 角例如: 可以从红外光谱的相关性质导出键伸缩以及键角能量项所需要的参数。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 28

Parameterization of Force FieldParameterization of Force Field

另一种广泛应用的方法是在适当的模型体系上根据量学 算结 导 需 参数子力学的计算结果导出所需的力场参数。

Frequency analysis by high-level QM

Zn-containing model systems

Seminario’s method

V lid ti Force field parameters (bond stretching &

angle bending)

Validations

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 29Lin, F.; Wang, R.*, J. Chem. Theory Comput. 2010, 6, 1852‐1870.

分子力场目前所存在的问题分子力场目前所存在的问题

对于含金属的分子体系缺乏适用的力场模型和参数:The “ ” bl“missing parameter”problem

可能的解决办法:发展导出力场参数的系统方法。

谐振势函数不能精确地拟合实验数据。

可能的解决办法:在键伸缩、键角弯折、扭转角等能量项中采

非键作用势中假定原子为球形,实际上非键作用受原子形状的

用高次项;引入各种交叉能量项。

影响,也许需要考虑孤对电子。两个相互作用原子之间的诱导偶极作用会受到其它原子的影响。对于静电作用的处理过于简化 使用固定的原子部分电荷分布化,使用固定的原子部分电荷分布。

可能的解决办法:发展新一代可极化的分子力场(polarizable force field)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 30

force field)。

Simplified Force Field ModelSimplified Force Field Model

联合原子力场(united-atom force field) 将化学基团处理为“超原子”,从而减少计算量。

H

CH3 CH2C

CH2

CH3CH3H

CH2

CH3

H

联合原子力场一般通过拟合全原子力场(all-atom force field)的计算结果得出其力场参数。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 31

e d)的计算结果得出其力场参数。

CoarseCoarse--Grained ModelGrained Model

粗粒度模型 (coarse-grained model)是更为简化的力场模型。它将 组基团当成 个单位来处理 从而极大地减少计算量 因此常将一组基团当成一个单位来处理,从而极大地减少计算量,因此常用于处理生物大分子体系或功能材料体系。

粗粒度模型表示的多肽分子

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 32

粗粒度模型表示的多肽分子

CoarseCoarse--Grained ModelGrained Model

All atom model Coarse-grained All-atom model gmodel

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 33

CoarseCoarse--Grained ModelGrained Model

由于忽略键长、键角等分子结构的细节,粗粒度模型力场具有与常规的分子力场不同的能量函数形式。

End-to-end

T shaped

Side-by-side

T-shaped

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 34

分子力学的基本特点分子力学的基本特点

分子力学采用“力场”方法来计算体系的势能。分子分子力学采用 力场 方法来计算体系的势能 分子的总能量分解为键伸缩、键角弯折、扭转角效应、非键相互作用等能量项,可以对分子的构象变化从能量键相互作用等能量项,可 对分子的构象变 能量角度进行定量的描述。

分子力场所采用的能量分解方案虽然符合人们对分子结构的直观认识,但是并无理论依据。力场所采用的结构的直观认 ,但是并无 论依据 力场所采用的势能函数及其参数均是通过拟合各种实验数据得出的。因此,分子力学方法本质上仍然是是唯象的经验方法。因 ,分子力学方法本质 仍然是是唯象的 验方法

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 35

分子力学方法的应用分子力学方法的应用

由于计算量小,分子力学可以用来研究包括成千上万个原子的分子体系,包括有机小分子、生物大分子(蛋白、核酸和生物膜等) 甚至是材料分子体系。

对分子进行构象分析:确定优势构象,确定各种可能构象之间转化所需的能垒等等。化所需的能垒等等。

对分子进行分子动力学模拟:研究分子的结构和性质随时间变化的关系的关系

可以得出分子的振动光谱和热力学性质(标准生成热等) :不推荐

分子力学不能用于研究化学反应变化

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 36

分子力学不能用于研究化学反应变化。

分子体系能量的计算方法:分子体系能量的计算方法:MM or QM?MM or QM?

量子力学(Quantum Mechanics, QM): 计算量较大,计算结果相对比较准确。主要用于优化有机小分子的几何结构,计算分子的能量、偶极矩、电荷分布等性质,研究有机反应途径和机理。近年来也逐步应用于计算分子间的相互作用 计算量正比于n4或年来也逐步应用于计算分子间的相互作用。计算量正比于n 或n3(n=基函数总数)。

分子力学(Molecular Mechanics, MM): 计算相对于量子力学计算快几个数量级,因此所能够计算的体系比较大,可以用于模拟蛋白质 核酸等生物大分子的结构和性质 及研究配体 受体相互白质、核酸等生物大分子的结构和性质以及研究配体受体相互作用。分子力学方法可以获得分子的平衡结构、振动光谱、热力学性质等,但不能求得与电子结构有关的其他性质,不能用于研究学性质等,但不能求得与电子结构有关的其他性质,不能用于研究化学反应。计算量正比于N2(N=原子总数)。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 37

分子力学与量子力学相结合的算法分子力学与量子力学相结合的算法(QM/MM)(QM/MM)

QM/MM方法将较大的分子体系分为MM和QM区域分别处理,比较多地应用于研究酶促反应的机理比较多地应用于研究酶促反应的机理。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 38

思考题思考题

1. 为什么原则上不同力场间的力常数不能互换使用?

2. 请数一数binol (1,1’-联二萘酚) 分子中共存在多少对范德华非键相互作用? 提示:分子力场中范德华相范德华非键相互作用? 提示:分子力场中范德华相互作用一般认为存在于超过1-4作用的原子对之间。

3. 为什么对于静电作用的处理在适用于核酸分子体系的力场中尤为重要?

4. 假定某分子有两种可能的构象同时存在,其能量分别为-25.0kcal/mol和 -26.0kcal/mol。请计算两种构象存在的比例。算 种 存

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 39

II. Conformational AnalysisII. Conformational Analysis

构象分析: 对分子的势能面进行采样分析。其根本目的在于研究分子的构象空间,确定分子的最低能量构象以及若干典型低能构象。

请思考 为什么构象分析的请思考:为什么构象分析的目的不是单纯地获得所谓的最低能量构象?

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 40

能量构象?

Geometry OptimizationGeometry Optimization

结构优化是构象分析中的基本操作之一。结构优化的过程(geometry optimization)即为在势能面上定位能量极小点(energy minimization),从而确定分子的低能结构。

local maximumglobal maximum

local minimum

global minimum

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 41

global minimum

Methods for Energy MinimizationMethods for Energy Minimization

数值优化方法

单变量顺序优化法(Sequential Univariate Method)

单纯型方法(Simplex Method)

使用体系能量一阶微商的方法

最陡下降法(Steepest Descent Method)

共轭梯度法(Conjugate Gradient Method)( j g )

使用体系能量二阶微商的方法系 量 阶 商

牛顿-拉弗森法(Newton-Raphson Method)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 42

The Sequential Univariate MethodThe Sequential Univariate Method

单变量顺序优化法按照一定的顺序每次考察一个变量,如此循环往复直至函数值收敛在某极小值处。

For each coordinate two new structures (2 & 3) are generated by changing For each coordinate, two new structures (2 & 3) are generated by changing the current coordinate of the original structure (1); the minimum point along this coordinate (4) is then determined.

The next coordinate is then explored using the new structure (4) as the starting pointstarting point.

The above process is repeated until th h i ll di t i

xy

the changes in all coordinates is sufficiently small.

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 43

The Simplex MethodThe Simplex Method

单纯形(simplex)就是N维向量空间中具有N+1个顶点的凸多面形。

A simplex in 2D space A simplex in 3D space

单纯型优化方法的理论基础是Simplex定理:N维向量空间中如果存在最优值,必能构建一个凸多面形集合,在此集合中某个凸多面形的某个顶点可以达到该最优值。该定理是由美国数学家George Dantzig于1947年首先提出。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 44

The Simplex Method: An ExampleThe Simplex Method: An Example

使用单纯型优化法寻求下面函数的极小值:

22 2),( yxyxf

323)11,9(1 f 243)9,9(2 f 283)9,11(3 f

219)7,11(4 f 179)7,9(5 f 171)5,11(6 f

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 45

9

The Steepest Descent MethodThe Steepest Descent Method

Steepest descents (最陡下降法) is a first-order optimization algorithm. To find a local minimum of a function using gradient descent, one takes steps proportional to the negative of the gradient of the function at the current point

ff )()(

gradient of the function at the current point.

iiii xsxfxf )()( 1

iiiii gg

xxf

xxfs

)()(

xi起始时一般为设定值,计算过程中可进行调整

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 46

进行调整。

The Conjugated Gradient MethodThe Conjugated Gradient Method

The conjugate gradient method (共轭梯度法) is based on the idea that the convergence to the solution could be accelerated if the system is minimized over

f f

convergence to the solution could be accelerated if the system is minimized over the hyperplane that contains all previous search directions, instead of being minimized over just the line that points down gradient.

h = -g + h

f(x i+1) = f(x i) + h i+1 x

h i+1 -g i+1 + i h i i = (g i+1 g i+1)/(g i g i)

0 th l t ( )g i g j =0, g i+1 orthogonal to (g0, g1, g2,…, gi)

h i Vij h j =0, h i+1 is V conjugate to (h0, h1,

h2, …, hi), jiij xxVV /2

A comparison of the convergence of gradient descent with

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 47

A comparison of the convergence of gradient descent with optimal step size (green) and conjugate gradient (red)

The NewtonThe Newton--Raphson MethodRaphson Method

牛顿迭代法(Newton‘s method) 是牛顿在17世纪提出的一种在实复 求数域和复数域上近似求解方程的方法。

Write f(x) in its Taloy expansion:( ) y p

f(x) reaches its extremum when its first-order derivative equals to zero:

Thus, provided that f(x) is a twice-differentiable function, the sequence (xn) can b d fi d bbe defined by:

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 48

The NewtonThe Newton--Raphson MethodRaphson Method

For a given molecular system consisting of N atoms:

63...,,3,2,1,02

Nix

VxV

i

jii xx0xxFxV )()(

ji xx

1 )(1 xVFxx 1 nn

A comparison of gradient descent (green) and Newton's method (red) for minimizing a function (with small step sizes). Newton's method uses curvature information to take a

di t t

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 49

more direct route.

Major Parameters for Energy MinimizationMajor Parameters for Energy Minimization

起始结构(initial structure)起 结构( )

极小化方法(SD, CG, Newton method, etc.)

步数(number of steps): 102 ‾ 103

步长(step size): 0 002-0 01Å步长(step size): 0.002 0.01Å

收敛标准(convergence criteria): 能量差值

Å(0.002kcal/mol), 梯度差值(0.02kcal/molÅ)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 50

How to Select Minimization Methods?How to Select Minimization Methods?

对分子体系进行结构优化的计算量大大高于单点能计算。对于较复杂 分 体系 般 言先采 S D 法 体系比较复杂的分子体系,一般而言先采用Steepest Descent 方法对体系

的结构进行粗略的优化,然后使用Conjugate Gradient或Newton-Raphson方法进行更精细的优化Raphson方法进行更精细的优化。

最陡下降法:方向变化大,对结构的调整辐度较大,当接近最陡 降 变 对 调整 度极小点时收敛速度较慢。

共轭梯度法:收敛较快,相对于初始结构的偏离不大,易陷共轭梯度法:收敛较快,相对于初始结构的偏离不大,易陷入局部势阱。

牛顿迭代法:计算量较大,当微商小时收敛快。牛顿迭代法:计算量较大,当微商小时收敛快。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 51

Conformational SamplingConformational Sampling

对于结构比较复杂的分子,简单的结构优化往往不能获得其最低能量构象,也不能得出构象的分布,这时就需要对其进行比较详细的构象搜索。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 52

Methods for Conformational SamplingMethods for Conformational Sampling

系统搜索法(systematic search)系统搜索法( y )

随机搜索法(stochastic search / random search)

蒙特卡罗模拟(Monte Carlo method MC ) 蒙特卡罗模拟(Monte Carlo method, MC )

遗传算法( genetic algorithm,GA )

分子动力学方法(molecular dynamics, MD)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 53

Systematic SearchSystematic Search

系统搜索法:在由扭转角构成的构象空间中进行逐点搜索。按一定步长均匀变化每个扭转角 并逐 计算能量 取能量小于 定标准步长均匀变化每个扭转角,并逐一计算能量,取能量小于一定标准的所有构象进行分析。

)( n21 ,...,φ,φφfE

假设每个扭转角需要探索360/10 = 36个角度:

如果有2个扭转角,则可能的构象总数为:362 = 1296如果有2个扭转角,则可能的构象总数为:36 1296如果有3个扭转角,则可能的构象总数为:363 = 46656如果有4个扭转角,则可能的构象总数为:364 = 1.68 106

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 54

The Ramachandran Plot The Ramachandran Plot

Ramachandran作图法表示蛋白质分子中氨基酸残基主链 角φ ψ 值范 表 多肽链形成链上的二面角φ和ψ的取值范围,从而表征多肽链形成的构象。

φ

ψ

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 55

Random SearchRandom Search

1. 随机产生多个构象:可以随机变化分子结构中各个扭转角的数值,直至达到用户预设的计算量上限。

)(fE

2 对每个获得的构象进行结构优化 并进行构象分组

)( n21 ,...,φ,φφfE

2. 对每个获得的构象进行结构优化,并进行构象分组。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 56

systematic search random search

BuildBuild--Up MethodUp Method

假设分子的构象主要依赖于短程相互作用,把较大的分子体系分解为若干片段(Fragment) 每个分子片段具有固定的一种或几种构象解为若干片段(Fragment),每个分子片段具有固定的一种或几种构象,然后将各个片段接起来形成完整分子的构象。

A search tree

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 57

这种方法比较适用于研究含环分子或其他特殊体系的构象。

Monte Carlo MethodMonte Carlo Method

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 58

Monte Carlo MethodMonte Carlo Method

1. 产生给定分子体系的初始构象r0 ;

2. 令构象ri产生微小随机变化,生成新的构象ri+1

3. 计算能量的差值:

4 M l 断

)()( 1 ii rErEE

4. 根据Metropolis法则进行判断:

如果E < 0,则接受新的构象ri+1 ; 如果E 0,则接受新的构象ri+1 ; 如果E 0,则产生一个(0,1)之间的随机数R,如果

R< exp (-E/RT), 则接受新的构象ri+1;否则抛弃之。

5. 重复步骤2-4,直至获得所需的构象集合。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 59

Monte Carlo MethodMonte Carlo Method

Monte Carlo方法在构象空间中进行随机采样,采用线性采样过在 中 样 线 样程(Markov chain)。

对初 构象 依赖性 接受部分能量 升 构象 跳出 对初始构象的依赖性小,可接受部分能量上升的构象,跳出局部势阱。还可以与模拟退火等方法结合使用,对构象空间进行较大范围的搜索较大范围的搜索。

理论上可以得出能量符合Bolztmann分布的构象集合,进而根据布统计力学原理计算体系的热力学性质。

比较不适用于处 结构复杂的分子 适用于比较 的分子体系 比较不适用于处理结构复杂的分子,适用于比较小的分子体系。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 60

Simulated AnnealingSimulated Annealing

模拟退火算法来源于对固体退火过程的模拟。将固体加温至充分高 再让其徐徐冷却 加温时 固体内部粒子随温升变为无序状分高,再让其徐徐冷却。加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。最后在常温时达到基态,内能减为最小。

The method was independently described by Scott Kirkpatrick, C. Daniel G l tt d M i P V hi i 1983 d b Vl d Č ý i 1985

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 61

Gelatt and Mario P. Vecchi in 1983, and by Vlado Černý in 1985.

Simulated AnnealingSimulated Annealing

Monte-Carlo模拟退火方法用于构象搜索的基本流程:

1. 给定体系的初始构象, 在较高温度下进行Monte Carlo搜索,获得一组新的构象。

2 降低体系的温度 新的 组构象为初始构象继续进行M t2. 降低体系的温度,以新的一组构象为初始构象继续进行MonteCarlo搜索。

E

0 < exp (‐E/RT) < 1  接受更高能量构象的几率

较高 度 获得的构象 较低温度下获得的构象

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 62

较高温度下获得的构象 较低温度下获得的构象

Genetic AlgorithmGenetic Algorithm

基因算法(genetic algorithm)是一种应用广泛的优化算g g法。它模拟生物进化过程,通过复制、杂交、突变等方式以产生更适应环境压力的新一代个体,最终获得给定问题的最优解 。

分子的构象被编码为一个数串(chromosome):

)( xxxfE

x1 x2 xnx3

),...,,( 21 nxxxfE

fitness function

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 63

fitness function

Genetic Algorithm: Basic OperationsGenetic Algorithm: Basic Operations

突变操作(single-point mutation):

杂交操作( i l i t )杂交操作(single-point cross-over):

Parents

Off i

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 64

Offsprings

Genetic AlgorithmGenetic Algorithm

1 随机产生 组初始构象(population) 每个1. 随机产生一组初始构象(population),每个构象用 一个数字串来编码 (chromosome);计算每个构象的适应度(Fitness score)。计算每个构象的适应度(F t ess sco e)。

2. 通过遗传(inheritance)、杂交(cross-over)、2. 通过遗传(inheritance)、杂交(cross over)、突变(mutation)等方式以产生新一组构象;保留具有较高适应度的构象。

3. 循环步骤1-2,每一代构象能量的平均值不断下降直至收敛。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 65

基因算法的基本特点基因算法的基本特点

基因算法本质上为一种并行搜索算法:由一组初始构基因算法本质上为 种并行搜索算法:由 组初始构象开始,得到一组优化后的构象。能够自适应地调整搜索方向,不需要确定的规则。搜索方向,不需要确定的规则。

直接对优化对象进行操作,不存在求导和函数连续性的限定,可以实现对分子构象比较大的调整。

搜索过程中采用随机数 结果有不确定性 算法中有搜索过程中采用随机数,结果有不确定性。算法中有许多参数可以调整,原则上会对最终的结果有影响。

基因算法的搜索过程往往在后期收敛较慢。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 66

Clustering of ConformationsClustering of Conformations

进行构象搜索通常得到数目众多的构象(102~103),需象 索通常得 象( ) 需要对其进行合理的聚类和分组以便更清楚地表征结果。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 67

Clustering of ConformationsClustering of Conformations

两个构象之间的差异通常可以用均方根距离来表示:(Root-Mean-Square Distance, RMSD):

zzyyxxRMSD

N

iiiiiii

1

2)

'2)

'2)

' ](([(

NRMSD

Conformation Fitting: 在分子的两个不同构象上选择三对或三对以上原子进行叠合,使两者间RMSD值最小。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 68

Clustering of ConformationsClustering of Conformations

对于一组构象可以构建其相似度矩阵:对于 构象 构建其相 度 阵

0 SSS

...0

...0

22321

11312

N

N

SSSSSS

...... 33231

22321

N

N

SSS

0...............

SSS相似度矩阵 (NN )

0...321 NNN SSS

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 69

Clustering of ConformationsClustering of Conformations

给定要聚类的N个对象及其相似性矩阵, 层次式聚类方法

1 将每个对象 为 类 共得到N类 每类

(Hierarchical clustering)的基本步骤如下:

1. 将每个对象归为一类, 共得到N类, 每类仅包含一个对象. 类与类之间的距离就是它们所包含的对象之间的距离是它们所包含的对象之间的距离。

2. 找到最接近的两个类并合并成一类, 于是总的类数减少为N 1是总的类数减少为N-1。

3. 重新计算新的类与所有旧类之间的距离。

4. 重复第2步和第3步, 直到所有对象最后合并成一个类为止。

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 70

Clustering of ConformationsClustering of Conformations

非层次式聚类方法(Non-hierarchical clustering )( g )

先假定可以分为N组:先假定可 分为 组:

1. 将其它构象按最近邻进行最初的分组;分组;

2. 计算新的中心点,再重新分组。

3. 重复以上过程直至分类情况再没有改变为止。

The K-means method

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 71

思考题思考题

请问以下几种分子分别可以利用哪些方法进行构象分

NH2

析,为什么?

N

NN

N

OHO

HOH

H

H

O

HO

HHHH

POO-

O-

O

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 72

太有才了!太有才了!

“因为多肽分子是生物分子,所以可以采用基因算法来进行构象搜索。”(吐血指数=9)

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 73

The Final OverviewThe Final Overview

有机分子的结构和构象分析

有机分子的热力学性质

有机分子间的相互作用

有机反应动力学分析结构性质关系

量子化学分子力学 量子化学方法

分子力学方法

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 74

What is for next lectureWhat is for next lecture

Lecture 7: Applications of Molecular Modeling Lecture 7: Applications of Molecular Modeling to Chemical and Biological Problems

中国科学院上海有机化学研究所 Shanghai Institute of Organic Chemistry, Chinese Academy of Sciences 75