1、分子模拟基础分子模拟基础 任彦亮任彦亮Tel:15071407727E-mail:Molecular Modelling Molecular Modelling 分子模拟分子模拟 根据物理与化学的基本原理,建立一种以计根据物理与化学的基本原理,建立一种以计算数据(由计算机执行)代替实验测量的研究方算数据(由计算机执行)代替实验测量的研究方法,获取法,获取分子信息分子信息(化学、生命、材料化学、生命、材料)。-江元生院士框框 架架模型软件信息方案工具目的 原 理 基 础材料科学材料科学药物研发药物研发分子模拟分子模拟分子科学分子科学生命科学生命科学分子模拟的发展趋势分子模拟的发展趋势Case S
2、tudy合成技术、分析表征技术、分子模拟技术合成技术、分析表征技术、分子模拟技术各种化学问各种化学问题研究题研究化学合成化学合成路线路线设计设计化学信息系统化学信息系统(数据分析处理数据分析处理)化学生物学化学生物学数据库数据库分子模拟分子模拟分子结构模建分子结构模建3D3D图象显示图象显示量子化学量子化学计算化学计算化学分子力学分子力学分子动力学分子动力学分子分子模拟模拟应应用用网网格格系系统统药物、农药药物、农药材料材料设计设计计算硬件资源(计算硬件资源(PC-ClusterPC-Cluster、各种、各种ServerServer、OSOS)网络计算应用中间件平台和安全支撑环境网络计算应用
3、中间件平台和安全支撑环境(CGSPCGSP)分分子子模模拟拟软软件件资资源源分子体系的信息、性质、结构、功能、反应分子体系的信息、性质、结构、功能、反应分子模拟应用用户分子模拟应用用户化学信息学化学信息学研究研究化学-生物学数据库化合物库化合物库 晶体库晶体库 热力学数据库热力学数据库 反应数据库反应数据库分子光谱分子光谱 波谱图谱库波谱图谱库 化学文献库化学文献库生物数据库(蛋白质、核酸、多糖库)生物数据库(蛋白质、核酸、多糖库)代谢数据库代谢数据库 生物活性、毒性数据库生物活性、毒性数据库 化学-生物学信息(人工智能)系统计算机辅助分子结构解释计算机辅助分子结构解释 化学模式识别化学模式识
4、别 结构活性关系分析结构活性关系分析(QSAR)结构性质关系分析结构性质关系分析(QSPR)数理统计方法:数理统计方法:ANN、GA、SA、Boosting1010Portal for usersBioinformaticsMolecular ModelingStructure-based Drug Design Computational Chemical BiologyNodes and Machines1212Work FlowVirtual Screening ProcessGaussian03/GaussViewOutline1.The Theoretical Background
5、理论背景理论背景2.Single Point Energy Calculations 单点能计算单点能计算3.Geometry Optimizations 几何构型优化几何构型优化4.Frequency Calculations 频率计算频率计算5.Reaction Pathways 反应途径反应途径References Exploring Chemistry with Electronic Structure Methods,J.R.Foresman,A.Frisch,Second Edition Gaussian,Inc.Molecular Modelling,A.R.Leach,Addi
6、son Wesley Long-man Limited,1996.量子化学量子化学,徐光宪等徐光宪等,科学出版社科学出版社.计算机辅助药物设计计算机辅助药物设计,陈凯先等,上海科学技术出版社。,陈凯先等,上海科学技术出版社。蛋白质的结构预测与药物设计蛋白质的结构预测与药物设计,来路华,来路华,北京大学。北京大学。结构化学结构化学,东北师范大学等,高等教育出版社。,东北师范大学等,高等教育出版社。The Theoretical Background 理论背景理论背景Chapter OneMolecular Modelling的的主要理论方法有:主要理论方法有:1.Molecular Mechan
7、ics(MM分子力学分子力学)2.Molecular Dynamics(MD分子动力学分子动力学)3.Electronic Structure Theory(电子结构理论电子结构理论)Quantum Mechanics,QC&Semiempirical QC (Ab initio Methods)4.Quantum Statistics(量子统计理论量子统计理论)1.1 Molecular Modelling (Computational Chemistry)a)计算分子体系的能量、计算分子体系的能量、与能量有关的物理、化学性质与能量有关的物理、化学性质。b)进行几何构型优化。在初始几何构型的
8、附近寻找具有最进行几何构型优化。在初始几何构型的附近寻找具有最低能量低能量(local minimum)的平衡几何构型。依据是能量梯度的平衡几何构型。依据是能量梯度(即能量对原子位置坐标的一阶导数)最小化得到的。(即能量对原子位置坐标的一阶导数)最小化得到的。c)计算分子振动频率。依据是能量对原子位置坐标的二阶计算分子振动频率。依据是能量对原子位置坐标的二阶导数矩阵。导数矩阵。MM、MD、ab initio方法的共同点方法的共同点BME2Advantages 优点优点 方法很便宜。可用于大分子体系,如蛋白质,酶等生方法很便宜。可用于大分子体系,如蛋白质,酶等生物体系的模拟计算。物体系的模拟计算
9、。1.1.1 Molecular Mechanics&Dynamics 分子力学与分子动力学Disadvantages 缺点缺点 每一系列参数都是针对特定原子得出的每一系列参数都是针对特定原子得出的,没有针对原没有针对原子各个状态的统一参数。子各个状态的统一参数。计算中忽略了电子,只考虑键和原子,自然就不能处计算中忽略了电子,只考虑键和原子,自然就不能处理有很强电子效应的体系理有很强电子效应的体系,比如比如不能描述键的断裂不能描述键的断裂。1.Molecular Mechanics(MM分子力学分子力学)2.Molecular Dynamics(MD分子动力学分子动力学)a)Semi-empi
10、rical 半经验方法半经验方法 HMO、AM1、MNDO、PM3、INDO/S等方法等方法b)Ab initio Methods 从头算方法从头算方法 Hartree-Fock/HF方法方法 c)Density Functional Theory 密度泛函理论密度泛函理论 DFT/(B3LYP,X3LYP,PW91)等方法等方法 1.1.2 Electronic Structure Theory 电子结构理论电子结构理论主要有三类主要有三类常见的软件包常见的软件包:Gaussian、ADF、MOPAC、HyperChem Amber、Gromos Functions in Gaussian0
11、3Molecular energy and structures 分子的能量和结构分子的能量和结构Energies and structures of transition states过渡态的能量和结构过渡态的能量和结构Bond and reaction energies 化学键以及反应能垒化学键以及反应能垒Molecular obitals 分子轨道分子轨道Dipole/Multipole moments 偶极矩和多极矩偶极矩和多极矩Atomic charges and electrostatic potentials 原子电荷和静电势原子电荷和静电势Vibrational frequen
12、cy 振动频率振动频率IR and Raman spectra 红外和拉曼光谱红外和拉曼光谱NMR properties 核磁共振屏蔽常数核磁共振屏蔽常数Polarizabilities and hyperpolarizabilities 极化率和超极化率极化率和超极化率Thermochemical properties 热力学性质热力学性质Reaction pathways 反应途径反应途径 1.2 Computational Models&Model ChemistriesAll chemists use models.Plastic models -the structures of m
13、olecules SN2 mechanism is a simple model for a particular class of reactions Molecular modeling simulates chemical structures and reactions numerically,based in full or in part on the fundamental laws of physics.It allows chemists to study chemical phenomena by running calculations on computers rath
14、er than by examining reactions and compounds experimentally.包括包括:理论方法、电子的自旋状态、基组理论方法、电子的自旋状态、基组 (分子自旋多重度分子自旋多重度)Gaussian03关键词关键词 理论方法:理论方法:PM3 半经验分子轨道方法半经验分子轨道方法HF Hartree-Fock自恰场模型自恰场模型B3LYP Becke型型3参数密度泛函方法参数密度泛函方法MP2 二级二级Moller-Plesset微扰理论微扰理论1.2.1 Defining Model Chemistries 模型化学的定义Model chemistr
15、ies are characterized by the combination of the theoretical procedure and basis set in addition to specifying the molecular system to consider and which results to computer for it.1.2.2 Open shell vs.Closed shell 开壳层 vs.闭壳层 电子的自旋状态电子的自旋状态:对于闭壳层体系对于闭壳层体系,采用限制性的采用限制性的Restricted Hartree-Fock方法计算。在方法关键词
16、前面加方法计算。在方法关键词前面加R:RHF。对于开壳层对于开壳层,采用非限制性的采用非限制性的Unrestricted Hartree-Fock方法计算。在方法关键词前面加方法计算。在方法关键词前面加U:UHF。对于不加的,程序默认为是闭壳层。对于不加的,程序默认为是闭壳层。开壳层的可能情况开壳层的可能情况:1.存在奇数个电子的体系存在奇数个电子的体系,如自由基,某些离子体系如自由基,某些离子体系 2.激发态激发态 3.有多个单电子的体系(含过渡金属原子体系)有多个单电子的体系(含过渡金属原子体系)4.描述键的断裂过程描述键的断裂过程 1.3 Basis set 基组基组LCAO-MO基函数
17、基函数:分子轨道线性展开时用到的独立基矢分子轨道线性展开时用到的独立基矢基组:基组:某个原子所用基函数的集合某个原子所用基函数的集合)exp(31rs)exp(352rrsH原子的原子的1s轨道:轨道:H原子的原子的2s轨道:轨道:Types of Basis Sets Slater type orbitals(STO)Gaussian type orbitals(GTO)-functional form -zeroth-order Gaussian function n=0 rnnnlernrR12/12/1)!2()2()(24/32),(rserg.2,1,0,2nncbaezyxarc
18、ba)()()(121)(2/1)!(2)!1(32230lnllnnlnnaZnlLerR0/2naZrnZ/Laguerre polynomialThe orbital exponent Gauss型轨道计算起来快速、方便型轨道计算起来快速、方便,但它与电子运动但它与电子运动的真实图象相差太远。的真实图象相差太远。Slater型轨道会增加分子积分计算的难度,但它更接型轨道会增加分子积分计算的难度,但它更接近电子运动的真实图象。近电子运动的真实图象。为了弥补这些缺陷,可用为了弥补这些缺陷,可用GTO的线性组合近似拟合逼的线性组合近似拟合逼近近STO的办法。即以的办法。即以STO作为基函数,而
19、每个作为基函数,而每个STO用若干用若干个个GTO来逼近来逼近(一般是一般是3到到6个个,一般表示为一般表示为STO-NG)。Property of Gaussian functions is that the product of two Gaussians can be expressed as a single Gaussian,located along the line joining the centers of the two Gaussians2222cmnnmnmnnmmarraaaararaeeee1.3.1 Minimal Basis Sets 最小基组最小基组包含了描述
20、一个原子的最小基组包含了描述一个原子的最少的基函数最少的基函数 例如例如 第一周期原子第一周期原子 H、He:1s 第二周期原子第二周期原子 Li、Be、CNe:1s,2s,2px,2py,2pz STO-NGSTO-NG是最小基组是最小基组(N=3)(N=3)1.3.2 Split Valence Basis Sets 分裂价层基组双分裂价基组双分裂价基组:对于价键轨道都用两个函数来进行描述对于价键轨道都用两个函数来进行描述 如:如:3-21G,6-31GH、He:1s,1sLi、Be、C:1s,2s,2s,2Px,2Py,2Pz,2Px,2Py,2Pz 3-21G表示表示 非价轨道用一个基
21、函数描述,这个非价轨道用一个基函数描述,这个基函数由基函数由3 3个个Gauss函数拟合而成;函数拟合而成;价轨道用两个基函数描述,这两个基函数中一个价轨道用两个基函数描述,这两个基函数中一个由由2个个Gauss函数拟合,另一个由函数拟合,另一个由1个个Gauss函数函数拟合拟合.问题问题1 1:H H原子与原子与C C原子若使用基组原子若使用基组6-31G6-31G,它们的,它们的基函数各有多少个?基函数各有多少个?H:2H:2 C:1+4 C:1+4*2=9 2=9 1.3.3 Polarized Basis Sets 极化基组 分裂基组允许轨道改变其大小分裂基组允许轨道改变其大小(siz
22、e),但不能改变形状,但不能改变形状(shape)。极化基组则取消了这样的限制,增加了。极化基组则取消了这样的限制,增加了一个一个描述描述高高阶角动量阶角动量的基函数的基函数。如:如:6-31G(d),又称为又称为6-31G*6-31G(d,p),也称为,也称为6-31G*6-31G(d)基组来源于基组来源于6-31G基组,并在其基础上,对于基组,并在其基础上,对于非氢原子增加了一个非氢原子增加了一个d轨道;轨道;6-31G(d,p)在在6-31G(d)的基础上,在氢原子轨道中加的基础上,在氢原子轨道中加入了一个入了一个p轨道。轨道。笛卡儿笛卡儿:d(x2),d(y2),d(z2),d(xy)
23、,d(xz),d(yz)6纯粹轨道纯粹轨道:d(z2-r2),d(x2-y2),d(xy),d(xz),d(yz)5注意:注意:d d轨道包括两种形式轨道包括两种形式问题问题2 2:H H原子与原子与C C原子若使用基组原子若使用基组6-31G6-31G*或或6-31G6-31G*,它们的基函数各有多少个?,它们的基函数各有多少个?6-31G6-31G*H:2 H:2 C:1+4 C:1+4*2+6=15 (6d)2+6=15 (6d)6-31G6-31G*H:2+3=5 H:2+3=5 C:1+4 C:1+4*2+6=15 (6d)2+6=15 (6d)1.3.4 Diffuse Funct
24、ions 弥散函数 弥散函数是弥散函数是s和和p轨道函数的轨道函数的“大号大号”的版本,它的版本,它们允许轨道占据更大的空间们允许轨道占据更大的空间 6-31+G(d)基组表示的是基组表示的是6-31G(d)基组在重原子上基组在重原子上加上弥散基组加上弥散基组,6-31+G(d)基组表示对于氢原子也加上基组表示对于氢原子也加上弥散函数。弥散函数。如:如:6-31+G(d),6-31G+(d)1.3.5 High Angular Momentum Basis Sets 高角动量基组 高角动量基组高角动量基组是在分裂价层基组基础上增加多个极是在分裂价层基组基础上增加多个极化基函数化基函数 6-31
25、1+G(3df,2df,p)基组在第二周期以及以上都采用三基组在第二周期以及以上都采用三个个d函数和一个函数和一个f函数的极化函数的极化,而对于第一周期采用两个而对于第一周期采用两个d函数函数和一个和一个f函数的极化函数的极化。6-31G(2d)是在是在6-31G基础上增加两个基础上增加两个d轨道的函数。轨道的函数。6-311+G(3df,3pd)则增加了更多的极化函数,包括则增加了更多的极化函数,包括三个分裂的价键基组,在重原子和氢原子上加的弥散函数,三个分裂的价键基组,在重原子和氢原子上加的弥散函数,在重原子上加的三个在重原子上加的三个d函数和一个函数和一个f函数,在氢原子上加的函数,在氢
26、原子上加的三个三个p函数和一个函数和一个d函数。函数。问题问题3 3:H H原子与原子与C C原子若使用基组原子若使用基组6-31+G6-31+G*或或6-31+G6-31+G*,它们的基函数各有多少个?,它们的基函数各有多少个?6-31+G6-31+G*H:2 H:2 C:1+4 C:1+4*2+6+4=19 2+6+4=196-31+G6-31+G*H:2+3+1=6 H:2+3+1=6 C:19 C:191.3.6 Effective Core Potential Basis Sets 有效核势能基组 第三周期以上的原子的基组很难处理。由于存第三周期以上的原子的基组很难处理。由于存在非常
27、大的核,原子核附近的电子通过有效核电势在非常大的核,原子核附近的电子通过有效核电势方法方法(Effective Core Potential,ECP)进行了近似,这进行了近似,这一处理同时也包含了相对论效应。其中,一处理同时也包含了相对论效应。其中,LanL2DZ是最有常用的基组。是最有常用的基组。STO-3G:H-Xe3-21G:H-Xe6-31G(d):H-Cl6-31G(d,p):H-Cl6-31+G(d):H-Cl6-31+G(d,p):H-Cl6-311+G(d,p):H-Br6-311+G(2d,p):H-Br6-311+G(2df,2p):H-Br6-311+G(3df,2pd)
28、:H-Br 常用基组总结常用基组总结(in Gaussian)1.4 理论方法的局限性理论方法的局限性*半经验方法半经验方法(semi-empirical)*从头算方法从头算方法:Hartree-Fock理论理论 SCF方法方法(电子相关电子相关):Moller-Plesset微扰微扰 Quadratic Configuration Interaction 耦合簇方法和耦合簇方法和QCI方法方法*密度泛函方法密度泛函方法(DFT)1.4.1 半经验方法半经验方法最有名的半经验方法:最有名的半经验方法:AM1,PM3,MNDOGaussian、MOPAC、HyperChem、Spartan中含有
29、这些方法中含有这些方法 *非常大的系统非常大的系统 *处理大系统的第一步,如:可以先采用半经验方法优化大处理大系统的第一步,如:可以先采用半经验方法优化大的体系,然后再进行的体系,然后再进行HF或或DFT方法的优化。方法的优化。*对于半经验参数发展很完善的体系,如:一些简单有机分对于半经验参数发展很完善的体系,如:一些简单有机分子。子。*分子的定性研究,如:分子轨道,原子电荷,正则振动模分子的定性研究,如:分子轨道,原子电荷,正则振动模式等。式等。1.4.2 半经验方法的局限性 只能处理已经有良好参数的体系只能处理已经有良好参数的体系,此外此外,不能处理氢键不能处理氢键,过渡态过渡态,以及不能
30、处理没有良好参数的原子以及不能处理没有良好参数的原子等。等。AM1PM3HFMP2R(H-F)0.830.940.920.92R(H4-F2)2.091.741.881.84R(F-F)2.872.652.792.76A(F-H4-F)159.3159.8168.3170.6A(H3-F-F)143.8143.1117.7111.8例例:HF二聚体在二聚体在AM1,PM3,HF/6-31+G(d)和和MP2/6-311+G(2d,2p)优化的构型优化的构型 1.4.3 Hartree-Fock理论的局限性理论的局限性 Hartree-Fock方法对于稳定的分子和一些过渡金属方法对于稳定的分子和
31、一些过渡金属的处理能够得到很好的结果,是一个很好的基本的理论的处理能够得到很好的结果,是一个很好的基本的理论方法,但是由于其忽略了方法,但是由于其忽略了电子相关电子相关,在一些特殊体系的,在一些特殊体系的应用上就显得不足。应用上就显得不足。Electron Correlation(电子相关电子相关):Fermi(费米费米)相关相关-自旋相同的电子由于自旋相同的电子由于Pauli不相容不相容原理有相互回避的趋势,使能量降低。原理有相互回避的趋势,使能量降低。Couloub(库仑库仑)相关相关-所有电子由于库仑排斥作用有所有电子由于库仑排斥作用有相互回避的趋势,使能量降低。相互回避的趋势,使能量降
32、低。Electron Correlation The most significant drawback to HF theory is that it fails to adequately represent electron correlation.Ecorr=E NR E HF Configuration Interactions -excited states are included in the description of an electronic state Many Body Perteubation Theroy -based upon Rayleigh-Schrdin
33、ger perturbation theroy.1.4.4 Electron Correlation and Post-SCF Methods 电子相关和后SCF方法在在Gaussian中,这些方法有:中,这些方法有:Moller-Plesset微扰微扰:由二级到五级的关键词是由二级到五级的关键词是MP2,MP3,MP4,MP5。提供优化方法的有。提供优化方法的有MP2和和MP3,MP4(不不包括包括MP4SDQ),频率分析提供,频率分析提供MP2。Quadratic CI:一般包括三重和四重:一般包括三重和四重QCISD,QCISD(T),QCISD(TQ),QCISD提供优化。提供优化。C
34、oupled Cluster methods电子相关簇方法电子相关簇方法:包括二重:包括二重激发算符激发算符(能量和优化能量和优化),单重和二重激发算符,单重和二重激发算符(能量能量)以及可以及可选的三重激发算符选的三重激发算符CCD,CCSD,CCSD(T)。HF/STO-3G73.9HF97.9MP2144.9MP3137.9MP4(SDTQ)141.8QCISD138.8QCISD(T)140.6实验值141.2例:例:HF键能键能 1.4.5 Density Functional Theory Methods 密度泛函理论方法 DFT方法通过泛函来计算电子相关,其将电子能量分为方法通过
35、泛函来计算电子相关,其将电子能量分为几个部分:动能,电子几个部分:动能,电子-核相互作用,库仑排斥,以及其余核相互作用,库仑排斥,以及其余部分的交换相关项,最后一部分又根据密度泛函方法分解部分的交换相关项,最后一部分又根据密度泛函方法分解为交换和相关项为交换和相关项。所有项只是电子密度的函数。所有项只是电子密度的函数。Gaussian提供的最有名的泛函是:提供的最有名的泛函是:B3LYP和和B3PW91 1.5 资源的使用资源的使用不同方法理论上的资源消耗不同方法理论上的资源消耗 CPU CPU 内存内存 磁盘磁盘 实际消耗实际消耗CPU CPU 磁盘磁盘传统传统SCF NSCF N4 4 N
36、 N2 2 N N4 4 N N3.5 3.5 N N3.53.5直接直接SCF NSCF N4 4 N N2 2 -N -N2.7 2.7 N N2 2MP2 MP2 能量能量 传统传统 ONON4 4 N N2 2 N N4 4 ON ON4 4 N N4 4 直接直接 ONON4 4 OVN -O OVN -O2 2NN3 3 N N2 2半直接半直接 ONON4 4 N N2 2 VN VN2 2 O O2 2NN3 3 VN VN2 2MP3 MP3 梯度梯度 传统传统 ONON4 4 N N2 2 N N4 4 ON ON4 4 N N4 4 直接直接 ONON4 4 N N3 3
37、 -O -O2 2NN3 3 N N2 2半直接半直接 ONON4 4 N N2 2 N N3 3 O O2 2NN3 3 N N3 3MP4MP4QCISD(T)OQCISD(T)O3 3V V4 4 N N2 2 N N4 4 O O3 3V V4 4 N N4 4Full-CI (O+V)!/O!V!)Full-CI (O+V)!/O!V!)2 2作业作业1 1:说明每个基组的含义:说明每个基组的含义,并写出得出每并写出得出每个数据的计算过程。个数据的计算过程。基基 组组基函数个数基函数个数使用使用轨道轨道类类 型型第二周期原子第二周期原子H H,HeHe STO-3GSTO-3G 6d
38、6d3-21G3-21G 6-31G6-31G*6-31G6-31G*6-31+G(d)6-31+G(d)6-31+G(d,p)6-311+G(d,p)5d5d 基基 组组 基函数个数基函数个数使 用使 用轨 道轨 道类型类型第二周期原子第二周期原子H,He STO-3G1s2s2p(5)1s2s2p(5)1s(1)1s(1)6d3-21G1s2s2s2p2p(9)1s2s2s2p2p(9)1s1s(2)1s1s(2)6-31G*1s2s2s2p2p3d(11s2s2s2p2p3d(15)5)1s1s(2)1s1s(2)6-31G*1s2s2s2p2p3d(11s2s2s2p2p3d(15)5
39、)1s1s2p1s1s2p(5)(5)6-31+G(d)1s2s2s2p2p3s3p1s2s2s2p2p3s3p3d3d(19)(19)1s1s(2)1s1s(2)6-31+G(d,p)1s2s2s2p2p3s3p1s2s2s2p2p3s3p3d3d(19)(19)1s1s2p1s1s2p(5)(5)6-311+G(d,p)1s2s2s2s2p2p1s2s2s2s2p2p2p3s3p3d(22)2p3s3p3d(22)1s1s1s1s1s1s2p(6)2p(6)5dCHCH4 4分子在分子在6-31+G(d,p)6-31+G(d,p)基组下的基函数的个基组下的基函数的个数是多少?数是多少?作业作业2 2:CHCH4 4分子在分子在6-31+G(d,p)6-31+G(d,p)基组下的基函数的个基组下的基函数的个数是多少?数是多少?作业作业2 2:H:1s1s2s2p(6)H:1s1s2s2p(6)C:1s2s2s2p2p3s3p3d(18)5dC:1s2s2s2p2p3s3p3d(18)5d4 46 618184242