电子教案与课件：化学信息学-第十一课.ppt-资源下载-163文库_上传原创PPT模板、课件、文档赚钱

电子教案与课件：化学信息学-第十一课.ppt

1、1化学模式识别化学模式识别(二二)定量构效关系(Quantitative Structure-Activity Relationship,QSAR)是依据化合物的结构决定其性质这一基本假设而建立的一种使用模型来表征分子结构与其某种活性之间的定量关系的方法。2在结构-活性（结构-性质）的定量关系研究中，主要是以分子的加和性为基础的，认为分子中的原子、基团和化学键等对分子某种性质的贡献都是固定的，因此可以将各种贡献进行加和。这种定量研究分子结构和活性或性质关系的方法称为定量构效关系方法。3QSAR模型可以分为二维定量构效关系（2D-QSAR）、三维定量构效关系（3D-QSAR）和多维定量构效关系（

2、nD-QSAR）三类。4二维定量构效关系（2D-QSAR）是发展最早的一类定量构效关系研究方法。传统的二维定量构效关系（2D-QSAR）方法很多，其中具有典型代表性的有两种：Hansch分析法和Free-Wilson分析法。5美国波蒙拿学院的Hansch在1962年提出的Hansch方程，也称自由能相关模型或线性自由能模型。Hansch方法的核心是使用化学计量学方法建立一个描述药物分子性质的各种参数和生物活性之间关系的方程。6(1)化合物的计算机辅助设计与合成；(2)化合物活性的测定；(3)测定化合物的理化与结构参数；(4)进行定量构效关系研究；(5)评估定量构效关系模型。7优点：1.理化基础

3、比较明确，研究者可以很容易的理解QSAR方程的意义。2.一种经典的、被广泛应用、理论最完善的QSAR 方法81.一元回归对一元线性关系的识别具有较好的效果，但不易解释作用机理；2.多元回归对参数建模较为有效，但要求建模的变量数不能太多，必须有恰当的取代基性质参数3.只能适用于系列同源物的定量结构活性关系研究，主要针对小分子化合物，对于生物系统中较复杂大分子就显得无能为力4.建立在化合物二维结构基础上的物化参数只能表征化合物中原子间的连接顺序、方式以及可能存在的几何异构体，而对于各种构象异构体不能明确表征9该方法假定分子的母体化合物和各取代基的活性是恒定的，可以通过加和的方式得到整个分子的活性。

4、即药效分子的生物活性与取代基之间的关系可以用下式表达：活性=A+GirXir+GjsFjs（11-3）式中A被定义为一系列化合物生物活性的平均值，Xir表示在r位置上存在(=1)或不存在(=0)第i个官能团；Fjs表示在s位置上存在(=1)或不存在(=0)第j个结构因素；Gir和Gis分别表示Xir和Fjs对活性的影响大小。10优点：对化合物作用时活性构象变化及生物体系中的渗透性等因素进行了忽略，根据化合物的生物活性和结构输出结果，活性与官能团特征参数间的关系得到直观反映，可从整体上认识化合物，初步判断官能团的重要性11缺点：基准化合物的选择较难；未考虑药物与生物体的相互作用，以存在或不存在来

5、分析太武断，不能对许多现象进行合理的解释；同样要求较多的化合物数目；所选的结构参数缺乏明确的物理意义1220世纪80年代以来，Cramer等人提出以小分子化合物和受体分子的三维结构为基础，根据他们之间相互作用能量来定量的分析分子结构和生物活性之间关系的方法，我们统称为三维定量构效关系（3D-QSAR）方法。131）比较分子场分析(comparative molecular field analysis,CoMFA)方法2）比较分子相似因子分析法3）距离几何法4）分子形状分析法5）虚拟受体方法141988年，Cramer等提出了基于分子空间结构的比较分子场方法即所谓CoMFA方法。CoMAF方法

6、通过分析分子在三维空间内的疏水场、静电场和立体场分布，以这些参数为变量对药物活性做回归分析。15（1）首先确定药物分子的活性构象，再按合理的重叠规则进行药物分子的构象叠合；（2）在叠合好的分子周围均匀划分固定步长的格点，在每个格点上用一个探针离子来评价格点上的分子场的空间分布特征；（3）接着通过偏最小二乘方法建立化合物活性和分子场特征之间的关系并给出各种分子面的等势能面；（4）根据分子的等势能面绘制相互作用的CoMFA系数图，从而可以直观地看到不同格点的力场对生物活性的影响。16计算可以简单的分为四个步骤：计算可以简单的分为四个步骤：在CoMSIA方法中，由于采用了与距离相关的高斯函数形式，可

7、以有效地避免在传统CoMFA方法中由静电场和立体场的函数形式所引起的缺陷。17假定配体分子的活性基团与受体分子间的结合位点之间是相互作用的，它首先将药物分子划分为若干功能区块定义药物分子活性位点，计算低能构象时各个活性位点之间的距离，形成距离矩阵；同时定义受体分子的结合位点，获得结合位点的距离矩阵，通过活性位点和结合位点的匹配为每个分子生成结构参数，对生理活性数据进行统计分析。181980年，Hopfinger等提出了分子形状分析法(molecularshape analysis,MSA)，分子形状分析认为药物分子的药效构象是决定药物活性的关键，比较作用机理相同的药物分子的形状，以各分子间重叠

8、体积等数据作为结构参数进行统计分析获得构效关系模型。19虚拟受体方法(pseudoreceptor model,PM)是3D-QSAR和CoMFA方法的延伸与发展，其基本思路是采用多种探针粒子在药物分子周围建立一个虚拟的受体环境，以此研究不同药物分子之间活性与结构的相关性。20多维定量构效关系（nD-QSAR）主要是指4D-QSAR和5D-QSAR。在经典的3D-QSAR分析基础上考虑到受体的结构和活性212D-QSAR方法大都使用具有明确物理意义的参数或结构描述符，适用于药动学和体内的活性数据，所构建模型易解释。可以不依赖于分子构象、叠合方式、探针、生物活性的选择等。2D-QSAR研究可以不

9、借助于大型计算软件和高性能计算机，研究成本低，计算时间短。223D-QSAR是引入了药物分子三维结构信息进行定量构效关系研究的方法，间接地反映了药物分子与大分子相互作用过程中两者之间的非键相互作用特征，相对于二维定量构效关系有更加丰富的信息量。由于3D-QSAR方法采用了缺乏明确物理化学意义的偏最小二乘潜参数，不能给出定量的合理的概念，仅适用于绝大部分药效学数据。23多元线性回归主成分回归偏最小二乘回归投影寻踪回归非线性方法24假定被解释变量与多个解释变量之间具有线性关系，是解释变量的多元线性函数，称为多元线性回归模型。即 (11-4)其中为被解释变量，为个解释变量，为个未知参数，为

10、随机误差项。25被解释变量的期望值与解释变量的线性方程为：(11-5)称为多元总体线性回归方程，简称总体回归方程。26所谓主成分回归就是利用主成分分析对活性影响最大的几个主成分建立定量构效关系模型。当数据存在较大噪声或较多变量时，可考虑采用主成分回归方法。27偏最小二乘法(Partial Least Squares,PLS)是在主成分分析的基础上发展起来的一种统计方法。它与主成分分析的不同在于：主成分分析仅仅考虑了自变量的相互作用,而PLS在考虑自变量的同时也考虑了因变量的作用,通过折衷各自空间内的因子,使模型较好地同时描述自变量和因变量。28利用计算机技术，把高维数据通过某种组合，投影到

11、低维(1-3维)空间上，并通过极小化某个投影指标，寻找出能反映原高维数据结构或特征的值，在低维空间上对数据结构进行分析，以达到研究和分析高维数据的目的。29人工神经网络(Artificial Neural Network,ANN)支持向量机(Support Vector Machines,SVM)核方法30药物设计是创新药物研发的重要组成部分，也是现代医药产业发展的基本动力。31类药性是指药物的特征决定其不同于其它的化合物。32脂水分布系数是指化合物在有机相（一般用正辛醇）和水相中的平衡浓度比值，Co为有机相中的浓度，Cw为水相中的浓度。由于P通常较大，所以一般使用其对数值 LogP。33n为

12、所有片段的种类数，ai为第i种片段在分子中的个数，fi为第i种片段的脂水分布系数，B通常为常数。脑血分配系数（Brain blood Partitioning）是指一种化合物在脑组织间液和血液中的平衡浓度的比值。LogBB=log(C brain/C blood),其中C brain为化合物在脑组织中的平衡浓度，C blood为化合物在血液中的平衡浓度。34PAPC（cm/s）=穿透量/理论穿透总量，其中理论穿透总量=化合物的浓度面积时间。由于肠穿透性和血脑屏障透过性都是属于跨膜行为，因此我们可以借鉴脑血分配系数的QSAR预测方法来预测肠穿透性。35水溶性是指药物分子在水中的溶解能力，Hans

13、ch于1968年就观察到液态有机化合物的水溶性和其脂水分布系数之间存在着如下关系：LogS=-1.339LogP+0.987，LogS表示化合物的水溶性（S表示化合物在其饱和溶液中的浓度），LogP为脂水分布系数。36毒性是指化合物对生物系统产生的不利影响。37这里n为化合物性质的个数，ai为相应性质的系数，fi为化合物的第i种性质，B通常为常数。精准医疗（Precision Medicine）是以个体化医疗为基础、随着基因组测序技术快速进步以及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。精准医疗服务主要提供精准诊断、精准治疗与精准药物。38高通量筛选(high thro

14、ughput screening,HTS)是以分子和细胞水平的实验方法为基础,在微孔板上以自动化操作系统执行实验过程,通过灵敏快速的检测仪器采集实验数据、运用计算机对实验数据进行实验结果的分析处理。39例1：Hansch方法的实质是寻找化合物的性质与其生物活性或其它化学性质之间的关系。如Hansch和Lien等人对的抗肾上腺活性与其物化参数进行了Hansch方法分析，具体情况如下表：40表11-2 N,N二甲基-a-溴苯乙胺的间、对位二取代化合物的抗肾上腺素活性和理化性质（=亲脂性参数，+=苄基阳离子的哈米特常数，Es=塔夫脱立体参数）41当我们仅考虑3-5列的时候得到的方程如下，log(l/C)=1.151(0.19)-1.464(0.38)+7.817(0.19)（11-26）(n=22;r=0.945;s=0.196;F=78.63)此处，n为样本数，r为相关系数，s为标准偏差，F为Fisher值。预测结果为第7列log(l/C)“计算值1”的值。当我们综合考虑3-6列的时候得到的方程如下，log(l/C)=1.259(0.19)-1.460(0.34)+0.208(0.17)+7.619(0.24)（11-27）(n=22;r=0.959;s=0.173;F=69.24)预测结果为第8列“计算值2”的值。4243

邮箱/手机：
温馨提示：	系统将以此处填写的邮箱或者手机号生成账号和密码，方便再次下载。如填写123，账号和密码都是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？