1、虚拟 筛选定义u虚拟筛选(虚拟筛选(virtual screening,VS)也称计算机筛选,即在进行生物活性筛也称计算机筛选,即在进行生物活性筛选之前,在计算机上对化合物分子进行预筛选之前,在计算机上对化合物分子进行预筛选,以降低实际筛选化合物数目,同时提高选,以降低实际筛选化合物数目,同时提高先导化合物发现效率。先导化合物发现效率。化合物数据库化合物数据库虚拟的虚拟的实际存在的实际存在的优势优势不消耗样品,降低筛选成本不消耗样品,降低筛选成本考虑化合物分子的药动学性质和毒性,增加筛选的内涵考虑化合物分子的药动学性质和毒性,增加筛选的内涵虚拟筛选的效率例:蛋白酪氨酸磷酸酯酶1B1B(PTP1
2、BPTP1B)抑制剂的发现经虚拟筛选,再作生物学测试,虚拟筛选的命中率比随机的高通量筛选提高1,7001,700倍虚拟筛选技术的分类根据靶点的结构知识根据靶点的结构知识基于靶点结构的虚拟筛选基于靶点结构的虚拟筛选基于配体相似性的虚拟筛选基于配体相似性的虚拟筛选分子对接分子对接药效基团搜寻药效基团搜寻一、基于靶点结构的虚拟筛选 分子对接起源:受体-配体的锁和钥匙模型 配体配体 受体受体 复合物复合物 对接对接 受体和配基之间通过能量匹配和空间匹配而受体和配基之间通过能量匹配和空间匹配而相互识别形成分子复合物,并预测复合物结构的操作过相互识别形成分子复合物,并预测复合物结构的操作过程程基于分子对接
3、的筛选方法基于一个靶点(酶、受体、离子通道、核酸等)的三基于一个靶点(酶、受体、离子通道、核酸等)的三维结构,常常采用分子对接的虚拟筛选方法从小分子数维结构,常常采用分子对接的虚拟筛选方法从小分子数据库中找到能与之匹配的候选化合物。所谓分子对接是据库中找到能与之匹配的候选化合物。所谓分子对接是基于两个或多个分子之间通过几何匹配和能量匹配相互基于两个或多个分子之间通过几何匹配和能量匹配相互识别的过程,即在药物分子和靶酶产生药效的反应过程识别的过程,即在药物分子和靶酶产生药效的反应过程中,两个分子先充分接近,然后采取合适的取向,使两中,两个分子先充分接近,然后采取合适的取向,使两者在必要的部位相互
4、契合、发生作用,进而通过构象调者在必要的部位相互契合、发生作用,进而通过构象调整形成稳定的复合物整形成稳定的复合物。基于分子对接的筛选方法在通常的分子对接中,小分子的构象是柔性的,如在通常的分子对接中,小分子的构象是柔性的,如果筛选一个分子数目过多的数据库(如果筛选一个分子数目过多的数据库(如ACD-SCACD-SC),),那么整个虚拟筛选过程将非常耗时。因此,通常可那么整个虚拟筛选过程将非常耗时。因此,通常可先设定一些条件,比如先设定一些条件,比如Lipinski Lipinski 的的“5 5 倍律经验规则倍律经验规则”等一系列类药性条件,先对该库进行过滤,从而快等一系列类药性条件,先对该
5、库进行过滤,从而快速缩小三维数据库的规模。另外,如果针对某个靶速缩小三维数据库的规模。另外,如果针对某个靶点,已经获得相关抑制剂的结构,则可采用分子形点,已经获得相关抑制剂的结构,则可采用分子形状匹配的方法(如状匹配的方法(如FlexSFlexS),对数据库进行初筛,保),对数据库进行初筛,保留其中与已知抑制剂形状相似的分子。经过这些初留其中与已知抑制剂形状相似的分子。经过这些初步筛选之后,再采用基于分子对接的虚拟筛选从数步筛选之后,再采用基于分子对接的虚拟筛选从数据库中找出可能与靶点相互匹配的有机小分子。据库中找出可能与靶点相互匹配的有机小分子。类药五原则类药五原则类药五原则(rule of
6、 five)也称为Lipinski规则,其内容如下:一个小分子药物中要具备以下性质:1.分子量小于500;2.氢键给体数目小于5;3.氢键受体数目小于10;4.脂水分配系数小于5;5.可旋转键的数量不超过10个。辉瑞公司资深药物化学家Christopher A.Lipinski在1997年提出更好的药代动力学性质,更高的生物利用度分子对接筛选常用的软件DOCK 是应用比较广泛的对接软件之一,由是应用比较广泛的对接软件之一,由Kuntz 等设计等设计开发。它能自动模拟配体在受体活性位点的作用情况,并记开发。它能自动模拟配体在受体活性位点的作用情况,并记录下最佳的相互作用方式。而且该软件能对配体的
7、三维数据录下最佳的相互作用方式。而且该软件能对配体的三维数据库进行搜索,因此被广泛用于基于受体结构的对接筛选。库进行搜索,因此被广泛用于基于受体结构的对接筛选。在在DOCK 中,活性位点的确定是通过软件包中的中,活性位点的确定是通过软件包中的sphgen 程程序来完成,它通过在受体表面所有的凹陷区形成负像,并对序来完成,它通过在受体表面所有的凹陷区形成负像,并对这些负像进行聚类分析,用户则从中挑选出所需要的一类作这些负像进行聚类分析,用户则从中挑选出所需要的一类作为活性区域的位置。在生成负像的基础上,就可以进行配体为活性区域的位置。在生成负像的基础上,就可以进行配体分子和受体活性口袋之间的匹配
8、,配体分子也采用一组球集分子和受体活性口袋之间的匹配,配体分子也采用一组球集来表示,并且来表示,并且DOCK 进行对接时,配体可以是刚性的,也可进行对接时,配体可以是刚性的,也可以设定为柔性以设定为柔性。分子对接筛选常用的软件在对接结束后,在对接结束后,DOCK 程序则采用自带的打分函数程序则采用自带的打分函数对配体对配体-受体之间的匹配情况进行评价,其中包括原受体之间的匹配情况进行评价,其中包括原子接触得分和能量得分。所谓接触原子是指在一定子接触得分和能量得分。所谓接触原子是指在一定距离之内的原子(一般定义为距离之内的原子(一般定义为4.5),如果配体和),如果配体和受体之间存在这个距离内的
9、原子,则认为产生碰撞,受体之间存在这个距离内的原子,则认为产生碰撞,作为罚分从总得分中扣除;能量得分主要来自配体作为罚分从总得分中扣除;能量得分主要来自配体和受体间非键相互作用能。和受体间非键相互作用能。AUTODOCK 也是常用的分子对接软件包之一,由Scripps 的Olson 科研小组开发。它采用模拟退火和遗传算法寻找受体和配体最佳的结合位置,用半经验的结合自由能方法来评价两者之间的匹配情况。为了加快计算速度,AUTODOCK 采用了格点对接的方法,格点上保存的是探针原子和受体之间的相互作用能,包括了范德华相互作用能、静电作用能和氢键相互作用能等。在AUTODOCK3.0 以前,只能实现
10、单个配体和受体分子之间的对接,但目前的版本(AUTODOCK4.0)已经能实现对数据库对接筛选的功能。除此之外,还有一些常用的对接筛选程序,比如FlexX、GOLD、Affinity 等,它们都各自开发出一套相应的对接筛选策略、打分函数,使得对接筛选的应用越来越广泛。基于结构虚拟筛选一般流程图建立大量化合物的三维结构数据库建立大量化合物的三维结构数据库将库中的分子逐一与靶标分子进行将库中的分子逐一与靶标分子进行“对接对接”(dockingdocking)优化小分子化合物的取向及构象等优化小分子化合物的取向及构象等找到小分子化合物与靶标大分子作找到小分子化合物与靶标大分子作用的最佳构象用的最佳构
11、象计算其相互作用及结合能计算其相互作用及结合能完成所有分子的对接计算完成所有分子的对接计算找出与靶标分子结合的最佳分子找出与靶标分子结合的最佳分子对接方法尚需解决的问题对接方法尚需解决的问题分子的柔性分子的柔性溶剂化效应溶剂化效应打分函数打分函数(一)靶点结构的预处理靶点结构的预处理1、靶点的检验2、靶点的处理3、确定靶点的配体结合口袋1 1、靶点的检验、靶点的检验晶体结构(X射线测定)溶液结构(NMR测定)分辨率R 因子温度因子几何构型的准确率小于2.5Rfree28%R25%重点关注部位不大于整个分子的平均温度因子角至少有90%落在允许区域内PDB多个构象Profile-3D:三维结构和氨
12、基酸序列相容性ProsaII:残基之间相互作用能量评估拉氏图:检测三维结构立体构型好坏2 2、靶点的处理、靶点的处理补齐晶体结构中缺失原子和残基补齐晶体结构中缺失原子和残基为大分子加上氢,并分配相应电荷为大分子加上氢,并分配相应电荷确定带电残基的质子化状态确定带电残基的质子化状态去除不重要的小分子去除不重要的小分子3 3、确定靶点的配体结合口袋、确定靶点的配体结合口袋靶点分子为复合物靶点分子为复合物靶点分子不是复合物靶点分子不是复合物实验数据未知实验数据未知为配体为中心的5-7区域内的氨基酸残基根据同源蛋白或定点变突的数据确定利用软件搜寻小分子数据库的来源小分子数据库的来源商用化合物数据库商用
13、化合物数据库公司或研究机构自有数据库公司或研究机构自有数据库设计的虚拟化合物库设计的虚拟化合物库 常用的数据库有常用的数据库有MDLMDL数据库、数据库、SPECSSPECS数据库和数据库和CNPDCNPD(Chinese Natural Product DatabaseChinese Natural Product Database)数据库)数据库(二)小分子数据库的预处理(三)分子对接 概念:概念:将配体分子放置到受体将配体分子放置到受体大分子的活性位点中,预测小分大分子的活性位点中,预测小分子与受体结合构象及作用能的过子与受体结合构象及作用能的过程。是基于受体分子结构虚拟筛程。是基于受体
14、分子结构虚拟筛选的核心。选的核心。目的:目的:从小分子数据库中发现合从小分子数据库中发现合适的化合物作为受体大分子的配适的化合物作为受体大分子的配体。从整体上考虑配体与受体结体。从整体上考虑配体与受体结合的效果。合的效果。系统搜索随机搜索确定性搜索片段生长法构象搜索法构象库方法蒙特卡罗法模拟退火遗传算法禁忌搜索法分子动力学模拟关键环节:配体结合构象的优化关键环节:配体结合构象的优化目的:目的:评判配体分子和受体结合能力的强弱。含义:含义:先对同一个分子的不同结合构象,评价各构象的结合好坏。再对数据库中的不同分子的最好结合构象进行评价,以得到最终的结合能力从高到低的化合物分子清单。(四)打分函数
15、 1、基于立场的打分函数 2、半经验的自由能打分函数 3、基于知识的打分函数 4、“一致性”打分(五)成功实例人碳酸酐酶与其抑制剂复合物 2002 年Grunberg 等采用基于分子对接的虚拟筛选方法成功地找到了多种人碳酸酐酶(humancarbonic anhydrase)的抑制剂。在整个设计过程中,他们采用了多次初筛的办法将Maybridge 数据库(61 186 个分子)和LeadQuest 数据库(37 841 个分子)进行过滤。首先利用Lipinski 的“5 规则”将数据库缩小为5 904 个;然后利用FlexS 与已知抑制剂进行相似性筛选,得到了100 个候选化合物;最后将这10
16、0 个分子利用FlexX 程序进行对接筛选,从中挑选出13 个进行生物活性测试,结果7 个分子的IC50 值达到了微摩尔级别。见图。抗艾滋病药物的发现虚拟筛选艾滋病病毒,人类免疫缺陷病毒human immunodeficiency virus,HIVhuman immunodeficiency virus,HIV1.HIV-1蛋白酶(HIV-PR),所催化的水解反应在艾滋病病毒导入人体细胞过程中起着重要的作用2.高效的HIV-PR抑制剂为治疗艾滋病的有效药物3.肽类HIV-PR抑制剂生物性质不稳定,吸收性差,易被代谢分解,因此口服给药无效1.X-射线晶体结构2.搜寻数据库3.生物测试:高选择性
17、,高活性(Ki=0.1 nM)抗SARS冠状病毒药物的设计基于SARS-CoV 3CL蛋白酶的虚拟筛选严重急性呼吸道综合征严重急性呼吸道综合征病原体病原体SARSSARS冠状病毒冠状病毒SARS-Cov 感染宿主细胞起重要作用的结构蛋白 E蛋白(蛋白(small envelope protein,小信封蛋白),小信封蛋白)S蛋白(蛋白(spike glycoprotein,刺突糖蛋白),刺突糖蛋白)M蛋白(蛋白(membrane protein,膜蛋白),膜蛋白)N蛋白(蛋白(nucleocapsid protein,核衣壳蛋白),核衣壳蛋白)多聚酶(多聚酶(polymerase)类类3C蛋白
18、酶(蛋白酶(3C like proteinase,3CL)3CL蛋白酶作为抗SARS药物筛选靶点的优点 在冠状病毒复制过程中起着重要作用在冠状病毒复制过程中起着重要作用 有许多已知抑制剂,便于迅速开发有许多已知抑制剂,便于迅速开发 较易表达,有利于加紧研究较易表达,有利于加紧研究 有较高的同源性,可用同源法模建三维结构模型有较高的同源性,可用同源法模建三维结构模型步骤1.同源模建(1)3CL蛋白酶序列(GenBank)与各类冠状病毒蛋白酶序列(PDB)作序列分析和同源性分析(BLAST程序)人冠状病毒;鼠科肝炎病毒;猪传染性腹泻病毒;猫传染性腹膜炎病毒;禽传染性支气管炎病毒;猪冠状病毒;传染性
19、胃肠炎病毒(2)传染性胃肠炎病毒(TGEV)的蛋白酶Mpro与3CL蛋白酶有极高的同源性,特别在底物结合口袋(活性部位)(3)以TGEV Mpro的X-射线晶体结构为模板,模建3CL蛋白酶三维结构(Sybyl 6.8/SiteID程序)结果(1 1)所建模型与)所建模型与TGEV MTGEV Mpro pro 晶体结构基本重叠晶体结构基本重叠(2 2)3CL3CL蛋白酶的折叠方式与蛋白酶的折叠方式与TGEV MTGEV Mpropro相同,结合口袋相同,结合口袋的结构以及空间特征几乎一样的结构以及空间特征几乎一样3CL3CL蛋白酶结构与Mpro蛋白酶晶体结构的重叠图3CL3CL蛋白酶的缎带模型
20、步骤2.分析酶-配体作用模型两种蛋白酶的结合部位两种蛋白酶的结合部位(Sybyl 6.8/MOLCAD程序程序)中中,小分子小分子C能以同样的方式与两种酶的结合口袋契合能以同样的方式与两种酶的结合口袋契合A.TGEV MA.TGEV MPRoPRo蛋白酶B.SARS 3CLB.SARS 3CL蛋白酶C.C.蛋白酶抑制剂两种蛋白酶的底物结合口袋的表面特征两种蛋白酶的底物结合口袋的表面特征 3CL蛋白酶模建模型或TGEV Mpro的晶体结构均可作为筛选抗SARS药物的结构模型步骤3.虚拟筛选以以SARSSARS冠状病毒冠状病毒3CL3CL蛋白酶三维结构模型和蛋白酶三维结构模型和TGEV MTGEV
21、 Mpropro 为筛选模型为筛选模型作虚拟筛选(作虚拟筛选(SGI Origin 3800SGI Origin 3800超级计算机和超级计算机和392CPU392CPU的神威的神威1 1号超级计号超级计算机)算机)ACDACD数据库、数据库、MDDRMDDR数据库、数据库、SPECSSPECS数据库、中国天然产物数据库数据库、中国天然产物数据库(CNPDCNPD)和国家药物筛选中心内部样品库)和国家药物筛选中心内部样品库共数十万个化合物共数十万个化合物(1 1)DOCK 4.0DOCK 4.0作初筛,作初筛,选出得分高的前选出得分高的前10001000个化合物;个化合物;(2 2)用)用Cs
22、coreCscore软件和软件和AutoDock 3.0AutoDock 3.0软件作评价,从每个数据库中挑选出软件作评价,从每个数据库中挑选出100100个得分最高的化合物个得分最高的化合物结果:共找到结果:共找到300300个可能具有抗个可能具有抗SARSSARS冠状病毒潜力的候选化合物冠状病毒潜力的候选化合物步骤4 药理测试(1 1)用病毒)用病毒3CL3CL蛋白酶分子水平筛选模型筛选候选化合物蛋白酶分子水平筛选模型筛选候选化合物发现发现了了7 7个具有高活性的化合物个具有高活性的化合物(2 2)在)在P3P3实验室中作实验室中作SARSSARS病毒感染细胞水平的测试,发现病毒感染细胞水
23、平的测试,发现5-HT5-HT受体受体拮抗剂(拮抗剂(肉桂硫胺,肉桂硫胺,CinanserinCinanserin)有明显的抗)有明显的抗SARSSARS病毒感染和保病毒感染和保护细胞的作用护细胞的作用(3 3)申请专利,以)申请专利,以CADDCADD作结构优化作结构优化例 美普他酚双配体衍生物与AChE的对接研究阿尔茨海默症(阿尔茨海默症(Alzheimers DiseaseAlzheimers Disease,ADAD)与乙酰胆碱()与乙酰胆碱(AChACh)水平降低和对乙酰胆碱酯酶水平降低和对乙酰胆碱酯酶AChEAChE诱导的诱导的-淀粉样蛋白(淀粉样蛋白(AA)聚集)聚集有关有关治疗
24、治疗AD AD 的药靶:的药靶:乙酰胆碱酯酶(乙酰胆碱酯酶(AChEAChE)和)和-淀粉样蛋白淀粉样蛋白AChEAChE抑制剂:美普他酚(抑制剂:美普他酚(MeptazinolMeptazinol)研究发现研究发现AA的聚集与的聚集与AChEAChE上的外周阴离子位点(上的外周阴离子位点(PASPAS)有关)有关 Xie Q et al.Xie Q et al.J.Med.ChemJ.Med.Chem.2008,51(7):2027.2008,51(7):2027美普他酚双配体类似物的设计在美普他酚分子中通过引入不同长度连接链,希望使另在美普他酚分子中通过引入不同长度连接链,希望使另一个配体
25、能与一个配体能与PAS相互作用相互作用合成合成n=2-12n=2-12的多个美普他酚双配体类似物,发现的多个美普他酚双配体类似物,发现n=9n=9的的AChEAChE抑制活性最强抑制活性最强(ICIC50503.9nM3.9nM),比美普他酚高比美普他酚高2 2万倍,同时对万倍,同时对AChEAChE诱导的诱导的AA聚集具有明聚集具有明显的抑制作用(显的抑制作用(ICIC50507979MM),具双重作用具双重作用.以分子对接证明作用模式 小鼠乙酰胆碱酯酶(小鼠乙酰胆碱酯酶(mAChE)PDB数据库中的琥珀酰数据库中的琥珀酰胆碱与胆碱与mAChE的复合物(的复合物(PDB编号:编号:2HA2)双配体分子(双配体分子(n=9)的三维结构)的三维结构以以CORINA软件生成,软件生成,将将N原子质子化,再用原子质子化,再用Tripos力场进行分子力学优化力场进行分子力学优化 以以GOLD 3.0进行分子对接,最后用进行分子对接,最后用SYBYL/CScore一致性一致性打分和半经验自由能评价函数打分和半经验自由能评价函数XSCORE打分,评价出最优结打分,评价出最优结合构象合构象对接模型:证明了AChE抑制作用和A聚集抑制作用单晶X衍射证明:结合方式与对接相似Thank you