第3章蛋白质工程课件.ppt

上传人(卖家):晟晟文业 文档编号:5175604 上传时间:2023-02-16 格式:PPT 页数:118 大小:954KB
下载 相关 举报
第3章蛋白质工程课件.ppt_第1页
第1页 / 共118页
第3章蛋白质工程课件.ppt_第2页
第2页 / 共118页
第3章蛋白质工程课件.ppt_第3页
第3页 / 共118页
第3章蛋白质工程课件.ppt_第4页
第4页 / 共118页
第3章蛋白质工程课件.ppt_第5页
第5页 / 共118页
点击查看更多>>
资源描述

1、第二专题第三章 蛋白质工程 引引 言言 19781978年,年,美国美国HutchisonHutchison用寡脱氧核糖核苷酸作体外诱变剂,成功地实现了定位突变试验定位突变试验,培育出多种具有生物学特性的突变株。19811981年,年,美美国国GeneGene公司厄尔默公司厄尔默(K(KU1mer)U1mer)将此定位突变试验冠以“蛋白质工程蛋白质工程”。经过多年的发展,蛋白质工程已经成为生命科学中的一个重要分支。蛋白质工程的定义蛋白质工程的定义:通过蛋白质化学、蛋白蛋白质化学、蛋白质晶体学和动力学质晶体学和动力学的研究获取关于蛋白质物理、蛋白质物理、化学化学等方面的信息,在此基础上对编码该蛋

2、白的对编码该蛋白的基因进行有目的的设计改造基因进行有目的的设计改造,并通过基因工程等手段将其进行表达和分离纯化表达和分离纯化,最终将其投入实实际应用。际应用。蛋白质工程是在基因重组技术、生物化学、基因重组技术、生物化学、分子生物学、分子遗传学等学科分子生物学、分子遗传学等学科的基础之上,融合了蛋白质晶体学、蛋白质动力学、蛋白质化学蛋白质晶体学、蛋白质动力学、蛋白质化学和计算机辅助设计和计算机辅助设计等多学科而发展起来的新兴研究领域。蛋白质工程蛋白质工程内容内容主要有两个方面:(1)根据需要合成具有特定氨基酸序列和空间结构特定氨基酸序列和空间结构的蛋白质;(2)确定蛋白质化学组成、空间结蛋白质化

3、学组成、空间结构与生物功能构与生物功能之间的关系。在此基础上,实现从氨基酸序列预测蛋白质的空间结构和生物功能,设计合成具有特定生物功能的全新蛋白质,这也是蛋白质工程最最根本的目标之一。根本的目标之一。第一节第一节 蛋白质结构分析蛋白质结构分析 蛋白质工程的核心内容之一蛋白质工程的核心内容之一就是收集大量的蛋白质分子结构的信息,以便建立结构与功能之间关系的数据库,为蛋白质结构与功能之间关系的理论研究奠定基础。一、蛋白质的分子结构一、蛋白质的分子结构 蛋白质分子的结构有4个严格的层次,即蛋白质的一级至四级结构。蛋白质的一级结构蛋白质的一级结构(primary structure)是指多肽链的氨基酸

4、残基的排列顺序。图图3-1 3-1 胰岛素一级结构及不同动物胰岛素胰岛素一级结构及不同动物胰岛素A A链的差异链的差异 线性多肽链在空间折叠成特定的三维空间结构,称为蛋白质的空间结构或构象。蛋白质的空间结构包括:二级结构、超二二级结构、超二级结构、结构域、三级结构和四级结构。级结构、结构域、三级结构和四级结构。蛋白质二级结构蛋白质二级结构(secondary structure)是指多肽链主链借助于氢键沿一维方向排列成具有周期性的结构的构象,是多肽链局部的空间结构(构象),主要有-螺旋、-折叠、-转角等几种形式(见图3-2至图3-4)。图3-2 四种不同的-螺旋图3-3 反向-折叠图3-4 R

5、Nase 的某些二级结构-螺旋螺旋无规卷曲无规卷曲-转角转角-折叠折叠 超二级结构超二级结构(supersecondary structure)和结构域结构域(domain)是介于蛋白质二级结构和三蛋白质二级结构和三级结构级结构之间的空间结构。超二级结构超二级结构是指相邻的二级结构单元组合在一起,彼此相互作用,排列形成规则的、在空间结构上能够辨认的二级结构组合体,并充当三级结构的构件(block building),其基本形式有、和等(见图3-5至图3-7)。图3-5细胞色素C的结构 图3-6纤溶酶原的结构图3-7 细胞核抗原的结构 结构域结构域是在超二级结构的基础上形成的,通常由50-300

6、个氨基酸残基组成,其特点是在三维空间可以明显区分和相对独立,并且具有一定的生物学功能。模体或基序模体或基序(motif)是结构域的亚单位,通常由23个二级结构单位组成,一般为螺旋、折叠和环(loop)(见图3-8)。较大的蛋白质分子一般含有两个以上的结构域,其间以柔性的铰链(hinge)相连,以便相对运动。图3-8 Zn2+模体 三级结构三级结构(tertiary structure)是指整条多肽链的三维结构,包括骨架和侧链在内的所有原子的空间排列。如果蛋白质分子仅由一条多肽链组成,三级结构就是它的最高结构层次(见图3-9)。图3-9 胰岛素的三级结构 四级结构四级结构(quaternary

7、structure)是指在亚基和亚基亚基和亚基之间通过疏水作用疏水作用等次级键结合成为有序排列的特定的空间结构。亚基亚基通常由一条多肽链组成,有时含两条以上的多肽链,单独存在时一般没有生物活性(见图3-10)。图3-10 血红蛋白的四级结构二、蛋白质结构测定二、蛋白质结构测定1.1.一级结构测定一级结构测定 蛋白质一级结构的测定蛋白质一级结构的测定又称蛋白质顺序分析,其基本方法是:(1)应用化学裂解法和蛋化学裂解法和蛋白酶水解法白酶水解法将多肽链专一性裂解;(2)逐一测定每个纯化的小肽段的顺序小肽段的顺序;(3)根据肽段氨基酸顺序中的重叠区确定小肽段的排列次序小肽段的排列次序;(4)完成整条多

8、肽链的顺序分析顺序分析。尽管蛋白质顺序分析已经自动化,但仍然耗时、复杂并且昂贵。重组重组DNADNA技术技术出现后,人们可以从从cDNAcDNA或或基因序列直接推导出蛋白质氨基酸顺序基因序列直接推导出蛋白质氨基酸顺序,速度快且经济,已成为最常用的测定蛋白质一级结构的方法。2.2.蛋白质三维结构测定蛋白质三维结构测定 根据蛋白质的状态,测定蛋白质三维结构的方法分为两大类:(1)应用X X射线晶体衍射图谱法射线晶体衍射图谱法和中子衍射中子衍射法法测定晶体中的蛋白质分子构象;(2)应用核磁共振法(核磁共振法(NMRNMR)、园二色性光园二色性光谱法、激光拉曼光谱法、荧光光谱法、紫外差谱法、激光拉曼光

9、谱法、荧光光谱法、紫外差光谱法和氢同位素交换法等光谱法和氢同位素交换法等测定测定溶液中的蛋白质构象。利用X X射线晶体衍射法射线晶体衍射法测定蛋白质分子的构象,结果比较可靠。但是,与溶液中的构象相比,蛋白质分子在晶体中的构象是静态的。所以,利用蛋白质晶体不能测定不稳定的过渡态的构象。而且,很多蛋白质很难结晶,或者很难得到用于结构分析的足够大单晶。另外,X X射线射线晶体衍射的工作流程较长晶体衍射的工作流程较长(见图3-11)。图3-11 X射线晶体衍射的基本原理 核磁共振核磁共振(缩写NMR)是指核磁矩不为零核磁矩不为零的核,在外磁场的作用下在外磁场的作用下,核自旋能级发生塞曼塞曼分裂分裂(Z

10、eeman(Zeeman splitting)splitting),共振吸收某一特定频率的射频辐射的物理过程。近年来,NMR法测定小蛋白的三维结构得到了成功的应用。NMR法不需要制备蛋白质晶体,但这种方法仅限于分析长度不超过但这种方法仅限于分析长度不超过150150个氨基酸个氨基酸残基的小蛋白残基的小蛋白(见图3-12)。图3-12 NMR测定蛋白质三维结构的基本过程第二节第二节 蛋白质结构预测蛋白质结构预测 蛋白质三维结构很大程度上决定了蛋白质的功能,因此如何获得蛋白质的结构并对之基蛋白质的结构并对之基序分析序分析研究是现代分子生物学的重要课题。目前应用X X射线晶体衍射法和射线晶体衍射法和

11、NMRNMR法法已测定出1 1万多种蛋白质及其复合物万多种蛋白质及其复合物的结构,但与已测得的3030多万蛋白质多万蛋白质序列相比,还有很大的差距,大大地影响了人们对蛋白质结构和功能关系的研究。因此发展一种不依赖实验而又有一定准确性的理论蛋白质结构预测方法理论蛋白质结构预测方法显得格外重要,近年来在这个方面取得了很多重要的成果。蛋白质结构的理论预测方法蛋白质结构的理论预测方法都是建立在氨基酸的一级结构决定高级结构的理论基础上,大致分为以下三类。一、比较建模法一、比较建模法(comparative modeling method)比较建模法比较建模法是基于蛋白质三维结构知识的蛋白质结构预测方法,

12、又称为同源结构预测同源结构预测,是根据大量已知的蛋白质三维结构来预测序列序列已知而结构未知已知而结构未知的蛋白质结构。按照目前的定义,若模型构建蛋白质的序列模型构建蛋白质的序列与模板序列经比对与模板序列经比对(alignment)后,序列同源性序列同源性(sequence identity)在在40%40%(也有人认为在35%)以上以上,则它们的结构可能属于同一家族,它们是同源蛋白同源蛋白(homology),可以用同源蛋白同源蛋白模型构建的方法模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,它们具有相似的空间结构,相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的

13、结构,就可以预测其它一些序列已知而结序列已知而结构未知的同源蛋白构未知的同源蛋白的结构,可以用同源模型构同源模型构建的方法建的方法预测未知蛋白质的三维结构。同源蛋白模型构建(模建)的步骤:同源蛋白模型构建(模建)的步骤:1.1.目标蛋白序列与目标序列的匹配目标蛋白序列与目标序列的匹配 应用FASTA或BLAST搜索软件,在PIR、SWISSPROT或GENEBANK等序列库中按序列同源性挑选出一些同源性比较高的序列挑选出一些同源性比较高的序列,然后把挑选出的序列与目标序列基序多重匹配多重匹配,得到模得到模板结构等价位点套的初始集合。板结构等价位点套的初始集合。2.2.根据模板结构构建目标蛋白结

14、构模型根据模板结构构建目标蛋白结构模型 在已确定的模板结构等价位点套的初始集合基础上,旋转每一个模板的结构,使它们相互间的位置尽可能多地重叠在一起。不同两个模板在空间中若符合一定的重叠距符合一定的重叠距离标准离标准,那它们相互之间的关系就是等价位点等价位点。许多这样的等价位点构成了等价位点套等价位点套。叠合结束后,即得到了同源蛋白的结构保结构保守区守区(SCRs),),以及相应的基架结构以及相应的基架结构。模板结构匹配后,一般还要用得到的同源体SCRs的第一条序列与目标序列匹配,挑选出目标序列上的高相拟区,定义为目标蛋白的目标蛋白的SCRsSCRs。Homology、UQANTA/CHARM、

15、COMPOSER和和Collar extension等软件和方法可以用于目标蛋白结构模型的构建。3.3.对模建结构基序优化和评估对模建结构基序优化和评估 同源结构模建(预测)得到的蛋白质结构模型,通常含有一些不合理的原子间接触含有一些不合理的原子间接触,需要对模型进行分子力学和分子动力学优化进行分子力学和分子动力学优化,消除模型中不合理的接触。另外,模型中有些键长、键角和二面角也有可能不合理,也需要检查评估。PROCHECK和和PROSA II等软件等软件常用于完成这类工作。二反向折叠法二反向折叠法 反向折叠法反向折叠法是近年来发展起来的一种比较新的方法。它可以应用到没有同源结构的情况中,且不

16、需要预测二级结构,即直接预测三级结构直接预测三级结构,从而可以绕过现阶段二级结构预测准确性不超二级结构预测准确性不超过过65%65%的限度,是一种有潜力的预测方法。反向折叠法的主要原理反向折叠法的主要原理是把未知蛋白的序列和已知的结构进行匹配,找出一种或几种匹配最好的结构作为未知蛋白质的预测结构。它的实现过程它的实现过程是总结出已知独立的蛋白质结构模式做为未知结构进行匹配的模板,然后用经过对现有的数据库的学习,总结出的可以区分正误结构的平均势函数(平均势函数(Mean Force Field),做为判别标准来选择出最佳匹配方式。这种方法的局限性这种方法的局限性在于它假设蛋白质折假设蛋白质折叠类

17、型是有限叠类型是有限的,所以只有未知蛋白质和已知蛋白质结构相像的时候,才有可能预测出未知的蛋白质结构。如未知蛋白质结构是现在还没有出现的结构类型时,这种方法将不能被应用。三从头预测法三从头预测法 从理论上说,从头预测法是最为理想的最为理想的蛋白质结构预测方法蛋白质结构预测方法。它要求方法本身可以只根据蛋白质的氨根据蛋白质的氨基酸序列来预测蛋白质的二级结构和高级结基酸序列来预测蛋白质的二级结构和高级结构构,但现在还不能完全得到这个要求。从头预测可以细分为:从头预测可以细分为:1.1.二级结构预测二级结构预测 首先从一级结构预测出二级结构,然后再把二级结构堆积成三维结构。由于目前对二级目前对二级结

18、构中氨基酸的中远程相互作用不完全清楚结构中氨基酸的中远程相互作用不完全清楚,因此预测准确率一般在65%以下。如果具有多种蛋白质同源序列的三维结构,在多重序列匹配比较多重序列匹配比较的情况下,预测的准确性可以达到88%以上。BartonBarton和和SanderSander等人发现,等人发现,在一个蛋白质序列中总有约40%序列的预测可以有很好的可信度,其预测的准确性都在80%以上。这些区域都是一些二级结构序列比较保守的部分。这些结果给如何将现有二级结构预测结将现有二级结构预测结果应用到三维结构预测提供了有益的启示。果应用到三维结构预测提供了有益的启示。2.2.超二级结构预测超二级结构预测 实际

19、上是局部的空间结构预测,主要应用主要应用人工神经网络方法和向量投影方法人工神经网络方法和向量投影方法,从蛋白质序列出发,直接预测蛋白质的超二级结构,观察此段氨基酸序列是否能形成某一种模式的超二级结构。其中人工神经网络方法预测的准确率在人工神经网络方法预测的准确率在75%75%82%82%,向量投影方法预测的准确率达到,向量投影方法预测的准确率达到85%85%以上。以上。3.3.结构类型(结构类型(structure classstructure class)预测)预测 该方法是预测未知结构蛋白质属于何种类型该方法是预测未知结构蛋白质属于何种类型,如全全类蛋白质类蛋白质(主要由-螺旋组成)、全全

20、类蛋白质类蛋白质(主要由-折叠组成)、/类蛋白类蛋白质质(由-螺旋和-折叠交替排列)或类类蛋白质蛋白质(由分开的-螺旋和-折叠组成,其中-折叠一般为平行结构)。结构类型预测结构类型预测除能了解大概的蛋白质结构折叠情况外,对二级结构的预测也有帮助。方法主要有光谱数据预测、神经网络预测方法主要有光谱数据预测、神经网络预测和和MahalanobisMahalanobis距离预测等距离预测等,后者的准确率较前两者为高,可达94.7%。4.4.三维结构预测三维结构预测 是蛋白质结构预测的最终目标。主要有两个方面:(1)根据二级结构、结构类型和折叠类型预二级结构、结构类型和折叠类型预测测的结果,结合结构间

21、的立体化学性质、亲疏立体化学性质、亲疏水性质、氢键以及静电相互作用水性质、氢键以及静电相互作用,把可信度较高的二级结构进一步组装,搭建出最后的蛋白质结构。由于该方法主要依赖于前面的预测结果,所以受到的限制很多。(2)不依赖二级结构预测不依赖二级结构预测的结果,直接预测直接预测三维结构三维结构。主要方法是有效收集构象空间和区有效收集构象空间和区分天然结构和错误结构分天然结构和错误结构。根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列的肽链空间结构和生物学功能;反之也可以根据特定的生物功能,设计蛋白质的氨基酸序列和空间结构。通过基因重组等实验基因重组等实验可以直接考察

22、分析结结构与功能之间的关系;构与功能之间的关系;也可以通过分子动力学、分子动力学、分子热力学等,分子热力学等,根据能量最低、同一位置不能能量最低、同一位置不能同时存在两个原子等同时存在两个原子等基本原则分析计算蛋白质分子的立体结构和生物功能。虽然这方面的工作尚在起步阶段,但可预见将来能建立一套完整的理论来解释结构与功能之间的关系,用以设计、预测蛋白质的结构和功能。第三节第三节 蛋白质的创造和改造蛋白质的创造和改造 蛋白质的分子设计是蛋白质工程的一个重要方面。设计分成三类:设计分成三类:一是小范围改造,就是对已知结构的蛋白质进行少数几个残基的替换,来研究和改善蛋白质的性质和功能;二是较大程度的改

23、造,是对来源于不同蛋白质的结构域进行拼接组装,期望转移相应的功能;三是蛋白质从头设计。所谓蛋白质从头设计所谓蛋白质从头设计就是给定一个目标三维结构,要求找出与已知顺序无明显同源,能折叠成目标结构的氨基酸顺序来。蛋白质从头设计与蛋白质结构预测恰恰相蛋白质从头设计与蛋白质结构预测恰恰相反反,后者是从顺序出发,预测其所折叠成的三维结构。一、定点突变一、定点突变 蛋白质中的氨基酸是由基因中的三联密码决定的,只要改变其中的一个或两个就可以改变氨基酸。通常是改变某个位置的氨基酸改变某个位置的氨基酸,以研究蛋白质的结构、稳定性或催化特性。例如将t-PA Asn117替换为Glu117,从而除去一个原有的糖基

24、化位点。由于该处原有的糖链能促进t-PA从血浆清除,因此点突变后能够降低降低t-t-PAPA的血浆清除率,延长血浆半衰期的血浆清除率,延长血浆半衰期。二、盒式突变二、盒式突变 1985年Wells提出的一种基因修饰技术盒式突变,一次可以在一个位点上产生20种不同氨基酸的突变体,可以对蛋白质分子中重要氨基酸进行“饱和性饱和性”分析分析。利用定位突变在拟改造的氨基酸密码两侧添加两个原载体和基因上没有的内切酶切点,用该内切酶消化基因,再用合成的发生不同变化的双链DNA片段替代被消化的部分。这样一次处理就可以得到多种突变型基因。三、蛋白质融合三、蛋白质融合 将编码一种蛋白的部分基因移植到另一种蛋白质基

25、因上或将不同蛋白质基因的片段组合在一起,经基因克隆和表达,产生出新融合蛋白新融合蛋白。这种方法可以将不同蛋白质的特性集中在一种蛋白质上,显著地改变蛋白质的特性。现在研究较多的所谓“嵌合抗体嵌合抗体”和和“人源人源化抗体化抗体”等,就是采用的这种方法。四、蛋白质的从头设计四、蛋白质的从头设计 成功地从头设计一个蛋白质或活性位点需要正确理解所有有关的相互作用,理论的正确理论的正确与否与设计成功与否直接相关。与否与设计成功与否直接相关。由于设计的蛋白质是由一个算法采用一组描述相互作用的参数而产生,因此在设计参数和蛋白质特性之间可以建立直接的实验联系。1 1设计策略设计策略 设计的一般策略是“设计循环

26、设计循环”,是理论设理论设计和实验验证交互计和实验验证交互进行,逐步发展。首先由一个算法,基于某些理论和研究结果,设计出初始分子模型;然后实际构建这个分子,用各种手段分析它,寻找成功或失败或不理想的原因,接着修改算法、参数、理论基础、改进模型,进行重新设计,如此循环反复。在这个过程中,复杂程度渐进提高,对蛋白质结构和功能的理解也逐渐深刻丰富起来。2.2.考虑因素考虑因素 具体设计中要考虑的因素较多,例如要正确选择二级结构倾向性的残基,正确布置适应目标结构的“二元模式二元模式”(Binary pattern),正确选择转角、帽结构以连接和终止螺旋,正确选择适应于堆积核心的疏水侧链,另外还可以导入

27、内部的极性作用。主要有二元模式、二级结构倾向性、互补二元模式、二级结构倾向性、互补堆积堆积(complementary packing)等。所谓二元模式所谓二元模式指的是氨基酸的亲疏水性在编码结构中的作用。对残基的亲疏水性的考虑几乎是设计中的唯一标准,是最重要的因素。天然蛋白质折叠时总是尽可能将疏水残基埋进内部,而将亲水残基暴露在表面。二元模式的作用二元模式的作用可能主要在二级结构上发挥出来,二级结构是具有周期性的,沿主链残基的亲疏水性也是有周期性的,并与二级结构相适应。对已知结构数据库的统计分析表明,各种氨基酸在不同的二级结构中出现的频率是不同的,就是说各种氨基酸形成不同二级结构的倾向性是不

28、同的,这就是所谓的二级结二级结构倾向性。构倾向性。设计时应将合适的氨基酸安排在其倾向的二级结构中。特定的序列还可以成为某种二级结构的起始或终止信号。设计中还要考虑到“互补堆积互补堆积”。天然蛋白质的核心中的侧链相互镶嵌地堆积在一起,几乎不留出什么空间,这种作用既使疏水作用尽量的大,又不致于引起拥挤,这就是互补堆积互补堆积。所以,对侧链的大小外形都是有一定要求的。尽管大多数极性侧链都是暴露在表面,而内部还有一些极性侧链构成盐桥或氢键网络。这些内部的盐桥或氢键网络并不是使蛋白质稳定而是建立了一种构象特异性。对已知结构数据库结构数据库的统计分析发现,内部的极性残基比在表面的极性残基要保守得多。不少成

29、功的设计工作都是内部引入了有限的几个极性残基。成功的设计需要仔细地考虑各种因素,但是目前人们对蛋白质结构并没有完全理解,每一条经验规律都存在着许多例外情况,所以有人也认为过细的考虑纯属多虑了。3.3.设计方法设计方法 目前所有的算法都基于一种思路,首先首先选择某种主链骨架作为目标结构,随后随后固定骨架,寻找能够折叠成这种结构的氨基酸组合。这是蛋白质从头设计具体步骤的主要两步,就是所谓所谓“逆折叠逆折叠”(inverse folding)方法。方法。寻找目标组合的直接想法是穷举法穷举法,检查合适大小范围内的每种组合,选出正确的组合。但实际上即使对设计一个小肽,穷举法也几乎是不可能的。一条特定的肽

30、链所能采取的构象数目是极其巨大的。以相对较小的100个残基的肽链为例,由20个天然氨基酸组成,就有20100(大于10130)种可能性,如果每种可能合成一个分子,把这些分子放到一个盒子里,这个盒子会比数个宇宙还大!更何况每个残基位置上都可能有许多转子,这个组合数就太大了。解决办法解决办法是先考虑“二元模式”和氨基酸的二级结构倾向性,各个位置上不是每个氨基酸都适合的,考虑到这些特性后,每个位置上就只有不多的氨基酸需要进一步检验了。4.4.设计实例设计实例 长期以来,设计目标都是一些结构简单、规律明显的分子。最著名的是四螺旋捆结构四螺旋捆结构,这个结构可以作为一个独立的折叠单位,易于独立研究。De

31、grado等应用“设计循环”的策略,在在1986年完成了一个四聚体螺旋捆年完成了一个四聚体螺旋捆,每个单体为16残基,这个序列仅使用Leu作为疏水残基,放在螺旋的内侧,用Lys或Glu作为极性残基,置于螺旋的外侧,每个螺旋用Gly(螺旋终结者)结束,而Gly又为将来加环区埋下了伏笔。此后此后,研究者在两个反平行的螺旋间加了环区,并根据第一步的结果对螺旋进行了一些修改。环区开始是用单个Pro与两个螺旋的终结者Gly构成Gly-Pro-Arg-Gly的连接区,结果发现产物成了三聚体(含6个螺旋)而不是期望的二聚体(4个螺旋),后来将连接的环区改成Gly-Pro-Arg-Arg-Gly才得到二聚体。

32、第三步第三步,在二聚体之间加了第三个连接体,用的仍是Pro-Arg-Arg,这个肽共74个残基。最后,他们合成了该多肽的基因,在E.coli中实现了表达。这项工作被誉为蛋白质分子设计的里程碑。后来Richardson等也设计了四螺旋捆,称为Felix(意为four helix),79个残基,由非重复序列组成,并在14螺旋间加了一个二硫键。设计目标除了-螺旋外还有-折叠。-折叠比-螺旋要困难一些,后者主要靠局域性的氢键就可以设计出来,而前者却涉及了序列上靠近或不靠近的不同股之间的氢键。著名的是著名的是Betabellin(Beta barrel bellshaped protein),是由前后两

33、个折叠组成,每个折叠由四股组成。随着理论和技术的发展,人们又把目标瞄向/混合蛋白质,以及进一步优化已经成功的结果和将设计工作自动化。最近成功的例子是Dahiyat和和Mayo等完成的自动化蛋白质从头设计。这是一个锌指结构锌指结构域蛋白质域蛋白质,共28个残基,结构中同时包含了螺旋、折叠以及转角,全部使用天然氨基酸,其重要意义在于这是第一个全自动设计的蛋白质。除了努力达到设计出具有目标结构的蛋白质外,人们更希望设计出有目标功能的蛋白质。Hecht等最近成功地应用二元模式设计出了具有血红素结合活性血红素结合活性的蛋白质。蛋白质从头设计这个领域还有许多挑战性的问题,如如折叠蛋白质、折叠蛋白质、/交替

34、蛋白的交替蛋白的设计还有困难,设计还有困难,即使对-螺旋蛋白而言,要设计各种性能都和天然蛋白质一样仍然是个问题。序列组合中只有极少数序列能形成精确的结构、高水平的活性,要设计出这样的分子无疑是个难度更高的课题。但无论如何,在过去10年中,人们已经从一个只能从天然有机体中提取蛋白质从天然有机体中提取蛋白质的时代走到了一个蛋白质从头设计蛋白质从头设计成为新期刊和专题研讨会的焦点的时代。第四节第四节 蛋白质工程的应用蛋白质工程的应用一、提高蛋白质的稳定性一、提高蛋白质的稳定性 葡萄糖异构酶(GI)在工业上应用广泛,为提高其热稳定性,朱国萍等人在确定第138位甘氨酸(G1y138)为目标氨基酸后,对G

35、I基因进行体外定点诱变,以脯氨酸(Pro138)替代G1y138,含突变体的重组质粒在大肠杆菌中表达,结果突变型GI比野生型的热半衰期长一倍,最适反应温度提高10-12,酶比活相同。据分析,Pro替代G1y138后,可能由于引入了一个吡咯环,该侧链刚好能够填充于GIyl38附近的空洞,使蛋白质空间结构更具刚性,从而提高了酶的热稳定性。二、融合蛋白质二、融合蛋白质 脑啡肽(Enk)N端5肽线性结构是型受体结合的基本功能区域,干扰素(IFN)是一种广谱抗病毒抗肿瘤的细胞因子。黎孟枫等人化学合成了Enk N端5肽编码区,通过一连接3肽编码区与人1型IFN基因连接,在大肠杆菌中表达了这一融合蛋白。以体

36、外人结肠腺癌细胞和多形胶质瘤细胞为模型,采用3H-胸腺嘧啶核苷掺入法证明该融合蛋白抑制肿瘤细胞生长的活性显著高于单纯的IFN,通过Naloxone竞争阻断实验证明,抑制活性的增高确由Enk导向区介导。三、蛋白质活性的改变三、蛋白质活性的改变 通常饭后3060分钟,人血液中胰岛素的含量达到高峰,120180分钟内恢复到基础水平。而目前临床上使用的胰岛素制剂注射后120分钟后才出现高峰且持续180240分钟,与人生理状况不符。实验表明胰岛素在高浓度(大于105mol/L)时以二聚体形式存在,低浓度(小于109mol/L)时主要以单体形式存在。设计速效胰岛素原则就是避免胰岛素形成聚合体。类胰岛素生长

37、因子1(IGF1)的结构和性质与胰岛素具有高度的同源性和三维结构的相似性,但IGF1不形成二聚体。IGF1的B结构域(与胰岛素B链相对应)中B28B29氨基酸序列与胰岛素B链的B28B29相比,发生颠倒。因此,将胰岛素B链改为B28LysB29Pro,获得单体速效胰岛素。该速效胰岛素已通过临床实验。四、治癌酶的改造四、治癌酶的改造 癌症的基因治疗分二个方面:药物作用于药物作用于癌细胞癌细胞,特异性地抑制或杀死癌细胞;药物保药物保护正常细胞护正常细胞免受化学药物的侵害,可以提高化学治疗的剂量。疱疹病毒(疱疹病毒(HSVHSV)胸腺嘧啶激酶()胸腺嘧啶激酶(TKTK)可以催化胸腺嘧啶和其它结构类似

38、物如GANCICLOVIR和ACYCLOVIR无环鸟苷磷酸化。GANCICLOVIR和ACYCLOVIR缺少3端羟基,就可以终止DNA的合成,从而杀死癌细胞杀死癌细胞。HSV-TK催化GANCICLOVIR和ACYCLOVIR的能力可以通过基因突变来提高。从大量的随机突变中筛选出一种,在酶活性部位附近有6 6个氨基酸被替换个氨基酸被替换,催化能力分别提高43和20倍。O6-烷基-鸟嘌呤是DNA经烷化剂(包括化疗用亚硝基药物)处理以后形成的主要诱变剂和主要诱变剂和细胞毒素细胞毒素,所以这些亚硝基药物的使用剂量受到限制。06-烷基-鸟嘌呤-DNA烷基转移酶(AGT)能够将鸟嘌呤06上的烷基去除掉,

39、起到保护作用。通过反向病毒转染,人类AGT在鼠骨髓细胞中表达并起到保护作用。通过突变处理,得到一些正突变AGT基因且活性都比野生型的高,经检查发现一个突变基因中的第139位脯氨酸被丙氨酸替代。五嵌合抗体和人源化抗体五嵌合抗体和人源化抗体 免疫球蛋白呈Y型,由二条重链和二条轻链通过二硫键相互连接而构成。每条链可分为可变区(N端)和恒定区(C端)。抗原的吸附位点在可变区,细胞毒素或其他功能因子的吸附位点在恒定区。每个可变区中有三个部分在氨基酸序列上高度变化,在三维结构上是处在折叠端头的松散结构松散结构(CDR(CDR),是抗原的结合位点,其余部分为CDR的支持结构。不同种属的CDR结构是保守的,这

40、样就可以通过蛋白质工程对抗体进行改造。鼠单克隆抗体被人免疫系统排斥,它潜在的治疗作用得不到利用。嵌合抗体嵌合抗体就是用人抗体的恒定区替代鼠单克隆抗体的恒定区,这样它的免疫原性就显著下降。如用于治疗直肠结肠腺癌的单克隆抗体Mabl7-lA。尽管嵌合抗体还存在着免疫原的问题,但仍有几种嵌合抗体通过了临床实验。所谓人源化抗体所谓人源化抗体就是将抗原吸附区域嫁接到人抗体上,这样抗体上的外源肽链降低到最小,免疫原性也就最小。但是,仅将CDR转接到人抗体上,其抗原吸附能力很小,必须带上几个框架氨基酸残基,才能保持原有的吸附力。这样就存在免疫原性与抗原吸附力免疫原性与抗原吸附力之间的矛盾。通过逐个氨基酸替代

41、或计算机模拟分析,可在保持原有吸附力的基础之上,尽可能地降低免疫原性。第一个临床上应用的用于治疗淋巴肉芽肿病和风湿性关节炎的人源化抗体人源化抗体CAMPATHCAMPATH1H1H,尽管疗效显著,但仍有半数以上的患者有免疫反应。而其他人源化抗体如治疗脊髓性白血病的ANTICD33等,其免疫反应可以忽略不计。蛋白质工程汇集了当代分子生物学当代分子生物学等学科的一些前沿领域的最新成就,它把核酸与核酸与蛋白质结合、蛋白质空间结构与生物功能结蛋白质结合、蛋白质空间结构与生物功能结合合起来研究。蛋白质工程将蛋白质与酶的研究蛋白质与酶的研究推进到崭新的时代,为蛋白质和酶在工业、农业和医药方面的应用开拓了诱

42、人的前景。蛋白质工程开创了按照人类意愿改造、创造符合人类需要的蛋白质的新时期。第五节第五节 t-PAt-PA的基因工程与蛋白质工程的基因工程与蛋白质工程 组织纤溶酶原激活剂组织纤溶酶原激活剂(tissue-type plasminogen activator,t-PA)专一水解纤溶酶原形成纤溶酶,从而激活纤溶系统。正常的纤溶功能对于清除血管内不溶性纤维蛋白,保证血液循环畅通起重要作用。药用t-PA能高效地预防和治疗急性心肌梗塞预防和治疗急性心肌梗塞等血栓性疾病。t-PAt-PA与纤维蛋白的亲和力很高与纤维蛋白的亲和力很高,其激活纤溶激活纤溶酶原依赖于纤维蛋白酶原依赖于纤维蛋白的作用。当t-PA

43、接触到血栓后,立刻形成纤维蛋白、纤维蛋白、t-PAt-PA及纤溶酶原三元复合体及纤溶酶原三元复合体,t-PA选择性地高效激活血栓中的纤溶酶原生成纤溶酶,后者水解纤维蛋白,从而溶解血栓。纤溶酶本身的专一性不高,除水解纤维蛋白外,还能降解纤维蛋白原、凝血因子V及VIII。游离状态的t-PA几乎不激活血流中的纤溶酶原,药用时一般不会引起全身性纤溶状态。t-PA用于溶栓治疗时也有一定的局限性,例如它进入血浆后大部分与纤溶酶原激活剂抑制物它进入血浆后大部分与纤溶酶原激活剂抑制物(plasminogen activator inhabitor-1,PAI-1)形成复合物,并迅速失去活性。肝细胞膜上的特异受

44、体能识别t-PA分子,快速与t-PA结合,使t-PA血浆半衰期仅为46min。因此,t-PA溶栓治疗急性心肌梗塞的剂量较大,为50100mg。当接受治疗的病人血浆中t-PA浓度上升到生理水平的1,000倍时,可引起血浆纤维蛋白浓度下降3050%,多次持续用药易出现内出血倾向。因而,改造t-PA分子结构,消除上述缺点,是t-PA蛋白质工程的主要内容。t-PAt-PA的唯一功能的唯一功能是水解激活纤溶酶原,可直接与t-PA分子相互作用的有纤溶酶原、纤维蛋白、PAI-1和肝细胞受体四种蛋白质,这说明t-PA的作用受到复杂的控制。研究这些分子间的作用机制,这些分子间的作用机制,尤其是尤其是t-PAt-

45、PA对纤维蛋白的亲和力、激活纤溶酶原的活性、对纤维蛋白的亲和力、激活纤溶酶原的活性、PAI-1PAI-1对对t-PAt-PA的抑制作用,以及受体对的抑制作用,以及受体对t-PAt-PA的特的特异性摄取等方面异性摄取等方面与与t-PAt-PA分子特定结构域的关系分子特定结构域的关系,会促进t-PA分子的结构改造,使其具有更强的纤溶专一性和效率。t-PA基因工程和蛋白质工程的目标就在于生成高效特异的新型生成高效特异的新型t-PAt-PA产品产品。一、一、t-PAt-PA分子的结构和功能分子的结构和功能 t-PA分子是含527个氨基酸的糖蛋白,分子量为67,000。天然t-PA为单链分子,受纤溶酶或

46、胰蛋白酶催化水解Arg275Ile276肽键,转变为由单二硫键相连的双链t-PA。双链t-PA的N端是重链(或A链),C端为轻链(或B链),见图3-13和表3-1。图3-13 t-PA分子的一级结构 信号肽(S)Met35Gln13 与t-PA由胞内向细胞分泌有关前肽(P)Gln12Ala1N端重链指形区(F)Ser1Ser50与t-PA对纤维蛋白的结合有关表皮生长因子区(EGF)Cys51-Asp87含肝细胞膜识别t-PA的受体结构K1区The88-Gly176K2区Asp177-rg275 含纤维蛋白结合位点C端轻链Ile276-pro527含有丝氨酸蛋白酶类活性中心,含PAI1结合位点表

47、表3-1 t-PA3-1 t-PA分子各结构的分布与功能分子各结构的分布与功能1.1.重链和轻链重链和轻链 t-PA重链(H)位于肽链的1275位,包括指形区、表皮生长因子区及两个三角区,决定了t-PA对纤维蛋白的亲和力,即t-PA溶血栓的高效特异性与重链有关。轻链位于276527位,与胰蛋白酶等丝氨酸蛋白酶有很高的同源性,含有t-PA活性中心,即His322、Asp371和Ser478。2.2.指形区指形区 t-PA分子1-43位氨基酸与纤维结合蛋白分子的指形区结构同源性很高,称为指形区(F);实验证实t-PA与纤维蛋白的作用部分与指形区有关。3.3.表皮生长因子区表皮生长因子区 t-PA分

48、子的44-91位氨基酸结构与人表皮生长因子的同源性很高,称为表皮生长因子区(E)。4.4.三角区三角区 t-PA分子有两个三角区(K1和K2),分别由氨基酸残基92-173、180-261组成。K1和K2都与纤溶酶原分子、凝血酶原分子的三角区有较大的同源性。K2区是t-PA分子与纤维蛋白分子结合部位,比F更为重要。5.5.糖链糖链 t-PA分子含糖6.8%,有三个糖基化位点,分别位于Asn117、Asn184和Asn448。糖链对t-PA活性影响不大,但缺少糖链或无糖链的缺失突变cDNA表达的新型t-PA,其血浆半衰期显著延长,具有更大应用价值。二、二、t-PAt-PA的基因工程的基因工程 下

49、面描述t-PA基因工程的步骤和方法。1.1.获取目的基因获取目的基因 获取目的基因的方法很多。对于大多数已知基因,借逆转录酶,以mRNA为模板,进行酶促合成相应的cDNA,是获得真核细胞基因最主要和最常用的方法。t-PA基因可用此法获得。(1 1)搜索)搜索t-PA mRNAt-PA mRNA序列序列 登陆美国国家生物技术信息中心(NCBI)网站http:/www.ncbi.nlm.nih.gov,在Search栏中键入nucleotide,在For栏中键入 human tissue plasminogen activator mRNA,点击Go;网页上会出现许多搜索结果,选择 A03776

50、H.sapiens mRNA for tissue plasminogen activator(t-PA),即可得到t-PA mRNA全长序列。(2 2)提取总细胞)提取总细胞RNARNA Bowes黑色素瘤细胞能大量合成t-PA,因此也可以高频率地合成t-PA mRNA。体外大量培养Bowes黑色素瘤细胞,应用TRIZOL法提取总细胞RNA。(3 3)cDNAcDNA合成合成 在逆转录酶的作用下,采用oligo(dT)引物,以总细胞RNA为模板,合成cDNA的第一条链,得到DNA-RNA杂合分子,随后采用RNase H、大肠杆菌DNA聚合酶I和T4 DNA Ligase 联合作用,以单链cD

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第3章蛋白质工程课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|