1、第第2 2章章 大肠杆菌基因工程四、基因工程菌的遗传不稳定性及其对策三、大肠杆菌基因工程菌的构建策略二、外源基因在大肠杆菌中高效表达的原理一、大肠杆菌作为表达外源基因受体菌的特征五、利用重组大肠杆菌生产人胰岛素一、大肠杆菌作为表达外源基因受体菌的特征大肠杆菌表达外源基因的优势全基因组测序,共有4405个开放型阅读框架基因克隆表达系统成熟完善繁殖迅速、培养简单、操作方便、遗传稳定被美国FDA批准为安全的基因工程受体生物缺乏对真核生物蛋白质的复性功能缺乏对真核生物蛋白质的修饰加工系统内源性蛋白酶降解空间构象不正确的异源蛋白细胞周质内含有种类繁多的内毒素二、外源基因在大肠杆菌中高效表达的原理启动子终
2、止子核糖体结合位点密码子质粒拷贝数启动子(1)启动子最佳距离的探测目的基因EEAEE启动子A 酶切开Bal31酶解目的基因(2)启动子的筛选AprorigalKpKO1终止密码子采用鸟枪法战略,将合适大小的DNA片段克隆到启动子探针质粒pKO1上受体细胞染色体DNA上的galE、galT与质粒上报告基因galk的表达产物联合作用,可将培养基中的半乳糖酵解成红色素物质转化galE+、galT+、galK-的大肠杆菌受体菌株含有外源启动子活性的重组克隆(3)启动子的构建-35 区序列-10 区序列Pl lLPrecAPtrpPlacPtraAPtac启动子T T G A C AG A T A C
3、TT T G A T AT A T A A TT T G A C AT T A A C TT A G A C AT A A T G TT T T A C AT A T A A TT T G A C AT A T A A TPtac = 3 Ptrp = 11 Plac(4)启动子的可控性P乳糖启动子Plac的可控性:OPO高效转录阻遏蛋白诱导乳糖 异丙基-b-D-硫代半乳糖苷(IPTG)野生型的Plac与其控制区Olac偶联在一起,在没有诱导物存在时,整个操纵子处于基基底水平转录底水平表达;诱导物可以使启动子Plac介导的转录大幅提高PlacOPlacO高效转录葡萄糖代谢基底水平转录进Plac
4、介导的转录。葡萄糖区,cAMP激活CAP,CAP遏Plac介导的转录。因此,乳糖启动子Plac的可控性:野生型的Plac上游附近拥有代谢激活因子(CAP)结合结合启动子控制区,进而促代谢使cAMP减少,也能阻基因工程中使用的乳糖启动子均为抗葡萄糖代谢阻遏的突变型,即Plac UV5CAPcAMPcAMP浓度降低Plac UV5O高效转录Ptrp色氨酸启动子Ptrp的可控性:Otrp除去色氨酸色氨酸启动子Ptrp受色氨酸-阻遏蛋白复合物的阻遏,转录呈基底状态。在培养系统中去除色氨酸基底水平转录或者加入3-吲哚丙烯酸(IAA),便可有效地解除阻遏抑制作用。在正常的细菌培养体系中,除去色氨酸是困难的
5、,因此基因工程中往往添加IAA诱导Ptrp介导的目基因的表达色氨酸或加3-吲哚丙烯酸高效转录阻遏蛋白 (IAA)OtrpPtrp高效转录OtrpPtrpl噬菌体启动子Pl lL的可控性:噬菌体启动子PL受CI阻遏蛋白阻遏,很难直接诱导控制。在基因工程中常使用温度敏感型的cI突变基因cI857控制PL。 cI857阻遏蛋在42时失活脱落,PL便可介导目的基因的表达。但在大型细菌培养罐中迅速升温非常困难,因此常使用一个双质粒控制系统,用色氨酸间接控制目的基因表达PtrpABcI857PL目的基因阻遏作用PtrpABPL表达色氨酸终止子(1)强化转录终止的必要性 外源基因在强启动子的控制下表达,容易
6、发生转录过头现象,即RNA聚合酶滑过终止子结构继续转录质粒上邻近的DNA序列,形成长短不一的mRNA混合物 过长转录物的产生在很大程度上会影响外源基因的表达,其原因如下: 转录产物越长,RNA聚合酶转录一分子mRNA所需的时间就相应增加,外源基因本身的转录效率下降; 如果外源基因下游紧接有载体上的其它重要基因或DNA功能区域,如选择性标记基因和复制子结构等,则RNA聚合酶在此处的转录可能干扰质粒的复制及其它生物功能,甚至导致重组质粒的不稳定性; 过长的mRNA往往会产生大量无用的蛋白质,增加工程菌无谓的能量消耗; 更为严重的是,过长的转录物往往不能形成理想的二级结构,从而大大降低外源基因编码产
7、物的翻译效率(2)强终止子的选择与使用 目前外源基因表达质粒中常用的终止子是来自大肠杆菌rRNA操纵子上的rrnT1T2以及T7噬菌体DNA上的Tf。对于一些终止作用较弱的终止子,通常可以采用二聚体终止子串联的特殊结构,以增强其转录终止作用 终止子也可以象启动子那样,通过特殊的探针质粒从细菌或噬菌体基因组DNA中克隆筛选pCP1AproriTcr筛选Apr、Tcs的转化子核糖体结合位点 外源基因在大肠杆菌细胞中的高效表达不仅取决于转录启动的频率,而且在很大程度上还与mRNA的翻译起始效率密切相关。大肠杆菌细胞中结构不同的mRNA分子具有不同的翻译效率,它们之间的差别有时可高达数百倍。mRNA翻
8、译的起始效率主要由其5 端的结构序列所决定,称为核糖体结合位点(RBS) 大肠杆菌核糖体结合位点包括下列四个特征结构要素:位于翻译起始密码子上游的6-8个核苷酸序列5 UAAGGAGG 3,即Shine-Dalgarno(SD)序列,它通过识别大肠杆菌核糖体小亚基中的16S rRNA 3端区域3 AUUCCUCC 5并与之专一性结合,将mRNA定位于核糖体上,从而启动翻译;翻译起始密码子,大肠杆菌绝大部分基因以AUG作为阅读框架的起始位点,但有些基因也使用GUG或UUG作为翻译起始密码子;SD序列与翻译起始密码子之间的距离及碱基组成;基因编码区5 端若干密码子的碱基序列 (1)核糖体结合位点的
9、结构(2)核糖体结合位点对外源基因表达的影响SD序列的影响: 一般来说,mRNA与核糖体的结合程度越强,翻译的起始效率就越高,而这种结合程度主要取决于SD序列与16S rRNA的碱基互补性,其中以GGAG四个碱基序列尤为重要。对多数基因而言,上述四个碱基中任何一个换成C或T,均会导致翻译效率大幅度降低 SD序列与起始密码子之间的序列的影响: SD序列下游的碱基若为AAAA或UUUU,翻译效率最高;而CCCC或GGGG的翻译效率则分别是最高值的50%和25%。紧邻AUG的前三个碱基成份对翻译起始也有影响,对于大肠杆菌b-半乳糖苷酶的mRNA而言,在这个位置上最佳的碱基组合是UAU或CUU,如果用
10、UUC、UCA或AGG取代之,则酶的表达水平低20倍SD序列与起始密码子之间的距离的影响: SD序列与起始密码子之间的精确距离保证了mRNA在核糖体上定位后,翻译起始密码子AUG正好处于核糖体复合物结构中的P位,这是翻译启动的前提条件。在很多情况下,SD序列位于AUG之前大约七个碱基处,在此间隔中少一个碱基或多一个碱基,均会导致翻译起始效率不同程度的降低起始密码子及其后续若干密码子的影响: 大肠杆菌中的起始tRNA分子可以同时识别AUG、GUG和UUG三种起始密码子,但其识别频率并不相同,通常GUG为AUG的50%而UUG只及AUG的25%。除此之外,从AUG开始的前几个密码子碱基序列也至关重
11、要,至少这一序列不能与mRNA的5 端非编码区形成茎环结构,否则便会严重干扰mRNA在核糖体上的准确定位 目前广泛用于外源基因表达的大肠杆菌表达型质粒上,均含有与启动子来源相同的核糖体结合位点序列,序列和间隔是最佳的 密码子(1)生物体对密码子的偏爱性 不同的生物,甚至同种生物不同的蛋白质编码基因,对简并密码子使用频率并不相同,具有一定的偏爱性,其决定因素是: 生物基因组中的碱基含量 在富含AT的生物(如单链DNA噬菌体fX174)基因组中,密码子第三位上的U和A出现的频率较高;而在GC丰富的生物(如链霉菌)基因组中,第三位上含有G或C的简并密码子占90%以上的绝对优势 密码子与反密码子相互作
12、用的自由能 性中等强度规律 细胞内tRNA的含量如GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少;如GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;(2)密码子偏爱性对外源基因表达的影响 由于原核生物和真核生物基因组中密码子的使用频率具有较大程大的差异性,因此外源基因尤其是高等哺乳动物基因在大肠杆菌中高 效翻译的一个重要因素是密码子的正确选择。一般而言,有两种策略可以使外源基因上的密码子在大肠杆菌细胞中获得最佳表达: 外源基因全合成同步表达相关tRNA编码基因按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适宜的相应简并密码子,重组人胰岛素、
13、干扰素以及生长激素在大肠杆菌中的高效表达均采用了这种方法 外源基因全合成 对于那些含有不和谐密码子种类单一、出现频率较高、而本身分子量又较大的外源基因而言,则选择相关tRNA编码基因同步克隆表达的策略较为有利。例如,在人尿激酶原cDNA的412个密码子中,共含有22个精氨酸密码子,其中7个AGG、2个AGA,而大肠杆菌受体细胞中tRNAAGG和tRNAAGA的丰度较低。为了提高人尿激酶原cDNA在大肠杆菌中的高效表达,将大肠杆菌的这两个tRNA编码基因克隆在另一个高表达的质粒上。由此构建的大肠杆菌双质粒系统有效地解除了受体细胞对外源基因高效表达的制约作用同步表达相关tRNA编码基因质粒拷贝数(
14、1)质粒拷贝数对细菌生长代谢的影响 目前实验室里广泛使用的表达型质粒在每个大肠杆菌细胞中可达数百甚至上千个拷贝,质粒的扩增过程通常发生在受体细胞的对数生长期内,而此时正是细菌生理代谢最旺盛的阶段。质粒分子的过度增殖以及其后目的基因的高效表达势必会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性以及目的基因宏观表达水平的下降 解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的轨道(2)质粒扩增时序的控制pCP3拥有一个温度可诱导型的复制子pCP3PLMCSoriApr在28时,每个细胞的质粒拷贝数为60在42时,拷贝数迅速增至300 - 600在此温度下,受体细胞染色体上的CI基 因表达
15、的温度敏感型阻遏蛋白失活 因此,用一种手段同时控制质粒拷 贝数和基因的表达三、大肠杆菌基因工程菌的构建策略包涵体型异源蛋白的表达分泌型异源蛋白的表达融合型异源蛋白的表达寡聚型异源蛋白的表达整合型异源蛋白的表达蛋白酶抗性或缺陷型表达系统的构建包涵体型异源蛋白的表达(1)包涵体及其性质 在某些生长条件下,大肠杆菌能积累某种特殊的生物大分子,它们致密地集聚在细胞内,或被膜包裹或形成无膜裸露结构,这种水不溶性的结构称为包涵体(Inclusion Bodies,IB)。富含蛋白质的包涵体多见于生长在含有氨基酸类似物培养基的大肠杆菌细胞中,由这些氨基酸类似物所合成的蛋白质往往会丧失其理化特性和生物功能,从
16、而集聚形成包涵体。由高效表达质粒构建的大肠杆菌工程菌大量合成非天然性的同源或异源蛋白质,后者在一般情况下也以包涵体的形式存在于细菌细胞内。除此之外,包涵体中还含有少量的DNA、RNA和脂多糖等非蛋白分子(2)以包涵体形式表达目的蛋白的优缺点能简化外源基因表达产物的分离操作 包涵体表达形式的优点:包涵体的水难溶性及其密度远大于其它细胞碎片和细胞成分,菌体经超声波裂解后,直接通过高速离心即可将重组异源蛋白从细菌裂解物中分离出来能在一定程度上保持表达产物的结构稳定 在形成包涵体之后,大肠杆菌的蛋白酶降解作用基本上对异源重组蛋白的稳定性已构不成威胁包涵体表达形式的缺点: 以包涵体形式表达的重组蛋白丧失
17、了原有的生物活性,必须通过有效的变性复性操作,才能回收得到具有正确空间构象(因而具有生物活性)的目标蛋白,因此包涵体变复性操作的效率对目标产物的收率至关重要。然而,这也是一个技术难题,尤其当目标蛋白分子中的Cys残基数目较高时,体外复性蛋白质的成功率相当低,一般不超过30%(3)以包涵体形式表达目的蛋白的操作 如果未进行特殊设计(如分泌型表达或融合型表达),外源基因在大肠杆菌中表达的蛋白量占细胞总蛋白量20%以上时,表达产物一般倾向于形成包涵体。因此,以包涵体形式表达目的基因操作的关键就是选择高表达的载体。事实上,这种高表达率也是包涵体法的长处所在(4)包涵体的变性与复性操作C 共价修饰的蛋白
18、质蛋白质变性复性的动力学原理:C1C2CnCUI 1I nNX1X2XnXAgAgAgAgI 有效变复性过程中的中间状态X 脱离有效变复性过程而进入集聚的中间状态N 天然状态的蛋白质U 变性状态的蛋白质A 集聚状态的蛋白质在细菌细胞内,集聚状态和共价修饰的蛋白质不能进入复性过程,因此永远成为无活性的蛋白质。包涵体中的蛋白质就属于这两种状态,因此需要在体外进行人工变性(解除共价修饰和驱散集聚体)复性操作包涵体的溶解与变性: 包涵体的溶解与变性的主要任务是拆开错配的二硫键和次级键在人工条件下,使包涵体溶解并重新进入复性途径中。能有效促进包涵体溶解变性的试剂和条件包括: 清洗剂 SDS、正十二醇肌氨
19、酸,廉价,但影响复性和纯化 促溶剂 盐酸胍、尿素,前者昂贵,尿素便宜,但常被自发 形成的氰酸盐污染,后者能与多肽链中的氨基反应 混合溶剂 如尿素与醋酸、二甲基砜等联合使用,溶解力增强 极端pH 廉价,但许多蛋白质在极端pH条件下发生修饰反应包涵体的复性与重折叠(refolding): 包涵体的复性与重折叠的主要任务是:通过次级键的形成使蛋白质复性将多肽链中被拆开的游离巯基重新折叠包涵体的复性与重折叠(refolding):复性操作 包涵体复性操作的方法包括:分段稀释法,逐步降低变性剂的浓度,防止二次集聚的发生一步稀释法,蛋白复性与浓度无关,但集聚与浓度关系很大试剂添加法,精氨酸、甘氨酸、甘油、
20、蔗糖、PEG、Ca2+蛋白修饰法,氨基柠檬酸酐酰化,蛋白带负电,抑制集聚产物隔离法,将变性的蛋白分子固定化,避免其相互碰撞分子伴侣法,GroEL、GroES、DnaK,固定化,共表达包涵体的复性与重折叠(refolding):二硫键形成在包涵体变性体系中,始终存在着还原剂,使多肽链中的巯基保持还原状态,防化学氧化法(A)需要电子受体,最廉价的电子受体为空气,二硫键形成是二硫键交换(B)需要还原型和氧化型谷胱甘肽(GSH和GSSG),二硫键止二硫键错配导致严重的集聚。在变性操作结束后,这些游离型的巯基必须重新配对形成二硫键,此时多肽链也重新发生折叠。形成二硫键的方式主要有: 随机的,仅适用于那些
21、不含游离半胱氨酸残基的蛋白质的重折叠 形成相对特异,因此适用性较广,重折叠效果好HSHS S S+2e+2H+AHSHS S-S-R HS+BR-S-S-R S S2R-SH分泌型异源蛋白的表达 在大肠杆菌中表达的异源蛋白按其在细胞中的定位可分为两种形式:即以可溶性或不溶性(包涵体)状态存在于细胞质中;或者通过运输或分泌方式定位于细胞周质,甚至穿过外膜进入培养基中。蛋白产物N端信号肽序列的存在是蛋白质分泌的前提条件(1)以分泌形式表达目的蛋白的优缺点分泌表达形式的优点:目的蛋白稳定性高 重组人胰岛素原若分泌到细胞周中,其稳 稳定性大约是在细胞质中的10倍目的蛋白易于分离目的蛋白末端完整 相当多
22、的真核生物成熟蛋白N端并不含有 甲硫氨酸残基。当这些真核基因在大肠杆菌中表达时,蛋白质 N端的甲硫氨酸残基往往不能被切除。如若将外源基因与大肠 杆菌的信号肽编码序列重组在一起,一旦分泌型表达,其N端 的甲硫氨酸残基便可在信号肽的剪切过程中被有效除去分泌表达形式的缺点: 相对其它生物细胞而言,大肠杆菌的蛋白分泌机制并不健全。外源真核生物基因很难在大肠杆菌中进行分泌型表达,少数外源基因既便能分泌表达,但其表达率通常要比包涵体方式低很多,因此目前用于产业化的异源蛋白分泌型重组大肠杆菌尽管有,但并不普遍(2)蛋白质的分泌机制原核细菌周质中含有多种分子伴侣可阻止分泌蛋白的随机折叠,分泌在细胞周质或培养基
23、中的重组蛋白很少形成分子间的二硫键交联,因此与包涵体相比,分泌型重组蛋白具有较高比例的正确构象,生物活性的回收率增加,且对蛋白酶不敏感 (3)分泌型目的蛋白表达系统的构建使用相同性质的启动子介导目的基因的转录,则可实现目的蛋白从重泌到胞外,但有些革兰氏阴性菌能将细菌的抗菌蛋白(细菌素)分泌 因此,只要将细菌素释放蛋白编码基因克隆在一个合适的质粒上 包括大肠杆菌在内的绝大多数革兰氏阴性菌不能将蛋白质直接分到培养基中,这一过程严格依赖于细菌素释放蛋白,它激活定位于内上的磷酸酯酶,导致细菌内外膜的通透性增大。即可构建完全分泌型的受体细胞。此时,用另一种携带大肠杆菌信号肽编码序列和目的基因的表达质粒转
24、化上述完全分泌型受体细胞,并组大肠杆菌中的完全分泌。融合型异源蛋白的表达 除了直接表达异源蛋白外,还可将外源基因与受体菌自身的蛋白质编码基因拼接在一起,并作为一个开放型阅读框架进行表达。由这种杂合基因表达出的蛋白质称为融合蛋白。在这种融合蛋白结构中,通常受体细菌的蛋白部分位于N端,异源蛋白位于C端。通过在DNA水平上人工设计引入的蛋白酶切割位点或化学试剂特异性断裂位点,可以在体外从纯化的融合蛋白分子中释放回收异源蛋白(1)以融合形式表达目的蛋白的优缺点目的蛋白稳定性高 尤其对分子量较小的多肽效果更佳目的蛋白易于分离 利用受体蛋白成熟的抗体、配体、底物进目的蛋白表达率高 与受体蛋白共用一套完善的
25、表达元件 胞内形成良好的空间构象,且大多具有水溶性 目的蛋白。在实际生产中,产品主要的成本往往就在该工段 行亲和层析,可以快速获得纯度较高的融合蛋白目的蛋白溶解性好 由于受体蛋白的存在,融合蛋白往往能在目的蛋白需要回收 融合蛋白需要裂解和进一步分离,才能获(2)融合型目的蛋白表达系统的构建两个结构基因拼接位点处的序列设计十分重要,它直接决定着外源基因应装在受体蛋白编码基因的下游,为融合蛋白提供终融合蛋白表达质粒的构建原则:受体细胞的结构基因能高效表达,且其表达产物可以通过亲和层析进行特异性简单纯化为目的蛋白分离回收创造条件止密码子。在某些情况下,并不需要完整的受体结构基因,目的是尽可能避免融合
26、蛋白分子中两种组份的分子量过于接近,融合蛋白的裂解工艺两个蛋白编码序列应保持一致的翻译阅读框架 用于融合蛋白构建的受体蛋白:谷胱甘肽转移酶(GST) 维持良好空间构象硫氧化还原蛋白(TrxA) 维持良好空间构象 pTrxFus麦芽糖结合蛋白(MBP) 促进分泌金黄色葡萄球菌蛋白A(SAPA) 免疫亲和层析 pRIT2T外膜蛋白(OmpF) 促进分泌b-半乳糖苷酶(LacZ) 免疫亲和层析泛素蛋白(Ubi) 维持良好空间构象(3)目的蛋白的回收 融合蛋白中受体蛋白部分的存在可能会影响目的蛋白的空间构象和生物活性,如果将之注入人体还会导致免疫反应,因此在制备和生产药用目的蛋白时,将融合蛋白中的受体
27、蛋白部分完整除去是必不可少的工序。融合蛋白的位点专一性断裂方法有两种: 化学断裂法 酶促裂解法 用于蛋白位点专一性化学断裂的最佳试剂为溴化氰(CNBr)它与多肽链中的甲硫氨酸残基侧链的硫醚基反应,生成溴化亚氨内酯,后者不稳定,在水的作用下肽键断裂,形成两个多肽降解片段其中上游肽段的甲硫氨酸残基转化为高丝氨酸残基,而下游肽段N端的第一位氨基酸残基保持不变。这一方法的优点是回收率高(可达到85%以上),专一性强,而且所产生的目的蛋白的N端不含甲硫氨酸,与真核生物细胞中的成熟表达产物较为接近。然而,如果异源蛋白分子内部含有甲硫氨酸残基,则不能用此方法化学断裂法:酶促裂解法:单残基位点蛋白内切酶切割位
28、点梭菌蛋白酶 Arg-C葡萄球菌蛋白酶 Glu-C假单孢菌蛋白酶 Lys-C猪胰蛋白酶 Arg-C Lys-C蛋白酶酶促裂解法的特点是断裂效率更高,同时每种蛋白酶均具有相应的断裂位点决定簇,因此可供选择的专一性断裂位点范围较广。几种断裂位点专一性最强的商品化蛋白酶分别在多肽链中的精氨酸、谷氨酸、赖氨酸残基处切开酰胺键,形成不含上述残基的下游断裂肽段,与溴化氰化学断裂法相似。用上述蛋白酶裂解融合蛋白的前提条件是外源蛋白分子内部不能含有精氨酸、谷氨酸或赖氨酸残基,如果外源基因表达产物为小分子多肽,这一限制条件并不苛刻,但大分子量的异源蛋白来说,上述三种氨基酸残基的出现频率是相当高的Arg CNNC
29、受体蛋白目的蛋白酶促裂解法:多残基位点 为了克服仅切单一氨基酸残基的蛋白酶所带来的应用局限性,可在受体蛋白编码序列与不含起始密码子的外源基因之间加装一段编码寡肽序列(Ile-Glu-Gly-Arg)的人工接头片段,该寡肽为具有蛋白酶活性的凝血因子Xa的识别和作用序列,其断裂位点在Arg的C末端。纯化后的融合蛋白用Xa处理,即可获得不含上述寡肽序列的目的蛋白。由于Xa的识别作用序列由四个氨基酸残基组成,大多数蛋白质中出现这种寡肽序列的概率极少,因此这种方法可广泛用于从融合蛋白中回收各种不同大小的目的蛋白产物酶促裂解法:多残基位点启动子 受体基因 接头 目的基因MetArgStopLysGluIl
30、e-Glu-gly-ArgArgLysGluIle-Glu-gly-Arg表达亲和层析酶解回收酶促裂解法:多残基位点Pinpoint Xatac生物素结合肽编码序列Xa因子识别位点编码序列SP6T7AproriMCSATC GAA GGT CGC GAA GCT TCA GCT GGG ATC CGG TAC CGA TAT CAG ATC TCC CGG GGC GGC CGCATC GAA GGT CGC GAA GCT TCA GCT GGG ATC CGG TAC CGA TAT CAG ATC TCC CGG GGC GGC CGCXa-1Ile Glu Gly ArgIle Glu
31、 Gly Arg GluGluATC GAA GGT CGC GAA ATC GAA GGT CGC GAA A AGC TTC AGC TGG GAT CCG GTA CCG ATA TCA GAT CTC CCG GGG CGG CCG CGC TTC AGC TGG GAT CCG GTA CCG ATA TCA GAT CTC CCG GGG CGG CCG CXa-2ATC GAA GGT CGC GAA ATC GAA GGT CGC GAA AAAAG CTT CAG CTG GGA TCC GGT ACC GAT ATC AGA TCT CCC GGG GCG GCC GCG
32、CTT CAG CTG GGA TCC GGT ACC GAT ATC AGA TCT CCC GGG GCG GCC GCXa-3 NruI HindIII PvuII BamHI KpnI EcoRV BglII SmaI NotIXa因子切割位点寡聚型异源蛋白的表达 从理论上讲,外源基因的表达水平与受体细胞中可转录基因的拷贝数(即基因剂量)呈正相关。然而重组质粒除了含有外源基因外,还携带其它的可转录基因,如作为筛选标记的抗生素抗性基因等。随着重组质粒拷贝数的不断增加,受体细胞内的大部分能量和原料被用于合成所有的重组质粒编码蛋白,而细胞的正常生长代谢却因能量不济受到影响,因此通过增加质粒拷
33、贝数提高外源基因表达产物的产量往往不能获得满意的效果。 另一种通过增加外源基因剂量而提高目标蛋白产量的有效方法是构建寡聚串联型异源蛋白表达载体,即将多拷贝的外源基因克隆在一个低拷贝质粒上,以取代单拷贝外源基因在高拷贝载体上表达的策略(1)以寡聚形式表达目的蛋白的优缺点目的蛋白高效表达在不提高质粒拷贝数的前提下,增加目的基因的拷贝数,可以稳定表达小分子短肽在一定程度上改善表达量目的产物回收困难短肽由于缺乏有效的空间结构,在细菌细胞中的半衰期较短。串联短肽具有与蛋白质相似的长度及空间结构,因而抗蛋白酶降解的能力大幅度提高寡聚短肽需要裂解和进一步分离,才能获最终分子,但裂解后的短肽分子容易出现序列不
34、均一性(2)寡聚型目的蛋白表达系统的构建PSDgenegenegenegeneT1 T2H2NCOOHMetMetMetMetmRNACNBr基本战略:构建举例:P SDT1 T2EcoRIBamHIAATTCAGATCT GTCTAGAGCCTAGEcoRI Bgl IIBamHIEcoRIBamHIBgl II GATCT AGCCTAGEcoRIBamHIBgl IIEcoRIBamHIBgl IIEcoRI + BamHIBgl II + BamHIBamHI整合型异源蛋白的表达(1)以整合形式表达目的蛋白的优缺点目的基因稳定表达整合型的目的基因随受体细胞染色体DNA的复制而复制,在大
35、多数情况下相当稳定,工程菌在没有选择压力存在下可以连续目的基因表达率低单拷贝整合的目的基因表达率受到限制,此时可通过强化表达元件而加以补偿培养而不丢失目的基因表达盒,这对以改良物种遗传性状为目的的基因工程案例特别有意义(2)DNA体内重组的基本原理 在生物体细胞尤其是原核细菌细胞内,广泛存在着DNA的遗传重组机制,其可能的生物学功效是促进生物种群的进化。细胞内的遗传重组可分为两大类: 转位因子依赖型同源序列依赖型 转位因子是指生物细胞内天然存在的一类无复制能力的DNA可移动因子,不同生物种群拥有结构不同的转位因子,例如: 转位因子依赖型的体内重组:转位因子家族噬菌体 G片段(G-Fragmen
36、t) 原核细菌 插入顺序(IS) 真核细菌 转座子(Tn、Ty) 高等植物 可移动因子(Ac、Ds) 高等动物 跳跃基因(mobil gene) 转位因子依赖型的体内重组:转位因子的结构IS(1 kb)Ty(5 kb)Tn(2 - 20 kb)ACCATGGTTTTGGTACCA抗药性基因转位酶基因识别位点 阻遏基因IRIRIRIRISIS转位因子依赖型的体内重组:整合形式 在很多原核细菌细胞中,染色体DNA链上的两个同源区之间可发生所谓的同源重组,其频率与细菌种类、两个同源区之间的距离同源区的长度、同源程度密切相关。一般地说,距离越远、长度越长、同源性越高,重组的频率也就越高,反之亦然。 同
37、源重组有整合和交换两种形式,前者只需要一个断裂位点,而后者涉及两个断裂位点同源序列依赖型的体内重组:基本形式同源序列依赖型的体内重组:同源整合ori目的基因同源区域标记基因整合位点染色体DNA同源序列依赖型的体内重组:同源交换ori目的基因同源区域标记基因交换区域染色体DNAori标记基因+ +蛋白酶抗性或缺陷型表达系统的构建 无论是在真核生物还是在原核细胞中,重组目的蛋白表达后都会面临被降解的命运,其稳定性甚至还不如半衰期较短的受体细胞内源性蛋白质。 在大多数情况下,重组目的蛋白的不稳定性可归结为对受体细胞蛋白酶系统的敏感性。然而越来越多的实验表明,重组目的蛋白在受体细胞内的半衰期可以通过蛋
38、白序列的人工设计以及受体细胞的改造加以调整和控制。 实验结果表明,大多数不稳定的重组目的蛋白是被大肠杆菌中的蛋白酶La和Ti降解的,两者分别由lon和clp基因编码,其蛋白水解活性依赖于ATP。lon基因由热休克等环境压力激活,细胞内异常蛋白或重组异源蛋白的过量表达也可作为一种环境压力诱导lon基因的表达。lon-的大肠杆菌突变株可使原来半衰期较短的细菌调控蛋白(如SulA、RscA、lN)稳定性大增,因此被广泛用作外源基因高效表达的受体菌。(1)蛋白酶缺陷型受体细胞的改造lon基因缺陷的大肠杆菌受体(lon - -): 大肠杆菌中庞大的热休克蛋白家族对异常或异源蛋白的降解也有重要作用,其机理
39、是胁迫异常或异源蛋白形成一种对蛋白酶识别和降解较有利的空间构象,从而提高异常或异源蛋白对蛋白酶的敏感性。热休克基因dnaK、dnaJ、groEL、grpE以及环境压力特异性s因子编码基因htpR的突变株均呈现出对异源蛋白降解作用的严重缺陷,特别是lon-htpR-的双缺陷株,非常适合高效表达各种不稳定的重组异源蛋白。htpR基因缺陷的大肠杆菌受体(htpR - -): 大量的实验结果表明,在所有的极性氨基酸中,天门冬氨酸(Asp)的存在对提高蛋白质稳定性的效应最显著,而且Asp残基离C末端越近,蛋白质的稳定性就越大。更为重要的是,在多种结构和功能相互独立的蛋白质C末端引入Asp残基,都能显著地
40、延长这些蛋白质的半衰期,因此具有普遍意义。(3)抗蛋白酶的重组异源蛋白序列的设计多肽链C末端氨基酸序列对稳定性的影响: 大量的实验结果同时表明,如果多肽链的N末端序列中含有较高比例的Ala、Asn、Cys、Gln、His,则蛋白质的稳定性显著改善。 相反,N末端含有Pro、Glu、Ser、Thr的真核生物蛋白质,在真核和原核细胞中的半衰期通常很短,尤其Pro-Glu-Ser-Thr序列(PEST序列),是胞内蛋白酶的超敏感区。多肽链N末端氨基酸序列对稳定性的影响:四、基因工程菌的遗传不稳定性及其对策基因工程菌遗传不稳定性的表现与机制改善基因工程菌不稳定性的策略基因工程菌遗传不稳定性的表现与机制
41、(1)工程菌遗传不稳定性的表现形式 基因工程菌的遗传不稳定性主要表现在重组质粒的不稳定性,这种不稳定性具有下列两种表现形式:结构不稳定性重组DNA分子上某一区域发生缺失、重排、修饰,导致其表观生物学功能的丧失分配不稳定性整个重组DNA分子从受体细胞中逃逸(curing)(2)工程菌遗传不稳定性的产生机制受体细胞中的限制修饰系统对外源重组DNA分子的降解能量、物质的匮乏和外源基因表达产物的毒性诱导受体细胞外源基因的高效表达严重干扰受体细胞正常的生长代谢产生应激反应:关闭合成途径,启动降解程序重组质粒在受体细胞分裂时的不均匀分配这是重组质粒逃逸的基本原因受体细胞中内源性的转座元件促进重组分子的缺失
42、重排(3)重组质粒的逃逸率一部分细胞不再携带重组质粒,这些空载细胞数与总细胞数之比称为 当含有重组质粒的工程菌在非选择性条件下生长时,培养系统中称为重组质粒的宏观逃逸率。重组质粒逃逸的原因有: 高温培养、表面活性剂(SDS)、药物(利福平)、染料( 吖啶)促使重组质粒渗漏 受体细胞中的核酸酶降解重组质粒 重组质粒在受体细胞分裂时不均匀分配,细胞所含重组质粒 拷贝数的差异随着细胞分裂次数的增多而加剧改善基因工程菌不稳定性的策略(1)改进载体受体系统 以增大质粒稳定性为目的的构建方法包括:将R1质粒上的parB基因引入表达型载体中,其表达产物可以选择性地杀死由于分配不均匀所产生的无质粒细胞正确设置
43、载体上的多克隆位点,禁止DNA片段插在稳定区内将受体细胞的致死性基因安装在载体上,同时构建条件致死性的相应受体系统,如大肠杆菌的ssb基因(DNA单链结合蛋白编码基因(2)施加选择压力根据载体上的抗药性标记,向培养系统中添加相应的抗生素药物和食品生产时禁止使用抗生素根据载体上的营养缺陷型标记,向培养系统中添加相应的营培养基复杂,成本较高养组份(3)控制目的基因的过量表达使用可控型启动子控制目的基因的定时表达及表达程度使用可控型复制子控制质粒的定时增殖或降低质粒的拷贝数(4)优化基因工程菌的培养工艺培养基组成:限制培养基比丰富培养基更有利于稳定培养温度: 较低的培养温度有利于重组质粒的稳定五、利
44、用重组大肠杆菌生产人胰岛素胰岛素的结构及其生物合成人胰岛素的生产方法重组人胰岛素的大肠杆菌工程菌的构建胰岛素的结构及其生物合成SSSSCNSSB 肽(30)C 肽(31)A 肽(21)RRRKSSSSCNSSNC高尔基体内的特异性肽酶NC信号肽B 肽C 肽A 肽信号肽酶人胰岛素的生产方法(1)直接提取法迄今为止,有四种大规模生产人胰岛素的方法:早期人的胰岛素是从人的胰脏中直接分离纯化的,由于原料供应的限制,其产量远远不能满足日益增多的糖尿病人的临床需求。(2)化学合成法根据人胰岛素A链和B链的序列,由单个氨基酸从头合成。这条化学全合成的路线从技术上来说是能够做到的,但其生产成本奇高,从而也限制
45、了产品的广泛应用。(3)化学转型法 猪的胰岛素可从原料丰富的猪胰脏中提取获得,而且猪胰岛素与人胰岛素只在B链的C末端有一个氨基酸的差异,猪的为Ala,人的为Thr,因此将猪胰岛素在体外酶促转化为人胰岛素不失为一种选择。 上述思路的技术路线是:在pH为6-7的有机相中使胰蛋白酶催化其逆反应,该酶在过量的苏氨酸叔丁酯的存在下,将猪胰岛素B链C末端的丙氨酸交换下来,所形成的人胰岛素叔丁酯再用三氯乙酸脱去叔丁酯基团,最终获得人胰岛素。该过程的总转化率为60%但工艺路线耗时,分离纯化操作复杂,产品的价格不菲。(4)基因工程法 1982年,美国Ely LiLi公司首先使用重组大肠杆菌生产人胰岛素,成为世界
46、上第一个上市的基因工程药物。1987年,Novo公司又推出了利用重组酵母菌生产人胰岛素的新工艺。 上述由基因工程菌合成的重组人胰岛素在体外胰岛素受体结合性能、淋巴细胞和成纤维细胞的应答能力、降血糖作用、血浆药代动力学等指标上均与天然胰岛素没有任何区别,而且还具有无免疫原性、注射吸收迅速等优点,充分展示了基因工程在生物医药领域中的巨大潜力。重组人胰岛素的大肠杆菌工程菌的构建(1)A链和B链分别表达法基因工程菌的构建战略:tactacb-Galb-GalA peptideB peptideorioriAprAprMetMetMetMetMMNCMMNC化学合成A链和B链的编码序列表达产物的后处理路
47、线:MMNCMMNCb-Galb-GalABCNBr 处理NCSSSSCNSSNCNCNCNCCys 体外氧化和重折叠分离纯化生产技术的评价: 由于A链和B链上共存在六个半胱氨酸残基,体外二硫键的正确配对率较低,通常只有10% - 20%,因此采用这条工艺路线生产的重组人胰岛素每克成本高达100美元以上。 为了进一步降低生产成本,美国Ely LiLi公司随后又建立了第二条生产重组人胰岛素的工艺路线。(2)人胰岛素原表达法基因工程菌的构建战略:tacb-GalC peptideoriAprMetMetMMNCB peptideA peptide人胰岛素原的cDNA重组人胰岛素原转化分离纯化表达产
48、物的后处理路线:SSSSCN胰蛋白酶C peptideA peptideB peptideMRRKRCNBrRSSSSCNNCS SS SR羧肽酶BB链中第22位上的Arg和第29位上的Lys由于良好折叠的原因,对胰蛋白酶不敏感生产技术的评价: 在人胰岛素原表达工艺中,由于C肽的存在,胰岛素原能形成良好的空间构象,三对二硫键的正确配对率也相应提高,折叠率高达80%以上。虽然这条工艺路线并不比AB链分别表达法更为简捷,而且还要使用两种高纯度的酶制剂,但理想的折叠率在很大程度上弥补了工艺繁琐的缺陷,使得每克最终产品的成本仅50美元。 目前美国Ely LiLi公司采用此工艺年产十几吨的重组人胰岛素。
49、(3)A链和B链同时表达法tacb-GaloriAprMetMetMMNCB peptideA peptide化学合成AB链编码序列重组人胰岛素转化分离纯化CNBr 处理特异性裂解体外折叠(4)分泌型重组人胰岛素表达法 上述三种重组大肠杆菌的构建路线均采用胰岛素或胰岛素原编码序列与大肠杆菌b-半乳糖苷酶基因拼接的方法,所产生的融合型重组蛋白表达率高、稳定性强,但不能分泌,只要以包涵体的形式存在于胞质中。一种能促进融合蛋白分泌的工程菌构建策略是将胰岛素或胰岛素原编码序列与b-內酰胺酶基因拼接,b-內酰胺酶通常能被大肠杆菌分泌到胞外。由此获得的工程菌同时具备了稳定高效表达可分泌型融合蛋白的优良特性,为胰岛素的后续分离纯化工序减轻了负担。