1、 docin第六章第六章 RNARNA的生物合成的生物合成转录是以转录是以DNADNA为模板酶促合成为模板酶促合成RNARNA的过程,是基因表达全过程的的过程,是基因表达全过程的第一步,并最终导致由基因编码的蛋白质的合成。转录在化学第一步,并最终导致由基因编码的蛋白质的合成。转录在化学和酶学上与和酶学上与DNADNA的复制非常相似,二者都是通过酶的作用合成一的复制非常相似,二者都是通过酶的作用合成一条与模板条与模板DNADNA互补的核苷酸链。需要双链互补的核苷酸链。需要双链DNADNA模板。模板。 需要需要4 4种前体核糖核苷酸。种前体核糖核苷酸。 聚合酶是沿聚合酶是沿5353方向延伸方向延伸
2、RNARNA链的。链的。 RNARNA合成不需要引物。合成不需要引物。 转录发生在转录发生在DNADNA分子某些特定的区域。分子某些特定的区域。 双链双链DNADNA中也只有一条链被用来指导中也只有一条链被用来指导RNARNA合成。合成。RNARNA聚合酶具有解旋酶活性,酶移动时局部解开聚合酶具有解旋酶活性,酶移动时局部解开DNADNA双螺旋,双螺旋,暴露出模板链,形成一个转录泡暴露出模板链,形成一个转录泡转录分为三个阶段:起始转录分为三个阶段:起始(initiation)(initiation)、延伸、延伸(elongation)(elongation)和终止和终止(termination)
3、(termination)。DNADNA分子上分子上RNARNA聚合酶结合并起始转聚合酶结合并起始转录的部位称为启动子(录的部位称为启动子(promoterpromoter)。转录时,)。转录时,DNADNA双螺旋必双螺旋必须局部解旋。解旋从须局部解旋。解旋从RNARNA聚合酶结合的启动子区开始。然后聚合酶结合的启动子区开始。然后聚合酶从一个特定的、被称为起始位点的核苷酸处起始聚合酶从一个特定的、被称为起始位点的核苷酸处起始RNARNA链的合成。这一位点被定义为基因序列的链的合成。这一位点被定义为基因序列的1 1位置。新生位置。新生RNARNA链的第一个碱基通常是腺嘌呤(占链的第一个碱基通常是
4、腺嘌呤(占90%90%左右)。左右)。转录的终止发生在转录的终止发生在DNADNA分子上特定的区域,即终止子分子上特定的区域,即终止子(terminatorterminator)处。终止子经常含有反向互补序列,被转)处。终止子经常含有反向互补序列,被转录后在录后在RNARNA产物上形成发卡结构,导致产物上形成发卡结构,导致RNARNA聚合酶停顿并随聚合酶停顿并随即终止转录。即终止转录。第一节:原核生物的转录机制第一节:原核生物的转录机制大肠杆菌大肠杆菌RNARNA聚合酶是大肠杆菌细胞中最大的酶之一,该酶至少聚合酶是大肠杆菌细胞中最大的酶之一,该酶至少有有5 5种亚基组成,它们分别是种亚基组成,
5、它们分别是、和和亚基。亚基。全酶全酶(holoenzyme)(holoenzyme) :2 2,是转录起始所必需的。,是转录起始所必需的。核心酶(核心酶(core enzyme)core enzyme):2 2(不含(不含因子的酶),催因子的酶),催化延伸反应。化延伸反应。因子因子: :对转录的延伸不是必需的,它识别启动子,由此来引导对转录的延伸不是必需的,它识别启动子,由此来引导核心酶正确地起始转录。核心酶正确地起始转录。一、大肠杆菌一、大肠杆菌RNARNA聚合酶聚合酶aasbbwCore (a2, bba2, bbpw w)Combined molecular weight 390 KDa
6、Sigma subunits- bind transiently to the core- vary in size- direct RNA polymerase to specific DNA binding sitesa- a- subunitsMW = 35.6 KDaw- w- subunitsMW = 11 KDaNot required for activityb - b - subunitsMW = 155 KDa MW = 151 KDaa subunit, the N-terminus (aNTD) & C-terminus (aCTD) fold into independ
7、ent domains The NTD is bound to the core polymerase while the CTD is free to interact with other proteins or DNARoles of the Core Enzyme Subunitsa subunit, the N-terminus (aNTD) & C-terminus (aCTD) fold into independent domains The NTD is bound to the core polymerase while the CTD is free to interac
8、t with other proteins or DNAUpstream of the core promoter of rRNA genes (rrn genes) is a region called the up element (-40 to -60)Binding of the CTD to this element up regulates txn 30 xThe CTD also plays a role in other positive regulators of transcription, i.e. cAMP-CAP大肠杆菌中最常见的大肠杆菌中最常见的因子是因子是7070
9、(因其分子量为(因其分子量为70 KD70 KD而而得命)。得命)。因子在全酶对启动子的识别中起关键作用,但因子在全酶对启动子的识别中起关键作用,但并不参与链的延伸过程。大肠杆菌有多种并不参与链的延伸过程。大肠杆菌有多种因子因子, ,分别识别分别识别不同类型的启动子序列。在不同类型的启动子序列。在RNARNA链延伸链延伸8 89 nt9 nt时,时,因子因子会从会从RNARNA聚合酶中释放出来。然后核心酶沿聚合酶中释放出来。然后核心酶沿DNADNA模板移动合模板移动合成成RNARNA链。释放出来的链。释放出来的因子可以再和其他核心酶结合重新因子可以再和其他核心酶结合重新起始转录。起始转录。 二
10、、二、7070启动子启动子启动子是启动子是DNADNA分子上分子上RNARNA聚合酶首先结合的序列。大肠杆菌中,聚合酶首先结合的序列。大肠杆菌中,其中最常见的其中最常见的因子是因子是7070(因其分子量为(因其分子量为70 KD70 KD而得命)。而得命)。7070识别的启动子由识别的启动子由4040至至60 bp60 bp的序列组成。通过比较不同基的序列组成。通过比较不同基因的启动子序列,人们在大肠杆菌基因的启动子中发现了两个因的启动子序列,人们在大肠杆菌基因的启动子中发现了两个6 bp6 bp的共有序列,一个在的共有序列,一个在1010位置,另一个在位置,另一个在3535位置。共有位置。共
11、有序列是指一系列相关但不相同的序列在各个位置上最常出现的序列是指一系列相关但不相同的序列在各个位置上最常出现的核苷酸构成的序列。核苷酸构成的序列。1010序列在许多大肠杆菌基因的启动子中都存在,这一序列序列在许多大肠杆菌基因的启动子中都存在,这一序列的中心位于相对于转录起始位点的中心位于相对于转录起始位点1010的位置。有时也称为的位置。有时也称为PribnowPribnow框,因为它是由框,因为它是由Pribnow1975Pribnow1975年首先发现的。年首先发现的。1010框框的共有序列的共有序列(consensus sequence) (consensus sequence) 是是T
12、ATAATTATAAT。1010框的前框的前两个碱基(两个碱基(TATA)和最后一个碱基()和最后一个碱基(T T)最保守。该)最保守。该6 6聚体距转聚体距转录起始位点录起始位点5 58 bp8 bp。其间的间隔序列是不保守的,但距离。其间的间隔序列是不保守的,但距离很重要。很重要。1010序列似乎是聚合酶启动序列似乎是聚合酶启动DNADNA解旋的区域。解旋的区域。 在在3535位置附近的上游区也有一段保守的位置附近的上游区也有一段保守的6 6聚体序列,其聚体序列,其共有序列是共有序列是TTGACATTGACA。3535序列被认为是序列被认为是RNARNA聚合酶最初识聚合酶最初识别的序列,它
13、在高效启动子中是非常保守的。该别的序列,它在高效启动子中是非常保守的。该6 6聚体的聚体的前三个碱基最保守。前三个碱基最保守。3535框和框和1010框之间的序列并不重框之间的序列并不重要,但它们之间的距离非常重要。实验表明,两个序列要,但它们之间的距离非常重要。实验表明,两个序列之间为之间为17 bp17 bp时转录效率最高。在时转录效率最高。在9090的启动子中这段距的启动子中这段距离有离有161618 bp18 bp。大肠杆菌大肠杆菌RNARNA聚合酶全酶所识别的启动子区聚合酶全酶所识别的启动子区(-40 to -60)在一些较强的启动子中,如在一些较强的启动子中,如rRNArRNA基因
14、的启动子中,基因的启动子中,3535序列的序列的上游有一段富含上游有一段富含A+TA+T的序列,称为增强元件(的序列,称为增强元件(up-elementup-element)。该)。该元件能够提高转录效率。与启动子内的其他元件不同,元件能够提高转录效率。与启动子内的其他元件不同,UPUP元件元件并不被并不被因子所识别,而是由因子所识别,而是由亚基的羧基末端结构域识别。亚基的羧基末端结构域识别。RNARNA聚合酶通过聚合酶通过CTDCTD与与UPUP元件的相互作用促进聚合酶与启动子元件的相互作用促进聚合酶与启动子的结合的结合。 三、转录的起始、延伸和终止三、转录的起始、延伸和终止 1. 1. 转
15、录的起始转录的起始聚合酶与处于双螺旋状态的启动子聚合酶与处于双螺旋状态的启动子DNADNA所形成的最初复合物被所形成的最初复合物被称为闭合复合物称为闭合复合物( (closed complexclosed complex) )。coding strand当当RNARNA聚合酶与启动子区紧密结合后,围绕转录起始位聚合酶与启动子区紧密结合后,围绕转录起始位点解开一小段点解开一小段DNADNA双螺旋,形成开放复合物双螺旋,形成开放复合物( (open open complexcomplex).).随后转录进入流产式起始阶段(随后转录进入流产式起始阶段(abortive abortive initia
16、tioninitiation)。)。稳定的三元复合体稳定的三元复合体 在在RNARNA链的延伸过程中,转录泡与链的延伸过程中,转录泡与RNARNA聚合酶一起沿聚合酶一起沿DNADNA移移动。转录泡的大小保持恒定表明,聚合酶在转录泡之前解动。转录泡的大小保持恒定表明,聚合酶在转录泡之前解旋旋DNADNA,而在其后复旋,而在其后复旋DNADNA。大约有。大约有8 89 nt9 nt的新合成的的新合成的RNARNA链与链与DNADNA模板形成模板形成RNARNADNADNA杂合体。杂合体。 2. 2. 转录的延伸转录的延伸RNARNA聚合酶执行两种校对功能。聚合酶执行两种校对功能。第一种称为焦磷酸化
17、编辑(第一种称为焦磷酸化编辑(pyrophosphorolytic pyrophosphorolytic editingediting),该反应是形成磷酸二酯键的逆向反应。),该反应是形成磷酸二酯键的逆向反应。在第二种称为水解编辑(在第二种称为水解编辑(hydrolytic editinghydrolytic editing)的校对机制)的校对机制中,聚合酶倒退一个或更多个核苷酸,并切断中,聚合酶倒退一个或更多个核苷酸,并切断RNARNA产物,去产物,去除含有错误碱基的核苷酸序列。水解编辑是由除含有错误碱基的核苷酸序列。水解编辑是由GreGre因子激发因子激发的。的。GreGre因子不但能够增
18、强因子不但能够增强RNARNA聚合酶的水解编辑功能,还能聚合酶的水解编辑功能,还能够作为延伸因子(够作为延伸因子(elongation factorelongation factor)使)使RNARNA聚合酶进行高聚合酶进行高效的延伸反应。效的延伸反应。在细菌中存在两种不同的转录终止机制。一种终止类型不需要在细菌中存在两种不同的转录终止机制。一种终止类型不需要RhoRho因子的参与,称为因子的参与,称为RhoRho非依赖型终止;另一种需要非依赖型终止;另一种需要RhoRho因子因子的参与,称为的参与,称为RhoRho依赖型终止。依赖型终止。3. 3. 转录的终止转录的终止RhoRho非依赖型终
19、止子,由两个序列元件构成。非依赖型终止子,由两个序列元件构成。有些基因的终止序列需要一个辅助的蛋白质因子有些基因的终止序列需要一个辅助的蛋白质因子RhoRho才能有效才能有效地终止转录。地终止转录。Rho in actionRho is a hexamer helicase.Can unwind RNA-DNA hybrids.第二节:真核生物的转录机制第二节:真核生物的转录机制在真核细胞的细胞核中,有三种在真核细胞的细胞核中,有三种RNARNA聚合酶,即聚合酶,即RNARNA聚合酶聚合酶I I、IIII和和IIIIII。这三种。这三种RNARNA聚合酶最早是依据它们从聚合酶最早是依据它们从D
20、EAEDEAE纤维素纤维素柱上洗脱的先后顺序而命名的。后来发现不同生物的三种柱上洗脱的先后顺序而命名的。后来发现不同生物的三种RNARNA聚合酶的洗脱顺序不尽相同,因而改用三种聚合酶的洗脱顺序不尽相同,因而改用三种RNARNA聚合酶对聚合酶对鹅膏蕈碱(鹅膏蕈碱(amanitinamanitin)的敏感性的不同来进行区分。)的敏感性的不同来进行区分。一、真核生物一、真核生物RNARNA聚合酶聚合酶 RNA RNA聚合酶聚合酶I I合成合成5.8S rRNA5.8S rRNA、18S rRNA18S rRNA和和28S rRNA28S rRNA,存,存在于核仁中,对在于核仁中,对鹅膏蕈碱不敏感。鹅
21、膏蕈碱不敏感。 RNARNA聚合酶聚合酶IIII合成所有的合成所有的mRNAmRNA以及部分以及部分sn RNAsn RNA,存在于核,存在于核质中,对质中,对鹅膏蕈碱非常敏感。鹅膏蕈碱非常敏感。 RNARNA聚合酶聚合酶IIIIII合成合成tRNAtRNA、5S rRNA5S rRNA和某些和某些sn RNAsn RNA,也存,也存在于核质中,对在于核质中,对鹅膏蕈碱中度敏感。鹅膏蕈碱中度敏感。 aminitinSubunit composition of eukaryotic RNA polymerases羧基末端结构域羧基末端结构域: :所有所有RNA pol RNA pol 最大的亚基
22、的最大的亚基的C-C-端都含有一端都含有一段七肽串联重复序列段七肽串联重复序列Tyr-Ser-Pro-Thr-Ser-Pro-SerTyr-Ser-Pro-Thr-Ser-Pro-Ser,延伸,延伸形成一个尾巴,被称为羧基末端结构域(形成一个尾巴,被称为羧基末端结构域(carboxyl-terminal carboxyl-terminal domaindomain,CTDCTD)。酵母的)。酵母的Pol IIPol II的的CTDCTD中有中有2727个个7 7肽重复序列,肽重复序列,哺乳动物中有哺乳动物中有5252个个7 7肽重复,每一重复都包含特定的磷酸化位肽重复,每一重复都包含特定的磷酸
23、化位点。点。二、二、RNA Pol I RNA Pol I 负责转录的基因负责转录的基因 1. 1.核糖体核糖体RNARNA基因基因rRNArRNA是细胞内占优势的转录产物,占细胞是细胞内占优势的转录产物,占细胞RNARNA总量的总量的80809090。真核细胞中有真核细胞中有4 4种种rRNArRNA,5S5S、5.8S5.8S、18S18S和和28S rRNA28S rRNA。在真核。在真核细胞基因组中,细胞基因组中,18S18S、5.8S5.8S和和28S rRNA28S rRNA基因构成一个转录单位,基因构成一个转录单位,由由RNARNA聚合酶聚合酶I I负责转录。负责转录。5S rR
24、NA5S rRNA则单独由则单独由RNARNA聚合酶聚合酶IIIIII转录。转录。 rRNArRNA基因属于中度重复序列,集中成簇。人类细胞含有约基因属于中度重复序列,集中成簇。人类细胞含有约400400个拷贝的个拷贝的rRNArRNA基因,聚集成基因,聚集成5 5个个rRNArRNA基因簇,分布在不同的染基因簇,分布在不同的染色体上。每一基因簇含有许多转录单位,转录单位之间是非转色体上。每一基因簇含有许多转录单位,转录单位之间是非转录间隔区。每一录间隔区。每一rDNArDNA转录单位产生一个长约转录单位产生一个长约13 000 nt 13 000 nt 的的45S 45S rRNArRNA转
25、录物。这一转录物随后被切成转录物。这一转录物随后被切成28S28S(5 000 nt5 000 nt)、)、18S18S(2 000 nt2 000 nt)5.8S 5.8S (160 nt160 nt)rRNArRNA各一个。各一个。在在rRNArRNA合成活跃的合成活跃的细胞中,一个转录细胞中,一个转录单位由许多单位由许多RNARNA聚聚合酶在进行转录。合酶在进行转录。形成圣诞树样结构形成圣诞树样结构(Christmas tree Christmas tree structuresstructures)2.RNA Pol I promoter和转录的起始和转录的起始人类的人类的rRNArR
26、NA基因的启动子由核心元件(基因的启动子由核心元件(core elementcore element)和上)和上游控制元件(游控制元件(upstream control element, UCEupstream control element, UCE)两个部分)两个部分构成。构成。RNARNA聚合酶聚合酶I I起始转录需要两种辅助因子,上游结合因子起始转录需要两种辅助因子,上游结合因子(upstream binding factorupstream binding factor,UBFUBF)和选择因子)和选择因子(selectivity factor 1, SL1selectivity f
27、actor 1, SL1)。)。SL1SL1至少由至少由4 4个亚基组成,其中一个亚基是个亚基组成,其中一个亚基是TBPTBP(TATA binding TATA binding proteinprotein),其他三个亚基叫做),其他三个亚基叫做TBPTBP相关因子(相关因子(TBP-associated TBP-associated protein, TAFprotein, TAF)。)。Pol IPol I通过其伴随因子通过其伴随因子Rrn3Rrn3与与SL1SL1相互作用形相互作用形成前起始复合物(成前起始复合物(preinitiation comlexpreinitiation co
28、mlex)。此时,启动子即)。此时,启动子即转换到转换到“开启开启(open) ”(open) ”状态,转录起始。状态,转录起始。随后,随后,Rrn3 Rrn3 从从PICPIC脱离并失活,导致脱离并失活,导致Pol Pol 从启动子释放,转从启动子释放,转录进入延伸阶段。此时,尽管录进入延伸阶段。此时,尽管pol Ipol I离开了启动子,但离开了启动子,但UBF UBF 和和SL1 SL1 仍然保留在启动子区域,可募集下一个仍然保留在启动子区域,可募集下一个Pol IPol I,于同一地,于同一地点再一次启动转录,实现对同一点再一次启动转录,实现对同一rRNA rRNA 基因的多轮转录。基
29、因的多轮转录。 3 3、RNA Pol IRNA Pol I转录的终止转录的终止哺乳动物哺乳动物rRNArRNA基因的终止子位于前体基因的终止子位于前体rRNArRNA转录区的下游,被转录区的下游,被称作称作SalSal盒。小鼠的盒。小鼠的SalSal盒为一在非转录间隔区重复盒为一在非转录间隔区重复1010次的次的18 18 bpbp基序,而人类的基序,而人类的SalSal盒较短,为盒较短,为11 bp11 bp。SalSal盒是转录终止盒是转录终止因子(因子(transcription termination factor-1, TTF-1transcription termination
30、factor-1, TTF-1)的)的识别位点。识别位点。TTF-1TTF-1与与SalSal盒结合导致盒结合导致Pol IPol I的停顿,但不会造的停顿,但不会造成三元复合体的解体。成三元复合体的解体。新生新生RNARNA链和链和Pol IPol I与模板脱离还需要转录释放因子与模板脱离还需要转录释放因子PTRFPTRF(Pol Pol I transcription release factor, PTRFI transcription release factor, PTRF)和转录释放元件)和转录释放元件(transcription release elementtranscript
31、ion release element)。转录释放元件为一富)。转录释放元件为一富含含T T的序列,位于的序列,位于SalSal盒的上游,是转录的终止的地方。很可能盒的上游,是转录的终止的地方。很可能PTRFPTRF与新生与新生RNARNA链链33末端的一串末端的一串U U结合,促进了新生结合,促进了新生RNARNA链的释链的释放。所以,放。所以,Pol IPol I的转录终止包含两个步骤,第一步是的转录终止包含两个步骤,第一步是TTF-1TTF-1与与SalSal结合导致转录的停顿,第二步是结合导致转录的停顿,第二步是PTRFPTRF介导新生的介导新生的RNARNA链和链和Pol IPol
32、I与模板脱离。与模板脱离。 三、三、RNA Pol III genes: 5S rRNA and tRNA RNA Pol III genes: 5S rRNA and tRNA transcriptiontranscriptionRNARNA聚合酶聚合酶IIIIII是一个至少由是一个至少由1616种不同的亚基构成的复合体,种不同的亚基构成的复合体,与与RNARNA聚合酶聚合酶IIII一样也位于核质种。一样也位于核质种。RNARNA聚合酶聚合酶IIIIII负责负责5S 5S rRNArRNA、tRNAtRNA、无帽子结构的、无帽子结构的snRNA(small nuclear RNA)snRNA
33、(small nuclear RNA)和和snoRNA(small nucleolar RNA)snoRNA(small nucleolar RNA)的转录。的转录。1.tRNA1.tRNA基因的转录基因的转录tRNAtRNA基因的启动子位于转录起始位点之后,由两个非常保守基因的启动子位于转录起始位点之后,由两个非常保守的序列构成,分别被称为的序列构成,分别被称为A A框(框(5-TGGCNNAGTGG-35-TGGCNNAGTGG-3)和)和B B框框(5-GGTTCGANNCC3)(5-GGTTCGANNCC3)。同时这两个序列还编码。同时这两个序列还编码tRNAtRNA的的D D环环和和
34、TCTC环。这意味着环。这意味着tRNAtRNA基因内的高度保守序列同时也是高基因内的高度保守序列同时也是高度保守的启动子的序列。度保守的启动子的序列。 2.rRNA2.rRNA基因的转录基因的转录与与RNARNA聚合酶聚合酶I I转录的转录的rRNArRNA基因一样,基因一样,5S rRNA5S rRNA基因也是串联排基因也是串联排列形成基因簇。在人类基因组中有一个大约由列形成基因簇。在人类基因组中有一个大约由20002000个个5S rRNA5S rRNA基因组成的基因簇。基因组成的基因簇。5S rRNA5S rRNA基因的启动子位于转录起始位点基因的启动子位于转录起始位点下游,转录区的内
35、部,属于内部启动子。启动子被分成下游,转录区的内部,属于内部启动子。启动子被分成A A框和框和C C框两个部分,框两个部分,A A框位于框位于50506565,C C框位于框位于81819999。TFIIICTFIIIC不能直接与不能直接与5S rRNA5S rRNA基因启动子结合。在装配转录起始复基因启动子结合。在装配转录起始复合体时,首先是合体时,首先是TFIIIATFIIIA与启动子的与启动子的C C框结合。框结合。TFIIIATFIIIA由一条多肽由一条多肽链组成,含有锌指结构。链组成,含有锌指结构。TFIIIATFIIIA与启动子结合后招募与启动子结合后招募TFIIICTFIIIC与
36、与启动子结合,随后启动子结合,随后TFIIIBTFIIIB被招募到转录起始位点附近。最后被招募到转录起始位点附近。最后RNARNA聚合酶通过与聚合酶通过与TBFTBF的相互作用而被招募的转录起始复合体中,起的相互作用而被招募的转录起始复合体中,起始转录。始转录。3、人类、人类U6 snRNA基因的转录基因的转录还有一类还有一类RNARNA聚合酶聚合酶IIIIII负责转录的基因(例如负责转录的基因(例如U6 snRNAU6 snRNA、7SK 7SK RNARNA和和7SL RNA7SL RNA基因)的启动子位于转录起始位点的上游,属基因)的启动子位于转录起始位点的上游,属于外部启动子。这类基因
37、的启动子含有三种元件,靠近转录于外部启动子。这类基因的启动子含有三种元件,靠近转录起始位点的上游序列起始位点的上游序列TATATATA框是转录起始所必需的,框是转录起始所必需的,TATATATA框上框上游的两个元件分别是近端序列原件(游的两个元件分别是近端序列原件(proximal sequence proximal sequence element, PSEelement, PSE)和远端序列元件()和远端序列元件(distal sequence elementdistal sequence element,DSEDSE)。)。DSEDSE的作用是募集转录激活因子的作用是募集转录激活因子Oc
38、t-1Oct-1。 与与DSEDSE结合的结合的Oct-1Oct-1又促进又促进SnRNASnRNA激活蛋白复合体(激活蛋白复合体(SnRNA SnRNA activating protein complex, SNAPcactivating protein complex, SNAPc)与)与PSEPSE结合。然后,结合。然后,TFIIIBTFIIIB在在SNAPcSNAPc的介导下,通过其的介导下,通过其TBPTBP亚基与启动子的亚基与启动子的TATATATA框结合。实际上框结合。实际上TBPTBP就是识别就是识别TATATATA框的亚基,框的亚基,TFIIIBTFIIIB中的其中的其他亚
39、基称为他亚基称为TBPTBP相关因子(相关因子(TBF-related factorTBF-related factor)。)。TBPTBP及及其相关蛋白的作用是保证其相关蛋白的作用是保证RNARNA聚合酶聚合酶IIIIII的准确定位。的准确定位。 1) Assembly factor binds first (UBP and TFIIIC in class I and III promoters, respectively)2) This attracts another factor that contains TBP (these are SL1 or TFIIIB in class I
40、 and III promoters, respectively).3) These complexes are sufficient to recruit polymerase in class I and III四、四、RNA Pol IIRNA Pol II基因的转录基因的转录1. RNA1. RNA聚合酶聚合酶IIII的启动子的启动子(1 1) RNARNA聚合酶聚合酶IIII的核心启动子的核心启动子RNARNA聚合酶聚合酶IIII启动子由核心启动子和上游元件两部分组成。核启动子由核心启动子和上游元件两部分组成。核心启动子是体外心启动子是体外RNARNA聚合酶聚合酶IIII精确起始转录
41、所需的最少一组序精确起始转录所需的最少一组序列元件,因此又称基本启动子。已在列元件,因此又称基本启动子。已在Pol IIPol II的核心启动子中的核心启动子中发现了四种元件,它们是发现了四种元件,它们是TATATATA盒、盒、TFIIBTFIIB识别元件(识别元件(TFIIB TFIIB recognition element, BRErecognition element, BRE)、起始框()、起始框(initiator boxinitiator box,InrInr)和下游启动子元件()和下游启动子元件(downstream promoter element, downstream p
42、romoter element, DPEDPE)。一个启动子通常只含有其中的)。一个启动子通常只含有其中的2 23 3个元件。个元件。(2 2)上游启动子元件)上游启动子元件RNARNA聚合酶聚合酶IIII在体内进行有效转录还需要上游元件。上游元件在体内进行有效转录还需要上游元件。上游元件的长度通常是的长度通常是5 510 bp10 bp,位于转录起始位点上游,位于转录起始位点上游5050200 bp200 bp处,它们或者极大地处,它们或者极大地提高基因的转录效率或者决定基因表达提高基因的转录效率或者决定基因表达的组织特异性的组织特异性。一个启动子可以具有多个上游元件,同一个。一个启动子可以
43、具有多个上游元件,同一个上游元件也可以存在于不同启动子的不同位置。转录激活因上游元件也可以存在于不同启动子的不同位置。转录激活因子(子(transcriptional activatorstranscriptional activators)与上游启动子元件结合)与上游启动子元件结合对转录过程进行调节。对转录过程进行调节。常见的上游元件包括常见的上游元件包括GCGC框、框、CAATCAAT框、框、OctOct元件等。元件等。GCGC框是真框是真核生物核生物IIII型启动子中的一个常见元件,其共有序列是型启动子中的一个常见元件,其共有序列是GGGCGGGGGCGG。在转录起始位点上游在转录起始位
44、点上游4040100 bp100 bp处可以有几个拷贝的处可以有几个拷贝的GCGC框。框。看家基因的启动子常常具有几个拷贝的看家基因的启动子常常具有几个拷贝的GCGC框。而那些在一种框。而那些在一种或几种细胞中选择性表达的基因常常缺乏这样的或几种细胞中选择性表达的基因常常缺乏这样的GCGC丰富序列。丰富序列。 很多结构基因,包括编码各种珠蛋白的基因的启动子中含有一很多结构基因,包括编码各种珠蛋白的基因的启动子中含有一个称为个称为CAATCAAT盒的保守序列,位于盒的保守序列,位于707090 bp90 bp处,其一致序列处,其一致序列是是5-GGN5-GGNCAATCAATCT-3CT-3。该
45、序列如果发生突变会极大地降低珠蛋。该序列如果发生突变会极大地降低珠蛋白基因转录的效率。尽管启动子的作用是单向的,但是白基因转录的效率。尽管启动子的作用是单向的,但是GCGC框和框和CAATCAAT框能够在两个方向上发挥作用。这两个元件的作用是提高框能够在两个方向上发挥作用。这两个元件的作用是提高转录的效率,但并不决定转录的特异性。转录的效率,但并不决定转录的特异性。OctOct元件(元件(ATTTGCATATTTGCAT,或者或者ATGCAAATATGCAAAT)存在于很多基因的启动子和增强子中。在哺乳)存在于很多基因的启动子和增强子中。在哺乳动物中,动物中,OctOct元件似乎是决定免疫球蛋
46、白轻链基因和重链基因在元件似乎是决定免疫球蛋白轻链基因和重链基因在B-B-细胞中特异性表达的主要因素。细胞中特异性表达的主要因素。一些上游元件可以被几种特异性的转录因子识别。在这种情一些上游元件可以被几种特异性的转录因子识别。在这种情况下,不同的转录因子存在于不同的组织中。例如,转录因况下,不同的转录因子存在于不同的组织中。例如,转录因子子Oct-1Oct-1和和Oct-2Oct-2均识别均识别OctOct元件。元件。Oct-1Oct-1存在于所有的组织中,存在于所有的组织中,但但Oct-2Oct-2仅存在于免疫细胞中,激活编码免疫球蛋白的基因。仅存在于免疫细胞中,激活编码免疫球蛋白的基因。
47、GCGC框:框: GGGCGG CAATCAAT框:框: GGNCAATCT OctOct元件:元件:ATTTGCAT ,or ATGCAAAT 2 2、增强子(、增强子(enhancerenhancer)除核心启动子和上游调控元件以外,真核生物基因还有一段除核心启动子和上游调控元件以外,真核生物基因还有一段序列与转录的起始有关。在序列与转录的起始有关。在SV40SV40早期启动子的上游,有一段早期启动子的上游,有一段200 bp200 bp的的DNADNA片段可以明显增强启动子的活性。该片段含有两片段可以明显增强启动子的活性。该片段含有两个个72 bp72 bp长的重复序列,它们不是启动子的
48、一部分,但能增强长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始。若除去这两段序列,基因的表达水平会或促进转录的起始。若除去这两段序列,基因的表达水平会大大地降低。大大地降低。这种通过启动子来增强转录的序列被称为增强这种通过启动子来增强转录的序列被称为增强子(子(enhancerenhancer)。大多数受调控的基因的表达都需要增强子,。大多数受调控的基因的表达都需要增强子,而持家基因的表达不需要增强子。而持家基因的表达不需要增强子。 有人曾把有人曾把珠蛋白基因置于带有上述珠蛋白基因置于带有上述72 bp72 bp序列的序列的DNADNA分分子上,发现它在体内的转录水平提高了子上
49、,发现它在体内的转录水平提高了200200倍。而且,无论倍。而且,无论这段这段72 bp72 bp序列放在转录起始位点的上游序列放在转录起始位点的上游1 400 bp1 400 bp或下游或下游3 3 300 bp300 bp处,它都有增强转录的作用。处,它都有增强转录的作用。这说明增强子无启动这说明增强子无启动子特异性,可以从基因的上游或下游远距离发挥作用。子特异性,可以从基因的上游或下游远距离发挥作用。增增强子序列的跨度一般为强子序列的跨度一般为100100200 bp200 bp,具有多种特异性转录,具有多种特异性转录因子的结合元件,其中一些元件,例如因子的结合元件,其中一些元件,例如O
50、ctOct和和AP1AP1,也是启,也是启动子的上游元件。动子的上游元件。3. 3. 转录起始转录起始所有的真核生物所有的真核生物RNARNA聚合酶自身均不能识别启动子,它们需要聚合酶自身均不能识别启动子,它们需要转录因子的辅助才能与启动子结合起始体外转录。转录因子的辅助才能与启动子结合起始体外转录。RNARNA聚合酶聚合酶IIII进行体外基本转录(进行体外基本转录(basal transcriptionbasal transcription)所必需的转录)所必需的转录因子称为因子称为通用转录因子通用转录因子。基本转录的起始,依赖转录因子与启动子的相互作用,以及各种基本转录的起始,依赖转录因子