1、第三章 转录及其调控,中心法则 The Central Dogma,逆转录,复 制,转 录,翻 译,DNA,RNA,蛋白质,在有些病毒中,RNA也可以指导合成RNA。,转录 (transcription) 是生物体以DNA为模板合成RNA的过程 。,1、基本概念,2、参与转录的物质,原料: NTP (ATP, UTP, GTP, CTP) 模板: DNA 酶: 依赖DNA的RNA聚合酶(RNA polymerase) 其他蛋白质因子,3、转录的规律,不对称转录(asymmetric transcription),有义链 (sense strand) 又称编码链 coding strand: 指
2、不作模板的DNA单链,反义链 (antisense strand) 又称模板链 template srand : 指作为模板进行RNA转录的链,在依赖DNA的RNA聚合酶作用下进行转录 AU、CG 合成RNA分子 转录合成RNA链的方向为53,模板单链DNA的极性 方向为35, 而非模板单链的极性方向与RNA链相 同,均为53。(书写) 基因转录方式为不对称转录(一条单链DNA 为模板,RNA 聚合酶的结合) ,有两方面含义:在DNA分子双链上,一 股链用作模板指引转录,另一股链不转录;其二是模板链 并非总是在同一单链上,RNA 的转录包括 promotion. elongation. ter
3、mination 三过程 从启动子 (promoter)到终止子(terminator)称为转录单 位 (transcription unit) (转录起始点) 原核生物的转录单位多为 polycistron in operon,真 核生物中的 转录单位多为monocistron, No operon 转录起点即转录原点记为1,其上游记为负值,下游 记为正值,均以DNA为模板 均需要依赖DNA的聚合酶 均以含三个磷酸的核苷酸为原料 均是核苷酸聚合过程,多核苷酸为产物 均遵从碱基配对规律,A-U;G-C,(1)复制和转录的相同点,(2)复制和转录的不同点,第一节 原核生物转录,RNA聚合酶直接与
4、模板DNA启动序列结合启动转录。 转录过程分为起始、延长和终止三个阶段。 起始需要RNA聚合酶全酶,延长仅需核心酶。 终止分为依赖因子和不依赖因子两种机制。,原核生物转录酶及相关因子,原核生物RNA聚合酶:全酶 = 核心酶(2) + 因子 亚基决定转录的基因 亚基在5 3方向上延长多核苷酸链,可被利福平抑制 亚基结合DNA模板 因子识别“启动子”并与之结合 功能不清楚,原核生物转录相关因子 因子:六聚体蛋白、依赖ATP的解旋酶活性。 其他因子:nusA蛋白,识别新和成RNA分子中的终止信号,原核生物转录过程,原核生物转录起始: RNA聚合酶与模板DNA的启动子辨认结合 启动子:RNA聚合酶识别
5、、结合并起始转录的一段高度保守性DNA序列,两个相关概念: 操纵元(operon): 是原核生物基因 表达调控的一个 完整单元,其中 包括结构基因、 调节基因、操作 子和启动子,启动子(promoter):是指DNA分子上被RNA聚合酶识别并结合形成起始转录复合物的区域 ,它还包括一些调节蛋白因子的结合位点 。 (频率、效率),一、原核生物的RNA polymerase (E. coli),1、全酶 (Holo Enzyme)和核心酶(Core Enzyme),(1) 全酶(Holo Enzyme) 用于转录的起始 依靠空间结构与DNA模板结合 (与核心酶结合后 引起的构象变化) 专一性地与D
6、NA序列(启动子)结合 结合常数:1014mol 半衰期:数小时 (107mol 1秒以下) 转录效率低,速度缓慢( 的结合 ),(2) 核心酶 (Core Enzyme) 作用于转录的延伸过程(终止) 依靠静电引力与DNA模板结合(蛋白质中碱性 基团与DNA的磷酸根之 间) 非专一性的结合(与DNA的序列无关) 结合常数:1011mol 半衰期:60秒,此外,新发现的一种亚基的功能尚不清楚。 2、各亚基的特点和功能 (1) 因子 因子可重复使用 修饰RNApol构型 使Holo Enzyme 识别启动子的Sextama Box(35区), 并通过与模板链结合,2 ,2, 2 ,2,(3)全酶
7、的组装过程, 不同的因子识别不同的启动子 E.coli 中有五种因子(70、32、54、28 、 24 ) 枯草杆菌中有11种因子 (因子的更替对转录起始的调控),第一个磷酸二酯键生成后,亚基即从转录起始复合物上脱落,核心酶连同四磷酸二核苷酸,继续结合于DNA模板上,酶沿DNA链前移,进入延长阶段。,(2)因子 核心酶的组建因子, 2 2, 促使RNApol 与DNA模板链结合, 前端因子使模板DNA双链解链为单链 尾端因子使解链的单链DNA重新聚合为双链,(3) 因子, 促进RNApolNTP RNA elongation, 完成NMP之间的磷酸酯键的连接 Editing 功能(排斥与模板链
8、不互补的碱基) 与Rho ()因子竞争RNA 3end,E site(elongation site. RifR):对NTP非专一性地结 合(催化作用和Editing功能),(4) 因子 参与RNA非模板链(sense strand)的结合 (充当SSB), 构成Holoenzyme 后,因子含有两个位点 I site(initiation site . Rifs): 该位点专一性地结合 ATP或者GTP (需要高浓度的ATP或GTP),由于各亚基的功能,使全酶本身含有五个功能位点,有义DNA链结合位点( 亚基提供) DNA/RNA杂交链结合位点(亚基提供) 双链DNA解链位点(前端 亚基提供
9、) 单链DNA重旋位点(后端亚基提供) 因子作用位点,E. coli RNA polymerase,用于起始和延伸,只用于起始,36.5 KD,36.5 KD,151 KD,155 KD,11 KD,70 KD,原核生物启动子结构,-10区:TATA区(Pribnow box),RNA聚合酶的牢固结合位点 -35区:TTGACA区,与RNA聚合酶的因子相互识别,转录起始的过程: 核心酶在因子的参与下,与模板DNA接触,生成非专一性的,不稳定的复合物在模板上移动 起始识别:亚基发现识别位点后,与-35区序列结合形成一个封闭的启动子复合体“酶-启动子二元复合物”,全酶紧密地结合在启动子的-10序列
10、处,模板DNA局部变性,形成“开放的启动子二元复合体” 酶移动到转录起始点,第一个rNTP转录开始, 因子释放,形成“酶-启动子-rNTP三元复合体”,RNA链的延伸 核心酶向前移动, NTP不断聚合,RNA链不断延长 核心酶覆盖双链DNA和RNA复合物,向前推进,边解开螺旋边释放出新合成的RNA链,已经转录的区域中分开的DNA链又重新形成双螺旋,E.coli的转录起始和延长,原核生物转录终止 终止子:DNA分子中终止转录的核苷酸序列 。 不依赖Rho ()因子的转录终止 依赖Rho ()因子的转录终止,不依赖Rho ()因子的转录终止 结构特征: 一是形成一个发夹结构 茎. 720 bp的I
11、R序列形成(富含G/C) 环.中间不重复序列形成 发夹结构的突变可阻止转录的终止 二是6 8 个连续的U串(发夹结构末端),原核生物转录的终止 不依赖因子的终止子终止转录 (1) 新生RNA链发夹结构形成,与RNApol发生作用,造成高度延宕(典型的有60秒左右),(2) RNApol暂停为终止提供了机会 ,6 8个连续的U 串可能为RNApol与模板的解离提供了信号 RNADNA之间的 rUdA 结合力较弱,阻止RNA链的释放,不依赖终止子结构,茎部富含GC,无连续 U串,G/C含量较少,依赖 因子的终止子终止转录 (1) 通读(read through):在依赖 因子的转录终止 过程中,
12、RNApol 转录了 IR 序列之后,虽发生 一定时间的延宕,但如果没有 因子存在,则 RNApol 会继续转录 (2) 因子 a、 活性形式为六聚体 促进转录终止的活性,NTPase 活性,b、 RNA长度大于50nt时,依赖RNA的NTPase活性最大 说明:因子识别和结合的是RNA (3) 因子对终止子的作用 a、因子与RNA结合(终止子上游的某一处,RNA的5端 ),b、因子沿RNA从53移动(NTP水解供能) (终止子处的较长时间的延宕给因子追赶的机会),c、因子与 RNApol 相互作用而造成转录的终止,结合上来追赶RNApol,追赶上来(暂停),与RNApol相互作用使杂交链解链
13、,(4) 终止反应还需要 RNA 与 DNA 的相互作用 即 : 需要一定的RNA序列 因为: 其与模板的结合力必须弱到一定数值,才能配合 因子与 RNApol 的作用 (发夹结构下游的AU序列) 序列不同的终止子不同的终止程度基因表达 调控的途径之一,真核生物转录,三种RNA pol识别不同启动子。 转录起始过程需要很多转录因子(transcription factor, TF )参与,按一定顺序与DNA形成复合物,协助RNA pol定位于转录起始点 RNA-pol前移会遇到核小体,转录延长过程中可以观察到核小体移位和解聚现象 真核生物转录终止与转录产物的加工密切相关,真核生物转录酶及相关因
14、子,真核生物RNA聚合酶,RNA聚合酶I的启动子,核心启动子(core promoter),由-45+20位核苷酸组成,单独存在时就足以起始转录。 由-170 -107位序列组成,称为上游调控元件,能有效地增强转录效率 转录成rRNA,真核生物启动子,RNA聚合酶启动子,起始子:转录起始的第一个碱基多为A,两侧各有若干嘧啶核苷酸 TATA box: -25 -35区含TATA序列,是转录因子与DNA分子结合的部位,使转录精确地起始 CAAT 框:-70 -80区含CCAAT序列,控制转录起始的频率 GC box:-80 -110区含有GCCACCC或GGGCGGG序列,控制转录起始的频率,负责
15、转录的是5SrRNA、tRNA和某些snRNA 5S rRNA和tRNA基因的启动子是内部启动子位于转录起始位点的下游,RNA聚合酶启动子,转录因子 (transcription factor, TF):是一类细胞核内蛋白因子,通过与顺式作用元件和RNA聚合酶的相互作用调节转录的活性 基本转录因子RNA聚合酶结合启动子所必需的一组蛋白因子 特异转录因子结合在转录核心元件以外的其他上游顺式作用元件的蛋白因子,通过DNA与蛋白之间的相互作用影响转录的效率,真核生物RNA-pol不与DNA分子直接结合,而需依靠众多的转录因子,真核生物转录的终止,真核生物RNA聚合酶II转录生成hnRNA的过程,直至
16、出现多聚腺苷酸信号(AATAA及其下游富含GT的序列)为止,真核生物RNA成熟,真核生物转录生成的RNA是初级转录产物(primary transcripts),是不具备生物活性及独立功能的前体RNA,必须经过适当的加工处理,才能变为成熟的、有活性的RNA,真核生物mRNA的成熟,5端形成特殊的帽子结构 3端切断一段序列并加上poly A尾巴 通过剪切去除由内含子转录来的序列 链内部核苷酸甲基化,mRNA的转录后修饰-帽子 1、 帽子的种类 帽子0(Cap-0) m7GpppXpYp-(共有) m7G N7甲基鸟苷 帽子1 (Cap-1) m7GpppXmpYp- 第一个核苷酸的 2-O 位上
17、产生甲基 化 (A N6 位甲基化) 帽子2(Cap-2) m7GpppXmpYmp 第二个核苷酸的 2-O 位上产生甲基 化(A、G、C、U),HNCH3,m7G,帽子0,其中:, 单细胞真核生物只有 Cap0, Cap1 是其余真核生物的主要帽子形式, Cap2 存在于某些真核生物中,2、 帽子结构的生成, 甲基供体都为S腺苷甲硫氨酸(SAM), RNA鸟苷酸基转移酶-戴帽酶(capping enzyme),5端加帽及其重要性,a. 翻译起始的必要结构,为IF3(起始因子)和核糖体对mRNA的识别提供信号 b. 增加mRNA的稳定性,保护mRNA 免遭5外切核酸酶的攻击 c. 运输,有助于
18、mRNA越过核膜,进入胞质,mRNA的转录后修饰二- 多聚(A)尾巴,1、 3端-约长200bp (大多数Euk.的mRNA) (poly(A)+ poly(A)- ),最近研究发现,原核生物的RNA转录后也有3添加 poly(A) 的现象,E.coli 的poly(A)+聚合酶早在1962年就已发现,2、 poly(A) 的生成,a、 RNA末端腺苷酸转移酶(poly(A) 聚合酶)催化 前体ATP,反应如下: 多聚核糖核酸 + nATP,Mg+ 或 Mn+,多聚核糖核酸(A)n + nPPi b、添加位点 内切酶(360KDa)切除一段序列,由poly(A) 聚合酶 催化添加poly(A)
19、,内切酶的识别位点(有其它因子参与),切点上游 1320bp处的 AAUAAA 切点下游的 GUGUGUG (单细胞Euk.除外),3端加尾及其功能,与mRNA从细胞核转送到细胞质有关 稳定mRNA结构,保持生物半衰期 与真核mRNA的翻译效率有关:缺失可抑制体外翻译的起始,含 poly(A) 的mRNA 失去 poly(A) 可减弱其翻译 稳定帽子结构,RNA的剪接,RNA剪接(RNA splicing) :一个基因的外显子和内含子共同转录在一条转录产物中,将内含子去除而把外显子连接起来形成成熟RNA分子的过程,内含子(intron) 成熟RNA的序列中不出现的序列 外显子(exon) 在断
20、裂基因及其初级转录产物上出现,并表达为成熟RNA的核酸序列,1977年,在冷泉港会议上,来自冷泉港实验室的罗伯茨(Richarl J.Roberts)和麻省理工学院癌症研究中心的夏普(Pilip A. sharp)报道了他们关于真核生物断裂基因的发现。因为这一发现,他们分享了1993年诺贝尔生理医学奖。断裂基因的发现揭示了真核生物不同于原核生物。其次,这一过程体现了生物进化中的自然选择机制的美妙。第三,它成为生物研究的一个重要生长点。,断裂基因的发现,夏普,1974年在麻省理工学院的癌症研究中心。他集中于肿瘤病毒的分子生物学和RNA剪接研究。夏暜关注腺病毒的基因表达过程。他想看看hnRNA和
21、mRNA有什么不同。他利用DNA和RNA杂交的方法找到了二者的不同。他们发现hnRNA明显长于mRNA. mRNA不能与DNA全部杂交。他们获得了1993年诺贝尔奖。,美国科学家,因发现mRNA的剪接于1993年获诺贝尔奖,内含子的分类,类内含子:线粒体、叶绿体、低等真核生物rRNA的基因 类内含子 :线粒体、叶绿体mRNA的基因 类内含子 :多数mRNA的基因,形成套索后剪接。 IV类内含子 :tRNA的基因及其初级转录产物中的内含子。剪接过程需要酶和ATP。,3)mRNA前体( hnRNA )的剪接,1)边界序列:5-GU.AG-OH-3 2)分枝点顺序:内含子3端上游 3)依赖于snRN
22、Ps进行剪接 4)内含子5端有一保守序列5GUAAGUA3,和剪接体中U1 snRNA的5端的3CAUUUCAU5互补,四种内含子的边界序列各有一定共同的特征,拼接方式,方式一:由拼接装置完成(核mRNA内含子) 可供识别的特异序列 拼接装置由多种蛋白质和核蛋白组成,方式二:自我拼接(两类内含子 、 ) 形成特定的二级结构 RNA具有催化拼接的能力,方式三:需要蛋白质酶参与的拼接(酵母tRNA) 前两种拼接都属于转酯反应,RNAaseP切除5端前导序列 RNAaseD切去3端附加顺序,加上-CCA-OH 通过剪接去除内含子 核苷酸修饰形成稀有碱基,真核生物tRNA的成熟,真核生物rRNA的成熟
23、,初始转录本为45S前体,18S,5.8S和28S rRNA 是一个转录本 5s rRNA前体独立于其他三种rRNA的基因转录 前体rRNA与蛋白质结合,然后再切割和甲基化 剪切和甲基化均需要小核仁RNA(snoRNAs)的参与,RNA编辑,RNA编辑(RNA editing):在mRNA水平上,通过核苷酸的缺失、插入或替换而改变遗传信息的过程,转录调控,基因表达是多级水平上进行的复杂事件,分为: 转录水平、转录后水平(加工及转运)、翻译水平及翻译后水平,但以转录水平的基因表达调控最为重要 转录调控涉及特异的转录调节蛋白与转录调控区DNA之间的相互作用,可产生正或负的调控效果,原核生物转录调控
24、的特点,因子决定RNA聚合酶识别的特异性 操纵子模型的普遍性:多个功能相关的原核基因串联在一起,依赖同一转录调控区对基因的转录进行调节,以确保功能相关基因之间表达的协调性 以负性调节为主:阻遏蛋白与操纵基因结合,抑制转录起始,操纵子(operon):是原核生物DNA上的一段区域。是由若干功能相关的结构基因和控制这些基因表达的元件组成的一个完整、连续的功能单位,原核生物转录起始调控,操纵子的基本组成,结构基因(structural genes):能通过转录、翻译使细胞产生一定的酶系统和结构蛋白 操纵基因(operator, O):控制结构基因的转录速度,位于结构基因的附近,本身不能转录成mRNA
25、 启动基因P:位于操纵基因的附近,它的作用是发出信号,mRNA合成开始 调节基因(regulator gene, i):产物为阻遏物(repressor)或激活物(activator),调节操纵基因,1.乳糖操纵子,由3个结构基因(lac Z、lac Y 、 lac A)及其上游的操纵序列(operator, O)、启动序列(promotor, P)、分解代谢物基因激活蛋白(CAP)结合位点和调节基因(inhibitor gene, I)构成,没有乳糖存在时,阻遏蛋白的负性调节,有乳糖存在时,阻遏蛋白的负性调节 可诱导调控 1) 无乳糖存在时,阻遏物可以结合在操纵基因上 阻止转录过程 基因关闭
26、; 2)有乳糖存在时,乳糖半乳糖与阻遏物结合阻遏物变构 阻遏物不能结合操纵基因 转录进行 基因开放。,CAP的正性调节,一个由两个相同亚基组成的二聚体,可被单个分子cAMP激活 CRP单体含一个DNA结合区和一个转录激活区,无葡萄糖,cAMP浓度高时,有葡萄糖,cAMP浓度低时,CAP及RNA 聚合酶不能与 启动基因结合,当培养基中乳糖浓度降低而葡萄糖浓度升高时,细胞中cAMP浓度降低,缺乏乳糖与阻遏蛋白结合,CAP失活,阻遏蛋白与操纵基因结合,基因转录被阻遏,阻遏蛋白的负性调节,乳糖操纵子的协调调节,当培养基中乳糖浓度升高而葡萄糖浓度降低时,细胞中cAMP浓度升高,乳糖作为诱导剂与阻遏蛋白结
27、合,cAMP与CRP结合并使之激合,促使阻遏蛋白与操纵基因分离,CRP与启动基因结合并促使 RNA聚合酶与启动基因结合,基因转录激活,CAP正性调节,原核生物转录终止调控,依赖因子的转录终止调控 不依赖因子的转录终止调控 衰减子介导的转录终止调控,色氨酸操纵子的结构,五个结构基因,编码色氨酸合成通路中所需酶 上游的转录调控区,包括前导基因(trp L)、操纵序列(O)和启动序列(P) 调节基因(trp R),编码阻遏蛋白,色氨酸操纵子的转录调控机制,(1)阻遏蛋白的调控作用,(2)色氨酸操纵子转录的衰减调节,真核生物转录调控,瞬时调控:或称为可逆调控,相当于原核细胞对环境条件变化作出的反应 发
28、育调控:不可逆调控,决定了真核细胞生长、分化、发育的全部进程,真核生物转录调控的特点,有多种RNA聚合酶(RNA pol、),单独没有活性,必须与转录因子共同作用 通过顺式作用元件和反式作用因子调节转录的起始 转录激活状态的染色质结构发生明显变化 正性调控占主导地位,真核生物转录前调控,染色质结构对转录的影响:具有转录活性的活性染色质 染色质DNA对DNase更敏感 正转录的DNA甲基化程度降低 常缺乏组蛋白H1,其他核心组蛋白则被乙酰化或与泛素相结合而修饰 非常活泼的转录区,如许多真核生物的rRNA基因处,没有核小体结构,DNA的修饰:甲基化与去甲基化 DNA甲基化能关闭某些基因的活性,去甲
29、基化则诱导了基因的重新活化和表达。 甲基化常发生在基因5侧区的CpG序列中,阻碍转录因子与DNA特定部位的结合,真核生物转录水平调控,真核生物通过顺式作用元件和反式作用因子相互作用实现转录调控,顺式作用元件(cis-acting element):与相关基因处于同一DNA分子上,能起调控作用的DNA序列。包括启动子、终止子、增强子、衰减子等 反式作用因子(trans-acting factor):一个基因的产物(蛋白质或RNA) ,通过与特异的顺式作用元件相互作用,对另一个基因的表达具有调节作用,顺式作用元件 启动子(promoter):RNA聚合酶结合并起动转录的DNA序列 核心启动子 :
30、指RNA聚合酶起始转录所必需的最小的DNA序列 上游启动子元件: 包括-70bp附近的CAAT盒和GC盒以及距转录起始点更远的上游元件。 增强子(enhancer):远离转录起始点、决定基因的时间、空间特异性、增强启动子转录活性的DNA序列,增强基因转录效应十分明显 发挥作用与其方向或转录起始点的距离无关 大多数为100-200 bp重复序列,其基本核心组件常为8-12bp 没有基因专一性 有严格的组织细胞特异性 活性与其在DNA双螺旋结构中的 空间方向性有关 许多增强子作用的发挥还受外部信号驱使,增强子的特点,沉默子(silencer):负性调节元件。当其DNA序列与特异蛋白因子结合后,可阻
31、断转录起始复合物的形成和活化,使基因表达的活性受到抑制。功能不受距离和取向的限制,反式作用因子,螺旋回折螺旋(helix-turn-helix ,HTH) 锌指结构(zinc finger) 亮氨酸拉链(leucine zipper, bZIP) 碱性螺旋-环-螺旋(helix-loop-helix, bHLH) -片层和环结构,转录因子的DNA结合域,螺旋回折螺旋(HTH) 由两个短螺旋和转角构成 通过识别螺旋识别并与DNA大沟结合 也称为同源结构域,参与个体发育 锌指结构(zinc finger) 一组保守的氨基酸残基和锌离子结合,形成可以进入DNA双螺旋大沟的指状结构 两种类型:Cys2
32、/His2; Cys2/Cys2,Cys2/His2 Cys-X2-4-Cys-X3-Phe-X5-Leu-X2- His-X3-His,类固醇受体DNA结合域Cys2/Cys2 Cys-X2-Cys-X13-Cys-X2-Cys,亮氨酸拉链(bZIP): 每隔6个氨基酸就有一个亮氨酸残基 以二聚体形式与DNA结合,两个蛋白质螺旋上的亮氨酸靠近而形成拉链样结构 碱性螺旋-环-螺旋(bHLH): 由40-50aa组成,含有两个两性螺旋,负责二聚体的形成 bHLH蛋白含碱性序列,它在HLH基序附近,负责结合DNA 片层和环结构,富含谷氨酰胺的结构域 富含脯氨酸的结构域 带负电荷的螺旋结构域,增加激
33、活区的负电荷能提高激活转录的水平 含有双性螺旋和酸性氨基酸的结构域,转录因子的转录激活域,真核生物转录起始复合物的形成,真核生物转录终止调控,HIV基因组转录终止调节:Tat蛋白抗终止作用 热休克蛋白基因的转录终止调节:环境温度升高或其他应激条件下,热休克转录因子快速激活,使HSP70和其他热休克蛋白转录达到最高水平,真核生物转录后调控,对hnRNA的剪接和加工、mRNA由胞核向胞质的转运及定位、mRNA的稳定性、RNA编辑 mRNA的半衰期影响蛋白合成的量,转录调控,基因表达是多级水平上进行的复杂事件,分为: 转录水平、转录后水平(加工及转运)、翻译水平及翻译后水平,但以转录水平的基因表达调控最为重要 转录调控涉及特异的转录调节蛋白与转录调控区DNA之间的相互作用,可产生正或负的调控效果,