1、第八章第八章真核基因表达的调控真核基因表达的调控1. 1. 真核生物的基因组真核生物的基因组 2. 2. 真核生物基因表达调控的特点和种类真核生物基因表达调控的特点和种类3. 3. 真核生物真核生物DNADNA水平上的基因表达调控水平上的基因表达调控 4. 4. 真核生物转录水平上的基因表达调控真核生物转录水平上的基因表达调控 5. 5. 真核基因转录后水平上的调控真核基因转录后水平上的调控主要内容主要内容1. 1. 真核生物的基因组真核生物的基因组1.1 1.1 真核基因组结构特点真核基因组结构特点l 基因组结构庞大基因组结构庞大l 单顺反子单顺反子l 基因不连续性基因不连续性 断裂基因(断
2、裂基因(interrupted geneinterrupted gene) 内含子内含子(intron)(intron) 外显子外显子(exon)(exon)l 非编码区较多非编码区较多l 含有大量重复序列含有大量重复序列 原核生物基因组结构特点 基因组很小,大多只有一条染色体基因组很小,大多只有一条染色体 结构简炼结构简炼 存在操纵子转录单元存在操纵子转录单元 有重叠基因有重叠基因1.2 1.2 基本概念基本概念1.2.1 1.2.1 基因家族(基因家族(gene family)gene family):真核基因组中真核基因组中很多来源相同、结构相似、功能相关的基因构成基很多来源相同、结构相
3、似、功能相关的基因构成基因家族。因家族。如编码组蛋白、免疫球蛋白和血红蛋白的基因都如编码组蛋白、免疫球蛋白和血红蛋白的基因都分别属于不同的基因家族。分别属于不同的基因家族。 基基因簇因簇(gene cluster)(gene cluster) :同一基因家族中的成同一基因家族中的成员有时紧密地排列在一起,成为一个员有时紧密地排列在一起,成为一个基因簇基因簇。The eukaryotic ribosomal DNA repeating unit 简单多基因家族简单多基因家族:基因成员一般以串联方式前后相连。基因成员一般以串联方式前后相连。Organization of histone genes
4、 in the animal genome 复杂多基因家族:复杂多基因家族:一般由一般由几个相关基因家族成员几个相关基因家族成员构成,构成,基因家族之间由间隔序列隔开。现已发现存在不同形式的复基因家族之间由间隔序列隔开。现已发现存在不同形式的复杂多基因家族。杂多基因家族。 1.2.2 1.2.2 断裂基因:断裂基因:基因的编码序列在基因的编码序列在DNADNA分子上是不连分子上是不连续的,为非编码序列所隔开,其中编码的序列称为续的,为非编码序列所隔开,其中编码的序列称为外显子外显子,非编码序列称非编码序列称内含子内含子。 外显子外显子(Exon)(Exon) :真核基因:真核基因DNADNA中
5、的编码序列,这些序列中的编码序列,这些序列被转录成被转录成RNARNA并进而翻译为蛋白质。并进而翻译为蛋白质。 内含子内含子(Intron)(Intron) :真核基因:真核基因DNADNA中的间插序列,这些序中的间插序列,这些序列被转录成列被转录成RNARNA,但被剪除而不翻译。,但被剪除而不翻译。 外显子与内含子的连接区:外显子与内含子的连接区:指外显子和内含子指外显子和内含子的边界序列。它有两个重要特征:内含子的两端序列之的边界序列。它有两个重要特征:内含子的两端序列之间没有广泛的同源性;连接区序列很短且高度保守,是间没有广泛的同源性;连接区序列很短且高度保守,是RNARNA剪接的信号序
6、列。剪接的信号序列。 5 5GTAG 3GTAG 3 GT-AG GT-AG法则法则: : 内含子内含子5-5-端以端以GTGT开始开始, 3-, 3-端以端以AGAG结尾。结尾。 外显子与内含子的可变调控外显子与内含子的可变调控组成型剪接组成型剪接:一个基因的转录产物通过剪接只能:一个基因的转录产物通过剪接只能产生一种成熟的产生一种成熟的mRNAmRNA。选择性剪接选择性剪接:一:一个个基因的转录产物由于不同的剪基因的转录产物由于不同的剪接方式而形成不同的接方式而形成不同的成熟成熟mRNAmRNA。2 2 真核生物基因表达调控的特点和种类真核生物基因表达调控的特点和种类2.1 2.1 真核基
7、因表达调控的特点真核基因表达调控的特点 RNARNA聚合酶种类多聚合酶种类多 多层次调节多层次调节 个体发育机制复杂个体发育机制复杂 活性染色体结构变化活性染色体结构变化 以正调节为主以正调节为主 转录与翻译不耦联转录与翻译不耦联 存在转录后修饰、加工机制存在转录后修饰、加工机制 2.2 2.2 真核生物基因表达调控的种类真核生物基因表达调控的种类 根据性质可分为两大类:根据性质可分为两大类:(1 1)瞬时调控或称为可逆性调控:)瞬时调控或称为可逆性调控:相当于原核细胞对环相当于原核细胞对环境条件变化所做出的反应。瞬时调控包括某种底物或激素境条件变化所做出的反应。瞬时调控包括某种底物或激素水平
8、升降时,及细胞周期不同阶段中酶活性和浓度的调节。水平升降时,及细胞周期不同阶段中酶活性和浓度的调节。(2 2)发育调控或称不可逆调控)发育调控或称不可逆调控:是真核基因调控的精髓:是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。部分,它决定了真核细胞生长、分化、发育的全部进程。 根据基因调控在同一事件中发生的先后次序又可分为:根据基因调控在同一事件中发生的先后次序又可分为:DNADNA水平调控转录水平调控转录后水平调控水平调控转录水平调控转录后水平调控翻译水平调控蛋白质加工水平的调控翻译水平调控蛋白质加工水平的调控3 3 真核生物真核生物DNADNA水平上的基因表达调控水
9、平上的基因表达调控 基因丢失基因丢失 基因扩增基因扩增 基因重排基因重排 DNADNA甲基化状态与调控甲基化状态与调控 染色体的结构与调控染色体的结构与调控3.1 3.1 基因丢失基因丢失 在细胞分化过程中,可以通过丢失掉某些基在细胞分化过程中,可以通过丢失掉某些基因而去除这些基因的活性。某些原生动物、线虫、因而去除这些基因的活性。某些原生动物、线虫、昆虫和甲壳类动物在个体发育中,许多体细胞常昆虫和甲壳类动物在个体发育中,许多体细胞常常常不可逆地不可逆地丢失掉整条或部分染色体。丢失掉整条或部分染色体。只有将来只有将来分化产生生殖细胞的那些细胞,才一直保留着整分化产生生殖细胞的那些细胞,才一直保
10、留着整套染色体。套染色体。目前,目前,尚未尚未在高等真核生物(包括动在高等真核生物(包括动物、植物)中发现类似的基因丢失现象。物、植物)中发现类似的基因丢失现象。3.2 3.2 基因扩增基因扩增 基因扩增是指某些基因的拷贝数专一性增基因扩增是指某些基因的拷贝数专一性增大的现象,它使得细胞在短期内产生大量的基大的现象,它使得细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调因产物以满足生长发育的需要,是基因活性调控的一种方式。控的一种方式。 非洲爪蟾非洲爪蟾卵母细胞卵母细胞rRNArRNA基因(基因(rDNArDNA)数量)数量是一般体细胞的是一般体细胞的40004000倍(倍(2
11、000000/5002000000/500),这是),这是由于为适应胚胎发育对核糖体的大量需要而进由于为适应胚胎发育对核糖体的大量需要而进行基因扩增的结果。行基因扩增的结果。 基因组拷贝数增加,即基因组拷贝数增加,即多倍性,多倍性,在植物中是非在植物中是非常普遍的现象。基因组拷贝数增加使可供遗传重组常普遍的现象。基因组拷贝数增加使可供遗传重组的物质增多,这可能是加速基因进化、基因组重组的物质增多,这可能是加速基因进化、基因组重组和最终物种形成的一种方式。和最终物种形成的一种方式。 在发育或系统发生中的倍性增加现象在植物中在发育或系统发生中的倍性增加现象在植物中普遍存在。普遍存在。3.3 3.3
12、 基因重排基因重排 通过调整有关基因片段的衔接顺序,使之重通过调整有关基因片段的衔接顺序,使之重排成为排成为1 1个完整的转录单位,例如将一个基因从个完整的转录单位,例如将一个基因从远处移至距远处移至距启动子启动子很近的位点从而有效启动转录,很近的位点从而有效启动转录,这种方式被称为这种方式被称为基因重排基因重排。 通过基因重排调节基因活性的典型例子是通过基因重排调节基因活性的典型例子是免免疫球蛋白疫球蛋白结构基因的表达。结构基因的表达。 Ig有2条相同的重链和轻链。恒定区和可变区分别由不同的DNA基因片段所编码。不同区的重排和连接是产生抗体多样性的分子基础。3.4 DNA3.4 DNA的甲基
13、化与基因调控的甲基化与基因调控 DNA DNA甲基化能关闭甲基化能关闭某些基因的活性,去甲某些基因的活性,去甲基化则能诱导基因的重基化则能诱导基因的重新活化和表达。新活化和表达。 DNADNA甲基化的主要甲基化的主要形式:形式:5-5-甲基胞嘧啶、甲基胞嘧啶、N N6 6- -甲基腺嘌呤和甲基腺嘌呤和7-7-甲基甲基鸟嘌呤。鸟嘌呤。 CpGCpG岛:岛:成串出现在成串出现在DNADNA上的上的CpGCpG二核苷酸序列。二核苷酸序列。 在真核生物中,在真核生物中,5-5-甲基胞嘧啶主要出现在甲基胞嘧啶主要出现在CpGCpG、CpXpGCpXpG、CCACCA和和GATCGATC序列序列中。中。
14、关于甲基化酶关于甲基化酶 日常型:日常型:催化半甲基化催化半甲基化DNADNA迅速甲基化。需甲基化迅速甲基化。需甲基化DNADNA模模板;速度快。板;速度快。 从头合成型:从头合成型:催化未甲基化的催化未甲基化的CpGCpG甲基化。不需甲基化甲基化。不需甲基化DNADNA链指导;速度慢。链指导;速度慢。 甲基供体:甲基供体:S-S-腺苷蛋氨酸(腺苷蛋氨酸(S-Adenosyl Methionine,S-Adenosyl Methionine,SAMSAM) ) DNADNA甲基化抑制基因转录的机理甲基化抑制基因转录的机理 DNADNA甲基化导致某些区域甲基化导致某些区域DNADNA构象变化,从
15、而构象变化,从而影响了蛋白质与影响了蛋白质与DNADNA的相互作用,抑制了转录因子的相互作用,抑制了转录因子与启动区与启动区DNADNA的结合效率。主要是不利于模板的结合效率。主要是不利于模板DNADNA与与RNARNA聚合酶的结合。聚合酶的结合。 真核真核DNADNA约有约有5%5%的胞嘧啶被甲基化,甲基化程的胞嘧啶被甲基化,甲基化程度与基因表达程度呈负相关。度与基因表达程度呈负相关。图图7-14 DNA7-14 DNA甲基化对基因转录的抑制作用甲基化对基因转录的抑制作用 DNADNA甲基化密甲基化密度与基因转录的度与基因转录的效率成反比。效率成反比。 没有甲基化的胞嘧啶发生脱氨基作用,就没
16、有甲基化的胞嘧啶发生脱氨基作用,就可能被氧化成为可能被氧化成为U U,被,被DNADNA修复系统所识别和切修复系统所识别和切除,恢复成除,恢复成C C。已经甲基化的胞嘧啶发生脱氨基。已经甲基化的胞嘧啶发生脱氨基作用作用, , 它就变为它就变为T, T, 无法被区分。因此无法被区分。因此, CpG, CpG序序列极易丢失。列极易丢失。 由于甲基化胞嘧啶极易在进化中丢失,所由于甲基化胞嘧啶极易在进化中丢失,所以,高等真核生物中以,高等真核生物中CGCG序列远远低于其理论值。序列远远低于其理论值。哺乳类基因组中约存在哺乳类基因组中约存在4 4万个万个CG CG 序列,大多位序列,大多位于转录单元的于
17、转录单元的5 5区。区。 人类人类X X染色体失活调控的机制染色体失活调控的机制 1 1)X X染色体上存在一个重要的染色体上存在一个重要的XistXist基因,该基因只在失活基因,该基因只在失活的的X X染色体上表达,而不在有活性的染色体上表达,而不在有活性的X X染色体上表达。染色体上表达。XistXist基因基因的表达是决定的表达是决定X X染色体失活的关键因素。染色体失活的关键因素。2 2)该基因参与了)该基因参与了X X染染色体的失活过程,其表达产物为一个功能性色体的失活过程,其表达产物为一个功能性RNARNA分子,不含分子,不含ORFORF,含有大量的终止密码子序列,不编码蛋白质,
18、该含有大量的终止密码子序列,不编码蛋白质,该RNARNA只存在于只存在于核内,不向细胞质中转移。核内,不向细胞质中转移。3 3)该)该RNARNA分子能与分子能与X X染色体失活中染色体失活中心区域(心区域(XicXic)相互作用,引起后者构象发生变化,更易于与)相互作用,引起后者构象发生变化,更易于与各种蛋白因子相结合,最终导致各种蛋白因子相结合,最终导致X X染色体失活,染色体失活, 4 4)活性)活性X X染色染色体上的体上的XistXist基因总是甲基化了的,而失活的基因总是甲基化了的,而失活的X X染色体上的该基染色体上的该基因都是去甲基化了的。雄性体细胞只含有一条因都是去甲基化了的
19、。雄性体细胞只含有一条X X染色体,永远染色体,永远处于活性状态,其处于活性状态,其XistXist基因内部及基因内部及5 5端启动区都高度甲基化。端启动区都高度甲基化。雌性体细胞含有两条雌性体细胞含有两条X X染色体,活性染色体,活性X X染色体上的染色体上的XistXist位点都高位点都高度甲基化,而失活度甲基化,而失活X X染色体上的染色体上的XistXist位点都无甲基化。位点都无甲基化。XistXist基基因被高度甲基化,该基因不表达,因被高度甲基化,该基因不表达,X X染色体有活性;染色体有活性;XistXist基因基因去甲基化,该基因表达,引起去甲基化,该基因表达,引起X X染色
20、体失活。染色体失活。 3.5 3.5 染色质的结构与基因表达调控染色质的结构与基因表达调控 按功能状态不同可将染色质分为按功能状态不同可将染色质分为活性染色质(活性染色质(具具有转录活性)和有转录活性)和非活性染色质(非活性染色质(没有转录活性)。没有转录活性)。 活泼转录区染色质的结构改变活泼转录区染色质的结构改变(1 1)核小体变得不完整;)核小体变得不完整;(2 2)DNADNA甲基化程度降低;甲基化程度降低;(3 3)组蛋白和有关蛋白的改变。)组蛋白和有关蛋白的改变。 实验方法:实验方法:(1 1)核酸酶的敏感性实验;)核酸酶的敏感性实验;(2 2)染色质再造实验。)染色质再造实验。
21、常染色质常染色质: :结构松散,基因结构松散,基因表达。表达。 异染色质异染色质: :结构紧密,基因结构紧密,基因不表达。不表达。 有基因表达活性的染色质有基因表达活性的染色质DNADNA对对DNaseDNase更敏感,更敏感,即,即,对对DNaseDNase的敏感性可作为该的敏感性可作为该基因转录活性的标志。基因转录活性的标志。 活性染色质上具有活性染色质上具有DNaseIDNaseI超敏感位点。超敏感位点。每个活跃表达每个活跃表达的基因都有一个或几个超敏的基因都有一个或几个超敏感位点,大部分位于基因感位点,大部分位于基因5 5 端启动子区域。端启动子区域。 染色质是否处于活化状态是决定染色
22、质是否处于活化状态是决定RNARNA聚合酶能聚合酶能否有效行使转录功能的关键。否有效行使转录功能的关键。 活性染色质往往具有疏松的结构,从而便于活性染色质往往具有疏松的结构,从而便于转录调控因子与顺式调控元件结合,及便于转录调控因子与顺式调控元件结合,及便于RNARNA聚合酶在转录模板上滑动。聚合酶在转录模板上滑动。染色质结构状态与转录的关系染色质结构状态与转录的关系 在转录过程中在转录过程中, ,在在RNARNA聚合酶前方消聚合酶前方消除核小体结构除核小体结构, ,而在而在RNARNA聚合酶后方聚合酶后方, ,再重再重新形成核小体。新形成核小体。真核真核RNA Pol RNA Pol 转录的
23、基因转录的基因 真核蛋白质基因真核蛋白质基因一般包括一般包括启动子启动子、相间排列、相间排列的的外显子和内含子外显子和内含子及及转录终止子转录终止子序列等。启动子序列等。启动子本身一般不被转录。本身一般不被转录。 “ “基因基因”的分子生物学定义:的分子生物学定义:产生一条多肽链或功能产生一条多肽链或功能RNARNA所必需的全部核苷酸序列。所必需的全部核苷酸序列。4 4 真核生物转录水平上的基因表达调控真核生物转录水平上的基因表达调控4.1 4.1 真核基因转录起始复合物的组成真核基因转录起始复合物的组成(1 1)启动子(含各类顺式作用元件)启动子(含各类顺式作用元件)(2 2)转录调节因子(
24、反式作用因子)转录调节因子(反式作用因子)(3 3)RNARNA聚合酶聚合酶 启动子:启动子:RNARNA聚合酶能够识别、结合并导致转录起始的聚合酶能够识别、结合并导致转录起始的DNADNA序列。序列。真核基因启动子真核基因启动子包含转录起始位点附近的包含转录起始位点附近的DNADNA序列及序列及启动转录所必需的一些顺式作用元件启动转录所必需的一些顺式作用元件, , 这些元件被反式作用这些元件被反式作用因子所识别和结合。因子所识别和结合。4.2 4.2 真核基因启动子与真核基因启动子与RNARNA聚合酶聚合酶 顺式作用元件顺式作用元件(cis-acting element)(cis-actin
25、g element):影响基因表达活性的影响基因表达活性的DNADNA序列,主要包括启动子中的相对保守的序列,主要包括启动子中的相对保守的DNADNA序列,如序列,如TATATATA盒、盒、CAATCAAT盒和盒和GCGC盒盒等,是反式作用因子所识别和结合的部位。等,是反式作用因子所识别和结合的部位。 真核真核RNARNA聚合酶聚合酶、为寡聚酶,每种酶分为寡聚酶,每种酶分子含子含2 2个大亚基和个大亚基和4 48 8个小亚基,分子量在个小亚基,分子量在500 KD500 KD左左右。右。4.2.1 4.2.1 真核真核rRNArRNA基因启动子与基因启动子与RNARNA聚合酶聚合酶I I RN
26、A RNA聚合酶聚合酶I I负责转录负责转录rRNArRNA基因。基因。 rRNArRNA基因启动子(基因启动子(I I类)比较单一,由转录起始位点附近的两部分序列构成。类)比较单一,由转录起始位点附近的两部分序列构成。第一部分是核心启动子第一部分是核心启动子,由,由-45-45 +20 +20位核苷酸组成,单位核苷酸组成,单独存在时就足以起始转录。独存在时就足以起始转录。另一部分另一部分由由-170-170-110-110位序列位序列组成,组成,称为上游调控元件称为上游调控元件,能有效地增强转录效率。,能有效地增强转录效率。4.2.2 4.2.2 真核真核tRNAtRNA基因启动子与基因启动
27、子与RNARNA聚合酶聚合酶 RNARNA聚合酶聚合酶负责转录负责转录5S rRNA5S rRNA、tRNAtRNA和某些核内小分和某些核内小分子子RNARNA(snRNAsnRNA)基因,这些基因的启动子()基因,这些基因的启动子(类)组成较类)组成较为复杂,又可被分为三个亚类。其中为复杂,又可被分为三个亚类。其中5S rRNA5S rRNA和和tRNAtRNA基因的基因的两类启动子是内部启动子,位于转录起始位点的下游,都两类启动子是内部启动子,位于转录起始位点的下游,都由两部分组成由两部分组成; ; 第三类启动子由三个部分组成,位于转录第三类启动子由三个部分组成,位于转录起始位点的上游。起
28、始位点的上游。4.2.3 4.2.3 真核蛋白质基因启动子与真核蛋白质基因启动子与RNARNA聚合酶聚合酶 RNA RNA聚合酶聚合酶IIII负责转录所有蛋白质基因和部分负责转录所有蛋白质基因和部分snRNAsnRNA基因。编码蛋白质的基因。编码蛋白质的类基因启动子在结构上有共同的类基因启动子在结构上有共同的保守序列。这些短的保守序列(元件),位于起始位点保守序列。这些短的保守序列(元件),位于起始位点的上游,通常分散存在于的上游,通常分散存在于200bp200bp的范围内。的范围内。不同启动子所不同启动子所用的元件的种类、数目以及元件所处的位置都不尽相同。用的元件的种类、数目以及元件所处的位
29、置都不尽相同。只有当多种转录因子分别特异地识别这些元件并与之结只有当多种转录因子分别特异地识别这些元件并与之结合之后,合之后,RNARNA聚合酶聚合酶才能结合上去以启动转录。通常才能结合上去以启动转录。通常RNARNA聚合酶聚合酶自身不能启动转录。自身不能启动转录。 真核蛋白质基因的启动子元件真核蛋白质基因的启动子元件 核心启动子元件:核心启动子元件:指指RNARNA聚合酶起始转录所聚合酶起始转录所必需的最小的必需的最小的DNADNA序列,包括转录起始点及其上序列,包括转录起始点及其上游游-25-25区的区的TATATATA盒。盒。核心元件单独起作用时只能核心元件单独起作用时只能确定确定转录起
30、始位点和产生基础水平的转录。转录起始位点和产生基础水平的转录。 上游启动子元件:上游启动子元件:包括位于包括位于-70bp-70bp附近的附近的CAATCAAT盒和盒和GCGC盒、以及距转录起始点更远的上游盒、以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。或改变转录效率。 不同基因具有不同的上游启动子元件,其不同基因具有不同的上游启动子元件,其位置也不相同,使不同基因的表达分别具有不位置也不相同,使不同基因的表达分别具有不同的调控机制。同的调控机制。RNA PolRNA Pol转录因子分类转录因子分类 应答元件(应答元
31、件(response elementresponse element): : 能与某个(类)专一蛋能与某个(类)专一蛋白因子结合,从而控制基因特异表达的白因子结合,从而控制基因特异表达的DNADNA上游序列。上游序列。最常见的应答元件最常见的应答元件:热激应答元件(:热激应答元件(heatshock response heatshock response elementelement,HSEHSE)、糖皮质应答元件()、糖皮质应答元件(glucocorticoid glucocorticoid response elementresponse element,GREGRE)、金属应答元件()、
32、金属应答元件(metal metal response elementresponse element,MREMRE)。)。 基础转录装置:基础转录装置:由通用转录因子、由通用转录因子、RNA PolRNA Pol和核心启动子和核心启动子共同组成。该装置是任何真核共同组成。该装置是任何真核类类启动子启动转录都必需的。启动子启动转录都必需的。 通用(基础)转录因子:通用(基础)转录因子:TFD、TFA、TFB、TFF、TFE。基础转录因子起着与原核。基础转录因子起着与原核因子相类似的作用。通常因子相类似的作用。通常RNA Pol自己不能识别启动子,而依靠基础因子来识别,后者自己不能识别启动子,而
33、依靠基础因子来识别,后者起着严格规定转录起始位点的作用。起着严格规定转录起始位点的作用。 核心启动子由核心启动子由InrInr元件(起始子)和元件(起始子)和TATATATA框所组成:框所组成: 起始子(起始子(通用启动子)通用启动子):包括包括PyPy2 2CAPyCAPy5 5( InrInr元件)在内的一元件)在内的一段序列,其中段序列,其中A A为转录的第为转录的第1 1个碱基。个碱基。InrInr元件位于元件位于 -3 -3 +5+5。仅仅由由InrInr元件组成的启动子是可被元件组成的启动子是可被RNARNA聚合酶聚合酶IIII识别的最简单的启动识别的最简单的启动子形式。子形式。
34、TATATATA框(框(-25-25区):区):真核启动子中唯一与起始位点有固定距真核启动子中唯一与起始位点有固定距离的元件,也是最靠近转录起始位点的元件。离的元件,也是最靠近转录起始位点的元件。 转录前先是转录前先是TFTFD D与与TATATATA盒结合。盒结合。TFTFA A结合在结合在TFTFD D上游。上游。TFTFB B结合在转录结合在转录起始位点附近。起始位点附近。RNARNA聚合酶聚合酶与与TFTFF F偶联形成复合体结偶联形成复合体结合到转录起始位点。合到转录起始位点。TFTFE E结合在结合在RNARNA聚聚合酶合酶的下游。的下游。TFTFH H和和TFTFJ J结结合上去
35、,形成完整的转合上去,形成完整的转录起始复合物。录起始复合物。RNARNA聚合酶聚合酶的转录起始复合物的形成的转录起始复合物的形成 上游元件及其转录因子上游元件及其转录因子 一个启动子要达到足够的转录效率和具有特异性,要一个启动子要达到足够的转录效率和具有特异性,要依靠其上游更远处的短序列,这些序列由上游因子或诱导依靠其上游更远处的短序列,这些序列由上游因子或诱导因子所识别。这些元件位于起点上游因子所识别。这些元件位于起点上游100bp100bp范围内。范围内。 1 1)上游元件的鉴定方法:)上游元件的鉴定方法:碱基突变或缺失。碱基突变或缺失。 2 2)上游元件:)上游元件:CAAT框,即框,
36、即GGCCAATCT。 GC框,即框,即 GGGCGG。 转录因子转录因子活化转录的机制:活化转录的机制:特异因子结合在上游元件上特异因子结合在上游元件上之后,作用于基础因子,再由后者作用于之后,作用于基础因子,再由后者作用于RNA PolRNA Pol。所所以,在转录的启动中,蛋白与蛋白之间的相互作用具有蛋以,在转录的启动中,蛋白与蛋白之间的相互作用具有蛋白与白与DNADNA作用同等的重要性。作用同等的重要性。 增强子:增强子:指能使与它连锁的基因转录频率明显增指能使与它连锁的基因转录频率明显增加的加的DNADNA序列。序列。 在SV40的转录单元上发现,转录起始位点上游约200bp处有两段
37、长72 bp的正向重复序列。 增强子特点增强子特点 增强效应十分明显。增强效应十分明显。能使基因转录频率增加能使基因转录频率增加10-20010-200倍。倍。 增强效应与其位置和取向无关。增强效应与其位置和取向无关。不论增强子以什么方向排不论增强子以什么方向排列(列(5 533或或3 355),甚至和靶基因相距),甚至和靶基因相距3kb3kb,或在靶,或在靶基因下游,均表现出增强效应。基因下游,均表现出增强效应。 大多为短重复序列。大多为短重复序列。一般长约一般长约50bp50bp,适合与某些蛋白因子,适合与某些蛋白因子结合。其内部常含有一个核心序列,该序列是产生增强效应结合。其内部常含有一
38、个核心序列,该序列是产生增强效应时所必需的。时所必需的。 增强效应有严密的组织和细胞特异性。增强效应有严密的组织和细胞特异性。说明增强子只有与说明增强子只有与特定的蛋白质(转录因子)相互作用才能发挥其功能。特定的蛋白质(转录因子)相互作用才能发挥其功能。 无基因专一性。无基因专一性。可在不同基因组合上表现增强效应。可在不同基因组合上表现增强效应。 许多增强子还受外部信号的调控。许多增强子还受外部信号的调控。如金属硫蛋白的基因启如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。反应。增强子作用机理增强子作用机理 沉默
39、子(沉默子(沉寂子)沉寂子):某些基因含有某些基因含有负调控顺式元件。负调控顺式元件。当当其结合特异蛋白因子时,对基因转录起阻遏作用。其结合特异蛋白因子时,对基因转录起阻遏作用。 目前对其作用机制的研究还不多。目前已知目前对其作用机制的研究还不多。目前已知沉寂子的作沉寂子的作用可不受其序列方向的影响用可不受其序列方向的影响,也可远距离发挥作用,并能对,也可远距离发挥作用,并能对异源基因的表达起作用。异源基因的表达起作用。 真核基因转录表达的调控蛋白也有起阻遏、或真核基因转录表达的调控蛋白也有起阻遏、或激活、或兼有两种作用者,但总的是以激活蛋白的激活、或兼有两种作用者,但总的是以激活蛋白的作用为
40、主,即多数真核基因在没有调控蛋白作用时作用为主,即多数真核基因在没有调控蛋白作用时是不转录的,需要表达时就要有激活蛋白来促进转是不转录的,需要表达时就要有激活蛋白来促进转录。录。换言之:真核基因表达以正调控为主导。换言之:真核基因表达以正调控为主导。 真核基因调控中虽然也发现有负性调控元件,但其存在并不普遍。 真核真核RNA聚合酶对启动子的亲和力很低,基本上不依聚合酶对启动子的亲和力很低,基本上不依靠自身来起始转录,靠自身来起始转录,需要依赖多种激活蛋白的协同作用。需要依赖多种激活蛋白的协同作用。 反式作用因子反式作用因子(trans-acting factor)(trans-acting f
41、actor):能直能直接或间接地识别或结合在各类顺式作用元件的核接或间接地识别或结合在各类顺式作用元件的核心序列上,参与调控靶基因转录效率的心序列上,参与调控靶基因转录效率的蛋白质蛋白质。如结合如结合TATATATA区的区的TFDTFD、结合、结合CAATCAAT区的区的CTFCTF、结合、结合GGGCGGGGGCGG区区的的SP1SP1、及结合热激元件的、及结合热激元件的HSFHSF等。等。4.3 4.3 转录调节因子(反式作用因子)转录调节因子(反式作用因子) 转录因子是转录因子是发生转录所必需的蛋白质,大多直发生转录所必需的蛋白质,大多直接结合于接结合于DNADNA上,少数结合在其它转录
42、因子上。上,少数结合在其它转录因子上。 在真核中,主要由在真核中,主要由辅助因子辅助因子识别启动子。真核识别启动子。真核启动子的多个保守序列都不是由启动子的多个保守序列都不是由RNARNA聚合酶本身所聚合酶本身所识别和结合的。识别和结合的。 调控蛋白与调控蛋白与DNADNA结合的方式结合的方式 基因表达调控的基本方式是依赖调控蛋白(基因表达调控的基本方式是依赖调控蛋白(转转录因子录因子)与基因调控序列()与基因调控序列(顺式作用元件顺式作用元件)的特异)的特异结合,也依赖调控蛋白之间的特异结合。调控蛋白结合,也依赖调控蛋白之间的特异结合。调控蛋白通常有独立的结合通常有独立的结合DNADNA的结
43、构域。的结构域。结构域结构域DNA结合结构域结合结构域连接区转录活化结构域转录活化结构域DNADNA结合蛋白与结合蛋白与DNADNA之间的相互作用之间的相互作用 蛋白质与特异蛋白质与特异DNADNA序列的识别与结合模式序列的识别与结合模式-调控蛋白与特异调控蛋白与特异DNADNA序列之间通过氢键相结合序列之间通过氢键相结合 调控蛋白与蛋白质结合的方式调控蛋白与蛋白质结合的方式 除了与除了与DNADNA结合的结构域外,调控蛋白通常还有与蛋白结合的结构域外,调控蛋白通常还有与蛋白质结合的结构域,用以和质结合的结构域,用以和RNARNA聚合酶、其它调控蛋白相互作聚合酶、其它调控蛋白相互作用,也用于相
44、同的用,也用于相同的转录因子转录因子之间的作用。在真核中,许多之间的作用。在真核中,许多转录因子都以二聚体的形式结合在转录因子都以二聚体的形式结合在DNADNA上。上。 调节蛋白质中的用于与调节蛋白质中的用于与DNADNA结合的结构基元结合的结构基元(1 1)锌指()锌指(zinc fingerzinc finger): : 是一种常出现在是一种常出现在DNA结合蛋白中的结构基元。是由一个含有大约结合蛋白中的结构基元。是由一个含有大约30个氨基酸的环个氨基酸的环和一个与环上的和一个与环上的4个个Cys(或(或2个个Cys和和2个个His)配位的)配位的Zn构构成,形成的结构像手指状。成,形成的
45、结构像手指状。 为某些蛋白质(如调为某些蛋白质(如调节蛋白)中由若干个氨基节蛋白)中由若干个氨基酸残基与一个锌离子结合酸残基与一个锌离子结合而成的一个相对独立的结而成的一个相对独立的结构域。锌指的尖端可进入构域。锌指的尖端可进入DNA大沟或小沟,以识别大沟或小沟,以识别和结合特异的和结合特异的DNA序列。序列。锌指是锌指是DNA结合蛋白中常结合蛋白中常见的基元,通常组织成为见的基元,通常组织成为一个串联重复。一个串联重复。 配位键配位键2-92-9个个The same types of transcription factors can have different DNAbinding do
46、mains and thus bind to different DNA sequences. CysCys2 2 / Cys/ Cys2 2锌指锌指CysCys2 2 / His/ His2 2锌指锌指见于甾体激素受体见于甾体激素受体见于见于SP1SP1,TF ATF A等等锌指结构锌指结构(zinc finger motif)(zinc finger motif) 锌指可以形成锌指可以形成-螺旋而插入螺旋而插入DNA DNA 的大沟中,在另的大沟中,在另一面连着一面连着-片层。片层。 转录因子转录因子SP1SP1(结合(结合GCGC盒)的盒)的3 3个个连续的锌指重复结构。连续的锌指重复结
47、构。 螺旋螺旋- -转角转角- -螺旋螺旋(helix-turn-helix)(helix-turn-helix)(2 2)螺旋)螺旋- -转角转角- -螺旋(螺旋( 两个两个-螺旋被一个螺旋被一个-转角隔开,两个转角隔开,两个-螺旋螺旋之一起识别作用,为许多真核调控蛋白中含有的与之一起识别作用,为许多真核调控蛋白中含有的与DNADNA结合的基元。结合的基元。(3 3)碱性)碱性- -亮氨酸拉链(亮氨酸拉链(basicleucinebasicleucine zipper zipper) 定义定义:出现在:出现在DNADNA结合结合蛋白质和其它蛋白质中的蛋白质和其它蛋白质中的一种结构基元(一种结
48、构基元(motifmotif)。)。疏水的疏水的LeuLeu集中排列在集中排列在-螺旋的一侧而呈直线状,螺旋的一侧而呈直线状,该侧是两个蛋白分子构成该侧是两个蛋白分子构成二聚体的接触点。二聚体的接触点。 亮氨酸之间相互作用形成二聚体。亮氨酸之间相互作用形成二聚体。肽链氨基端肽链氨基端20203030个富含碱性氨基酸的结构域参与个富含碱性氨基酸的结构域参与结合结合DNADNA(4 4)碱性)碱性- -螺旋螺旋- -环环- -螺旋螺旋(basic helix - loop - helixbasic helix - loop - helix,bHLHbHLH) 只有形成同源或异源只有形成同源或异源二
49、聚体时,才具有足够的二聚体时,才具有足够的DNADNA结合能力。长约结合能力。长约5050个个aaaa残基,同时具有残基,同时具有DNADNA结合和结合和形成蛋白质二聚体的功能,形成蛋白质二聚体的功能,其主要特点是可形成两个其主要特点是可形成两个亲脂性亲脂性-螺旋,两个螺旋螺旋,两个螺旋之间由环状结构相连,其之间由环状结构相连,其DNADNA结合功能是由一个较短结合功能是由一个较短的富碱性氨基酸区所决定的富碱性氨基酸区所决定的。的。4.4 4.4 真核基因转录调控的主要模式真核基因转录调控的主要模式 4.4.1 4.4.1 信号传导信号传导 信息分子信息分子: : 由一种细胞释放由一种细胞释放
50、, , 然后传给靶细胞然后传给靶细胞并发挥作用的物质。并发挥作用的物质。 细胞间信息物质是由细胞分泌的调节靶细胞细胞间信息物质是由细胞分泌的调节靶细胞生命活动的化学物质的统称,又称作生命活动的化学物质的统称,又称作第一信使第一信使。如生长因子、细胞因子、胰岛素等。如生长因子、细胞因子、胰岛素等。第二信使第二信使(secondary messenger)(secondary messenger)是指在细胞内传递信息是指在细胞内传递信息的小分子物质,如:的小分子物质,如:CaCa2+2+、IP3IP3、DAGDAG、cAMPcAMP、cGMPcGMP等。等。跨膜信号转导的一般步骤跨膜信号转导的一般