1、第一节第一节 染色质结构与基因表达染色质结构与基因表达一、位置效应 位置效应(位置效应(position effectposition effect)是指一个基因由于在基因)是指一个基因由于在基因组的位置发生改变,而发生的表达上的变化。位置效应在果蝇组的位置发生改变,而发生的表达上的变化。位置效应在果蝇中得到了详尽的研究。野生型中得到了详尽的研究。野生型w w基因使果蝇的复眼呈红色。基因使果蝇的复眼呈红色。有一个果蝇品系,由于染色体倒位使有一个果蝇品系,由于染色体倒位使w w基因座靠近着丝粒处基因座靠近着丝粒处的异染色质。在这一新的位置,基因是否表达因细胞而异,取的异染色质。在这一新的位置,基
2、因是否表达因细胞而异,取决于复眼早期发育时异染色质的对基因表达的抑制效应扩展到决于复眼早期发育时异染色质的对基因表达的抑制效应扩展到多远。多远。不表达不表达w w基因的细胞分裂后产生的子代细胞仍不表达基因的细胞分裂后产生的子代细胞仍不表达w w基因,基因,产生白眼细胞克隆;而表达产生白眼细胞克隆;而表达w w基因的细胞分裂后产生的子代细基因的细胞分裂后产生的子代细胞都表达胞都表达w w基因,产生红眼细胞克隆。所以,该品系的果蝇的基因,产生红眼细胞克隆。所以,该品系的果蝇的复眼表现为红白相嵌,又称为位置效应花斑(复眼表现为红白相嵌,又称为位置效应花斑(position effect positi
3、on effect variegationvariegation)。)。在正常情况下,转录因子与在正常情况下,转录因子与w w基因的调控区结合,促进转录基因的调控区结合,促进转录的起始。然而,在新的位置,紧密包装的异染色质可以阻止转的起始。然而,在新的位置,紧密包装的异染色质可以阻止转录因子的靠近。在复眼发育的早期异染色质扩展的范围会在不录因子的靠近。在复眼发育的早期异染色质扩展的范围会在不同的细胞中发生某种变化,随后会被子细胞稳定遗传。同的细胞中发生某种变化,随后会被子细胞稳定遗传。二、活性染色质的特征 与非表达区域中核小体结构紧密、间隔规则相比,其核小体与非表达区域中核小体结构紧密、间隔规
4、则相比,其核小体组装较为伸展或不规则。这样的一种结构有利于转录因子的结组装较为伸展或不规则。这样的一种结构有利于转录因子的结合,以及合,以及RNARNA聚合酶沿模板的滑动。在转录起始区以及某些特聚合酶沿模板的滑动。在转录起始区以及某些特殊的区域,核小体的构象变化更为明显,殊的区域,核小体的构象变化更为明显,DNase IDNase I和微球菌核和微球菌核酸酶等非特异性内切酶可用于检测这种变化。酸酶等非特异性内切酶可用于检测这种变化。DNase IDNase I可降解染色质可降解染色质DNADNA可接近的区域,但是被组装成核小体可接近的区域,但是被组装成核小体的染色质的染色质DNADNA则受到保
5、护,不会被核酸酶降解。则受到保护,不会被核酸酶降解。三、染色质结构的调节 在原核细胞中,在原核细胞中,RNARNA聚合酶和调节蛋白可以自由地接聚合酶和调节蛋白可以自由地接近近DNADNA。由组蛋白和基因组。由组蛋白和基因组DNADNA两部分组成的染色质结两部分组成的染色质结构限制了转录因子对构限制了转录因子对DNADNA的接近与结合,实际上起着阻的接近与结合,实际上起着阻遏转录的作用。基因转录需要染色质发生一系列重要遏转录的作用。基因转录需要染色质发生一系列重要的变化,如染色质去凝集,核小体变成开放式的疏松的变化,如染色质去凝集,核小体变成开放式的疏松结构,使转录因子等更容易接近并结合核小体结
6、构,使转录因子等更容易接近并结合核小体DNADNA。有。有两种方式可以显著改变两种方式可以显著改变DNADNA的易接近性:组蛋白的乙酰的易接近性:组蛋白的乙酰化和核小体重塑。组蛋白的去乙酰化,则可以使染色化和核小体重塑。组蛋白的去乙酰化,则可以使染色质凝集,引起基因沉默。质凝集,引起基因沉默。1 1、组蛋白、组蛋白N N端尾的修饰对染色质结构及基因转录的影端尾的修饰对染色质结构及基因转录的影响响 每种核心组蛋白包括一个每种核心组蛋白包括一个8080个氨基酸残基构成的保守的个氨基酸残基构成的保守的区域称为组蛋白折叠域(区域称为组蛋白折叠域(histone fold domainhistone f
7、old domain)和一个突出)和一个突出于核小体核心之外、由于核小体核心之外、由2020个氨基酸残基组成的个氨基酸残基组成的N N端尾。端尾。N N端尾端尾的相互作用对核小体的聚集和染色质折叠非常重要,也是组的相互作用对核小体的聚集和染色质折叠非常重要,也是组蛋白的主要修饰部位。核小体蛋白的主要修饰部位。核小体N N端尾的修饰作用包括位点特异端尾的修饰作用包括位点特异的磷酸化、乙酰化和甲基化。乙酰化是最早发现与转录有关的磷酸化、乙酰化和甲基化。乙酰化是最早发现与转录有关的组蛋白修饰方式,在这里我们也是主要介绍组蛋白的乙酰的组蛋白修饰方式,在这里我们也是主要介绍组蛋白的乙酰化对染色质的结构和
8、基因表达的影响。化对染色质的结构和基因表达的影响。异染色质中的组蛋白一般不被乙酰化,而具有转录活性的染色异染色质中的组蛋白一般不被乙酰化,而具有转录活性的染色质常常是高度乙酰化的,这些清楚地表明这种类型的修饰与质常常是高度乙酰化的,这些清楚地表明这种类型的修饰与DNADNA的包装相关。的包装相关。经过多年的努力,终于在经过多年的努力,终于在20192019年分离出催化向组蛋白添加乙年分离出催化向组蛋白添加乙酰基的酶,即组蛋白乙酰转移酶(酰基的酶,即组蛋白乙酰转移酶(histone acetyl histone acetyl transferase,HATtransferase,HAT)。许多组
9、蛋白乙酰转移酶是以往鉴定过的)。许多组蛋白乙酰转移酶是以往鉴定过的激活蛋白或辅激活蛋白(激活蛋白或辅激活蛋白(coactivatorcoactivator)。辅激活蛋白在基因)。辅激活蛋白在基因的转录调控中主要是起桥梁作用,使结合在的转录调控中主要是起桥梁作用,使结合在DNADNA上游的转录因上游的转录因子与结合在核心启动子上的转录机器发生联系。子与结合在核心启动子上的转录机器发生联系。组蛋白乙酰化为一可逆过程,乙酰化和去乙酰化的动态平衡控组蛋白乙酰化为一可逆过程,乙酰化和去乙酰化的动态平衡控制着染色质的结构和基因表达。组蛋白脱乙酰酶(制着染色质的结构和基因表达。组蛋白脱乙酰酶(histone
10、 histone deacetylase,HDACdeacetylase,HDAC)可去除组蛋白上的乙酰基,抑制基因表达。)可去除组蛋白上的乙酰基,抑制基因表达。2、核小体重塑 核小体重塑涉及在基因组一个较短的区域中核小体核小体重塑涉及在基因组一个较短的区域中核小体位置的改变或者结构的改变,是一个能量依赖的过程,位置的改变或者结构的改变,是一个能量依赖的过程,由核小体重塑复合体(由核小体重塑复合体(chromatin remodeling chromatin remodeling complexcomplex)催化完成。重塑复合体利用)催化完成。重塑复合体利用ATPATP水解释放的水解释放的能
11、量,介导二种主要的反应:(能量,介导二种主要的反应:(1 1)组蛋白八聚体沿)组蛋白八聚体沿DNADNA滑动;(滑动;(2 2)在不改变位置的情况下使核小体变成)在不改变位置的情况下使核小体变成一种较为松散的结构。一种较为松散的结构。转录因子、组蛋白乙酰转移酶和染色质重塑复合体的转录因子、组蛋白乙酰转移酶和染色质重塑复合体的结合顺序因启动子的不同而不同。激活一个真核生物结合顺序因启动子的不同而不同。激活一个真核生物基因的大致过程如下:基因的大致过程如下:(1 1)某种转录因子与)某种转录因子与DNADNA结合。结合。(2 2)一种组蛋白乙酰转移酶与转录因子结合。)一种组蛋白乙酰转移酶与转录因子
12、结合。(3 3)HATHAT乙酰化结合位点附近的组蛋白,使核小体之乙酰化结合位点附近的组蛋白,使核小体之间的联系变得松散。间的联系变得松散。(4 4)染色质重塑复合体催化核小体滑动或者在不改)染色质重塑复合体催化核小体滑动或者在不改变核小体位置的情况下,使核小体的结构发生改变,变核小体位置的情况下,使核小体的结构发生改变,暴露出暴露出DNADNA结合位点。结合位点。(5 5)新的转录因子与)新的转录因子与DNADNA结合。结合。(6 6)RNARNA聚合酶与聚合酶与DNADNA结合。结合。(7 7)转录起始需要来自于特异性转录因子经中介复)转录起始需要来自于特异性转录因子经中介复合体传递来的正
13、调控信号。合体传递来的正调控信号。四、染色质结构的区间性 绝缘子(绝缘子(insulatorinsulator)序列首先在果蝇中被发现,)序列首先在果蝇中被发现,以后又在多种真核生物的基因组中被鉴定出来。以后又在多种真核生物的基因组中被鉴定出来。19851985年,年,UdvadryUdvadry等在果蝇的基因组中检测出了两个等在果蝇的基因组中检测出了两个绝缘子序列,绝缘子序列,scsscs和和scsscs(Specialized Chromatin Specialized Chromatin StructureStructure)。)。scsscs和和scsscs分别位于果蝇多线染色体分别位
14、于果蝇多线染色体S7A7S7A7条带热激蛋白基因座的两侧,长度分别是条带热激蛋白基因座的两侧,长度分别是350 350 bpbp和和200 bp200 bp。当受到热激时,。当受到热激时,hsp70hsp70基因高水平转录,基因高水平转录,在多线染色体上形成一个膨泡。在多线染色体上形成一个膨泡。scsscs和和scsscs就位于膨泡的两端,是膨泡的边界元件。就位于膨泡的两端,是膨泡的边界元件。在在scsscs和和scsscs的外侧是异染色质区域,所以绝缘子的外侧是异染色质区域,所以绝缘子能够抵挡异染色质对热激蛋白基因座位的影响,使能够抵挡异染色质对热激蛋白基因座位的影响,使该座位在结构和功能上
15、都是一个独立的区域。该座位在结构和功能上都是一个独立的区域。绝缘子是一组在真核生物基因组中建立独立的转录活绝缘子是一组在真核生物基因组中建立独立的转录活性区的调控元件,它具有两种性质。第一,当绝缘子性区的调控元件,它具有两种性质。第一,当绝缘子位于增强子或者沉默子与启动子之间时可以阻断增强位于增强子或者沉默子与启动子之间时可以阻断增强子对启动子的作用。第二,绝缘子可以使其界定的基子对启动子的作用。第二,绝缘子可以使其界定的基因的表达不受位置效应的影响。在转基因时,目的基因的表达不受位置效应的影响。在转基因时,目的基因整合到染色体上的不同位置,因位置效应作用基因因整合到染色体上的不同位置,因位置
16、效应作用基因的表达水平差异很大。但是,如果在目的基因的两侧的表达水平差异很大。但是,如果在目的基因的两侧连接上绝缘子,目的基因往往不受染色体位置效应的连接上绝缘子,目的基因往往不受染色体位置效应的影响。影响。2、基质附着区(matrix attachment region,MAR)无论是在原核细胞还是在真核细胞中,基因组无论是在原核细胞还是在真核细胞中,基因组DNADNA形形成巨大的环状结构,环的基部附着在染色体骨架上。成巨大的环状结构,环的基部附着在染色体骨架上。在细菌中环的长度大概是在细菌中环的长度大概是40 kb40 kb,而真核生物的,而真核生物的DNADNA环环要长一些,大约要长一些
17、,大约60 kb60 kb。在间期,核基质是由丝状蛋白构成的网络结构,附着在间期,核基质是由丝状蛋白构成的网络结构,附着于核膜的内表面。于核膜的内表面。DNADNA借着于基质附着区(借着于基质附着区(matrix matrix attachment regionattachment region,MARMAR)与基质蛋白结合。因为)与基质蛋白结合。因为MARMAR也被用于附着染色体支架,因此也称为支架附着区也被用于附着染色体支架,因此也称为支架附着区(scaffold attachment region,SARscaffold attachment region,SAR)。这些)。这些MAR/
18、SARMAR/SAR位点长度为位点长度为2002001000 bp1000 bp,富含,富含ATAT(占(占7070),),但是没有明显的一致序列。但是没有明显的一致序列。具有几个连续腺嘌呤的具有几个连续腺嘌呤的DNADNA序列有发生弯曲的趋势。与序列有发生弯曲的趋势。与MARMAR位点结合的核蛋白识别弯曲的位点结合的核蛋白识别弯曲的DNADNA,而不是特定的,而不是特定的序列。在靠近序列。在靠近MARMAR位点的地方经常有拓扑异构酶位点的地方经常有拓扑异构酶IIII的识的识别位点,意味着每一个巨大的环状别位点,意味着每一个巨大的环状DNADNA的超螺旋程度受的超螺旋程度受到独立的调控。增强子
19、以及其他调控元件也经常靠近到独立的调控。增强子以及其他调控元件也经常靠近MARMAR位点。在某些情况下,染色质重塑也是从位点。在某些情况下,染色质重塑也是从MARMAR位点位点开始的,并且影响整个染色质环。开始的,并且影响整个染色质环。3、基因座控制位点人类的人类的珠蛋白基因簇长约珠蛋白基因簇长约60 Kb60 Kb,含有,含有5 5个功能基个功能基因,它们的排列顺序是因,它们的排列顺序是55 GGAA33。其中。其中在胚胎早期表达,在胚胎早期表达,GG和和AA在胎儿时在胎儿时期表达,期表达,和和在成体中表达。每个在成体中表达。每个珠蛋白基因珠蛋白基因都有自己的一套调控系统,但它们的表达还要受
20、到基都有自己的一套调控系统,但它们的表达还要受到基因簇上游因簇上游12 Kb12 Kb的基因座控制位点(的基因座控制位点(locus control locus control region,LCRregion,LCR)的控制。)的控制。LCRLCR最初是在研究地中海贫血病的过程中被发现的,地最初是在研究地中海贫血病的过程中被发现的,地中海贫血是一种由中海贫血是一种由或或珠蛋白缺陷导致的血液病。珠蛋白缺陷导致的血液病。许多地中海贫血是由珠蛋白基因编码区突变造成的,许多地中海贫血是由珠蛋白基因编码区突变造成的,但是也有一些地中海贫血是由于但是也有一些地中海贫血是由于珠蛋白基因簇上珠蛋白基因簇上游
21、游12 Kb12 Kb的区域发生大范围缺失,导致了整个基因簇沉的区域发生大范围缺失,导致了整个基因簇沉默。因此,默。因此,LCRLCR具有增强转录的功能。具有增强转录的功能。人类人类珠蛋白基因珠蛋白基因LCRLCR的增强子活性已由实验证明。的增强子活性已由实验证明。将连接或不连接将连接或不连接LCRLCR的人类的人类珠蛋白基因分别转化珠蛋白基因分别转化小鼠细胞。研究发现,如果缺少小鼠细胞。研究发现,如果缺少LCRLCR,珠蛋白基珠蛋白基因转录水平通常不到内源小鼠因转录水平通常不到内源小鼠珠蛋白基因的珠蛋白基因的1 1。若是连接上若是连接上LCRLCR,外源,外源珠蛋白基因的表达水平与珠蛋白基因
22、的表达水平与小鼠自身的小鼠自身的珠蛋白基因的表达水平相当。珠蛋白基因的表达水平相当。人类人类珠蛋白基因的珠蛋白基因的LCRLCR含有含有5 5个个DNase IDNase I超敏感位点超敏感位点(如图),(如图),LCRLCR的增强子活性存在于的增强子活性存在于HS2HS2,3 3,和,和4 4,与,与HS1HS1,和,和5 5无关。无关。HS5HS5是一种绝缘子,是一种绝缘子,HS1HS1的功能尚未阐的功能尚未阐明。明。HS2HS2为一个典型的增强子,在瞬时转染分析中,可为一个典型的增强子,在瞬时转染分析中,可以检测到以检测到HS2HS2的活性。然而,的活性。然而,HS3HS3和和HS4HS
23、4只有整合到染色只有整合到染色质中时,才能检测到其增强转录的活性。另外,有一质中时,才能检测到其增强转录的活性。另外,有一种种地中海贫血病,地中海贫血病,HS1HS1上游大约上游大约35 Kb35 Kb的发生了缺的发生了缺失,珠蛋白基因位点保持完整,然而珠蛋白基因不表失,珠蛋白基因位点保持完整,然而珠蛋白基因不表达,原因是缺失导致了整个基因座产生一种致密的染达,原因是缺失导致了整个基因座产生一种致密的染色质结构。色质结构。所以,所以,珠蛋白基因珠蛋白基因LCRLCR的另一种功能可能是介导的另一种功能可能是介导松弛型染色质的形成。松弛型染色质的形成。LCRLCR诱导基因座的染色质形成诱导基因座的
24、染色质形成并维持开放的结构是它们不同于增强子的地方。并维持开放的结构是它们不同于增强子的地方。3.沉默子在酿酒酵母中,在酿酒酵母中,HMLHML和和HMRHMR位点,以及接近端粒的染色位点,以及接近端粒的染色质区域,形成一种抑制性染色质结构,因此在转录上质区域,形成一种抑制性染色质结构,因此在转录上是沉默的。是沉默的。HMHM位点上的沉默效应是由位点两侧、短的位点上的沉默效应是由位点两侧、短的被称为沉默子的特异序列起始的。被称为沉默子的特异序列起始的。HMLHML的沉默子分别的沉默子分别是是HML-EHML-E和和HML-IHML-I;HMRHMR的沉默子分别是的沉默子分别是HMRHMRE E
25、和和HMRHMRI I。沉默子中含有。沉默子中含有AbflpAbflp,Rap1pRap1p,和复制起始位点识,和复制起始位点识别复合体(别复合体(origin recognition complex for DNA origin recognition complex for DNA replication,ORCreplication,ORC)的结合位点。沉默子结合蛋白通)的结合位点。沉默子结合蛋白通过募集过募集SirSir沉默复合体起始沉默过程。沉默复合体起始沉默过程。第二节第二节 DNADNA甲基化与基因组沉默甲基化与基因组沉默DNADNA甲基化是指在甲基化是指在DNADNA甲基化酶(
26、甲基化酶(DNA DNA methyltransferasemethyltransferase)的作用下,以)的作用下,以S S腺苷甲硫氨腺苷甲硫氨酸为甲基供体,将甲基转移到酸为甲基供体,将甲基转移到DNADNA分子的胞嘧啶碱基分子的胞嘧啶碱基上形成上形成5 5甲基胞嘧啶的过程。胞嘧啶的甲基化作用甲基胞嘧啶的过程。胞嘧啶的甲基化作用不是随机的。在脊椎动物基因组中胞嘧啶甲基化仅不是随机的。在脊椎动物基因组中胞嘧啶甲基化仅限于限于55CGCG33二核苷酸,植物中仅限于二核苷酸,植物中仅限于55CGCG33二核苷酸和二核苷酸和55CNGCNG33三核苷酸。三核苷酸。在哺乳动物的基因组中在哺乳动物的基
27、因组中CpGCpG通常被甲基化,因而在整通常被甲基化,因而在整个基因组中含量相对较少,这是由于个基因组中含量相对较少,这是由于5 5甲基胞嘧啶甲基胞嘧啶可以自发脱氨生成胸腺嘧啶,而这种错误又往往得不可以自发脱氨生成胸腺嘧啶,而这种错误又往往得不到修复,所以甲基化的到修复,所以甲基化的CpGCpG突变成了突变成了TpGTpG。脊椎动物基。脊椎动物基因组中仅有不到因组中仅有不到1/41/4的的CpGCpG位点得以保留。在基因组中,位点得以保留。在基因组中,CpGCpG二核苷酸并非随机分布,基因组的某些区域其二核苷酸并非随机分布,基因组的某些区域其CpGCpG二核苷酸的水平比平均值高二核苷酸的水平比
28、平均值高10102020倍,这些倍,这些CpGCpG富集富集区被定义为区被定义为GpCGpC岛。脊椎动物基因许多基因的上游都岛。脊椎动物基因许多基因的上游都有有CpGCpG岛,尤其是在各种组织中都有表达的管家基因岛,尤其是在各种组织中都有表达的管家基因的启动子。的启动子。DNADNA甲基化可以引起基因沉默。基因沉默是指以相对非甲基化可以引起基因沉默。基因沉默是指以相对非特异性的方式关闭基因的表达,它可以影响一个基因、特异性的方式关闭基因的表达,它可以影响一个基因、一个基因簇、染色体的一个区段甚至整条染色体。把一个基因簇、染色体的一个区段甚至整条染色体。把甲基化的或未甲基化的基因引入细胞,检测它
29、们的表甲基化的或未甲基化的基因引入细胞,检测它们的表达水平,结果显示甲基化的达水平,结果显示甲基化的DNADNA不表达。在检测染色体不表达。在检测染色体DNADNA的甲基化模式时,发现的甲基化模式时,发现DNADNA甲基化水平与相邻基因甲基化水平与相邻基因的表达水平呈负相关。例如,脊椎动物管家基因启动的表达水平呈负相关。例如,脊椎动物管家基因启动子中的子中的CpGCpG在各种组织都保持非甲基化状态,而组织特在各种组织都保持非甲基化状态,而组织特异性的基因仅在其表达的组织中才是去甲基化的。异性的基因仅在其表达的组织中才是去甲基化的。细胞在有丝分裂时可以通过维持甲基化酶使子代细胞细胞在有丝分裂时可
30、以通过维持甲基化酶使子代细胞的基因组保持与亲本基因组相同的甲基化模式。因此,的基因组保持与亲本基因组相同的甲基化模式。因此,规定哪些基因可以表达的信息也遗传到子细胞中。规定哪些基因可以表达的信息也遗传到子细胞中。甲基化的生物学效应是由各种甲基化的生物学效应是由各种mCpGmCpG结合蛋白(结合蛋白(methyl-methyl-CpG-binding proteins,MeCPCpG-binding proteins,MeCP)介导的。)介导的。MeCPMeCP与启动与启动子区甲基化的子区甲基化的CpGCpG岛结合,募集一些蛋白质,形成转录岛结合,募集一些蛋白质,形成转录抑制复合物,阻止转录因子
31、与启动子结合,从而抑制抑制复合物,阻止转录因子与启动子结合,从而抑制基因转录。除了直接作用于转录起始复合体外,基因转录。除了直接作用于转录起始复合体外,MeCPMeCP还可以作为组蛋白去乙酰化复合体的组分发挥作用。还可以作为组蛋白去乙酰化复合体的组分发挥作用。MeCP2MeCP2就是就是Sin3Sin3去乙酰化酶复合体的组分。去乙酰化酶复合体的组分。MeCP2MeCP2识别识别并结合基因上游的甲基化并结合基因上游的甲基化CpGCpG岛。复合体中的岛。复合体中的HDACHDAC使组使组蛋白去掉乙酰基,于是松弛的蛋白去掉乙酰基,于是松弛的DNADNA重新被包装成紧密的重新被包装成紧密的染色质结构,
32、使相邻基因沉默。染色质结构,使相邻基因沉默。4、DNA甲基化与基因组印记 在一个二倍体细胞中,常染色体基因有两个拷贝,一个来在一个二倍体细胞中,常染色体基因有两个拷贝,一个来自父本,一个来自母本。多数情况下,两个基因在功能上是自父本,一个来自母本。多数情况下,两个基因在功能上是等价,它们在表达水平上具有可比性。但在少数情况下,二等价,它们在表达水平上具有可比性。但在少数情况下,二倍体细胞核中同源染色体上的一对等位基因中只有一个可以倍体细胞核中同源染色体上的一对等位基因中只有一个可以表达,另一个因甲基化而沉默,这种现象就是基因印记,就表达,另一个因甲基化而沉默,这种现象就是基因印记,就如同基因被
33、打上了亲代的印记。对一些印记基因来说,来源如同基因被打上了亲代的印记。对一些印记基因来说,来源于父本的等位基因不表达,来源于母本的基因表达。对另一于父本的等位基因不表达,来源于母本的基因表达。对另一些印记基因来说,情况刚好相反。些印记基因来说,情况刚好相反。“印记印记”首先被用来描述一种遗传事件。首先被用来描述一种遗传事件。In In Pseudococcids or Pseudococcids or mealybugsmealybugs(Homoptera,(Homoptera,Coccoidea)Coccoidea)雌性和雄性都是由受精卵发育来的。在雌雌性和雄性都是由受精卵发育来的。在雌体
34、中,所有的染色体都保持常染色质状态,是有功能体中,所有的染色体都保持常染色质状态,是有功能的。然而,将发育成雄性个体的胚胎在第六次卵裂以的。然而,将发育成雄性个体的胚胎在第六次卵裂以后,有一组染色体转变为异染色质,并且,以后在大后,有一组染色体转变为异染色质,并且,以后在大多数组织中一直保持这种状态。因此,雄性个体在功多数组织中一直保持这种状态。因此,雄性个体在功能上是一个单倍体。在昆虫中,印记被用来描述雄性能上是一个单倍体。在昆虫中,印记被用来描述雄性个体中一个亲本基因组的失活,涉及到性别决定。个体中一个亲本基因组的失活,涉及到性别决定。在人类和小鼠中已经发现了在人类和小鼠中已经发现了100
35、100个印记基因。研究得比个印记基因。研究得比较透彻的两个例子是人类的较透彻的两个例子是人类的Igf2Igf2基因(基因(insulin-like insulin-like growth facotr-2growth facotr-2)和)和H19H19基因。基因。Igf2Igf2编码胰岛素生长编码胰岛素生长因子因子2 2,参与细胞间信号传递,它和,参与细胞间信号传递,它和H19H19位于人类第位于人类第1111号染色体上相互邻近的位置。在细胞内,位于父本来号染色体上相互邻近的位置。在细胞内,位于父本来源的同源染色体上的源的同源染色体上的Igf2Igf2基因是活化的,位于母本来基因是活化的,位
36、于母本来源的源的Igf2Igf2基因被关闭。基因被关闭。H19H19基因的情况刚好相反:来自基因的情况刚好相反:来自母方的拷贝处于工作状态,来自父方的拷贝则处于关母方的拷贝处于工作状态,来自父方的拷贝则处于关闭状态。闭状态。基因组印记与基因组甲基化模式有关。图显示了只有基因组印记与基因组甲基化模式有关。图显示了只有父本染色体上父本染色体上Igf2Igf2基因和母本染色体上的基因和母本染色体上的H19H19基因被基因被活化的原因。在活化的原因。在H19H19基因下游有一增强子序列,位于基因下游有一增强子序列,位于Igf2Igf2基因和基因和H19H19基因之间有一绝缘子序列。增强子序基因之间有一
37、绝缘子序列。增强子序列不能激活母本染色体上的列不能激活母本染色体上的Igf2Igf2基因,原因是绝缘子基因,原因是绝缘子序列被一种叫做序列被一种叫做CTCFCTCF的蛋白质结合。的蛋白质结合。CTCFCTCF阻断转录激阻断转录激活蛋白在增强子序列处激活活蛋白在增强子序列处激活Igf2Igf2基因。基因。在父本染色体上,绝缘子和在父本染色体上,绝缘子和H19H19启动子均被甲基化。在启动子均被甲基化。在这种状态下,转录机器不能与这种状态下,转录机器不能与H19H19结合,而结合,而CTCFCTCF也不能也不能与绝缘子结合。所以,增强子能够激活与绝缘子结合。所以,增强子能够激活Igf2Igf2基因
38、。在基因。在父本染色体上,通过父本染色体上,通过MeCP2MeCP2结合甲基化的绝缘子,结合甲基化的绝缘子,H19H19基因被进一步抑制。基因被进一步抑制。5 5、X X染色体失活染色体失活 雌性哺乳动物有两条雌性哺乳动物有两条X X染色体,而雄性只有一条。如染色体,而雄性只有一条。如果雌性的两条果雌性的两条X X染色体都有活性,那么雌性个体中由染色体都有活性,那么雌性个体中由X X染色体上的基因编码的蛋白的合成速率可能是雄性个染色体上的基因编码的蛋白的合成速率可能是雄性个体的两倍。为了避免这种不利事件的发生,雌性个体体的两倍。为了避免这种不利事件的发生,雌性个体的一条的一条X X染色体处于失
39、活状态。染色体处于失活状态。X X染色体失活发生在胚染色体失活发生在胚胎发育的早期。在雌性哺乳动物的间期细胞核中可见胎发育的早期。在雌性哺乳动物的间期细胞核中可见的被称为巴氏小体(的被称为巴氏小体(Barr bodyBarr body)的结构就是失活的、)的结构就是失活的、完全由异染色质构成的完全由异染色质构成的X X染色体。染色体。哺乳动物哺乳动物X X染色体的失活与染色体的失活与X X染色体上的染色体上的XistXist基因是否基因是否甲基化有关。起初,两条甲基化有关。起初,两条X X染色体都转录染色体都转录Xist RNAXist RNA。在。在胚胎发育过程中,活性胚胎发育过程中,活性X
40、 X染色体上的染色体上的XistXist基因因甲基化基因因甲基化而失活。并且,这种甲基化模式一旦被建立在每次细胞而失活。并且,这种甲基化模式一旦被建立在每次细胞分裂中就被保持下来。因此,分裂中就被保持下来。因此,X X染色体失活是可以遗传染色体失活是可以遗传的,在子代细胞中保持活性的,在子代细胞中保持活性X X染色体是同一条染色体。染色体是同一条染色体。是是XistXist基因的表达造成携带该基因的基因的表达造成携带该基因的X X染色体失活。该染色体失活。该基因被转录成一条大分子非翻译基因被转录成一条大分子非翻译RNARNA。这种。这种Xist RNAXist RNA包包裹着失活的裹着失活的X
41、 X染色体,然后从染色体,然后从XistXist基因开始形成异染色基因开始形成异染色质,并向两个方向延伸,直至整条染色体都受到影响,质,并向两个方向延伸,直至整条染色体都受到影响,形成巴氏小体。失活的形成巴氏小体。失活的X X染色体除了染色体除了XistXist基因和几个异基因和几个异常的位点外,均被甲基化。在失活的常的位点外,均被甲基化。在失活的X X染色体上,染色体上,XistXist基因是唯一保持活性的基因。基因是唯一保持活性的基因。XistXist诱导诱导X X染色体失活的机制仍未完全揭示。染色体失活的机制仍未完全揭示。Xist Xist RNARNA结合到结合到X X染色体上后,募集
42、介导基因沉默和异染色染色体上后,募集介导基因沉默和异染色质形成的蛋白质。失活质形成的蛋白质。失活X X染色体还要发生以下的变化:染色体还要发生以下的变化:首先首先H3H3的的Lys7Lys7发生甲基化,而活性发生甲基化,而活性X X染色体上染色体上H4H4是是Lys4Lys4发生甲基化;其次,组蛋白发生甲基化;其次,组蛋白H4H4丢失它的大部分乙酰基丢失它的大部分乙酰基团;随后,一种团;随后,一种H2AH2A组蛋白的变异体组蛋白的变异体macroH2AmacroH2A取代取代H2AH2A参与核小体的形成,与参与核小体的形成,与H2AH2A组蛋白相比,组蛋白相比,macroH2AmacroH2A
43、具有具有一个额外的一个额外的C C末端结构域,并且仅出现在失活的末端结构域,并且仅出现在失活的X X染色染色体上;最后,失活体上;最后,失活X X染色体上的染色体上的CpGCpG岛发生甲基化。岛发生甲基化。X X染染色体沉默一旦被形成,就不再需要色体沉默一旦被形成,就不再需要Xist RNAXist RNA来维持。来维持。第三节:真核生物的特异性转录因子真核生物蛋白质编码基因的表达不但需要通用转录因真核生物蛋白质编码基因的表达不但需要通用转录因子,也需要特异性转录因子。特异性转录因子结合于子,也需要特异性转录因子。特异性转录因子结合于启动子的上游元件,或者结合于远离启动子的增强子启动子的上游元
44、件,或者结合于远离启动子的增强子元件,对基因的表达进行调控。一个典型的特异性转元件,对基因的表达进行调控。一个典型的特异性转录因子具有下面录因子具有下面3 3个基本特征:个基本特征:1.1.应答一种特异性信号,激活一个或者一组基因。应答一种特异性信号,激活一个或者一组基因。2.2.与大多数蛋白质不同,转录因子能够进入细胞核,与大多数蛋白质不同,转录因子能够进入细胞核,识别并结合于识别并结合于DNADNA分子上特异性序列。分子上特异性序列。3.3.直接或间接地与转录起始装置发生作用。直接或间接地与转录起始装置发生作用。一、转录因子的分离、鉴定 对于像酵母、果蝇、以及其他在遗传上容易操作的真对于像
45、酵母、果蝇、以及其他在遗传上容易操作的真核生物,可以利用经典的遗传分析的方法鉴定编码转录核生物,可以利用经典的遗传分析的方法鉴定编码转录因子的基因。然而,对于不适合进行遗传分析的脊椎动因子的基因。然而,对于不适合进行遗传分析的脊椎动物来说,大多数转录因子是通过生物化学的方法纯化出物来说,大多数转录因子是通过生物化学的方法纯化出来的。来的。1、利用生物化学的方法分离转录因子 转录因子能够与调控元件特异性结合,所以一旦分转录因子能够与调控元件特异性结合,所以一旦分离出基因的调控元件,就可以利用这一性质把转录因离出基因的调控元件,就可以利用这一性质把转录因子从细胞核中分离来。利用调控元件分离与之结合
46、的子从细胞核中分离来。利用调控元件分离与之结合的转录因子,需要人工合成一段转录因子,需要人工合成一段DNADNA序列,该序列含有序列,该序列含有几个拷贝的这种转录因子的结合位点。这种人工合成几个拷贝的这种转录因子的结合位点。这种人工合成的的DNADNA分子被连接到固体支持物上,形成一个序列专分子被连接到固体支持物上,形成一个序列专一性亲和柱(一性亲和柱(sequence-specific affinity sequence-specific affinity columncolumn)。)。部分纯化的含有待分离转录因子的细胞核抽提物以低部分纯化的含有待分离转录因子的细胞核抽提物以低盐缓冲液上样
47、盐缓冲液上样(100 mM KCl)(100 mM KCl)。不与结合位点结合的蛋。不与结合位点结合的蛋白质用低盐缓冲液从柱中洗出。与结合位点结合不紧白质用低盐缓冲液从柱中洗出。与结合位点结合不紧密的蛋白质用含有密的蛋白质用含有300 mM KCl300 mM KCl的缓冲液洗出。高纯度的缓冲液洗出。高纯度的转录因子用含有的转录因子用含有1 M KCl1 M KCl的缓冲液洗脱。最后,还的缓冲液洗脱。最后,还要利用体外转录技术检测所分离的蛋白质能否促进含要利用体外转录技术检测所分离的蛋白质能否促进含有结合位点的有结合位点的DNADNA序列转录的起始。序列转录的起始。接下来,我们可以获得被纯化的
48、转录因子的部分氨基接下来,我们可以获得被纯化的转录因子的部分氨基酸序列,并根据所确定的氨基酸序列从基因文库中筛酸序列,并根据所确定的氨基酸序列从基因文库中筛选出编码该转录因子的基因,或其选出编码该转录因子的基因,或其cDNAcDNA。有了编码转。有了编码转录因子的基因,就可以检测转录因子在细胞内刺激转录因子的基因,就可以检测转录因子在细胞内刺激转录的能力。录的能力。如图所示,一个质粒载体携带有编码转录因子的基因;如图所示,一个质粒载体携带有编码转录因子的基因;另一个质粒载体携带有报道基因和转录因子的结合位另一个质粒载体携带有报道基因和转录因子的结合位点。两种质粒同时被引入到缺少编码转录因子点。
49、两种质粒同时被引入到缺少编码转录因子X X和报道和报道基因的受体细胞。如果在编码转录因子基因的受体细胞。如果在编码转录因子X X的质粒存在时,的质粒存在时,报道基因的转录水平升高,说明蛋白质是一种活化子;报道基因的转录水平升高,说明蛋白质是一种活化子;报道基因的转录水平下降,说明蛋白质是一种抑制子。报道基因的转录水平下降,说明蛋白质是一种抑制子。2、利用遗传学的方法鉴定编码转录因子的基因在酵母中,编码转录因子的基因是通过遗传分析的手段在酵母中,编码转录因子的基因是通过遗传分析的手段确定的。下面我们以确定的。下面我们以GAL4GAL4基因的分离为例加以说明。基因的分离为例加以说明。当酵母菌在含有
50、半乳糖的培养基上生长时,细胞内参与当酵母菌在含有半乳糖的培养基上生长时,细胞内参与半乳糖代谢的基因的表达水平要升高半乳糖代谢的基因的表达水平要升高10001000倍以上。然倍以上。然而,在而,在gal4gal4突变体中,这些基因的表达并不升高。突变体中,这些基因的表达并不升高。采用突变分析技术,可以鉴定出半乳糖诱导基因的上采用突变分析技术,可以鉴定出半乳糖诱导基因的上游激活序列(游激活序列(upstream activation sequence,upstream activation sequence,UASUAS),它们均含有一个或多个拷贝的),它们均含有一个或多个拷贝的17 bp17 b