1、基因的表达与调控(下)n真核基因表达调控的一般规律张建勇山东理工大学生命科学学院分子生物学真核基因表达调控真核基因表达调控n特征:在特定的时间和特定的细胞中激活特定的基因,从而实现“预定”、有序的、不可逆转的分化、发育过程,使生物的组织和器官保持正常功能。n什么是调控基因表达的信号?什么是调控基因表达的信号?n基因的调控主要是在哪一步?基因的调控主要是在哪一步?(转录、(转录、mRNA的成熟或蛋白的成熟或蛋白质合成)质合成)n不同水平基因调控的分子机制不同水平基因调控的分子机制是什么?是什么?n核小体:a.无调控蛋白时,基因表达减少。b.修饰改变核小体,让DNA结合蛋白与DNA的结合易于进行。
2、n重复序列和内含子。nDNA与蛋白质结合,构象的变化,调节序列的增多。n转录和翻译的间隔,RNA的合成与转运,RNA的剪接和加工。1、影响真核基因表达调控的因素、影响真核基因表达调控的因素2 2、真核基因表达的调节特点、真核基因表达的调节特点n(1)多层次n(2)无操纵子和衰减子n(3)个体发育复杂n(4)受环境影响较小染色体基因结构的激活 转录起始 转录物加工 向胞质转运 mRNA 的翻译(产物加工)3、分两大类、分两大类1.瞬时调控或可逆调控:n相当于原核生物对环境的变化作出的反应,象某种底物或激素水平升降时,或细胞周期不同阶段酶活性的调节。2.发育调控或不可逆调控:调控发生的主要水平:n
3、转录水平调控n转录后水平调控:RNA加工成熟过程的调控 翻译水平的调控 蛋白质加工水平的调控一、真核生物的基因结构与表达活性一、真核生物的基因结构与表达活性n单顺反子n结合组蛋白和非组蛋白n重复序列和内含子nDNA片段重排和增加基因拷贝数n基因调节区的位置和大小n空间间隔n有剪接成熟的过程1、基因家族、基因家族n真核细胞中许多相关的基因常按功能成套组合,被称为基因家族(gene family)n家族成员可以成簇存在,或者分散在不同的染色体中(或两者都有)。n基因簇(Gene cluster)少则可以是由重复产生的两个相邻相关基因所组成,多则可以是几百个相同基因串联排列而成。基因簇通过重复和变异
4、形成基因簇通过重复和变异形成n多数重复都在基因第一个拷贝附近产生第二个拷贝。有时这些拷贝保持联系,进一步重复可以产生相关基因的一个基因簇。n突变可以在一个拷贝中积累而不会使自然选择向不利的方向进行。然后这个突变的拷贝可以进化形成一种新功能,也许和第一个拷贝在不同时期或地点表达,也许获得不同的活性。(1)简单多基因家族)简单多基因家族n串连方式前后相连。E.coli中有七个拷贝,每个拷贝中tRNA基因的种类、数量和部位发生变化。原核生物真核生物真核生物n前体为45Sn100处被甲基化(2-OH)n需要snoRNAs的参与(核仁小RNA,研究热点,由内含子编码。反义snoRNA指导rRNA核糖甲基
5、化。)snRNAsnRNAnsnRNA(核小RNA):指任何一个限制在核内的小分子RNA,一些snRNA在涉及剪接过程,另一些涉及RNA 合成反应。n核内RNA(U1,U2,U4,U5,U6)与核蛋白组成snRNPsn剪接装置中的snRNPs和大量的附加蛋白,常称为剪接因子非编码非编码RNA:non-coding RNARNA:non-coding RNA(ncRNA)ncRNA)能被转录但不编码蛋白质且具有特定功能的RNA分子。DNA序列中专门转录成非编码RNA的部分称为RNARNA基因基因或非编码非编码RNARNA基因基因。ncRNAtRNA、rRNAsiRNAs、microRNAs、pi
6、RNAs小分子ncRNA大分子ncRNA:Xist、Evf、Air、CTN、PINK lincRNAs(大型插入性非编码RNA)snoRNA、snRNA、scRNA、gRNA、pRNA、tmRNA、RNase P RNA、Signal recognition particle RNA(guide RNA)(small cytoplasmic RNA)(small nuclear RNA)(transfer-messenger RNA)(small nucleolar RNA)(packaging RNA)(核酶)(2)复杂多基因家族)复杂多基因家族n复杂多基因家族一般由几个相关基因家族构成,基
7、因家族之间由间隔序列隔开,作为独立的转录单位。(3)发育调控的多基因家族)发育调控的多基因家族n血红蛋白基因基本结构n但在生物个体发育的不同阶段,却出现不同形式的和亚基。n哺乳动物血红蛋白类-珠蛋白基因家族、类-珠蛋白基因家族都是由功能基因和假基因形成的一个基因簇。n:16chrn:11chrn人类中,和是两条类似链,、和是类似链。这些链在不同的发育阶段表达。n在基因家族中,基因的排列顺序是它们在发育阶段的表达顺序。n无功能基因是指没有编码蛋白质能力的基因,没有活性的原因很多,可能是由于在转录或翻译(或两种中都有)过程中有缺失。它们被称为假基因(Pseudogenes),用符号表示。n在脊椎动
8、物-珠蛋白的基因簇中普遍存在基因和假基因,小鼠的基因簇有7 个基因:2个早期胚胎表达基因;1个晚期胚胎表达基因,2 个成体表达基因,剩下2 个为假基因。鸡和兔的-珠蛋白基因簇有4 个成员。当前的珠蛋白基因簇是从一个当前的珠蛋白基因簇是从一个原祖珠蛋白基因进化而来的原祖珠蛋白基因进化而来的n植物的豆血红蛋白(Leghemoglobin)基因可代表此基因的原始结构n一些“原始”鱼类仅有珠蛋白链n非洲爪蟾(X.laevis)珠蛋白基因的结构是一个连锁的-对的内部重复n 和珠蛋白基因的分开一定是由于哺乳动物/鸟类祖先的基因发生转座的结果n我们可以把一个编码区的核苷酸序列分为潜在的置换位点(Replac
9、ement sites)和沉默位点(Silent sites)。n置换位点上的突变应该引起相应氨基酸的趋异基因的趋异基因的趋异两个核酸或蛋白质之间的差异可以用趋异度(Divergence)表示,即差异的位点的百分比。人-珠蛋白基因置换位点的多样性使我们能够再现其进化历史,图中树状进化图解释了一系列珠蛋白基因逐渐分离过程。Sequence divergence is the basis for the evolutionary clock假基因假基因n假基因:它们具有与功能基因非常类似的序列,但这些序列不能翻译成有功能的蛋白质。n假基因与功能基因一样的结构:有相当于外显子和内含子的序列。n基因表
10、达过程中的突变,会使这些基因失去活性。n突变几种形式:如消除起始转录的信号,阻止在外显子-内含子的连接点进行剪接或过早的终止翻译。假基因是进化的死角假基因是进化的死角n许多系统中(包括珠蛋白、免疫球蛋白和组织相容性抗原)有些假基因只当作活性基因的失活形式。在这些系统中,假基因位于基因簇附近,往往中间还夹杂着活性基因突变成为新的功能基因或成为失去功能的假基因等过程,在基因簇中不断地进行。n大多数基因家族都有一些假基因。通常假基因在总基因数目中只占一小部分。n我们所看到的那些基因都是在目前种群中幸存下来的基因,其他一些假基因在过去可能早已被清除。n假基因的清除可以通过突然发生的序列缺失,或通过某个
11、位点上累积突变,只是假基因不再被认作原有序列家族的一员而发生的(这可能是一切不被清除掉的假基因的最终归宿)。2、真核基因的断裂结构、真核基因的断裂结构n在各级生物中都存在断裂基因(Interrupted genes)。在低等真核生物的基因中断裂基因仅占很小的一部分,但是在高等真核生物基因组中绝大部分都是断裂基因。n剪接需要在内含子与外显子结合处产生断裂,然后将外显子末端相连。从图中的放大演示可以看到RNA加工的基本流程。外显子外显子nDNA序列中外显子部分可能还不到10n少数基因如组蛋白及型、型干扰素基因,根本没有内含子。n不清楚内含子的功能。n断裂基因的结构形式为编码区域提供了进行重组的潜在
12、位点,有利于基因的进化。边界顺序边界顺序n连接区的保守序列几乎存在于所有高等生物基因中,表明可能存在共同的剪接加工机制。n线粒体和酵母tRNA基因中不存在类似保守序列,还有其它加工剪接过程。外显子与内含子的可变调控外显子与内含子的可变调控n组成型剪接:一个基因的转录产物通过组成型剪接只能产生一种成熟的mRNA分子,编码一个多肽。n选择性剪接:hnRNA通过不同的剪接方式,产生不同的mRNA,并翻译成不同的蛋白。n选择性剪接二、真核生物基因表达多层次的调控二、真核生物基因表达多层次的调控n染色体水平的调控染色体水平的调控n染色体丢失等n染色质水平调控染色质水平调控n异染色质化n组蛋白的影响nDN
13、A水平的调控nDNA的甲基化与去甲基化n基因的扩增n基因的重排n转录水平的调控n转录起始和加工的调节n翻译的调控n细胞周期的调控(一)染色质水平调控(一)染色质水平调控n染色质的丢失:不可逆n异染色质化n组蛋白的影响1、异染色质化异染色质化n异染色质(Heterochromatin)是用以描述染色体区域的术语,这类区域永久性的卷曲并呈惰性,致密。与代表大多数基因组的常染色质不同。n异染色质经常位于着丝粒和端粒上。n哺乳动物细胞中50%的基因组是以异染色质形式存在n异染色质中也有少量基因,活性基因转移到异染色质区,该基因通常会被关闭。染色质结构对转录的影响染色质结构对转录的影响n遗传物质的结构状
14、态与其活性是相对应的。在S 期晚期被复制;异染色质不被转录。这表明遗传物质的压缩状态是与其失活相关联的。n活性基因包含在常染色质内,所以定位在常染色质上是基因表达的必要而非充分条件。染色质结构对转录的影响染色质结构对转录的影响n常染色质解旋,形成自由DNA,导致结构基因暴露,促进转录因子与启动区DNA结合,诱发基因转录。n用DNA酶I处理各种组织的染色质时,处于活跃状态的基因比非活跃状态的DNA更容易被酶所降解。n含有一个或几个DNA酶I超敏感位点,大多位于基因5端启动区。(1)灯刷染色体的伸展状态)灯刷染色体的伸展状态n灯刷染色体在特别长的减数分裂期内形成,可能会存在几个月!此期间,染色体在
15、光镜下可看到染色体呈现向外伸出的灯刷伸展状态存在。n表达的染色体呈高度伸展状态灯刷染色体是二价体,姐妹染色单体几乎完全分离,它们之间仅由几个交叉相连。n染色体在某些位置上染色线以突环(Lateral loop)的形式伸出,形状很像灯刷。n突环被核糖核蛋白围绕,包含一些新生RNA 链。一个转录单位能被定义为沿突环移动的RNP的长度。n突环是被活跃转录突出的DNA片段。n突环成对伸展,且都源于同一姊妹染色单体。在轴线上突环是连续的。n转录时核小体伸展和压缩状态时可逆的。n进行转录,遗传物质需要从其更加紧密的包装状态变为相对松散的开放状态。(2)转录破坏多线染色体的结构)转录破坏多线染色体的结构n条
16、带的线性排布代表基因的线性排布。n果蝇基因的总数似乎多于带的数目,大多数带中可能有多个基因。这种染色体与间期染色质或分裂期染色体相比,遗传物质呈充分伸展状态。n多线染色体的一个内在特征是活性位点能够直接观察。有些带暂时形成一个涨泡(称为Balbiani环),染色体物质从轴上突出出来。n涨泡(Buff)的本质是什么?在组成涨泡区域里,染色体纤维从其正常包装状态解螺旋,纤维连续地染色体轴伸出。涨泡经常从单个带里解放出来。昆虫昆虫(C.tentans 摇蚊摇蚊)唾腺唾腺的的IV 染色体有三个巴尔比亚尼染色体有三个巴尔比亚尼环。环。n涨泡状态与基因表达相关。n在组成涨泡区域里,染色体纤维从其正常包装状
17、态解螺旋,纤维连续地染色体轴伸出。n涨泡是RNA 合成的位置。n灯刷和多线染色体这些性质表明了一个普遍的结论,为进行转录,遗传物质需要从其更加紧密的包装状态变为相对松散的开放状态。2 2、组蛋白的影响、组蛋白的影响n核小体的转录阻遏作用。n组蛋白的转录阻遏作用。nH1的转录阻遏作用:能稳定核小体的结构。竞争性结合DNA上某些位点,转录因子抗H1。H1能引导核小体进一步压缩。2 2、组蛋白的影响、组蛋白的影响n组蛋白密码子(histone code)假说:组蛋白尾部(N端)不同形式的修饰可以被“阅读”,具有一定的内涵(打开或关闭基因)。n修饰:乙酰化(激活),甲基化(激活或抑制)Methylat
18、ion of histone or of DNA usually turns a gene off.Acetylation of histone usually turns a gene on.Phosphorylation-were not sure what that does.修饰需要特定的酶修饰需要特定的酶n组蛋白乙酰转移酶、组蛋白脱乙酰化酶和组蛋白甲基转移酶。n机制:a.修饰改变了组蛋白的电荷分布,影响了DNA高级结构的形成。b.提高调节蛋白与修饰位点的结合(核小体会被释放),提高了DNA的易接近性。乙酰化的生物功能乙酰化的生物功能n促进基因转录活性:电荷分布改变,影响核小体结构。n
19、促进转录起始复合物的装配:修饰后与DNA结合能力下降。n去乙酰化导致基因沉默:(二)(二)DNADNA水平上基因表达调控水平上基因表达调控nDNA模板发生规律性的变化,从而控制基因的表达和生物的发育。nDNA发生永久性的变化:成熟的红细胞与前体细胞nDNA水平的调控:基因丢失、扩增、重排和移位、甲基化等。n基因组发生了改变。DNADNA水平的调控水平的调控n基因扩增(gene amplification):增加基因的拷贝数n非洲爪蟾卵母细胞rRNA基因,扩增4000倍,1012个核糖体n药物:诱导抗药性基因的扩增;肿瘤细胞:原癌基因拷贝数异常增加n基因重排(gene rearrangement
20、):n如免疫球蛋白基因重排,多样性n重排可能会产生在特定环境中需要表达的新基因n重排可能会关闭一个基因而打开另一基因。n基因转换nDNA的甲基化1、基因扩增、基因扩增n基因扩增:指某些基因的拷贝数专一性大量增加的现象,可使细胞在短期内产生大量的基因产物以满足生长发育的需要,是基因活性调控的一种方式。n例如:非洲爪蟾的rRNA基因。n例如:果蝇卵壳蛋白基因的扩增。rRNArRNA基因基因n核糖体RNA是最主要的转录产物,在真核和原核生物中它们构成了细胞RNA总量的大约8090%。nrRNA基因数目变动很大,从大肠杆菌的7个到低等真核生物的100200个,高等真核生物中有几百个。大的和小的编码rR
21、NA的基因(分别存在于核糖体大亚基和小亚基中)经常串联排列(唯一例外的是酵母线粒体)。rDNArDNAn在大多数真核生物的细胞核中,rRNA基因包含在一些串联基因簇中。有时把这些区域称为rDNAn判断一个串联基因簇的重要特征是它能产生一个环状的限制图谱。核仁核仁(Nucleolus)(Nucleolus)n细胞核中rRNA合成的区域具有特殊的形态:它有一个纤维状核心,外面包被着一层颗粒状皮层。这个纤维状核心是以DNA 为模板转录rRNA 的区域,而颗粒状皮层是由装配了rRNA 的核糖核蛋白颗粒形成的。整个区域称为核仁(Nucleolus)核仁组织区核仁组织区(Nucleolar organiz
22、ers)(Nucleolar organizers)n特殊的染色体区域与核仁相联,这些区域称为核仁组织区(Nucleolar organizers)。n核仁组织区相当于一个串联重复的rRNA基因簇。n串联重复rRNA基因的浓缩及其强烈转录造成了核仁的特殊形态。2、基因重排、基因重排n基因重排:将一个基因从远离启动子的地方移到距它很近的位点从而启动转录。n例如:免疫球蛋白基因(B淋巴细胞)T-细胞受体基因(T淋巴细胞)(1)免疫反应)免疫反应n免疫反应是白细胞:B 淋巴细胞、T 淋巴细胞和巨噬细胞(Macrophage)的职责。n淋巴是根据产生它们的组织命名的。在哺乳动物中,B淋巴细胞在骨髓中成
23、熟,而T淋巴细胞在胸腺中成熟。n每一类淋巴细胞产生蛋白质来特异性应答的机制都是DNA 重排(重组)。n免疫应答典型的特征是无论在什么时候遇到抗原,机体都能产生相应的抗体。对于每个不能预料的抗原,机体是如何产生那些能够特异性识别这些抗原的抗体呢?n通常情况下,哺乳动物能够产生106108种不同的抗体。每一种抗体都是免疫球蛋白四聚体,有两个轻链(L)和两个重链(H)组成。如果任何一个轻链都能够和任何重链组合,那么产生106108种不同的抗体需要103104个不同的轻链和重链。(2)免疫球蛋白的基本结构免疫球蛋白的基本结构n四肽链结构:所有Ig的基本单位都是四条肽链的对称结构。两条重链(H)和两条轻
24、链(L)。每条重链和轻链分为氨基端和羧基端。n根据氨基酸排列顺序的不同分为可变区(V)和恒定区(C)。Table Each immunoglobulin family consists of a cluster of V genes linked to its C gene(s).n在这里,基因的意义是一段编码免疫球蛋白一部分肽链(轻链或重链)的DNA序列。nV 基因编码可变区,C基因编码恒定区,它们都不能单独的表达。n构建一个能够表达的真正的轻链或重链基因,一个V 基因必须和一个C 基因连接起来。在这个系统中,我们用基因片段而不用基因来指这些单位。n轻链和重链相对应的区域结合产生免疫球蛋白中
25、不同的结构域(Domain):n可变结构域(V)是由轻链和重链的可变区结合而成。V 区负责对抗原的识别。n恒定区的数量比可变区数量少很多,典型情况下对于特殊的蛋白质链只有110个C区。n编码轻链的基因和编码重链的基因,其组合方式是一样的:n许多V 基因片段中的一个和几个C基因片段中的一个连接。n这种体细胞基因的重组(Somatic recombination)发生在B淋巴细胞中。数量巨大的可变V基因片段是免疫球蛋白多样性的主要原因。(3)轻链基因的重排与连接)轻链基因的重排与连接nLambda型轻链nV基因片段包含前导序列(Leader),它被一个内含子和V 基因片段分开。nC 基因片段由J片
26、段和恒定区(C)组成,中间被一个内含子分开。nV片段和C片段的连接时,实际上是V-JC 连接。轻链基因的重排与连接轻链基因的重排与连接nKappa型轻链nV与J的重排和连接:是通过之间的识别序列来完成的。形成的茎环结构被切除,形成连续的VJ片段。nV与J重排是随机的和不精确的,造成重排后的多样性。(4)重链基因的重排与连接)重链基因的重排与连接n重链的结构包含一个附加片段:D 片段(Diversity,负责多样性的)nV基因与D、J片段组合,能产生4000个不同的V区,都能与CH结合。nCH基因簇:有10个基因,在同一细胞内只有一个基因得到表达3、酵母的交配型转换、酵母的交配型转换n酿酒酵母既
27、能够以单倍体(Haploid)繁殖也能以双倍体(Diploid)繁殖。n两种状态的改变是通过接合(单倍体孢子融和产生双倍体)和孢子形成(双倍体有丝分裂产生单倍体孢子)进行的。酵母的交配型转换酵母的交配型转换n带有MATa 等位基因的细胞为a类型。相反,携带MAT等位基因的细胞为型。类型相反的细胞能够接合;同型的则不能接合。n当双倍体是杂合子时,才能发生重组并能产生单倍体孢子。nHML负责MAT类型,HMRa负责MATa 型。这些基因和MAT位于同一条染色体上,HML位于左边,HMR位于右端。n当沉默的基因座取代了活跃的基因座时,酵母的接合型就会发生改变,相同类型基因座之间互相易位,接合型不变。
28、nHO内切酶能够在MAT基因一个24bp序列(Y)的右端切开。酶切产生一个4 个碱基的粘末端,内切酶不能作用于突变的MAT基因座24bp 的大部分或者全部对内切酶的识别是必须的。对内切酶来说,这个靶序列相对很大。n供体位点和受体位点区域的转换反应与普通的反应类似,主要与单链DNA 相互作用,酶切后是重组的一系列步骤;酶切后的步骤所需要的酶和普通重组酶相同。n就像复制型转座,供体位点没有受到影响,但在受体上序列却发生了变化酵母能改变接合型酵母能改变接合型n携带显性基因HO,能改变接合型,甚至一代就能改变一次。携带隐性基因HO的菌株具有稳定的接合型,改变得频率约为10-6。nHO引起酵母基因型的改
29、变。无论开始是什么类型,几代之后,就会产生这两种接合型的细胞,最后导致产生MATa/MAT型的双倍体占据整个种群。4 4、DNADNA甲基化与基因活性的调甲基化与基因活性的调控控nDNA甲基化(DNA methylation):n甲基化(methylated)程度高:基因表达降低;去甲基化(undermethylated):基因表达增加nDNA甲基化的作用:改变染色质结构、DNA构象、DNA的稳定性及DNA与蛋白质的相互作用,从而控制基因表达。(1)DNA的甲基化nDNA甲基化广泛存在。n甲基化类型:5甲基胞嘧啶(5mC),N6甲基腺嘌呤(N6mA)和7甲基鸟嘌呤(7mG)。n5甲基胞嘧啶(5
30、mC)主要出现在CpG序列、CpXpG、CAA/TGG和GATC中。CpGCpG岛岛n哺乳动物基因组中5%的C为甲基化(mC),mC主要存在于CpG二核苷酸序列中。nCpG二核苷酸序列常成簇聚集并零散地分布于人基因组中,形成CpG岛(CpG islands)。人基因组中约每10Kb就有一个CpG岛nCpG岛常与基因相连(可作为寻找基因的标记)。甲基化酶n日常型甲基转移酶:主要在甲基化母链(模板链)指导下使处于半甲基化的DNA双链分子上与甲基胞嘧啶相对应的胞嘧啶甲基化。催化特异性极强,速度快。n从头合成甲基转移酶:催化未甲基化的CpG成为mCpG,不需要母链指导,速度慢。n去甲基化酶(Demet
31、hylase)则去除甲基。n这样的位点称为完全甲基化位点(Fully methylated)。这些位点在复制时,每个子代双链有一条链甲基化而另一条未甲基化,这样的位点称为半甲基化位点(Hemimethylated)。识别n限制性内切酶Hpa II 和Msp I 都识别CCGG序列,Msp I 无论是否甲基化均能切割,但Hpa II只能切未甲基化的位点。甲基基团的分布可用限制酶来检测。(2)DNA甲基化抑制基因转录的机制n基因中,甲基化状态在大多数位点都是恒定的,但另一些位点是可变的。这些位点中的一部分被甲基化,而另一些位点不被甲基化。n在基因不表达的组织中有少数位点被甲基化,在基因具有活性的组
32、织中却未被甲基化。活性基因被称为低甲基化基因(Undermethylated gene)。n甲基集团的缺失与基因的表达有关。然而在推测甲基化状态是如何提供控制基因表达方式时存在一些困难。n例如,果蝇中没有任何DNA甲基化。激活和失活染色质之间的其它区别和显现甲基化的物种中情况一样。所以在果蝇中,脊椎动物中的任何甲基化作用均被一些其它机制取代。n甲基化达到一定程度会导致B-DNA向Z-DNA的过渡。nZ-DNA结构收缩,螺旋加深,与蛋白因子结合的元件缩入大沟而不利于转录的起始。启动子附近的甲基化阻止转录发生,是影响启动子活性的几种调控之一。n基因5末端的甲基化与表达直接相关。许多基因在被表达时5
33、端不甲基化,尽管3端仍被甲基化。n-珠蛋白基因中,在起点区域的甲基化(-22 到+90bp 之间)抑制转录。(3)DNA甲基化提高突变率n5-mC脱氨后生成胸腺嘧啶(T),不易被识别和矫正。造成基因表达的紊乱。转录所需要的是(活性基因中的三种改变):n在启动子附近建立了一个超敏位点。(实际上是一段长约200bp的DNA序列特异暴露的染色质区域,甲基化程度较低,富含HMG14,HMG17蛋白。一般在转录起始附近或者相关部位。)n含转录区的结构域中核小体变得对DNAaseI更加敏感。n相同DNA结构域低甲基化。(4)DNA甲基化与X染色体失活nX染色体失活是发育过程中独特的调节机制n哺乳动物,雌性
34、两条X 染色体中的一条完全没有活性。与在雄性中基因表达水平情况相同。n果蝇,雄性单条X 染色体的表达水平是雌性的两倍。n秀丽隐线虫(C.elegans),雌性每条X 染色体的表达水平是雄性的一半。剂量补偿平衡两性中X染色体相关基因的表达n雌性中X 染色体的失活服从n-1 规律:n通常雌性有2X 染色体,但在偶然染色体不分离的情况下,能产生3X 或更大的基因型,仅有一个X染色体保持活性。n这表明一个通常的模型,即特殊的事件被限定在一条X染色体上,并且保护它不受其它染色体失活的影响。X染色体失活中心nX 染色体上的单一基因座足以导致失活。称为X染色体失活中心(X-inactivation cent
35、er,Xic)。n一个450kb的克隆区域包含所有的Xic 特性。定位在Xq13区(Barr氏小体)。n当此序列作为转基因被插入常染色体,常染色体将被失活(在细胞培养系统中)。n失活染色体高度甲基化。nXic是一个顺式作用座位,包含计数X染色体和失活除一个以外所有X染色体的必须信息。nXic包含一个基因,称为Xist,它仅在非活性X染色体中表达。该基因的活动与染色体上其它被关闭的基因座相反删除Xist能阻止X染色体被失活。n含有8个外显子,基因中存在多个串联重复序列。n基因产物是功能性RNA分子,不含ORF,含有大量终止密码子,不编码蛋白质只存在于细胞核。nXist表达的沉默对活性X是必须的。
36、删除DNA甲基化酶基因则阻止Xist的沉寂,可能是因为Xist启动子的甲基化对转录中止是必须的。nXist的甲基化(三)真核基因转录水平的调控(三)真核基因转录水平的调控n已发现基因具有两种结构状态,从而证实了第一层面确实存在。“活化”结构的产生是基因表达所必须的第一步。n活性基因的转录在起始阶段受RNA 聚合酶和启动子间相互作用的调控。基因结构的激活转录起始转录物加工向胞质转运mRNA 的翻译转录水平的调控n顺式作用元件n反式作用因子顺式作用:不转变为任何其他形式的DNA序列,只在原位发挥DNA序列的作用,仅影响与其在物理上相连的DNA。(同一染色体上的DNA序列直接调控其他邻近基因的表达)
37、顺式作用元件:是指对基因表达有调节活性的DNA序列,其活性影响与其自身同处在一个DNA分子上的基因;这种序列通常不编码蛋白质,多位于基因傍侧或内含子中。反式作用:游离的基因产物扩散至目标场所的过程。反式作用因子的编码基因与其识别或结合的靶序列一般不在同一个DNA分子上。(DNA通过其产物(mRNA或蛋白质)间接调节基因的表达。)反式作用因子:通过直接结合或间接作用于DNA、RNA等核酸分子,对基因表达发挥不同调节作用(激活或抑制)的各类蛋白质因子。n核心启动子成分,如 TATA 框;n上游启动子元件(UPE),如 CAAT框,GC框;n远端调控区:如增强子,减弱子、沉默子,酵母的UAS(ups
38、treamactivator sequences)等。n特殊细胞中的启动子成分:如淋巴细胞中的 Oct(octamer)和B。n转录模板1、顺式作用元件增强子特征:n增强效应十分明显n增强效应与其位置和取向无关n大多为重复序列,核心序列:(G)TGGA/TA/TA/T(G)n增强效应有组织和细胞特异性n没有基因专一性n受外部信号的调控2、RNA聚合酶IIn由1012个亚基组成n最大亚基的羧基末端有七个氨基酸残基(Tyr-Ser-Pro-Thr-Ser-Pro-Ser)组成的多磷酸化位点重复序列,称为羧基端结构域(CTD)TFIIn通用转录因子(General transcription fac
39、tors)。通用转录因子又称为TFX。nTFD结合到TATA序列nTFA 可以激活TBPnTFB结合TATA盒的下游nTFF、TFE和TFHnRNA 聚合酶从启动子上释放,进入转录延伸阶段。TFH是一个特别的因子,在延伸中也发挥作用。nTFH有多种酶活性:ATP酶、螺旋酶和RNA聚合酶的CTD尾磷酸化激酶活性;它还涉及DNA的损伤修复。nCTD磷酸化可能是释放聚合酶、起始转录所必需的。nRNA聚合酶II指导的基因转录过程反式作用因子可以分为4类:nRNA聚合酶亚基聚合酶亚基n通用反式作用因子通用反式作用因子,识别启动子的核心成分,如TBP;n特殊组织与细胞中的反式作用因子特殊组织与细胞中的反式
40、作用因子,如淋巴细胞中的Oct-2;n与应答元件与应答元件(response elenents)相结合的反式作用因子。应答元件n应答元件(response element)是位于基因上游能被反式作用因子识别和结合,调控基因专一性表达的DNA序列。n如热激应答元件(heat shock response element,HSE)、金属应答元件(metal response element,MRE)、糖皮质激素应答元件(glucor-ticoid response element,GRE)和血清应答元件(serum response element,SRE)等。n基因对这种因子产生反应n应答元件含
41、有短重复序列,不同基因中应答元件的拷贝数不相等。n应答元件通常位于转录起点上游200bp内。应答元件也有位于启动子或增强子内。如HSE位于启动子内,GRE则在增强子内。n各种应答元件的作用原理是相同的:特定的蛋白因子识别应答元件并与其结合,调控基因的表达。反式作用因子n广泛被研究的是识别TATA区的TF IID,识别CAAT区的CTF,识别GC区的SP1,以及识别热激蛋白启动区的HSF。n基因受位于启动子或增强子上被特异性蛋白质识别的序列调控。蛋白质可以作为一个转录因子参与RNA 聚合酶的起始。n活性蛋白质只有在基因将被表达时才存在。n控制转录因子活性的机制有多种,可以是蛋白质合成,蛋白质共价
42、修饰,配体结合,也可以是影响转录因子与DNA 结合甚至是将蛋白与DNA隔离的各种抑制剂。转录因子和调控蛋白需要两种能力n它们能识别位于增强子、启动子的特异靶序列或其它影响特定基因的调控元件。n与DNA结合之后,转录因子或正调控蛋白通过与转录复合物的其它成分结合来行使功能。3、反式作用因子中的DNA结合域n通过比较许多转录因子的序列,发现有多种共同基序(Motif)类型负责与DNA结合。这些基序通常很短。n基序还通过与转录复合体的蛋白质之间的相互作用激活转录。n基序(motif):在许多蛋白质分子中,二个或三个具有二级结构的肽段,在空间上相互接近,形成一个具有特殊功能的空间结构。一个基序总有其特
43、征性的氨基酸序列,并发挥特殊的功能。(1)螺旋转角螺旋n螺旋转角螺旋(Helix-turn-helix):最早在噬菌体阻遏蛋白质的DNA 结合域发现的。n此类结构的相关形式还存在于“同源域(Homeodomain)”中。这是在果蝇发育调控基因编码的几种蛋白质序列中发现的。它也存在于哺乳动物转录因子基因中。Helix-Turn-Helixn三个螺旋被两个转角分开nC端Helix为DNA结合必需,其它两个Helix参与形成二聚体n作用于DNA链的大沟nLacO的R蛋白,涉及酵母交配型的a1和a2蛋白,真核生物中的Oct-1和Oct-2Sample of Helix-Turn-HelixIntera
44、ction between the l repressor dimer and DNA.Each l repressor contains a helix-turn-helix motif.One of helices fits into the major groove of DNA.PDB ID=1LMB(2)同源域蛋白n同源框(Homebox)是一段60个氨基酸组成的结构域序列,该结构域存在于许多甚至所有真核生物的蛋白质中。其名称来源于它最早是在果蝇的同源异形基因座(Homeotic loci)中发现的(它们的基因决定身体结构的特性)。n同源结构域(Homoedomain)识别(或至少普
45、遍存在)与发育调节有关的基因。n三种同源框,果蝇触角足基因(Antp)、锯齿(En 基因)和哺乳类因子Oct-2 则代表了一组关系较远的转录因子。同源结构域氨基酸残基从1-60 被标出,开始于N 端的臂,三个螺旋区分别位于10-22,28-38,42-58。n同源率8090n同源框的螺旋3 结合到DNA的大沟上,螺旋1、2 露在双螺旋之外。螺旋3 与磷酸骨架和特异性碱基同时接触,其N 端的臂位于小沟中,也结合在DNA上。C末端存在螺旋-转角-螺旋的结构:具有转录调控功能(3)锌指结构n锌指基序(Zinc finger motif):包含一个DNA结合域(DNA-binding domain)。
46、在因子TFIIIA中发现,该因子是RNA聚合酶III转录5S rRNA基因所必须的。在其它几种转录因子中也发现了该结构。在类固醇受体中也发现了此结构的一种形式。n锌指结构家族蛋白分类:锌指、锌钮和锌簇。n锌指的共有序列为Cys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X3-His。Zn位于由保守的Cys和His残基所组成的四面体内。指身包含约23个氨基酸,指间由78个氨基酸相连。Cys2/His2锌指分类:经典的“锌指”蛋白质和类固醇受体。n锌指的C 末端都形成螺旋与DNA结合;N末端形成-折叠(图的下部分并末显示折叠和锌离子的位置)。三个螺旋恰好适合大沟的一圈;每个螺旋都
47、与DNA两个特异序列接触(如箭头所示)。据推测,每个锌指C 末端的非保守氨基酸负责识别特异的靶位点。n类固醇受体(Steroid receptor):每个受体与一个特定类固醇结合而被激活。与其它受体如甲状腺素(Thyroid)受体或视黄酸(Retinoic acid)受体相同,都是同一转录因子超家族中的一员。n类固醇受体含有另一种类型的锌指。同源序列为:Cys-X2-Cys-X13-Cys-X2-Cys。Cys2/Cys2锌指n具有Cys2/Cys2锌指的蛋白质通常都含非重复的锌指,相反Cys2/His2锌指则串联重复。n类固醇受体的第一个锌指控制着DNA结合特异性(相关位置用红色表示),第二
48、个锌指控制着二聚体化特异性(相关位置用蓝色表示)。n从第一个锌指放大图来看,锌指是以GRE(糖)为靶序列还是以ERE(雌)为靶序列取决于底部的两个氨基酸。(4)碱性-亮氨酸拉链n结构:羧基端35个氨基酸形成螺旋,每隔6个氨基酸就有一个亮氨酸残基,导致第七个亮氨酸都在螺旋的同一方向出现。n二聚体的形式出现,两个蛋白螺旋上的亮氨酸一侧是形成拉链型二聚体的基础。碱性-亮氨酸拉链n在一个双元亮氨酸拉链基序中,当两个相邻拉链的疏水面以互相平行的方向作用时,所产生的二聚体化作用会将各自的碱性区连在一起。n这种结构是如何与DNA 的结合相关的呢?n每个拉链蛋白质中邻近亮氨酸重复的区域都是高度碱性的,能成为结
49、合DNA 的一个位点。两个亮氨酸拉链形成一个丫形结构,其中,拉链形成干,两个碱性区对称地形成DNA结合臂。这就解释了为什么这些蛋白质的靶序列是无间隔的反向重复序列。(5)螺旋-环-螺旋n基序序列:羧基端100200个氨基酸的序列中含有两个双亲性的螺旋,两螺旋被一个连接区(环)分开。n环的作用可能仅仅是使两个螺旋区自由独立的作用。n特点:存在结合DNA的螺旋区和形成蛋白质二聚体的能力。n这种蛋白通过两个螺旋相应表面的疏水残基的相互作用,可形成同源二聚体和异源二聚体。Basic-Helix-Loop-Helixn大多数HLH 蛋白质在HLH基序附近有一个非常碱性的、对DNA结合非常重要的区域。n碱
50、性HLH(bHLH protein)。bHLH又分为两类n A类是可以广泛表达的蛋白,包括哺乳动物的E12/E47(可和免疫球蛋基因增强子中的元件结合)和果蝇da(daughterless,性别控制的总开关基因)的产物;nB类是组织特异性表达的蛋白,包括哺乳动物的MyoD(肌浆蛋白myogen)基因的转录因子,果蝇的AC-S(achaete-scute 无刚毛基因的产物)n当两个亚单位都是HLH(DNA 结合型HLH,含有碱性区)时,HLH 二聚体可以结合DNA,但只要一个亚单位缺乏碱性区,二聚体就不能与DNA结合。4、转录活化结构域n活化其他调控因子和RNA聚合酶。n并不是每个转录因子都直接
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。