1、 分子生物学分子生物学Molecular Biology 主要内容1.基因的概念2.基因表达及调控3.组学的基本知识生物化学分子生物学:1.基因的概念l1857-1864年:孟德尔经典遗传学规律:独立分配和自由组合规律。“遗传颗粒”性状。l1900年:摩尔根“遗传颗粒”定位在染色体上。l1909年:丹麦科学家Johannsen“遗传颗粒”命名为基因。l1944 年:遗传物质为DNA。l1953年:DNA双螺旋结构的发现,分子生物学诞生。l1966年:遗传密码子破译。l1972年:基因工程的诞生及其后续的快速发展不但是分子生物学的结果而且大大促进了分子生物学的发展。l2000年:DNA 测序技术
2、的发展获得模式生物和重要生物全基因组学列,分子生物学进入了后基因组和蛋白组时代,重点解决蛋白-RNA-DNA互作的遗传语言问题。孟德尔 摩尔根 Avery Watson and Crick 多利羊 HGP 基因的概念基因的概念l基因是一段编码功能性是一段编码功能性RNA分子的分子的DNA片段片段,包括传统意义上的编码蛋白质的基因编码蛋白质的基因,还包含一些非编码蛋白的基因非编码蛋白的基因,其终产物为RNA分子,如 tRNA、rRNA、snRNA 和 miRNA。非编码蛋白的基因在编码蛋白质基因表达过程中具有重要作用的作用。l在基因的上下游会有调控DNA序列,如启动子和终止子序列,控制着基因表达
3、。l基因的结构模式图为:启动子启动子-编码区编码区-终止子终止子 分子生物学研究的内容围绕着分子生物学研究的内容围绕着中心法则中心法则进行,进行,特别注意特别注意 RNA的重要作用和核心地位。的重要作用和核心地位。当前的中心法则当前的中心法则 基因载体基因载体-染色质结构染色质结构 DNA长度远远超过细胞核的直径,必需压缩折叠才能放入核中。压缩的层面有核核小体小体-螺线管螺线管-突突环环,最终形成染色质。大肠杆菌(大肠杆菌(E.coliE.coli)结构)结构E.coliE.coli染色体只含一个环状超螺旋分子,含量为染色体只含一个环状超螺旋分子,含量为4.64.6 Mb Mb,完全展开后总长
4、度,完全展开后总长度大约大约1.31.3 mm.mm.细菌染色体细菌染色体DNA双螺旋(双螺旋(2nm)核小体(核小体(11nm)螺线管(螺线管(30nm)突环突环(300nm)染色体(染色体(1400 nm)核小体及核小体核心颗粒核小体及核小体核心颗粒核小体:染色质在电子显微镜核小体:染色质在电子显微镜下观察时呈现为由下观察时呈现为由10nm的球的球状状 颗粒和颗粒和DNA纤维组成的念纤维组成的念珠状外观。这些球状颗粒称为珠状外观。这些球状颗粒称为核小体(核小体(nucleosome)。)。核小体核心由组蛋白核小体核心由组蛋白H2A,H2B,H3和和 H4各两个亚基组成各两个亚基组成的八聚体
5、,带正电荷,与带负的八聚体,带正电荷,与带负电荷的电荷的DNA通过离子键结合。通过离子键结合。核小体间的核小体间的DNA称为接头称为接头DNA(linker DNA)。核小体所缔合)。核小体所缔合的的DNA约为约为166bp(146+20),),由于连接由于连接DNA(约(约55 bp)易于)易于为核酸酶所作用。为核酸酶所作用。因此,当染色质以微球菌核因此,当染色质以微球菌核酸酶(酸酶(micrococcal nudease)等)等轻微处理后,染色质就产生一系轻微处理后,染色质就产生一系列依次相差列依次相差200 bp左右的长度不左右的长度不等的等的DNA片段。片段。30nm30nm纤丝纤丝
6、30nm30nm纤丝:核小体链呈螺旋形缠纤丝:核小体链呈螺旋形缠绕,并形成超微螺旋,称为绕,并形成超微螺旋,称为“螺线螺线管管”(solenoidsolenoid),即),即30 nm30 nm纤丝。纤丝。这种超微螺旋的直径约为这种超微螺旋的直径约为3Onm3Onm,内,内径径10nm10nm,螺距为,螺距为llnmllnm,为中空呈管,为中空呈管状结构。这种螺旋管的每一转由状结构。这种螺旋管的每一转由6 6个核小体组成,螺线管是染色体的个核小体组成,螺线管是染色体的二级结构。二级结构。突环结构突环结构螺线管的纤丝沿着它中央的蛋白质轴发射出大小不等的环,像灯刷染螺线管的纤丝沿着它中央的蛋白质轴
7、发射出大小不等的环,像灯刷染色体那样,这些观察证明,染色体是由一系列的环状的域(色体那样,这些观察证明,染色体是由一系列的环状的域(domaindomain)组成的。这种结构可以说是染色体的三级结构。组成的。这种结构可以说是染色体的三级结构。2.基因表达及其调控原核和真核细胞基因表达的区别 原核生物 真核生物 无细胞核 有细胞核 多顺反子(编码多种蛋白)单顺反子(一般编码一种蛋白)环状染色体 线性染色体 边转录边翻译 转录发生在细胞核,而翻译发生在细胞质 一般无内含子 一般有内含子l转录前水平:调控基因所在染色质的压缩程度,暴露出转录因子等结合位点,为基因转录创造条件。l转录水平:组成型表达,
8、诱导型表达,细胞依赖性表达。l输出核孔:mRNA分子结合蛋白质介导加工成熟的mRNA出核,错误加工的mRNA分子则留在核中,被降解实现再循环利用。l细胞质中mRNA的存量调控:取决于转录产出量和降解量。细胞质中mRNA的命运:有机会翻译蛋白质(细胞质核糖体,定位在内质网上的核糖体)、被降解(尤其错误加工的mRNA的分子),转移到其它细胞中翻译。l蛋白质翻译后水平:经过不同的折叠、化学修饰和剪接形成多种功能的蛋白质。是基因功能放大的一种有效措施。现代观念:边转录边加工(加帽、去内含子、加尾),一步形成成熟的现代观念:边转录边加工(加帽、去内含子、加尾),一步形成成熟的mRNA。DNA复制 -遗传
9、物质保持和传代 DNA复制是多种酶(拓扑异构酶、解旋酶、DNA聚合酶、引发酶、RNA酶、DNA连接酶)和辅助因子(增殖细胞核抗原PCNA,单链结合蛋白)协同作用以半保留半不连续的方式进行的。DNADNA的半不连续复制的半不连续复制3535OK!How?5353真真核核生生物物的的复复制制子子 真核生物的线形染色体是真核生物的线形染色体是由多复制子构成,每个复制子由多复制子构成,每个复制子都有自己的起点。一个典型的都有自己的起点。一个典型的哺乳动物细胞有哺乳动物细胞有50 00050 000100 100 000000个复制子,每个复制子长个复制子,每个复制子长约约4040200kbp200kb
10、p。在相邻复制叉。在相邻复制叉的复制泡相遇处,新生的复制泡相遇处,新生DNADNA融融合并形成复制完整的合并形成复制完整的DNADNA。郭爱娟郭爱娟 BCU参与参与DNADNA复制的有关物质复制的有关物质一、参与DNA复制的模板、底物和引物二、参与DNA复制的有关酶和蛋白酵母酵母DNADNA复制所需要的酶复制所需要的酶Enzymes(Proteins)Enzymes(Proteins)Functions FunctionsTopoisomerase Topoisomerase (拓扑异构酶拓扑异构酶)去除超螺旋结构去除超螺旋结构Helicase Helicase (解螺旋酶)解螺旋酶)变性双螺
11、旋变性双螺旋DNADNAReplication protein A(RP-A)Replication protein A(RP-A)单链结合单链结合Polymerase Polymerase /聚合酶:聚合酶:子链合成子链合成PCNA PCNA (增殖细胞核抗原)(增殖细胞核抗原)DNADNA聚合酶辅助蛋白聚合酶辅助蛋白PolPol/Primase Primase (引发酶复合体(引发酶复合体 )合成引物合成引物RNaseH/FEN-1RNaseH/FEN-1(MF-1MF-1)去除引物和寡聚脱氧核去除引物和寡聚脱氧核苷酸(苷酸(20-30nts20-30nts)Ligase Ligase (
12、连接酶)连接酶)连接冈崎片段连接冈崎片段 Schematic representation of the organization of eukaryotic DNA replication fork.(yeast)DNA复制过程中,随着复制叉的移动,核小体解聚,随后在新形成的子链中重新形成。DNA转录 -遗传信息流向RNA 转录单位包括启动子-转录区-终止子。转录因子识别启动子,招募RNA聚合酶以负链DNA为模板,按照A-U,G-C配对原则将游离的核苷酸按照5-3方向合成RNA分子的过程。原核生物转录原核生物转录l原核生物转录和翻译是偶联的,其mRNA为编码多种蛋白的多顺反子。原核生物 因子
13、协助RNA聚合酶识别启动子基本元件并由此起始转录,并在具有发卡结构的终止子处(或在因子协助下)结束转录l操纵子是原核生物转录调控的主要模式,其中最典型的代表为乳糖操纵子。调控蛋白(或阻遏蛋白)与操纵区结合阻止RNA聚合酶前进达到降低转录效率。转录单位转录单位Figure 8.2编码链/+链模板链/-链转录起始不需要引物。RNA聚合酶不具备识别启动子的能力,需要基本转录因子的协助。转录过程如下:起始-延伸-终止。启动子(启动子(promoterpromoter)是能启动转录的一段)是能启动转录的一段DNADNA片段。片段。常含有转录因子识别和结合的保守的和特异顺式元常含有转录因子识别和结合的保守
14、的和特异顺式元件(件(cis-elementscis-elements),用以控制基因的转录起始。),用以控制基因的转录起始。上游特异元件-TTGACA-TATAAT-CA/G T -35序列 -10序列 +1 特异转录因子结合元件 基本转录因子结合元件 转录起始位点 控制基因特异表达 招募RNA聚合酶组装转录起始复合物 (何时何地多少)原核生物转录调控模型原核生物转录调控模型(+)链()(-)链 Enzyme Movement解旋()复旋()覆盖约40bp,其中约17 bp解链区 延伸延伸l起始成功后,聚合起始成功后,聚合酶释放出酶释放出因子,因子,形成核心酶形成核心酶-DNA-新生新生RN
15、A链三元链三元(三聚)复合物。(三聚)复合物。随着转录泡的移动,随着转录泡的移动,不断地解螺旋和再不断地解螺旋和再螺旋(解螺旋区域螺旋(解螺旋区域的大小稳定地保持的大小稳定地保持在在17bp),),RNA链不断的延长。链不断的延长。Figure 8.16终止子终止子l终止序列的特点 1)发夹结构(减速)2)4个或更多的U残基 (脱离)Figure 8.6依赖依赖的转录终止的转录终止l不形成强的发夹结构,不形成强的发夹结构,必须一种辅助因子即必须一种辅助因子即蛋白来帮助转录终蛋白来帮助转录终止。六聚体蛋白,识止。六聚体蛋白,识别别72bp 序列(特异结序列(特异结构),依赖单链构),依赖单链RN
16、A水解水解ATP。依赖依赖的转录终止的转录终止Rho factor()-dependent termination操纵子与乳糖操纵子操纵子与乳糖操纵子1.1.提出:1961年,Jacob(雅格布)-Monod(莫诺).l2.操纵子:操纵子是基因表达和调控的单元,典型的操纵子包括:结构基因、调控元件和阻遏蛋白编码基因。l大肠杆菌K12中共有4136个基因,以操纵子结构存在的基因接近1/4(256 操纵子 控制879基因)操纵子结构操纵子结构l 结构基因:控制某一代谢途径关键酶的多顺反子。l调控元件:启动子 和操纵区(覆盖在启动子和编码区交叉区,是阻遏调节蛋白质的结合位点)。l调节基因:编码阻遏蛋
17、白质独立的基因。乳糖操纵子乳糖操纵子启动区PlaclacZlacAlaclOlaclacY调控元件结构基因-半乳糖苷透性酶分解乳糖半乳糖和葡萄糖运送乳糖透过细胞壁乙酰辅酶A 乙酰半乳糖-半乳糖苷酶-半乳糖苷转乙酰酶 乳糖转化异乳糖调节基因A YZ操纵区转录方向分解分解X-gal蓝色乳糖阻抑物乳糖阻抑物RNAlaclPlacI乳糖阻抑物单体乳糖阻抑物四聚体lacZlacYlacA透性酶-半乳糖苷酶转乙酰酶 PlaclacZlacAlaclOlaclacY含回文结构(-5/+21)PlaclacZlacAlaclOlaclacYPlaclacZlacAlaclOlaclacY异乳糖诱导物安慰诱导物
18、IPTGRNA聚合酶iRNARNA聚合酶lacZlacYlacA被激活的乳糖阻抑物四聚体乳 糖转化酶位置产物对-鹅膏蕈碱的敏感性RNA polRNA polRNA pol 真核细胞核基因的三种RNA聚合酶核仁pre-rRNA 28S 18S 5.8S不敏感核质pre-mRNA small RNAsnRNA U1,U2,U4,U5敏 感核质pre-tRNA5SRNASmall RNA高浓度敏感5cap 5非编码区 编码区 3非编码区 3poly(A)tail真核生物mRNA结构真核生物基本转录机器的组装II-F:与RNA pol 结合具有解旋复旋功能;II-H:具有磷酸化CTD的功能;TBP:T
19、ATA-BOX 结合蛋白质,识别启动子功能。特异转录因子通过中介蛋白复合体间接地与基本转录机器互作改变转录起始频率。染色质构象调控-转录前调控水平 表观遗传学 组蛋白乙酰化和脱乙酰化影响 染色质的紧密程度从而影响转录因子与启动子结合。胞嘧啶甲基化H3K27甲基化H3K4甲基化组蛋白H3化学修饰 转录后加工 -从单一基因扩大编码mRNA分子种类 一基多能l基因复制-转录后加工(可变剪接、可变启动子、可变加尾和RNA编辑)-多种mRNA分子-多种蛋白质 真核基因转录后加工过程不但是形成成熟mRNA的必要过程(加帽、内含子剪接和加尾),同时也是重要的调控步骤。这一步骤使得单一的前体mRNA通过可变剪
20、接、RNA编辑和可变加尾形成多种mRNA分子。此外,在同一个基因位点可以存在多个启动子和多个加尾位点,也可以驱动多种mRNA分子合成。综合这些加工手段(可变剪接、可变加尾、可变启动子和RNA编辑),最终从单一个基因产生多种mRNA分子,是遗传性信息扩大的重要手段。一基多能l基因复制-转录后加工(可变剪接、可变启动子、可变加尾和RNA编辑)-多种mRNA分子-多种蛋白质剪接基本元件(剪接位点和分支点)剪接基本元件(剪接位点和分支点)5.A A G U A A G U.CURAY.(10-40).(U/C)N C A G G3 外显子外显子 5剪切位点剪切位点内含子内含子 外显子外显子 3剪切位点
21、剪切位点分支点序列分支点序列嘧啶区嘧啶区内含子剪接:位于内含子和外显子中的剪接元件识别并招募剪接机器,通过两次转酯反应完成除去内含子连接外显子,并护送出细胞核参与蛋白翻译过程。mRNA剪接位点与剪接位点与SnRNA之间的相互识别之间的相互识别U1 snRNP结合在5端拼接点U2 snRNP结合在分支点需要SR蛋白正确引导U4/U6和U5 snRNP三聚体进入拼接体,U6结合U2 剪接过程-顺序组装,动态的流水席U1、U4被释放U6结合在5拼接点U6/U2催化转酯反应5位点断开,形成套索3位点断开,外显子拼接可变剪接方式外显子跳跃 潜在的3-剪接位点利用潜在的5-剪接位点利用内含子滞留内含子生物
22、学功能l通过选择性剪接扩大转录本/蛋白种类。l具有调控基因表达(增强或减弱)的功能。l控制基因表达的组织器官特异表达。l充当启动子,产生新的转录本。可变启动子l定义:选择不同的转录起始位点,可以获得具有不l同的5序列的转录本。l功能:#1 产生新的蛋白;#2 增加新的N序列;#3 引入具有复杂二级结构的5-UTR序列,减弱翻译。可变加尾可变加尾 mRNA翻译-mRNA遗传信息流向蛋白质 1#多种成分(氨基酸、核糖体、50种左右 t-RNA,mRNA和多种蛋白因子)参与蛋白质合成。2#遗传信息的正确传递涉及到:20种以上的氨酰t-RNA合成酶将氨基正确加载到tRNA)-tRNA反密码子-mRNA
23、密码子特异识别。3#核糖体按照起始、延伸和终止程序合成蛋白。真核生物和原核生物蛋白合成主要区别在起始阶段。4#蛋白合成过程中或合成后需要修饰和折叠等加工过程,而加工的信号储藏在特定的氨基酸顺序(如导肽、信号肽)。5#合成不正常或受损的蛋白主要通过泛素介导的蛋白酶复合体降解的途径,以实现氨基酸循环再利用。遗传密码遗传密码连续性:从起始密码子到终止密码子按3的倍数连续读码。简并性:密码子的第三位碱基具有多态性。基本通用性:病毒、原核细胞和真核细胞。如:果蝇、酵母、和高等植物植物线粒体利用UGA作为色氨酸密码子。哺乳动物线粒体用AGA/G作为终止密码子,而核DNA则为精氨酸的密码子。包含在mRNA三
24、联核苷酸序列,它决定蛋白质中氨基酸的种类和排列顺序。遗传密码(genetic code)遗传密码的突变遗传密码的突变 错义突变(错义突变(missense mutation)密码子发生突变导致蛋白质中原来的氨基酸被另一种密码子发生突变导致蛋白质中原来的氨基酸被另一种氨基酸取代。氨基酸取代。无义突变(无义突变(nonsense mutation)氨基酸的密码子变成终止密码子。分为琥珀型(氨基酸的密码子变成终止密码子。分为琥珀型(UAG)、)、赭石型(赭石型(UAA)和乳白型()和乳白型(UGA)三种。)三种。移码突变(移码突变(frame shift mutation)由于一个或多个非三整倍核苷
25、酸对的插入或缺失,导致该由于一个或多个非三整倍核苷酸对的插入或缺失,导致该位点后密码子阅读框架发生改变。位点后密码子阅读框架发生改变。密码子和反密码子是反向配对密码子和反密码子是反向配对D loopT C loopVariable loopAnticodon loop三环一臂的二级结构三环一臂的二级结构倒倒L三级结构三级结构D loopT loopVariable loop接受臂接受臂3 3 端端-CCAOH-CCAOH上氨基酸接受位点(上氨基酸接受位点(tRNAtRNA的荷载功能)的荷载功能)aa +tRNA氨酰氨酰-tRNAMg2+氨酰氨酰-tRNA合成酶合成酶AMP+PPiATP“第二遗
26、传密码第二遗传密码”-氨酰氨酰-tRNA合成酶对合成酶对tRNA和氨基酸的再和氨基酸的再识别识别 核糖体只识别tRNA,而不能识别其携带的氨基酸。因此还存在氨酰-tRNA合成酶将正确的氨基酸加载到对应tRNA分子上,即氨酰-tRNA合成酶对tRNA和氨基酸的再识别。核糖体核糖体有很多双螺旋区有很多双螺旋区三、核糖体的功能位点三、核糖体的功能位点 蛋白质合成过程蛋白质合成过程原核生物转录与翻译共线性原核生物转录与翻译共线性 翻译后加工 -从单一蛋白质扩大功能的方式(不同折叠、修饰、亚基组装-多种功能)翻译后的加工翻译后的加工Molten globule(溶球)(溶球)分子伴侣防止错误折叠分子伴侣
27、防止错误折叠Hsp70(70KD)Protein降解的生理意义降解的生理意义除去不正常(失去功能的、错误折叠、错误加工)的蛋白;除去不正常(失去功能的、错误折叠、错误加工)的蛋白;回收降解蛋白的氨基酸,回收降解蛋白的氨基酸,实现氨基酸的在循环利用。实现氨基酸的在循环利用。维持聚合蛋白亚基的比例,防止亚基过量积累;维持聚合蛋白亚基的比例,防止亚基过量积累;泛素分子结构泛素分子结构泛素泛素(Ubiquitin)76aaE1:ubiquitin-activating enzymeE2:ubiquitin-conjugating enzymeE3:ubiquitin-ligating enzyme 生
28、物组学生物组学l -分析细胞基因组DNA序列及其表达的所有mRNA和蛋白质种类及其相对数量的一门学科。它基于高通量(一次实验分析大量数据)的基因芯技术和2-D-MS技术(双向电泳偶联质谱),并借助生物信息学分析手段获得细胞整体基因表达模式。l基因组学:单倍体细胞中所有DNA序列,可以揭示基因数量、分布、物种进化、分子标记等重要信息。多采用SHOT GUN全基因组测序技术。l转录组学:细胞中所有mRNA种类及其相对数量,具有特定的细胞类型、发育阶段和外界条件依赖性。多采用表达谱芯片技术。l蛋白质组学:细胞中所有蛋白质种类及其相对数量,具有特定的细胞类型、发育阶段和外界条件依赖性。多采用双向电泳技术。l蛋白质组学:细胞中所有蛋白质种类及其相对数量,具有特定的细胞类型、发育阶段和外界条件依赖性。多采用双向电泳技术。