1、12绪绪 论论 分子生物学定义分子生物学定义 分子生物学发展简史分子生物学发展简史 分子生物学研究内容分子生物学研究内容 分子生物学与医学的关系分子生物学与医学的关系分子生物学分子生物学 第一章第一章3一、分子生物学定义一、分子生物学定义 从分子水平研究生物分子的结构与功能从而阐明从分子水平研究生物分子的结构与功能从而阐明生命现象本质和生命过程规律的一门交叉科学生命现象本质和生命过程规律的一门交叉科学;主要;主要研究遗传信息的传递(复制)、保持(损伤和修复)、研究遗传信息的传递(复制)、保持(损伤和修复)、基因的表达(转录和翻译)与调控。基因的表达(转录和翻译)与调控。4分子生物学的发展大致可
2、分为分子生物学的发展大致可分为三三个阶段:个阶段:准备和酝酿阶段准备和酝酿阶段 现代分子生物学的建立和发展阶段现代分子生物学的建立和发展阶段 1.初步认识生命本质并开始改造生命的深入发展初步认识生命本质并开始改造生命的深入发展阶段阶段二、分子生物学发展简史二、分子生物学发展简史51.准备和酝酿阶段准备和酝酿阶段 19世纪后期世纪后期-20世纪世纪50年代初。该阶段产生了两点对生命年代初。该阶段产生了两点对生命本质的认识上的重大突破:本质的认识上的重大突破:确定了蛋白质是生命活动的主要物质基础确定了蛋白质是生命活动的主要物质基础 19 世纪末世纪末 Buchner 兄弟证明酵母无细胞提取液能使糖
3、发酵产生兄弟证明酵母无细胞提取液能使糖发酵产生酒精,酒精,第第1次提出酶次提出酶(enzyme)的名称的名称,酶是生物催化剂。,酶是生物催化剂。20 世纪世纪 20-40 年代提纯和结晶了一些酶(包括尿素酶、胃蛋年代提纯和结晶了一些酶(包括尿素酶、胃蛋白酶、胰蛋白酶、黄酶、细胞色素白酶、胰蛋白酶、黄酶、细胞色素C、肌动蛋白等),、肌动蛋白等),证明酶的证明酶的本质是蛋白质。本质是蛋白质。6对蛋白质一级结构和空间结构的认识对蛋白质一级结构和空间结构的认识1902年年Emil Fisher证明蛋白质结构是多肽;证明蛋白质结构是多肽;1953年年Sanger和和Thompson完成了第一个多肽分完成
4、了第一个多肽分子子胰岛素胰岛素A链和链和B链的氨基全序列分析。链的氨基全序列分析。1950年年Pauling和和Corey提出了提出了-角蛋白的角蛋白的-螺旋结螺旋结构模型。构模型。7 1865年,孟德尔发表了他的年,孟德尔发表了他的植物杂交实验植物杂交实验一一文,首次阐述了生物界有规律的遗传现象文,首次阐述了生物界有规律的遗传现象-分离定分离定律和自由组合定律。律和自由组合定律。“遗传因子遗传因子”1900年,孟德尔遗传规律被证实,成为近代遗传年,孟德尔遗传规律被证实,成为近代遗传学基础。学基础。1910年,年,Morgan的染色体的染色体基因遗传理论基因遗传理论,Gene 存在于染色体上。
5、存在于染色体上。进一步将“性状”与“基因”相耦联,成为现代遗传学的奠基石。确定了生物遗传的物质基础是确定了生物遗传的物质基础是DNA8 1944年,美国微生物学家Avery证明肺炎球菌转化因子就是DNA分子,提出提出 DNA是遗是遗传信息的载体。传信息的载体。9 从从5050年代初到年代初到7070年代初,年代初,以以19531953年年WatsonWatson和和CrickCrick提提出的出的DNADNA双螺旋结构模型作双螺旋结构模型作为现代分子生物学诞生的里为现代分子生物学诞生的里程碑,程碑,开创了分子遗传学基开创了分子遗传学基本理论建立和发展的黄金时本理论建立和发展的黄金时代。代。2.
6、2.现代分子生物学的建立和现代分子生物学的建立和发展阶段发展阶段10(1)遗传信息传递中心法则的建立)遗传信息传递中心法则的建立1953年年Watson和和Crick提出提出DNA复制的模型;复制的模型;逐渐完善了对逐渐完善了对DNA复制机理的认识复制机理的认识1954年年Crick提出遗传信息传递的规律提出遗传信息传递的规律中心法则;中心法则;1970年年Crick提出了完整的中心法则。提出了完整的中心法则。实线箭头的转移普遍地存在于所有生物细胞中。虚线箭头是特殊情况下的遗传信息转移。朊病毒?朊病毒?11 中心法则合理地说明了在细胞的生命活动中心法则合理地说明了在细胞的生命活动中两类大分子的
7、联系和分工:中两类大分子的联系和分工:核酸核酸的功能是储存和转移遗传信息,指导的功能是储存和转移遗传信息,指导和控制蛋白质的合成。和控制蛋白质的合成。蛋白质蛋白质的主要功能是进行新陈代谢活动和的主要功能是进行新陈代谢活动和作为细胞结构的组成成分。作为细胞结构的组成成分。122 对蛋白质结构和功能的进一步认识对蛋白质结构和功能的进一步认识 1956-1958 年 Anfinsen 和 White根据对酶蛋白的变性和复性实验,提出蛋白质的三维空间结构是由其氨基酸序列来确定的。1958 年 Ingram 证明正常的血红蛋白与镰刀状红细胞贫血病人的血红蛋白之间,肽链上仅有一个氨基酸残基的差别,使人们对
8、蛋白质的一级结构影响功能有了深刻的印象。对蛋白质研究的方法手段也有很大改进。1969 年 Weber 应用 SDS-PAGE 测定蛋白质分子量;1973 年氨基酸自动测序仪问世。中国科学家在 1973 年通过 1.8A X 线衍射,分析测定了牛胰岛素的空间结构。133.3.认识生命本质并改造生命的发展阶段认识生命本质并改造生命的发展阶段 7070年代后,以基因工程技术的出现作为新年代后,以基因工程技术的出现作为新的里程碑,标志着人类深入认识生命本质的里程碑,标志着人类深入认识生命本质并能动改造生命的新时期开始。其间的重并能动改造生命的新时期开始。其间的重大成就包括:大成就包括:14(1)重组重
9、组DNA技术的建立和发展技术的建立和发展1967-1970年R.Yuan和H.O.Smith等发现的限制性核酸内切酶为基因工程提供了有力的工具;第一个实现第一个实现DNA重组的人重组的人Berg 1972年斯坦福大学的Paul Berg 小组首次完成了体外重组实验:用E.coR 切割SV40 DNA和噬菌体DNA,经过连接组成重组的DNA分子。(1980年诺贝尔化学奖)Paul BergSV40l噬菌体15 1973年,美国斯坦福大学的Cohen 组将E.coli的tetr质粒psclol和neorsr Rb-3质粒体外限制酶切割,连接成一个新的质粒,转化E.coli,在含有四环素和新霉素的平
10、板上筛选出了tetrner,实现了细菌遗传性状的转移。这是基因工程史上的第一个克隆化并取得成功的例子,由此宣告了基因工程的诞生,这一年由此宣告了基因工程的诞生,这一年被定为基因工程诞生的元年。被定为基因工程诞生的元年。第一个取得基因工程成功的人第一个取得基因工程成功的人Cohen Cohen16(2)基因组研究的发展基因组研究的发展 目前分子生物学已经从研究单个基因发展到研目前分子生物学已经从研究单个基因发展到研究生物基因组的结构与功能。究生物基因组的结构与功能。1977年年Sanger测定了测定了X174-DNA全部全部5375个核个核苷酸的序列;苷酸的序列;1978年年Fiers等测出等测
11、出SV-40DNA全部全部5224bp序列;序列;80年代年代噬菌体噬菌体DNA全部全部48,502bp的序列全部测的序列全部测出;出;一些小的病毒包括乙型肝炎病毒、艾滋病毒等一些小的病毒包括乙型肝炎病毒、艾滋病毒等基因组的全序列也陆续被测定;基因组的全序列也陆续被测定;17三、分子生物学的主要研究内容三、分子生物学的主要研究内容1.1.核酸的分子生物学核酸的分子生物学 研究核酸的结构及其功能,研究核酸的结构及其功能,包括核酸包括核酸/基因组基因组的结构、遗传信息的复制、转录与翻译,核酸的结构、遗传信息的复制、转录与翻译,核酸存储的信息修复与突变,基因表达调控和基因存储的信息修复与突变,基因表
12、达调控和基因工程技术的发展和应用等。工程技术的发展和应用等。遗传信息传递的中遗传信息传递的中心法则是其理论体系的核心心法则是其理论体系的核心。182.蛋白质的分子生物学蛋白质的分子生物学 研究蛋白质的结构与功能。研究蛋白质的结构与功能。蛋白质的研究比早,但难度较蛋白质的研究比早,但难度较大,发展较慢。近年来在蛋白质大,发展较慢。近年来在蛋白质的结构及其与功能关系方面取得的结构及其与功能关系方面取得了一些进展,但是对其基本规律了一些进展,但是对其基本规律的认识尚缺乏突破性的进展。的认识尚缺乏突破性的进展。193.细胞信号转导的分子生物学细胞信号转导的分子生物学 研究细胞内、细胞间信息研究细胞内、
13、细胞间信息传递的分子基础。传递的分子基础。生物体的细胞分裂与分化及其它各种功能的完生物体的细胞分裂与分化及其它各种功能的完成,均依赖于环境所赋予的各种信号。成,均依赖于环境所赋予的各种信号。在外源信号的刺激下,细胞将信号转变为一系在外源信号的刺激下,细胞将信号转变为一系列的生物化学变化,例如蛋白质构象的转变、蛋列的生物化学变化,例如蛋白质构象的转变、蛋白质分子的磷酸化以及蛋白与蛋白互作的变化等,白质分子的磷酸化以及蛋白与蛋白互作的变化等,从而使其发生改变以适应内外环境的需要。从而使其发生改变以适应内外环境的需要。20四、四、分子生物学与医学的关系分子生物学与医学的关系 由于分子生物学涉及认识生
14、命的本质,它也就自然而然地渗透到医学各学科领域中,成为现代医学的重要基础。在医学各学科中,包括生理学、微生物学、免疫学、病理学、药理学以及临床各学科,分子生物学都正在广泛地形成交叉和渗透,形成了一些交叉学科,如分子免疫学、分子病理学、分子病毒学和分子药理学,大大促进了医学的发展。分子生物学在医学各个领域中的渗透使医学进入分子水平。分子生物学的发展终将解决诸多的重大医学问题,如人脑的机能、生育控制、肿瘤防治、器官移植、免疫调节、新药开发等。因此,可以说分子生物学将可以说分子生物学将是未来医学的核心内容是未来医学的核心内容。21基因、基因组和基因组学基因、基因组和基因组学分子生物学分子生物学 第二
15、章第二章22主要内容主要内容 第一节第一节 基因的结构和功能基因的结构和功能 第二节第二节 病毒基因组的结构和功能病毒基因组的结构和功能 第三节第三节 原核生物基因组的结构和功能原核生物基因组的结构和功能 第四节第四节 真核生物基因组的结构和功能真核生物基因组的结构和功能 第五节第五节 基因组学基因组学23遗传学角度:遗传学角度:基因(gene):是指携带有遗传信息的DNA或RNA序列,也称为遗传因子。分子生物学角度:分子生物学角度:基因(gene):是合成有功能的蛋白质或RNA所必需的全部DNA,包括编码蛋白质或RNA的核酸序列及为保证转录所必需的调控序列。第一节第一节 基因的结构和功能基因
16、的结构和功能24(1)具有转录和翻译功能,编码蛋白质的基)具有转录和翻译功能,编码蛋白质的基因。包括结构基因和调节基因;因。包括结构基因和调节基因;基因的分类基因的分类基因按其功能可分为:基因按其功能可分为:结构基因结构基因 可被转录成mRNA,并可翻译成多肽,构成结构蛋白或催化各种生化反应的酶。调节基因调节基因 指某些可调节、控制结构基因表达的基因。25(2)只有转录功能而没有翻译功能的基因,包)只有转录功能而没有翻译功能的基因,包括括tRNA基因和基因和rRNA基因基因。(3)不转录的基因,它对基因表达起调节控制)不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因作用,包括启
17、动基因和操纵基因。26基因的结构基因的结构真核生物真核生物编码区编码区:能够编码产生蛋白质的序列,包括外显子与内含子。前导区:前导区:位于编码区上游,相当于mRNA5端非编码区。调节区:调节区:包括启动子和增强子等基因编码区的两侧,也称为侧翼序列。27断裂基因(断裂基因(splite gene)真核生物结构基因真核生物结构基因,由若干个编码区和非编码区互相,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质,这些基因可翻译出由连续氨基酸组成的完整蛋白质,这些基因称为断裂基因称为断裂基因 编
18、码序列称外显子编码序列称外显子(exon),非编码序列称内含子,非编码序列称内含子(intron)。1977年发现断裂基年发现断裂基因,因,1993年获诺贝年获诺贝尔奖尔奖28断裂基因断裂基因29基因大小基因大小 低等生物的基因较小,高等生物基因较大低等生物的基因较小,高等生物基因较大 基因的大小主要取决于内含子的有无、大小及数量基因的大小主要取决于内含子的有无、大小及数量 病毒与原核生物(古细菌除外)基因病毒与原核生物(古细菌除外)基因没有内含子没有内含子,不是,不是断裂基因(断裂基因(split gene)低等真核生物(如酵母和真菌)大多数基因低等真核生物(如酵母和真菌)大多数基因没有内含
19、子没有内含子,因此其基因较小,一般不超过因此其基因较小,一般不超过5kb 高等真核生物基因高等真核生物基因普遍含有内含子普遍含有内含子,内含子通常比外显,内含子通常比外显子(子(exon)大很多,使基因比其)大很多,使基因比其mRNA分子大很多分子大很多 30 基因携带遗传信息基因携带遗传信息 基因控制生物体的性状基因控制生物体的性状 (1)控制酶的合成;)控制酶的合成;(2)控制结构蛋白的成分)控制结构蛋白的成分 遗传信息的表达过程是一个基因所携带的信息转变为一遗传信息的表达过程是一个基因所携带的信息转变为一种具有正常功能产物(蛋白质、多肽、种具有正常功能产物(蛋白质、多肽、RNA)的过程。
20、)的过程。(严格的时间和空间特异性严格的时间和空间特异性)基因功能基因功能31基因组(基因组(genome):):是指一个物种的单倍体的染色体所携是指一个物种的单倍体的染色体所携带的全部遗传信息。带的全部遗传信息。原核生物(原核生物(prokaryote)和真核生物()和真核生物(eukaryote)的)的基因基因组组都是都是DNA 病毒病毒基因组基因组有的是有的是DNA,有的是,有的是RNA 基因组(原核生物和真核生物)基因组(原核生物和真核生物)第二节第二节 基因组的结构和功能基因组的结构和功能 染色体基因组(染色体基因组(chromosomal genome)染色体外基因组(染色体外基因
21、组(extrachromosomal genome)如:细菌的如:细菌的质粒质粒(plasmid)DNA 真核生物的真核生物的线粒体线粒体(mitochondria)DNA 叶绿体叶绿体(chloroplast)DNA 32C值(值(C value):):一种生物体单倍体基因组的一种生物体单倍体基因组的DNA含量总是恒定的,它通常称为该物种含量总是恒定的,它通常称为该物种DNA的的C值值。不同物种的不同物种的C值差异很大,如最小的支原体只有值差异很大,如最小的支原体只有104bp,而最大的某些显花植物和两栖动物可达,而最大的某些显花植物和两栖动物可达1011bp。基因组的大小基因组的大小33不
22、同生物种类基因组不同生物种类基因组DNA的的C值分布图值分布图34主要表现主要表现:1.C值不随生物的进化程度和复杂性而增加,如肺鱼的C值为112.2109bp,而人的是3.2109bp;2.亲缘关系密切的生物C值相差甚大,如两栖动物,C值小的可以低至109bp以下,C值大的可以高至几乎1011bp;3.高等真核生物具有比用于遗传高得多的C值,如人的染色体组DNA含量在理论上包含300万个基因,但实际有用途的基因只有2-3万左右。C值矛盾:值矛盾:生物体的进化程度与基因组大小之间不完全生物体的进化程度与基因组大小之间不完全成比例的现象(又称:成比例的现象(又称:C值悖论,值悖论,C value
23、 paradox)35必需基因必需基因:指关系到生物体存活的基因,可通过基因突变的指关系到生物体存活的基因,可通过基因突变的方法确定致死位点的数量,以得知基因组必需基因的数量方法确定致死位点的数量,以得知基因组必需基因的数量 有相当一部分基因对生物体的存活没有影响。原因之一可有相当一部分基因对生物体的存活没有影响。原因之一可能是冗余(也即多拷贝)基因的存在能是冗余(也即多拷贝)基因的存在 基因组中是否存在非必需基因,其比例是多少等有待研究基因组中是否存在非必需基因,其比例是多少等有待研究 基因总数与必需基因基因总数与必需基因生物体的复杂程度与基因组中基因数目成正生物体的复杂程度与基因组中基因数
24、目成正相关(不完全成比例)相关(不完全成比例)36(1)病毒基因组的核酸类型)病毒基因组的核酸类型 病毒基因组有病毒基因组有4种不同类型种不同类型 双链双链DNA(乳头瘤病毒)(乳头瘤病毒)单链单链DNA(X174)双链双链RNA(轮状病毒)(轮状病毒)单链单链RNA(流感病毒)(流感病毒)对于单链对于单链DNA或或RNA病毒而言,如果基因组序列与病毒而言,如果基因组序列与mRNA相同,称为正链相同,称为正链DNA(+DNA)或正链)或正链RNA(+RNA)病毒,如果与)病毒,如果与mRNA互补,则称为负链互补,则称为负链DNA(-DNA)或负链)或负链RNA(-RNA)病毒)病毒一、病毒基因
25、组的结构和功能一、病毒基因组的结构和功能37(2)病毒基因组的大小及碱基组成)病毒基因组的大小及碱基组成 病毒基因组大小在不同病毒有较大差异,变化范围在病毒基因组大小在不同病毒有较大差异,变化范围在1.5103bp(核(核苷酸,苷酸,nucleotide,nt)3.6106bp(nt)之间)之间 乙肝病毒乙肝病毒DNA:3kb,信息量较小,编码,信息量较小,编码4种蛋白质种蛋白质 痘病毒的基因组:痘病毒的基因组:300kb,编码几百种蛋白质(病毒复制所涉及,编码几百种蛋白质(病毒复制所涉及 的酶类编码,核苷酸代谢的酶类)的酶类编码,核苷酸代谢的酶类)病毒基因组大小与病毒对宿主的依赖性有关病毒基
26、因组大小与病毒对宿主的依赖性有关不同病毒核酸的碱基组成相差很大不同病毒核酸的碱基组成相差很大 疱疹病毒属,疱疹病毒属,G+C含量高达含量高达75%痘病毒属痘病毒属G+C含量却低至含量却低至26%38(3)RNA病毒基因组编码序列具有节段性病毒基因组编码序列具有节段性 多数多数RNA病毒的基因组是由连续的病毒的基因组是由连续的RNA链组链组成;但有些病毒的基因组成;但有些病毒的基因组RNA由不连续的几条核酸由不连续的几条核酸链组成;链组成;如:如:流感病毒流感病毒由由8条条RNA分子构成,每条分子构成,每条RNA分子分子都含有编码蛋白质分子的信息;都含有编码蛋白质分子的信息;轮状病毒轮状病毒由由
27、10个节个节段性的线性双链段性的线性双链RNA分子构成,每段分子构成,每段RNA分子都分子都编码一种蛋白质。编码一种蛋白质。有分段基因组的病毒一般感染效率较低;容易重组,有分段基因组的病毒一般感染效率较低;容易重组,发生变异。发生变异。39 所谓重叠基因(overlapping gene)是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列成为两个或两个以上基因的组成部分。某些原核生物、病毒或噬菌体(4)病毒基因存在基因重叠;)病毒基因存在基因重叠;40基因重叠基因重叠 1977年,年,Sanger 在研究在研究X174时发现时发现X174是一种单链是一种单链DNA病毒,病毒,感染
28、大肠杆菌后共合成总分子量感染大肠杆菌后共合成总分子量为为25万左右蛋白质分子,相当于万左右蛋白质分子,相当于6078个核苷酸所容纳的信息量个核苷酸所容纳的信息量X174 DNA本身只有本身只有5386个核个核苷酸,最多能编码总分子量为苷酸,最多能编码总分子量为20万的蛋白质分子万的蛋白质分子41基因重叠基因重叠 基因重叠有以下几种情况:基因重叠有以下几种情况:(1 1)完全重叠)完全重叠 (2 2)部分重叠)部分重叠 (3 3)两个基因只有一个碱基重叠)两个基因只有一个碱基重叠 一个基因终止密码子的最后一个碱基是另一个一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基基因起始密
29、码子的第一个碱基42(5)病毒基因组的大部分序列可编码蛋白质,只有非常小的)病毒基因组的大部分序列可编码蛋白质,只有非常小的一部份不编码蛋白质;一部份不编码蛋白质;(6)病毒基因组的转录单元是多顺反子;)病毒基因组的转录单元是多顺反子;DNA序列中功能相关的蛋白质的基因丛集在基因组的一个序列中功能相关的蛋白质的基因丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元,它们或几个特定的部位,形成一个功能单位或转录单元,它们可被一起转录成含有多个可被一起转录成含有多个mRNA的分子,称为多顺反子的分子,称为多顺反子mRNA。43(7)病毒基因组都是单倍体(逆转录病毒除外)病毒基因组都是单
30、倍体(逆转录病毒除外)(8)噬菌体(细菌病毒)的基因是连续的,而真核)噬菌体(细菌病毒)的基因是连续的,而真核细胞病毒的基因是不连续的细胞病毒的基因是不连续的44病毒基因组的结构与功能特征 病毒基因组基因组很小,且大小相差较大。病毒基因组可以由DNA组成,或由RNA组成。多数RNA病毒的基因组是由连续的RNA链组成;基因重叠。基因组的大部分可编码蛋白质,只有非常小的一部份不编码蛋白质。形成多顺反子结构(polycistronie)。病毒基因组都是单倍体(逆转录病毒除外)。噬菌体(细菌病毒)的基因是连续的,而少数真核细胞病毒的基因是不连续的。452.2.2原核生物基因组的结构和功能 原核生物基因
31、组通常比较简单,其基因组大小在原核生物基因组通常比较简单,其基因组大小在106bp107bp之间,所包含的基因数目几百个到数千之间,所包含的基因数目几百个到数千个之间。个之间。类核(类核(nucleoid):):是指原核生物基因组通常由一条环状的是指原核生物基因组通常由一条环状的双链双链DNADNA分子组成,在细胞中与蛋白质结合成染色体的形式,分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域。在细胞内形成一个致密的区域。46图 大肠杆菌的类核结构模型47 基因组较小(基因组较小(106bp107bp)功能上相关的几个结构基因串联在一起组成操功能上相关的几个结构基因串联在
32、一起组成操纵子纵子(operon)结构。结构。结构基因均为单拷贝基因(除结构基因均为单拷贝基因(除18s、28s、5s rRNA及及tRNA基因外)基因外)(1)原核生物基因组的一般特点)原核生物基因组的一般特点48 不编码的不编码的DNA序列约占全基因组的序列约占全基因组的10%以内(比以内(比真核生物少得多):基因组中几乎没有重复序列,真核生物少得多):基因组中几乎没有重复序列,基因间几乎没有间隔,基因内没有内含子(古细基因间几乎没有间隔,基因内没有内含子(古细菌除外)。菌除外)。不编码部分通常包含调控基因表达的序列不编码部分通常包含调控基因表达的序列 DNA分子中有各种功能区,如复制起始
33、区分子中有各种功能区,如复制起始区OriC,复制终止区复制终止区TerC,转录起始区和终止区等,这些,转录起始区和终止区等,这些区域往往有反向重复序列,能形成特殊的结构区域往往有反向重复序列,能形成特殊的结构49有色部分代表编码序列有色部分代表编码序列外环为外环为顺时针转录顺时针转录的编的编码序列码序列内环为内环为逆时针转录逆时针转录的编的编码序列码序列 化脓性链球菌基因组化脓性链球菌基因组 50大肠杆菌大肠杆菌染色体基因组染色体基因组的结构和功能的结构和功能大肠杆菌染色体基因组是研究最清楚的基因组。结构特点:(1)仅有一条环状双链DNA分子组成,总共具有4288个基因,平均编码长度950bp
34、,且这些结构基因没有内含子。(2)几乎所有的基因都是单拷贝基因;(3)和病毒的基因相似,不编码的DNA部分所占比例比真核细胞基因组少得多。(4)基因组种编码顺序一般不会重叠,即不会出现基因重叠现象。51(5 5)具有操纵子结构)具有操纵子结构,其中的结构基因为多顺反子,即数个功能相关的结构基因串联在一起,受同一个调节区的调节。Cregulatory regionInhibitor geneGene ZGene Y Gene Astructural genes regionOp35i gene region1000bp100bp3520bp760bp810bpbase pair:peptide:
35、(MW kDa)37repressor(4 polymer)3230135-galactosidase(4 polymer)lactosecellgalactose+acetyl CoAacetylgalactose+glucosegalactoselactose-galactoside transacetylase(2 polymer)lactose permease(2 polymer)52(6)DNA分子中重复序列很少,但是在大肠杆菌基因组的不分子中重复序列很少,但是在大肠杆菌基因组的不同部位可以称为转座子的同部位可以称为转座子的50kb的重复片段。的重复片段。转座子:转座子:能在基因组
36、中从一个位点移至另一位点的能在基因组中从一个位点移至另一位点的DNA序序列称为转座因子(列称为转座因子(transposable element),又称为可转座),又称为可转座元件元件 原核生物转座因子的种类及结构功能特征:原核生物转座因子的种类及结构功能特征:根据分子结构及转座特点,原核生物的转座因子可分为根据分子结构及转座特点,原核生物的转座因子可分为 插入序列(插入序列(insertion sequence,IS)复合型转座子复合型转座子53 插入序列插入序列(insertion sequence,IS):2 000bp以内,两端正以内,两端正向重复序列(向重复序列(direct rep
37、eats,DR)、反向重复序列)、反向重复序列(inverted repeats,IR),中间),中间1kb左右的编码序列,仅编左右的编码序列,仅编码和转座有关的转座酶。码和转座有关的转座酶。复合型转座子复合型转座子(composite transposon):2 00020 000bp之间,两端由一对之间,两端由一对IS元件组成,带有与转座作用有关的基元件组成,带有与转座作用有关的基因和其他基因。因和其他基因。图 Tn的基本结构 54大肠杆菌染色体外基因组的结构和功能大肠杆菌染色体外基因组的结构和功能 大肠杆菌质粒是双链环状结构的大肠杆菌质粒是双链环状结构的DNA分子。分子。可以有共价闭合环
38、状可以有共价闭合环状DNADNA、缺口的环状、缺口的环状、DNADNA线性线性DNA DNA 三种结构状态。三种结构状态。质粒(质粒(plasmid):):是指一类染色体外具有自主复制能力的是指一类染色体外具有自主复制能力的环状双链环状双链DNADNA分子,属染色体外基因组。分子,属染色体外基因组。没有游离的末端,每条链上的核苷酸通过共价键彼此头尾相连,这种 结构称为共价闭环DNA(covalently closed circular DNA,cccDNA),常形成超螺旋结构。如果双链中一条链产生一个缺口,则形成带缺口的开环DNA;如果两条链都产生缺口则成为线状DNA分子;琼脂糖凝胶电泳时泳动
39、速度依次为:共价闭环DNA线状DNA开环DNA55质粒质粒(plasmid)特点:特点:能在宿主细胞内独立自主复制;带有某些遗传信能在宿主细胞内独立自主复制;带有某些遗传信息息,会赋予宿主细胞一些遗传性状。会赋予宿主细胞一些遗传性状。56质粒的功能质粒的功能(细菌质粒控制的性状)(细菌质粒控制的性状)质粒对宿主细胞的生存一般不是必需的,但质粒带有某些质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些新的遗传性状,某些情况下有利于细胞的生长。一些新的遗传性状,某些情况下有利于细胞的生长。57抗
40、性抗性抗生素抗性氨基糖甙类、-内酰胺类、大环内酯类及磺胺类等重金属抗性 汞离子及有机汞制剂、镍、钴、银、铬、铅、锑及铋等阳离子抗性砷酸盐、亚砷酸盐、铬酸盐及硼酸盐等其它抗性紫外线,X射线,细菌素,质粒控制的修饰系统等代谢能力代谢能力简单糖类的代谢乳糖、蔗糖及绵籽糖等卤化物的代谢2,4-二氯甲苯复杂碳化合物的代谢甲苯、萘、樟脑、苯胺、烟碱及烷烃等蛋白质代谢 明胶及酪蛋白等其他代谢 色素生成,产硫化氢,胞外DNA酶等致病性致病性侵袭力菌毛、夹膜、黏附因子及血浆凝固酶等毒素大肠杆菌肠毒素、破伤风杆菌神经毒素、炭疽杆菌外毒素及鼠疫菌素等结合转移结合转移性伞毛的合成,表面排斥,致育性抑制,对信息素的反应
41、和抑制等表2-2 细菌质粒所控制的一些性状58质粒的复制质粒的复制 质粒能自主复制,是能独立复制的复制质粒能自主复制,是能独立复制的复制子(子(autonomous replicon)。)。严紧控制(严紧控制(stringent control)型质粒:)型质粒:其复制其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。个到十几个拷贝。松弛控制(松弛控制(relaxed control)型质粒:)型质粒:其复制与其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。宿主不偶联,每个细胞中有几十到几百个拷贝。59质粒的稳定性与不相容性质
42、粒的稳定性与不相容性质粒的稳定性:质粒的稳定性:质粒在宿主细胞内稳定地存在而不丢失称为质粒地稳定性。影响质粒稳定性的因素有两种:(1)宿主细胞分裂时质粒能否均衡地分配到子代细胞;(2)质粒分子自身结构的稳定性。质粒的不相容性:质粒的不相容性:两种不同的质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失的现象。携带不同复制和维持机制的质粒则属于不同的不相容群,它们可以共存于同一细胞中。60原核生物基因组的一般特点原核生物基因组的一般特点 基因组较小(106bp107bp)。操纵子结构是原核生物基因组的功能单位。结构基
43、因均为单拷贝基因(除18s、28s、5s rRNA及tRNA基因外)。不编码的DNA序列约占全基因组的10%以内(比真核生物少得多):基因组中几乎没有重复序列,基因间几乎没有间隔,基因内没有内含子(古细菌除外)。不编码部分通常包含调控基因表达的序列DNA分子中有各种功能区,如复制起始区OriC,复制终止区TerC,转录起始区和终止区等,这些区域往往有反向重复序列,能形成特殊的结构。61真核生物的遗传物质绝大部分存在于细胞核染色体,少部分真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中,因此真核生物基因组可分为存在于线粒体或叶绿体中,因此真核生物基因组可分为细胞细胞核基
44、因组核基因组和和细胞器(质)基因组细胞器(质)基因组。细胞核基因组:不同细胞核基因组:不同物种之间,大小相差物种之间,大小相差悬殊(悬殊(1071012bp)三、真核生物基因组的结构与功能特点三、真核生物基因组的结构与功能特点 线粒体线粒体 叶绿体叶绿体62(一)细胞核染色体基因组(一)细胞核染色体基因组 1.细胞核基因组由染色体细胞核基因组由染色体DNA组成组成 DNA以线形分子的形式存在于染色体中以线形分子的形式存在于染色体中6364真核生物染色体基因组特点真核生物染色体基因组特点 真核生物基因组存在大量的重复序列真核生物基因组存在大量的重复序列;真核基因组的另一特点是存在多基因家真核基因
45、组的另一特点是存在多基因家族与假基因族与假基因。65 真核生物的染色体基因组一般比较庞大,例如人真核生物的染色体基因组一般比较庞大,例如人的单倍体基因组由的单倍体基因组由3109bp碱基组成,按组成,按1000个个碱基编码一种蛋白质计算,理论上可有碱基编码一种蛋白质计算,理论上可有300万个基基因。但实际上,人类基因组中仅含有因。但实际上,人类基因组中仅含有2500030000个个基因。基因。这些与表达无关的这些与表达无关的DNA大部分是基因间隔区序列,大部分是基因间隔区序列,基因间隔区序列主要由基因间隔区序列主要由重复重复DNA构成。构成。只有只有很少一部份很少一部份(约占(约占2-3)的)
46、的DNA序列用以序列用以编码蛋白质和结构编码蛋白质和结构RNA。66真核生物基因组存在大量的重复序列真核生物基因组存在大量的重复序列 单拷贝序列单拷贝序列 中度重复序列中度重复序列 高度重复序列高度重复序列67单拷贝序列(低度重复序列)单拷贝序列(低度重复序列)在单倍体基因组中,在单倍体基因组中,单拷贝序列只有一个或几单拷贝序列只有一个或几个拷贝,个拷贝,占占DNA总量的总量的40-80:果蝇中占果蝇中占79,小鼠中占,小鼠中占70。结构基因基本上属于单拷贝序列结构基因基本上属于单拷贝序列,储存的巨大,储存的巨大遗传信息,用来编码各种不同功能的蛋白质,遗传信息,用来编码各种不同功能的蛋白质,体
47、现了生物的各种功能。体现了生物的各种功能。68中度重复序列中度重复序列 中度重复序列在真核基因组中重复次数为中度重复序列在真核基因组中重复次数为10105,占,占DNA总量的总量的10-40:果蝇中占果蝇中占1515,小鼠中占,小鼠中占2020。编码编码rRNA、tRNA、组蛋白以及免疫球蛋白的、组蛋白以及免疫球蛋白的结构基因等都属于这一类,另有部分可能与基结构基因等都属于这一类,另有部分可能与基因的调控有关。因的调控有关。69Alu家族 Alu家族是灵长类基因组特有的含量丰富的中度重家族是灵长类基因组特有的含量丰富的中度重复序列,是散在重复序列中最大的一个家族,因复序列,是散在重复序列中最大
48、的一个家族,因序列内部有限制性内切酶序列内部有限制性内切酶AluI的酶切位点而得名。的酶切位点而得名。Alu序列每个成员的长度约序列每个成员的长度约300bp,由两个,由两个130bp的正向重的正向重复序列组成,二者之间有复序列组成,二者之间有31bp的间隔序列,的间隔序列,Alu序列的重序列的重复次数为复次数为30-50万次。万次。70rRNA基因基因 rRNA基因通常集中成簇存在,而不是分散于基因通常集中成簇存在,而不是分散于基基因组因组中,这样的区域称为中,这样的区域称为rDNA,如染色体的核,如染色体的核仁组织区(仁组织区(nucleolus organizer region)即为)即
49、为rDNA区。区。图 非洲爪蟾的rRNA基因结构71高度重复序列高度重复序列 高度重复序列在真核基因组中重复次数可高达百万高度重复序列在真核基因组中重复次数可高达百万(106)以上,在基因组中所占比例随种属而异,约占以上,在基因组中所占比例随种属而异,约占DNA总总量量10-60,可以集中串联排列在某一区域。,可以集中串联排列在某一区域。典型的高度重复序列典型的高度重复序列DNA有有反向重复序列反向重复序列(inverted repeats)和和卫星卫星DNA(satellite DNA)。反向重复序列反向重复序列:是指两个相同顺序的互补拷贝在同一是指两个相同顺序的互补拷贝在同一DNA链上的反
50、向排列。链上的反向排列。卫星卫星DNA 是另一类高度重复序列,这类重复序列的重复单是另一类高度重复序列,这类重复序列的重复单位一般由位一般由2-10bp组成,成串排列。组成,成串排列。72图 反向重复序列发夹式结构反向重复序列反向重复序列:两个相同顺序的互补拷贝在同一两个相同顺序的互补拷贝在同一DNA链上链上的反向排列。的反向排列。73重复序列的多态性重复序列的多态性 DNA多态性是指多态性是指DNA序列发生变异从而导致的个体间核序列发生变异从而导致的个体间核苷酸序列的差异,主要包括:苷酸序列的差异,主要包括:单核苷酸多态性(单核苷酸多态性(single nucleotide polymorp