1、分子生物学基本原理分子生物学基本原理第一篇第一篇第一章第一章 基基 因因第一节第一节基因的基本概念基因的基本概念及基因的结构特点及基因的结构特点一、核酸是遗传信息的载体一、核酸是遗传信息的载体 DNA的结构:的结构:一级结构一级结构二级结构二级结构三级结构三级结构 DNA上主要携带两类遗传信息:上主要携带两类遗传信息:一类是编码信息一类是编码信息 另一类是调控信息另一类是调控信息 真核细胞的真核细胞的DNA中存在着大量的非编码序列中存在着大量的非编码序列 RNARNA RNA分为三类:分为三类:mRNA;rRNA;tRNA。基因基因(gene):(gene):是核酸分子中贮存遗传信息的遗传单位
2、,是指是核酸分子中贮存遗传信息的遗传单位,是指贮存有功能的蛋白质多肽链或贮存有功能的蛋白质多肽链或RNARNA序列信息及表达这序列信息及表达这些信息所必须的全部核酸序列。些信息所必须的全部核酸序列。按照此说,基因即包括编码序列,也包括它的调按照此说,基因即包括编码序列,也包括它的调控序列及内含子和上、下游的非编码序列。控序列及内含子和上、下游的非编码序列。真核生物和原核生物及多数病毒的基因都以真核生物和原核生物及多数病毒的基因都以DNADNA的形式存在,少数病毒(的形式存在,少数病毒(RNARNA病毒)的基因是以病毒)的基因是以RNARNA的的形式存在形式存在。二、基因的基本概念二、基因的基本
3、概念基因一般特点:基因一般特点:多数生物的基因都是由多数生物的基因都是由DNA组成,而少数组成,而少数病毒的基因是由病毒的基因是由RNA组成。组成。基因的大多数都编码在染色体上,但也有基因的大多数都编码在染色体上,但也有编码在染色体之外的基因。如质粒、线粒编码在染色体之外的基因。如质粒、线粒体、叶绿体等。体、叶绿体等。原核生物的基因是连续编码的,而真核细原核生物的基因是连续编码的,而真核细胞基因是断裂基因。胞基因是断裂基因。在病毒的基因组中存在着重叠基因的现象在病毒的基因组中存在着重叠基因的现象基因组基因组(GenomeGenome)的概念的概念:Genome最早由德国植物遗传学家温克勒最早由
4、德国植物遗传学家温克勒尔于尔于1920年提出,它由年提出,它由gene和和chromosome组合而成。组合而成。基因组是指一个细胞中核酸的全部核苷酸基因组是指一个细胞中核酸的全部核苷酸排列序列,即一个细胞中蕴藏着的全部遗传自排列序列,即一个细胞中蕴藏着的全部遗传自信。信。第二节第二节 结构基因中贮存的遗传信息结构基因中贮存的遗传信息 结构基因中贮存的遗传信息结构基因中贮存的遗传信息 RNA的结构信息的结构信息 蛋白质的结构信息蛋白质的结构信息 RNA的特点:的特点:mRNA:原核与真核的区别原核与真核的区别 tRNA:rRNA:结构基因与蛋白质信息之间的关系结构基因与蛋白质信息之间的关系 遗
5、传密码遗传密码:蛋白质结构的特点:蛋白质结构的特点:遗传密码表遗传密码表第三节第三节结构基因变异及其结构基因变异及其与疾病的关系与疾病的关系 基因突变及发生机制基因突变及发生机制:自发突变与诱变自发突变与诱变 基因突变的类型:基因突变的类型:转换;颠换转换;颠换 基因突变的后果:基因突变的后果:基因突变与疾病的关系:基因突变与疾病的关系:基因突变导致蛋白质功能降低或丧失基因突变导致蛋白质功能降低或丧失 基因突变导致蛋白质活性异常增高基因突变导致蛋白质活性异常增高 基因表达量过高导致某种蛋白质过量基因表达量过高导致某种蛋白质过量 基因突变导致蛋白质产生过少而不能形成基因突变导致蛋白质产生过少而不
6、能形成正常功能正常功能 第二章第二章 基因组的结构与功能基因组的结构与功能第二节第二节 原核生物基因组原核生物基因组一、原核生物基因组结一、原核生物基因组结构与功能的特点构与功能的特点基因组为一个环状双链基因组为一个环状双链DNA分子:分子:原核生物的原核生物的DNA与一个大的支架蛋白与一个大的支架蛋白结合形成一个复合结构,结合形成一个复合结构,习惯上仍称为习惯上仍称为染色体染色体。细。细菌细胞没有细胞核,但它菌细胞没有细胞核,但它的染色体的染色体DNA在细胞中形在细胞中形成一个致密的区域,称为成一个致密的区域,称为类核类核(nucleoid)。基因组中只有一个复制起始点。基因组中只有一个复制
7、起始点。具有操纵子的结构:具有操纵子的结构:操纵子操纵子(operon):指数个功能上相关联的结构基因串指数个功能上相关联的结构基因串联在一起,构成一个信息区,它共用一个上游的调控区和下联在一起,构成一个信息区,它共用一个上游的调控区和下游的终止信号,上游的调控区包括游的终止信号,上游的调控区包括启动子启动子(promoter)和操纵和操纵基因基因(operator)在转录时将几个相联的结构基因一同转录成在转录时将几个相联的结构基因一同转录成RNA,形成的形成的RNA也为也为多顺反子多顺反子。编码顺序不会重叠编码顺序不会重叠结构基因的序列是连续编码的,不存在内含子,结构基因的序列是连续编码的,
8、不存在内含子,转录后不需剪切。转录后不需剪切。编码区在基因组中占的比例(约编码区在基因组中占的比例(约50%)多于真核)多于真核细胞,但小于病毒基因组。非编码区主要是一些细胞,但小于病毒基因组。非编码区主要是一些调控序列。调控序列。重复序列少:原核细胞的结构基因多为单拷贝,重复序列少:原核细胞的结构基因多为单拷贝,但编码但编码rRNA的基因往往是多拷贝的。的基因往往是多拷贝的。存在编码同功酶的基因。存在编码同功酶的基因。细菌基因组存在着可移动的细菌基因组存在着可移动的DNA序列,包括插入序列,包括插入序列和转座子。序列和转座子。含有多种功能的识别区域,如复制起始区、复制含有多种功能的识别区域,
9、如复制起始区、复制终止区、转录起动区和终止区等。终止区、转录起动区和终止区等。大肠杆菌染色体基因组的结构和功能大肠杆菌染色体基因组的结构和功能 大肠杆菌染色体基因组是研究最清楚的基因组。大肠杆菌染色体基因组是研究最清楚的基因组。估计大肠杆菌基因组含有估计大肠杆菌基因组含有3500个基因个基因,已被定位的,已被定位的有有900个左右个左右。在这。在这900个基因中,有个基因中,有260个基因已查个基因已查明具有操纵子结构,定位于明具有操纵子结构,定位于75个操纵子个操纵子中。在已知的中。在已知的基因中基因中8的序列具有调控作用。大肠杆菌染色体基的序列具有调控作用。大肠杆菌染色体基因组中已知的基因
10、多是编码一些酶类的基因,如氨基因组中已知的基因多是编码一些酶类的基因,如氨基酸、嘌呤、嘧啶、脂肪酸和维生素合成代谢的一些酶酸、嘌呤、嘧啶、脂肪酸和维生素合成代谢的一些酶类的基因,以及大多数碳、氮化合物分解代谢的酶类类的基因,以及大多数碳、氮化合物分解代谢的酶类的基因。的基因。另外,核糖体大、小亚基中另外,核糖体大、小亚基中50多种蛋白质多种蛋白质的基的基因也已经鉴定了。因也已经鉴定了。二、质粒二、质粒质粒的一般特性:质粒的一般特性:1.质粒是存在于细菌细胞中独立于染色体之外的自主质粒是存在于细菌细胞中独立于染色体之外的自主复制的遗传成分。绝大多数的质粒都是由环形双链复制的遗传成分。绝大多数的质
11、粒都是由环形双链DNA组成,极少发现线性质粒和组成,极少发现线性质粒和RNA成分的质粒。质成分的质粒。质粒的大小差别很大,小的质粒分子量约为粒的大小差别很大,小的质粒分子量约为106,仅编码,仅编码2-3个蛋白质,而最大的分子可比它大个蛋白质,而最大的分子可比它大100倍。倍。2.质粒与宿主菌是寄生的关系,质粒离开细菌不能独质粒与宿主菌是寄生的关系,质粒离开细菌不能独立的复制和生存,而细菌离开质粒仍能正常生存。立的复制和生存,而细菌离开质粒仍能正常生存。3.质粒的存在可以赋予细菌新的遗传特性,这包括抗质粒的存在可以赋予细菌新的遗传特性,这包括抗性特征、代谢特征、修饰宿主生活方式的因子等,其性特
12、征、代谢特征、修饰宿主生活方式的因子等,其中对抗菌素的抗性是质粒最重要的特性。中对抗菌素的抗性是质粒最重要的特性。质粒的遗传控制质粒的遗传控制 质粒带有自己的复制调控系统,可有效的控制质粒带有自己的复制调控系统,可有效的控制质粒在宿主细胞中的拷贝数量。质粒在宿主细胞中的拷贝数量。质粒还有自己精确的分配拷贝到子细胞中的能质粒还有自己精确的分配拷贝到子细胞中的能力。力。质粒还有控制宿主细胞有丝分裂的能力,以便质粒还有控制宿主细胞有丝分裂的能力,以便确保每个子代细胞中稳定的质粒数目。确保每个子代细胞中稳定的质粒数目。高拷贝质粒在细菌中常形成多聚体的形式,在高拷贝质粒在细菌中常形成多聚体的形式,在细菌
13、分裂时,这种多聚体又拆散成单体,控制这一细菌分裂时,这种多聚体又拆散成单体,控制这一过程的诸多因子构成了位点特异重组系统。过程的诸多因子构成了位点特异重组系统。质粒的不相容性:质粒的不相容性:质粒的质粒的类型类型1.结合型质粒、可移动型质粒和自传递型质粒结合型质粒、可移动型质粒和自传递型质粒2.严谨型质粒和松驰型质粒严谨型质粒和松驰型质粒3.窄宿主型质粒和广宿主型质粒窄宿主型质粒和广宿主型质粒一、真核生物染色质一、真核生物染色质DNA的高级结构的高级结构 DNA高级结构中的蛋白质高级结构中的蛋白质组蛋白组蛋白与与非组蛋白非组蛋白第二节第二节 真核生物基因组真核生物基因组 DNA与蛋白质的结与蛋
14、白质的结合与染色体的组装合与染色体的组装 基因组大,编码蛋白质多,一般编码蛋白都基因组大,编码蛋白质多,一般编码蛋白都超过超过1万个以上。在万个以上。在DNA复制时,有多个复复制时,有多个复制起始点。制起始点。真核生物的结构基因都是单顺反子。真核生物的结构基因都是单顺反子。真核生物的基因组中含有大量的重复序列真核生物的基因组中含有大量的重复序列(45%)。真核生物的基因组中存在大量的非编码区。真核生物的基因组中存在大量的非编码区。二、真核生物核基因组结构和功能特点二、真核生物核基因组结构和功能特点 真核基因为断裂基因,在它的结构基真核基因为断裂基因,在它的结构基因中含有外显子和内含子。因中含有
15、外显子和内含子。真核生物的基因组中存在着各种基因真核生物的基因组中存在着各种基因家族。家族。真核生物基因组中也存在移动基因。真核生物基因组中也存在移动基因。基因组中结构基因所占区域远小于非基因组中结构基因所占区域远小于非编码区。编码区。三、真核生物基因组的结构三、真核生物基因组的结构结构基因结构基因 断裂基因断裂基因(split gene):真核生物的结构基真核生物的结构基因是不连续的编码氨基酸的序列被非编码因是不连续的编码氨基酸的序列被非编码序列所打断,因此被称为断裂基因。序列所打断,因此被称为断裂基因。外显子外显子(exon):在真核生物的结构基因中,在真核生物的结构基因中,编码氨基酸的序
16、列称为外显子,它被数个编码氨基酸的序列称为外显子,它被数个内含子分隔成数个片段间隔排列。内含子分隔成数个片段间隔排列。内含子内含子(intron):在真核生物的结构基因在真核生物的结构基因中,在编码氨基酸序列之间存在着数个非中,在编码氨基酸序列之间存在着数个非编码的序列称为内含子。编码的序列称为内含子。顺式调控原件顺式调控原件 顺式调控元件顺式调控元件(cis-acting elements):与结构基因与结构基因表达调控相关,能够被基因调控蛋白特异性识别和表达调控相关,能够被基因调控蛋白特异性识别和结合的结合的DNA序列。序列。包括:启动子、上游启动元件、增强子、加尾包括:启动子、上游启动元
17、件、增强子、加尾信号和一些其它反应元件。信号和一些其它反应元件。反式作用元件反式作用元件(trans-acting elements):一些可以一些可以通过结合顺式元件二调节基因转录活性的蛋白因子。通过结合顺式元件二调节基因转录活性的蛋白因子。启动子启动子(promoter):(promoter):启动子是启动子是DNA分子可以分子可以与与RNA聚合酶特异识别和结合的部位,启动聚合酶特异识别和结合的部位,启动子位于结构基因的上游,每个结构基因的上游子位于结构基因的上游,每个结构基因的上游都含有一个启动子。都含有一个启动子。启动子具有高度的保守性,真核基因的启动子具有高度的保守性,真核基因的启动
18、子必须与转录因子结合后才能被启动子必须与转录因子结合后才能被RNA聚聚合酶识别与结合,并启动转录。这一点与原核合酶识别与结合,并启动转录。这一点与原核细胞不同。细胞不同。真核细胞的启动子元件是真核细胞的启动子元件是TATA盒盒(TATA box),位于转录起始点上游位于转录起始点上游-25bp处。处。上游启动子元件上游启动子元件(upstream promoter element):是是TATA盒上游的一些特定的盒上游的一些特定的DNA序列,反式序列,反式作用因子可与这些元件结合,通过参与促进作用因子可与这些元件结合,通过参与促进RNA聚聚合酶与合酶与DNA的结合,调节的结合,调节DAN的转录
19、过程。的转录过程。常见的上游启动元件包括:常见的上游启动元件包括:CAAT框:位于框:位于TATA上游,位置不确定。上游,位置不确定。GC盒:盒:CACA盒:盒:反应元件反应元件(response element):也是一种顺式作用元件,但它是专门与细胞的一也是一种顺式作用元件,但它是专门与细胞的一些信息分子结合,来调节基因的表达。些信息分子结合,来调节基因的表达。反应元件一般仅次于启动子内或增强子内。反应元件一般仅次于启动子内或增强子内。增强子增强子(enhancer):为一段为一段DNA序列,它能与反式作用因子识别、序列,它能与反式作用因子识别、并结合,起到调节转录(通常是增强)的作用。并
20、结合,起到调节转录(通常是增强)的作用。增强子可在一个基因存在多个,即可分布在启动增强子可在一个基因存在多个,即可分布在启动子的上流,也可存在于结构基因内部的内含子或下游。子的上流,也可存在于结构基因内部的内含子或下游。现在又发现了一些增强子内含负调控序列,称为现在又发现了一些增强子内含负调控序列,称为负增强子。负增强子。加尾信号加尾信号:在结构基因的最后一个外显子中有一个保守的在结构基因的最后一个外显子中有一个保守的AATAAA序列,这个序列对于序列,这个序列对于mRNA转录终止和加转录终止和加poly(A)尾是必不可少的。尾是必不可少的。在此位点的下游有一段在此位点的下游有一段GT丰富区或
21、丰富区或T丰富区,丰富区,此区与此区与AATAAA序列共同构成序列共同构成poly(A)加尾信号加尾信号。基因家族基因家族 基因家族基因家族(gene family)的概念:指核苷的概念:指核苷酸序列或编码产物的结构具有一定程度同源酸序列或编码产物的结构具有一定程度同源性的一组基因。性的一组基因。基因家庭可能是由同一祖先进化来的。基因家庭可能是由同一祖先进化来的。有的基因家族的成员同源性很高,但也有的有的基因家族的成员同源性很高,但也有的基因家族很低。基因家族很低。假基因假基因(pseudogene):在多基因家族在多基因家族中,某些成员不能表达出有功能的产物,这中,某些成员不能表达出有功能的
22、产物,这些基因称为假基因,用些基因称为假基因,用来表示。来表示。基因家族在基因组的分布:基因家族在基因组的分布:一类是基因家族成簇地分布在某一条一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集些蛋白质,如组蛋白基因家族就成簇地集中在第中在第7号染色体长臂号染色体长臂3区区2带到带到3区区6带区域带区域内;内;另一类是一个基因家族的不同成员成另一类是一个基因家族的不同成员成簇地分布簇地分布 在不同的染色体上,这些不同成在不同的染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如员编码一组功能上紧密相关
23、的蛋白质,如珠蛋白基因家族珠蛋白基因家族基因家族的类型:基因家族的类型:核酸序列相同核酸序列相同 在真核基因组中,编码在真核基因组中,编码rRNA和和RNA基因的基因的DNA片段常以这种形式出现片段常以这种形式出现。构成染色质中的组构成染色质中的组蛋白基因也是一种核苷酸序列相同的蛋白基因也是一种核苷酸序列相同的DNA序列。序列。核酸序列高度同源核酸序列高度同源 如人生长激素基因家族,包括生长激素、人如人生长激素基因家族,包括生长激素、人胎盘促乳素、催乳素的编码基因。它们之间的同胎盘促乳素、催乳素的编码基因。它们之间的同源性很高,编码蛋白质的氨基酸序列的同源性为源性很高,编码蛋白质的氨基酸序列的
24、同源性为85%,RNA上的上的同源性为同源性为92%,而各个基因的也,而各个基因的也未排列在一起。未排列在一起。编码产物具有同源功能区编码产物具有同源功能区 有的基因家族成员之间的同源性可能不高,有的基因家族成员之间的同源性可能不高,但编码蛋白具有高度的保守区,如获至宝但编码蛋白具有高度的保守区,如获至宝src 癌癌基因家族,各成员无明显的同源性,但每个基因基因家族,各成员无明显的同源性,但每个基因产物都有一个产物都有一个250个氨基酸序列同源,组成相似个氨基酸序列同源,组成相似的结构域。的结构域。编码产物具有小段保守基序编码产物具有小段保守基序 基因序列的同源性不高,但编码产物具有共基因序列
25、的同源性不高,但编码产物具有共同的功能。同的功能。基因超家族基因超家族 是指一组由多基因家族及单基因组成的更大是指一组由多基因家族及单基因组成的更大基因家族。其代表为免疫球蛋白基因超家族基因家族。其代表为免疫球蛋白基因超家族 重复序列重复序列(repeat sequence):在真核生物基因组存在着的大量的碱基序列重在真核生物基因组存在着的大量的碱基序列重复出现的情况。复出现的情况。重复序列中,除了编码重复序列中,除了编码RNA、RNA和组蛋白的和组蛋白的结构基因外,大部分是非编码序列。但对它们的功结构基因外,大部分是非编码序列。但对它们的功能还不十分清楚。能还不十分清楚。根据出现频率的不同,
26、将它们分为三类:根据出现频率的不同,将它们分为三类:高度重复序列:重复出现高度重复序列:重复出现1010 中度重复序列:重复出现中度重复序列:重复出现101-105。单拷贝序列:单拷贝序列:真核生物基因组中的转座子真核生物基因组中的转座子端粒端粒 端粒端粒(telomere):以线性结构存在于基因以线性结构存在于基因组端部的一段特殊组端部的一段特殊DNA序列。序列与蛋白质形序列。序列与蛋白质形成复合结构,存在于每个染色体的末端部,成复合结构,存在于每个染色体的末端部,端粒的功能主要有保护端粒的功能主要有保护DNA在在复制过程复制过程的完整性,同时也是细胞衰老的重要指标。的完整性,同时也是细胞衰
27、老的重要指标。五、线粒体基因组五、线粒体基因组 原核基因组与真核基因组的比较原核基因组与真核基因组的比较第三节第三节 病毒基因组病毒基因组一、病毒基因组核酸的主要类型一、病毒基因组核酸的主要类型1.双链双链DNA2.单链正股单链正股DNA3.双链双链RNA4.单链负股单链负股RNA5.单链正股单链正股RNA二、病毒基因组的特点二、病毒基因组的特点1病毒基因组大小相差较大病毒基因组大小相差较大,与细菌或真核细与细菌或真核细胞相比,病毒的基因组很小,但是不同的病毒胞相比,病毒的基因组很小,但是不同的病毒之间其基因组相差亦甚大。之间其基因组相差亦甚大。如乙肝病毒如乙肝病毒DNA只有只有3kb大小,所
28、含信息大小,所含信息量也较小,只能编码量也较小,只能编码4种蛋白质,而痘病毒的种蛋白质,而痘病毒的基因组有基因组有300kb之大,可以编码几百种蛋白质,之大,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚至为核不但为病毒复制所涉及的酶类编码,甚至为核苷酸代谢的酶类编码,因此,痘病毒对宿主的苷酸代谢的酶类编码,因此,痘病毒对宿主的依赖性较乙肝病毒小得多。依赖性较乙肝病毒小得多。2病毒基因组可以由病毒基因组可以由DNA组成,也可以由组成,也可以由RNA组组成,成,每种病毒颗粒中只含有一种核酸,或为每种病毒颗粒中只含有一种核酸,或为DNA或为或为RNA,两者一般不共存于同一病毒颗粒中。两者
29、一般不共存于同一病毒颗粒中。组成病毒基因组的组成病毒基因组的DNA和和RNA可以是单链的,可以是单链的,也可以是双链的,可以是闭环分子,也可以是线性也可以是双链的,可以是闭环分子,也可以是线性分子。分子。如乳头瘤病毒是一种闭环的双链如乳头瘤病毒是一种闭环的双链DNA病毒,病毒,而腺病毒的基因组则是线性的双链而腺病毒的基因组则是线性的双链DNA,脊髓灰质脊髓灰质炎病毒是一种单链的炎病毒是一种单链的RNA病毒,而呼肠孤病毒的病毒,而呼肠孤病毒的基因组是双链的基因组是双链的RNA分子。一般说来,大多数分子。一般说来,大多数DNA病毒的基因组双链病毒的基因组双链DNA分子,而大多数分子,而大多数RNA
30、病毒的基因组是单链病毒的基因组是单链RNA分子。分子。3 多数多数RNA病毒的基因组是由连续的核病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组糖核酸链组成,但也有些病毒的基因组RNA由不连续的几条核酸链组成。由不连续的几条核酸链组成。如流感病毒的基因组如流感病毒的基因组RNA分子是节段分子是节段性的,由八条性的,由八条RNA分子构成,每条分子构成,每条RNA分分子都含有编码蛋白质分子的信息;而呼肠子都含有编码蛋白质分子的信息;而呼肠孤病毒的基因组由双链的节段性的孤病毒的基因组由双链的节段性的RNA分分子构成,共有子构成,共有10个双链个双链RNA片段,同样每片段,同样每段段RNA分
31、子都编码一种蛋白质。目前,还分子都编码一种蛋白质。目前,还没有发现有节段性的没有发现有节段性的DNA分子构成的病毒分子构成的病毒基因组。基因组。4 非编码区少非编码区少,编码序列大于编码序列大于90%:病毒基病毒基因组的大部分是用来编码蛋白质的,因组的大部分是用来编码蛋白质的,只有非只有非常小的一份不被翻译,这与真核细胞常小的一份不被翻译,这与真核细胞DNA的冗余现象不同如在的冗余现象不同如在X174中不翻译的部中不翻译的部份只占份只占217/5375,G4DNA中占中占282/5577,都不到都不到5。不翻译的。不翻译的DNA顺序通常是基因顺序通常是基因表达的控制序列。如表达的控制序列。如X
32、174的的H基因和基因和A基基因之间的序列(因之间的序列(39063973),共),共67个碱个碱基,包括基,包括RNA聚合酶结合位,转录的终止聚合酶结合位,转录的终止信号及核糖体结合位点等基因表达的控制区。信号及核糖体结合位点等基因表达的控制区。乳头瘤病毒是一类感染人和动物的病毒,基乳头瘤病毒是一类感染人和动物的病毒,基因组约因组约8.0Kb,其中不翻译的部份约为其中不翻译的部份约为1.0kb,该区同样也是其他基因表达的调控区该区同样也是其他基因表达的调控区5 单倍体基因组单倍体基因组除了反转录病毒以外,一切病毒基因组都是单除了反转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只
33、出现一次。反转录倍体,每个基因在病毒颗粒中只出现一次。反转录病毒基因组有两个拷贝。病毒基因组有两个拷贝。6 基因有连续的和间断的基因有连续的和间断的噬菌体(细菌病毒)的基因是连续的;而真核噬菌体(细菌病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,细胞病毒的基因是不连续的,具有内含子,除了正具有内含子,除了正链链RNA病毒之外,真核细胞病毒的基因都是先转录病毒之外,真核细胞病毒的基因都是先转录成成mRNA前体,再经加工才能切除内含子成为成熟前体,再经加工才能切除内含子成为成熟的的mRNA。更为有趣的是,有些真核病毒的内含子更为有趣的是,有些真核病毒的内含子或其中的一部分,对某一个基因来说
34、是内含子,而或其中的一部分,对某一个基因来说是内含子,而对另一个基因却是外显子。如对另一个基因却是外显子。如SV40和多瘤病毒和多瘤病毒(polyomavirus)的早期基因就是这样。的早期基因就是这样。7 相关基因丛集:相关基因丛集:病毒基因组病毒基因组DNA序列中功序列中功能上相关的蛋白质的基因或能上相关的蛋白质的基因或rRNA的基因往往的基因往往丛集在基因组的一个或几个特定的部位丛集在基因组的一个或几个特定的部位,形成形成一个功能单位或转录单元。它们可被一起转录一个功能单位或转录单元。它们可被一起转录成为含有多个成为含有多个mRNA的分子,称为多顺反子的分子,称为多顺反子mRNA(pol
35、ycistroniemRNA),),然后再加然后再加工成各种蛋白质的模板工成各种蛋白质的模板mRNA。8 基因重叠基因重叠 基因重叠即同一段基因重叠即同一段DNA片段能够编码两种甚片段能够编码两种甚至三种蛋白质分子,这种现象在其它的生物细至三种蛋白质分子,这种现象在其它的生物细胞中仅见于线粒体和质粒胞中仅见于线粒体和质粒DNA,所以也可以认所以也可以认为是病毒基因组的结构特点。这种结构使较小为是病毒基因组的结构特点。这种结构使较小的基因组能够携带较多的遗传信息的基因组能够携带较多的遗传信息9 含不规则结构基因含不规则结构基因几个结构基因的编码区无间隔,即编码一条多几个结构基因的编码区无间隔,即
36、编码一条多肽,翻译后再切割在几个蛋白质肽,翻译后再切割在几个蛋白质。mRNA没有没有5端的帽子结构。端的帽子结构。结构基因本身没有翻译起始序列。结构基因本身没有翻译起始序列。10 重复序列少。重复序列少。三、典型病毒基因组介绍三、典型病毒基因组介绍SV40病毒基因组:病毒基因组:为双链环状为双链环状DNA动动物病毒。物病毒。5243bp。乙型肝炎病毒基因组:乙型肝炎病毒基因组:是一个带有部分是一个带有部分单链区的环状双链单链区的环状双链DNA。大小大小3.2bp。脊髓灰质炎病毒基因组:脊髓灰质炎病毒基因组:单链正股单链正股RNA病毒。病毒。逆转录病毒逆转录病毒 人类免疫缺陷病毒基因组(人类免疫缺陷病毒基因组(HIV)1981年首次在人类中发现的一种年首次在人类中发现的一种RNA病病毒,目前已发现的毒,目前已发现的HIV分分为两种,分别是为两种,分别是HIV1和和HIV2SARS病毒病毒 2003年初,我国首次发现年初,我国首次发现“非典非典”,4月月16日,世界卫生组织正式宣布日,世界卫生组织正式宣布SARS的病的病原体是一种新的冠状病毒原体是一种新的冠状病毒,SARS病毒为正链病毒为正链的单链的单链RNA病毒病毒。序列分析推测得到的序列分析推测得到的SARS病毒的基因组编码产物图病毒的基因组编码产物图