1、Chapter 3Genome and Gene第一节第一节 基因基因一、基因概念的发展一、基因概念的发展(一)经典遗传学经典遗传学1、1865,Mendel:控制性状的因子控制性状的因子-遗传因子遗传因子2、1909,Johannsen 提出基因(提出基因(genegene)的概念,取)的概念,取代遗传因子代遗传因子3、1910,1916,Morgan:将基因定位在染色体上将基因定位在染色体上1、In 1941,Beadle and Tatum 一基因一酶学说一基因一酶学说 阐明了基因是通过对酶的控制来决定性状的阐明了基因是通过对酶的控制来决定性状的 一基因一蛋白一基因一蛋白 一基因一多肽链
2、一基因一多肽链2、In 1944,Avery DNADNA是生物遗传的物质基础是生物遗传的物质基础(二)分子遗传学对基因概念的新发展(二)分子遗传学对基因概念的新发展3、In 1961,Jacob and Monod 乳糖操纵子模型乳糖操纵子模型(1)结构基因(结构基因(structural gene)指可编码非调控指可编码非调控RNA或蛋白质的一段或蛋白质的一段DNA序列序列血红蛋白血红蛋白编码核糖体编码核糖体RNA基因基因(2)(2)调节基因调节基因(regulatory gene)指其表达产物参与调控其它基因表达的基因。指其表达产物参与调控其它基因表达的基因。lacZlacYlacAPl
3、acIPlacOlaclacImRNA小 结基因可控制生物的性状基因可控制生物的性状基因位于染色体上基因位于染色体上基因的物质基础是基因的物质基础是DNA(或(或RNA)基因是通过指导合成蛋白质或基因是通过指导合成蛋白质或RNA来来决定性状的决定性状的基因有结构基因和调节基因之分基因有结构基因和调节基因之分(三)基因概念的进一步发展(三)基因概念的进一步发展1、重叠基因重叠基因(Overlapping genes)指在同一段指在同一段DNA序列上,由于阅读框架不同序列上,由于阅读框架不同或终止早晚不同,可同时编码两个以上多肽。或终止早晚不同,可同时编码两个以上多肽。Sanger(1977)年发
4、现了年发现了174单链单链DNA病毒中有病毒中有6个基因是重叠的。个基因是重叠的。Overlapping genes in phage X174 采莲人在绿杨津,采莲人在绿杨津,在绿杨津一阙新;在绿杨津一阙新;一阙新歌声漱玉,一阙新歌声漱玉,歌声漱玉采莲人。歌声漱玉采莲人。2、断裂基因(断裂基因(Split Genes)指基因内部被一个或更多不编码顺序所隔裂指基因内部被一个或更多不编码顺序所隔裂(1 1)内含子)内含子(intron):DNA序列中不出现在成熟序列中不出现在成熟mRNA的片段;的片段;(2 2)外显子)外显子(extron):DNA序列中出现在成熟序列中出现在成熟mRNA中的片
5、段。中的片段。DiscoveryIn 1977,Roberts and Sharp 3 3、跳跃基因:、跳跃基因:Jumping Genes(Transposons)存在于染色体存在于染色体DNA上可自主转移座位的基本单上可自主转移座位的基本单位,可位,可在同一染色体内或不同染色体之间移动在同一染色体内或不同染色体之间移动Transposons in maize 40年代初,年代初,McClintock研究玉米花斑糊粉层研究玉米花斑糊粉层和植株色素产生的遗传基础时发现转座因子和植株色素产生的遗传基础时发现转座因子4 4、管家基因、管家基因(组成组成型型基因基因)Housekeeping gen
6、es:是是那那些些(理理论论上上)在在所所有细胞中有细胞中都都表达表达的基因,因的基因,因为为 其其功功能能对对任何任何细胞细胞型型都都是是必必要要的。的。(维持细胞生存不可缺少)(维持细胞生存不可缺少)5 5、奢侈基因(、奢侈基因(Luxury genes):在在特殊的特殊的细胞类细胞类型型中大量中大量表达表达并并编码特殊编码特殊功功能能 产物的基因。产物的基因。(与细胞分化有关,与组织特异性表达有关)(与细胞分化有关,与组织特异性表达有关)二、基因的定义 产生一条多肽链或功能性产生一条多肽链或功能性RNA所必须的全部核所必须的全部核苷酸序列苷酸序列1、RNA基因(基因(RNA genes)
7、编码功能性的编码功能性的RNA分子分子 RNA产物有很多参与基因表达的调控,如产物有很多参与基因表达的调控,如MicroRNA2、蛋白质编码基因(、蛋白质编码基因(protein-coding genes)(1)编码区)编码区(coding region)指在翻译时对应于多肽的氨基酸序列的一段核指在翻译时对应于多肽的氨基酸序列的一段核苷酸序列苷酸序列(2)非编码区()非编码区(Untranslated regions,UTR)能够转录但不被翻译的核苷酸序列能够转录但不被翻译的核苷酸序列 功能:功能:蛋白质合成的调控蛋白质合成的调控 5-UTR;3-UTRATG5TAA33、顺反子:、顺反子:等
8、同于基因,是编码一条完整多肽链的一段等同于基因,是编码一条完整多肽链的一段核苷酸序列。核苷酸序列。多顺反子:多顺反子:原核生物中数个结构基因常串联在一原核生物中数个结构基因常串联在一起,受同一调节区控制,转录生成的起,受同一调节区控制,转录生成的mRNA可编码几种功能相关的蛋白质。可编码几种功能相关的蛋白质。lacZlacYlacAPlacIPlacOlaclacIUAAAUGAUGUAA.53单顺反子单顺反子:一个编码基因转录只生成一个:一个编码基因转录只生成一个mRNA分子,经翻译生成一条多肽链。分子,经翻译生成一条多肽链。UAAAAAAAUG53第二节第二节 遗传信息的传递遗传信息的传递
9、一、中心法则(The central dogma)In 1958,Crick1.DNA是自身复制的模板;是自身复制的模板;2.DNA通过转录作用将遗传信息传递给中间物质通过转录作用将遗传信息传递给中间物质RNA;3.RNA通过翻译作用将遗传信息表达成蛋白质。通过翻译作用将遗传信息表达成蛋白质。中心法则揭示了遗传信息的传递方向,反映了中心法则揭示了遗传信息的传递方向,反映了DNA、RNA和蛋白质之间的相互关系。和蛋白质之间的相互关系。DNA RNA ProteinTranscription Translationreplication二、中心法则的挑战中心法则的挑战1、反转录(Reverse t
10、ranscription)In 1970,Baltimore and Temin 发现逆转录酶逆转录酶(reverse transcriptase)2、RNA 复制3、RNA 编辑(RNA editing)是指转录后的是指转录后的RNA在编码区发生碱基的加入,在编码区发生碱基的加入,丢失或转换等现象丢失或转换等现象4、表观遗传(Epigenetic Inheritance)是指在是指在DNA序列没有发生变化的情况下,基因序列没有发生变化的情况下,基因表达的可遗传的改变表达的可遗传的改变 The calico phenotype shows effects of mosaicism of X-l
11、inked traits in female mammals an epigenetic phenomenon.(1)表观遗传修饰)表观遗传修饰(Epigenetic modification)DNA甲基化;组蛋白修饰;microRNA(2)表观遗传学补充了“中心法则”忽略的两个问题:a、哪些因素决定了基因的正常转录和翻译 b、对基因组而言,不仅仅是序列包含遗传信息,而且其修饰也可以记载遗传信息。5、朊病毒朊病毒(Prion)疯牛病疯牛病,学名为牛海绵状脑病学名为牛海绵状脑病(BSE)人和动物的可转移性神经退化疾病人和动物的可转移性神经退化疾病 In 1982,Prusiner,discove
12、ring prion PrPC PrPSc三、修改后的中心法则proteinDNARNAreplicationtranscriptionReverse transcription RNA editingRNA replication translation第三节第三节 基因组(基因组(Genome)一、概述:一、概述:1、概念:、概念:是指细胞或生物体单倍体染色体上的所有遗传物质的是指细胞或生物体单倍体染色体上的所有遗传物质的总称(包括所有的遗传信息)总称(包括所有的遗传信息)(1)细菌和病毒基因组:是指染色体上所含的全部)细菌和病毒基因组:是指染色体上所含的全部DNA(2)二倍体及多倍体真核
13、生物的基因组:)二倍体及多倍体真核生物的基因组:一个物种单倍体所有染色体上的遗传物质的总称。一个物种单倍体所有染色体上的遗传物质的总称。如人类基因组:包括如人类基因组:包括24条染色体条染色体2、基因组大小(、基因组大小(Genome size)haploid genome C值值(C-value):):size of the haploid genome 一种生物单倍体基因组一种生物单倍体基因组DNA的总量的总量讨论讨论:C值大小与生物遗传复杂性是否成正相关?值大小与生物遗传复杂性是否成正相关?C值在低等真核生物中与遗传复杂性有一定的正值在低等真核生物中与遗传复杂性有一定的正相关,但在高等真
14、核生物中却并非如此,它们的相关,但在高等真核生物中却并非如此,它们的C值变化不定。值变化不定。Insects4.7 107 1.2 107 Amphibians9.5 108 1.0 1011 Flowering plants 9.5 107 1.2 1011 C值矛盾(值矛盾(C-value paradox)生物基因组的大小同生物在进化生物基因组的大小同生物在进化上所处地位的高低无关上所处地位的高低无关 3.基因密度基因密度是指每是指每Mb基因组基因组DNA上基因的平均数目。上基因的平均数目。生物体的复杂度与基因密度存在大致负相关的生物体的复杂度与基因密度存在大致负相关的关系。关系。Why?
15、二、真核生物基因组二、真核生物基因组(一)非编码(一)非编码DNA 不编码蛋白质的不编码蛋白质的DNA序列序列 (没有确定功能)(没有确定功能)如人类:如人类:30亿对核苷酸,预计亿对核苷酸,预计10万个基因,万个基因,实际为实际为22.5万蛋白编码基因(占整万蛋白编码基因(占整 个基因组的个基因组的2%)内含子内含子 基因间隔序列(功能未知)基因间隔序列(功能未知)1、内含子、内含子物种物种基因平均基因平均长度长度平均内含子平均内含子个数个数/基因基因mRNA平均平均长度长度线虫线虫4kb343kb果蝇果蝇11kb343kb人类人类16kb672.5kb内含子的普遍性内含子的普遍性n不仅大多
16、数蛋白质编码的基因有内含子不仅大多数蛋白质编码的基因有内含子,rRNA,tRNA基因也有内含子。基因也有内含子。n大肠杆菌噬菌体大肠杆菌噬菌体T4胸腺嘧啶合成酶基因有胸腺嘧啶合成酶基因有内含子。内含子。n某些低等真核生物的线粒体和叶绿体基因某些低等真核生物的线粒体和叶绿体基因中有内含子。中有内含子。内含子的相对性内含子的相对性n内含子有时也编码蛋白内含子有时也编码蛋白n并非真核生物所有的基因都有内含子并非真核生物所有的基因都有内含子 真核生物组蛋白基因真核生物组蛋白基因,酵母的大多数基因无酵母的大多数基因无内含子内含子具有编码功能的内含子具有编码功能的内含子:如可移动内含子如可移动内含子 编码
17、编码3种蛋白质:种蛋白质:(1)内切核酸酶:能切割)内切核酸酶:能切割DNA上的靶序列并且上的靶序列并且 允许内含子插入允许内含子插入 (2)反转录酶:以自身)反转录酶:以自身RNA为模板产生为模板产生DNA拷贝拷贝 (3)成熟酶:在将特定内含子从前体)成熟酶:在将特定内含子从前体mRNA中剪中剪 除时起作用除时起作用 内含子的移动类似转座机制内含子的移动类似转座机制内含子的类型内含子的类型(1)GU-AG 内含子:真核细胞核内含子:真核细胞核mRNA前体中前体中(2)AU-AC 内含子:真核细胞核内含子:真核细胞核mRNA前体中前体中(3)型内含子:主要在真核细胞核型内含子:主要在真核细胞核
18、rRNA前体中前体中 自我剪接自我剪接(4)型内含子:细胞器型内含子:细胞器RNA、某些原核生物、某些原核生物RNA 自我剪接自我剪接内含子与进化内含子与进化 (1)特点:外显子的保守程度远高于内含子,)特点:外显子的保守程度远高于内含子,内含子的序列是多变的内含子的序列是多变的 (2)合理解释:)合理解释:内含子序列最终不出现在内含子序列最终不出现在mRNA的序列的序列 中,即使发生改变也不会受到自然选择中,即使发生改变也不会受到自然选择 的压力的压力 (3)在进化上的意义)在进化上的意义 a、有利于生物遗传的相对稳定有利于生物遗传的相对稳定 b、积累突变的内含子可能演化为新的基因、积累突变
19、的内含子可能演化为新的基因 c、扩大了生物体的遗传信息储量、扩大了生物体的遗传信息储量2、基因间隔序列(功能未知)、基因间隔序列(功能未知)-主要由重复序列组成主要由重复序列组成 串联重复序列:如卫星串联重复序列:如卫星DNA 分散重复序列分散重复序列:如:如Alu元件元件(二)重复序列(二)重复序列DNA 单一序列单一序列/中度重复序列中度重复序列/高度重复序列高度重复序列附附:复性动力学复性动力学:根据序列的拷贝数不同在基因组根据序列的拷贝数不同在基因组DNA复性过程复性过程中的复性速率不同的原理,来识别不同种类的重中的复性速率不同的原理,来识别不同种类的重复序列复序列DNA的一种技术。的
20、一种技术。思考思考:复性速度与基因组重复序列拷贝数的有什复性速度与基因组重复序列拷贝数的有什么关系么关系?人类和人类和E.coli DNA的理想复性动力学曲线的理想复性动力学曲线(一一)单一序列(单一序列(unique sequence DNA)基因组中只有一个或几个拷贝的基因组中只有一个或几个拷贝的DNA序列序列 (真核生物结构基因多属于单一序列)(真核生物结构基因多属于单一序列)(二二)中度重复序列(中度重复序列(moderately repetitive DNA)基因组中重复次数在基因组中重复次数在10 105之间的之间的DNA序列序列 如如rRNA、tRNA的基因,组蛋白基因的基因,组
21、蛋白基因 1、串联重复序列(串联重复序列(Tandem repeat sequences)基因簇:基因簇:基因家族中一组相同或相关基因串联基因家族中一组相同或相关基因串联 排列在一起排列在一起 如:如:rDNA-基因簇重复多次基因簇重复多次 组蛋白基因(组蛋白基因(5 genes)-基因簇重复多次基因簇重复多次2、散在重复序列(、散在重复序列(dispersed repetitive DNA)分散分布在基因组中的中等重复序列分散分布在基因组中的中等重复序列 (1)短散在元件)短散在元件 SINE:Alu 元件(元件(300 bp)(2)长散在元件)长散在元件 LINE:L1 元件(元件(650
22、0 bp)Alu 元件和元件和L1 元件占人类基因组的元件占人类基因组的10%功能:没有被证明有功能功能:没有被证明有功能(三)高度重复序列(三)高度重复序列(highly repetitive DNA)基因组中重复次数超过基因组中重复次数超过106 的的DNA序列序列 卫星卫星DNA(Satellite DNA)1、概念:真核生物基因组中、概念:真核生物基因组中由许多短的基本重由许多短的基本重复单位构成的连续重复的一种高度重复序列。复单位构成的连续重复的一种高度重复序列。短短重复单位:重复单位:2bp至至2030bp5 ATAAACTATAAACTATAAACT 33 TATTTGATATT
23、TGATATTTGA 5果蝇的卫星果蝇的卫星DNA重复单位重复单位n密度梯度离心,卫星密度梯度离心,卫星DNA与其他与其他DNA分开。形成两分开。形成两个峰:较大的主峰和高度个峰:较大的主峰和高度重复序列小峰重复序列小峰Buoyant densityOptical absorbanceMouse DNA/CsClMainbandsatellite2、特点:、特点:GC 含量低,因而具有较低的浮力密度含量低,因而具有较低的浮力密度3、位置:卫星、位置:卫星DNA位于着丝粒部位位于着丝粒部位 是异染色质的组成成分是异染色质的组成成分4、功能:没有被证明有功能、功能:没有被证明有功能5、微卫星、微卫
24、星DNA(microsatellite DNA)简短串联重复简短串联重复-STR 特点:特点:(1 1)重复单位长度在)重复单位长度在2 26bp6bp之间之间 (2 2)较为平均地沿染色体分布)较为平均地沿染色体分布 6、小卫星、小卫星DNA(minisatellite DNA)可变串联重复可变串联重复-VNTR 特点:特点:(1)拷贝数具有高度可变性拷贝数具有高度可变性 (2 2)重复单位长度在)重复单位长度在151565bp65bp之间之间 (3 3)一般出现在染色体的末端)一般出现在染色体的末端DNA fingerprintingGGGCAGGAXGCCCGTCCTXCProgenyP
25、arents56789(三)基因家族(三)基因家族 一个祖先基因经重复或突变所产生的功能相关一个祖先基因经重复或突变所产生的功能相关 的同源基因的同源基因假基因:基因家族中因突变而失去功能的基因假基因:基因家族中因突变而失去功能的基因基因簇:基因家族中一组相同或相关基因串联排列基因簇:基因家族中一组相同或相关基因串联排列在一起而形成在一起而形成 如如rRNA、tRNA和组蛋白的基因和组蛋白的基因;孤独基因孤独基因:基因家族中在独立位点上的单个基因:基因家族中在独立位点上的单个基因典型的基因家族典型的基因家族1tRNA基因基因 单倍体人基因组中单倍体人基因组中1300个个tRNA基因,基因,tR
26、NA 基因簇基因簇2rRNA基因基因 l00copy rRNA基因簇基因簇(重复单元重复单元:28S、18S、5.8s-rRNA)3组蛋白基因组蛋白基因 30-40copy 组蛋白基因簇组蛋白基因簇(重复单位:重复单位:H1,H2A,H2B,H3、H4)特点:无特点:无intron,Poly(A)-RNA 4珠蛋白基因珠蛋白基因(四)(四)DNA的多态性的多态性 DNA序列发生变化而导致的个体间核苷酸序列的序列发生变化而导致的个体间核苷酸序列的差异差异1、RFLP(限制性片段长度多态性)(限制性片段长度多态性)DNA序列上的微小变化,甚至序列上的微小变化,甚至1个核苷酸的变化,也个核苷酸的变化
27、,也能引起限制性内切酶切点的丢失或产生,导致酶切片能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化段长度的变化2、DNA重复序列多态性(重复序列多态性(RSP)表现为重复序列拷贝数的变异表现为重复序列拷贝数的变异(1)小卫星)小卫星DNA:(可变串联重复:(可变串联重复-VNTR)重复单位长度在重复单位长度在15-65个核苷酸左右个核苷酸左右(2)微卫星)微卫星DNA:重复单位长度在重复单位长度在2-6个核苷酸之间,又称为简个核苷酸之间,又称为简短串联重复(短串联重复(STR、STRP或或SSLP)。)。3、单核苷酸的多态性(、单核苷酸的多态性(SNP):):分散于基因组中的单个碱基
28、的差异,即包分散于基因组中的单个碱基的差异,即包括单个碱基的缺失、插入和替换。括单个碱基的缺失、插入和替换。三、原核生物的基因组三、原核生物的基因组特点:特点:1、功能相关的几个结构基因往往串联在、功能相关的几个结构基因往往串联在起,起,受它们上游的共同调控区控制,形成操纵子受它们上游的共同调控区控制,形成操纵子2、结构基因为多顺反子、结构基因为多顺反子3、结构基因中没有内含子、结构基因中没有内含子4、DNA大部分为编码序列大部分为编码序列5、重复序列不多(单拷贝基因)、重复序列不多(单拷贝基因)6、有重叠基因、有重叠基因四、病毒基因组的特点四、病毒基因组的特点1每种病毒只有一种核酸,每种病毒
29、只有一种核酸,DNA或或RNA;2病毒核酸大小差别很大;病毒核酸大小差别很大;3除逆转录病毒外,病毒基因都是单拷贝的。除逆转录病毒外,病毒基因都是单拷贝的。4大部分病毒核酸是由一条双链或单链分子大部分病毒核酸是由一条双链或单链分子 (RNA或或DNA)5真核病毒基因有内含子,而噬菌体基因中真核病毒基因有内含子,而噬菌体基因中 无内含子无内含子6有重叠基因有重叠基因真核生物基因组真核生物基因组 大,线状大,线状 与组蛋白结合与组蛋白结合 线粒体线粒体/叶绿体叶绿体 单顺反子单顺反子 断裂基因断裂基因 split gene 一般无重叠基因一般无重叠基因 含大量非编码含大量非编码 DNA 大量重复序
30、列大量重复序列 原核生物基因组原核生物基因组 小小,环状环状 裸露裸露DNA 质粒质粒 plasmid 操纵子操纵子 operon,多顺反子,多顺反子 基因是连续的基因是连续的 有重叠基因有重叠基因 大部分序列都为编码大部分序列都为编码序列序列 重复序列不多重复序列不多(单拷贝)(单拷贝)1990 人类基因组计划开始实施 第四节 人类基因组学研究进展2000 2000 公布公布人类基因组工作框架图人类基因组工作框架图(90%90%)2001 2001 人类基因组人类基因组“精细图精细图”完成(完成(99%99%)2003 2003 人类基因组序列图亦称人类基因组序列图亦称“完成图完成图”(99
31、.99%99.99%)2006 2006 完成了人类完成了人类1 1号染色体的基因测序图,人类号染色体的基因测序图,人类 基因组计划彻底完成基因组计划彻底完成Question作业:作业:一、名词解释一、名词解释 基因组、基因、基因组、基因、C值、值、C值矛盾、基因簇、值矛盾、基因簇、基因家族、假基因、卫星基因家族、假基因、卫星DNA、结构基因、结构基因、调控基因、重叠基因、断裂基因、内含子、调控基因、重叠基因、断裂基因、内含子、外显子、跳跃基因、管家基因、奢侈基因、外显子、跳跃基因、管家基因、奢侈基因、表观遗传表观遗传二、简答题二、简答题 简述原核生物与真核生物基因组的差异简述原核生物与真核生
32、物基因组的差异思考题:思考题:请区分下列术语请区分下列术语1、多顺反子、基因簇、多顺反子、基因簇2、重叠基因、重复序列、重叠基因、重复序列3、基因家族、基因簇、基因家族、基因簇4、内含子、基因非编码区、内含子、基因非编码区谈谈对谈谈对“一基因一条多肽链一基因一条多肽链”假说的看法假说的看法真核生物基因组中含有几种类型的真核生物基因组中含有几种类型的DNA序列序列?你你如何设计实验来证明?如何设计实验来证明?根据根据 DNA复性动力学研究,复性动力学研究,DNA序列可以分成序列可以分成哪几种类型?并加以举例说明。哪几种类型?并加以举例说明。何谓何谓DNA多态性,在遗传分析中有何应用价值?多态性,在遗传分析中有何应用价值?