1、 是编码有功能的蛋白质多肽链或是编码有功能的蛋白质多肽链或RNARNA所必需的全部核苷酸序所必需的全部核苷酸序列。列。一个基因不仅仅包括编码蛋白质肽链或一个基因不仅仅包括编码蛋白质肽链或RNARNA的核酸序列的核酸序列,还还包括转录所必需的调控序列及位于编码区包括转录所必需的调控序列及位于编码区55端上游的非编码序端上游的非编码序列、内含子和位于编码区列、内含子和位于编码区33下游的非编码序列下游的非编码序列。人类基因组包含人类基因组包含2222条染色体和条染色体和X X、Y Y两条性染色体上的全两条性染色体上的全部遗传物质(核基因组)以及胞浆线粒体上的遗传物质(线部遗传物质(核基因组)以及胞
2、浆线粒体上的遗传物质(线粒体基因组)粒体基因组)不同生物基因组结构与组织形式上有巨大差别,病毒基不同生物基因组结构与组织形式上有巨大差别,病毒基因组结构简单,所含结构基因很少;原核生物基因组所含基因组结构简单,所含结构基因很少;原核生物基因组所含基因数量较多,且有了较为完善的表达调控体系;真核生物基因数量较多,且有了较为完善的表达调控体系;真核生物基因组所含基因数量巨大,表达调节系统也更为精确。因组所含基因数量巨大,表达调节系统也更为精确。第一节第一节 病毒基因组病毒基因组 病毒是最简单的生命形式,病毒是不能单独繁病毒是最简单的生命形式,病毒是不能单独繁殖的生物体,它是一类只能在宿主细胞内进行
3、复制殖的生物体,它是一类只能在宿主细胞内进行复制的最小微生物。遗传信息的延续构成了其生命的主的最小微生物。遗传信息的延续构成了其生命的主要内容。病毒基因组的主要功能就是保证基因组的要内容。病毒基因组的主要功能就是保证基因组的复制及其向子代传递,整套的基因组所编码的蛋白复制及其向子代传递,整套的基因组所编码的蛋白质都是与基因复制、病毒颗粒包装以及病毒向其它质都是与基因复制、病毒颗粒包装以及病毒向其它宿主细胞传递密切相关的。宿主细胞传递密切相关的。完整的病毒颗粒具有蛋白质外壳,以保护病毒完整的病毒颗粒具有蛋白质外壳,以保护病毒核酸不受核酸酶的破坏,并能识别和侵袭特定的宿核酸不受核酸酶的破坏,并能识
4、别和侵袭特定的宿主。主。RNA病毒基因组分为以下几种类型病毒基因组分为以下几种类型复制负链复制负链RNA复制正链复制正链RNA正链正链RNARNA1 1、单股正链、单股正链RNARNA病毒基因组:病毒基因组:SARSSARS冠状病毒;冠状病毒;HIVHIV病毒、病毒、白血病病毒、肉瘤病毒白血病病毒、肉瘤病毒正链正链RNARNA逆转录酶逆转录酶双链双链cDNA插入宿主细胞基插入宿主细胞基因组成为前病毒因组成为前病毒转录出正链转录出正链RNARNA2 2、单股负链、单股负链RNARNA病毒基因组:滤泡性口腔炎病毒、流感病毒、病毒基因组:滤泡性口腔炎病毒、流感病毒、副流感病毒等副流感病毒等负链负链R
5、NA正链正链RNARNA复制负链复制负链RNA3 3、双链、双链RNARNA病毒基因组:轮状病毒、呼肠孤病毒病毒基因组:轮状病毒、呼肠孤病毒DNADNA病毒基因组分为以下几种类型病毒基因组分为以下几种类型DNADNA病毒基因组也有单、双链和正、负股之分。由于单链病毒基因组也有单、双链和正、负股之分。由于单链DNADNA在转录之前都要合成互补在转录之前都要合成互补DNADNA,因此正股、负股,因此正股、负股DNADNA区区别别 没有真正的显示出来。没有真正的显示出来。DNADNA病毒基因组可以有环状(乳头瘤病毒)和线性(腺病病毒基因组可以有环状(乳头瘤病毒)和线性(腺病毒)之分毒)之分(二)、病
6、毒与细菌或真核生物相比,基因组小、基因数(二)、病毒与细菌或真核生物相比,基因组小、基因数少,所含遗传信息也相应少。同时病毒基因组之间差别大。少,所含遗传信息也相应少。同时病毒基因组之间差别大。(三)、病毒基因组有重叠基因存在。(三)、病毒基因组有重叠基因存在。一段序列可编码一段序列可编码2种或种或2种以上蛋白质,基因重叠虽种以上蛋白质,基因重叠虽然共用同一段核酸序列,但转录成的然共用同一段核酸序列,但转录成的mRNA链的阅读框链的阅读框不同。不同。(四)、(四)、噬菌体的基因是连续的,基因中无内含子。但感染噬菌体的基因是连续的,基因中无内含子。但感染真核细胞的病毒基因是不连续的,有内含子。真
7、核细胞的病毒基因是不连续的,有内含子。(五)、病毒基因组的大部分是用来编码蛋白质的(五)、病毒基因组的大部分是用来编码蛋白质的(90%),只有一小部分不被翻译。,只有一小部分不被翻译。(六)、相关基因丛集(六)、相关基因丛集 病毒基因组病毒基因组DNA序列中功能相关的编码蛋白质基因序列中功能相关的编码蛋白质基因或或rRNA基因常集中在基因组的一个或几个特定部位形基因常集中在基因组的一个或几个特定部位形成一个功能单位或转录单元,它们可被一起转录成多顺成一个功能单位或转录单元,它们可被一起转录成多顺反子,然后加工成各种。反子,然后加工成各种。(七)、除反转录病毒基因组有两个拷贝外,其它病毒(七)、
8、除反转录病毒基因组有两个拷贝外,其它病毒基因组都是单倍体。基因组都是单倍体。第二节第二节 原核生物基因组原核生物基因组 原核生物的生命活动不仅仅是简单的复制基因组,还原核生物的生命活动不仅仅是简单的复制基因组,还有复杂的代谢活动,即利用外界环境中的营养成分,获取有复杂的代谢活动,即利用外界环境中的营养成分,获取自身所需的能量,合成自身生长所需的材料。自身所需的能量,合成自身生长所需的材料。原核生物需要根据外界环境的变化,调节自身的酶系原核生物需要根据外界环境的变化,调节自身的酶系统的组成及功能,利用不同的营养物质,调整细胞内一些统的组成及功能,利用不同的营养物质,调整细胞内一些蛋白质的数量,应
9、付环境的变化。因此原核生物基因组的蛋白质的数量,应付环境的变化。因此原核生物基因组的结构基因数量和功能的类型远远多于病毒基因组。结构基因数量和功能的类型远远多于病毒基因组。1.1.基因组通常仅由基因组通常仅由 其其DNADNA是与蛋白质结合,但并不形成染色体结构,只是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称为染色体。细菌染色体是习惯上将之称为染色体。细菌染色体DNADNA在胞内形成一在胞内形成一个致密区域,即类核(个致密区域,即类核(nucleoidnucleoid),类核无核膜将之与胞),类核无核膜将之与胞浆分开。浆分开。2.2.功能相关的几个结构基因往往串联排列在一起组成功能相
10、关的几个结构基因往往串联排列在一起组成3.3.原核生物基因组中基因密度非常高原核生物基因组中基因密度非常高,结构结构 4.4.基因组中任何一段基因组中任何一段DNADNA不会用于编不会用于编码码2 2种蛋白质。种蛋白质。5.5.在原核生物基因组中含有编码同工酶的基因在原核生物基因组中含有编码同工酶的基因。6.6.在不同原核生物基因组中在不同原核生物基因组中GCGC含量变化很大含量变化很大。7 7、在原核生物基因组的非编码区内主要是一些调控序列在原核生物基因组的非编码区内主要是一些调控序列。复制起始区、复制终止区、转录启动区和终止区等。这些区域往往具复制起始区、复制终止区、转录启动区和终止区等。
11、这些区域往往具有特殊的序列,并且含有反向重复序列。有特殊的序列,并且含有反向重复序列。8 8、细菌基因组中的可移动成分能产生转座现象。、细菌基因组中的可移动成分能产生转座现象。9 9、除细菌染色体外,还有能自主复制的双链环状、除细菌染色体外,还有能自主复制的双链环状DNADNA分子,分子,称为质粒。称为质粒。即可移动的即可移动的基因成分(可移动基因,基因成分(可移动基因,movable gene mobmovable gene mob),是指能够),是指能够在一个在一个DNADNA分子内部或两上分子内部或两上DNADNA分子之间移动的分子之间移动的DNADNA片段。在片段。在细菌中指在质粒和染
12、色体之间或在质粒和质粒之间移动的细菌中指在质粒和染色体之间或在质粒和质粒之间移动的DNADNA片段(文献上有时形象地称其为是片段(文献上有时形象地称其为是跳跃基因跳跃基因,jumping jumping genegene)。转位也是)。转位也是DNADNA重组的一种形式。重组的一种形式。移动基因最早由美国冷泉港实验室(移动基因最早由美国冷泉港实验室(cold spring Harbor cold spring Harbor LaboratoryLaboratory)的女科学家)的女科学家B.MClintockB.MClintock于上个世纪于上个世纪4040年代晚期年代晚期在玉米中首次发现的。
13、在玉米中首次发现的。6060年代,为年代,为J.A.ShapircJ.A.Shapirc研究大肠杆菌研究大肠杆菌高效突变实验证实。高效突变实验证实。19831983年荣获诺贝尔生物学医学奖。年荣获诺贝尔生物学医学奖。细菌的转位因子包括细菌的转位因子包括插入序列插入序列,转座子转座子及及可转座的噬菌体可转座的噬菌体。1.1.插入序列(插入序列(insertion sequence,ISinsertion sequence,IS)插入序列是一类较小的没有插入序列是一类较小的没有表型效应表型效应的转位因子,长度为的转位因子,长度为700-2000BP700-2000BP,其组成除带有一个与转座作用有
14、关的转位酶基因外,其组成除带有一个与转座作用有关的转位酶基因外,在其两侧有反向重复序列及在其两侧有反向重复序列及靶位点靶位点。同时。同时ISIS的转位频率为的转位频率为1010-7-7/拷拷贝,即在一个传代的贝,即在一个传代的10107 7细菌中有一次插入。插入方向可以正向,细菌中有一次插入。插入方向可以正向,也可以反向。也可以反向。TSTranspcsase geneTSIRIRtarget site(TS)靶位点)靶位点Transposase gene 转位酶基因转位酶基因inverted repeated(IR)反向重)反向重复顺序复顺序ISIS的示意图的示意图(一)转位因子的种类及特征
15、(一)转位因子的种类及特征 Tn Tn是一类较大的可移动成分,长度在是一类较大的可移动成分,长度在2000-202000-20,000bp000bp,除有关转座基因外,至少还含有一个以上与转座无关,除有关转座基因外,至少还含有一个以上与转座无关,但决定宿主菌遗传性状的基因。如抗药基因等。但决定宿主菌遗传性状的基因。如抗药基因等。TnTn是是在研究抗药基因中发现的,由此知道抗药基因可在质在研究抗药基因中发现的,由此知道抗药基因可在质粒之间,质粒与染色体之间或质粒与可转座的噬菌体粒之间,质粒与染色体之间或质粒与可转座的噬菌体之间来回移动,之间来回移动,TnTn的转位原理和的转位原理和IsIs基本相
16、同,转位频基本相同,转位频率为率为1010-3-3至至1010-6-6/拷贝之间。拷贝之间。2.2.转座子(转座子(transposon,Tntransposon,Tn)3.3.可转座的噬菌体(可转座的噬菌体(transposable phagetransposable phage)(1)(1)两种噬菌体,是一类温和噬菌体。两种噬菌体,是一类温和噬菌体。(2)(2)感染细菌后,可以整合到细菌染色体中,插入位点是随感染细菌后,可以整合到细菌染色体中,插入位点是随机的(而入机的(而入phagephage插入位点是专一的),可以插到结构基因插入位点是专一的),可以插到结构基因内部,引起突变,内部,引
17、起突变,MuMu即即Mutator(Mutator(突变子突变子)因此得名。因此得名。(3)(3)插入时,一个拷贝留在原位,新合成的拷贝插入新的插入时,一个拷贝留在原位,新合成的拷贝插入新的部位。部位。(4)(4)和和ISIS,TnTn相比,相比,MuMu末端不含末端不含IRIR,这是可转座成分的一个,这是可转座成分的一个例外。例外。(二二)转位作用的机理转位作用的机理 转位作用可以分为和。通常带有内解离区(转位作用可以分为和。通常带有内解离区(resres位点)位点)的转座因子以复制转座为主,而无解离区的以简单转座为的转座因子以复制转座为主,而无解离区的以简单转座为主。主。简单转痤(单纯转座
18、)简单转痤(单纯转座)复制性转座复制性转座1.1.复制性转位机理:复制性转位机理:转座因子在其自身tnpA基因编码的转座酶作用下,首先在转座成分双链的相反极性端同时出现单链切口。与此同时,一种DNA内切酶在靶点序列两侧各一条单链上造成一切口。随后,供体上转座因子的游离端与靶位点DNA上错开切割的突出端分别连接,在宿主细菌DNA聚合酶的作用下,以任意一条链为模板进行复制,新的转座成分通过半保留复制完成,形成“共整合体”,此“共整合体”是以转座成分正向重复序列相连接。最后,由转座因子tnpR基因编码的解离酶作用于共整合体中的转座因子的内解离区,使共整合体发生解离,产生各含一个供体DNA分子和受体D
19、NA分子。2 2、简单转座机制、简单转座机制 简单转座时,转位酶将供体简单转座时,转位酶将供体DNADNA的转座因子两侧各的转座因子两侧各切断一条单链并与靶序列的切断一条单链并与靶序列的2 2个游离末端连接,随后并个游离末端连接,随后并没有复制过程,而是由转位酶将供体没有复制过程,而是由转位酶将供体DNADNA转座因子的另转座因子的另一段也切断,因此在供体一段也切断,因此在供体DNADNA留下一个致死性缺口。留下一个致死性缺口。(三)转座作用的遗传学效应(三)转座作用的遗传学效应1 1、转座引起插入突变、转座引起插入突变 当插入序列或转座子插入某个基因的操纵序列前时,可引起操纵子后当插入序列或
20、转座子插入某个基因的操纵序列前时,可引起操纵子后的结构基因表达失活。的结构基因表达失活。2 2、转座可产生新基因、转座可产生新基因 如果转座子上带有某些抗药性基因,它一方面会造成靶位点如果转座子上带有某些抗药性基因,它一方面会造成靶位点DNADNA突变,突变,同时会使该位点产生抗药性。同时会使该位点产生抗药性。3 3、转座可出现染色体畸变发生、转座可出现染色体畸变发生 当转座发生在宿主当转座发生在宿主DNADNA原有位点时,往往导致转座子两个拷贝之间原有位点时,往往导致转座子两个拷贝之间的同源重组,引起的同源重组,引起DNADNA的缺失或倒位。的缺失或倒位。4 4、转座可以引起生物进化、转座可
21、以引起生物进化 由于转座作用,使一些原来在染色体上相距甚远的基因组合到一起,由于转座作用,使一些原来在染色体上相距甚远的基因组合到一起,构建成一个操纵子或表达单元,也可能产生上些具有新的生物学功能的基构建成一个操纵子或表达单元,也可能产生上些具有新的生物学功能的基因和新的蛋白质分子。因和新的蛋白质分子。原核生物原核生物-大肠杆菌大肠杆菌大肠杆菌是格兰氏阴性杆菌,生长、繁殖迅速,培养时大肠杆菌是格兰氏阴性杆菌,生长、繁殖迅速,培养时营养要求不高。同时在基因工程中有重要应用。营养要求不高。同时在基因工程中有重要应用。大肠杆菌的遗传物质主要是大肠杆菌的遗传物质主要是染色体染色体DNADNA和和质粒质
22、粒DNADNA。染色。染色体体DNADNA总长度为总长度为4.64.6*10106 6碱基对,约有碱基对,约有35003500个基因。细菌个基因。细菌除了在类核中有较大环状染色体除了在类核中有较大环状染色体DNADNA外,许多细菌胞质外,许多细菌胞质中还含有一个或多个小的环状中还含有一个或多个小的环状DNADNA分子,这些染色体外分子,这些染色体外的遗传物质称为的遗传物质称为质粒质粒。定义定义 是存在于细菌染色体外的,具有自主复制能力的环状双链是存在于细菌染色体外的,具有自主复制能力的环状双链DNADNA分子。分子。(1 1)质粒对宿主的生存不是必需的,只是)质粒对宿主的生存不是必需的,只是“
23、友好友好”的的“借居借居”宿主细胞中,宿主细胞中,既不杀伤细胞,对宿主的代谢活动既不杀伤细胞,对宿主的代谢活动也无影响,宿主离开质粒照样的生存下去。也无影响,宿主离开质粒照样的生存下去。(酶和蛋白质)帮助,才能完成自身的复制(扩增)、转(酶和蛋白质)帮助,才能完成自身的复制(扩增)、转录。录。使宿主获得生存优势,与我们基因工程实验紧密相使宿主获得生存优势,与我们基因工程实验紧密相关的,如抗生素抗性基因:关的,如抗生素抗性基因:AmpAmpr r ,水解,水解-内酰胺环内酰胺环,解除氨苄青霉素毒性解除氨苄青霉素毒性,使细菌抗使细菌抗氨苄青霉素。氨苄青霉素。TetTetr r,可阻止四环素进入细胞
24、可阻止四环素进入细胞,使细菌抗四环素。使细菌抗四环素。(二)质粒与宿主细胞的关系(二)质粒与宿主细胞的关系(三)质粒的基本特性(三)质粒的基本特性 。复制调控系统由质粒上的复制起点(复制调控系统由质粒上的复制起点(oriori),质粒的),质粒的reprep基因和基因和copcop基因组成。基因组成。Rep Rep蛋白启动质粒的复制,蛋白启动质粒的复制,copcop基因本身或其表达产物可抑制复制作用,从基因本身或其表达产物可抑制复制作用,从而控制质的拷贝数。而控制质的拷贝数。分配系统是使质粒在细菌分裂过程中精确分配到子细胞中。质粒中对其稳分配系统是使质粒在细菌分裂过程中精确分配到子细胞中。质粒
25、中对其稳定存在至关重要的区域称分配区。定存在至关重要的区域称分配区。当一个宿主细胞内的两个质粒的复制起始点相同时,它们共用同一分配系当一个宿主细胞内的两个质粒的复制起始点相同时,它们共用同一分配系统,彼此之间存在竞争。最终会出现一种质粒的丢失。如果两个质粒的复制起统,彼此之间存在竞争。最终会出现一种质粒的丢失。如果两个质粒的复制起始点不同,分配系统不一,可以共存。始点不同,分配系统不一,可以共存。在自然条件下,在些质粒可以通过细菌接合作用在细菌、在自然条件下,在些质粒可以通过细菌接合作用在细菌、细胞向传递。基因工程中常用的质粒载体缺乏转移所需的基因(细胞向传递。基因工程中常用的质粒载体缺乏转移
26、所需的基因(mobmob基因),基因),不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌、细胞中。不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌、细胞中。质粒能够复制、传递和表达遗传信息,从分子质粒能够复制、传递和表达遗传信息,从分子遗传学观点来看是一种有机体,是比病毒更原始的生命形式,遗传学观点来看是一种有机体,是比病毒更原始的生命形式,基因工程的重要基因工程的重要任务之一就是严格改造质粒的同时,控制质粒不传递,若一个任务之一就是严格改造质粒的同时,控制质粒不传递,若一个致癌质粒可以传递就会传的到处都是。致癌质粒可以传递就会传的到处都是。(四)质粒研究意义(四)质粒研究意义
27、 A.A.都能独立自主的复制;都能独立自主的复制;B.B.都能便利的加以检测(抗生素抗性);都能便利的加以检测(抗生素抗性);C.C.都能容易引进宿主细胞中去,也易从宿主细胞中分离纯都能容易引进宿主细胞中去,也易从宿主细胞中分离纯化(提质粒)。化(提质粒)。质粒符合上述质粒符合上述3 3个条件。个条件。基因工程中主要使用人工构建的质粒。基因工程中主要使用人工构建的质粒。(五)质粒的分类(五)质粒的分类 (1)拷贝数少,一般10个,分子量大;(1)拷贝数多,10-200个,分子量小;(2)复制受限,受细菌宿主DNA复制系 (2)复制不受细菌DNA复制系统限制,统的控制;当宿主蛋白质合成受抑制时(
28、如培养 (3)特点是这类质粒可以自传递;中加入氯要素时),其拷贝数可猛增至 (4)严谨控制机理(低拷贝原因),认 1000-3000之多,该性质对基因工程技术 为是该质粒可以产生阻遏蛋白,反馈 十分有利。抑制自身DNA合成。3)分子量小,不具备自传递能力;4)基因工程使用松弛型(高拷贝数)质粒,以获得列多的基因产物。真核生物远比原核生物复杂,其基因组的容量远远大于真核生物远比原核生物复杂,其基因组的容量远远大于原核生物基因组,真核基因组结构和功能也更为复杂。真核原核生物基因组,真核基因组结构和功能也更为复杂。真核生物细胞具有细胞核,生物细胞具有细胞核,DNADNA为线性,与组蛋白、非组蛋白结为
29、线性,与组蛋白、非组蛋白结合成染色质,染色质组装在核内,外有核膜包裹,因此基因合成染色质,染色质组装在核内,外有核膜包裹,因此基因组的转录和翻译不能在同一空间进行,转录在细胞核、翻译组的转录和翻译不能在同一空间进行,转录在细胞核、翻译在胞浆。真核生物除了核基因组外,真核生物还具有线粒体在胞浆。真核生物除了核基因组外,真核生物还具有线粒体基因组,植物细胞叶绿体内也有遗传物质。基因组,植物细胞叶绿体内也有遗传物质。一、真核生物基因组结构与功能特点一、真核生物基因组结构与功能特点1 1、每一种真核生物都有一定的染色体数目,除了配、每一种真核生物都有一定的染色体数目,除了配子为单倍体外,体细胞一般为双
30、倍体。而原核生物子为单倍体外,体细胞一般为双倍体。而原核生物为单倍体。为单倍体。2 2、真核基因组远远大于原核生物基因组,结构复杂,、真核基因组远远大于原核生物基因组,结构复杂,基因数多。基因数多。具有多个复制起始点。具有多个复制起始点。3 3、真核生物基因组、真核生物基因组DNADNA与蛋白质结合形成染色体与蛋白质结合形成染色体,储储存于核内。存于核内。4 4、真核生物中含有大量的重复序列。、真核生物中含有大量的重复序列。5 5、真核生物基因组内非编码序列占、真核生物基因组内非编码序列占90%90%以上。基因组以上。基因组中非编码序列所占比例是真核生物与细菌、病毒的中非编码序列所占比例是真核
31、生物与细菌、病毒的重要区别,且在一定程度上也是生物进化的标尺。重要区别,且在一定程度上也是生物进化的标尺。6 6、真核基因是断裂基因,即编码序列被非编码序列、真核基因是断裂基因,即编码序列被非编码序列分隔开。分隔开。二、真核生物基因组的二、真核生物基因组的C值矛盾问题?值矛盾问题?同一物种的基因组同一物种的基因组DNA含量总是恒定的,一个单倍含量总是恒定的,一个单倍体基因组中的全部体基因组中的全部DNA量称为该量称为该物种物种DNA的的C值值。一般来说,随着生物的进化,生物体的结构与功能一般来说,随着生物的进化,生物体的结构与功能越复杂,基因组越复杂,基因组DNA也应增多,其也应增多,其C值就
32、越大。即值就越大。即C值随值随着生物的复杂性增加而增加。着生物的复杂性增加而增加。但真核生物中,这种进化的复杂程度与但真核生物中,这种进化的复杂程度与DNA的的C值值的大小并不完全一致。的大小并不完全一致。这种形态学复杂程度与这种形态学复杂程度与C值大小不一致的值大小不一致的C值反常现值反常现象称为象称为C值值矛盾矛盾 真核生物基因数目巨大,结构功能复杂,但这些众多真核生物基因数目巨大,结构功能复杂,但这些众多基因实际上是由数量有限的原始基因逐步进化、发展而来,基因实际上是由数量有限的原始基因逐步进化、发展而来,因此许多基因在核苷酸序列或编码产物的结构上存在着不因此许多基因在核苷酸序列或编码产
33、物的结构上存在着不同程度的同源性。同程度的同源性。基因家族基因家族:是指核苷酸序列或编码产物具有一定程度同是指核苷酸序列或编码产物具有一定程度同源性的一组基因源性的一组基因.同一基因家族成员可分散在不同的染色体上,也可集同一基因家族成员可分散在不同的染色体上,也可集中在一条染色体上,而且同一个基因家族的成员也不不一中在一条染色体上,而且同一个基因家族的成员也不不一定都是有功能的,没有功能的成员称为定都是有功能的,没有功能的成员称为假基因假基因。二、基因家族二、基因家族(gene family)(gene family)根据基因家族内各成员同源性的程度,基因家族分类根据基因家族内各成员同源性的程
34、度,基因家族分类:在真核生物基因组中,有些基因的拷贝数不只一个,可以有几个、在真核生物基因组中,有些基因的拷贝数不只一个,可以有几个、几十个或上百个,这些基因被称为几十个或上百个,这些基因被称为各各如如rRNA,tRNArRNA,tRNA家族和组蛋白基因家族。家族和组蛋白基因家族。tRNA tRNA基因基因:人类基因约有人类基因约有13001300个个tRNAtRNA基因,编码基因,编码5050多种多种tRNAtRNA。每种。每种tRNAtRNA可有可有10-10-几百个基因拷贝。同种几百个基因拷贝。同种tRNAtRNA往往串联在一起形成基因簇,但基往往串联在一起形成基因簇,但基因间有非转录间
35、隔区分隔,常常比结构基因长近因间有非转录间隔区分隔,常常比结构基因长近1010倍。倍。组蛋白基因家族在染色体上的排列则是另一种形式,组蛋白基因家族在染色体上的排列则是另一种形式,5 5种组蛋白基因串种组蛋白基因串联成一个单元,再由许多单元串联成一个大簇。这种重复排列与联成一个单元,再由许多单元串联成一个大簇。这种重复排列与DNADNA复复制时需要大量组蛋白有关。提高了组蛋白合成的效率。制时需要大量组蛋白有关。提高了组蛋白合成的效率。1、核酸序列相同、核酸序列相同2.2.家族中各基因家族中各基因人类生长激素基因家族人类生长激素基因家族 包括人生长激素(包括人生长激素(hGhhGh)、人胎盘促乳素
36、()、人胎盘促乳素(hCShCS)和)和催乳素。它们之间的同源性很高,尤其是催乳素。它们之间的同源性很高,尤其是hGhhGh和和hCShCS之间,之间,蛋白质氨基酸序列有蛋白质氨基酸序列有85%85%的同源性,的同源性,mRNAmRNA上序列上有上序列上有92%92%的同源性,说明它们是来自一个共同祖先基因。的同源性,说明它们是来自一个共同祖先基因。3 3种基种基因并不都排列在一起,因并不都排列在一起,hGhhGh和和hcshcs基因位于第基因位于第1717号染色体号染色体长臂,催乳素基因位于第长臂,催乳素基因位于第6 6号染色体号染色体。3.3.家族中各基因编码的产物蛋家族中各基因编码的产物
37、蛋白质有同源功能区白质有同源功能区(如如srcsrc癌基因家族癌基因家族 src,abl,fes,fgr,fps,fym,kck,lyn,ros,tkl,yessrc,abl,fes,fgr,fps,fym,kck,lyn,ros,tkl,yes此家族中各基因的此家族中各基因的DNADNA序列没有明显的同源性。序列没有明显的同源性。但每个基因产物都含有但每个基因产物都含有250250个氨基酸顺序的同源蛋个氨基酸顺序的同源蛋白激酶结构域。这个结构域白激酶结构域。这个结构域具有具有酪氨酸激酶活性酪氨酸激酶活性。共同。共同参与细胞信号转导。参与细胞信号转导。4.4.家族各基因编码的家族各基因编码的
38、这类基因家族中各成员的这类基因家族中各成员的DNADNA序列可能并不明显相关,而所序列可能并不明显相关,而所编码的产物具有共同的功能特征,存在一小段保守的氨基酸编码的产物具有共同的功能特征,存在一小段保守的氨基酸基序。基序。如如DEAD boxDEAD box基因家族。基因家族。DEAD boxDEAD box:Asp-Glu-Ala-Asp.Asp-Glu-Ala-Asp.此家族中各基因的此家族中各基因的DNADNA序列没有明显的同源性,但所有的表达序列没有明显的同源性,但所有的表达产物都具有解旋酶的功能,都具有同样的保守基序(产物都具有解旋酶的功能,都具有同样的保守基序(DEADDEAD盒
39、),盒),DEADDEAD是酶活性的关键结构。是酶活性的关键结构。5.5.基因超家族(基因超家族(gene superfamilygene superfamily)基因超家族基因超家族 它们的结构有程度不等的同源性,因此它它们的结构有程度不等的同源性,因此它们可能起源于相同的祖先基因,但是它们的功能并不一定相们可能起源于相同的祖先基因,但是它们的功能并不一定相同,这一点正是与多基因家族的差别所在。这些基因在进化同,这一点正是与多基因家族的差别所在。这些基因在进化上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。上也有亲缘关系,但亲缘关系较远,故将其称为基因超家族。如:如:表达产物都有免疫球
40、蛋白样的结构域结表达产物都有免疫球蛋白样的结构域结构。有构。有2 2个微球蛋白、个微球蛋白、MHCIMHCI类抗原的类抗原的链链,类抗原的类抗原的链和链和链、链、CD4CD4、CD8CD8等与免疫有关的分子。等与免疫有关的分子。以后又陆续发现了许多免疫系统内以及与免疫无关的家族成员。以后又陆续发现了许多免疫系统内以及与免疫无关的家族成员。假基因假基因(pseudogene)pseudogene)2.2.假基因常用符号假基因常用符号表示,如表示,如1 1 表示与表示与1 1 相似的假基相似的假基因因.3.3.假基因与有功能的基因同源假基因与有功能的基因同源,原来也可以是有功能的基因原来也可以是有
41、功能的基因,由于发生缺失由于发生缺失(deletion)(deletion)、倒位、倒位(inversion)(inversion)或点突变(或点突变(point point mutaionmutaion)等,成为无功能的基因,即形成了假基因,哺乳动物)等,成为无功能的基因,即形成了假基因,哺乳动物基因组中的基因组中的1/41/4基因为假基因,可能为进化的痕迹。基因为假基因,可能为进化的痕迹。三、真核生物三、真核生物DNA序列的类型序列的类型 真核生物染色体真核生物染色体DNA中存在着许多重复序列,根据中存在着许多重复序列,根据DNA序列出现频率的不同,可分为:单拷贝序列、中度重序列出现频率的
42、不同,可分为:单拷贝序列、中度重复序列、高度重复序列。复序列、高度重复序列。单拷贝序列单拷贝序列:该拷贝序列在基因组中只出现一次或少数几次该拷贝序列在基因组中只出现一次或少数几次(10)。真核生物的大多数基因都是单拷贝。真核生物的大多数基因都是单拷贝。中度重复序列中度重复序列:中度重复序列基因重复次数在数十次至数万次(中度重复序列基因重复次数在数十次至数万次(10 105 5的的DNADNA序列,这种序列可以集序列,这种序列可以集中分布在某一区域串联排列,典型的高度重复序列有中分布在某一区域串联排列,典型的高度重复序列有卫星卫星DNADNA和和反向重复序列反向重复序列两类。两类。反向重复顺序反
43、向重复顺序(inverted repeats,IRinverted repeats,IR)是指两个顺序相同的)是指两个顺序相同的拷贝在拷贝在DNADNA链上呈反向排列。反向重复顺序有两种形式。链上呈反向排列。反向重复顺序有两种形式。.连续的连续的反向重复顺序,这种结构又称反向重复顺序,这种结构又称.不连续不连续的反向重复顺序之间含有间隔顺序。的反向重复顺序之间含有间隔顺序。ATTAGC GCTAAT ATTAGC GGAT GCTAATATTAGC GCTAAT ATTAGC GGAT GCTAATTAATCG CGATTA TAATCG CCTA CGATTATAATCG CGATTA TA
44、ATCG CCTA CGATTA反向重复顺序占人类基因组反向重复顺序占人类基因组5%5%,可能与复制、转录调控有关。,可能与复制、转录调控有关。卫星卫星DNADNA 将基因组将基因组DNADNA切成较小片段(数百个碱基对的片段切成较小片段(数百个碱基对的片段10104 4),用氯化铯进行密度梯度离心时,真核生物大部分),用氯化铯进行密度梯度离心时,真核生物大部分DNADNA形成一个主峰形成一个主峰(CG(CG含量在含量在30-50%)30-50%),有些高度重复序列,有些高度重复序列的的DNADNA由于碱基组成不同,出现小峰,因小峰在主峰旁似由于碱基组成不同,出现小峰,因小峰在主峰旁似卫星而得
45、名。卫星而得名。卫星卫星DNADNA不编码蛋白质或不编码蛋白质或RNARNA。它在染色体的位置主。它在染色体的位置主要位于着丝粒、端粒处。要位于着丝粒、端粒处。卫星卫星DNADNA分类分类:1 1、大卫星大卫星DNADNA:也称为经典卫星:也称为经典卫星DNADNA。是在氯化铯密度梯。是在氯化铯密度梯度离心时发现。总长度约度离心时发现。总长度约100KB-100KB-几个几个MBMB2 2、小卫星小卫星DNADNA:由中等大小的串联重复顺序构成,卫星:由中等大小的串联重复顺序构成,卫星总长度约总长度约0.1-20KB0.1-20KB。如分布在端粒区域。如分布在端粒区域3 3、微卫星微卫星DNA
46、DNA:是一类更简单的寡核苷酸串联重复顺序:是一类更简单的寡核苷酸串联重复顺序组成。重复单位为组成。重复单位为1-5BP1-5BP,常见的是以(,常见的是以(ACAC)n n、(、(TGTG)n n的二聚核苷酸为重复单位。它可以分布在内含子、间隔的二聚核苷酸为重复单位。它可以分布在内含子、间隔DNADNA,也可以在编码区存在,也可以在编码区存在.人类基因组中的人类基因组中的DNADNA多态性多态性 人类个体之间之所以千差万别,其物质基础在于人类个体之间之所以千差万别,其物质基础在于基因组基因组DNADNA的差异造成的。的差异造成的。DNADNA序列多态性是这些序列多态性是这些差异中十分重要一种
47、。差异中十分重要一种。DNADNA序列多态性可分为以序列多态性可分为以下两类:下两类:1 1、DNADNA位点多态性位点多态性2 2、串联重复顺序多态性、串联重复顺序多态性1 1、DNADNA位点多态性位点多态性 DNA DNA位点多态性是由于等位基因间特定位点上位点多态性是由于等位基因间特定位点上DNADNA序列存在序列存在差异造成的。差异造成的。在在DNADNA位点多态性中,可能影响位点多态性中,可能影响DNADNA序列中的限制性内切酶序列中的限制性内切酶位点,造成位点,造成限制性片段长度多态性限制性片段长度多态性(restriction fragment restriction frag
48、ment length polymorphism length polymorphism RFLPRFLP)。即利用同一种限制性内切酶)。即利用同一种限制性内切酶消化消化DNADNA时,在同种生物的不同个体中会出现不同长度的限制时,在同种生物的不同个体中会出现不同长度的限制性片段类型,即限制性片段长度多态性,简称性片段类型,即限制性片段长度多态性,简称RFLPRFLP技术。技术。RFLPRFLP产生的原因产生的原因 是是DNADNA顺序上某个碱基发生突变,如单个碱基顺序上某个碱基发生突变,如单个碱基置换,或少数碱基缺失、重复、插入,使突变部位置换,或少数碱基缺失、重复、插入,使突变部位的的DN
49、ADNA序列产生或丢失某种限制性内切酶位点,当序列产生或丢失某种限制性内切酶位点,当用该限制性内切酶消化此用该限制性内切酶消化此DNADNA时,使时,使DNADNA限制性片段限制性片段长度发生变化,产生与正常不同的限制性片段。长度发生变化,产生与正常不同的限制性片段。由于真核生物体内串联重复序列的拷贝数不同造成由于真核生物体内串联重复序列的拷贝数不同造成串联重复次数有较大的变化,形成串联重复顺序多态性串联重复次数有较大的变化,形成串联重复顺序多态性(tandem repeats polymorphism),tandem repeats polymorphism),也称为也称为可变数目的可变数目
50、的串联重复序列(串联重复序列(variable number of tandem repeats variable number of tandem repeats VNTRVNTRS S)。串联重复顺序长度多态性是另一种。串联重复顺序长度多态性是另一种DNADNA序列长序列长度多态性度多态性,这种多态性在人群中有极高的频率这种多态性在人群中有极高的频率.串联重复串联重复顺序长度多态性主要发生在小卫星顺序长度多态性主要发生在小卫星DNADNA、微卫星、微卫星DNADNA中中 。同时人类基因组位点多态性和串联重复多态性都是按孟同时人类基因组位点多态性和串联重复多态性都是按孟德尔规律遗传的德尔规律