1、2022-8-7鲁云霞制作1l重点:重点:基因组的概念,各类生物基因组的特基因组的概念,各类生物基因组的特点。点。l难点:难点:各类生物基因组的结构特点。各类生物基因组的结构特点。l基本要求:基本要求:l掌握掌握基因组的概念、各类生物基因组的结构基因组的概念、各类生物基因组的结构特点;特点;l熟悉熟悉基因的转位与插入;基因的转位与插入;l比较和了解比较和了解各类生物基因组的差异。各类生物基因组的差异。2022-8-7鲁云霞制作2l从简单的病毒到复杂的高等动植物细胞,都有一套从简单的病毒到复杂的高等动植物细胞,都有一套决定于生物基本特征和功能的遗传信息,贮存于病决定于生物基本特征和功能的遗传信息
2、,贮存于病毒或细胞的核酸中;毒或细胞的核酸中;lRNARNA和蛋白质的结构信息都以基因的形式贮存于和蛋白质的结构信息都以基因的形式贮存于DNADNA(或(或RNARNA)中;)中;lDNADNA中有大量非编码序列中有大量非编码序列,在真核生物中高达,在真核生物中高达95%95%以以上;上;l含有一种生物的一整套遗传信息的遗传物质,称为含有一种生物的一整套遗传信息的遗传物质,称为基因组。基因组。l病毒、原核生物及真核生物所贮存的遗传信息量有病毒、原核生物及真核生物所贮存的遗传信息量有巨大的差别,其基因组的结构与组织形式上也各有巨大的差别,其基因组的结构与组织形式上也各有特点。特点。2022-8-
3、7鲁云霞制作3l第一节第一节 基因组的概念基因组的概念l第二节第二节 病毒基因组的结构特点病毒基因组的结构特点l第三节第三节 原核生物的基因组原核生物的基因组l第四节第四节 真核生物基因组真核生物基因组l第五节第五节 基因组变异的意义基因组变异的意义l第六节第六节 人类基因组学简介人类基因组学简介2022-8-7鲁云霞制作4 一、基因组储存了生物体整套的遗传信息一、基因组储存了生物体整套的遗传信息l基因组(基因组(genomegenome)泛指一个细胞或病毒的全)泛指一个细胞或病毒的全部遗传信息。部遗传信息。在真核生物体中,基因组是指一在真核生物体中,基因组是指一套完整单倍体套完整单倍体DNA
4、(DNA(染色体染色体DNA)DNA)和线粒体和线粒体DNADNA的全部序列,既包括编码序列,也包括大的全部序列,既包括编码序列,也包括大量存在的非编码序列。量存在的非编码序列。l人类基因组包含人类基因组包含22条常染色体和条常染色体和X、Y两条性两条性染色体上的全部遗传物质(核基因组)以及胞染色体上的全部遗传物质(核基因组)以及胞浆线粒体上的遗传物质(线粒体基因组)。浆线粒体上的遗传物质(线粒体基因组)。某某些病毒的基因组由些病毒的基因组由RNA组成组成。2022-8-7鲁云霞制作5l基因组的大小通常以其基因组的大小通常以其DNA含量来表示,单倍体含量来表示,单倍体基因组中的全部基因组中的全
5、部DNA量称为量称为C值(值(C-value););l不同生物的基因组大小差异很大。基因组大小和不同生物的基因组大小差异很大。基因组大小和DNA含量随着生物进化复杂程度的增加以及生物含量随着生物进化复杂程度的增加以及生物结构和功能复杂程度的增加而逐步上升;结构和功能复杂程度的增加而逐步上升;lC值矛盾:如人的值矛盾:如人的C值只有值只有109bp,肺鱼的,肺鱼的C值为值为1011bp;l基因组的大小与基因的数目没有直接的线性关系。基因组的大小与基因的数目没有直接的线性关系。2022-8-7鲁云霞制作6类别类别基因组(基因组(bp)基因数目基因数目数量级数量级乙肝病毒乙肝病毒 3125(部分单链
6、)(部分单链)5 103 噬菌体噬菌体 48531 60 104 EB病毒病毒 172282 80 105 大肠杆菌大肠杆菌 4.2106 3000 106 人人 类类 3109 3万万4万万 109 2022-8-7鲁云霞制作7l原核生物的基因组一般较小,结构比较简单;原核生物的基因组一般较小,结构比较简单;l病毒基因组的大小和结构差异较大;病毒基因组的大小和结构差异较大;l真核生物基因组一般较庞大,但结构基因在真核生物基因组一般较庞大,但结构基因在基因组中所占的比例较小,其中编码序列更基因组中所占的比例较小,其中编码序列更小,且存在大量重复序列;小,且存在大量重复序列;l人的基因组中只有人
7、的基因组中只有23%的的DNA序列是编码序列是编码序列。序列。2022-8-7鲁云霞制作8基因组信息基因组信息人类基因组:人类基因组:编码区域只占编码区域只占2%-3%对于非编码序列,尚不清楚其含义或功能对于非编码序列,尚不清楚其含义或功能非编码区域对于生命活动具有重要的意义非编码区域对于生命活动具有重要的意义 包括包括内含子内含子、简单重复序列、移动元件、假基因、简单重复序列、移动元件、假基因 重复序列重复序列:大卫星(大卫星(macro-satellite)DNA小卫星(小卫星(mini-satellite)DNA微卫星(微卫星(micro-satellite)DNA 顺式调控元件顺式调控
8、元件:启动子、增强子、沉默子启动子、增强子、沉默子2022-8-7鲁云霞制作9l病毒(病毒(virus)是最简单的生命形式,遗传信)是最简单的生命形式,遗传信息的延续构成了生命活动的主要内容。息的延续构成了生命活动的主要内容。l病毒基因组的主要功能就是保证基因组的复病毒基因组的主要功能就是保证基因组的复制及其向子代传递,整套基因组所编码的蛋制及其向子代传递,整套基因组所编码的蛋白质都是与基因复制、病毒颗粒包装以及向白质都是与基因复制、病毒颗粒包装以及向其它宿主细胞传递密切相关,有些蛋白质可其它宿主细胞传递密切相关,有些蛋白质可影响宿主细胞基因表达和增殖,通过促进细影响宿主细胞基因表达和增殖,通
9、过促进细胞的增殖而有利于病毒复制繁衍。胞的增殖而有利于病毒复制繁衍。2022-8-7鲁云霞制作102022-8-7鲁云霞制作11l病毒基因组(病毒基因组(virus genome)的核酸有)的核酸有DNA,也有,也有RNA,但不会二者共存但不会二者共存。l按照核酸的性质、基因组结构及复制的特点,可以按照核酸的性质、基因组结构及复制的特点,可以将病毒基因组分为以下几类:将病毒基因组分为以下几类:l l 单链单链DNADNA:如:如X174X174;l 双链双链RNARNA如轮状病毒如轮状病毒含有正负两条含有正负两条RNARNA链;链;l 单链负股单链负股RNARNA如流感病毒如流感病毒需要先合成
10、与其互补的需要先合成与其互补的mRNAmRNA;l 单链正股单链正股RNARNA如如SARSSARS;逆转录病毒通常引起人;逆转录病毒通常引起人和动物的肿瘤,如和动物的肿瘤,如HIVHIV可作为可作为mRNAmRNA行使模板功能。行使模板功能。2022-8-7鲁云霞制作12lSARS冠状病毒属于单股正链冠状病毒属于单股正链RNA病毒;病毒;lRNA分子不分节段,分子不分节段,5端有甲基化帽,端有甲基化帽,3端有端有polyA结结构,基因组长度在构,基因组长度在2700030000碱基之间;碱基之间;l5端约端约2/3的区域编码病毒的区域编码病毒RNA聚合酶蛋白,后聚合酶蛋白,后1/3的区的区域
11、编码结构蛋白,依次为域编码结构蛋白,依次为S蛋白蛋白(spike protein),E蛋白蛋白(envelop protein),M蛋白蛋白(membrane protein),N蛋白蛋白(nucleocapsid protein)等等;l在结构蛋白编码区可能的在结构蛋白编码区可能的ORF中,能编码在已知蛋白中,能编码在已知蛋白质序列数据库中未找到任何同源序列的未知蛋白质序列数据库中未找到任何同源序列的未知蛋白PUP(predicted unknown protein)。2022-8-7鲁云霞制作132022-8-7鲁云霞制作14l逆转录病毒是一类特殊的单股正链逆转录病毒是一类特殊的单股正链R
12、NARNA病病毒,通常引起人和动物的肿瘤;毒,通常引起人和动物的肿瘤;l逆转录病毒基因组一般包括逆转录病毒基因组一般包括3 3个基本的结个基本的结构基因,即构基因,即gaggag、polpol、envenv,分别编码核心蛋分别编码核心蛋 白、逆转录酶和膜蛋白。白、逆转录酶和膜蛋白。2022-8-7鲁云霞制作15 逆转录病毒的基因组结构逆转录病毒的基因组结构2022-8-7鲁云霞制作16l 不同病毒基因组大小相差较大不同病毒基因组大小相差较大l乙肝病毒(乙肝病毒(HBV)DNA为为3.2kb,所含信息,所含信息量较少,只能编码几种蛋白质;而痘病毒基量较少,只能编码几种蛋白质;而痘病毒基因组因组D
13、NA长达长达300kb,可编码几百种蛋白质。,可编码几百种蛋白质。l 不同病毒基因组可以是不同结构的核酸不同病毒基因组可以是不同结构的核酸l病毒基因组的核酸可能是病毒基因组的核酸可能是DNA,也可能是,也可能是RNA;可能是单链,也可能是双链;可能是;可能是单链,也可能是双链;可能是闭合环状分子,也可能是线性分子。闭合环状分子,也可能是线性分子。2022-8-7鲁云霞制作17l 病毒基因组有连续的也有不连续的病毒基因组有连续的也有不连续的lDNADNA 病毒基因组均由连续的病毒基因组均由连续的DNA分子组成;分子组成;多数多数RNA病毒基因组也由连续的核糖核酸链病毒基因组也由连续的核糖核酸链组
14、成,但有些则以不连续的核糖核酸链组成。组成,但有些则以不连续的核糖核酸链组成。l 病毒基因组的编码序列大于病毒基因组的编码序列大于9090 l病毒基因组的大部分是用来编码蛋白质的,病毒基因组的大部分是用来编码蛋白质的,只有很小部分不编码蛋白质。只有很小部分不编码蛋白质。l 单倍体基因组单倍体基因组 除逆转录病毒基因组有两除逆转录病毒基因组有两个拷贝外,至今发现的病毒基因组都是单倍个拷贝外,至今发现的病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。体,每个基因在病毒颗粒中只出现一次。2022-8-7鲁云霞制作18l 基因有连续的和间断的基因有连续的和间断的 感染细菌的病毒感染细菌的病毒(噬
15、菌体)基因组与细菌基因组结构特点相(噬菌体)基因组与细菌基因组结构特点相似,基因是连续的;而感染真核细胞的病毒似,基因是连续的;而感染真核细胞的病毒基因组与真核生物基因组结构相似,有内含基因组与真核生物基因组结构相似,有内含子,基因是间断的。子,基因是间断的。l 相关基因丛集排列相关基因丛集排列 病毒基因组核酸序列病毒基因组核酸序列中功能相关的几个蛋白质基因丛集在基因组中功能相关的几个蛋白质基因丛集在基因组的一个或几个特定部位,形成一个功能单位的一个或几个特定部位,形成一个功能单位或转录单元,受同一个转录调控机制调节,或转录单元,受同一个转录调控机制调节,它们可被一起转录成为多顺反子它们可被一
16、起转录成为多顺反子mRNA,然后,然后加工成为各种蛋白质的模板。加工成为各种蛋白质的模板。2022-8-7鲁云霞制作19l 基因重叠基因重叠 有些病毒在进化过程中形成有些病毒在进化过程中形成重叠基因,即同一段核酸序列能编码重叠基因,即同一段核酸序列能编码2种或种或2种以上蛋白质。这些重叠基因虽然共用一段种以上蛋白质。这些重叠基因虽然共用一段核酸序列,但转录出的核酸序列,但转录出的mRNA链阅读框不同。链阅读框不同。lX174噬菌体的基因结构噬菌体的基因结构 Ala Glu Gly Val Met 终止终止 -G C GG A A G G A G T GA T G T A A T G T C T
17、-Arg Lys Glu 终止 起始 Ser2022-8-7鲁云霞制作20噬菌体噬菌体 x174基因图谱基因图谱2022-8-7鲁云霞制作212022-8-7鲁云霞制作22lSV40病毒的基因组是双链环状病毒的基因组是双链环状DNA,全长,全长5243bp,基因组复制通过,基因组复制通过DNA复制过程而完成;复制过程而完成;l基因组中含有早期转录基因和晚期转录基因两基因组中含有早期转录基因和晚期转录基因两部分,早晚期转录的两部分基因大约等长,但部分,早晚期转录的两部分基因大约等长,但转录方向相反;转录方向相反;l在早期和晚期转录区之间是调控区(约在早期和晚期转录区之间是调控区(约400bp),
18、主要包括复制起点、启动子和增强),主要包括复制起点、启动子和增强子,可调节基因组的复制及早期和晚期基因的子,可调节基因组的复制及早期和晚期基因的转录。转录。2022-8-7鲁云霞制作23典型病毒基因组介绍典型病毒基因组介绍2022-8-7鲁云霞制作24l原核生物一般只有一个染色体,即一个核酸原核生物一般只有一个染色体,即一个核酸分子,大多数为双螺旋结构,少数为单链形分子,大多数为双螺旋结构,少数为单链形式存在。式存在。原核生物基因组较小,结构简单原核生物基因组较小,结构简单。l原核生物需要根据外界环境的变化,调节自原核生物需要根据外界环境的变化,调节自身的酶系统的组成及功能,利用不同的营养身的
19、酶系统的组成及功能,利用不同的营养物质,调整细胞内某些蛋白质的数量;物质,调整细胞内某些蛋白质的数量;l原核基因组中存在操纵子结构,一个调控区原核基因组中存在操纵子结构,一个调控区控制数个结构基因,结构基因是成套表达的,控制数个结构基因,结构基因是成套表达的,从而可以有效地利用核酸序列。从而可以有效地利用核酸序列。2022-8-7鲁云霞制作25原核生物转录后的原核生物转录后的mRNA结构图结构图2022-8-7鲁云霞制作26l1.基因组通常由一基因组通常由一条环状条环状DNA分子组分子组成成。没有明显的核。没有明显的核结构,在细胞内相结构,在细胞内相对集中在一个区域,对集中在一个区域,形成类核
20、结构。其形成类核结构。其中中DNA占占80,其,其余为余为RNA和蛋白质。和蛋白质。2022-8-7鲁云霞制作27Nucleoid(类核类核,拟核拟核)Bacterial chromosome 细菌染色体细菌染色体2022-8-7鲁云霞制作28l2.基因组中只有基因组中只有1个复制起始点。个复制起始点。l3.基因操纵子结构。基因操纵子结构。操纵子(操纵子(operon)是指数)是指数个功能相关的结构基因(个功能相关的结构基因(sructure gene)串联)串联在一起,构成信息区,连同上游的调控区在一起,构成信息区,连同上游的调控区(包括启动子和操纵基因)以及下游的转录(包括启动子和操纵基因
21、)以及下游的转录终止信号所构成的基因表达单位,所转录出终止信号所构成的基因表达单位,所转录出的的RNA为多顺反子。为多顺反子。l4.编码序列一般不重叠。编码序列一般不重叠。l5.基因是连续的基因是连续的,无内含子,转录后不需要剪,无内含子,转录后不需要剪接(切)。接(切)。l6.编码区在基因组中所占的比例编码区在基因组中所占的比例(约占(约占50)远远大于真核基因组,但小于病毒基因组。远远大于真核基因组,但小于病毒基因组。非编码区主要是一些调控序列。非编码区主要是一些调控序列。2022-8-7鲁云霞制作29l7.基因组中很少有重复序列。基因组中很少有重复序列。编码蛋白质的编码蛋白质的结构基因多
22、为单拷贝,而编码结构基因多为单拷贝,而编码rRNA的基因往的基因往往是多拷贝的。往是多拷贝的。l8.细菌基因组中存在有可移动的细菌基因组中存在有可移动的DNA序列序列,包括插入序列和转座子。包括插入序列和转座子。l9.具有编码同工酶的基因。具有编码同工酶的基因。l10.在在DNA分子中具有多种功能的识别区域分子中具有多种功能的识别区域,如复制的起始区、复制终止区、转录启动区如复制的起始区、复制终止区、转录启动区转录终止区等。这些区域往往具有特殊的序转录终止区等。这些区域往往具有特殊的序列,并且含有反向重复序列。列,并且含有反向重复序列。2022-8-7鲁云霞制作302022-8-7鲁云霞制作3
23、1l转座因子转座因子(transposable element)是能在一)是能在一个个DNA分子内部或两个分子内部或两个DNA分子之间移动的分子之间移动的DNA片段。在细菌中,则指可在质粒和染色片段。在细菌中,则指可在质粒和染色体之间或在质粒与质粒之间移动的体之间或在质粒与质粒之间移动的DNA片段。片段。转位也是转位也是DNA重组的一种形式。重组的一种形式。l 插入顺序插入顺序 插入顺序(插入顺序(insertion sequence,IS)是一类较小的没有表型效应的转位因子,)是一类较小的没有表型效应的转位因子,长度约长度约7002000bp,由一个转位酶基因及两,由一个转位酶基因及两侧的反
24、向重复序列(侧的反向重复序列(inverted repeat sequence,IR)组成。)组成。2022-8-7鲁云霞制作32lIR的对称结构使的对称结构使IS可以双向插入靶位点,并可以双向插入靶位点,并在插入后于两侧形成一定长度(在插入后于两侧形成一定长度(311bp)的)的顺向重复序列(顺向重复序列(direct repeat sequence,DR),),DR是靶位点序列复制的产物。是靶位点序列复制的产物。l 转座子转座子 转座子(转座子(transposon,Tn)是一类)是一类较大的可移动成分,除有关转座的基因外,较大的可移动成分,除有关转座的基因外,至少带有一个与转座作用无关并
25、决定宿主细至少带有一个与转座作用无关并决定宿主细胞(菌)遗传性状的基因。转座子中的转位胞(菌)遗传性状的基因。转座子中的转位酶常称为转座酶,其功能是介导转座子插入酶常称为转座酶,其功能是介导转座子插入到到DNA的其他部位。的其他部位。l 可转座的噬菌体可转座的噬菌体 可转座的噬菌体可转座的噬菌体(transposable phage)是一类具有转座功能)是一类具有转座功能的溶源性噬菌体,包括的溶源性噬菌体,包括Mu和和D108等。等。2022-8-7鲁云霞制作332022-8-7鲁云霞制作34简化的转座过程简化的转座过程2022-8-7鲁云霞制作35l由转座因子复制出一个新拷贝转移到基因组中的
26、新由转座因子复制出一个新拷贝转移到基因组中的新位置;位置;l新的转座因子转到靶点后,靶点序列倍增成为新的转座因子转到靶点后,靶点序列倍增成为2个个靶点序列,并分别排列在转座因子两侧,形成靶点序列,并分别排列在转座因子两侧,形成同向同向重复序列重复序列(见图(见图 ););l在转座过程中能形成共合体;在转座过程中能形成共合体;l转座因子转座后能促使染色体畸变;转座因子转座后能促使染色体畸变;l转座因子从原来位置上切除(切离,转座因子从原来位置上切除(切离,excision););l转座可引起插入突变;转座可引起插入突变;l由于携带有标志基因如由于携带有标志基因如ampR、terR、smR,使受,
27、使受体基因组增添了新的基因。体基因组增添了新的基因。2022-8-7鲁云霞制作36转座子具有反转座子具有反向末端重复序向末端重复序列以及在靶部列以及在靶部位两侧产生的位两侧产生的同向重复序列。同向重复序列。在该例中靶序在该例中靶序列为列为5bp,转,转座子末端由座子末端由9bp反向重复反向重复序列组成,数序列组成,数字字1-9指序列重指序列重复碱基对。复碱基对。2022-8-7鲁云霞制作37l是存在于细菌染色体外的具有是存在于细菌染色体外的具有自主复制能力自主复制能力的共价的共价闭合环状双链闭合环状双链DNA分子。分子。l分子量一般为分子量一般为106108,小型质粒的长度一般为,小型质粒的长
28、度一般为1.515kb。l其基因组的结构特点类似于细菌基因组。其基因组的结构特点类似于细菌基因组。l通常质粒对于宿主细胞的生存不是必需的,但质粒通常质粒对于宿主细胞的生存不是必需的,但质粒含有的某些基因,可对宿主细胞的生物特性产生影含有的某些基因,可对宿主细胞的生物特性产生影响。响。l因质粒是一个完整、独立的复制子,并能转化细胞,因质粒是一个完整、独立的复制子,并能转化细胞,即把它的一个复本从供体细胞转移给受体细胞,而即把它的一个复本从供体细胞转移给受体细胞,而且能给转化细胞带来特殊标记,故在基因工程技术且能给转化细胞带来特殊标记,故在基因工程技术中作为目的基因的载体被广泛应用。中作为目的基因
29、的载体被广泛应用。2022-8-7鲁云霞制作38AmproripUC18(3 kb)MCS(Multiple cloning sites,多克隆位点)Lac promoterlacZACGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCA.T h rA s n S er S e r Val Pro Gly Asp Pro Leu Glu Ser Thr Cys Arg His Ala SerEcoRI SacI KpnISmaIXmaIBamHIXbaISalIHincIIAccIPstISphILac Z The ORF of the in
30、serted gene has to be in the same direction as that of the lacZ A fusion protein contains the N-terminal sequence of lacZ and the inserted ORF will be produced 2022-8-7鲁云霞制作39AmproripUC18(3 kb)MCS(Multiple cloning sites,多克隆位点)Lac promoterlacZACGAATTCGAGCTCGGTACCCGGGGATCCTCTAGAGTCGACCTGCAGGCATGCA.T h
31、 rA s n S er S e r Val Pro Gly Asp Pro Leu Glu Ser Thr Cys Arg His Ala SerEcoRI SacI KpnISmaIXmaIBamHIXbaISalIHincIIAccIPstISphILac Z The ORF of the inserted gene has to be in the same direction as that of the lacZ A fusion protein contains the N-terminal sequence of lacZ and the inserted ORF will b
32、e produced 2022-8-7鲁云霞制作40Ampicillin resistant?yes yesTetracycline resistant?No yesB X BBBXAmproriAmprTcroriAmprTcroripBR322B抗性基因的插入失活以筛选重组质粒抗性基因的插入失活以筛选重组质粒2022-8-7鲁云霞制作41l复制调控系统复制调控系统:由复制起点(:由复制起点(ori)、rep基因、基因、cop基因组成,控制质粒的拷贝数;基因组成,控制质粒的拷贝数;l分配系统分配系统:使质粒在细菌分裂过程中精确分配到子使质粒在细菌分裂过程中精确分配到子细胞中;细胞中;l细胞分
33、裂系统细胞分裂系统:抑制细胞分裂,使细胞分裂与质:抑制细胞分裂,使细胞分裂与质粒复制协调;粒复制协调;l位点特异重组系统位点特异重组系统:由质粒:由质粒att位点、质粒编码的位点、质粒编码的Int和和Xis酶、宿主酶、宿主FIS组成,将高拷贝质粒形成的组成,将高拷贝质粒形成的多聚体拆开成单体,便于平均分配;多聚体拆开成单体,便于平均分配;l质粒的不相容性质粒的不相容性:具有相同复制起始位点和分配具有相同复制起始位点和分配区的两种质粒不能共存于一个宿主菌。区的两种质粒不能共存于一个宿主菌。2022-8-7鲁云霞制作42l接合型质粒、可移动型质粒和自传递质粒:接合型质粒、可移动型质粒和自传递质粒:
34、接接合型质粒只能使细菌接合;可移动型质粒可被合型质粒只能使细菌接合;可移动型质粒可被传递;自传递型质粒兼具上述两种质粒的功能传递;自传递型质粒兼具上述两种质粒的功能(如(如F质粒)。质粒)。l严谨型和松弛型质粒严谨型和松弛型质粒:分别为低拷贝数和高拷:分别为低拷贝数和高拷贝数质粒。贝数质粒。l窄宿主谱及广宿主谱质粒窄宿主谱及广宿主谱质粒:窄宿主谱质粒存在:窄宿主谱质粒存在于一种或数种密切相关的宿主(如于一种或数种密切相关的宿主(如ColE);广);广宿主谱质粒可在不同科、属、种细菌间传递宿主谱质粒可在不同科、属、种细菌间传递(如(如pC194)。)。2022-8-7鲁云霞制作43l细菌基因组学
35、是测定细菌全基因组序列,把细细菌基因组学是测定细菌全基因组序列,把细菌全基因组序列的知识和分析序列的情报工具菌全基因组序列的知识和分析序列的情报工具结合起来,研究细菌的毒力和致病性的一门科结合起来,研究细菌的毒力和致病性的一门科学。学。l更好地了解病原微生物的致病机制;更好地了解病原微生物的致病机制;l加快重要致病基因的发现速度;加快重要致病基因的发现速度;l寻找病原菌特异的寻找病原菌特异的DNA序列,提高临床诊断的序列,提高临床诊断的效率和准确性;效率和准确性;l为筛选有效药物及发展疫苗提供参考。为筛选有效药物及发展疫苗提供参考。2022-8-7鲁云霞制作44一、真核生物基因组远大于原核生物
36、基因组一、真核生物基因组远大于原核生物基因组l真核生物(真核生物(eukaryote)基因组的容量远远大)基因组的容量远远大于原核生物基因组,真核基因组的结构与功于原核生物基因组,真核基因组的结构与功能更为复杂。能更为复杂。l人的单倍体基因组人的单倍体基因组DNA约为约为3.3x109bp,大肠,大肠杆菌的基因组只有杆菌的基因组只有4.6x106bp。2022-8-7鲁云霞制作45l真核生物细胞具有细胞核,真核生物细胞具有细胞核,DNA为线状,为线状,与组蛋白、非组蛋白结合成染色质。与组蛋白、非组蛋白结合成染色质。l除细胞核基因组外,真核生物还具有线除细胞核基因组外,真核生物还具有线粒体基因组
37、,在植物细胞中的叶绿体内粒体基因组,在植物细胞中的叶绿体内也有遗传物质。也有遗传物质。2022-8-7鲁云霞制作462022-8-7鲁云霞制作472022-8-7鲁云霞制作48l1、每一种真核生物都有一定的染色体数目,、每一种真核生物都有一定的染色体数目,除配子(精子和卵子)为单倍体外,体细胞一除配子(精子和卵子)为单倍体外,体细胞一般为双倍体,即含有两份同源的基因组。般为双倍体,即含有两份同源的基因组。l2、真核基因组远远大于原核生物基因组,、真核基因组远远大于原核生物基因组,结结构复杂,基因数庞大构复杂,基因数庞大,具有许多复制起始点,具有许多复制起始点,每个复制子大小不一。每个复制子大小
38、不一。l3、真核基因都由一个结构基因与相关的调控、真核基因都由一个结构基因与相关的调控区 组 成,区 组 成,转 录 产 物 为 单 顺 反 子转 录 产 物 为 单 顺 反 子(monocistron),即一分子),即一分子mRNA只能翻译只能翻译成一种蛋白质。成一种蛋白质。l4、真核生物含有大量重复顺序真核生物含有大量重复顺序。2022-8-7鲁云霞制作49l5、真核生物基因组内非编码序列(真核生物基因组内非编码序列(non-coding sequence,NCS)占)占90以上以上。l6、真核基因是、真核基因是断裂基因断裂基因(split gene),即编),即编码序列被非编码序列分割开
39、来,基因与基因间码序列被非编码序列分割开来,基因与基因间的非编码序列为间隔的非编码序列为间隔DNA(spacer DNA),),基因内非编码序列为内含子,被内含子隔开的基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。编码序列则为外显子。l7、功能相关的基因构成各种、功能相关的基因构成各种基因家族基因家族,它们,它们可以串联在一起,亦可相距很远,但即使串联可以串联在一起,亦可相距很远,但即使串联在一起的成簇的基因也是分别转录的。在一起的成簇的基因也是分别转录的。l8、真核生物基因组中也存在有、真核生物基因组中也存在有一些可移动的一些可移动的遗传因素遗传因素(mobile geneti
40、c elements)。)。2022-8-7鲁云霞制作50内含子、启动子内含子、启动子假基因假基因基因片段基因片段非编码序列非编码序列 90 编码序列编码序列105)的)的DNA序列称为高度重复序列称为高度重复序列。典型的高度重复序列有卫星序列。典型的高度重复序列有卫星DNA和反和反向重复序列两类。向重复序列两类。l 中度重复序列中度重复序列 中度重复序列是在基因组中度重复序列是在基因组中的重复次数为中的重复次数为101105。中度重复序列约占。中度重复序列约占基因组基因组DNA总量的总量的35。l 单拷贝序列单拷贝序列 在整个基因组中仅出现一次在整个基因组中仅出现一次或少数几次。大多数编码蛋
41、白质的基因都属或少数几次。大多数编码蛋白质的基因都属于这一类。于这一类。2022-8-7鲁云霞制作53(一)高重复序列(一)高重复序列DNA:可集中在某一区域串:可集中在某一区域串联排列,典型的高重复序列有卫星联排列,典型的高重复序列有卫星DNA和反和反向重复序列。向重复序列。1.卫星卫星DNA是出现在非编码区的串联重复序列,是出现在非编码区的串联重复序列,通常存在于间隔通常存在于间隔DNA和内含子中,分为:和内含子中,分为:大卫星大卫星DNA:也称经典卫星:也称经典卫星DNA;小卫星小卫星DNA:由中等大小的串联重复顺序组:由中等大小的串联重复顺序组成,有高度可变的小卫星成,有高度可变的小卫
42、星DNA和端粒和端粒DNA;微卫星微卫星DNA:一类更简单的寡核苷酸串联重:一类更简单的寡核苷酸串联重复序列。复序列。2022-8-7鲁云霞制作54Satellite DNAMouse genome DNA30%GC in satellite DNACsCl centrifugation2022-8-7鲁云霞制作55卫星卫星 DNAs 经常存经常存在于异染色质在于异染色质2022-8-7鲁云霞制作56鼠卫星位于着丝粒2022-8-7鲁云霞制作572.反向重复序列反向重复序列l两个顺序相同的拷贝在两个顺序相同的拷贝在DNA链上呈反向排列。链上呈反向排列。人类基因组约含人类基因组约含5的反向重复序
43、列,散布于的反向重复序列,散布于整个基因组中,常见于基因组调控区内,可整个基因组中,常见于基因组调控区内,可能与复制、转录的调控有关。能与复制、转录的调控有关。w两个反向排列的拷贝之间隔着一段间隔顺序;两个反向排列的拷贝之间隔着一段间隔顺序;两个拷贝反向串联在一起,中间没有间隔顺两个拷贝反向串联在一起,中间没有间隔顺序,形成回文结构(序,形成回文结构(palindrome)。)。2022-8-7鲁云霞制作58l中度重复序列散在分布于基因组中;中度重复序列散在分布于基因组中;l中重复序列常与单拷贝序列间隔排列,有一部中重复序列常与单拷贝序列间隔排列,有一部分是编码分是编码rRNA、tRNA、组蛋
44、白和免疫球蛋白、组蛋白和免疫球蛋白的结构基因,另外一些可能与基因的调控有关;的结构基因,另外一些可能与基因的调控有关;l典型的典型的Alu家族是一种散在重复顺序,由于序家族是一种散在重复顺序,由于序列中有限制性内切酶列中有限制性内切酶Alu的酶切位点而得名;的酶切位点而得名;l重复单位是重复单位是300bp,由,由2个个130bp的重复序列组的重复序列组成,中间有成,中间有31bp间隔序列,重复间隔序列,重复3050万次;万次;l为灵长类基因组所特有,可作为天然标记。为灵长类基因组所特有,可作为天然标记。2022-8-7鲁云霞制作59lDNA位点多态性:由于等位基因间在特位点多态性:由于等位基
45、因间在特定位点上的定位点上的DNA序列存在差异造成;序列存在差异造成;l限制性片段长度多态性(限制性片段长度多态性(RFLP):用同):用同一种限制酶消化不同个体的一种限制酶消化不同个体的DNA时,会时,会得到长度各不相同的限制性片段类型;得到长度各不相同的限制性片段类型;l串联重复顺序多态性:可变数目的串联串联重复顺序多态性:可变数目的串联重复序列(重复序列(VNTRs),有小卫星),有小卫星DNA多多态性,微卫星态性,微卫星DNA多态性。多态性。2022-8-7鲁云霞制作60l基因家族(基因家族(gene family)是指核苷酸序列或是指核苷酸序列或编码产物的结构具有一定程度同源性的一组
46、编码产物的结构具有一定程度同源性的一组基因。同一个家族的基因成员是由同一祖先基因。同一个家族的基因成员是由同一祖先基因进化而来,同源性最高可达基因进化而来,同源性最高可达100(多拷(多拷贝基因)。贝基因)。l多基因家族中的基因,其编码产物常具有相多基因家族中的基因,其编码产物常具有相似的功能;而在似的功能;而在基因超家族基因超家族中,许多基因的中,许多基因的编码产物在功能上却毫无相同之处。编码产物在功能上却毫无相同之处。l根据家族内各成员同源性的程度,基因家族根据家族内各成员同源性的程度,基因家族主要有以下几种类型:主要有以下几种类型:2022-8-7鲁云霞制作61l 核酸序列相同核酸序列相
47、同 实际上是多拷贝基因。如实际上是多拷贝基因。如rRNA基因家族,基因家族,tRNA基因家族,组蛋白基基因家族,组蛋白基因家族等。因家族等。l 核酸序列高度同源核酸序列高度同源 如人类生长激素基因如人类生长激素基因家族。包括家族。包括3种激素的基因:人生长激素种激素的基因:人生长激素(hGH)、人胎盘促乳素()、人胎盘促乳素(hCS)和催乳素)和催乳素(prolactin)。它们之间的同源性很高,尤其)。它们之间的同源性很高,尤其是是hGH与与hCS,蛋白质氨基酸序列有,蛋白质氨基酸序列有85的同的同源性,源性,mRNA序列有序列有92的同源性。的同源性。l 编码产物具有同源功能区编码产物具有
48、同源功能区 如如src癌基因家癌基因家族,各成员基因结构虽无明显的同源性,但族,各成员基因结构虽无明显的同源性,但每个基因产物都含有每个基因产物都含有250个氨基酸顺序的同源个氨基酸顺序的同源蛋白激酶结构域。蛋白激酶结构域。2022-8-7鲁云霞制作62l 编码产物具有小段保守基序编码产物具有小段保守基序 如如DEAD盒盒基因家族含有几个不同的基因,它们的产物基因家族含有几个不同的基因,它们的产物都具有解旋酶的功能,其结构特征是都具有解旋酶的功能,其结构特征是8个氨基个氨基酸基序,内含酸基序,内含DEAD盒序列:盒序列:AspGluAlaAsp。l 基 因 超 家 族基 因 超 家 族 基 因
49、 超 家 族(基 因 超 家 族(g e n e superfamily)是指一组由多基因家族及单基)是指一组由多基因家族及单基因组成的更大的基因家族。它们的结构有程因组成的更大的基因家族。它们的结构有程度不等的同源性,可能都起源于相同的祖先度不等的同源性,可能都起源于相同的祖先基因,但是它们的功能并不一定相同。最典基因,但是它们的功能并不一定相同。最典型的基因超家族是免疫球蛋白基因超家族。型的基因超家族是免疫球蛋白基因超家族。2022-8-7鲁云霞制作63l通过应用计算机分析基因结构序列,使通过应用计算机分析基因结构序列,使越来越多的基因归为一类,使原来的多越来越多的基因归为一类,使原来的多
50、基因家族成为基因超家族。基因家族成为基因超家族。l如丝氨酸蛋白酶基因超家族,原来是多如丝氨酸蛋白酶基因超家族,原来是多基因家族,具有酶活性;现已有很多新基因家族,具有酶活性;现已有很多新成 员 加 入 进 去,特 别 是 载 脂 蛋 白成 员 加 入 进 去,特 别 是 载 脂 蛋 白(apolipoprotein),只是转移胆固醇蛋),只是转移胆固醇蛋白颗粒中的成分,不具有酶活性。白颗粒中的成分,不具有酶活性。2022-8-7鲁云霞制作64l是与某些有功能的基因结构相似,但不能表达基因是与某些有功能的基因结构相似,但不能表达基因产物的基因;产物的基因;l假基因起初可能是有功能的,但在复制时编