1、 第第13章章 基因组学基因组学 基因组学基因组学 1 1 基因组学概述基因组学概述 2 2 基因组图谱的构建基因组图谱的构建3 3 基因组测序基因组测序4 4 功能基因组学功能基因组学本章教学时数:本章教学时数:4 4学时。学时。本章重点:基因组计划的基本流程。本章重点:基因组计划的基本流程。本章难点:分子标记和基因图谱;本章难点:分子标记和基因图谱; 研究基因功能的方法研究基因功能的方法 1 1 基因组学概述基因组学概述基因组(基因组(genomegenome),),又称染色体组又称染色体组一个物种单倍体的染色体数目,一个物种单倍体的染色体数目,物种全物种全部遗传信息的总和部遗传信息的总和
2、物种遗传信息的物种遗传信息的“总词典总词典”控制发育的控制发育的“总程序总程序”生物进化历史的生物进化历史的“总档案总档案”基因组学(基因组学(genomicsgenomics)19861986年提出,至今年提出,至今2020年,已经发展成为年,已经发展成为遗传学中最重要的分支学科。遗传学中最重要的分支学科。对物种的所有基因进行定位、作图、测对物种的所有基因进行定位、作图、测序和功能分析序和功能分析基因组学研究的最终目标基因组学研究的最终目标u 获得生物体全部基因组序列获得生物体全部基因组序列u 鉴定所有基因的功能鉴定所有基因的功能u 明确基因之间的相互作用关系明确基因之间的相互作用关系u 阐
3、明基因组的进化规律阐明基因组的进化规律经典遗传学经典遗传学 在在2020世纪初,遗传学刚刚诞生的时候,遗传世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。些基因在染色体上的位置。 第一个环节:寻找自发突变体,或者利用物第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。理、化学因素诱发突变。 第二个环节:通过连锁分析确定新基因与已第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。知基因的相互关系,绘制遗传连锁图。几个代表物种的基因组大小几个代表物种的基因组大小物种物种基因组大
4、小/bp基因组大小/bpT4噬菌体T4噬菌体2.0102.0105 5大肠杆菌(大肠杆菌(Escherichia coli) )4.2104.2106 6酵母(酵母(Sccharomyces cerevisiae) )1.5101.5107 7拟南芥(拟南芥(Arabidopsis thaliana) )1.0101.0108 8秀丽小杆线虫(秀丽小杆线虫(Caenorhbditis elagans) )1.0101.0108 8果蝇(果蝇(Drosophila melanogaster) )1.65101.65108 8水稻(水稻(Oryza sativa) )3.89103.89108 8
5、小白鼠(小白鼠(Mus musculus) )3.0103.0109 9人类(人类(Homo sapiens) )3.3103.3109 9玉米玉米(Zea mays) )5.4105.4109 9普通小麦(普通小麦(Triticum aestivum) )1.6101.6101010钓鱼钓鱼竭泽而渔竭泽而渔CREDIT: JOE SUTLIFF Science, Vol 291: 1221.Fishing in a More Effective Way!基因组学的研究内容基因组学的研究内容q 结构基因组学结构基因组学q 功能基因组学功能基因组学q 蛋白质组学蛋白质组学结构基因组学(结构基因组
6、学(structural genomics) 基因定位基因定位 基因组作图基因组作图 测定核苷酸序列测定核苷酸序列功能基因组学(功能基因组学(functional genomics) 又称后基因组学(又称后基因组学(postgenomics)postgenomics)q 基因的识别、鉴定、克隆基因的识别、鉴定、克隆q 基因结构、功能及其相互关系基因结构、功能及其相互关系q 基因表达调控的研究基因表达调控的研究蛋白质组学(蛋白质组学(proteomics) 鉴定蛋白质的产生过程、结构、功能和鉴定蛋白质的产生过程、结构、功能和相互作用方式相互作用方式人类基因组计划人类基因组计划19901990,美
7、国国立卫生研究所和能源部投资,美国国立卫生研究所和能源部投资3030亿,启动了人类基因组计划,预计亿,启动了人类基因组计划,预计1515年时间完成人类基因组全部序列的测定年时间完成人类基因组全部序列的测定19961996,完成标记密度为,完成标记密度为0.60.6cMcM的人类基因组的人类基因组遗传图谱,遗传图谱,100100kbkb的物理图谱的物理图谱20002000,完成草图,完成草图20012001年年2 2月,公布人类基因组图谱的修订版月,公布人类基因组图谱的修订版20022002,完成测序工作,完成测序工作2 基因组图谱的构建基因组图谱的构建基因组计划的主要任务是获得全基因组序列基因
8、组计划的主要任务是获得全基因组序列但是,现在的测序方法每次只能测但是,现在的测序方法每次只能测80080010001000bpbp大量的测序片段要拼接大量的测序片段要拼接要知道序列在要知道序列在ChrChr上的位置才能正确拼接上的位置才能正确拼接基因组计划的第一个环节:基因组计划的第一个环节: 构建基因组图谱构建基因组图谱基因组图谱基因组图谱遗传图谱遗传图谱(genetic map)物理图谱物理图谱(physical map)遗传图谱遗传图谱(genetic map) 采用采用遗传分析的方法遗传分析的方法将基因或其它将基因或其它DNADNA序列标定在染色体上构建连锁图。序列标定在染色体上构建连
9、锁图。遗传标记遗传标记q有可以识别的标记,才能确定目标的方位有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。及彼此之间的相对位置。q构建遗传图谱就是寻找基因组不同位置上构建遗传图谱就是寻找基因组不同位置上的特征标记。的特征标记。q包括:包括: 形态标记形态标记 细胞学标记细胞学标记 生化标记生化标记 DNA DNA分子标记分子标记多态性(多态性(polymophism)所有的标记都必须具有多态性所有的标记都必须具有多态性!v 花色:白色、红色花色:白色、红色v 株高:高、矮株高:高、矮v 血型:血型:A A、B B、O O型型v 淀粉:糯、非糯淀粉:糯、非糯所有多态性都是基因突变的结
10、果!所有多态性都是基因突变的结果!形态标记形态标记形态性状:株高、颜色、白化症等形态性状:株高、颜色、白化症等又称表型标记又称表型标记数量少数量少很多突变是致死的很多突变是致死的受环境、生育期等因素的影响受环境、生育期等因素的影响q 最早建立的果蝇连锁图,就是利用控制最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。它们连锁关系及遗传距离,绘制而成的。q 控制性状的其实是基因,所以形态标记控制性状的其实是基因,所以形态标记实质上就是基因标记
11、。实质上就是基因标记。果果蝇蝇连连锁锁图图细胞学标记细胞学标记v明确显示遗传多态性的染色体结构特征明确显示遗传多态性的染色体结构特征和数量特征和数量特征 染色体的核型染色体的核型 染色体的带型染色体的带型 染色体的结构变异染色体的结构变异 染色体的数目变异染色体的数目变异v优点:不受环境影响优点:不受环境影响v缺点:数量少、费力、费时、对生物体缺点:数量少、费力、费时、对生物体的生长发育不利的生长发育不利生化标记生化标记v 又称蛋白质标记又称蛋白质标记v 就是利用蛋白质的多态性作为遗传标记。就是利用蛋白质的多态性作为遗传标记。 如:同工酶、贮藏蛋白如:同工酶、贮藏蛋白v 优点:数量较多,受环境
12、影响小优点:数量较多,受环境影响小v 缺点:受发育时间的影响、有组织特异缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息性、只反映基因编码区的信息DNADNA分子标记分子标记简称分子标记简称分子标记以以DNADNA序列的多态性作为遗传标记序列的多态性作为遗传标记优点:优点:v 不受时间和环境的限制不受时间和环境的限制v 遍布整个基因组,数量无限遍布整个基因组,数量无限v 不影响性状表达不影响性状表达v 自然存在的变异丰富,多态性好自然存在的变异丰富,多态性好v 共显性,能鉴别纯合体和杂合体共显性,能鉴别纯合体和杂合体限制性片段长度多态性限制性片段长度多态性(restriction
13、fragment length polymorphism,RFLP)v DNADNA序列能或不能被某一酶酶切,相当于一对序列能或不能被某一酶酶切,相当于一对等位基因的差异。等位基因的差异。 v 如有两个如有两个DNADNA分子(一对染色体),一个具有分子(一对染色体),一个具有某一种酶的酶切位点,而另一个没有这个位点,某一种酶的酶切位点,而另一个没有这个位点,酶切后形成的酶切后形成的DNADNA片段长度就有差异,即多态片段长度就有差异,即多态性。性。v 可将可将RFLPRFLP作为标记,定位在基因组中某一位作为标记,定位在基因组中某一位置上。置上。v人类基因组中有人类基因组中有10105 5个
14、个RFLPRFLP位点,每一位点只位点,每一位点只有两个等位基因。有两个等位基因。RFLPRFLP分析分析RFLP标记位共显性标记标记位共显性标记微卫星微卫星(microsatellite)标记标记v微 卫 星 又 称 为微 卫 星 又 称 为 简 单 重 复 序 列 (简 单 重 复 序 列 ( s i m p l e s i m p l e sequence repeatsequence repeat,SSRSSR)。)。v这种重复序列的重复单位很短,常常只有这种重复序列的重复单位很短,常常只有2 2个、个、3 3个或个或4 4个核苷酸个核苷酸v如一条染色体如一条染色体TCTGAGAGAG
15、ACGCTCTGAGAGAGACGC 另一染色体另一染色体TCTGAGAGAGAGAGAGAGACGCTCTGAGAGAGAGAGAGAGACGC,就构成就构成了多态性。了多态性。遗传图谱的构建方法遗传图谱的构建方法 v 理论基础理论基础: 连锁与交换连锁与交换v 基本方法基本方法: 两点测验法和三点测验法两点测验法和三点测验法植物遗传图谱的构建植物遗传图谱的构建v 选择研究材料(亲本)选择研究材料(亲本)v 构建分离群体构建分离群体v 遗传标记检测遗传标记检测v 标记间的连锁分析标记间的连锁分析选择亲本选择亲本 要求亲缘关系远,遗传差异大要求亲缘关系远,遗传差异大 但又不能相差太大以导致引起
16、子代不育。但又不能相差太大以导致引起子代不育。 对备选材料进行多态对备选材料进行多态( (差异差异) )性检测,综性检测,综合测定结果,选择有一定量多态性的一对合测定结果,选择有一定量多态性的一对或几对材料作为遗传作图亲本。或几对材料作为遗传作图亲本。构建作图群体构建作图群体 遗传标记的染色体定位遗传标记的染色体定位v 利用遗传学方法或其它方法将少数标记利用遗传学方法或其它方法将少数标记锚定在染色体上,作为确定连锁群的参锚定在染色体上,作为确定连锁群的参照系。照系。v 常用的方法:常用的方法: 单体分析单体分析 三体分析三体分析 代换系分析代换系分析 附加系分析附加系分析标记间的连锁分析标记间
17、的连锁分析v利用在两个亲本间有多态性的标记分析利用在两个亲本间有多态性的标记分析分离群体中所有个体的基因型分离群体中所有个体的基因型v根据连锁交换的情况,确定标记之间的根据连锁交换的情况,确定标记之间的连锁关系和遗传距离连锁关系和遗传距离v有计算机软件可以应用有计算机软件可以应用水稻遗传图水稻遗传图v 1994 1994年,水稻第一张高密度遗传图谱年,水稻第一张高密度遗传图谱 927 927个位点,个位点, 1383 1383个标记个标记v 1998 1998年,年,11571157个位点,个位点,22752275个标记个标记v 2000 2000年,年,32673267个标记个标记v 高密度
18、的遗传图谱为基因组测序和遗传高密度的遗传图谱为基因组测序和遗传研究奠定了坚实的基础。研究奠定了坚实的基础。人类遗传图谱的构建人类遗传图谱的构建v 不可能根据需要选择亲本,设计杂交组合,不可能根据需要选择亲本,设计杂交组合,构建分离群体!构建分离群体!v 只能检测现存家庭连续几代成员的基因型只能检测现存家庭连续几代成员的基因型v 家系分析法家系分析法v 资料有限、必须借助于统计学方法资料有限、必须借助于统计学方法现有的人类遗传图谱现有的人类遗传图谱v 1 12222号染色体号染色体v 8 8个家系个家系134134个成员个成员v X X染色体,染色体,1212个家系个家系170170个成员个成员
19、v 5364 5364个个SSRSSR标记标记v 2335 2335个位点个位点v 标记间的平均距离标记间的平均距离599599kbkb物理图谱的构建物理图谱的构建v 用用分子生物学方法分子生物学方法直接检测直接检测DNADNA标标记在染色体上的实际位置绘制成的图谱记在染色体上的实际位置绘制成的图谱称为物理图谱。称为物理图谱。v 有遗传图谱为什么还要构建物理图谱?有遗传图谱为什么还要构建物理图谱? 遗传图谱的缺陷遗传图谱的缺陷v 分别率有限分别率有限v 人类只能研究少数减数分裂事件,不能人类只能研究少数减数分裂事件,不能获得大量子代个体获得大量子代个体v 测序要求每个标记的间隔小于测序要求每个
20、标记的间隔小于100100kbkbv 实际是实际是599599kbkb遗传图谱的缺陷遗传图谱的缺陷 精确性不够精确性不够 经典遗传学认为,交换是随机发生的经典遗传学认为,交换是随机发生的 基因组中有些区域是重组热点基因组中有些区域是重组热点 倒位、重复等染色体结构变异会限制交倒位、重复等染色体结构变异会限制交换重组换重组酵酵母母遗遗传传图图与与物物理理图图比比较较A A 遗传图遗传图B B 物理图物理图物理作图的方法物理作图的方法1 1、限制酶作图、限制酶作图2 2、依靠克隆的基因组作图、依靠克隆的基因组作图3 3、荧光原位杂交、荧光原位杂交4 4、序列标签位点作图、序列标签位点作图限制酶作图
21、(限制酶作图(restriction mapping)限制酶作图(限制酶作图(restriction mapping)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)荧光原位杂交荧光原位杂交(fluorescent in situ hybridization,FISH)人类基因组物理图人类基因组物理图v 1987 1987年,年,RF
22、LPRFLP图谱,图谱,403403个标记,个标记,1010MbMbv 1994 1994年,年,58005800个标记,个标记,0.70.7MbMbv 1996 1996年,年,1700017000多个标记,多个标记,100100kbkbv 完全适应全基因组测序的要求完全适应全基因组测序的要求遗传图与物理图的整合遗传图与物理图的整合v有些标记既是遗传标记,又是物理标记有些标记既是遗传标记,又是物理标记 RFLPRFLP标记标记 SSRSSR标记标记 某些基因序列某些基因序列v借助这些标记可以将遗传图和物理图整借助这些标记可以将遗传图和物理图整合起来合起来基因组测序策略基因组测序策略v有了高密
23、度的基因组图谱,就可以开始全有了高密度的基因组图谱,就可以开始全基因组测序了基因组测序了v测序的技术飞速发展,现在可以全自动化测序的技术飞速发展,现在可以全自动化v测序的策略有两个:测序的策略有两个: 鸟枪法鸟枪法 克隆重叠群法克隆重叠群法鸟枪法(鸟枪法(shotgun sequencing)鸟枪法的优缺点鸟枪法的优缺点v优点:优点: 不需要高密度的图谱不需要高密度的图谱 速度快、简单、成本低速度快、简单、成本低v缺点:缺点: 拼接组装困难,尤其在重复序列多的区域拼接组装困难,尤其在重复序列多的区域v主要用于重复序列少、相对简单的原核生物基主要用于重复序列少、相对简单的原核生物基因组因组克隆重
24、叠群法(克隆重叠群法(clone contig)v 将基因组将基因组DNADNA切割长度为切割长度为0.10.1MbMb1Mb1Mb的的大片段,克隆到大片段,克隆到YACYAC或或BACBAC载体上载体上v 然后再进行亚克隆,分别测定单个亚克然后再进行亚克隆,分别测定单个亚克隆的序列隆的序列v 再装配、连接成连续的再装配、连接成连续的DNADNA分子。分子。v 这是一种自上而下(这是一种自上而下(up to downup to down)的测的测序策略序策略 v clone-by-clone methodclone-by-clone method两两种种基基因因组组测测序序策策略略The E.
25、coli genomeA portion of the E.coli chromosome showing genes and operons. A dot indicates the promoter for each gene or operon. Arrows and color indicate the direction of transcribtion: dark blue genes are transcribed left to right, light blue are transcribed right to left.Overlapping gene are shown
26、in green.功能基因组学功能基因组学v 完成基因组测序,仅仅是基因组计划的完成基因组测序,仅仅是基因组计划的第一步,更重要的工作在于弄清楚:第一步,更重要的工作在于弄清楚: 基因组序列中所包含的全部遗传信息基因组序列中所包含的全部遗传信息是什么;是什么; 基因组作为一个整体如何行使功能。基因组作为一个整体如何行使功能。v就是对基因组序列进行诠释的过程,也就是对基因组序列进行诠释的过程,也就是功能基因组学的研究内容。就是功能基因组学的研究内容。 根据序列分析搜寻基因根据序列分析搜寻基因 v 查找开放阅读框(查找开放阅读框(open reading frame, ORFopen readin
27、g frame, ORF)v 开放阅读框都有一个起始密码子开放阅读框都有一个起始密码子,ATGATG,还要有还要有终止密码子终止密码子。v 从从ATGATG开始,然后向下游寻找终止密码子。开始,然后向下游寻找终止密码子。v 起始密码子和终止密码子之间的碱基数目要能够起始密码子和终止密码子之间的碱基数目要能够被被3 3整除整除v 每一条链都有每一条链都有3 3种可能的阅读框,种可能的阅读框,2 2条连共计有条连共计有6 6种可能的阅读框种可能的阅读框. .v 计算机可以很快给出结果。计算机可以很快给出结果。同源查询同源查询v 利用已经存入数据库的基因序列与待查的利用已经存入数据库的基因序列与待查
28、的基因组序列比对,从中查找可以与之匹配的基因组序列比对,从中查找可以与之匹配的碱基序列及其比例,用于界定基因碱基序列及其比例,用于界定基因。v 同源查询可以部分弥补同源查询可以部分弥补ORFORF扫描的不足。扫描的不足。同源查询的依据同源查询的依据 有亲缘关系的物种,基因组可能存在某有亲缘关系的物种,基因组可能存在某种程度的相似性:种程度的相似性:v 存在某些完全相同的序列;存在某些完全相同的序列;v ORF ORF的排列相似,如等长的外显子;的排列相似,如等长的外显子;v ORF ORF指令的氨基酸序列相似;指令的氨基酸序列相似;v 模拟的多肽链的高级结构相似,等模拟的多肽链的高级结构相似,
29、等。基因功能研究基因功能研究 1 1、计算机预测基因功能、计算机预测基因功能 v 依据仍然是同源性比较。同源基因拥有依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多一个共同的祖先基因,它们之间有许多相似的序列。相似的序列。 v 种间同源基因种间同源基因 v 种内同源基因种内同源基因 基因功能研究基因功能研究2 2、实验确认基因功能、实验确认基因功能 基因克隆基因克隆 基因敲除基因敲除(knock-out) 基因的超表达基因的超表达 反义反义RNARNA技术技术 RNAi RNAi 转座子插入突变转座子插入突变 反义反义RNARNA(antisense RNAantisense RNA)技术技术
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。