生物学基因组学1课件.pptx

上传人(卖家):晟晟文业 文档编号:4781002 上传时间:2023-01-09 格式:PPTX 页数:80 大小:4.68MB
下载 相关 举报
生物学基因组学1课件.pptx_第1页
第1页 / 共80页
生物学基因组学1课件.pptx_第2页
第2页 / 共80页
生物学基因组学1课件.pptx_第3页
第3页 / 共80页
生物学基因组学1课件.pptx_第4页
第4页 / 共80页
生物学基因组学1课件.pptx_第5页
第5页 / 共80页
点击查看更多>>
资源描述

1、遗传学遗传学 Genetics1/177 基因组学基因组学是研究生物基因组的结构和功能的科学。是研究生物基因组的结构和功能的科学。遗传学遗传学 Genetics2/177结构基因组学的最终目的,是要揭示基因组的分子组结构基因组学的最终目的,是要揭示基因组的分子组成,在分子水平上描绘基因组的结构,即基因组序列成,在分子水平上描绘基因组的结构,即基因组序列(genomic)。)。遗传学遗传学 Genetics3/177遗传学遗传学 Genetics4/177生命的奥秘蕴藏于生命的奥秘蕴藏于 “四字天书四字天书”之之中中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCAC

2、CA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCATGCCGCCACCGCTTCTTCCtTCTCT遗传学遗传学 Genetics5/177第第9章章 基因组学基因组学 9.1 基因组的结构特征基因组的结构特征 9.2 基因组图谱的构建及应用基因组图谱的构建及应用 9.3 后基因组学后基因组学遗传学遗传学 Genetics6/177第第9章章 基因组学基因组学 9.1 基因组的结构特征基因组的结构特征 9.2 基因组图谱的构建及应

3、用基因组图谱的构建及应用 9.3 后基因组学后基因组学遗传学遗传学 Genetics7/1771、原核生物基因组的结构特征、原核生物基因组的结构特征 大多数原核生物的基因组小于5 Mb,比真核生物的基因组小得多。染色体是由一个核酸分子(DNA或RNA)组成的,DNA(RNA)呈环状或线性。原核生物还可能含有更小的质粒(plasmid)的DNA分子。蛋白质基因通常以单拷贝的形式存在。存在转座因子。功能相关的基因大多以操纵子形式出现,如大肠杆菌的乳糖操纵子等。遗传学遗传学 Genetics8/1772、真核生物细胞核基因组的结构特征真核生物细胞核基因组的结构特征1)真核生物细胞核基因组的大小从小于

4、10 Mb到大于100,000 Mb。基因组的大小一般与生物的复杂性相一致,高等真核生物的基因组一般大于低等真核生物的基因组。遗传学遗传学 Genetics9/177 生物生物 基因组大小(基因组大小(Mb)原核生物原核生物Mycoplasma genitalium 0.58Escherichia coli 4.64Bacillus megaterium 30真核生物真核生物 真菌真菌 Saccharomyces cerevisiae(酵母)(酵母)12.1Aspergillus nidulans 25.4 原生动物原生动物Tetrahymena pyriformis 190 无脊椎动物无脊椎

5、动物Drosophila melanogaster(果蝇)(果蝇)100 Bombyx mori(蚕)(蚕)490Locusta migratoria(蝗虫)(蝗虫)5,000 脊椎动物脊椎动物Fugu rubripes(河豚)(河豚)400Homo sapiens(人类)(人类)3,000Mus musculus(鼠)(鼠)3,300 植物植物Arabidopsis thaliana(拟南芥)(拟南芥)100Oryza sativa(水稻)(水稻)565Zea mays(玉米)(玉米)5,000Triticum aestivum(小麦)(小麦)17,000Fritillaria assyri

6、aca(贝母)(贝母)120,000不同生物类型基因组的大小不同生物类型基因组的大小资料来源:资料来源:Brown T.A.,1999。遗传学遗传学 Genetics10/1772)真核生物具有真核生物具有复杂的染色体结构复杂的染色体结构,染色体在细胞间期,染色体在细胞间期为染色质,由为染色质,由DNA、组蛋白、非组蛋白以及、组蛋白、非组蛋白以及RNA组组成的,基本结构物质是成的,基本结构物质是DNA和组蛋白。和组蛋白。真核生物的细胞核基因组由一组线性真核生物的细胞核基因组由一组线性DNA分子组分子组成成,而每一,而每一DNA分子包含在一条染色体中。分子包含在一条染色体中。遗传学遗传学 Gen

7、etics11/1773)非编码序列比例大大增加非编码序列比例大大增加 真核生物真核生物基因组复杂程度的增加,主要表现在非编码基因组复杂程度的增加,主要表现在非编码序列比例的增加序列比例的增加。例如,大肠杆菌基因组中非编码序列仅。例如,大肠杆菌基因组中非编码序列仅占占11%,而人类基因组中编码序列只有,而人类基因组中编码序列只有1.1%-1.5%。真核生物基因组存在着各种类型的非编码序列,使基真核生物基因组存在着各种类型的非编码序列,使基因组的因组的DNA序列变得十分复杂。序列变得十分复杂。遗传学遗传学 Genetics12/177人类基因组(人类基因组(3000 Mb)基因及基因相关序列基因

8、及基因相关序列(900 Mb)基因外基因外DNA(2100 Mb)编码编码DNA(90 Mb)非编码非编码DNA(810 Mb)重复重复DNA(420 Mb)单一和低拷贝单一和低拷贝DNA(1680 Mb)假基因假基因内含子内含子前导序列前导序列随尾序列随尾序列基因断片基因断片分散重复分散重复DNA串联重复串联重复DNA微卫星微卫星DNA小卫星小卫星DNA卫星卫星DNADNA转座子转座子LINESINELTR因子因子 人类基因组的序列组成人类基因组的序列组成(资料来源:(资料来源:Brown T.A.,1999)遗传学遗传学 Genetics13/177重复重复DNA(repetitive D

9、NA)是由特定大小序列(重复单位),)是由特定大小序列(重复单位),具有特定拷贝数,以特殊的方式组成的具有特定拷贝数,以特殊的方式组成的DNA序列。序列。原核生物:原核生物:含有完全不重复的含有完全不重复的DNA;低等真核生物:低等真核生物:大部分大部分DNA也是非重复的;也是非重复的;动物动物:接近:接近50%的的DNA是中度或高度重复的;是中度或高度重复的;植物和两栖动物植物和两栖动物:中度或高度重复序列占基因组的:中度或高度重复序列占基因组的80%。4)重复重复DNA的含量增加的含量增加遗传学遗传学 Genetics14/1775 5)编码基因数量与复杂程度的增加编码基因数量与复杂程度的

10、增加 随着基因组的增大,基因数目也相应增加。但这种增加随着基因组的增大,基因数目也相应增加。但这种增加并不是按比例的。并不是按比例的。随着生物的进化,基因组中基因数目增加同时,基因的随着生物的进化,基因组中基因数目增加同时,基因的复杂程度也在增加。复杂程度也在增加。遗传学遗传学 Genetics15/177基因组基因组大小(大小(bp)基因数基因数基因密度(基因密度(1/kb)年份年份生殖道支原体生殖道支原体5.8 105 470 1 1995流感嗜血杆菌流感嗜血杆菌1.8 1061,743 11995詹氏甲烷球菌詹氏甲烷球菌1.7 1061,682 11996大肠杆菌大肠杆菌4.6 1064

11、,288 11997酵母酵母1.2 1075,885 21997线虫线虫9.7 10719,099 51998拟南芥拟南芥1.2 10825,000 52001果蝇果蝇1.3 10813,000 102000水稻水稻4.2 10850,000 82002人类人类3.0 10932,000 952000 部分已测序基因组的基因数目部分已测序基因组的基因数目遗传学遗传学 Genetics16/1776 6)大量基因以大量基因以基因家族基因家族的形式存在。的形式存在。基因家族(基因家族(gene family):):基因组中来源相同、结构相似、功能相基因组中来源相同、结构相似、功能相关的一组基因。关

12、的一组基因。成簇的基因家族(成簇的基因家族(clustered gene family):):一个基因家族成员在一个基因家族成员在特殊的染色体区域上成簇存在,中间常以中等重复序列间隔。特殊的染色体区域上成簇存在,中间常以中等重复序列间隔。散布的基因家族(散布的基因家族(interspersed gene family):同一基因家族的成:同一基因家族的成员在整个染色体上广泛分布,甚至存在于不同的染色体上。员在整个染色体上广泛分布,甚至存在于不同的染色体上。遗传学遗传学 Genetics17/177第第9章章 基因组学基因组学 9.1 基因组的结构特征基因组的结构特征 9.2 基因组图谱的构建及

13、应用基因组图谱的构建及应用 9.3 后基因组学后基因组学遗传学遗传学 Genetics18/177物理作图物理作图:就是要把基因组分解成为许多较小的就是要把基因组分解成为许多较小的DNA片片段,然后再把这些段,然后再把这些DNA片段连接起来,构建片段连接起来,构建一个由一个由DNA片段重叠群组成的物理图片段重叠群组成的物理图(physical map)。)。从分子水平上看,基因组是一个巨大的物体,从分子水平上看,基因组是一个巨大的物体,例如,例如,拟南芥基因组大小为拟南芥基因组大小为1.2 108 bp(base pair,碱基对,碱基对),而,而人类基因组为人类基因组为3.0 109 bp。

14、要完成基因组测序的巨大工程,要完成基因组测序的巨大工程,通常首先需要把基因组分解成为许多较小的通常首先需要把基因组分解成为许多较小的DNA片段,然片段,然后分别测序,再综合组装。后分别测序,再综合组装。遗传学遗传学 Genetics19/177物理图谱:物理图谱:以特定以特定DNA序列为界标直线排序列为界标直线排列在基因组列在基因组DNA分子上,图上界标之间的距离以分子上,图上界标之间的距离以物理长度物理长度,即,即核苷酸对(核苷酸对(bp)的数目)的数目来表示。来表示。遗传学遗传学 Genetics20/1771、作图文库、作图文库 一个基因组分解产生的用于物理作图的一个基因组分解产生的用于

15、物理作图的DNA片段片段,在数量上通常是很大的。对这些,在数量上通常是很大的。对这些DNA片段进行有效片段进行有效的管理,以便开展物理作图,需要构建这些的管理,以便开展物理作图,需要构建这些DNA片段片段的文库,这就是的文库,这就是作图文库作图文库。作图文库的构建通常包括作图文库的构建通常包括DNA片段的分离、克隆片段的分离、克隆和分析和分析等环节。等环节。遗传学遗传学 Genetics21/177(1)DNA片段的分离片段的分离 用于物理作图的用于物理作图的DNADNA片段通常较大,一般为片段通常较大,一般为100-100-300kb300kb。u 获得途径获得途径:利用限制性内切酶的部分酶

16、切(不完全酶切),利用限制性内切酶的部分酶切(不完全酶切),或选用稀有切点的限制酶酶切或选用稀有切点的限制酶酶切;片段的大小可以通过酶切的时间来掌握。片段的大小可以通过酶切的时间来掌握。遗传学遗传学 Genetics22/177u 分离方法分离方法:通过通过降低凝胶的浓度降低凝胶的浓度来分离较高分子量的来分离较高分子量的DNA片段片段;应用应用脉冲场凝胶电泳技术脉冲场凝胶电泳技术(pulsed field gel electrophoresis,缩写成,缩写成PFGE),可成功分离到分),可成功分离到分子量高达子量高达107 bp(1000kb)的的DNA大分子。大分子。遗传学遗传学 Gene

17、tics23/177 将一个将一个方向不断变换方向不断变换的电的电场取代单向电场,使电泳中受场取代单向电场,使电泳中受阻的阻的DNA分子在电场改变时分子在电场改变时扭转迁移方向,扭转迁移方向,小分子小分子DNA比大分子比大分子DNA更易在凝胶中更易在凝胶中重新定向,重新定向,因而迁移速度更快,因而迁移速度更快,达到分离大分子达到分离大分子DNA的目的。的目的。脉冲场凝胶电泳的原理脉冲场凝胶电泳的原理遗传学遗传学 Genetics24/177(2)DNA片段的克隆载体片段的克隆载体 所有的克隆载体都包括三种共同的组成部分,即所有的克隆载体都包括三种共同的组成部分,即复制复制基因(基因(repli

18、cator)、选择性标记和克隆位点(酶切位)、选择性标记和克隆位点(酶切位点)点)。遗传学遗传学 Genetics25/177载体的类型:载体的类型:质粒(质粒(plasmid):5 kb 噬菌体(噬菌体(phase):2-25 kb 粘粒(粘粒(cosmid):35-45 kb 细菌人工染色体(细菌人工染色体(bacterial artificial chromosome,缩写,缩写成成BAC):100-200 kb 酵母人工染色体(酵母人工染色体(yeast artificial chromosome,缩写成,缩写成YAC):200-700 kb。遗传学遗传学 Genetics26/177

19、 对于物理作图,由于对于物理作图,由于DNA片段较大,常用的克隆载片段较大,常用的克隆载体为体为BAC和和YAC等。等。用用BAC载体构建的作图文库称为载体构建的作图文库称为BAC文库文库,而用,而用YAC载体构建的作图文库称为载体构建的作图文库称为YAC文库文库遗传学遗传学 Genetics27/177NotI、SacI脉冲场凝胶电泳得200kb左右的大片段DNA 纯化后与载体连接 电转化,将连接产物导入大肠杆菌感受态细胞插有外源DNA片段的BAC载体在含有氯霉素的固体培养基中培养每一个菌落为带有相同外源DNA片段的单克隆遗传学遗传学 Genetics28/1772、物理图的构建、物理图的构

20、建 物理作图的下一个目标是要确定作图文库中克隆片段的物理作图的下一个目标是要确定作图文库中克隆片段的排列顺序,建立克隆的排列顺序,建立克隆的重叠群。重叠群。(1)重叠群重叠群(contig):彼此可以通过末端的重叠序列相:彼此可以通过末端的重叠序列相互连接成连续的互连接成连续的DNA长片段的一组克隆。长片段的一组克隆。组装物理图有多种方法,如染色体步移、指纹作图等组装物理图有多种方法,如染色体步移、指纹作图等。遗传学遗传学 Genetics29/177(2)染色体步移)染色体步移(chromosome walking):选择已知位置的克隆作为探针,寻找基因组文库中选择已知位置的克隆作为探针,寻

21、找基因组文库中与其部分重叠的克隆。通过多次重复这一步骤,就可以找与其部分重叠的克隆。通过多次重复这一步骤,就可以找出出一个彼此重叠的、连续不断的克隆片段重叠群一个彼此重叠的、连续不断的克隆片段重叠群。遗传学遗传学 Genetics30/177AAB1B2AC1B1C2B2(a)以起始克隆)以起始克隆A为探为探针,从基因组文库中筛针,从基因组文库中筛选到克隆选到克隆B1和和B2(b)以克隆)以克隆B1和和B2为为探针,从基因组文库中探针,从基因组文库中筛选到克隆筛选到克隆C1和和C2基因组文库基因组文库重叠群的构建重叠群的构建染色体步移染色体步移遗传学遗传学 Genetics31/177DNA指

22、纹指纹:确定确定DNA样品所具有的特定样品所具有的特定DNA片段组成。片段组成。一个克隆的指纹一个克隆的指纹表示了该克隆所具有的限定的序列特表示了该克隆所具有的限定的序列特征,可与其它克隆产生的同类指纹相比较。如果指纹重征,可与其它克隆产生的同类指纹相比较。如果指纹重叠,表明两个克隆具有共同区段。叠,表明两个克隆具有共同区段。遗传学遗传学 Genetics32/177 克隆指纹法克隆指纹法可分为限制性片段指纹法和可分为限制性片段指纹法和PCR扩增产物扩增产物指纹法两大类指纹法两大类。限制性片段指纹法限制性片段指纹法:利用限制酶处理利用限制酶处理DNA克隆,经凝克隆,经凝胶电泳分离限制性片段,获

23、得一组克隆的限制性指纹。胶电泳分离限制性片段,获得一组克隆的限制性指纹。PCR扩增产物指纹法扩增产物指纹法:通过通过PCR扩增方法,比较克隆扩增方法,比较克隆间间PCR扩增条带的相似性,获得一组克隆的扩增产物指纹。扩增条带的相似性,获得一组克隆的扩增产物指纹。遗传学遗传学 Genetics33/177指纹作图指纹作图A.限制性片段指纹,限制性片段指纹,E表示限制性位点;表示限制性位点;B.PCR扩增片段指纹,箭扩增片段指纹,箭头表示扩增片段。头表示扩增片段。E E E E E E克隆克隆X克隆克隆Y克隆克隆X克隆克隆YA限制性片段指纹限制性片段指纹BPCR扩增片段指纹扩增片段指纹遗传学遗传学

24、Genetics34/177 无论是限制性片段指纹还是无论是限制性片段指纹还是PCR扩增产物指纹,扩增产物指纹,根据重叠区指纹相同的原理,可以找出相互重叠的克根据重叠区指纹相同的原理,可以找出相互重叠的克隆,从而构建重叠群隆,从而构建重叠群。由于指纹分析涉及大量的试验。由于指纹分析涉及大量的试验数据,因此通常通过计算机来进行分析。数据,因此通常通过计算机来进行分析。遗传学遗传学 Genetics35/1773、确定重叠群的长度 从重叠群中选择从重叠群中选择核心克隆核心克隆,酶切后标记做探针,与整个重叠群,酶切后标记做探针,与整个重叠群杂交以确定重叠部分大小;将所有克隆长度总和减去相互重叠部分,

25、杂交以确定重叠部分大小;将所有克隆长度总和减去相互重叠部分,即整个克隆重叠群的总跨度。即整个克隆重叠群的总跨度。克隆重叠群之间存在的空隙的实际物理距离可以克隆重叠群之间存在的空隙的实际物理距离可以通过步移法找通过步移法找出搭桥克隆出搭桥克隆加以推算和确定。加以推算和确定。这一工作必须由计算机来完成。这一工作必须由计算机来完成。遗传学遗传学 Genetics36/177遗传图遗传图是通过遗传标记的排列顺序和相对距离,来反映基因组是通过遗传标记的排列顺序和相对距离,来反映基因组的结构,图距单位是以重组率为基础的遗传距离,即厘摩的结构,图距单位是以重组率为基础的遗传距离,即厘摩(cM)。)。物理图物

26、理图是通过来源于基因组本身的是通过来源于基因组本身的DNA片段的重叠关系,对克片段的重叠关系,对克隆的隆的DNA片段进行排序,复原染色体全长的片段进行排序,复原染色体全长的DNA分子,图距单分子,图距单位是以碱基数为单位的物理距离(位是以碱基数为单位的物理距离(kb)。)。通过遗传图与物理图的整合,构成了更能反映基因组本质通过遗传图与物理图的整合,构成了更能反映基因组本质的基因组图。的基因组图。4、物理图与遗传图的整合、物理图与遗传图的整合遗传学遗传学 Genetics37/177(1)以遗传图为基础构建物理图以遗传图为基础构建物理图 利用遗传图中的分子标记,从作图文库中筛选出相应的克隆,并利

27、用遗传图中的分子标记,从作图文库中筛选出相应的克隆,并以锚定的克隆片段为基础构建重叠群。以锚定的克隆片段为基础构建重叠群。A B C D E F600 900 220 850 1100染色体染色体遗传距离(遗传距离(cM)遗传图遗传图锚定标记锚定标记物理图物理图物理距离(物理距离(kb)DNA分子分子 3 5 1 4 6遗传学遗传学 Genetics38/177(2)遗传距离与物理距离的关系遗传距离与物理距离的关系 不同生物基因组中每厘摩的物理距离存在很大的差异。不同生物基因组中每厘摩的物理距离存在很大的差异。遗传遗传距离与物理距离的这种关系,反映了通过距离与物理距离的这种关系,反映了通过遗传

28、作图对基因物理定遗传作图对基因物理定位的精度位的精度。该比率越小,基因物理定位的精度越高。如酵母基因。该比率越小,基因物理定位的精度越高。如酵母基因组中每组中每cM约为约为3kb,在水稻基因组中约在水稻基因组中约250kb,在玉米基因组中约在玉米基因组中约1700kb。遗传学遗传学 Genetics39/177三、基因组图谱的应用三、基因组图谱的应用(1)基因组序列测定。)基因组序列测定。(2)基因定位。精细定位)基因定位。精细定位,如抗病基因等,如抗病基因等(3)基因组比较分析:了解物种种间的同源性)基因组比较分析:了解物种种间的同源性(4)分子标记辅助选择)分子标记辅助选择(Marker-

29、assisted selection,MAS)。利用与。利用与基因紧密连锁的分子标记进行间接选择。基因紧密连锁的分子标记进行间接选择。(5)基因的克隆与分离。染色体步行法)基因的克隆与分离。染色体步行法(Chromosome walking)或或称图位克隆法称图位克隆法(map-based cloning)。遗传学遗传学 Genetics40/177 链终止法测序链终止法测序 ddNTP DNA自动测序自动测序 用不同颜色的荧光染料用不同颜色的荧光染料ddNTP 基因组全序列测定基因组全序列测定遗传学遗传学 Genetics41/177 链终止法测序链终止法测序 基本原理基本原理:在在DNA聚

30、合酶的酶促反应中,复制被聚合酶的酶促反应中,复制被测序的测序的DNA分子。在复制的过程中,分子。在复制的过程中,双脱氧核苷酸双脱氧核苷酸随随机掺入到新合成的机掺入到新合成的DNA链中,并引起链中,并引起DNA合成的终止合成的终止。由于双脱氧核苷酸包含由于双脱氧核苷酸包含4种不同的碱基,种不同的碱基,结果在合结果在合成的成的DNA产物中,包括了一系列依次相差一个核苷酸产物中,包括了一系列依次相差一个核苷酸的的DNA分子。分子。通过电泳,这些通过电泳,这些DNA分子可按大小分开,分子可按大小分开,根据末端碱基可读出模板的根据末端碱基可读出模板的DNA序列。序列。遗传学遗传学 Genetics42/

31、177双脱氧核苷三磷酸双脱氧核苷三磷酸(dideoxynucleotide,缩,缩写成写成ddNTP)是是DNA合成合成的阻断剂的阻断剂。双脱氧核苷三。双脱氧核苷三磷酸有磷酸有4种,分别对应种,分别对应4种种脱氧核苷三磷酸脱氧核苷三磷酸(dNTP),前者与后者的区别在于核前者与后者的区别在于核糖的糖的3碳处缺乏一个羟基碳处缺乏一个羟基基团基团。遗传学遗传学 Genetics43/177遗传学遗传学 Genetics44/177 测定一个测定一个DNA分子序列,分子序列,需要需要4个独立的酶促反应个独立的酶促反应:在每一反应试管中,除模板在每一反应试管中,除模板DNA、DNA聚合酶、引物外,聚合

32、酶、引物外,还分别加入一种还分别加入一种互不相同的互不相同的ddNTP和全部和全部4种种dNTP(其(其中有一种带有中有一种带有32P同位素标记)。同位素标记)。遗传学遗传学 Genetics45/177 在在DNA合成的任意位置,聚合酶可掺入一个合成的任意位置,聚合酶可掺入一个dNTP到正在延伸的到正在延伸的DNA链中,此时链中,此时DNA的合成继续进行;若聚合酶掺入的是的合成继续进行;若聚合酶掺入的是ddNTP,则,则链的延伸将被阻断,链的延伸将被阻断,DNA的合成在该位置终止。总的结果是,的合成在该位置终止。总的结果是,在在4个个反应中,每个都产生一系列不同长度的反应中,每个都产生一系列

33、不同长度的DNA分子,每个分子,每个DNA分子都以分子都以ddNTP为终点。为终点。反应混合物样品加在聚丙烯酰胺凝胶上反应混合物样品加在聚丙烯酰胺凝胶上电泳分离片段大小。谱带电泳分离片段大小。谱带的判读是从胶的底部开始,所得的核苷酸碱基顺序,与模板链为互补的判读是从胶的底部开始,所得的核苷酸碱基顺序,与模板链为互补链。链。遗传学遗传学 Genetics46/177(b)电泳及放射自显影,显示测序结果)电泳及放射自显影,显示测序结果CTCCTCA ACTCACCCTCACCA ACTCACCAGTCTCACCAGTA ACTCACCAGTATGCTCACCAGTATGA ACTCACCAGTAT

34、GACCTCACCAGTATGACA AC CT TCTCACCAGCTCACCAGT TCTCACCAGTACTCACCAGTAT TCTCACCAGTATGACACTCACCAGTATGACAT TCTCACCACTCACCAG GCTCACCAGTATCTCACCAGTATG GC CCTCTC CCTCACTCAC CCTCACCTCACC CCTCACCAGTATGACTCACCAGTATGAC C GAGTGGTCATACTGTA GAGTGGTCATACTGTA53模板模板DNA(单链)(单链)反应反应1,加,加ddATP反应反应3,加,加ddGTP反应反应2,加,加ddTTP反

35、应反应4,加,加ddCTP各反应中加入:DNA聚合酶引物dNTPCTCACCAGTATGACACTCACCAGTATGACAT TCTCACCAGTATGACCTCACCAGTATGACA ACTCACCAGTATGACTCACCAGTATGAC CCTCACCAGTATGCTCACCAGTATGA ACTCACCAGTATCTCACCAGTATG G CTCACCAGTACTCACCAGTAT TCTCACCAGTCTCACCAGTA ACTCACCAGCTCACCAGT TCTCACCACTCACCAG GCTCACCCTCACCA ACTCACCTCACC CCTCACTCAC CCTC

36、CTCA ACTCTC CC CT TC C A T G CDNA序列序列(a)PCR,利用,利用ddNTP终止终止DNA链的合成链的合成最大的困难:找到合适的引物最大的困难:找到合适的引物每种每种ddNTP携带不同携带不同的的32P同位素标记同位素标记遗传学遗传学 Genetics47/177 DNA自动测序自动测序 荧光化合物标记链荧光化合物标记链终止法终止法以荧光颜色为标记以荧光颜色为标记信号,每种信号,每种ddNTP各有各有1种代表颜色;整个反应在种代表颜色;整个反应在一个试管中进行;当新合一个试管中进行;当新合成的终止单链通过荧光监成的终止单链通过荧光监测仪时,可由光信号读出测仪时,

37、可由光信号读出末端核苷酸并由电脑记录。末端核苷酸并由电脑记录。以荧光化合物标记双脱以荧光化合物标记双脱氧核苷酸的自动测序氧核苷酸的自动测序遗传学遗传学 Genetics48/177(a)PCR,利用,利用 ddNTP终止终止 反应反应(b)信号检测)信号检测(c)显示结果)显示结果测序反应,产物分离测序反应,产物分离每种每种ddNTP携带携带不同的荧光标记不同的荧光标记ddAddC(红)(红)(蓝)(蓝)ddTddG(绿)(绿)(黄)(黄)检测系统检测系统ddAddTddGddCddAddAddAddAddGddGddGddGddCddCddCddCddTddTddTAG C GT A C C

38、GTT ACC GGTAA显示系统遗传学遗传学 Genetics49/177自动测序方法的优势自动测序方法的优势:免除了同位素标记免除了同位素标记必须同时进行必须同时进行4组反应的麻烦。组反应的麻烦。由由1个泳道个泳道同时判读同时判读4种碱基,为自动化加样及计种碱基,为自动化加样及计算机阅读提供了技术基础。算机阅读提供了技术基础。避免了肉眼分辨的误差避免了肉眼分辨的误差,阅读信号与计算机相连,阅读信号与计算机相连后,可直接对数据进行电脑处理,加快了基因组测序后,可直接对数据进行电脑处理,加快了基因组测序的进程。的进程。遗传学遗传学 Genetics50/177 基因组全序列测定基因组全序列测定

39、 1995年,用年,用鸟枪法(鸟枪法(shotgun approach)完成了流感完成了流感嗜血杆菌基因组的全序列测定,为基因组全序列测定提嗜血杆菌基因组的全序列测定,为基因组全序列测定提供了新的方法。供了新的方法。(a)DNA分子被打断,分子被打断,产产 生小片段生小片段DNA(b)小片段)小片段DNA分别分别测序测序(c)根据)根据DNA序列的重叠序列的重叠 关系,构建重叠群关系,构建重叠群AGCCAATGCATTAGCAGCCAATGCATTAGCATGCAGCCAATGCATATGCAGCCAATGCAT重叠群重叠群DNA序列序列小片段小片段DNADNA分子分子遗传学遗传学 Genet

40、ics51/177琼脂糖凝胶电泳琼脂糖凝胶电泳大小不同的大小不同的DNA片段片段超声波打断超声波打断DNA构建序列的重叠群构建序列的重叠群制备克隆文库制备克隆文库1.6-2.0 kb的的DNA片段片段从凝胶中提纯从凝胶中提纯DNA泳道泳道1:超声波处理的样品:超声波处理的样品DNA泳道泳道2:DNA分子量标记分子量标记末端序列末端序列流感嗜血杆菌流感嗜血杆菌提取提取DNA插入子两端测序插入子两端测序1 2 流感嗜血杆菌基因组鸟枪法测序流程流感嗜血杆菌基因组鸟枪法测序流程(仿(仿Brown T.A.,1999)遗传学遗传学 Genetics52/177 鸟枪法的主要优点鸟枪法的主要优点:速度快;

41、无须提供相关遗传:速度快;无须提供相关遗传图和物理图的资料。图和物理图的资料。鸟枪法的局限性鸟枪法的局限性:如果基因组太大,结构过于复:如果基因组太大,结构过于复杂,序列组装的起始阶段杂,序列组装的起始阶段工作量工作量非常大,而且数据分非常大,而且数据分析中出现析中出现错误的机率错误的机率较大。对一些缺少重复顺序的小较大。对一些缺少重复顺序的小基因组而言,鸟枪法仍是最佳的选择。基因组而言,鸟枪法仍是最佳的选择。遗传学遗传学 Genetics53/177高等生物的基因组测序高等生物的基因组测序:物理作图与鸟枪法测序相结合物理作图与鸟枪法测序相结合 物理作图物理作图:把基因组分解为众多的具有一定长

42、度的把基因组分解为众多的具有一定长度的DNA片段,片段,并对并对DNA片段进行克隆,构建片段进行克隆,构建YAC或或BAC等文库,并构建基因组的物等文库,并构建基因组的物理图。理图。亚克隆亚克隆:将大片段将大片段DNA分解为小片段分解为小片段DNA,然后再对小片段,然后再对小片段DNA进行克隆。直接用于进行克隆。直接用于DNA测序的测序的DNA片段其长度通常为片段其长度通常为2-5 kb。鸟枪法鸟枪法:分别对各分别对各DNA片段进行测序。片段进行测序。序列组装序列组装:鸟枪法测序后,再通过序列组装、间隙填充和校正,鸟枪法测序后,再通过序列组装、间隙填充和校正,构建成全基因组序列。构建成全基因组

43、序列。遗传学遗传学 Genetics54/177 文库组文库组 培养组培养组 模板组模板组 电泳组电泳组 反应组反应组 MegaBACE 上机组上机组 数据处理组数据处理组 基因组随机文库的构建基因组随机文库的构建 测序模板的制备测序模板的制备 测序反应与纯化测序反应与纯化反应产物上机测序反应产物上机测序 序列数据的接收、质量评估、序列数据的接收、质量评估、组装等组装等 含有质粒载体的大肠杆菌培养含有质粒载体的大肠杆菌培养检测模板质量与测序定量检测模板质量与测序定量遗传学遗传学 Genetics55/177遗传学遗传学 Genetics56/177遗传学遗传学 Genetics57/177 完

44、成基因组测序是基因组计划的第一步,下一步弄完成基因组测序是基因组计划的第一步,下一步弄清基因组顺序中所包含的全部遗传信息。清基因组顺序中所包含的全部遗传信息。(1)搜寻基因搜寻基因 由于编码基因中的碱基序列不是随机排列的,存在由于编码基因中的碱基序列不是随机排列的,存在着某些可以辨别的特征,因此可以利用这些特征来辨别着某些可以辨别的特征,因此可以利用这些特征来辨别DNA序列中的基因。序列中的基因。遗传学遗传学 Genetics58/177可读框(可读框(open reading frame,ORF)所有编码蛋白质的基因都含有可读框,由一系列指令氨基酸的密码所有编码蛋白质的基因都含有可读框,由一

45、系列指令氨基酸的密码子(子(codon)组成。)组成。可读框可读框有一个起点,又称有一个起点,又称起始密码子起始密码子(initiation codon),一般为),一般为ATG,还有一个终点,又称,还有一个终点,又称终止密码子终止密码子(termination codon),分别为),分别为TAA,TAG和和TGA,三者含义相同。,三者含义相同。一个一个ORF可能就是一个基因可能就是一个基因外显子外显子 内含子内含子 外显子外显子下游下游上游上游起始密码子起始密码子终止密码子终止密码子可读框可读框遗传学遗传学 Genetics59/177基因开放阅读框基因开放阅读框/基因结构分析识别工具基因

46、结构分析识别工具Getorfhttp:/bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlWeb/LinuxPlotorfhttp:/bioweb.pasteur.fr/seqanal/interfaces/plotorf.htmlWeb/LinuxORF Finder http:/www.ncbi.nlm.nih.gov/gorf/gorf.html WebBestORFhttp:/ Finderhttp:/rulai.cshl.org/tools/genefinder/(Dr.Michael Zhang)WebFGENESHhttp:/ Lin

47、uxFgeneSB/FgeneSVhttp:/ http:/compbio.ornl.gov/generation/WebGeneBuilder http:/r.it/webgene/genebuilder.html WebFGENESH+/+http:/ Web/LinuxGenomeScan http:/genes.mit.edu/genomescan.html WebGeneWise http:/www.sanger.ac.uk/Software/Wise2/WebGRAILhttp:/grail.lsd.ornl.gov/grailexp/Web/Linux/WindowsBCM Ge

48、ne Finderhttp:/searchlauncher.bcm.tmc.edu/seq-search/gene-search.htmlWeb核苷酸序列分析遗传学遗传学 Genetics60/177同源查询同源查询 利用数据库中的基因序列与待查的基因组序列进行比利用数据库中的基因序列与待查的基因组序列进行比较,从中查找出可与之匹配的碱基序列及其比例以便界较,从中查找出可与之匹配的碱基序列及其比例以便界定基因的方法,称为同源查询(定基因的方法,称为同源查询(homology search)。)。原理:如果来自于不同生物体的两个基因在功能上原理:如果来自于不同生物体的两个基因在功能上相似,那么在

49、序列上也会相似相似,那么在序列上也会相似(直系基因成员、平行基(直系基因成员、平行基因或称基因家族成员)因或称基因家族成员)。遗传学遗传学 Genetics61/177相似性有以下表现:相似性有以下表现:(1)存在某些完全相同的序列;)存在某些完全相同的序列;(2)ORF读框的排列类似,如等长的外显子;读框的排列类似,如等长的外显子;(3)ORF指令的氨基酸序列相同;指令的氨基酸序列相同;(4)模拟的多肽高级结构相似。)模拟的多肽高级结构相似。同源查询已成为界定基因的主要工具之一。同源查询已成为界定基因的主要工具之一。遗传学遗传学 Genetics62/177(2)基因功能预测)基因功能预测

50、任务任务:在确认在确认DNADNA序列中的基因序列后,对其功能进序列中的基因序列后,对其功能进行探知。行探知。手段手段:计算机预测计算机预测,其依据是其依据是同源性比较同源性比较。当一个新当一个新基因序列被确定后,根据同源性可从数据库中查找已知序基因序列被确定后,根据同源性可从数据库中查找已知序列的同源基因。根据进化的相关性,可从已知的同源基因列的同源基因。根据进化的相关性,可从已知的同源基因推测新基因的功能。推测新基因的功能。遗传学遗传学 Genetics63/177同源基因类型:同源基因类型:直系基因(直系基因(orthologous gene):又称种间同源基因,又称种间同源基因,是指是

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(生物学基因组学1课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|