第17章-基因组学与后基因组学-遗传学课件.ppt

上传人(卖家):三亚风情 文档编号:3178636 上传时间:2022-07-29 格式:PPT 页数:55 大小:8.06MB
下载 相关 举报
第17章-基因组学与后基因组学-遗传学课件.ppt_第1页
第1页 / 共55页
第17章-基因组学与后基因组学-遗传学课件.ppt_第2页
第2页 / 共55页
第17章-基因组学与后基因组学-遗传学课件.ppt_第3页
第3页 / 共55页
第17章-基因组学与后基因组学-遗传学课件.ppt_第4页
第4页 / 共55页
第17章-基因组学与后基因组学-遗传学课件.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、第第17章章 基因组学与后基因组学基因组学与后基因组学要点:要点:1 1)人人类基因组计划与遗传标记类基因组计划与遗传标记 2 2)基基因组测序与序列组装因组测序与序列组装 3 3)比比较基因组学和功能基因组学较基因组学和功能基因组学 History of the Human Genome Project1990 Official start of HGP with 3 billion$and a 15 year horizon.1999 Sanger Centre publishes chromosome 222001 Draft Genome published:Celera&Public

2、2003 Completion(almost)of Human GenomeCelera:Craig VenterIntl.Cons:Francis Collins 17.1 人类基因组计划与遗传标记人类基因组计划与遗传标记人类基因组计划人类基因组计划 美国美国RenatoRenato Dulbecco Dulbecco于于19861986年提出人类基因组计划年提出人类基因组计划(HGPHGP),旨在确定人类旨在确定人类DNADNA的总体结构,搞清其中各种基因的的总体结构,搞清其中各种基因的结构、功能和相互关系,从整体上认识遗传信息的组成及其结构、功能和相互关系,从整体上认识遗传信息的组成及其

3、调控方式,预防和早期诊断几千种遗传疾病的新方法,并为调控方式,预防和早期诊断几千种遗传疾病的新方法,并为最终揭开生命的奥秘奠定基础。最终揭开生命的奥秘奠定基础。19871987年美国国会批准年美国国会批准HGPHGP计划,并委托计划,并委托NIHNIH和和DOEDOE协调此计协调此计划实施。划实施。19901990年美国政府拨款年美国政府拨款1.621.62亿美元组织启动,从亿美元组织启动,从19911991年起平均每年拨款年起平均每年拨款2 2亿美元,计划用亿美元,计划用1515年时间测出人类基因年时间测出人类基因组全部核苷酸序列,花费组全部核苷酸序列,花费3030亿美元。美国国会认为,亿美

4、元。美国国会认为,HGPHGP计计划可与阿波罗登月计划媲美,但花费仅为登月计划的不到划可与阿波罗登月计划媲美,但花费仅为登月计划的不到1/31/3。HGPHGP计划提出后,美国科学基金会、农业部和一些私人机计划提出后,美国科学基金会、农业部和一些私人机构纷纷参与资助。随后英、法、德、意、丹麦也出巨资支持。构纷纷参与资助。随后英、法、德、意、丹麦也出巨资支持。不久,日本、前苏联、印度陆续成立相应机构,相互沟通和不久,日本、前苏联、印度陆续成立相应机构,相互沟通和协作。协作。形成有十多个国家正式参与国际协作组,包括二十多个国形成有十多个国家正式参与国际协作组,包括二十多个国家级实验室参与,从此家级

5、实验室参与,从此HGPHGP计划发展成为国际合作的巨大工计划发展成为国际合作的巨大工程。程。染色体分离染色体分离逐级克隆逐级克隆 YAC载体载体 BAC载体载体Cosmid载体载体Plasmid载体载体测序、组装测序、组装 绘制图谱绘制图谱HGPHGP计划实施总体进展计划实施总体进展19901990年以后,年以后,HGPHGP计划已完成和正在测序共计计划已完成和正在测序共计330Mb(3.3330Mb(3.3亿亿bpbp),约占人类约占人类基因组的基因组的11%11%;鉴定与人类疾病相关的基因;鉴定与人类疾病相关的基因200200个左右。个左右。模式生物中模式生物中已完成已完成古细菌、细菌、支

6、原体、酵母、线虫等近古细菌、细菌、支原体、酵母、线虫等近2525种生物的基因组全序列测定。种生物的基因组全序列测定。SeienceSeience在在19961996、19971997、19981998和和20002000年分别发表了酿酒酵母、大肠杆菌、线年分别发表了酿酒酵母、大肠杆菌、线虫虫(9700(9700万万bpbp,约约1909919099个基因个基因)和果蝇基因组全序列。和果蝇基因组全序列。19981998年完成全基因组年完成全基因组测序的还有梅毒、结核菌、斑疹伤寒菌、支原体等多种病原体,并发现一测序的还有梅毒、结核菌、斑疹伤寒菌、支原体等多种病原体,并发现一些蛋白质是这些病原体所特

7、有的,可用于药物和疫苗研制。些蛋白质是这些病原体所特有的,可用于药物和疫苗研制。由于许多私营公司参与竞争,使由于许多私营公司参与竞争,使HGPHGP计划加快进程,突出测定蛋白质编码计划加快进程,突出测定蛋白质编码序列为重点,加速进行基因功能的研究和开发。序列为重点,加速进行基因功能的研究和开发。19981998年美国年美国IGRIGR宣布将与宣布将与PE(PerkinPE(Perkin-Elmer)-Elmer)公司建立新公司,三年投资公司建立新公司,三年投资2 2亿美元,于亿美元,于20022002年完成年完成HGPHGP全序列测定。全序列测定。美国美国IncyteIncyte公司也宣布公司

8、也宣布2 2年内投资年内投资2 2亿美元,用亿美元,用SNPSNP绘制出人类绘制出人类1010万个基因万个基因的图谱,并宣称寻找人类基因的竞赛已经结束,当今研究重点应转向建立的图谱,并宣称寻找人类基因的竞赛已经结束,当今研究重点应转向建立疾病模型和基因的功能。这种情况下,国家资助的疾病模型和基因的功能。这种情况下,国家资助的HGPHGP负责人不得不也宣布负责人不得不也宣布20012001年完成大部分蛋白质编码区的测序,年完成大部分蛋白质编码区的测序,20032003年完成整个年完成整个HGPHGP测序。现将有测序。现将有关成果简要介绍。关成果简要介绍。国际上一批大型制药公司和化学公司大规模地向

9、基因组研究领域进军,标国际上一批大型制药公司和化学公司大规模地向基因组研究领域进军,标志着基因组研究可转化为巨大生产力。由于基因组研究与制药、生物技术、志着基因组研究可转化为巨大生产力。由于基因组研究与制药、生物技术、农业、食品、化学、环境、能源和计算机等部门密切相关,因此形成了一农业、食品、化学、环境、能源和计算机等部门密切相关,因此形成了一个新兴产业即生命科学工业。目前进入个新兴产业即生命科学工业。目前进入“后基因组后基因组”时代。时代。人类基因组含人类基因组含有有3-4万个基因,万个基因,其中其中80%进行可进行可变剪接改变蛋白变剪接改变蛋白质序列,因此,质序列,因此,其蛋白质组可能其蛋

10、白质组可能含有含有5-6万的成员。万的成员。人类基因组的构成人类基因组的构成Public effort-strategy:Celera-strategy:Sequencing StrategiesCeleras view of International ConsortiumInternational Consortiums view of Celera由长到短策略由长到短策略由短到长策略由短到长策略基因组基因组DNA大片段文库的构建大片段文库的构建 YAC(yeast artificial chromosome)酵母人工染色体)酵母人工染色体)含有三种必需成分:着丝粒、含有三种必需成分:着丝

11、粒、端粒和复制起点。是迄今容量端粒和复制起点。是迄今容量最大的克隆载体,插入片段平最大的克隆载体,插入片段平均长度为均长度为200-1000 Kbp,最大,最大的可以达到的可以达到2 Mbp。BAC(Bacterial artificial chromosome),用细菌的,用细菌的F质质粒及其调控基因构建了细菌染粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在色体克隆载体,其克隆能力在125150 Kbp左右。左右。以以BAC为基础的克隆载体形为基础的克隆载体形成嵌合体的频率较低,转化效成嵌合体的频率较低,转化效率高,而且以环状结构存在于率高,而且以环状结构存在于细菌体内,易于分辨和分离

12、纯细菌体内,易于分辨和分离纯化,已被科学界广泛接受。化,已被科学界广泛接受。100-150 Kbp insertionBACBAC的构建。的构建。pBAC108L来自细菌的一个小型来自细菌的一个小型F质粒,其中质粒,其中oriS和和repE控制了质粒的复制起始,控制了质粒的复制起始,parB和和parA控制了拷贝数。控制了拷贝数。鸟枪法序列测定技术鸟枪法序列测定技术全基因组鸟枪法测序全基因组鸟枪法测序(shotgun sequencing)技术:随技术:随机挑选带有基因组机挑选带有基因组DNA的质粒进行末端的质粒进行末端序列测定,然后用计算序列测定,然后用计算机程序进行序列拼接机程序进行序列拼

13、接。鸟枪法测序的鸟枪法测序的主要缺主要缺点是点是,随着所测基因组,随着所测基因组总量增大,所需测序的总量增大,所需测序的片段大量增加;其次,片段大量增加;其次,高等真核生物(如人类)高等真核生物(如人类)基因组中有大量重复序基因组中有大量重复序列,导致判断失误。列,导致判断失误。鸟枪法测序技术不能鉴别高等真鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列。核生物基因组中的重复序列。改进后的鸟枪法改进后的鸟枪法(adopted by both IC and Celera)。基因组学基础基因组学基础_遗传标记遗传标记遗传图谱遗传图谱又称为连锁图(又称为连锁图(Linkage Map),是),是

14、指基因或指基因或DNA标记在染色体上的标记在染色体上的相对位置相对位置(或(或距距离离),通常以基因或),通常以基因或DNA片段在染色体交换过程片段在染色体交换过程中的分离频率(中的分离频率(cM)来表示。)来表示。cM值越大,两者值越大,两者之间遗传距离越远。之间遗传距离越远。物理图谱物理图谱是指以已知序列的是指以已知序列的DNA片段(序列标片段(序列标签位点,签位点,sequence-tagged site,STS)在染色)在染色体上的体上的实际位置实际位置,位点之间的距离(图距)以碱,位点之间的距离(图距)以碱基对(基对(bp,kb,Mb)作为测量单位的基因组图。)作为测量单位的基因组图

15、。遗传图VS物理图遗传图和物理图所表示遗传图和物理图所表示的基因(和分子标记位的基因(和分子标记位点)在序列上基本相同,点)在序列上基本相同,但在但在距离上是不相同的距离上是不相同的。遗遗传图确定的是基因或传图确定的是基因或DNA DNA 标记在染色体上的标记在染色体上的相对位置与遗传距离。相对位置与遗传距离。物理图是指以物理距离物理图是指以物理距离来表示其在来表示其在DNA DNA 分子上分子上的位置而构成的位的位置而构成的位置图置图。理想的分子遗传标记应具备的理想的分子遗传标记应具备的特点特点:遗传多态遗传多态性高性高;检测手段简单快捷,易于实现自检测手段简单快捷,易于实现自动化动化;遗传

16、共显性,即在分离群体中能够分辨等位基因的遗传共显性,即在分离群体中能够分辨等位基因的3 3种基种基因型因型;标记遍布整个基标记遍布整个基因组因组;准确性,能正确反映动物的真实遗传,即标记是与准确性,能正确反映动物的真实遗传,即标记是与经济性状基因,还是与影响重要性的性状基因经济性状基因,还是与影响重要性的性状基因连锁连锁;实验重复性好(便于数据交实验重复性好(便于数据交换)换);开发成本和使用成本尽量开发成本和使用成本尽量低廉低廉。DNA遗传标记遗传标记(DNA marker)DNA遗传标记代表遗传标记代表 第一代第一代DNA遗传标记遗传标记是是RFLP(Restriction Fragmen

17、t Length Polymorphism)。DNA序列上的微小变化,甚至序列上的微小变化,甚至1个核苷酸的变化,也能引起个核苷酸的变化,也能引起限制性内切酶切点限制性内切酶切点的丢失或的丢失或产生,导致酶切片段长度的变化。产生,导致酶切片段长度的变化。第二代第二代DNA遗传标记遗传标记SSLP(Simple Seqeuce Length Polymorphism)利用了存在于人类基因组中的大量利用了存在于人类基因组中的大量重复序重复序列列,包括重复单位长度在,包括重复单位长度在15-65个核苷酸左右的小卫星个核苷酸左右的小卫星DNA(minisatellite DNA),重复单位长度在),重

18、复单位长度在2-6个核苷个核苷酸之间的微卫酸之间的微卫星星DNA(microsatellite DNA)。第三代第三代DNA遗传标记遗传标记SNP(single nucleotide polymorphism),是同一物种不同个体基因组,是同一物种不同个体基因组DNA序列序列在同一位置上的在同一位置上的单个碱基单个碱基的差异。单核苷酸的多态性。的差异。单核苷酸的多态性。到目前为止已经在人类基因组发现了超过到目前为止已经在人类基因组发现了超过1000万个万个SNP位点,位点,平均每平均每300bp中就有一个中就有一个SNP!对对RFLP的检测主要的检测主要是用是用Southern杂交的杂交的方法

19、进行基本流程:方法进行基本流程:组织或细胞组织或细胞基因组基因组DNA限制性内切酶限制性内切酶消化消化琼脂糖凝胶电琼脂糖凝胶电泳泳印迹转移至滤膜印迹转移至滤膜预杂交预杂交加入探针加入探针杂交杂交洗膜洗膜放射放射自显影。自显影。RFLP markersSSLP markers人人VNTRs(可变数目串联重复位点可变数目串联重复位点)的系谱分析(引自的系谱分析(引自Hartl等,等,2001)人)人类系谱分析表明类系谱分析表明VNTR等位基因的分离。在系谱中出现等位基因的分离。在系谱中出现6个等位基因个等位基因(A1 A6),但是任何一个个体仅可能有一个等位基因),但是任何一个个体仅可能有一个等位

20、基因(纯合子纯合子)或两个或两个等位基因等位基因(杂合子杂合子)。一般将。一般将16-100bp重复称为重复称为小卫星小卫星,2-6bp称为称为微卫星微卫星,多态性来源于其组成和重复次数,符合孟德尔遗传规律,可分析作图。多态性来源于其组成和重复次数,符合孟德尔遗传规律,可分析作图。SNP marker平均每平均每300300600bp600bp存在存在一个一个SNPSNP。这些这些SNPSNP位点可能正是位点可能正是生物多样性(包括群体水生物多样性(包括群体水平与个体水平)的物质基平与个体水平)的物质基础,也是多基因复杂疾病础,也是多基因复杂疾病及个体间患病风险与药物及个体间患病风险与药物不同

21、反应的物质基础。不同反应的物质基础。但是具体而言,应该如但是具体而言,应该如何利用这些何利用这些SNPSNP信息呢?信息呢?HaplotypeHaplotype:又称又称“单体型单体型”,“单元型单元型”。一条同。一条同源染色体上的等位基因或遗传标记所构成的组合。源染色体上的等位基因或遗传标记所构成的组合。假设存在假设存在N N个个SNPSNP位点,则理论上单倍体应有位点,则理论上单倍体应有2 2N N个个SNPSNP基因型。基因型。但实际上,人们发现人类基因组中相邻近的SNP等位位点倾向于以一个整体整体遗传给后代,即大多数染色体区域只有少数几种SNP基因型。单体型:一个haplotypes由

22、临近的一系列SNP等位位点组成,图中显示从一个6000bp DNA片段上检定出的20个SNPs的排布类型,包括A中的3个位点(第二排箭头)。标签SNPs:只要检定分型20个SNPs中的3个,就足以确定这一段序列的单体型,例如,如果测出一个染色体的标签SNPs是A-T-C,则这一序列是单体型1。单体型的应用:根据染色体上相关连锁基因的组成,追踪遗传来源和传递路线。根据单倍型与疾病的连锁关系,分析基因样本,推测疾病的风险。根据单倍型的群体分布,研究种群的形成和隔离。由于重组热点等原因,基因组内的连锁不平衡的基因通由于重组热点等原因,基因组内的连锁不平衡的基因通常是像积木一样块状分布的,并且每个积木

23、内部的单倍型常是像积木一样块状分布的,并且每个积木内部的单倍型差异远低于理论值。差异远低于理论值。单倍型的块状结构提示我们将遗传疾病和这些单倍型关单倍型的块状结构提示我们将遗传疾病和这些单倍型关联起来更加容易。联起来更加容易。HapMap计划在一定程度上解决了连锁计划在一定程度上解决了连锁分析中的遗传标记数量和代表性的问题,对复杂疾病的遗分析中的遗传标记数量和代表性的问题,对复杂疾病的遗传分析和数量性状的遗传分析具有重要的意义。传分析和数量性状的遗传分析具有重要的意义。17.2 基因组测序与序列组装基因组测序与序列组装人类基因组计划的成功很大程度上得益人类基因组计划的成功很大程度上得益于有效减

24、少于有效减少DNA测序成本的技术更测序成本的技术更新。新。通通过改良测序方法,不断提升其自动化过改良测序方法,不断提升其自动化程度,程度,DNA测序的成本降低了测序的成本降低了100倍,从倍,从20世纪世纪70-80年代年代$10/bp降低到本世纪初降低到本世纪初$0.1/bp!Illumina/Solexa Genetic Analyzer2000 Mb/runApplied Biosystems ABI 3730XL1 Mb/day Roche/454 Genome Sequencer FLX100 Mb/runApplied BiosystemsSOLiD3000 Mb/run测序技术测

25、序技术Sanger sequencing(双脱氧核苷酸链终止法双脱氧核苷酸链终止法)13maybe 800 bp long42Sanger方法的特点为方法的特点为读序能力较强读序能力较强,每次反应约可得到,每次反应约可得到1,000个核苷酸序列,因此可提供较多的个核苷酸序列,因此可提供较多的DNA讯息;但相对讯息;但相对的,其的,其缺点缺点为操作较复杂,以及不易于一定时间内分析大为操作较复杂,以及不易于一定时间内分析大量检体。量检体。虽然在很多情况中,我们对虽然在很多情况中,我们对DNA序列分析的要求是读序序列分析的要求是读序越长越好,但在相当多的越长越好,但在相当多的分子诊断分子诊断工作中,

26、往往需在短时工作中,往往需在短时间内侦测很多间内侦测很多DNA检体,而且只需短短的几十个核苷酸序检体,而且只需短短的几十个核苷酸序列的信息,就可以提供正确诊断。列的信息,就可以提供正确诊断。例如:例如:在临床分子诊断领域中,对细菌和其它病原微生物在临床分子诊断领域中,对细菌和其它病原微生物的分子诊断,或在侦测单一核苷酸多态性的分子诊断,或在侦测单一核苷酸多态性(SNP)时,只需对时,只需对最具代表性的十几到几十个核苷酸片段进行序列分析即可。最具代表性的十几到几十个核苷酸片段进行序列分析即可。在这种情况下,在这种情况下,Sanger 方法未必是最合适的方法未必是最合适的DNA序列分序列分析技术。

27、析技术。新发展的新发展的焦磷酸测序焦磷酸测序(pyrosequencing)技术,应该是目技术,应该是目前最适合这些应用目的的前最适合这些应用目的的DNA序列分析技术。序列分析技术。Pyrosequencing(焦磷酸测序焦磷酸测序)-454Margulies,M.Eghold,M.et al.Nature.2005 Sep 15;437(7057):326-7焦磷酸测序技术,是针对短到中焦磷酸测序技术,是针对短到中等长度的等长度的DNA序列样品进行高通量、序列样品进行高通量、高精确度高精确度(99%精确精确)和再现性佳的分和再现性佳的分析技术。其原理是利用几种生化反析技术。其原理是利用几种生

28、化反应组合来测定在应组合来测定在DNA合成过程中产合成过程中产生的焦磷酸基团生的焦磷酸基团(PPi)的特征,将的特征,将PPi转换成转换成ATP,ATP再促使荧光素再促使荧光素酶酶(luciferase)放出冷光放出冷光(bioluminescenc)。经冷光仪。经冷光仪(luminometer)侦测放出的冷光强度,侦测放出的冷光强度,转读出转读出DNA序列。序列。特点:特点:对对DNA的序列分析无须进的序列分析无须进行电泳、行电泳、DNA片段无须荧光标记及片段无须荧光标记及在在96孔盘上进行反应,可同时进行孔盘上进行反应,可同时进行多检体序列分析。但也因反应特性多检体序列分析。但也因反应特性

29、的限制,精准读序目前只在的限制,精准读序目前只在20-30bp左右。有的研究者经过改良,可使左右。有的研究者经过改良,可使该技术的读序长度增加一倍以上。该技术的读序长度增加一倍以上。焦磷酸测序的操作基本步骤:焦磷酸测序的操作基本步骤:利用利用PCR复制待测序的复制待测序的DNA。反应中。反应中PCR primer pair之一为生物素之一为生物素(biotin)所标记。所标记。经经biotin标定之标定之PCR产物与产物与streptavidin偶连之偶连之sepharose微珠微珠(streptavidin-conjugated sepharose beads)进行反应后被纯化。进行反应后被

30、纯化。DNA双股经加热变性而分开,成为双股经加热变性而分开,成为pyrosequencing反应的待测单股反应的待测单股DNA模板,之后和测序模板,之后和测序primer结合成杂交体。结合成杂交体。进行焦磷酸序列分析反应:与进行焦磷酸序列分析反应:与DNA聚合酶聚合酶(DNApolymerase)、硫酸化酶、硫酸化酶(ATP sulfurylase)、荧光素酶、荧光素酶(luciferase)、双磷酸酶、双磷酸酶(apyrase)和受质和受质adenosine 5-phosphosulfate(APS)、荧光素、荧光素(luciferin)进行反应。进行反应。四种四种dNTP(dATPS、dT

31、TP、dCTP、dGTP)依序被加入反应体系中。在每一轮测序反应依序被加入反应体系中。在每一轮测序反应中,只加入其中一种。如被加入的中,只加入其中一种。如被加入的dNTP与与DNA模板配对,模板配对,DNA聚合酶就可以催化该聚合酶就可以催化该dNTP与与primer的的3端形成共价键,端形成共价键,dNTP的焦磷酸基团的焦磷酸基团(PPi)就被释放出来。加入的就被释放出来。加入的dNTP和释放和释放出来的出来的PPi的摩尔的摩尔(mole)数目是相等的。接着,数目是相等的。接着,ATP sulfurylase催化催化APS和和PPi形成形成ATP,此此ATP和和PPi的的mole数目也是一致的

32、。利用数目也是一致的。利用ATP作为能源,作为能源,luciferase可将荧光素氧化为氧可将荧光素氧化为氧化荧光素化荧光素(oxyluciferin),进而发出与,进而发出与ATP量成正比的可见光信号。量成正比的可见光信号。光信号由光信号由CCD摄像机检摄像机检测,并由测,并由pyrogramTM转为波形讯号。每个波峰的高度转为波形讯号。每个波峰的高度(光信号光信号)与反应中加入的核苷酸数目与反应中加入的核苷酸数目成正比,例如:若加入成正比,例如:若加入dGTP的该次反应中,产生两倍高的波峰,表示此处的的该次反应中,产生两倍高的波峰,表示此处的DNA模板上的模板上的序列是两个与序列是两个与G

33、配对的配对的C。之后,。之后,ATP由由apyrase降解,消除光信号,并再生反应体系,然降解,消除光信号,并再生反应体系,然后就可以加入下一种后就可以加入下一种dNTP。如被加入的。如被加入的dNTP与与DNA模板不能配对,以上反应便不发生,模板不能配对,以上反应便不发生,dNTP由由apyrase直接降解,然后进入下一个反应循环。随着以上过程的循环进行,与直接降解,然后进入下一个反应循环。随着以上过程的循环进行,与DNA模板互补的模板互补的DNA链合成,产生链合成,产生pyrogram的波形讯号,并转为的波形讯号,并转为DNA序列。序列。可逆终止子可逆终止子 碱基测序碱基测序(Revers

34、ible terminator-based sequencing,Solexa)基本原理:基本原理:利用单分子阵列测定。利用单分子阵列测定。首先将提取的首先将提取的 DNA打断成约打断成约 100-200bp 片段,再加上接头,经片段,再加上接头,经 PCR 扩增制成文库。随后在含有接头的芯扩增制成文库。随后在含有接头的芯片片(flow cell)上将已加入接头的上将已加入接头的 DNA 片段绑定在片段绑定在 flow cell上,并将不同上,并将不同片段扩增。片段扩增。应用边合成边测序原理应用边合成边测序原理,在每个循环将荧光标记的核苷和聚合,在每个循环将荧光标记的核苷和聚合酶加入到单分子阵

35、列。互补的核苷和核苷酸片段的第一个碱基配对,通过酶加入到单分子阵列。互补的核苷和核苷酸片段的第一个碱基配对,通过酶加入到引物上。多余的核苷被移走。酶加入到引物上。多余的核苷被移走。这样每个单链这样每个单链 DNA 分子通过互补碱基的配对被延伸,利用生物发光蛋分子通过互补碱基的配对被延伸,利用生物发光蛋白白(荧光素酶荧光素酶),可通过碱基加到引物后端时所释放的焦磷酸盐提供检测信,可通过碱基加到引物后端时所释放的焦磷酸盐提供检测信号。针对每种碱基的特定波长的激光激发结合上的核苷的标记发出荧光。号。针对每种碱基的特定波长的激光激发结合上的核苷的标记发出荧光。荧光信号被荧光信号被 CCD 采集,采集,

36、CCD 快速扫描整个阵列检测特定的结合到每个快速扫描整个阵列检测特定的结合到每个片段上的碱基。片段上的碱基。通过上述的结合,检测可以重复几十个循环,这样就有可能决定核苷酸通过上述的结合,检测可以重复几十个循环,这样就有可能决定核苷酸片段中的几十个碱基。片段中的几十个碱基。可在一个反应中同时加入可在一个反应中同时加入 4 种核苷的标签,采用种核苷的标签,采用边合成边测序,可减少因二级结构造成的一段区域的缺失。并具有所需样边合成边测序,可减少因二级结构造成的一段区域的缺失。并具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等品量少,高通量,高精确性,拥有简单易操作的自动化平

37、台和功能强大等特点,此反应可以同时检测上亿个核苷酸片段特点,此反应可以同时检测上亿个核苷酸片段,因此在同一个芯片或几个因此在同一个芯片或几个芯片上花费很少芯片上花费很少(只需常规方法的只需常规方法的 1)的成本就可测试全基因组。的成本就可测试全基因组。(1)添加接头。利用物理方法将待测样品DNA打碎,在DNA碎片两端加上接头。(2)表面结合。随机添加到玻随机添加到玻璃璃Flow Cell内,随机固定内,随机固定单链接头序列和带接头的单单链接头序列和带接头的单链待测链待测DNA片片段段。(3)桥桥型扩增循环获得多拷贝待型扩增循环获得多拷贝待测测DNA片片段段。在在Flow cell内内加入未被标

38、记的加入未被标记的dNTP和酶起和酶起始固相桥型扩增。始固相桥型扩增。Solexa 测序的基本步骤测序的基本步骤1)制备文库制备文库所所有单链桥型待测片段被扩增成双链桥有单链桥型待测片段被扩增成双链桥片片段段,通过变性,通过变性,释放出互补的单链,锚定到附近的固相释放出互补的单链,锚定到附近的固相表面。表面。通通过不断循环,将会在过不断循环,将会在Flow cell的固相表面上获得上百万条成簇的固相表面上获得上百万条成簇分布的双链待测片分布的双链待测片段段。2)产生产生DNA簇簇边合成边测序。边合成边测序。加入改性的加入改性的DNA聚合酶和带有聚合酶和带有4种荧光标记的种荧光标记的dNTP。这

39、些核苷这些核苷酸是酸是“可逆终止子可逆终止子”,因为,因为3 羟基末端带有可化学切割的部分,它只容许每个循羟基末端带有可化学切割的部分,它只容许每个循环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应环掺入单个碱基。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复所聚合上去的核苷酸种类。之后,将这些基团化学切割,恢复3 端粘性,继续聚端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,统计每轮收集到的荧光信号结

40、果,就可以得知每个模板统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。片段的序列。SOLiD测序技术测序技术:SOLiD文库构建。文库构建。制备片段文库制备片段文库(fragment library)或末端配对文库或末端配对文库(mate-paired library)。片段文库就是在短。片段文库就是在短DNA片段片段(60110 bp)两端加上两端加上SOLiD接头接头(P1、P2 adapter)。而制备末端配对文库,先通过。而制备末端配对文库,先通过DNA环化、环化、Ecop15I酶切等步骤截取长酶切等步骤截取长DNA片段片段(600bp-10kb)两末端各两末端各25

41、 bp进行连接,然后在该连接产物两端加上进行连接,然后在该连接产物两端加上SOLiD接头。接头。油包水油包水PCR(emulsion)。文库制备得到大量末端带文库制备得到大量末端带P1、P2 adapter但内部插入但内部插入序列不同的序列不同的DNA双链模板。油包水双链模板。油包水PCR也是在水溶液进行反应,该水相含也是在水溶液进行反应,该水相含PCR所所需试剂,需试剂,DNA模板及可分别与模板及可分别与P1、P2 adapter结合的结合的P1、P2 PCR引物。引物。P1引物引物固定在固定在P1 磁珠球形表面磁珠球形表面,P1引物引导合成的引物引导合成的DNA链也就被固定到链也就被固定到

42、P1磁珠表面了。磁珠表面了。油包水油包水PCR关键技术是关键技术是“注水到油注水到油”,基本过程是在,基本过程是在PCR反应前,将包含反应前,将包含PCR所所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。油包裹的小水滴。含含DNA模板模板P1磁珠的固定。磁珠的固定。SOLiD测序反应在测序反应在SOLiD玻片表面进行。含有玻片表面进行。含有DNA模板的模板的P1磁珠共价结合在磁珠共价结合在SOLiD玻片表面。磁珠是玻片表面。磁珠是SOLiD测序的最小单元。每个磁测序的最小单元。每个

43、磁珠珠SOLiD测序后形成一条序列。测序后形成一条序列。SOLiD双碱基编码及测序。双碱基编码及测序。SOLiD“双碱基编码原理双碱基编码原理”实质上是阐明了荧光探针实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关系。的颜色类型与探针编码区碱基对的对应关系。SOLiD连接反应的底物是连接反应的底物是8碱基单链碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。模板链配对。SOLiD:底物附着;双碱基探针。底物附着;双碱基探针。构建构建SOLiD文库;文库;DNA片段与磁珠连接及油包水片段与磁珠连

44、接及油包水PCR(emulsion);将磁珠固定在玻璃片。将磁珠固定在玻璃片。SOLiD采用连接法测序获得基于采用连接法测序获得基于“双碱基编码原理双碱基编码原理”的的SOLiD颜色编码序列,比颜色编码序列,比较原始颜色序列,把较原始颜色序列,把SOLiD颜色序列定位,同时校正测序错误,并可结合原始颜颜色序列定位,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在色序列的质量信息发现潜在SNP位点。位点。SOLiD:Sequencing ligation cyclesSOLiD:Data Collection and Image Analysis第二代测序技术对比第二代测序技术对比App

45、lications Genetic Analyzer表达谱分析。表达谱分析。通过对样本中通过对样本中数以百万计的数以百万计的cDNA标签同时标签同时进行序列测定,可对整个转录进行序列测定,可对整个转录组进行数字化的分析,而成本组进行数字化的分析,而成本仅仅维持在与目前其他模拟化仅仅维持在与目前其他模拟化分析技术同样的水平。可以同分析技术同样的水平。可以同时进行全基因组转录子的发掘时进行全基因组转录子的发掘与定量分析,而无需事先知道与定量分析,而无需事先知道基因组的注释情况。基因组的注释情况。小小RNA鉴定与定量分析。鉴定与定量分析。可可以提供一套全新独特的,适用以提供一套全新独特的,适用于各个

46、物种的小于各个物种的小RNA深度鉴深度鉴定与定量分析研究平台。通过定与定量分析研究平台。通过大量的平行测序,可发掘、鉴大量的平行测序,可发掘、鉴定并定量出任何物种全基因组定并定量出任何物种全基因组水平的小水平的小RNA图谱,提供了图谱,提供了解密小解密小RNA图谱独一无二的图谱独一无二的方法。方法。What do we sequence?de novo genome sequencinggenome resequencing(SNP identification)metagenomes or complex samplestranscriptome profilingsmall RNA ide

47、ntification在细菌鉴定之应用在细菌鉴定之应用。利用。利用PCR和焦磷酸技术的和焦磷酸技术的序列分析,将可提供一个快速、简单、可靠的细序列分析,将可提供一个快速、简单、可靠的细菌鉴定方法。此方法速度快,几个小时即可得到菌鉴定方法。此方法速度快,几个小时即可得到结果,而且结果非常精确。结果,而且结果非常精确。在在SNP研究中的应用。研究中的应用。除了除了DNA序列分析外,序列分析外,还可以进行已知还可以进行已知SNP的分析和的分析和SNP频率确定。频率确定。在肿瘤基因甲基化研究的应用。在肿瘤基因甲基化研究的应用。在一般正常的在一般正常的细胞中,基因调控区细胞中,基因调控区CpG isla

48、nd处于非甲基化的处于非甲基化的状态。而当细胞发生癌变后,这些状态。而当细胞发生癌变后,这些CG区域往往区域往往呈现甲基化状态。呈现甲基化状态。快速地检测甲基化的频率,对快速地检测甲基化的频率,对样品中的甲基化位点进行定性及定量检测。样品中的甲基化位点进行定性及定量检测。Next Steps on HGPFinish the human sequenceLarge-scale identification of regulatory regionsSequencing of additional large genomesCompleting the catalogue of human va

49、riationFrom sequence to function完成人类基因组测序;完成人类基因组测序;大规模鉴定调控区域;大规模鉴定调控区域;测定附加的大基因组;测定附加的大基因组;完成不同个体基因组差异完成不同个体基因组差异分析;分析;解明基因组序列与其功能解明基因组序列与其功能的关系。的关系。疾病遗传标记,染色体定位基因序列mRNAcDNA蛋白质产物生物学功能 疾病疾病 功能功能基因基因 功能基因组学功能基因组学(Functional genomics):大规模平行:大规模平行研究不同组织或器官的基因研究不同组织或器官的基因表达模式及其调控机制。表达模式及其调控机制。蛋白质组学蛋白质组学

50、(Proteomics):整体上研究细胞内全部蛋白整体上研究细胞内全部蛋白质的组成、结构、功能及其质的组成、结构、功能及其相互作用。相互作用。生物信息学生物信息学(Bioinformatics):运用计运用计算机和信息技术开发新的算算机和信息技术开发新的算法和统计方法,对生物实验法和统计方法,对生物实验的数据进行分析的数据进行分析,确定其,确定其生物学意义。生物学意义。例:例:定位克隆定位克隆HapMap计划计划+GWAS应用。应用。17.3 功能基因组学功能基因组学基因定位方法基因定位方法 家系连锁分析法家系连锁分析法连锁分析原理:连锁分析原理:若某一遗传标记与待定基因距离较远若某一遗传标记

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第17章-基因组学与后基因组学-遗传学课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|