1、DNADNA测序技术的发展与应用测序技术的发展与应用引言引言测序技术的应用与展望测序技术的应用与展望第一代测序技术第一代测序技术第二代测序技术第二代测序技术DNADNA序列测定的意义序列测定的意义 DNADNA的序列测定是分子生物学研究中的一的序列测定是分子生物学研究中的一项非常重要的和关键的内容。如在基因的分项非常重要的和关键的内容。如在基因的分离、定位、基因结构与功能的研究、基因工离、定位、基因结构与功能的研究、基因工程中载体的组建、基因表达与调控、基因片程中载体的组建、基因表达与调控、基因片段的合成和探针的制备、基因与疾病的关系段的合成和探针的制备、基因与疾病的关系等等,都要求对等等,都
2、要求对DNADNA一级结构的详细了解。一级结构的详细了解。人类基因组计划(人类基因组计划(Human Genome ProjectHuman Genome ProjectHGPHGP)于于19901990年正式启动,其主要目标有:识别人类年正式启动,其主要目标有:识别人类DNADNA中所有基因(超过中所有基因(超过1010万个);测定组成人类万个);测定组成人类DNADNA的的3030亿碱基对的序列亿碱基对的序列;将这些信息储存到数;将这些信息储存到数据库中;开发出有关数据分析工具;致力于解决据库中;开发出有关数据分析工具;致力于解决该计划可能引发的伦理、法律和社会问题。已于该计划可能引发的伦
3、理、法律和社会问题。已于20032003年完成。年完成。人类基因组计划是当代生命科学一项伟大的人类基因组计划是当代生命科学一项伟大的科学工程,它奠定了科学工程,它奠定了2121世纪生命科学发展和现代世纪生命科学发展和现代医药生物技术产业化的基础,具有科学上的巨大医药生物技术产业化的基础,具有科学上的巨大意义和商业上的巨大价值。意义和商业上的巨大价值。测序技术最早可以追溯到测序技术最早可以追溯到20世纪世纪50年代。年代。早在早在1945年就已经出现了关于早期测序技术的年就已经出现了关于早期测序技术的报导,即报导,即Whitfeld等用化学降解的方法测定多聚核等用化学降解的方法测定多聚核糖核苷酸
4、序列。糖核苷酸序列。19771977年年Sanger等发明的双脱氧核苷等发明的双脱氧核苷酸末端终止法和酸末端终止法和Gilbert等发明的化学降解法,等发明的化学降解法,标志标志着第一代测序技术的诞生着第一代测序技术的诞生。此后在三十几年的发展中陆续产生了第二代测此后在三十几年的发展中陆续产生了第二代测序技术,包括序技术,包括Roche公司的公司的454技术技术、Illumina公司公司的的SolexaSolexa技术技术和和ABI公司的公司的SOLiD技术技术。最近,最近,Helicos公司的单分子测序技术、公司的单分子测序技术、Pacific Biosciences公司的单分子实时公司的单
5、分子实时(Single Molecule Real Time,SMRT)测序技术和测序技术和Oxford Nanopore Technologies公司正在研究的纳米孔公司正在研究的纳米孔单分子测序技术被认为是第三代测序技术。单分子测序技术被认为是第三代测序技术。测序技术正在向着高通量、低成本、长读取测序技术正在向着高通量、低成本、长读取长度的方向发展。长度的方向发展。化学降解法 基本原理:利用特异的基本原理:利用特异的选择性试剂选择性试剂,专一性的随机断裂专一性的随机断裂DNADNA成不同长短的片成不同长短的片段。根据试剂的选择性及片段在高分段。根据试剂的选择性及片段在高分辨力的辨力的聚丙烯
6、酰胺凝胶电泳聚丙烯酰胺凝胶电泳上的区带上的区带位置,判断位置,判断DNADNA片段末端核苷酸的种类片段末端核苷酸的种类,从而测出,从而测出DNADNA的序列。的序列。将双链将双链DNADNA样品变为样品变为单链单链 每个单链的同一方向末端都用放射每个单链的同一方向末端都用放射性同位素性同位素标记标记,以便显示以便显示DNADNA条带条带 分别用不同方法处理分别用不同方法处理,获得只差获得只差一个核苷酸的一个核苷酸的降解降解DNADNA群体群体 电泳电泳,读取读取DNADNA的核苷酸顺序的核苷酸顺序 化学降解法刚问世时,准确性较好,也容易为普化学降解法刚问世时,准确性较好,也容易为普通研究人员所
7、掌握,因此用得较多。通研究人员所掌握,因此用得较多。而且化学降解较之链终止法具有一个明显的优点而且化学降解较之链终止法具有一个明显的优点,即所测序列来自,即所测序列来自原原DNADNA分子分子而不是酶促合成产而不是酶促合成产生的拷贝,排除了合成时造成的错误。生的拷贝,排除了合成时造成的错误。但化学降解法操作过程较麻烦,且用到放射性物但化学降解法操作过程较麻烦,且用到放射性物质,逐渐被简便快速的质,逐渐被简便快速的SangerSanger法所代替。法所代替。又称为又称为SangerSanger法。法。原理:利用原理:利用DNADNA聚合酶,以待测聚合酶,以待测单链单链DNADNA为模板,为模板,
8、以以dNTPdNTP为底物,设立四种相互独立的测序反应体为底物,设立四种相互独立的测序反应体系,在每个反应体系中加入不同的系,在每个反应体系中加入不同的双脱氧核苷三双脱氧核苷三磷酸磷酸(ddNTPddNTP)作为链延伸终止剂。)作为链延伸终止剂。在测序引物引导下,通过高分辨率的变性在测序引物引导下,通过高分辨率的变性聚丙烯聚丙烯酰胺凝胶电泳酰胺凝胶电泳分离,分离,放射自显影放射自显影检测后,检测后,合成链合成链序列序列,由此推知待测模板链的序列,由此推知待测模板链的序列 。POHdNTPddNTP POHOH P P P POH Sanger法因操作简便,得到广泛的应用。法因操作简便,得到广泛
9、的应用。后来在此基础上发展出多种后来在此基础上发展出多种DNA测序技术测序技术,其中最重要的是,其中最重要的是荧光自动测序技术荧光自动测序技术。荧光自动测序技术基于荧光自动测序技术基于SangerSanger原理,用原理,用荧光标记荧光标记代替同位素标记代替同位素标记,并用,并用成像系统成像系统自动检测,从而自动检测,从而大大提高了大大提高了DNADNA测序的速度和准确性。测序的速度和准确性。目前,应用最广泛的应用生物系统公司目前,应用最广泛的应用生物系统公司(applied(applied biosystems biosystems,ABI)3730ABI)3730系列自动测序仪即是基系列自
10、动测序仪即是基于于毛细管电泳毛细管电泳和和荧光标记技术荧光标记技术的的DNADNA测序仪测序仪。3730全自动测序仪 该方法不同于化学降解法和该方法不同于化学降解法和SangerSanger法,是利用法,是利用DNADNA杂交原理,将一系列杂交原理,将一系列已知序列的单链寡核苷已知序列的单链寡核苷酸片段酸片段固定在基片上,把待测的固定在基片上,把待测的DNADNA样品片段变样品片段变性后与其杂交,根据杂交情况排列出样品的序列性后与其杂交,根据杂交情况排列出样品的序列信息。信息。杂交测序检测速度快,采用标准化的高密度杂交测序检测速度快,采用标准化的高密度寡核寡核苷酸芯片苷酸芯片能够大幅度降低检测
11、的成本,具有部分能够大幅度降低检测的成本,具有部分第二代测序技术的特点。但该方法误差较大,且第二代测序技术的特点。但该方法误差较大,且不能重复测定。不能重复测定。通过几十年的逐步改进通过几十年的逐步改进,第第1 1代测序仪的读长可代测序仪的读长可以超过以超过1000 bp,1000 bp,原始数据的准确率可以高达原始数据的准确率可以高达99.999%,99.999%,测定每千碱基序列的成本是测定每千碱基序列的成本是0.5 0.5 美元美元,每天的数据通量可以达到每天的数据通量可以达到600000 600000 碱基。碱基。第一代测序技术在分子生物学研究中发第一代测序技术在分子生物学研究中发挥过
12、重要的作用挥过重要的作用,如人类基因组计划如人类基因组计划(human(human genome project,HGP)genome project,HGP)主要基于第一代主要基于第一代DNADNA测测序技术。目前基于荧光标记和序技术。目前基于荧光标记和SangerSanger的双脱的双脱氧链终止法原理的氧链终止法原理的荧光自动测序仪荧光自动测序仪仍被广泛仍被广泛地应用。地应用。尽管第一代测序技术已经帮助人们完成了从噬尽管第一代测序技术已经帮助人们完成了从噬菌体基因组到人类基因组草图等大量的测序工菌体基因组到人类基因组草图等大量的测序工作,但由于其存在作,但由于其存在成本高成本高、速度慢速度
13、慢等方面的不等方面的不足,并不是最理想的测序方法。足,并不是最理想的测序方法。随着人类基因组计划的完成,后基因组时代,随着人类基因组计划的完成,后基因组时代,即功能基因组时代已向我们走来。第一代测序即功能基因组时代已向我们走来。第一代测序方法已经不能满足方法已经不能满足深度测序深度测序和和重复测序重复测序等大规等大规模基因组测序的需求,这促使了第二代测序,模基因组测序的需求,这促使了第二代测序,又称下一代测序又称下一代测序(nextgeneration(nextgeneration sequencing)sequencing)的诞生。的诞生。第二代测序技术包括:第二代测序技术包括:454454
14、测序技术测序技术、SolexaSolexa测测序技术序技术和和SOLiDSOLiD测序技术测序技术。基因组基因组DNA DNA DNA DNA片段(片段(cDNAcDNA)构建构建ssDNAssDNA文库文库测序测序(聚合酶合成测序聚合酶合成测序,连接酶合成测序连接酶合成测序)由于所有的克隆都在同一平面上,这些反应就能够大规模平行进由于所有的克隆都在同一平面上,这些反应就能够大规模平行进行,每个延伸反应所掺入的荧光标记的成像检测也能同时进行,从而行,每个延伸反应所掺入的荧光标记的成像检测也能同时进行,从而获得测序数据。获得测序数据。DNADNA序列延伸和成像检测不断重复,最后经过计算机序列延伸
15、和成像检测不断重复,最后经过计算机分析就可以获得完整的分析就可以获得完整的DNADNA序列信息。序列信息。在在聚合酶聚合酶、硫酸化酶硫酸化酶、荧光荧光素酶素酶和和双磷酸酶双磷酸酶的作用下,将每一个的作用下,将每一个的聚合与一次化学发光信号的释放偶联起来,的聚合与一次化学发光信号的释放偶联起来,通过检测化学发光信号的有无和强度,达到通过检测化学发光信号的有无和强度,达到实时检测实时检测序列的目的。序列的目的。硫化酶硫化酶荧光素酶荧光素酶指示器指示器相机相机PTPPTP盒盒 454 454测序法的突出优势是测序法的突出优势是较长的读长较长的读长,目前,目前GS FLXGS FLX测序系统的序列读长
16、已超过测序系统的序列读长已超过400 bp400 bp。虽。虽然然454454平台的测序成本比其他新一代测序平台要平台的测序成本比其他新一代测序平台要高很多,但对于那些需要长读长的应用,如从高很多,但对于那些需要长读长的应用,如从头测序,它仍是最理想的选择。头测序,它仍是最理想的选择。缺点是缺点是无法准确测量同聚物的长度无法准确测量同聚物的长度。Illumina公司的新一代测序仪公司的新一代测序仪Genome Analyzer最早由最早由Solexa公司研发,利用合成测序公司研发,利用合成测序(Sequencingby Synthesis)的的原理,实现自动化样本制备及大规模平行测序。原理,实
17、现自动化样本制备及大规模平行测序。原理:原理:将基因组将基因组DNA的随机片段附着到光学透明的玻的随机片段附着到光学透明的玻璃表面(即璃表面(即Flow cell),这些),这些DNA片段经过延伸和片段经过延伸和桥式扩增后,在桥式扩增后,在Flow cell上形成了数以亿上形成了数以亿Cluster,每个每个Cluster是具有数千份相同模板的单分子簇。然是具有数千份相同模板的单分子簇。然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的过可逆性终止的SBS(边合成边测序)技术对待测(边合成边测序)技术对待测的模板的模板DNA进行测序。进行测
18、序。GenomeAnalyzer系统需要的系统需要的样品量低至样品量低至100ng,文库构建过程简单,减少了样品分离,文库构建过程简单,减少了样品分离和制备的时间,配对末端读长可达到和制备的时间,配对末端读长可达到250bp,每次运行后可获得超过每次运行后可获得超过20 GB的高质量过滤数的高质量过滤数据,且运行成本较低,是性价比较高的新一代据,且运行成本较低,是性价比较高的新一代测序技术。测序技术。SOLID通过连接反应进行测序。其基本原理通过连接反应进行测序。其基本原理是以四色荧光标记的寡核苷酸进行多次连接合成,是以四色荧光标记的寡核苷酸进行多次连接合成,取代传统的聚合酶连接反应。具体步骤
19、包括:取代传统的聚合酶连接反应。具体步骤包括:文库准备文库准备扩增扩增微珠与玻片连接微珠与玻片连接连接测序连接测序测序过程测序过程:超高通量超高通量是是SOLID系统最突出的特系统最突出的特点,目前点,目前SOLID 3单次运行可产生单次运行可产生50 GB的序列数据,相当于的序列数据,相当于17倍人类基因组覆盖倍人类基因组覆盖度。度。第二代的高通量测序技术已经得到了很好的发第二代的高通量测序技术已经得到了很好的发展和应用展和应用,但是由于其但是由于其测序速度、成本、准确度测序速度、成本、准确度等等关键问题的解决仍存在困难关键问题的解决仍存在困难,研究者们很快将目光转研究者们很快将目光转向了更
20、高更新的测序解决方案。向了更高更新的测序解决方案。单分子测序也就应单分子测序也就应运而生。运而生。20092009年年1212月月,中科院北京基因组研究所与浪潮中科院北京基因组研究所与浪潮成立成立“中科院北京基因组研究所中科院北京基因组研究所浪潮基因组科学浪潮基因组科学联合实验室联合实验室”三代测序技术是以三代测序技术是以单分子测序单分子测序为特点的测序技术为特点的测序技术v 单分子即时单分子即时DNA测测序技术序技术(SMRT)v HeliScope单分子测序单分子测序v 基于荧光共振能量转移的即时基于荧光共振能量转移的即时DNA测序测序v 纳米孔单分子测序技术纳米孔单分子测序技术第三代测序
21、技术第三代测序技术1 1、目前一期的读取速度为目前一期的读取速度为3bp/s3bp/s2 2、它实现了、它实现了DNADNA聚合酶内在自身的聚合酶内在自身的processivity(延续性,也就是(延续性,也就是DNADNA聚合酶一次可以合成很聚合酶一次可以合成很长的片段),一个反应就可以测非常长的序列。长的片段),一个反应就可以测非常长的序列。3 3、它的精度非常高,达到、它的精度非常高,达到99.9999%99.9999%。标记荧光基因标记荧光基因DNA聚合酶作用 显微镜下进行荧光探测显微镜下进行荧光探测 零级波导的纳米结构零级波导的纳米结构来实来实现即时观察和背景荧光干扰现即时观察和背景
22、荧光干扰l 小孔的尺寸低于光的波长,小孔的尺寸低于光的波长,小孔底部形成消逝波,创造小孔底部形成消逝波,创造很小体积的很小体积的检测空间检测空间l DNADNA链周围游离的荧光标记链周围游离的荧光标记dNTPdNTP有限,非常快速进出于有限,非常快速进出于小孔,稳定的小孔,稳定的背景荧光信号背景荧光信号l 荧光标记荧光标记dNTPdNTP被掺入到被掺入到DNADNA合合成链,其携带的特定荧光会成链,其携带的特定荧光会持续一小段时间持续一小段时间(荧光光曝荧光光曝)DNA聚合酶 优点:采用了一种新的荧光类似物和更加灵敏的监测系统,能够直接记录优点:采用了一种新的荧光类似物和更加灵敏的监测系统,能
23、够直接记录到到单个碱基单个碱基的荧光,从而克服了第二代测序必须用的荧光,从而克服了第二代测序必须用PCRPCR扩增出数千个拷贝以扩增出数千个拷贝以增加信号亮度的缺陷。增加信号亮度的缺陷。DNADNA聚聚合合酶酶荧光标荧光标记的记的dNTPdNTP产生荧光产生荧光 CCD记录记录发生了碱基延伸反应发生了碱基延伸反应平面基板模拟图平面基板模拟图 荧光供体荧光供体 DNA DNA聚合酶聚合酶 荧光受体荧光受体 4 4种种dNTPdNTP具体过程具体过程优点:优点:游离的游离的dNTPdNTP不发光,只有其掺入到新合成的不发光,只有其掺入到新合成的DNADNA链时才会发光,极大地降低了背链时才会发光,
24、极大地降低了背景荧光干扰景荧光干扰 此方法不需要用到持续的高能量的激发光照射,因此也能够极大地减少此方法不需要用到持续的高能量的激发光照射,因此也能够极大地减少DNADNA聚合聚合酶的光损伤作用,进一步延长了测序长度。酶的光损伤作用,进一步延长了测序长度。能量 DNADNA分子以一次一个碱基的速度依次通过纳米小孔分子以一次一个碱基的速度依次通过纳米小孔,利用核酸外切酶的特性来识别出不同的利用核酸外切酶的特性来识别出不同的DNADNA碱基碱基 优点:纳米孔测序的优势在于它不需要对优点:纳米孔测序的优势在于它不需要对DNADNA进行标记,进行标记,也就省去了昂贵的荧光试剂和也就省去了昂贵的荧光试剂
25、和CCDCCD照相机。照相机。内部:核酸外切酶和环式糊精由生物分子组由生物分子组成的纳米孔成的纳米孔优点:直接测直接测RNARNA序列。序列。既然既然DNADNA聚合酶能够即时观测,那么以聚合酶能够即时观测,那么以RNARNA为为模板复制模板复制DNADNA的逆转录酶也同样可以应用于第三代的逆转录酶也同样可以应用于第三代测序平台。测序平台。直接测甲基化的直接测甲基化的DNADNA序列。序列。SMRT SMRT技术也可利用甲基化碱基特有的荧光信技术也可利用甲基化碱基特有的荧光信号来识别模板号来识别模板DNADNA中的甲基化修饰,如中的甲基化修饰,如N6N6甲基腺甲基腺苷、苷、5 5甲基胞嘧啶或甲
26、基胞嘧啶或5 5一羟甲基胞嘧啶一羟甲基胞嘧啶完成全基因组测序的部分的物种完成全基因组测序的部分的物种 转录组测序的研究对象为特定细胞在某转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有一功能状态下所能转录出来的所有RNARNA的总的总和,包括和,包括mRNAmRNA和非编码和非编码RNARNA。转录组测序是。转录组测序是指用新一代高通量测序技术对物种或者组织指用新一代高通量测序技术对物种或者组织的转录本进行测序并得到相关的转录本信息。的转录本进行测序并得到相关的转录本信息。利用光学成像技术设计的新型利用光学成像技术设计的新型DNADNA测序简图测序简图原理:当光照在一个物体上时,物体离光源越近,原理:当光照在一个物体上时,物体离光源越近,离成像面越远,则形成的影子越大,当离成像面越远,则形成的影子越大,当DNADNA被光照被光照后,可在光敏成像板上留下图像,通过比对可直后,可在光敏成像板上留下图像,通过比对可直接测定接测定DNADNA序列。序列。组件介绍:组件介绍:1.1.光源需要条形光源,光源与高通透光源需要条形光源,光源与高通透玻璃板之间要有金属通道,减少光能辐射递减玻璃板之间要有金属通道,减少光能辐射递减 2.2.高通透玻璃板上含有固定高通透玻璃板上含有固定DNADNA的芯片的芯片 3.3.光敏成像板为光敏变色材料光敏成像板为光敏变色材料