1、NGS系列讲座(一)NGS简介及原理2017/06/01魏冬凯魏冬凯Outline二代测序技术背景Solexa测序原理Outline二代测序技术背景Solexa测序原理其他平台测序技术简介什么是什么是DNA测序?测序的研究对象是什么?测序?测序的研究对象是什么?DNA测序(DNA sequencing,或译DNA定序)是指分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式。百度百科测序主要研究的是DNA一级结构,不涉及DNA的二级、三级结构DNA合成的基本过程合成的基本过程dNTPddNTP一代测序一代测序末端终止法末端终止法(ABI 370
2、0)使用特异性引物与单链模板使用特异性引物与单链模板DNA退火,在退火,在DNA聚合酶作用下进行延伸反应,用聚合酶作用下进行延伸反应,用ddNTP终止,终止,用荧光染料标记用荧光染料标记4种不同的碱基种不同的碱基,通过通过计算机自计算机自动读出。动读出。Frederick“Fred”SangerSanger测序测序5T G C G C G G C C C AT G C G C G G C C C APrimerA C G C G C C G G G A C G C G C C G G G T?T?53Sanger 测序测序A C G C G C C G G G T C A G A A C C
3、C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 535T G C G C G G C C C AT G C G C G G C C C APrimerG T C T T G G G C G T C T T G G G C T TSanger 测序测序G T C T T G G G C T A G C G T C T T G G G C T A G C G G C CA C G C G C C G G G T C A G A A C C C A C G C G C C G G G T C A G A A C
4、C C G A T C G C G G A T C G C G 535T G C G C G G C C C AT G C G C G G C C C APrimerG T C T T G G G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bpSanger 测序测序A C G C G C C G G G T C A G A A C C C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 53G T C T T G G
5、 G C T A G C G T C T T G G G C T A G C G G C C5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C C C AT G C G C G G C C C APrimerG T C T T G G G C T G T C T T G G G C T A ASanger 测序测序A C G C G C C G
6、G G T C A G A A C C C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 53G T C T T G G G C T A G C G T C T T G G G C T A G C G G C C5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C
7、 C C AT G C G C G G C C C AG T C T T G G G C T G T C T T G G G C T A A22 bp5T G C G C G G C C C AT G C G C G G C C C APrimerG GSanger 测序测序A C G C G C C G G G T C A G A A C C C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 53G T C T T G G G C T A G C G T C T T G G G C T A G C G G
8、C C5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C T G T C T T G G G C T A A22 bp5T G C G C G G C C C AT G C G C G G C C C AG G12 bp5T G C G C G G C C C
9、 AT G C G C G G C C C APrimerG T C T T G G G G T C T T G G G C CSanger 测序测序A C G C G C C G G G T C A G A A C C C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 53G T C T T G G G C T A G C G T C T T G G G C T A G C G G C C5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C
10、 G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C T G T C T T G G G C T A A22 bp5T G C G C G G C C C AT G C G C G G C C C AG G12 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G G T C T T G G G C C20 bp
11、5T G C G C G G C C C AT G C G C G G C C C APrimerG T C T G T C T T TSanger 测序测序A C G C G C C G G G T C A G A A C C C A C G C G C C G G G T C A G A A C C C G A T C G C G G A T C G C G 53G T C T T G G G C T A G C G T C T T G G G C T A G C G G C C5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G
12、 G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C T G T C T T G G G C T A A22 bp5T G C G C G G C C C AT G C G C G G C C C AG G12 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G G T C T T G G G C C2
13、0 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T G T C T T T16 bpSanger 测序测序A C G C G C C G G G A C G C G C C G G G T?T?53?C C5T G C G C G G C C C AT G C G C G G C C C A?T T5T G C G C G G C C C AT G C G C G G C C C A21 bp26 bp5T G C G C G G C C C AT G C G C G G C C C A?A A22 bp5T G C G C G G C
14、 C C AT G C G C G G C C C AG G12 bp5T G C G C G G C C C AT G C G C G G C C C A?C C20 bp5T G C G C G G C C C AT G C G C G G C C C A?T T16 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G T C T T G G G G19 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G C T G T C T T G G G C T
15、 A A22 bpSanger 测序测序G T C T T G G G C G T C T T G G G C T T5T G C G C G G C C C AT G C G C G G C C C A21 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G G G G T C T T G G G C C20 bp5T G C G C G G C C C AT G C G C G G C C C AG G12 bp5T G C G C G G C C C AT G C G C G G C C C AG G T T13 bp5T G
16、 C G C G G C C C AT G C G C G G C C C AG T C T G T C T T T16 bp5T G C G C G G C C C AT G C G C G G C C C AG T G T C C14 bp5T G C G C G G C C C AT G C G C G G C C C AG T C G T C T T15 bp5T G C G C G G C C C AT G C G C G G C C C AG T C T T G T C T T G G17 bp5T G C G C G G C C C AT G C G C G G C C C AG
17、 T C T T G G T C T T G G G18 bpLaser ReaderSanger 测序测序Sanger测序的特点测序的特点n 测序长度测序长度500-1000bp。n 通量低,每次测序最多获得通量低,每次测序最多获得1kb数据,如果测大基因组,成本极高。数据,如果测大基因组,成本极高。n 错误率高,错误率高,PCR带来错配。带来错配。n 测序基于测序基于PCR反应,需要引物,并且有些些结构复杂的难于进行反应,需要引物,并且有些些结构复杂的难于进行PCR反应的片段不能测序。反应的片段不能测序。1990 年年 10 月美国确定把当年的月美国确定把当年的 10 月月 1 日作为官方
18、实施日作为官方实施 HGP 的起始的起始日期,被誉为生命科学日期,被誉为生命科学“阿波罗登月计划阿波罗登月计划”的国际人类基因组计划启动的国际人类基因组计划启动。2000年完成草图,年完成草图,2003年正式完成。年正式完成。全部人类基因组约有全部人类基因组约有2.91Gbp,约有,约有39000多个基因。多个基因。目前已经发现和定位了目前已经发现和定位了26000多个功能基因多个功能基因。耗时耗时13年,年,30亿美金。亿美金。人类基因组计划(人类基因组计划(HGP)1977年年2005年年Roche 4542006年年Illumina GA2007年年ABI solid2008年年Heli
19、cos 单分子测单分子测序仪序仪2009年年Pacific 单分子测单分子测序仪序仪第一代第一代第二代第二代第三代第三代二代测序技术的出现二代测序技术的出现鸟枪法鸟枪法基因组基因组片段鸟枪法鸟枪法基因组片段通过剪切力,超声,酶切等打断基因组ATTGTTCCCACAGACCGCGGCGAAGCATTGTTCCACCGTGTTTTCCGACCGTTTCCGACCGAAATGGCTTGTTCCCACAGACCGTGAGCTCGATGCCGGCGAAGATGCCGGCGAAGCATTGTTAATGCGACCTCGATGCCACAGACCGTGTTTCCCGAAAGCATTGTTCCCACAGTGTTT
20、TCCGACCGAAATCCGACCGAAATGGCTCCTGCCGGCGAAGCCTTGT17 bp66 bp基本测序思路基本测序思路ATTGTTCCCACAGACCGCGGCGAAGCATTGTTCCACCGTGTTTTCCGACCGTTTCCGACCGAAATGGCTTGTTCCCACAGACCGTGAGCTCGATGCCGGCGAAGATGCCGGCGAAGCATTGTTAATGCGACCTCGATGCCACAGACCGTGTTTCCCGAAAGCATTGTTCCCACAGTGTTTTCCGACCGAAATCCGACCGAAATGGCTCCTGCCGGCGAAGCCTTGTTAATGC
21、GACCTCGATGCCGGCGAAGCATTGTTCCCACAGACCGTGTTTTCCGACCGAAATGGCTCC基因组:基本测序思路基本测序思路ATTGTTCCCACAGACCGCGGCGAAGCATTGTTCCACCGTGTTTTCCGACCGTTTCCGACCGAAATGGCTTGTTCCCACAGACCGTGAGCTCGATGCCGGCGAAGATGCCGGCGAAGCATTGTTAATGCGACCTCGATGCCACAGACCGTGTTTCCCGAAAGCATTGTTCCCACAGTGTTTTCCGACCGAAATCCGACCGAAATGGCTCCTGCCGGCGAAGCCTT
22、GTTAATGCGACCTCGATGCCGGCGAAGCATTGTTCCCACAGACCGTGTTTTCCGACCGAAATGGCTCC基因组:基本测序思路基本测序思路Outline二代测序技术背景Solexa测序原理其他二代测序平台技术简介Solexa测序的关键技术(测序的关键技术(Illumina)桥式PCR(Solid-phase bridge amplification)O PPPHNNOO荧光基团3保护基团Next cycle掺入检测去保护基团 去荧光基团ODNAHNNOO3O5游离3末端XOH4种标记过的核苷酸可逆终止反应Reversible Terminator Chemistr
23、ySolexa测序的关键技术(测序的关键技术(Illumina)桥式桥式PCR准备DNA片段两端接上 adapters桥式桥式PCR准备DNA片段两端接上 adapters将DNA片段通过adapter锚定在芯片上循环扩增DNA片段成“DNA簇”20 micronsSequence桥式桥式PCRCAGTCATCACCTAGCGTA5GTCAGTCAGTCAGT35First base incorporatedCycle 1:Add sequencing reagentsDetect SignalCleave Terminator and DyeCycle 2-n:Add sequencing
24、reagents and repeat边合成边测序边合成边测序(Sequencing By Synthesis)SBS123789456T T T T T T T G T T G C T A C G A T 根据每个DNA簇每轮反应读取的荧光信号序列,转换成相应的DNA序列Solexa测序原理测序原理测序种类测序种类Single-Read Sequencing(SR)测序种类测序种类Single-Read Sequencing(SR)Paired-End Sequencing(PE)测序种类测序种类Single-Read Sequencing(SR)Paired-End Sequencing(PE)测序种类测序种类Single-Read Sequencing(SR)Paired-End Sequencing(PE)Index Sequencing(PE)测序种类测序种类Single-Read Sequencing(SR)Paired-End Sequencing(PE)Index Sequencing(PE)测序种类测序种类Single-Read Sequencing(SR)Paired-End Sequencing(PE)Index Sequencing(PE)Question谢谢谢谢!