1、This template is the internal standard courseware template of the enterprise测序技术介绍测序技术发展史一代测序1954 年,Whitfeld 等用化学降解法测定多聚核糖核苷酸序列,是关于DNA 测序技术的较早报道。1977 年,Sanger 发明DNA 双脱氧核苷酸末端终止测序法(chain terminator sequencing),A.M.Maxam 和W.Gilbert 发明DNA 化学降解测序法(chemical degradation sequencing),2 项技术的出现,标志第1 代测序技术诞生。Sa
2、nger 测序法的原理每一次DNA 测序反应都由4 个独立反应组成;由于DNA 双链中核苷酸以3,5-磷酸二酯键相连,因此在测序过程中掺入2,3-双脱氧核苷三磷酸ddNTP(不含3-OH),当ddNTP 位于DNA 双链的延伸末端时,无羟基3端不能与其他脱氧核苷酸形成3,5-磷酸二酯键,因此,DNA 双链合成便终止;若在终止位点掺入ddATP,则新生链末端为A,若掺入ddTTP、ddCTP、ddGTP,相应地,新生链末端则是T、C 或G。该测序技术的具体做法如下:将模板、引物、4 种dNTP(其中含有一种为放射性同位素标记的核苷酸)与DNA 聚合酶共同保温,形成的混合物包含许多长短不一的片段,
3、最后利用聚丙烯酰胺变性凝胶电泳(SDS-PAGE)分离该混合物,得到放射性同位素自显影条带图谱,人们依据凝胶电泳图即可读出DNA 双链的碱基序列组成。自动化测序实际上已成为当今 dna序列分析的主流。美国PE ABI公司已生产出373型、377型、310型、3700和3100型等dna测序仪,其中310型是临床检测实验室中使用最多的一种型号。测序过程中的常见问题分析在进行DNA测序时,紧接引物的10 30 Bases有时不一定能完全读清楚。由于DNA结构上的原因,有时会出现反应中途无法进行之情况。如:G/C rich;G/C Cluster;Poly A、Poly T的连续结构等。此外,另一种
4、情况为反应中途出现的套峰现象,此种情况一般为DNA结构中的重复序列,造成测序用引物和模板之间有二个以上的结合位点。具体问题分析如下:1 1:测序结果有很多套峰,出现很多测序结果有很多套峰,出现很多N N值值原因分析:PCR产物直接进行测序,在PCR产物长度以后将无反应信号,机器将产生许多N值。在序列的起始端出现N值,主要是由于有未去除的染料单体造成的干扰峰,是机器无法正确判读出位何值。有时,引物二聚体或者起始端小片段的丢失,也会出现N值。模版本身含杂合序列,有等位基因。测序过程中的常见问题分析2 2:为什么找不到我的:为什么找不到我的PCRPCR引物序列?引物序列?用PCR引物作为测序引物,所
5、测序列是从引物3末端后第一个碱基开始的,所以就找不到您的测序引物了。可以进行反向测序,得到引物的反向互补序列。还可以将所测片段克隆到适当载体中,由于通用引物与插入序列有一段距离,就可以测出您的引物序列。3 3:测序结果和文献资料不一样,为什么:测序结果和文献资料不一样,为什么?原因有很多,如同一种动物,在不同的种族之间,或者不同的个体之间,基因序列也不一定完全一样。如果是PCR产物克隆测序,那还有PCR过程中的错配因素等等。我们提供的测序结果是客户样品序列的忠实结果,不能保证和文献序列完全一致。4 4:过短的:过短的PCRPCR产物为什么不适于直接测序?产物为什么不适于直接测序?首先由于一般的
6、PCR产物纯化试剂盒要求产物片段大于200bp,过短的PCR产物不能进行纯化;再者,测序的前50bp和后50bp的序列是不好的,所以不适于直接测序。测序过程中的常见问题分析5 5:酒精如果没有挥发完全:酒精如果没有挥发完全,在约在约300bp300bp处会出现连续异常的处会出现连续异常的G G峰,酒精挥发时峰,酒精挥发时间过长会导致间过长会导致DNADNA断裂。断裂。第一个峰,重叠干扰。如果不判读为干扰峰,那就说明样品不纯,如果是基因组DNA,就很好地说明了样品为杂合子,该位点可能存在SNP现象(T/G)。如果判读为干扰峰,我们只需认定样品此处碱基为T为行了。第二个峰,错位干扰。如果不判读为干
7、扰峰,则说明样本可能比预期多一个碱基(G),如果判读为干扰峰,我们仍只需认定样品此处碱基为T为行了。测序过程中的常见问题分析6 6:为什么用:为什么用PCRPCR产物或质粒测序时,经常会出现套峰现象产物或质粒测序时,经常会出现套峰现象?下图是pGEM-T载体测序的结果,在83位点处测序结果出现双峰,即模板中含有两个或两个以上的相同载体,但是插入片段不同。解决办法:重新挑取单克隆或者重新提取质粒。需要注意的是,重新进行PCR反应或者酶切鉴定仅能证明该克隆含有插入片段,并不足以证明模板的单一。测序过程中的常见问题分析7 7:polypoly结构的测序结果结构的测序结果以polyT为例,在polyA
8、/T结构之后往往出现移码现象,而在polyG/C之后会往往导致测序信号的衰减。解决办法:使用反向引物对模板进行测序,测到该poly结构处,即可完成模板全长的拼接。第二代测序技术(Next-Generation Sequencing)各自的优点454 测序平台得到的片段能够达到400 bp,并且读长的质量高;Solexa 测序平台的性价比最高,在数据量相同的情况下,测序成本仅为454 测序平台的1/10;SOLiD 测序平台准确度能够达到99.94%,在片段覆盖率为15时,测序准确度可接近100%。2005年底,454公司推出第一个基于焦磷酸测序原理的高通量基因组测序系统Genome Seque
9、ncer 20 System,这是核酸测序技术发展史上里程碑式的事件。随后,罗氏公司以1.55亿美元收购了454公司,并在2006年推出了更新的GS FLX测序系统,该系统可在10小时的运行中获得100万条读长(reads),46亿个碱基信息(base pair),且准确率达到99%以上。2008年,GS FLX系统再次升级,通量提高了5倍,读长和准确率也有所增加。虽然454 GS测序平台也许不是市场占有率最高的测序仪,但截至2011年3月,利用该系统进行研究的论文已发表超过1000余篇,而它在读长上的优势明显胜于另两套系统,因此在从头测序(de novo)和宏基因组测序(meta genom
10、e)方面有着不可替代的地位。2006年,Solexa公司也推出了自己的NGS系统Genome Analyzer,简称GA。这套基于DNA簇(DNA cluster)、桥式PCR(Bridge PCR)和可逆阻断(Reversible terminator)等核心技术的系统具有高通量、低错误率、低成本、应用范围广等优点。2007年,Illumina公司以6亿美元的高价收购了Solexa,使GA得以商品化。GA最早期的版本一次运行可获得1Gb的数据,因此也有1Gb Analyzer的含义,而最新的Hiseq2000平台则能够在10天的运行中获得300Gb以上的数据,读取的碱基长度达到150bp左右
11、。更有消息称,Illumina已完成了600Gb的运行测试并在部分客户中开展了前期体验,Tb(1000Gb)级的测试Run也将于年内进行。据不完全统计,Illumina公司已售出超过600台/套GA IIx和Hiseq2000平台,2010年仅深圳华大基因研究院一家就购买了128台Hiseq2000,一举成为全球最大的基因组测序与分析中心,Illumina公司在测序领域的影响力由此可见一斑。在Sanger测序时代,美国应用生物系统公司(ABI)一直是该行业的龙头老大,其垄断地位无人能撼,从早期的377到全自动化的3730 xl,ABI的测序仪被广泛应用在基因组学研究的各个方面。然而在第二代测序
12、技术迅猛发展之初,ABI起步较晚,显得有些漫不经心。直到2005年454公司推出GS平台,ABI的领先地位受到威胁,这才开始发力,迅速收购了研发NGS的一家小公司Agencourt,并于2007年推出了它的SOLiD测序平台。此后SOLiD不断升级,目前已到SOLiD 5版本(SOLiD 5500 xl)。SOLiD的全称是Sequencing by Oligo Ligation Detection,即寡聚物连接检测测序,其基本原理是通过荧光标记的8碱基单链DNA探针与模板配对连接,发出不同的荧光信号,从而读取目标序列的碱基排列顺序。在该方法下,目标序列的所有碱基都被读取了两遍,因此SOLiD
13、最大的优势就是它的高准确率。据悉,SOLiD 5平台的测序通量已达到30Gb/天,成本低于60美元/Gb,准确率高达99.99%。并且由于SOLiD系统采用的不是PCR反应进行DNA合成与测序,因此对于高GC含量的样本,SOLiD系统具有非常大的优势。454测序原理焦磷酸测序法(Pyrosequencing)的原理454测序原理焦磷酸测序法(Pyrosequencing)的原理454测序原理焦磷酸测序法(Pyrosequencing)的原理454测序原理l 在454测序仪中,A、T、G、C四种碱基是分别存储在单独的试剂瓶中的,每步反应四种碱基依次加入反应池,当碱基配对结合,就会释放出一个焦磷酸
14、(PPi),而这个焦磷酸在酶的作用下,将荧光素氧化成氧化荧光素,并发出光信号,从而读取出这一位置的碱基信息。454测序仪的整个实验步骤可大致概括为:样品处理 文库制备 emPCR 反应板准备 上机测序454测序原理 样品处理:样品处理主要是针对大片段的DNA分子,如基因组DNA、Fosmid或BAC质粒等,利用超声或氮气打断将这些DNA分子片段化,然后采用琼脂糖凝胶电泳回收或磁珠纯化,选择500-800bp的DNA片段。对于非编码RNA或PCR产物,则不需要这一步骤。454测序原理 文库制备包括接头连接和磁珠纯化两步,454的文库接头分A、B两种,各44bp,由20bp的PCR引物、20bp的
15、测序引物及4bp(TCAG)的“key”碱基构成,其中B接头的5端带有生物素(Biotin)标记,用于磁珠纯化步骤。经过磁珠结合与DNA变性之后,只有A+目的片段+B形式的连接产物得以富集,另两种形式(AA、BB)的产物都被去除。454测序原理 emPCR(乳液PCR)是454测序的一个关键步骤,将富集到的文库与测序磁珠、各反应物混合,加入特定的矿物油和表面活性剂,再利用振荡器剧烈振荡,使反应体系形成油包水(water-in-oil)的稳定乳浊液。在理想条件下,每一个液滴,或称微反应器(microreactor)中将只包含一个磁珠和一条单链DNA,通过控制该步骤的条件,1mL乳液中可以形成至少
16、10的6次方个理想的微反应器。经过PCR扩增后,每一个磁珠上将形成密集的DNA簇,这些DNA序列完全相同,即可用于后续的步骤。随后,乳液混合物被打破,扩增的片段依然结合在磁珠上。454测序原理 454测序的反应板称为PTP(Pico Titer Plate),含有350万个由光纤组成的小孔,每个孔的直径为29m,而测序磁珠的直径为20m,因此每个孔中仅能容纳一个磁珠。将磁珠与测序试剂加入PTP中,使之可用于上机测序。454测序原理 测序步骤如前所述,四种碱基在泵的控制下依次加入反应板,反应完成后再洗去,每延伸一个或若干个碱基,就会发出一次光信号,通过记录信号的有无和强度,即可测定DNA序列。4
17、54测序原理优缺点:454测序准确度较高,当读长超过400bp时,其准确性仍能达到99%以上;主要的错误来自于同聚物,即相同碱基的连续延伸,如ATTTG这样一段序列,A和G的读取没有问题,但T只记录了一次光信号,仅信号强度与ATG序列的T有所不同,因此同聚物越长,可能产生的误差就越大。目前,由于454测序仪在读长上的明显优势,它在大基因组从头测序(de novo)、转录组分析、基因组结构分析等领域有着广泛的应用。Solexa测序Solexa测序常用术语:SBSSBS:边合成边测序反应,每次SBS会延伸一个碱基,大约耗时70分钟。RunRun:单次上机测序反应,可以产生4G-75G测序通量不等。
18、LaneLane:单泳道,每条泳道可以直接物理区分测序样品,1次run最多可以同时上样8条Lane。ChannelChannel:Lane的同义词。TileTile:小区,每条Lane中排有2列tile,合计120个小区。每个小区上分布数目繁多的簇结合位点。ClusterCluster:簇,在Solexa测序技术中会采用桥式PCR方式生产DNA簇,每个DNA簇才能产生亮度达到CCD可以分辨的荧光点。Solexa测序IndexIndex:标签,在Solexa多重测序(Multiplexed Sequencing)过程中会使用Index来区分样品,并在常规测序完成后,针对Index部分额外进行7个
19、循环的测序,通过Index的识别,可以在1条Lane中区分12种不同的样品。Barcode:Barcode:Index同义词FastaFasta:一种序列存储格式。一个序列文件若以FASTA格式存储,则每一条序列的第一行以“”开头,而跟随“”的是序列的ID号(即唯一的标识符)及对该序列的描述信息;第二行开始是序列内容,序列短于61nt的,则一行排列完;序列长于61nt的,则每行存储61nt,最后剩下小于61nt的,在最后一行排列完;第二条序列另起一行,仍然由“”和序列的ID号开始,以此类推。Solexa测序FastqFastq:Fastq是Solexa测序技术中一种反映测序序列的碱基质量的文件
20、格式。第一行以“”符号开头,后面紧跟一个序列的描述信息;第二行是该序列的内容;第三行以“+”符号开头,后面紧跟的内容与第一行一样,同样是该序列的描述信息;而第四行是第二行中的序列内容每个碱基所对应的测序质量值。PF%PF%:PF%是指符合测序质量标准的簇的百分比(Multiplexed Sequencing),与测序的通量相关联。ReadRead:Solexa是成簇反应的,每个簇对应一条DNA序列片段,成为一个read。Solexa测序Solexa测序Solexa测序Solexa测序Solexa测序Solexa测序Solexa测序Solexa测序Solexa测序应用:Solexa平台的应用范围
21、极广,几乎囊括了目前基因组学研究的所有方面,例如基因组从头测序(de novo)、重测序(re-sequencing)、基因组结构分析、转录组测序、表达谱分析、小RNA及非编码RNA测序、表观遗传学研究等等。SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序SOLiD测序三者比较测序技术读取长度(测序技术读取长度(),在种测序技术中最长,可以对未知基因组),在种测序技术中最长,可以对未知基因组进行从头测序,但其通量最低(进行从头测序,但
22、其通量最低()。当遇到(如)。当遇到(如 等)时,等)时,碱基个数和荧光信号强度不成线性关系,即判断重复碱基碱基个数和荧光信号强度不成线性关系,即判断重复碱基有困难。有困难。三者比较属于高度自动化的系统,读属于高度自动化的系统,读取片段比其它种类的测序多,适合进行大量小片段的测序(如取片段比其它种类的测序多,适合进行大量小片段的测序(如),其测序通量大,),其测序通量大,其新机型产出量为,其新机型产出量为,但基于可逆反应时随反应轮数增加效率降低、信号减弱,并且但基于可逆反应时随反应轮数增加效率降低、信号减弱,并且读长(通常为)比短,给从头读长(通常为)比短,给从头测序拼接带来困难。测序拼接带来
23、困难。三者比较技术每个碱基读取次,有非常高的技术每个碱基读取次,有非常高的准确性,特别是针对的检测。此外,灵活的系统和准确性,特别是针对的检测。此外,灵活的系统和完善的磁珠编码系统可以进行样品的来分完善的磁珠编码系统可以进行样品的来分割测序区域,特别适用于具有高质量参考基因组序列物种割测序区域,特别适用于具有高质量参考基因组序列物种的重测序,但是该测序读长()最短,并且读取的重测序,但是该测序读长()最短,并且读取长度受反应轮数的限制,给从头测序拼接带来困难。长度受反应轮数的限制,给从头测序拼接带来困难。第三代测序技术原理:脱氧核苷酸用荧光标记,显微镜可以实时记录荧光的强度变化。当荧光标记的脱
24、氧核苷酸被掺入DNA链的时候,它的荧光就同时能在DNA链上探测到。当它与DNA链形成化学键的时候,它的荧光基团就被DNA聚合酶切除,荧光消失。这种荧光标记的脱氧核苷酸不会影响DNA聚合酶的活性,并且在荧光被切除之后,合成的DNA链和天然的DNA链完全一样。第三代测序技术技术关键:第一:因为在显微镜实时记录DNA链上的荧光的时候,DNA链周围的众多的荧光标记的脱氧核苷酸形成了非常强大的荧光背景。这种强大的荧光背景使单分子的荧光探测成为不可能。Pacific Biosciences公司发明了一种直径只有几十纳米的纳米孔zero-mode waveguides(ZMWs),单分子的DNA聚合酶被固定
25、在这个孔内。在这么小的孔内,DNA链周围的荧光标记的脱氧核苷酸有限,而且由于A,T,C,G这四种荧光标记的脱氧核苷酸非常快速地从外面进入到孔内又出去,它们形成了非常稳定的背景荧光信号。而当某一种荧光标记的脱氧核苷酸被掺入到DNA链时,这种特定颜色的荧光会持续一小段时间,直到新的化学键形成,荧光基团被DNA聚合酶切除为止。第二:共聚焦显微镜实时地快速地对集成在板上的无数的纳米小孔同时进行记录。第三代测序技术技术特点:1、它实现了DNA聚合酶内在自身的反应速度,一秒可以测10个碱基,测序速度是化学法测序的2万倍。2、它实现了DNA聚合酶内在自身的延续性,一个反应就可以测非常长的序列。二代测序现在可
26、以测到上百个碱基,但是三代测序现在就可以测几千个碱基。3、它的精度非常高,达到99.9999%。4、直接测RNA的序列。既然DNA聚合酶能够实时观测,那么以RNA为模板复制DNA的逆转录酶也同样可以。RNA的直接测序,将大大降低体外逆转录产生的系统误差。5、第二个是直接测甲基化的DNA序列。实际上DNA聚合酶复制A、T、C、G的速度是不一样的。正常的C或者甲基化的C为模板,DNA聚合酶停顿的时间不同。根据这个不同的时间,可以判断模板的C是否甲基化。第三代测序技术This template is the internal standard courseware template of the e
27、nterpriseSWOTSWOT分析模板分析模板SWOT分析是市场营销管理中经常使用的功能强大的分析工具,最早是由美国旧金山大学的管理学教授在80年代初提出来的:S代表strength(优势),W代表weakness(弱势),O代表opportunity(机会),T代表threat(威胁)。市场分析人员经常使用这一工具来扫描、分析整个行业和市场,获取相关的市场资讯,为高层提供决策依据,其中,S、W是内部因素,O、T是外部因素。它在制定公司发展战略和进行竞争对手分析中也经常被使用。SWOT的分析技巧类似于波士顿咨询(BCG)公司的增长/份额矩阵(The Growth/Share Matrix)
28、,什么是什么是SWOT分析分析内部环境优势Strengths劣势Weakness机会Opportunities威胁ThreatsSWOT分析传统矩阵示意图分析传统矩阵示意图外部环境SWOT行业分析适用范围行业分析适用范围业务单元及产品线分析竞争对手分析SWOT企业自身SBU SWOT分析SWO TSWO T企业自身SBU SWOT分析主要竞争对手SBU SWOT分析企业的内外部环境与行业平均水平进行比较当选择行业领域中只有少数竞争对手时,可以考虑做SWOT组图进行比较SWOT分析步骤分析步骤分析环境因素分析环境因素构造构造SWOT矩阵矩阵 制定行动计划制定行动计划运用各种调查研究方法,分析出公
29、司所处的各种环境因素,即外部环境因素和内部能力因素。将调查得出的各种因素根据轻重缓急或影响程度等排序方式,构造SWOT矩阵。在完成环境因素分析和SWOT矩阵的构造后,便可以制定出相应的行动计划。SW优势与劣势分析(内部环境分析)优势与劣势分析(内部环境分析)产品线的宽度产品的质量产品价格产品的可靠性产品的适用性服务的及时性服务态度竞争优势可以指消费者眼中一个企业或它的产品有别于其竞争对手的任何优越的东西。需要注意的是一定要从消费者的角度出发,寻找与竞争者或行业平均水平比较,公司的产品与服务有什么优势/劣势;而不是从公司的角度出发,衡量企业的竞争优势。通过一定努力,建立自身竞争优势引起竞争者注意
30、,开始作出反应直接进攻企业优势所在,或采取更为有力的策略竞争优势受到削弱,寻找新的策略增强自身竞争优势根据根据SW分析,公司建立并维持自身的竞争优势分析,公司建立并维持自身的竞争优势企业在维持竞争优势过程中,必须深刻认识自身的资源和能力,采取适当的措施。因为一个企业一旦在某一方面具有了竞争优势,势必会吸引到竞争对手的注意。而影响企业竞争优势的持续时间,主要的是三个关键因素:(1)建立这种优势要多长时间?(2)能够获得的优势有多大?(3)竞争对手作出有力反应需要多长时间?如果企业分析清楚了这三个因素,就会明确自己在建立和维持竞争优势中的地位了。OT机会与威胁分析(外部环境分析)机会与威胁分析(外
31、部环境分析)环境威胁指的是环境中一种不利的发展趋势所形成的挑战,如果不采取果断的战略行为,这种不利趋势将导致公司的竞争地位受到削弱。环境机会就是对公司行为富有吸引力的领域,在这一领域中,该公司将拥有竞争优势。OT机会与威胁分析方法一:机会与威胁分析方法一:PEST法法垄断法律环境保护法税法对外贸易规定劳动法政府稳定性经济周期GNP趋势利率货币供给通货膨胀失业率可支配收入能源供给成本人口统比收入分配社会稳定生活方式的变化教育水平消费政府对研究的投入政府和行业对技术的重视新技术的发明和进展技术传播的速度折旧和报废速度OT机会与威胁分析方法一:波特五力模型机会与威胁分析方法一:波特五力模型进入本行业
32、有哪些壁垒?它们阻碍新进入者的作用有多大?本企业怎样确定自己的地位(自己进入或者阻止对手进入)?购买者转而购买替代品的转移成本;公司可以采取什么措施来降低成本或增加附加值来降低消费者购买替代品的风险?供货商的品牌或价格特色;供货商的战略中本企业的地位;供货商之间的关系;从供货商之间转移的成本本企业的部件或原材料产品占买方成本的比例;各买方之间是否有联合的危险;本企业与买方是否具有战略合作关系行业内竞争者的均衡程度、增长速度、固定成本比例、本行业产品或服务的差异化程度、退出壁垒等,决定了一个行业内的竞争激烈程度构造构造SWOT矩阵矩阵SWT特快专递服务推出较早技术支持较强(如电子追踪服务以邮局为
33、服务终端,服务网络覆盖面广O特快专递”过去的形象不太好认知率不高可靠性与速度不及私营公司私营速递公司多以大公司为主要客户中小机构、个人的需求得不到满足,是个被忽视的市场香港近年经济不太景气,外部环境不利速递业竞争对手林立,正面冲突可能招致报复制订行动计划制订行动计划SWOTWT对策 最小与最小对策,即考虑弱点因素和威胁因素,目的是努力使这些因素都趋于最小。悲观 WO对策 最小与最大对策,即着重考虑弱点因素和机会因素,目的是努力使弱点趋于最小,使机会趋于最大 苦乐参半 ST对策 最小与最大对策,即着重考虑优势因素和威胁因素,目的是努力使优势因素趋于最大,是威胁因素趋于最小。苦乐参半 SO对策 最大与最大对策,即着重考虑优势因素和机会因素,目的在于努力使这两种因素都趋于最大。理想 小大大小