ImageVerifierCode 换一换
格式:PPT , 页数:125 ,大小:13.95MB ,
文档编号:2956878      下载积分:29 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-2956878.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(三亚风情)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(基因组测序的原理与方法课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

基因组测序的原理与方法课件.ppt

1、大规模基因组测序的大规模基因组测序的原理与方法原理与方法胡松年 元素周期表的发现奠定了二十世纪物理、化学研究和发展的基础元素周期表“基因组序列图”将奠定二十一世纪生命科学研究和生物产业发展的基础! “基因组”-生命科学的“元素周期表”人体解剖图奠定了现代医学发展的基础生命的奥秘蕴藏于 “四字天书”之中GCTTCTTCCTCATTTTCTCTTGCCGCCACCATGCCGCCACCA TCATTTTCTCTTGCCGCCACCATGCTTCTTCCTCATTTTCTCT CCACCATGCCGCCACCACGCCACCATGCTTCTTCCTCATCTC GCTTTCTTGCCGCCACCAT

2、GCCGCCACCGCTTCTTCCtTCTCT基因组学的基础理论研究基因组学的基础理论研究基因组学是要揭示下述四种整合体系的相互关系基因组学是要揭示下述四种整合体系的相互关系: 基因组作为信息载体基因组作为信息载体 (碱基对、重复序列的整(碱基对、重复序列的整体守恒与局部不平衡的关系)体守恒与局部不平衡的关系) 基因组作为遗传物质的整合体基因组作为遗传物质的整合体 (基因作为功能和基因作为功能和结构单位与遗传学机制的关系结构单位与遗传学机制的关系) 基因组作为生物化学分子的整合体基因组作为生物化学分子的整合体 (基因产物作基因产物作为功能分子与分子、细胞机制的关系)为功能分子与分子、细胞机制

3、的关系) 物种进化的整合体物种进化的整合体 (物种在地理与大气环境中的物种在地理与大气环境中的自然选择)自然选择)测序设备的垄断和高速度换代8199020052020Year2015201020001995Mb1000Mb4000ABI373ABI377ABI3130ABI3730ABI3730 xlGA-I GA-IILess Than 5 yrsHiSeq1000/2000Mb4500ABI3700ABI3700 xlSOLiDSOLiD2SOLiD35500 xl SOLiDABI3130 xlGA-IIx5500 SOLiD测序设备发展现状9第一代(稳定需求)第一代(稳定需求)ABi3

4、130 xL3730 xL3500 xL第三代(即将面市)第三代(即将面市)Helicos BiosciencesHelicos Genetic Analysis System Pacific BiosciencesRSSystem 第二代(高速发展)第二代(高速发展)RocheGenome Sequencer FLX System GS Junior System IlluminaGenome Analyzer IIxMiSeqHiSeq 1000HiSeq 2000Life Technologies (ABi)5500 SOLiD System5500 xL SOLiD SystemIon

5、 Torrent PGMDanaherMotionPolonator G.007Complete Genomics无锡艾吉因生物信息技术有限公司无锡艾吉因生物信息技术有限公司AG-100深圳华因康基因科技有限公司深圳华因康基因科技有限公司Pstar-1中科院北京基因组所中科院北京基因组所/ /半导体所半导体所BIGIS-1BIGIS-4反应所需物质:反应所需物质:DNA模板、引物、模板、引物、DNA聚合聚合 酶、酶、dNTP、缓冲液、缓冲液每个循环包括:每个循环包括:变性(变性(90)、退火()、退火(54 )、延伸()、延伸(72 )ATGCCGTAGGCCTAGC TAGGCCTAGCTC

6、GGA ATGCCGTAGGCCTAGCTCGGA基因组基因组DNABAC文库文库根据物理图谱根据物理图谱正确定位的正确定位的BAC 或或contig用于霰弹法测用于霰弹法测序的候选克隆序的候选克隆用于霰弹法测序用于霰弹法测序的亚克隆的亚克隆测序并组装测序并组装完整的基因完整的基因组序列组序列逐步克隆法(逐步克隆法(Clone by Clone) 全基因组霰弹法全基因组霰弹法 (Whole Genome Shot-gun)基因组基因组DNA 霰弹法克隆霰弹法克隆测序并进行测序并进行全基因组序全基因组序列组装列组装完整的基因完整的基因组序列组序列 BAC by BACWhole Genome S

7、hotgun the sequencing of the human genome is likely to be the only large sequencing project carried to completion by the methods described in this issue. Maynard V. Olson , The maps: Clone by clone by clone , Nature 409, 816 - 818 (2001) “WorkingDraft”(90%; 4X)FinishedGenome(99.99%; 8X)Gap1Gap2Chrom

8、osome工作草稿(框架图)与完成图BAC by BAC The sequence of the human genomeC. Venter et al.Science 16 Feb. 291: 1304 1351, 2001人类基因组计划研究的主要成果和进展表现在这人类基因组计划研究的主要成果和进展表现在这“四张图四张图”上上 遗传图谱遗传图谱 又称为连锁图谱(又称为连锁图谱(linkage maplinkage map),指),指基因或基因或DNADNA标志在染色体上的相对位置标志在染色体上的相对位置与遗传距离与遗传距离物理图谱物理图谱 以定位的以定位的DNADNA标记序列如标记序列如ST

9、SSTS作为路标,作为路标,以以DNADNA实际长度即实际长度即bp、kb、Mb为图距的为图距的基因组图谱。基因组图谱。转录图谱转录图谱 利用利用EST(expressed sequence tags 表达表达序列标签)作为标记所构建的分子遗传序列标签)作为标记所构建的分子遗传图谱图谱序列图谱序列图谱 通过基因组测序得到的,以通过基因组测序得到的,以A A、T T、G G、C C为标记单位的基因组为标记单位的基因组DNADNA序列序列 物理图谱的构建物理图谱的构建大片段克隆的筛选大片段克隆的筛选霰弹法测序与霰弹法测序与“工作框架图工作框架图”的构建的构建序列的全组装与序列的全组装与“完成图完成

10、图”构建构建物理图谱的制作物理图谱的制作 物理图谱物理图谱是以特异的是以特异的DNADNA序列为标志所展示的染色体图。序列为标志所展示的染色体图。标志之间的距离或图距以物理距离如碱基对(标志之间的距离或图距以物理距离如碱基对(base pairbase pair;bpbp,Kb , Mb)Kb , Mb)表示。最精细的物理图是核苷酸顺序图,最粗略的物表示。最精细的物理图是核苷酸顺序图,最粗略的物理图是染色体组型图。理图是染色体组型图。 STSSTS图谱图谱是最基本和最为有用的染色体物理图谱之一,是最基本和最为有用的染色体物理图谱之一,STSSTS(Sequence Tagged Site)Se

11、quence Tagged Site)本身是随机地从人类基因组上选择本身是随机地从人类基因组上选择出来的长度在出来的长度在200200300bp300bp左右的特异性短序列(每个左右的特异性短序列(每个STSSTS在基在基因组中是唯一的,因组中是唯一的,STSSTS图谱就是以图谱就是以STSSTS为路标(平均每为路标(平均每100Kb100Kb一一个),将个),将DNADNA克隆片段有序地定位到基因组上。克隆片段有序地定位到基因组上。 STS的来源的来源随机基因组序列随机基因组序列表达基因序列,如表达基因序列,如EST遗传标记序列,如微卫星标记遗传标记序列,如微卫星标记有关有关STSSTS的信

12、息可在基因组数据库的信息可在基因组数据库GDBGDB中找到中找到 http:/gdbwww. gdb. orgq确定各确定各STS序列及其序列及其在基因组中的位置在基因组中的位置q大插入片段基因组文大插入片段基因组文库的构建(库的构建(BAC文库文库)q 以特定以特定STS为标记为标记筛筛 选选并定位克隆并定位克隆q含有含有STS的克隆在基的克隆在基因组中排序因组中排序基因组数据库(GDB)中至少含有24568 个STS路标信息 作为载体的基本要求 能在宿主细胞中进行独立的复制能在宿主细胞中进行独立的复制 具有多克隆位点,可插入外源具有多克隆位点,可插入外源 DNADNA片段片段 有合适的筛选

13、标记,如抗药性有合适的筛选标记,如抗药性 大小合适,易于分离纯化大小合适,易于分离纯化 拷贝数多拷贝数多 文库的概念文库的概念 含有某种生物体全部基因的随机片段的重组含有某种生物体全部基因的随机片段的重组DNADNA克隆群体克隆群体 载体:载体:能携带外源能携带外源DNADNA进入宿主细胞进入宿主细胞的工具,常用的载体有质粒载体、噬的工具,常用的载体有质粒载体、噬菌体载体、细菌人工染色体等菌体载体、细菌人工染色体等宿主:宿主:能容纳外源能容纳外源DNADNA片段的生物体,片段的生物体,常用的有大肠杆菌、酵母等常用的有大肠杆菌、酵母等NotI、SacI脉冲场凝胶电泳得200Kb左右的大片段DNA

14、 纯化后与载体连接 电转化,将连接产物导入大肠杆菌感受态细胞插有外源DNA片段的BAC载体在含有氯霉素的固体培养基中培养每一个菌落为带有相同外源DNA片段的单克隆BAC克隆的筛选克隆的筛选“STS-PCR反反应池应池”方案方案筛筛选种子克隆选种子克隆特定的特定的STS标标记记 相互间具有重叠片段的BAC克隆根据STS信息组装成contig,并定位于基因组上Contig每一个菌落为带有相同外源DNA片段的单克隆Regional mappingRegional mappingMinimal tiling path selected for sequencing.Regional mappingst

15、SG50796stSG50796WI-21858WI-21858WI-20982WI-20982SGC-34652SGC-34652EST325005EST325005Bda37h09Bda37h09sts-N34454sts-N34454stSG-22642stSG-22642stSG22463stSG22463IB262IB262SGC-100057SGC-100057SGC-11218SGC-11218SGC-77734SGC-77734 SGC-12613SGC-12613SGC-79997SGC-79997D3S4170D3S4170WI-13469WI-13469SGC-10474

16、4SGC-104744WI-7400WI-7400SGC-82788SGC-82788sts-N30615sts-N30615SGC-106678SGC-106678WI-3006WI-3006D3S4125D3S4125 stSG31571stSG31571SGC-86097SGC-86097SGC-104738SGC-104738 sts-T03421sts-T03421 stSG81116stSG81116DM1-2b11sDM1-2b11sA004Q43A004Q43WI-10858WI-10858SGC-15279SGC-15279stSG3143stSG3143WI-8499WI-

17、8499 D3S3525D3S3525D3S3630D3S3630 SGC-11976 SGC-11976 WI-6116WI-6116WI-2053WI-2053SGC-84074SGC-84074SGC-77858SGC-77858D3S3706D3S3706SGC-102094SGC-102094 WI-13611WI-13611NRU18-13sNRU18-13sWI-21921WI-21921CHLC.GATA44a05CHLC.GATA44a05D3S1304D3S1304sts-T58150sts-T58150SGC-82964SGC-82964 WI-1341WI-1341D3

18、S3591D3S3591605m01229 e21279b12299n03198p1741l18233p0137i04324k11163m22Beijing CenterMapped on 3p by sequence from other center114k09204c23728k15429p24499n06399k19106b10129j10113l1013f06600o17322f0976o22263j0830m15320c08250a15294h24140b10137g22South centerMapped on 3p by fingerprint from other cente

19、r265o10717m12762o12156h01324k15283k15572b0261i09534j21166f03497i24497i24121d03121d03211k13161d20274o146i21116k05255k15812i02North centerMapped not on 3p by fish1120h22566o1463o01757o1626f1026f10 453a03586c02483g20507d0625c11344o05Mapped not on 3p by fish260k16263p03341o12560g03772p01344l093d22489o22

20、794g03Beijing and South 306h05621c18438g1582o03181f22622p03320k0124b1657d0657d06470 e10STS markers 385a18416n08785a0797c1625f0125f01167p17167p17277d17669 e03194c09Beijing and North210b1795 e11101a04101a0499d1099d10487j12590a20156b21End certified 710 e0410h06508a20508a20173f11173f117m247m24211b19291p

21、2144l1444l14481o07Phase 3Phase 3731 e12731 e12811m11811m11372k09194d21245a0616k1516k15318i14318i14529b1753 e12542k24Mapped not on 3p by sequence from NCBI392m07319i18 454f24238a09238a09264h03157 e16350a17Mapped on 3p by fish673f20453f03489d19194i05? ?Sequenced BACs without mapping information93a0193

22、a01360 e14244g03329a02611h22611h2270b0570b05135 e1674 e04124l0821j2321j23IB1403IB1403SGC-12699SGC-12699sts-F21241sts-F21241WI- 6061WI- 6061stSG16459stSG16459WI-6949WI-6949 stSG15038stSG15038sts-M91858sts-M91858WI-17502WI-17502 WI-7625WI-7625WI-7071WI-7071AB000410AB000410sts-F21841sts-F21841sts-L1540

23、9sts-L15409A004Z22A004Z22stSG31652stSG31652WI-16427WI-16427stSG43815stSG43815A007593A007593WI-11598WI-11598A008O42A008O42D3S4194D3S4194stSG4279stSG4279WI-14394WI-14394sts-N95054sts-N95054stSG32055stSG32055stSG15465stSG15465WI-11041WI-11041stSG47554stSG47554stSG3350stSG3350D3S3589D3S3589SGC-12045SGC-

24、12045D3S1263D3S1263stSG47397stSG47397 SGC-84455SGC-84455 D3S3610D3S3610SGC-10790SGC-10790D3S3691D3S3691A002R42A002R42stSG50845stSG50845stSG2582stSG2582WI-31307WI-31307A004X28A004X28D3S3601D3S3601A001T39A001T39stSG62586stSG62586WI-15608WI-15608sts-H83694sts-H83694stSG47347stSG47347WI-5650WI-5650WI-20

25、823WI-20823202a21 105k13334l221087o20593j10169k17309m10813n2383m12 19 e08 203c04481h17356a0713b04449 e2125o17715i04642 e22298m15224p21267l16407i02488o087f24481b18128a05380o24474f16327h1716m03470i10 398j1558i13424h06325l061016h17134k10299h13220d10220d10126l04900o2218f0358b17 1022p15193k15586c12588p09

26、173m24572m141082a181082a18266 e23275j11270i10270i10333a0234l0634l06ctb-159n23ctb-159n23168l03ctc-237n12ctc-237n12382a21ctc-371o18ctc-371o18126l09163d23AC055767AC055767767c01502k05502k05326o24ctb-140o19ctb-140o19415k13224m20167k17167k17219m19219m19266j06438j01627c01659g04659g04AC007791AC007791263i012

27、63i01596j09996c06338p06338p06606c06606c06ctc-243a06ctc-243a06ctc-371o18ctc-371o18357l2494a1494a14380a2270i1170i11citb-243a06citb-243a06af176815ctb-177n07ctb-177n07115g03115g03109j15781a02412a07412a07429f161020a11ctb-187p01ctb-187p01622i12402p1145b16439f04105h193pterBeijing MapBAC Pooling Protocol 1,

28、152 (plates) X 384 (wells/plate) X 1 (BAC/well) = 442,368 BAC 48X8 (板) X 384 ( 孔/板 ) X 1 ( BAC/孔 ) = 147,456 BAC Each BAC clone contain 150 Kbp human insert 147,456 BAC clones 对全基因组的覆盖率: 147,456 BAC clones X 150 Kbp = 7.3728 The genome DNA 3,000,000 Kbp 共共48个个每组每组 8 个个每每8个个96孔板组成孔板组成1个个superpool,384

29、个个96孔板组成孔板组成48个个superpools 48 superpools Column poolsColumn pools Row poolsRow pools 1 2 3 4 5 6 7 8 9 10 11 12第八板第八板第二板第二板Plate poolsPlate pools第一板第一板 plate pools,row pools,column pools的构成的构成 1 2 3 4 5 6 7 8 9 10 11 12超级池(超级池(8个个96孔板,孔板,共共768个克隆)个克隆)板池(板池(96个克隆)个克隆)行池(12个克隆)列池(列池(8个克隆)个克隆)大大减少筛选的工作

30、量,降低成本,所得筛选结果准确可靠大大减少筛选的工作量,降低成本,所得筛选结果准确可靠 28 VS 768sheet of superpools, plate pools, row pools, column pools 一一 BAC Screening前前48个样品为引物个样品为引物OGG1.51对对superpool(sp)的筛选结果的筛选结果后后48个样品为引物个样品为引物OGG1.52对对superpool(sp)的筛选结果的筛选结果 引物引物OGG1.52对应对应sp#27,34,45的的plate,row,column pools的筛选结果的筛选结果BAC clone 确定确定 (

31、+为阳性克隆为阳性克隆) 引物引物OGG1.52的的Colony-PCR STSSTS的密度尚未达到绘制高精度物理图谱的要求,且在基因组中的分的密度尚未达到绘制高精度物理图谱的要求,且在基因组中的分布不均匀,造成很多区域没有阳性克隆覆盖布不均匀,造成很多区域没有阳性克隆覆盖, ,形成空洞。因此需用指纹图形成空洞。因此需用指纹图谱(谱(FPCFPC法)或末端序列(法)或末端序列(Walking by End Sequence)Walking by End Sequence)步移等手段对种子步移等手段对种子克隆进行延伸,形成连续克隆群。利用延伸方法筛选得到的克隆称为延克隆进行延伸,形成连续克隆群。

32、利用延伸方法筛选得到的克隆称为延伸克隆。伸克隆。 Contig 1Contig 2重叠序列重叠序列重叠序列重叠序列延伸引物延伸引物筛选到的延伸克隆筛选到的延伸克隆20 kb300 bpMolecular weightmarker every 5th lane- BAC clones 在96深孔 板中培养- Hind III 完全酶切- 1% 琼脂糖凝胶电泳 指指 纹纹 图图 谱谱 法法 (Walking by Fingerprinting database) 挑取靠近空洞的种子克隆,酶切构建其指纹图谱,在FPC数据库中进行比对,搜索含有此克隆的重叠克隆群信息,从中确定覆盖空洞区域的克隆,达到延

33、伸目的。Hind III 完全酶切Hind III 完全酶切FPC数据库数据库中比对中比对Clone AClone BClone CCABcontig搭建中克隆的错位搭建中克隆的错位 末端序列步行法末端序列步行法 (Walking by End Sequence) 挑取靠近空洞的种子克隆进行末端测序,然后在基因组数据库中进行比对,确定专一性的序列片段作为新的STS路标。最后设计新路标的PCR引物,按照STSPCR“反应池”方案筛选新的克隆,达到延伸的目的 。克隆克隆350A18350A18序列输入序列输入 end sequence databaseend sequence database的查

34、询结果的查询结果四、四、Clone Identification 1、STS-PCR 2、BAC end sequencing 3、Fingerprinting 4、FISH CK2CK1CK2CK113f06267l16481o07250a15204c23340j13对对1515个克隆进行个克隆进行HindIIIHindIII酶切后电泳结果酶切后电泳结果 “工作框架图工作框架图”绘制绘制根据序列与STS database进行blastn比较结果,将克隆定位末端序的比较,判定延伸在contig外的一端序列。并可及时进行walking,筛选新的克隆 霰弹法测序组装与Finishing工作流程图工

35、作流程图 Shotgun Sequencing I :RANDOM PHASEShotgun Sequencing II:ASSEMBLYShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGShotgun Sequencing III: FINISHINGConsed软件显示序列组装结果界面软件显示序列组装结果界面 1、Filling “intraclone gaps”BAC-453F

36、3s finishingSp6Sp6Sp61kb.Insert size. The size of the clone-insert from which a clone-end pair is taken.Contig. The result of joining an overlapping collection of sequence reads.Scaffold. The result of connecting non-overlapping contigs by using pair-end reads.N50 size. As applied to contigs or scaf

37、folds, that size above which 50% of the assembled sequence can be found.Genome assembly strategyContig assemblyScafffoldingInternal gap closinghttp:/ whole genome sequencing projectsTable. Basic information of Rrecently sequenced genomes.OrganismGenome sizestrategyCoverageContigScafffolds#N50MaxTota

38、l#N50MaxTotalHuman3.0GbSolexa45x2.76M1.5Kb18.8Kb2.18GbNRNRNRNRApple742.3 MbSangr+4544.4x+12.5x122,14616,171NR603.9Mb1,629102KbNR598.3Castor320MbSanger4.59x54,00021.1kb190kb324Mb25,828496.5kb4.7Mb350.6MbGrapevine500MbSangr+4547x+4.2x58,61118.2Kb238kb531Mb2,0931.33Mb7.8Mb421MbPanda2.4GbSolexa74x200,60

39、436,728434,6352.25Gb81,4961.22Mb6.05Mb2.30GbStraberry220Mb454+solexa+solid24.5x+6.4x+6.4x16,48728,072215,349202Mb3,2631.44Mb4.1Mb214MbCacoo430Mb454+sanger+solexa16.7x+44x25,91219.8kb190Kb291.44,792473.8Kb3415Kb326.9MbTomato900Mb454+sanger+solexa+solid31x+3.6x+82x+140 x110,87255.7kbNR763Mb3,7614.45Mb

40、NR782MbPotato840Mb454+solexa+solid11x+106x+0.2x111,18731KbNR683Mb66,301387KbNR727Mb Flowchart of the WGS de novo assemblyGenomic DNADNA fragmentation, construct fragmented librariesGenerate sequencing reads using 454 technologySequencing error correctionOutput contigsFill in intra-scaffold gaps and

41、get the final scaffoldsGenomic DNADNA fragmentation, construct paired-end libraries with variant insert sizesGenerate sequencing reads using Illumina GA technologySequencing pre-processOutput contigs and mini scaffoldsSolexa part454 partHybrid assembly and scffolding 454 reads processRaw readsKmer e

42、valuationQ20, remove adaptor,trim Sequencing pre-processNewbler assemblyAssembled readsUnassembled readsUnigene coverageKmer evaluationSolexa mappingNr/Nt blastContig statusAssemblyHybrid scaffolding Solexa reads processRaw readsKmer evaluationSequencing pre-processSoap assemblyAssembled readsUnasse

43、mbled readsUnigene coverageKmer evaluationSolexa mappingNr/Nt blastContig statusAssemblyMapping to 454 contigHybrid scaffoldingCov /Complong readsassemblycontigsshort readsA +C B scaffoldingA +B C scaffoldsFix gapHybrid assemblyESTUnigeneScaf AScaf CScaf BScaf DNew ScafABCDEST based Assembly in shor

44、t reads of NGS: Constructe BIGer Scaffording Raw sequencing reads pre-processing I Significance and purposeuSequencing library quality controluSequencing bias analysisI.Inherited prosperities on certain second generation sequencerII. Genome sequencing black hole effectIII.Transcriptome sampling and

45、quantification biasuReady for mapping uReady for de novo assembly Raw sequencing reads pre-processing IISequencing reads numbersDuplicates detection, regional distribution analysis and trimmingAdapter detection and trimmingReads quality analysis and low quality reads filter Average quality density d

46、istribution Average quality positional distribution regional distribution F-R correlation GC content-quality correlationInsert length distribution Pipelineraw data pre-processImage analysis and basecallingGOAT pipeline (OLB1.6), CASAVAQuality Control GERALD Summary.htmLaneLane Yield (kbases)Clusters

47、 (raw)Clusters(PF)1st Cycle Int(PF)% intensity after 20 cycles (PF)%PF Clusters% Align (PF)Alignment Score (PF)%Error Rate (PF)152630597464 +/- 487887676 +/- 921975 +/- 2186.17 +/- 5.2589.76 +/-5.9599.06 +/-0.25102.41+/-1.621.30+/-0.22Fastq and QualitySolexa reads of the Fastq formats_1_1_sequence.t

48、xtHWI-EAS724_0001:8:32:374:374#0/1GAGCTGTATATGAATAATAGTTCGTTTTTCATTATCCAAGATGGATCGGTATAAAGTCTGCTAAAATAAAGGTACAACG+HWI-EAS724_0001:8:32:374:374#0/1fcfcfggdfggggfggggcggggggggfgggggcgggfWgggggggggfgcggdgcgcggggfacbbbbgcgggggds_1_2_sequence.txt HWI-EAS724_0001:8:32:374:374#0/2TACCGTTAATAGCAGTAATATCATAA

49、TAGTAATAGCATCATAACGGTAGTCCCATAAAAGTGTGTCAGTAGTAGTAGTA+HWI-EAS724_0001:8:32:374:374#0/2ggggfgggggd_adcggggeggfggeggegfgeececdegggggfegcfegggegggfgacacedbd_cYbIllumina 1.3 format encodes a Phred quality score from 0 to 40 using ASCII 64 to 104error probability (p):# for solexa: p = 0.01, Q = 19; p = 0

50、,05, Q = 12.8, p = 0.10, Q = 9.5;# for phred: p = 0.01, Q = 20; p = 0,05, Q = 13, p = 0.10, Q = 10;Data assessment I Read quality distributionLow Quality High Quality Trim: 3 end trim if QN 30) 60 Assessment: Distance Distrubition between two Low quality (Q20 ? Lane data usage in different solexa li

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|