1、RNA测序技术原理测序技术原理及应用及应用遗传的中心法则遗传的中心法则基因组基因组转录组转录组表观遗传组表观遗传组蛋白组层蛋白组层次次什么是转录组?All transcripts All mRNAsRNA是解读基因组的关键是解读基因组的关键RNAProteinDNA测序技术测序技术RNA-RNA-SeqSeqSmall RNA测序测序降解组测序降解组测序Non-coding RNA测序测序研究对象研究对象mRNASmall RNAmRNANon-coding RNA鉴定新分子鉴定新分子OOOO表达谱研究表达谱研究OOOO基因结构分析基因结构分析O/XXXOEST 测序测序O/XXXX 筛选分子
2、标记筛选分子标记 OOOX转录融合基因转录融合基因表达表达O/XXXXRNA 测序技术测序技术Workflow of RNA-Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析Total RNA样品检测样品检测 Agilent 2200 检测检测OD260/280:1.82.2 RNA 28S:18S 1.0;RIN7 新型安捷伦2200 TapeStation 系统是新一代测序(新一代测序(NGS)、生物微阵列芯片分析和qPCR工作流程以及蛋白质纯化和抗体生产过程中对生物样品进行质量控制(质量控制(QC)的理想解
3、决方案。可扩展的通量16联或96孔微量滴定板 快速得到结果平均每个样品只需一分钟便可获得结果 使用简单可直接使用的ScreenTape预制胶条简化了工作流程 样品用量少每次运行仅需要不到2ul样品检测报告检测报告-合格样品合格样品棉铃虫/果蝇检测报告检测报告-不合格样品不合格样品Workflow of RNA-Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析真核真核mRNA的纯化的纯化mRNA的纯化主要通过的磁珠与生物素吸附原理从而分离纯化Oligo(dT)25磁珠纯化原理主要是mRNA的3的poly A与磁珠在
4、bindingbuffer的作用下相结合。磁珠通过MPC(磁分离器)从溶液中分离出来。mRNA与磁珠结合后,再用Tris-HCL在加热条件下解离洗脱到溶液中。链霉亲合素包被磁珠链霉亲合素包被磁珠+生物素标记生物素标记Oligo(dT)25+poly(A)原核原核mRNA的纯化的纯化Ambion MICROExpress KitLNA扣锁型探针扣锁型探针mRNA反转录反转录-fragment+RT纯化过的mRNA样品加入1 l的fragment buffer 70作用1.5min。加入1l的stop buffer终止反应。加入沉淀剂(NaAc 糖原 无水乙醇)沉淀产物。RTds cDNA末端修复
5、(防止自连)cDNA 3末端加AAdapter连接第一天第一天消化消化DNAmRNA的分离的分离mRNA的打断的打断cDNA的合成的合成第二天第二天末端修复末端修复 加接头加接头胶回收胶回收3端加端加A第三天第三天PCRPCR胶回收胶回收 文库制备文库制备 文库质量检测:文库质量检测:Aligent 2100:片段大小、纯度、浓度qPCR:片段大小、浓度手工检测:跑胶验证。Workflow of RNA-Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析ApplicationRNA-Seq(单端测序单端测序-Qua
6、ntification)RNA-Seq(双端测序双端测序-Transcriptome)Expression-profilingAlternative SplicingFusion GeneSNP detectionHiSeq 2500Applications of RNA-Seq17RNA-Seq(Transcriptome)Workflow of RNA-Seq(Transcriptome)生物信息学分析生物信息学分析RNA-Seq(Transcriptome)Characterize the transcriptome in unparalleled detailTechnique 220
7、RNA-Seq(De novo transcriptome assembly)RNA-Seq(Transcriptome resequencing)RNA-Seq(De novo transcriptome assembly)文库构建文库构建测序测序组装组装De novo assemble a transcriptome组装流程组装流程 数据产出统计及测序数据的成分和质量评估 组装结果分析(Contig 长度分布、Scaffold 长度分布、Unigene 长度分布)Unigene(transcript)功能注释 Unigene 的GO 分类 Unigene 代谢通路分析 预测编码蛋白框(CD
8、S)Unigene 表达差异分析(两个或两个以上样品)Unigene 在样品间的差异GO 分类(需两个或两个以上样品)和Pathway 富集性分析De novo assembly transcriptome 信息分析主要信息分析主要内容内容:De novo assembly transcriptome信息分析流程信息分析流程Unigenes的的GO 注释注释Pathway 分析分析RNA-Seq(Transcriptome resequencing)cDNA文库构建文库构建测序测序比对到参考序列比对到参考序列Transcriptome resequencing比对流程比对流程 比对统计 基因表
9、达注释 基因差异表达分析 基因结构优化 可变剪接分析 预测新转录本 cSNP分析Transcriptome resequencing信息分析主要内容信息分析主要内容Transcriptome resequencing信息分析流程信息分析流程应用应用-优化转录组注释信息优化转录组注释信息l基因结构优化基因结构优化l可变剪接鉴定可变剪接鉴定l基因融合鉴定基因融合鉴定lRNA水平水平SNP分析分析Genomic intergenic regionReadsclusterPaired Readsdistribution优化基因结构优化基因结构鉴定新的转录本鉴定新的转录本Paired-End(PE)Re
10、adsReads 比对到参考序列基因间区域比对到参考序列基因间区域鉴定可变剪接(鉴定可变剪接(Alternative Splicing)exon1exon2exon3exon1exon2exon3exon1exon3common readsjunction readsmRNA鉴定基因融合鉴定基因融合Paired ReadsSingle ReadsGene AGene B分析分析RNA水平水平SNP转录组重测序比对软件:转录组重测序比对软件:SOAPDe novo 转录组测序转录组测序:组装软件:组装软件:SoapDenovo比对软件:比对软件:SoapSNP36转录组研究技术横向比较转录组研究
11、技术横向比较TechnologyTiling ArraycDNA or EST sequesing Transcriptome SequencingPrincipleHybridizationSanger sequencingNext-GensequencingResolutionFrom several to 100Single baseSingle baseThroughputHighLowHighReliance on genomic sequenceYesNoIn some casesBackground noiseHighLowLowApplicationSimutaneously
12、map transcribed regions and gene expressionYesLimited for expressionYesDynamic range to quantify gene expression levelUp to a few-hundred foldNot practical 8,000-foldAbility to distinguish different isoforms and allelic expressionLimitedYesYes转录组测序的优势转录组测序的优势RNA测序与芯片检测序与芯片检测基因数比较测基因数比较 RNA测序与芯片测序与芯片
13、检测基因的表达量分布检测基因的表达量分布Technique 1Genome Res 2010CaseCase 实验材料收集:实验材料收集:叶片,花序,果实,根 时间点:0,4,8,12,16,20和 24 h 将每个时间点采集的样品均匀混合 测序策略:测序策略:Illumina 测序,1G data1.High light 2.Heat 3.Cold 4.Salt 5.Drought抗逆相关可变剪接抗逆相关可变剪接外包膜蛋白外包膜蛋白16(AT2G28900)Intron-retentionControlLow Temperature Resistance低温胁迫相关的AS低温胁迫下这个内含子
14、和对照相比被保留了下来,揭示了可变剪接有重要功能。AS调节机制CCA1生物钟相关基因,例如调节气孔的开关等RNA-RNA-SeqSeq单端测序单端测序(QuantificationQuantification)等同于等同于数字表达谱数字表达谱(DGE)(DGE)Workflow of RNA-Seq单端测序单端测序(Quantification)生物信息学分析生物信息学分析RNA-Seq单端测序(单端测序(Quantification)生物信息分析内容生物信息分析内容v测序数据评估测序数据评估v筛选差异表达基因筛选差异表达基因v表达模式聚类分析表达模式聚类分析vGO 功能富集分析功能富集分析v
15、Pathway 富集分析富集分析v蛋白互作网络分析蛋白互作网络分析RNA-Seq单端测序(单端测序(Quantification)信息分析流程)信息分析流程RNA-Seq与基因芯片优缺点比较技术技术优点优点缺点缺点RNA-seq1)检测基因数比基因芯片多25%2)定量准,可重复性高(重复相关系数0.99)3)数字化信号,无背景噪音,无交叉杂交4)高、低丰度基因高、低丰度基因均均可检测可检测5)不受研究物种限制,不受研究物种限制,模式生物和非模式生物均可检测6)数据可与时俱进,数据可与时俱进,即随数据库更新而更新7)具有较好的分析兼容性,数据格式与芯片相同,可与芯片的分析软件兼容1)样本要求量比
16、基因芯片多2)数据量大,需要具备一定的生物信息分析基础,才能更好的挖掘数据蕴含的丰富信息基因芯片1)平台应用较早2)信息分析软件较多3)有些平台要求样品量少1)检测灵敏度较低、重复性差、检测阈值较狭窄2)有背景噪音,假阳性率1%3)受物种限制,只能检测部分模式生物受物种限制,只能检测部分模式生物4)受基因拷贝数限制,无法检测出低丰度基因无法检测出低丰度基因5)只能检测已知转录本,无法检测出新转录本,无法检测出新转录本6)受数据库数据所限,因探针依靠现有数据库探针依靠现有数据库或比较旧的版本的数据库来设计的,可能出现注释注释不准确不准确的情况casecase取样:取样:选取在成熟季节开花后 5,
17、10,和15个星期葡萄分别代表葡萄果实成熟中的三个时期(post setting,veraison和ripening)数据量:数据量:超过59M reads数据,长度在36-44bp之间运用RNA-Seq技术对葡萄果实发育过程中复杂转录特征的研究。表二表二 reads在基因组上的分布情况在基因组上的分布情况表一表一 测序数据测序数据葡萄葡萄RNA-Seq单端单端测序测序浆果发育三个阶段浆果发育三个阶段共有、特有共有、特有基因基因表达分布图表达分布图基因表达量分布基因表达量分布表达簇的分类分布情况表达簇的分类分布情况差异表达的基因GO功能注释-分成了19个功能类群-按照基因在三个不同时期的表达趋势进行分类,分成8个cluster。将基因的表达和它调控的一个生理功能联系在了一起。RNA-Seq对浆果对浆果标记标记基因的验证基因的验证用RNA-Seq的数据去验证已报到的十个浆果成熟期的mark基因。事实上从其它方法得到的数据去验证了RNA-Seq数据的准确性。RNA-Seq结果与RT-PCR具有高度一致性RT-PCR验证结果验证结果Thats all,thank you!