kegg与go通路数据库介绍功能富集软件介绍课件.ppt

上传人(卖家):ziliao2023 文档编号:6191200 上传时间:2023-06-10 格式:PPT 页数:88 大小:8.74MB
下载 相关 举报
kegg与go通路数据库介绍功能富集软件介绍课件.ppt_第1页
第1页 / 共88页
kegg与go通路数据库介绍功能富集软件介绍课件.ppt_第2页
第2页 / 共88页
kegg与go通路数据库介绍功能富集软件介绍课件.ppt_第3页
第3页 / 共88页
kegg与go通路数据库介绍功能富集软件介绍课件.ppt_第4页
第4页 / 共88页
kegg与go通路数据库介绍功能富集软件介绍课件.ppt_第5页
第5页 / 共88页
点击查看更多>>
资源描述

1、KEGG与与GO通路数据库介绍通路数据库介绍功能富集软件介绍功能富集软件介绍第三讲第三讲1常用芯片数据库n美国国家生物技术信息中心(美国国家生物技术信息中心(NCBI)gene expression omnibus(GEO)http:/www.ncbi.nlm.nih.gov/geo/n欧洲生物信息研究所(欧洲生物信息研究所(EBI)的)的ArrayExpress http:/www.ebi.ac.uk/arrayexpress/2下载数据n预处理的数据:E-GEOD 18842.processed.1.zipn原始数据:E-GEOD-18842.raw.1.zip E-GEOD-18842.

2、raw.2.zip E-GEOD-18842.raw.3.zipn 样本信息:E-GEOD-18842.sdrf.txtn 平台信息:A-AFFY-44.adf.txt3芯片数据预处理步骤n1.背景校正(Background Correction);n2.标准化(Normalization);n3.合并(Summary).4表达谱正常样本正常样本癌症样本癌症样本5常用筛选差异表达基因的方法n倍数法(fold change)nT检验(T-test)nSAM(significance analysis of microarrays)6芯片数据分析流程图像分析和数据提取图像分析和数据提取数据预处理数

3、据预处理后续芯片数据分析后续芯片数据分析差异基因筛选差异基因筛选功能富集功能富集7何为生物学通路?何为生物学通路?(biological pathway)由生物体内一系列生物化学分子(包括基因,基因产物以及化合物等)通过各种生化级联反应来完成某一具体的生物学过程。8差异表达基因在通路中的分布差异表达基因在通路中的分布9n是随机现象?n还是具有某种生物学意义?富集富集10富集原理富集原理11通路数据来源通路数据来源?12http:/www.genome.jp/kegg/13KEGG数据库简介数据库简介nKEGG(Kyoto Encyclopedia of Genes and Genomes)是系

4、统分析基因功能的数据库,它将基因组的信息与基因功能联系起来,旨在揭示生命现象的遗传与化学蓝图。n1995年5月,日本京都大学化学研究所生物信息中心的Kanehisa实验室建立生物信息学数据库KEGG。1415KEGG的信息大致可以分为3类:系统信息、基因组信息和化学信息16KEGG数据库特点n具有强大的图形功能,它利用图形而不是繁琐的文字来介绍众多的代谢途径及各途径之间的关系,这样可以使研究者能够对其所要研究的通路有一个直观全面的了解。n我们主要介绍KEGG pathway database1718192021以通路:cell cycle为例2223对该通路的简要描述通路图1231:所有通路的

5、树状图2:该通路的描述及参考文献3:下载通路信息.xml24Cell cycle 通路图25查询通路n在此处输入要查询的通路名或通路id,例如查询“cell cycle“通路或者已知通路id时,直接输入通路id:04110n另外也可输入直接输入关键字”cycle“,返回的是包含”cycle“的所有通路26n方式1:关键字查询27n方式2:通路id查询28n方式3:模糊匹配查询29n查询基因:以TP53为例若要限制种群,可以在后面输入hsa(人类)30KEGG下载下载31http:/www.genome.jp/kegg/catalog/pathway_dd.html32n疾病基因和药物靶基因在通

6、路图中标示33KEGG查询:着色基因查询:着色基因http:/www.genome.jp/kegg/tool/color_pathway.html3435富集感兴趣的基因n差异表达基因n疾病基因n突变基因n药物靶基因n36KEGG通路数据库通路数据库n优点:图形功能,直观形象n缺点:有功能注释的基因总量低通路边界定义主观37 Gene Ontology(GO)数据库数据库访问地址访问地址:http:/www.geneontology.org3839?Tactility 触感Taction 触摸Tactile sense 触觉40Tactility 触感Tactile sense 触觉Tacti

7、on 触摸Sensory perception of touch;GO:005097541GO 简介简介nGO(gene ontology)是基因本体联合会(Gene Ontology Consortium)所建立的数据库,旨在建立一个适用于各种物种的,对在不同数据库中的基因和蛋白质产物进行限定和一致性描述的,并能随着研究不断深入而更新的语义词汇标准。n该数据库最初是由1998年对三个模式生物数据库的整合开始:the FlyBase(果蝇数据库),the Saccharomyces Genome Database(酵母基因组数据库SGD)和 the Mouse Genome Informati

8、cs(小鼠基因组数据库MGI)。随后,GO不断发展扩大,现在已是包含多种动物、植物、微生物的数据库。42 GO组成组成 GO提供了一系列的语义(terms)用来描述基因、基因产物的特性。分三类:n 1.细胞组分(Cellular Component):用于描述亚细胞结构、位置和大分子复 合物,如细胞核、端粒等;n 2.分子功能(Molecular Function):用于描述基因、基因产物个体的功能,如酶活性,分子结合等;n 3.生物过程(Biological Process):指分子功能的有序组合,达成更广的生物功能,如有丝分裂等。43GO cellular component term:m

9、itochondrial inner membrane;GO:0005743处于何位置?处于何位置?细胞色素细胞色素C氧化酶氧化酶cytochrome c oxidase44GO molecular function term:cytochrome-c oxidase activity;GO:0004497发挥何功能?发挥何功能?4 ferrocytochrome c+O2+4 H+=4 ferricytochrome c+2 H2O45GO biological process term:electron transport;GO:0006118参与何过程?参与何过程?46GO结构特点结构特

10、点n分等级(Hierarchical)n有向无环图(Directed Acyclic Graph)qterms have one or more parentsnis-a 和 part-of 关系4748is-a 和和 part-of 关系关系part-ofis-a49GO的注释的注释(annotation)nGO中的语义(terms)如何和相对应的基因产物相联系的呢?n这是由参与合作的数据库来完成的,它们使用GO的定义方法,对它们所包含的基因产物进行注解,并且提供支持这种注解的参考和证据。n一个基因产物可以被一种本体论定义的多种分支或多种水平注释。注释需要反映在正常情况下此基因产物的功能,生

11、物途径,定位等,而并不包括其在突变或病理状态下的情况。50收录的证据类型收录的证据类型nISS:Inferred from Sequence/structural SimilaritynIDA:Inferred from Direct AssaynIPI:Inferred from Physical InteractionnIMP:Inferred from Mutant PhenotypenIGI:Inferred from Genetic InteractionnIEP:Inferred from Expression PatternnTAS:Traceable Author Statem

12、entnNAS:Non-traceable Author StatementnIC:Inferred by CuratornND:No Data availablenIEA:Inferred from electronic annotation51点击“AmiGO”,进入如下所示页面:GO数据库浏览与查询数据库浏览与查询http:/amigo1.geneontology.org/cgi-bin/amigo/go.cgi52点击“Browse”,进入如下所示页面:http:/amigo1.geneontology.org/cgi-bin/amigo/browse.cgi?session_id=8

13、890amigo14128423045354GO 富集http:/geneontology.org/55点击“Downloads”便进入GO数据库相关文件的下载界面,如下图所示:GO数据下载数据下载56GO 在芯片中的应用在芯片中的应用experimental conditionGenecomponentprocessfunction57富集结果富集结果58上机操作练习上机操作练习59分析软件nR(Bioconductor)nMatlabnArray toolnCytoscape60Bioconductor是针对基因组分析的一组R语言扩展包nsource(http:/www.bioconduc

14、tor.org/getBioC.R)getBioC()61基本命令n#Load the Bioconductor package affy.library(affy)n#Read the.CEL file data.Data=ReadAffy()n#Compute the RMA measures of expression.expr=justRMA(Data,background=RMA”,normalize=quantile)n#Write the data to a tab-delimited text file.write.exprs(expr,file=mydata.txt)62Ma

15、tlab code p=1-hygecdf(sa-1,bb,ba,sb)%bb:所有通路内基因总数%ba:目标基因与通路内基因交叠数%sb:某条通路内基因数%sa:目标基因与某条通路内基因交叠数63nBRB-ArrayTools是一款为了DNA基因芯片数据分析而设计的集成软件包。nBRB-ArrayTool能够处理来自多种实验的表达谱数据,包括可视化、多维尺度、聚类基因和样本、分类预测样本等。nArrayTools以Excel加载宏的形式呈现,所以用户界面对于生物学家来说非常熟悉。64nArrayTools安装程序和相关文件可在BRB站点中获得:http:/linus.nci.nih.gov/

16、BRB-ArrayTools.htmln以宏的形式加载到Excel中 65Cytoscapehttp:/www.cytoscape.org/6667686970Pluginsnhttp:/chianti.ucsd.edu/cyto_web/plugins/nPlugins available for network and molecular profile analysis.Cytoscape is a software written in Java.71BiNGO72n7003n7004n7005n8463n10413n25937n26524n9113n6788n55233n92597n

17、60485n23286n4771n122786n7998173747576冗余关系冗余关系n父子节点(local redundancy)n节点间有交叠基因(global redundancy)77去冗余分析软件去冗余分析软件nElim Alexa et al,2006 nWeight Alexa et al,2006nParent-Child Grossmann et al,2007 n7879GO-function 介绍介绍nGO-function 软件是一款基于GO的富集分析工具,根据一些明确细致的规则来处理富集过程中产生的一些冗余结果。n与其它的冗余处理工具相比,GO-function

18、富集出的结果(terms)不仅具有统计显著性而且具有明确的生物学意义。80GO-function 冗余处理规则冗余处理规则81举例举例n以结肠直肠癌(32 adenomas tissue 和32 adjacent normal mucosa)基因表达数据为例,经过RMA标准化,使用SAM算法,在FDR1%下,共9201个差异表达基因。82结果对比结果对比83GO-function 应用举例应用举例GO-function packageGO-function package运行环境及安装运行环境及安装n 1 首先在安装GO-function 软件包之前要确保如下包已经安装:Biobase(=2.

19、8.0),graph(=1.26.0),Rgraphviz(=1.26.0),GO.db(=2.4.1),AnnotationDbi(=1.10.2),SparseM(=0.85)and“org.Hs.eg.db”(=2.4.1).n 2 若没安装按如下提示代码进行安装:source(http:/www.bioconductor.org/biocLite.R)biocLite()biocLite(graph)biocLite(Rgraphviz)biocLite(SparseM)n 3 下载并安装“GOFunction_1.0.zip”library(GOFunction)84nlibrary

20、(GOFunction)ndata(exampledata)nsigTerm-GOFunction(interestGenes,refGenes,organism=org.Hs.eg.db,ontology=BP,fdrmethod=BY,fdrth=0.05,ppth=0.05,pcth=0.05,poth=0.05,peth=0.05,bmpSize=2000)85有两种类型的结果:一种结果命名为sigTerm.csv,如下所示:另一种结果命名为sigTerm.bmp,如下所示GO-function结果输出结果输出8687Welcome to Our Labnhttp:/210.46.85.180:8080/fcensus/Guozlab_home.jspnContact:88

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(kegg与go通路数据库介绍功能富集软件介绍课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|