1、第八章 基因注释与功能分类第一节 引 言背景随着后基因组(post-genomics)时代的来临,基因组学的研究重心开始从阐明所有遗传信息转移到在整体分子水平对功能进行研究。这种转变的一个重要标志是产生了功能基因组学(functional genomics)。任务功能基因组学的主要任务之一是进行基因组功能注释(Genome annotation),了解基因的功能,认识基因与疾病的关系,掌握基因的产物及其在生命活动中的作用等。意义快速有效的基因注释对进一步识别基因,研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,预测和发现蛋白质功能,揭示生命的起源
2、和进化等具有重要的意义。第二节 基因注释数据库 一、研究人员已经掌握了大量的全基因组数据,同时关于基因、基因产物以及生物学通路的数据也越来越多,解释生物学实验的结果,尤其从基因组角度,需要系统的方法。基因注释数据库产生的原因基因注释数据库产生的原因 二、在基因组范围内描述蛋白质功能十分复杂,最好的工具就是计算机程序,提供结构化的标准的生物学模型,以便计算机程序进行分析,成为从整体水平系统研究基因及其产物的一项基本需求。一、一、基因本体(基因本体(Gene Ontology,GO)数据库)数据库 基因本体数据库是GO组织(Gene Ontology Consortium)在2000年构建的一个结
3、构化的标准的标准生物学模型,旨在建立基因及其产物知识的标准词汇体系,涵盖了基因的细胞组分(细胞组分(cellular component)、分子功能()、分子功能(molecular function)、生物学过程生物学过程(biological process)。人民卫生出版社8年制及7年制临床医学等专业用生物信息学GO数据库收录的基因组数据列表数据库收录的基因组数据列表 人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学一、使用一、使用GO数据库数据库 人民卫生出版社8年制及7年
4、制临床医学等专业用生物信息学举例举例 人民卫生出版社8年制及7年制临床医学等专业用生物信息学此图显示了该基因产物的基本信息,包括类型、物种、此图显示了该基因产物的基本信息,包括类型、物种、别名来源和序列别名来源和序列 人民卫生出版社8年制及7年制临床医学等专业用生物信息学此图显示了该基因产物此图显示了该基因产物的术语关联(的术语关联(Term Associations)图,图中)图,图中记录名称记录名称“Term”是是GO记录的名字,记录的名字,“Ontology”是该基因是该基因产物的特性,如要查看产物的特性,如要查看其分子功能,可点击其其分子功能,可点击其中的一条记录中的一条记录“nerv
5、ous system development”。人民卫生出版社8年制及7年制临床医学等专业用生物信息学 此图上部先对神经源此图上部先对神经源性分化因子性分化因子6的相关的相关信息做简单描述,中信息做简单描述,中间间术语系谱(术语系谱(Term Lineage)成阶梯状成阶梯状分布,记录了分布,记录了GO数数据库中全部分子功能据库中全部分子功能所处的位置和关系。所处的位置和关系。下方下方“External Reference”提供了与提供了与外部相关数据的链接。外部相关数据的链接。人民卫生出版社8年制及7年制临床医学等专业用生物信息学点击上图右上方的可视化视图(Graphical View)就更
6、清晰地显示了分子功能记录之间构成的复杂网状结构,既有上下隶属关系,也存在平行关系。人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学二、二、京都基因与基因组百科全书京都基因与基因组百科全书人民卫生出版社8年制及7年制临床医学等专业用生物信息学KEGG存储内容存储内容 人民卫生出版社8年制及7年制临床医学等专业用生物信息学KEGG数据库的注释与检索数据库的注释与检索 人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学KEGG数据库的注释与检索数据库的注释与检索 人民卫生出版社8年制
7、及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学KEGG数据库的改进与更新数据库的改进与更新 人民卫生出版社8年制及7年制临床医学等专业用生物信息学KEGG数据库的改进与更新数据库的改进与更新 人民卫生出版社8年制及7年制临床医学等专业用生物信息学第三节 基因集功能富集分析 一组基因直接注释的结果是得到大量的功能结点。这些功能具有概念上的交叠现象,导致分析结果冗余,不利于进一步的精细分析,所以研究人员希望对得到的功能结点加以过滤和筛选,以便获得更有
8、意义的功能信息。进行基因集功能富集分析的原因进行基因集功能富集分析的原因一、富集分析算法一、富集分析算法 人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学二、常用富集分析软件二、常用富集分析软件 人民卫生出版社8年制及7年制临床医学等专业用生物信息学二、富集分析应用实例二、富集分析应用实例 人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学第四节 基因功能预测 近来已经发展了很多基于GO数据库或KEGG数据库的方法,利用高通
9、量的基因表达和蛋白质互作数据进行功能预测,其中一些新开发的方法试图整合多种数据类型,通过构建功能相关网络的方式预测基因功能。基因功能预测算法基因功能预测算法 当前基于当前基于GO或或KEGG的基因功能预测策略的基因功能预测策略人民卫生出版社8年制及7年制临床医学等专业用生物信息学一、基于一、基于GO的基因功能预测的基因功能预测 人民卫生出版社8年制及7年制临床医学等专业用生物信息学二、基于二、基于KEGG的基因功能预测的基因功能预测 通路分析是现在经常被使用的芯片数据基因功能分析法。与GO分类法(应用单个基因的GO分类信息)不同,通路分析法利用的资源是许多已经研究清楚的基因之间的相互作用,即生物学通路。研究者可以把表达发生变化的基因集导入通路分析软件中,进而得到变化的基因都存在于哪些已知通路中,并通过统计学方法计算哪些通路与基因表达的变化最为相关。人民卫生出版社8年制及7年制临床医学等专业用生物信息学三、常用基因功能预测软件三、常用基因功能预测软件人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学举例举例人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学人民卫生出版社8年制及7年制临床医学等专业用生物信息学
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。