1、第4讲:基于生物质谱数据的互联网数据库搜索 母昭德母昭德硕士生学位课程:蛋白质组学硕士生学位课程:蛋白质组学本讲所要介绍的内容提要、生物信息学的一般情况、有关数据库的基础知识、由双向聚丙烯酰胺凝胶电泳鉴别的蛋白质数据库、目前利用生物质谱数据进行搜索时相关的主要数据库、搜索引擎-ExPASy、以生物质谱数据从互联网数据库进行搜索、生物信息学的一般情况生物信息学(Bioinformatics)是一门新兴的交叉学科,它包括了生物信息的获取、处理、存取、发布、分析、和解释等在内的所有方面。生物信息学综合运用生物学、数学、计算机科学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学在蛋白质组
2、学中的应用概况 生物信息学已经成为蛋白组学研究中必不可少的组成部分,其应用包括:编码的DNA序列的寻找与分析 蛋白质序列信息的获取 蛋白质鉴定和性质预测蛋白质鉴定和性质预测 蛋白质结构和功能预测蛋白质序列分析 数据的分析与整合 、有关数据库的基础知识 生物信息学数据库生物信息学数据库:是长期存放在计算机内,有组织的、可共享的、表明了一些事实性的信信息的数据集合息的数据集合。数据库系统数据库系统:是一个可实际运行的存储、维护和应用系统,是提供数据的软件系统,是存储介质、处理对象和管理系统的集合体集合体。数据库是生物信息学的基础数据库是生物信息学的基础。Alberto Labarga,Franck
3、 Valentin,Mikael Anderson,and Rodrigo Lopez.Web Services at the European Bioinformatics Institute.Nucleic Acids Res.,2007;35:W6W11 Nucleic Acids Research杂志在其每年的第一期中详细介绍最新版本的各种数据库。在2000年1月1日出版的28卷第一期115种通用和专用数据库,包括其详尽描述和访问网址。至2006年,生物信息学数据库总数已达858个。至2009年,生物信息学数据库总数已达1170个。Nucleic Acids Research杂志htt
4、p:/nar.oxfordjournals.org/核酸序列数据库核酸序列数据库2.RNA 序列数据库序列数据库3.蛋白质序列数据库蛋白质序列数据库结构数据库结构数据库5.基因组数据库(非脊椎动物)基因组数据库(非脊椎动物)6.代谢酶相关产物代谢酶相关产物7.人类和其他脊椎动物基因组人类和其他脊椎动物基因组8.人类基因和疾病人类基因和疾病9.其他数据和其他基因表达数据库其他数据和其他基因表达数据库10.蛋白组资源蛋白组资源11.其他分子生物学数据库其他分子生物学数据库12.细胞器官数据库细胞器官数据库13.植物数据库植物数据库14.免疫学数据库免疫学数据库生物信息学的基本构架染色体基因组图谱基
5、因组图谱基因组数据库核酸DNA序列序列核酸序列数据库蛋白质序列蛋白质序列蛋白质序列数据库蛋白质结构蛋白质结构蛋白质结构数据库蛋白质基因组作图序列测定结构测定生物信息学数据库工具生物信息学数据库工具二次数据库;复合数据库 生物信息数据库的类别以建库的方式而论,大致可分为四类:一级数据库(primary database)二级数据库(secondary database)专家库整合数据库基于肽质量指纹谱(PMF)信息的数据库搜索A set of peptide molecular weights from an enzyme digest of a protein蛋白质酶解酶解肽的混合物PMFPr
6、otein/DNA数据库搜索引擎Search engine 数据库搜索结果肽质量指纹图数据的检索1503.6049701504.6035151505.6060801506.6353441548.6147291549.6358831550.628364Import mass list into protein database search programSet search parametersSubmit search and look for peptides matches in databaseMass list from spectrum 现行的PMF软件工具重点介绍MS Fit以相
7、关的质谱实验数据从序列数据库中进行发掘的蛋白质组学工具。MS Fit可选的数据库可选的数据库可选的物种可选的物种可选的质谱仪可选的质谱仪可选的酶可选的酶翻译后修饰种类翻译后修饰种类的选择的选择质谱数据输入框质谱数据输入框MOWSE score:MOlecular Weight Search,Scoring based on peptide frequency distribution from the OWL non redundant Database%cov:total aa coverage%tic:fragments coverage复习题1、如何利用PMF数据从互联网进行数据库搜索?