1、2.3 基因组数据库 收集并贮存各种生物完整基因组染色体的DNA序列、结构及功能注释的数据库。主要包括NCBI的Genome数据库,EBI的Genome Reviews数据库以及加利福尼亚大学圣克鲁斯分校的UCSC基因组数据库。2.3.1 NCBI的基因组数据库 http:/www.ncbi.nlm.nih.gov/genome 该数据库目前已收集了10400种以上物种的基因组的完整染色体序列图谱、遗传图谱和物理图谱,分为古生物、细菌、真核生物、病毒、类病毒五大类群。人基因组一号染色体图谱Map Viewer2.3.2 EBI的基因组浏览数据库2.3.3 UCSC基因组浏览器 http:/ge
2、nome.ucsc.edu加州大学圣克鲁兹分校基因组数据库工具栏 点击“Genomes”,进入“定位”检索方式。点击“Blat”,进入“序列比对”检索方式。点击“Tables”,进入“表单”检索方式。“表单”检索的参数选择:a)clade 进化分支;b)genome 物种;c)assembly 版本;d)group 数据组织类型,默认为“genes and gene prediction tracks”;e)track 数据检索方式,默认为“USCS tracks”;f)table 输出数据表,默认为“knownGene”;g)output format 数据输出格式;h)output fil
3、e 输出文件名。点击“get output”下载基因组数据。2.4 蛋白质序列数据库 早期的蛋白质序列数据库主要有:由NCBI建立的Protein序列数据库、由美国国家生物医学研究基金会建立的PIR序列数据库和由瑞士生物信息研究所建立的Swiss-Prot序列数据库。目前,PIR、TrEMBL已与Swiss-Prot蛋白质序列数据库合并为UniProtKB蛋白质序列数据库。2.4.1 NCBI蛋白质序列数据库2.4.2 UniProtKB蛋白质序列数据库 包含所有已知序列的野生型蛋白质的信息,其核心的蛋白质序列数据库为UniProtKB。数据库中所提供的蛋白质结构与功能信息非常全面。http:
4、/www.uniprot.org/UniProtKB蛋白质序列数据库格式文件所包含的内容有:功能名称和分类亚细胞定位病理和生物技术翻译后加工修饰表达相互作用结构家族和结构域序列交叉参考发表论文注册信息杂项相似蛋白质注册号标识符人类胰核糖核酸酶的数据库文件第一部分功能第二部分名称和分类第三部分亚细胞定位第四部分病理和生物技术第五部分翻译后加工修饰第六部分表达第七部分相互作用第八部分结构第九部分家族和结构域第十部分序列第十一部分交叉参考第十二部分发表论文第十三部分注册信息第十四部分杂项第十五部分相似蛋白质2.5 结构数据库 结构数据库收集并贮存生物大分子三维结构原始测量数据,其中主要是蛋白质分子三
5、维结构数据库。生物大分子的三维结构数据格式文件可通过特定的显示软件而直观地以图形方式表示出来。2.5.1 蛋白质结构数据库 主要的蛋白质三维结构数据库是PDB(Protein Data Bank)数据库。此外,NCBI的Structure数据库(MMDB,the Molecular Modeling Database)也包含PDB的全部数据。生物大分子的三维结构X射线衍射测量数据均以文本文件形式贮存,其后缀为.pdb,可用专门的软件打开或显示。2.5.2 三维结构显示软件 常用的生物大分子三维结构显示软件包括:RasMol软件(Bernstein HJ)和Cn3D软件(NCBI)和Swiss-
6、PdbViewer(SIB)等。下载地址(适用于Windows XP):http:/www.rasmol.org/software/RasMol_2.7.5_Windows_Installer.exeftp:/ftp.ncbi.nih.gov/cn3d/Cn3D-4.3.msihttp:/spdbv.vital-it.ch/download/binaries/SPDBV_4.10_PC.zip 为了帮助用户从浩如烟海的生物实验数据中获取有用的数据资料,并对数据进行科学的分析和处理,各生物信息数据库系统均开发了一系列的实用工具软件,主要的有:GQurey NCBI数据库检索工具软件;SRS EB
7、I的数据库检索工具软件;UniProt 蛋白质序列检索工具软件。2.6 生物数据库的信息检索2.6.1 GQurey检索工具:网址:http:/www.ncbi.nlm.nih.gov/gquery GQurey(以前称为Entrez)是NCBI开发的数据库检索系统。通过该检索系统,用户可对NCBI中的数据资料快速进行交叉检索,这些数据资料包括核苷酸序列、蛋白质序列、生物大分子结构、全基因组以及文献摘要。目前,GQurey链接的数据库主要有:PubMed:生物医学文献数据库;Nucleotide(GenBank):核苷酸序列数据库;Protein:蛋白质序列数据库;Structure:生物大分
8、子三维结构;Genome:基因组数据库;PopSet:种群研究数据资料;OMIM:在线人类孟德尔遗传学;Taxonomy:基因数据库中的生物分类学;UniGene:基因表达和微阵列数据库;UniSTS:遗传标志和作图数据库。1.在浏览器地址栏输入 http:/www.ncbi.nlm.nih.gov/nuccore/核苷酸序列检索步骤2.在检索框内输入关键词进行检索,必要时可设置“Limits”和“Advanced”。序列检索系统(Sequence Retrieval System,SRS)是由Biowisdom公司开发的生物信息数据库资料检索工具软件。但该检索系统现已停止服务。用户可通过EM
9、BL-EBI提供的链接进行检索。2.6.2 SRS检索工具:网址:http:/www.ebi.ac.uk/services2.6.3 BioMart检索工具 BioMart也是EBI中常用的数据库检索工具之一。该检索工具的特点是可以跨数据库进行核酸及蛋白质序列的检索。利用BioMart,可以方便的检索到某一物种全部的或限定范围的核酸或蛋白质序列、基因组位置、表达、结构以及其他注释信息等。http:/asia.ensembl.org/biomart/martview/1.选择数据库(database):2.选择数据集(dataset):3.设置“过滤器(filters)”:4.设置“属性(att
10、ributes)”:5.单击“Results”获得检索结果。2.6.4 UniProt检索工具:网址:http:/www.uniprot.org/由NIH提供资助,由EBI、SIB和PIR三方联合开发的主要针对UniProtKB蛋白质序列数据库的检索工具软件。课外练习1.使用GQuery,EMBL-EBI,BioMart,UniProt等检索工具,通过关键词(基因名称或蛋白质名称)、注册号(AC)、标识符(GI或ID)等方式检索一段核酸或蛋白质序列。2.对检索结果进行理解和分析。后面内容直接删除就行资料可以编辑修改使用资料可以编辑修改使用资料仅供参考,实际情况实际分析主要经营:课件设计,文档制作,网络软件设计、图文设计制作、发布广告等秉着以优质的服务对待每一位客户,做到让客户满意!致力于数据挖掘,合同简历、论文写作、PPT设计、计划书、策划案、学习课件、各类模板等方方面面,打造全网一站式需求The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider field