生物信息学全课件.ppt

上传人(卖家):晟晟文业 文档编号:5062281 上传时间:2023-02-07 格式:PPT 页数:77 大小:3.97MB
下载 相关 举报
生物信息学全课件.ppt_第1页
第1页 / 共77页
生物信息学全课件.ppt_第2页
第2页 / 共77页
生物信息学全课件.ppt_第3页
第3页 / 共77页
生物信息学全课件.ppt_第4页
第4页 / 共77页
生物信息学全课件.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

1、LifeScienceLifeScience第九讲第九讲生物信息学生物信息学将给生命科学带来变革性的变化!Biology is shifting from being an observational science to being a quantitative molecular scienceLifeScience学习目的学习目的1、了解生物信息学的发展背景、定义2、理解生物信息学在生命科学研究中的作用3、理解数学、计算机科学如何在生物信息中的地位和作用4、了解基因芯片的检测原理和制备方法LifeScienceLifeScience第一节第一节 生物信息学生物信息学(Bioinforma

2、tics)一、生物学基础(复习)二、发展背景与定义三、研究内容四、研究现状五、发展前景LifeScience一、生物学基础一、生物学基础表型与基因型(phenotype vs.genotype)遗传信息的流动基因的表达与调控分子进化DNA序列分析:基因识别、调控元件识别、进化分析mRNA:剪切位点识别、基因表达分析蛋白质:结构预测、蛋白质间相互作用、亚细胞定位基因组:基因预测、进化分析染色体:结构分析网络:pathway建模细胞:系统:LifeScienceLifeScience二、发展背景和定义二、发展背景和定义LifeScience生物信息生物信息广义的概念广义的概念生命现象是不同层次上的

3、物质、能量与信息的交换,不同层次是指核酸、蛋白质、细胞、器官、系统、整体等研究生物体系和生物过程中信息的内涵和信息的传递 生物电磁学与电磁生物学、视觉系统与光信息处理、脑和神经系统与信息、生物体结构与微光机电系统LifeScience发展背景发展背景BiocomputingComputational BiologyBioinformatics1986年,在EMBL Heidelberg成立Biocomputing部门,命名为BIOinformatis.如果我们不能回答生物学问题,作为计算生物学家是失败的。1997年底创立了CABIOS(Computer Applications in the

4、Biosciences).we assert:computational planning and analysis is an integral part of the biological discovery process.在完整基因组序列和高通量技术时代不要仅仅谈论分析海量数据的挑战,相反,要谈论疾病产生的风险,关于人类遗传差异、基因型改变的进化如何导致功能的改变,如何使用数据来回答这些问题。LifeScience 背景背景背景1965 1970 1975 1980 1985 1990 1995 2000100,00010,0001,0001001010.10.010.0011,000

5、Medline RecordsTransistors/ChipDNA Sequences3D StructuresCumulative Growth of Biological Information and Computer PowerMark Bogulski(1998)BioinformaticsMark Bogulski(1998)BioinformaticsMark Bogulski(1998)Bioinformatics:A New Era:A New Era:A New EraLifeScience生物医药工业生物医药工业 提供大量基因序列分析的工具,在以下方面加快新药开发的进程

6、:l资料的获取、包括从数据库中寻找新药开发者感兴趣的基因序列和相关资料文献l基因功能的预测和基因生理作用的预测l需要大量信息处理的药物筛选和加工过程(Weinstein JN et al.,1997)LifeScienceDefinition of Bioinformatics(1)Bioinformatics is defined as a scientific discipline that encompasses all aspects of biological information acquisition,processing,storage,distribution,analys

7、is and interpretation,that combines the tools and techniques of mathematics,computer science and biology with the aim of understanding the biological significance of a variety of data.生物信息学是一门交叉学科。它包含了生物信息的获取、处理、存储、生物信息学是一门交叉学科。它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学分发、分析和解释等在内的所有方面,它综合运用数学

8、、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。Understanding Our Genetic Inheritance.The US Human Genome Project:The First Five Years 1991-1995.NIH Publibcation No.901590,April,1995LifeScienceDefinition of Bioinformatics(2)Bioinformatics is conceptualising biology in terms of mole

9、cules(in the sense of Physical chemistry)and applying“informatics techniques”(derived from disciplines such as applied maths,computer science and statistics)to understand and organise the information associated with these molecules,on a large scale.Oxford English DictionaryLifeScienceComputationInfo

10、rmaticsBiologyBioinformaticsLifeScience算法统计学信息理论图形学科学可视化图像识别人工智能密码学非线性动力学计算机模拟语言学机器学习数据库软件工程计算机网络分布式系统数据获取数据解释基因组图谱三维结构预测分子建模药物设计同源比较分子进化数据库检索基因预测仪器设计数据库构建基因调控基因诊断及治疗生物信息学计算机科学和数学分子生物学 LifeScience生物信息学研究意义利用数理统计、模式识别、动态规划、密码解读、利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及语意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方

11、法隐马氏模型等各种方法对序列、结构数据进行对序列、结构数据进行定性和定量分析定性和定量分析,从中获,从中获取基因编码、基因调控、序列取基因编码、基因调控、序列-结构结构-功能关系等功能关系等理性知识理性知识阐明细胞、器官和个体的发生、发育、病变、衰阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和亡的基本规律和时空联系时空联系探索生命起源、生物进化、生命本质等重大理论探索生命起源、生物进化、生命本质等重大理论问题,最终建立问题,最终建立“生物学周期表生物学周期表”指导分子生物学实验指导分子生物学实验LifeScienceLifeScience生物信息学 研究方向基因组序列装配基因组序列装

12、配基因识别基因识别基因功能预报基因功能预报基因多态性分析基因多态性分析基因进化基因进化mRNAmRNA结构预测结构预测基因芯片设计基因芯片设计基因芯片数据分析基因芯片数据分析疾病相关基因分析疾病相关基因分析 蛋白质序列分析蛋白质序列分析 蛋白质家族分类蛋白质家族分类 蛋白质结构预测蛋白质结构预测 蛋白质折叠研究蛋白质折叠研究 代谢途径分析代谢途径分析 转录调控机制转录调控机制 蛋白质芯片设计蛋白质芯片设计 蛋白质芯片数据分析蛋白质芯片数据分析 药物设计药物设计LifeScience三、生物信息学的研究内容三、生物信息学的研究内容数学、计算机科学、生物学1、与HGP相关的研究内容2、功能基因组研

13、究相关内容3、蛋白组学相关4、基因芯片信息学研究LifeScienceStatistics 统计学Probability Theory 概率论(特别是随机过程理论)Operational Research 运筹学Optimization Theory&Method 最优化理论与方法Topology 拓扑学(主要是几何拓扑)Function Theory 函数论Information Theory 信息论Computational Mathematics 计算数学Group Theory 群论数学数学(Maths)LifeScience几个常用几个常用 数学模型概念与方法数学模型概念与方法Bay

14、es 公式、Bayes统计马氏链(Markov chains)隐马氏链(Hidden Markov chains)Poisson 过程与连续时间马氏链熵、相对熵与信息增益神经网络(neural networks(NN):Multi-layer feed-forward NN,self-organized learning NN,recurrent NN(Hopfield NN,Bolztmann machine)LifeScience网络技术数据库(特别是关系型数据库)数据整合和可视化数据挖掘基于Unix操作系统的各种软件包一些重要的算法的复杂性研究计算机科学计算机科学(Computer Sc

15、ience)计算机硬件LifeScience生物信息学研究内容生物信息学研究内容 (序列比对)包括:全序列、局部和多重比对;Fasta,Blast,PSI-Blast (蛋白质结构预测)(计算机辅助基因识别)算法纷纭,较著名的为GeneScan,GeneFinder,等;尚存在许多问题 (DNA语言)(分子进化和比较基因组学)(序列重叠群装配)(遗传密码的起源)(代谢网络分析)(基因芯片设计)LifeScience与与HGP相关的生物信息学研究相关的生物信息学研究 1、高度自动化的实验数据的获得、加工和整理高度自动化的实验数据的获得、加工和整理各种自动化分子生物学仪器应用上,如DNA测序仪,P

16、CR仪等实验过程高度自动化甚至工厂化,产生的海量数据(gigabyte),专门的实验室数据管理系统自动完成包括实验进程和实验数据的纪录,常规数据分析,数据质量检测和问题的自动查找,常规的数据说明和数据输入数据库。目前还没有成熟的通用的分子生物学数据管理系统。LifeScience2、序列片段的拼接目前DNA自动测序仪每个反应只能测序500bp左右,传统测序方法是将克隆进行亚克隆并对亚克隆进行排序。自动而高速拼接序列的算法,Lander-Waterman模型(Lander ES and Waterman MS,1998)利用鸟枪法进行测序,再将大量随机测序的片段用计算机进行自动拼接。1.9Mb

17、Haemophilus influenzae(流感嗜血杆菌)(Fleischmann RD et al.,1995)0.58Mb Mycoplasmu genitalium(枝原体)(Fraser CM et al.,1995)0.58Mb jannaschii(甲烷杆菌)(Bult CJ et al.,1996)有待改进:将已知的基因组知识应用于拼接算法,进一步提高拼接真核基因组的有效性;自动处理自动测序造成的差错LifeScienceLifeScience (序列比对、联配、对齐等)包括:全序列、局部 多重比对;Fasta,Blast,PSI-Blast_LifeScienceRaw DN

18、A sequenceGeneBank:11.5Millon sequence 12.5billion basesSeparating coding and non-coding Identification of introns and exonsGene product predictionForensic analysisLifeScience基因识别基因识别识别基因组编码区,识别基因结构1、同源比较(DNA序列、EST)2、基因预测(不是用同源搜索的方法来识别基因)从头开始基因预测基于知识的基因预测(密码子使用,碱基组成,剪切位点特征,PolyA信号,2、3、6核苷酸频率,转录信号,转译

19、信号,尺寸分布)LifeScience基因预测的步骤:1、识别可能的外显子2、辨别起始/内部/终止外显子3、把起始、一些内部的和终止外显子的连起来,形成可能的基因4、确保该可能的基因没有内部的移位或终止密码子5、leftovers:shadow exons算法:Rule-based system,linguistic system,linear discriminant analysis,decision tree,spliced alignment,fourier analysisLifeScienceLifeScienceLifeScienceEvaluating Gene Predict

20、ion敏感性(Sensitivity)敏感性=预测基因中确为基因的数目/待测序列中的基因数目;How many exons were correctly predicted?特异性(Specifity)特异性=预测基因中确为基因的数目/预测基因数目How many exon predictions are true?LifeScience 虽然人类基因组的草图很快就要完成,但生物学家们对基因组里到底有多少基因的猜测仍有极大的不同。最近在美国纽约冷泉港召开的一个会议上,他们设立了一美元一个(次)的基因数目赌注。胜者将于2003年揭晓,他除了可获得全部赌金外,还可得到一本由DNA结构的发现者Jam

21、es Watson亲笔签名的皮革封面双螺旋一书。如果基因组是生命的天书,那么基因就是写成这本书的词汇。生物学家们一直假设,微生物的故事较短,而人类的故事则是一部巨作,人类拥有8万到10万个基因。但是美国加州大学伯克利分校的果蝇基因组计划的主任Gerald Rubin指出,果蝇的基因比我们所认为的最简单的线虫少了5000个。他警告说:“生物体的复杂性并不是简单地与基因数量相关联的。”确实,根据目前已测序完成的人类基因组第21对、22对染色体的经验,德国分子生物技术研究所的 Andre Rosenthal 说,我们得出的结论是整个基因组有不多于4万个基因。法国的分子遗传学家Hugues Roest

22、 Crollius通过比较现有的人类基因序列与淡水河豚基因序列,提出了更低的人类基因数估计:在27700与34300之间。美国西雅图华盛顿大学的基因学家Phil Green是常用的组合基因序列数据的程序PHRED和PHRAP的发明人,他提出人类基因数大约为35000。Green说:“我们使用了3种独立的计算方法得出了这些较低的基因数估计,我确信基因数目就在这个范围内。”美国国家人类基因组研究所主任Francis Collins表示他同意Green的估计,将他1美元的赌金下在48011个基因上。但马里兰Rockville的基因组研究所(TIGR)的John Quackenbush根据TIGR的人

23、类基因指数的估计,将他的1美元赌在118259个基因上。加州Incyte Genomics公司的Sam LaBrie赌的基因数是153478个,该公司在1999年9月曾宣布人类基因至少有14万个。但是支持人类基因数目是一个较小数的科学家们也不灰心,他们争论说生物体的复杂性来自于基因如何被管理或表达的,而不是基因数目本身。Rosenthal解释说:“我们不需要那么多的基因成为高等动物,”他赌的是38000个。你赌多少呢?LifeScience基因功能预测基因功能预测(1)序列同源比较如果基因A与基因 B有相当的同源性,那么基因A可能具有类似基因B的功能。公共数据库:GenBank,EMBL,DD

24、BJ功能数据库:dbEST,dbSTS,dbGSS(Genome Survey Sequence,类似EST,不同的是它是基因组的片段而非cDNA的片段,来自随机的对基因组片段进行一轮测序,以及外显子捕捉和Alu PCR等方法),dbHTG(high throughput Genomic Sequence,未完成整理的序列数据)蛋白质序列库:PIR(protein information resource),Swiss-Prot 蛋白质高级结构数据库PDB(protein data bank):生物大分子三级结构的数据库,包括原子标记、文献引用、一级和二级结构信息,以及晶体结构和核磁共振的数据

25、。同源比较算法:分为整体对齐(Global alignment)和局部对齐(local alignment)局部对齐的算法有Smith-Watermann 算法;FASTA算法;BLAST算法LifeScienceProtein Sequence400,000 sequences(SWISS-PROT)300aaSequence comparison algorithmsMultiple sequence alignments algorithmsIdentification of conserved sequence motifsLifeScience蛋白质结构预测蛋白质结构预测 可以通过计

26、算(如分子力学、分子动力学等)来进行结构预测(1)对于自然的蛋白质结构和未折叠的蛋白质结构,两者之间的能量差非常小(1kcal/mol 数量级)(2)研究蛋白质结构的计算量非常大 LifeScienceAnfinsen,1960esX-射线衍射和核磁共振蛋白质结构预测的实验基础蛋白质结构预测的实验基础天然核糖核酸酶变性还原核糖核酸酶LifeScienceLifeScience蛋白质的二级结构蛋白质的二级结构二面角定义NCACNOCACywfORR蛋白质分子的主链二面角la螺旋(f,y)(-60,-40)lb折叠(f,y)(-120,140)l环区LifeScience蛋白质分子的三级结构蛋白质

27、分子的三级结构l典型的蛋白质结构类型 a、b、a/b、a blPDBSUMhttp:/www.biochem.ucl.ac.uk/bsm/pdbsumlSCOPhttp:/ l用处估计蛋白的结构类型提高同源模建的准确性三级结构预测的起点远缘蛋白的Threadingl方法Chou-FasmanGarnier神经网络组合算法LifeScience蛋白质三级结构预测蛋白质三级结构预测(1)同源模型化方法(2)远程同源模型化方法(3)结构的从头预测方法距离几何分子动力学 LifeScience一级序列数据库搜索同源结构序列和结构配比挑选模板蛋白模建保守区域模建环区模建侧链优化和评估LifeScienc

28、eMacromolecular structureSecondary,tertiary structure prediction3D structural alignment algorithmsProtein geometry measurementsSurface and volume shape calculationIntermolecular interactions Molecular simulationsForce-field calculationsMolecular movementsDocking predictions15,000 structures(PDB)1000

29、 atomic coordinates eachLifeScienceGenomes300 complete genomes 11.6 million sequencesCharacterization of repeatsStructural assignments to genesPhylogenetic analysisGenomic scale censuses(characterization of protein content,metabolic pathways)Linkage analysis relating specific genes to diseasesLifeSc

30、ience比较基因组学研究研究生命是从哪里起源的?生命是如何进化的?遗传密码是如何起源的?估计最小独立生活的生物至少需要多少基因,这些基因是如何使它们活起来的?比如,鼠和人的基因组大小相似,都含有约三十亿碱基对,基因的数目也类似。可是鼠和人差异确如此之大,这是为什么?同样,有的科学家估计不同人种间基因组的差别仅为 0.1%;人猿间差别约为1%。但他们表型间的差异十分显著。这又为什么?完整基因组序列的比较研究是解决这些问题的重要途径。LifeScience基于完整基因组数据的生物进化基于完整基因组数据的生物进化研究研究1、序列相似性比较。就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该

31、序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;2、序列同源性分析。是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;3、构建系统进化树。根据序列同源性分析的结果,重建反映物种间进化关系的进化树。为完成这一工作已发展了多种软件包,象PYLIP、MEGA等;4、稳定性检验。为了检验构建好的进化树的可靠性,需要进行统计可靠性检验,通常构建过程要随机地

32、进行成百上千次,只有以大概率(70以上)出现的分支点才是可靠的。通用的方法使用 Bootstrap算法,相应的软件已包括在构建系统进化树所用的软件包当中。为便于使用者查找表三给出了进化分析相关软件的因特网地址。LifeSciencePhylogeny of 23 completely sequenced Bacteria and Archaea species on the basis of 16s rRNA.LifeScienceGene expressionCorrelating expression patternsMapping expression data to sequence,

33、structural and biochemical dataLifeScience基因表达分析和调控网络研究基因表达分析和调控网络研究高通量基因转录实验技术高通量基因转录实验技术1、mRNAcDNA microarrayOligonucleotide chipRT-PCRSAGE2、protein2D-PAGELifeScienceHierarchical ClusteringLifeSciencePrincipal Component Analysis1234-4-3-2-11234-4-3-2-1LifeScienceMetabolic pathwaysPathway simulatio

34、nsMetabolic pathwaysRegulatory networkSignal cascadeProtein-protein interactionLifeScienceLifeScienceLiterature11 million citations Digital libraries for automated bibliographical serachesKnowledge databases of data from literatureLifeScience其他其他郝柏林院士:DNA序列中的分形模式,计算高频片断张春霆院士:z-curve陈润生 拼接方法基因表达数据分析和

35、调控网络研究基因芯片设计及信息处理基因芯片设计及信息处理探针设计探针设计解决杂交条件一致性问题芯片优化芯片优化提高芯片制备效率公共 数据库专用 数据库确定目标确定目标自动设计目标序列数据分析数据分析分析杂交检测结果及可靠性基因芯片 数据库图像处理图像处理数数 据据 库库 查查 询询 序序 列列 分分 析析生生 物物 信信 息息 学学 数数 据据 挖挖 掘掘杂交检测图像LifeScience四、生物信息学研究现状四、生物信息学研究现状1、研究机构2、数据库3、软件及应用4、重大成果LifeScienceLifeScienceNCBI National Center for Biotechnolo

36、gy Information(US)EBI European Bioinformatics Institute(EU)HGMP Human Genome Mapping Project Resource Centre(UK)ExPASy Expert of Protein Analysis System(Switzerland)CMBI Centre of Molecular and Biomolecule(The Netherlands)ANGIS National Genome Information Service(Australia)NIG National Institute of

37、Genetics(Japan)BIC National Bioinformatics Centre(Singapore)LifeScience北京大学生物信息中心北京大学生物信息中心 http:/http:/中国生物信息中国生物信息http:/www.biosinohttp:/www.biosino.org/.org/北京大学物理化学研究所北京大学物理化学研究所 http:/http:/北京医科大学生物医学信息北京医科大学生物医学信息 http:/http:/中国科学院微生物研究所中国科学院微生物研究所 http:/http:/天津大学生物信息中心天津大学生物信息中心 http:/http:/

38、中科院计算所智能信息处理重点实验室生物信息学研究组中科院计算所智能信息处理重点实验室生物信息学研究组http:/http:/ http:/ http:/www.embl-heidelberg.de/http:/www.ebi.ac.uk/embl/GenBank http:/www.ncbi.nlm.nih.gov/Web/Genbank/DDBJ http:/www.ddbj.nig.ac.jp/Ensembl http:/www.ensembl.org/Medline http:/www2.ncbi.nlm.nih.gov/medline/queryform.html BioMedNet

39、http:/www.BioMedN package)RCSB(结构生物信息学研究联合实验室)(结构生物信息学研究联合实验室)www.rcsb.orgPRESAGE(Collaborative resource for structural genomics 结构基因组学联合资源)http:/presage.stanford.edu/ExPASy http:/www.expasy.ch/SRS http:/srs.ebi.ac.uk:5000/Entrez http:/www3.ncbi.nlm.nih.gov/Entrez/GCG:http:/ LifeScienceDictyDb(Dicty

40、ostelium discoideum genome database Dictyostelium discoideum基因组数据库)http:/glamdring.ucsd.edu/others/dsmith/dictydb.htmlEcoCyc(Encyclopedia of E.coli genes and metabolism 大肠杆菌基因和代谢百科全书)http:/ EcoGene(Escherichia coli K12 genome database Escherichia coli K12基因组数据库)http:/bmb.med.miami.edu/EcoGene/EcoWeb

41、/F l y B a s e(D r o s o p h i l a g e n o m e d a t a b a s e 果 蝇 基 因 组 数 据 库)http:/flybase.bio.indiana.edu/http:/gin.ebi.ac.uk:7081/HIV(HIV sequence database HIV序列数据库)http:/hiv-web.lanl.gov/M a i z e D B(M a i z e g e n o m e d a t a b a s e 玉 米 基 因 组 数 据 库)http:/www.agron.missouri.edu/IMGT(ImMuno

42、GeneTics db 免疫基因标记数据库)http:/usc.fr:8104/MAIZE-2DPAGE(Maize genome 2D Electrophoresis database 玉米基因组双向电泳数据库)http:/moulon.moulon.inra.fr/imgd/Mendel(Mendel-GFDb(Plant genes families database)孟德尔植物基因家族数据库)http:/www.mendel.ac.uk MGD(Mouse genome database 小鼠基因组数据库)http:/www.informatics.jax.org/http:/mgd.

43、wehi.edu.au/mgd/http:/bioinformatics.weizmann.ac.il/mgd/http:/mgd.hgmp.mrc.ac.uk/http:/mgd.niai.affrc.go.jp/LifeScienceMIM(Online Mendelian Inheritance in Man(OMIM)人类孟德尔遗传网上数据库)http:/www.ncbi.nlm.nih.gov/omim/NRSUB(Non-redundant B.subtilis database 无冗余枯草杆菌数据库)http:/pbil.univ-lyon1.fr/nrsub/nrsub.htm

44、l SGD(Saccharomyces Genome Database 酵母基因组数据库)http:/genome-www.stanford.edu/Saccharomyces/SubtiList(Bacillus subtilis 168 genome database 枯草杆菌168基因组数据库)http:/www.pasteur.fr/Bio/SubtiList/TIGR(The bacterial database(s)of The Institute of Genome Research 基因组研究所的细菌数据库)http:/www.tigr.org/tdb/TubercuList(

45、Mycobacterium tuberculosis H37Rv genome database分支结核杆菌H37Rv基因组数据库)http:/www.pasteur.fr/Bio/TubercuList/GeneCards(GeneCards:human genes,protein and diseases 基因卡:人基因、蛋白和疾病)http:/bioinformatics.weizmann.ac.il/cards/ZFIN(Zebrafish Information Network genome database 斑马鱼信息网基因组数据库)http:/zfish.uoregon.edu/

46、ZFIN/酵母功能库http:/www.mips.biochem.mpg.de/proj/yeast/pathways/index.html LifeScienceExPASy(swiss institute of Bioinfomativcs)http:/www.isb-sib.ch/(proteomics,protein prediction)SWISS-PROT http:/www.expasy.ch/sprot-top.html PIR(Protein sequence database of the Protein Information Resource 蛋白质信息资源数据库)ht

47、tp:/pir.georgetown.edu/http:/www-nbrf.georgetown.edu/pir/GDB http:/gdbwww.gdb.org/PDB(Protein Data Bank 蛋白质结构数据库)http:/www.rcsb.org/pdb/http:/www2.ebi.ac.uk/pdb/http:/pdb.wehi.edu.au/pdb/http:/pdb.weizmann.ac.il/http:/ http:/ 蛋白质模块数据库)http:/www.blocks.fhcrc.org/D O M O(P r o t e i n D o m a i n d a

48、t a b a s e 蛋 白 质 结 构 域 数 据 库)http:/www.infobiogen.fr/gracy/domo ECO2DBASE(Escherichia coli gene-protein database(2D gel spots)大肠杆菌基因-蛋白数据库)http:/pcsf.brcf.med.umich.edu/eco2dbase/E N Z Y M E(E n z y m e s n o m e n c l a t u r e d a t a b a s e 酶 命 名 数 据 库)http:/www.expasy.ch/enzyme/GCRDb(G protein

49、-coupled receptor database G蛋白耦联受体数据库)h t t p:/w w w.g c r d b.u t h s c s a.e d u/LifeScienceHSSP(Homology-derived secondary structure of proteins database 蛋白质同源二级结构数据库)http:/www.sander.ebi.ac.uk/hssp/P f a m(P f a m p r o t e i n d o m a i n d a t a b a s e 蛋 白 质 结 构 域 数 据 库)http:/genome.wustl.edu

50、/Pfam/http:/www.sanger.ac.uk/Pfam/PRINTS(Protein Motif fingerprint database 蛋白质模式数据库)h t t p:/b i o i n f.m a n.a c.u k/b s m/d b b r o w s e r/P R I N T S/ProDom(ProDom Protein domain database 蛋白质结构域数据库)h t t p:/p r o t e i n.t o u l o u s e.i n r a.f r/p r o d o m.h t m l PROSITE(PROSITE:protein d

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(生物信息学全课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|