1、 课程名称:生物信息学 Bioinformatics 主 讲 人:刘 顺 会所在单位:生命科学与生物制药学院课前开胃甜点:打分政策:60%期末考试 30%实验 10%日常表现70%掌握内容25%熟悉内容5%理解内容60%实验技能40%实验报告50%Presentation50%Attendance目录A、生物信息学概述B、数据采集C、数据库-内容、结构和注释D、生物数据检索E、通过序列相似性标准搜索序列数据库F、多序列联配:基因和蛋白质家族G、系统发育学H、序列注释I、结构生物信息学A:生物信息学概述生物信息学的概念计算机在生物信息学中的作用生物信息学范围和实例生物信息学网站仁者见仁,智者见智
2、A1-生物信息学的概念什么是生物信息学?(一般性)生物信息学是生物信息学是生物学和和信息技术的的结合,是现代科学的又一个分支学科,结合,是现代科学的又一个分支学科,它利用计算机对大量生物数据进行分它利用计算机对大量生物数据进行分析处理。析处理。A marriage of BiologyInformationtechnology什么是生物信息学?(具体点)生物信息学把用于存储和搜索数据的生物信息学把用于存储和搜索数据的数数据库开发据库开发,与用于分析和确定大分子序列、,与用于分析和确定大分子序列、结构、表达模式和生化途径等生物数据集结构、表达模式和生化途径等生物数据集之间的关系的之间的关系的统计
3、工具和算法的开发统计工具和算法的开发结合结合在一起。在一起。生物信息学(总结)数据库算法与统计工具分析与解释生物数据的起源(一个大故事)What we do is 测序策略n逐个克隆法:对连续克隆系逐个克隆法:对连续克隆系中排定的克隆逐个进行亚克中排定的克隆逐个进行亚克隆测序并进行组装(公共领隆测序并进行组装(公共领域测序计划)域测序计划)n全基因组鸟枪法:在一定作全基因组鸟枪法:在一定作图信息基础上,绕过大片段图信息基础上,绕过大片段连续克隆系的构建而直接将连续克隆系的构建而直接将基因组分解成小片段随机测基因组分解成小片段随机测序,利用超级计算机进行组序,利用超级计算机进行组装(美国装(美国
4、Celera公司)公司)Two men we have to mentionFrancis Collins VS.J.Craig Venter全自动测序仪加速了 看看关键的两条曲线生物数据每14个月 double一次Our Contribution to HGP6/1-8/31/99NoCenterRegionSize(Mb)Actual KGenbank KrProjected Kr4/1-11/30/99Proj Accum.Mr.4/99-3/001Sanger Centre1,6,9,10,13,20,22,X85013009414200122WIBR(Clones from Wash
5、 U)837296290083Wash U2,3,4,7,11,15,18,Y90086555923007.94JGI5,16,1925068746121006.45Baylor1,2,3,X2304622616603.16Riken21,18,11q1601361955202.17IMB8,21,X50180321801.58GenoscopeMost of 14851001183001.49U.Wash(Olson)10 Beijing3p3012.512.51000.511 GTC(Smith)105051500.4512 MPIMG17,21,X6.94012400.313 GBF21
6、,reg of 96500.314 Stanford(Davis)8231370.2915 Keio2,6,8,22,213011751100.2316 U.Wash(Hood LAB)14,15267127400.17Total2671Mb4663Kr2950Kr13687Kr32.64MrOur Contribution to HGPAnother one!Our Contribution to HGPA2-计算机在生物信息学中的作用 生物信息学需要计算机快速、可靠地执行重 复任务的能力以及处理问题的能力。然而,生物信息学中涉及的许多问题仍需要专家的人工处理,同时原始数据的完整性和质量也很
7、关键。Computer-aided repetitive tasksProblem-solving powerA3-生物信息学范围和实例 使初学者理解生物信息学的基本原理,并获得相应的应用能力。具体包括生物信息学的一些关键领域:数据库使用、序列和结构分析工具、注 释工具、表达分析以及生化和分子途径分析。生物信息学实例数据库界面Genbank/EMBL/DDBJ,Medline,SwissProt,PDB,序列搜索与联配(比对)BLAST,FASTA,Clustal,MultAlin,DiAlign基因搜索Genscan,GenomeScan,GeneMark,GRAIL蛋白结构域分析与鉴定pf
8、am,BLOCKS,ProDom,基因调控元件的计算机模式识别 Gibbs Sampler,AlignACE,MEME蛋白折叠预测PredictProtein,SwissModeler系统发生学与进化(Phylogenetics and Evolution)限制酶切分析(Restriction Enzyme Analysis)序列比对(Sequence Alignment)基因表达(Gene expression)蛋白结构预测(Protein Structure Prediction)药物发现(Drug Discovery)药物发现(Drug Discovery)药物发现(Drug Disco
9、very)药靶筛选(Drug-target Screening)药靶筛选(Drug-target Screening)理性药物设计(Rational Drug Design)药物发现(Drug Discovery)A4-生物信息学网站 包括生物信息学资源、各种数据库和生物信息学分析工具的网站Five websites that all biologists should knowNCBI(The National Center for Biotechnology Information)http:/www.ncbi.nlm.nih.gov/EBI(The European Bioinformatics Institute)http:/www.ebi.ac.uk/The Canadian Bioinformatics Resourcehttp:/www.cbr.nrc.ca/SwissProt/ExPASy(Swiss Bioinformatics Resource)http:/expasy.cbr.nrc.ca/sprot/PDB(The Protein Databank)http:/www.rcsb.org/PDB/Thanks very much!