1、一、生物信息学发展的背景二、生物信息学概念及其研究内容和特点三、生物信息学的发展现状四、生物信息学课程的特点一、生物信息学发展的背景1990年启动目标:测定人类基因组的全部DNA序 列,了解基因及其功能投入:30亿美元结果:2003年完成精细图,产生28亿多个数据(碱基)AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTG
2、CATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCAT
3、GACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATC
4、GCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTG
5、CATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGA
6、CCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACC
7、TAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATA模式生物:小鼠、线虫、拟南芥、果蝇、水稻、酵母、古细菌、真细菌、病毒 地球生物圈约有万余种物种,其中至少有一段DNA序 列被测定。真核生物 种 哺乳动物 种 真 细 菌 种 古 细 菌 种 病 毒 种DNA序列数据增长趋势2D Gel Electropho
8、resis protein expression analysisMass Spectrometry protein sequencingYeast Two-Hybrid(Y2H)System protein interaction analysisThe Yeast cDNA Microarray Picture基因表达谱数据增长趋势The number of entries in SwissProt 140,000 now!蛋白质序列数据增长情况Tertiary Structure of a ProteinThe number of entries in PDB 25,000 now蛋白质
9、结构数据增长情况各种分子生物学数据库及其增长情况 生物数据爆炸性增长:得到的结论是:生物数据量的积累已达到人类有史以来所记录的文字的数百倍,而且还将以越来越快的速度增长。16(2)更为本质的原因是生物学数据的更为本质的原因是生物学数据的复杂性急待生物信息学的分析方法。复杂性急待生物信息学的分析方法。多基因病中致病基因彼此关系和致病性分析。蛋白三维结构和基于结构预测的蛋白之间或者蛋白与药物分子的相互作用和蛋白亚细胞定位。17 生物信息学是今后所有从事现代生物学生物信息学是今后所有从事现代生物学(医药学)研究所必需的工具和相关工作(医药学)研究所必需的工具和相关工作人员需要具备的基本技能。人员需要
10、具备的基本技能。二、生物信息学概念及其研究内容和特点生物数据爆炸性增长所带来的挑战AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGA
11、CCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTG
12、CATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAA 海量数据的存储、管理、共享 数据 知识,如何将这些数据变为生物学知识?20生物信息学基本概念 早在早在1956年,在美国田纳西州盖特林堡召开的首次年,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会生物学中的信息理论研讨会”上,便产生了生物信上,便产生了生物信息息学的概念。学的概念。1987年,林华安博士正式把这一学科命名年,林华安博士正式把这一学科命名为为“生物信息学生物信息学”(Bioinformatics)。被尊称为)。被尊称为“生物生物信息学之父信息学之父”。生物信息学(
13、生物信息学(Bioinformatics):):(1)生物信息学包含了生物信息的获取、处理、储存、生物信息学包含了生物信息的获取、处理、储存、分析和解释等在内一门交叉学科,分析和解释等在内一门交叉学科,(2)它综合运用数学、计算机科学和生物学的各种工它综合运用数学、计算机科学和生物学的各种工具进行研究,具进行研究,(3)目的在于阐明大量生物学数据所包含的生物学意目的在于阐明大量生物学数据所包含的生物学意义。义。21生物信息学当前的主要研究任务生物信息学当前的主要研究任务22生物信息学当前的主要研究任务生物信息学当前的主要研究任务核苷酸多态性的研究是以发现和分析群体(包括相近亚种间)DNA顺序上
14、的差别为基础,揭示这些多态性与基因表达和基因功能的关系,基因型和表现型的内在联系。为我们绘制人类基因组单倍体图和以后绘制其他物种的遗传图谱奠定基础。23RNA水平基因表达研究的基本方法有EST、Micro-array,所产生的数据量也非常巨大。但是目前的分析方法和手段都有很多潜力可以挖掘,尤其是数学模型的建立,与基因组数据的整合,对数据真实性的评估等。生物信息学当前的主要研究任务生物信息学当前的主要研究任务24蛋白质组学:(1)蛋白质组图像数据处理,蛋白及其修饰鉴定)蛋白质组图像数据处理,蛋白及其修饰鉴定(2)构建蛋白质数据库,相关软件的开发和应用;)构建蛋白质数据库,相关软件的开发和应用;(
15、3)蛋白质结构、功能预测;)蛋白质结构、功能预测;(4)蛋白质连锁图。)蛋白质连锁图。生物信息学当前的主要研究任务生物信息学当前的主要研究任务25 代谢组学:新陈代谢是由错综复杂的生化代谢途径所构成的动态网络组成。要揭示代谢的本质是一个长期的目标。但是,我们可以从现有数据出发建立主要或特定代谢途径的模型,如影响人类健康的常见代谢疾病等。生物信息学当前的主要研究任务生物信息学当前的主要研究任务26 生物信息学研究都有其特定的、不断创新的方法学。以系统优化、软件并行化和数据处理技术为主体的海量生物学数据处理体系的建立将基于新的思路和设想。生物信息学当前的主要研究任务生物信息学当前的主要研究任务27
16、生物信息学的特点 它是一门基于数据积累,尤其是原始数据积累的科学。数据的获取是生物信息学发展的保障和本源。生物信息学研究首先也是基于实验数据的生产、管理和分析。因此,生物信息领域的首要特点是生物学基本数据收集的规模化,数据处理的程序化,数据分析的专门化。28生物信息学的特点 极强的竞争性。不仅科研对失败者来说是无情的,而且用户对失败者也是不同情的。被遗弃的算法、工具和不完整的数据库比比皆是。29生物信息学的特点 硬件:中高端的服务器和海量数据存储以及个人电脑 互联网软件包括了两大方面:算法 良好的用户界面生物信息学研究的意义生物信息学研究的意义生物信息学研究的意义生物信息学研究的意义:强调的是
17、人才智力,是我国赶超世界发达国家最有希望的领域之一,是我国重点支持的方向之一。三、生物信息学的发展现状33生物信息学的发展过程 大致经历了3个阶段:前基因组时代-生物数据库的建立、检索工具的开发、DNA和蛋白质序列分析、全局和局部的序列对位排列;3435基因组时代-基因寻找和识别、网络数据库系统的建立、交互界面的开发;36后基因组时代-大规模不同来源的组学数据分析。37 Published April 25,2008 2007 IF 4.914作者:作者:魏丽萍魏丽萍 博士博士北京大学生命科学学院生物信息中心主任,教授北京大学生命科学学院生物信息中心主任,教授蛋白质工程与植物基因工程国家重点实
18、验室蛋白质工程与植物基因工程国家重点实验室 副主任副主任于于 军军 博士博士中国科学院北京基因组研究所副所长中国科学院北京基因组研究所副所长 38 bioinformatics training programs in China.31个博士,硕士学位点个博士,硕士学位点39 从工具的角度来讲,生物信息学是今后所有从工具的角度来讲,生物信息学是今后所有生物(医药)研究开发所必需的方法和相关生物(医药)研究开发所必需的方法和相关工作人员需要具备的基本技能,所以生物信工作人员需要具备的基本技能,所以生物信息学课程的建设对于生物相关专业有重要的息学课程的建设对于生物相关专业有重要的实际意义。实际意义
19、。四、四、“生物信息学生物信息学”课程的特课程的特点点如何掌握好如何掌握好“生物信息学生物信息学”?生物、计算机、数学等多学科交叉,知识覆盖面广;涉及从基因组序列分析直到药物设计等众多内容,且应用领域宽广;生物信息数据资源与分析工具繁多,实践环节非常重要;理论方法尚不系统成熟,处于迅速发展变化阶段,知识更新快。缺乏合适的教材课程特点课程特点数学方面数学方面计算机方面计算机方面45本课程基本要求 硬件:中高端的服务器和海量数据存储以及个人电脑(电脑的熟练使用)互联网(熟练的使用)软件包括了两大方面:算法(基本了解)良好的用户界面(熟练的使用)46本课程高级要求 了解问题 掌握方法 熟悉资源 融会
20、贯通了解问题掌握方法掌握方法 数据挖掘与知识发现方法:贝叶斯方法判别分析决策树特征的选择与提取聚类方法HMM(Hidden Markov Model)方法ANN(Artificial Neural Network)方法SVM(Support Vector Machine)方法 数据库与软件的设计与开发 熟悉资源熟悉资源 数据资源数据资源分子生物学数据库数量众多(500种以上)、种类繁多基因组数据库、核酸序列数据库、蛋白质序列数据库生物大分子三维空间结构数据库特殊功能数据库、工具数据库 分析软件资源分析软件资源核酸序列分析;蛋白质序列分析;其它资源其它资源搜索引擎;电子论坛;参考书目生物信息学概
21、论Introduction to bioinformatics(英)T K Attwood,D J Parry-Smith 著 罗静初 等译北京大学出版社 2002年4月第一版生物信息学手册 郝柏林 张淑誉 编著上海科学技术出版社 2000年10月第一版生物信息学 赵国屏 等 编著 科学出版社 2002年4月 第一版 生物信息学-基因和蛋白质分析的实用指南 Bioinformatics-A Practical Guide to the Analysis of Genes and Proteins Andreas D.Baxevanis B.F.Francis Ouellette 著李衍达 孙之荣 等 译清华大学出版社 2000年8月 第一版51思考题 生物信息学的定义联系方式:电话:65201076(O:8号楼213#)Email:cheng_
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。