生物信息学概论-课件1.ppt

上传人(卖家):晟晟文业 文档编号:5207518 上传时间:2023-02-17 格式:PPT 页数:66 大小:4.93MB
下载 相关 举报
生物信息学概论-课件1.ppt_第1页
第1页 / 共66页
生物信息学概论-课件1.ppt_第2页
第2页 / 共66页
生物信息学概论-课件1.ppt_第3页
第3页 / 共66页
生物信息学概论-课件1.ppt_第4页
第4页 / 共66页
生物信息学概论-课件1.ppt_第5页
第5页 / 共66页
点击查看更多>>
资源描述

1、生物信息学概论 王燕参考书目:v1.J.Pevsner著(孙之荣 等译).生物信息学与功能基因 组学.化学工业出版社,2006.v2.D.R.Westhead et al.Bioinformatics.科学出版社(影印本),2003v3.蒋彦 等 基础生物信息学及应用 清华大学出版社 4.陶士珩 生物信息学 科学出版社第一章:绪第一章:绪 论论第一节第一节 引言引言 第二节第二节 生物信息学及其发展历史生物信息学及其发展历史 第三节第三节 生物信息学主要研究内容生物信息学主要研究内容 第四节第四节 生物信息学的研究意义和展望生物信息学的研究意义和展望曼哈顿原子弹计划曼哈顿原子弹计划阿波罗登月计

2、划阿波罗登月计划人类基因组计划人类基因组计划20世纪人类三大科学计划世纪人类三大科学计划 40年代美国陆军60年代美国宇航局人类人类基因组基因组计划计划(human genome project,HGP)是由是由美国美国科学家于科学家于1985年率先提出,于年率先提出,于1990年正式年正式启动的。美国、启动的。美国、英国英国、法兰西共和、法兰西共和国、国、德意志联邦共和国德意志联邦共和国、日本日本和我和我国科学家共同参与了这一价值达国科学家共同参与了这一价值达30亿美元的人类基因组计划。亿美元的人类基因组计划。生命活动三要素:物质、能量、信息生命活动三要素:物质、能量、信息 DNA:遗传物质

3、遗传物质(遗传信息的载体遗传信息的载体)双螺旋结构双螺旋结构 A,C,G,T四种基本字符的复杂文本四种基本字符的复杂文本 基因基因(Gene):具有遗传效应的:具有遗传效应的DNA分子片段分子片段 基因组基因组(Genome)(Genome):包含包含细胞或生物体细胞或生物体全套的遗传信息的全部全套的遗传信息的全部 遗传物质。遗传物质。人类基因组人类基因组:3.2109 bpHGP的目的是解码生命、了解生命的起源、了解生命体生长发育的规律、认识种属之间和个体之间存在差异的起因、认识疾病产生的机制以及长寿与衰老等生命现象、为疾病的诊治提供科学依据。HGP的意义的意义 染色体的DNA分子中含有四种

4、核苷酸,核苷酸排列顺序的不同决定了遗传信息的差异。人的生、老、病、死归根结底都与基因和染色体相关。人体基因组图谱好比是一张能说明构成每一个人体细胞脱氧核糖核酸(DNA)的30亿个碱基对精确排列的“地图”。这些碱基对以一种特殊方式排列形成人体的10万个基因,基因又成为制造蛋白和化合物的蓝图,蛋白和化合物则负责指导人体细胞和器官的形成和运作。从理论上讲,如果掌握了所有基因上核苷酸分布的详细情况,关于人类生长、发育、衰老、遗传病变的秘密都将随之揭开,科学家将拥有新的“武器”来征服癌症、艾滋病、肝炎、肺结核和阿尔茨海默氏症等。1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列

5、的意义1985 Dulbecco在Science撰文“肿瘤研究的转折点:人类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元1989 美国成立“国家人类基因组研究中心”,Watson担 第一任主任1990.10 经任美国国会批准,人类基因组计划正式启动19951995第一个自由生物体流感嗜血菌第一个自由生物体流感嗜血菌(H.infH.inf)的全基因组测序完成的全基因组测序完成1996 1996 完成人类基因组计划的遗传作图完成人类基因组计划的遗传作图 启动模式生物基因组计划启动模式生物

6、基因组计划H.inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫1997 1997 大肠杆菌大肠杆菌(E.coliE.coli)全基因组测序完成全基因组测序完成1998 1998 完成人类基因组计划的物理作图完成人类基因组计划的物理作图 开始人类基因组的大规模测序开始人类基因组的大规模测序 CeleraCelera公司加入,与公共领域竞争公司加入,与公共领域竞争 启动水稻基因组计划启动水稻基因组计划1999.7 1999.7 第第5 5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类

7、基因组测序会议,加快测序速度大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划2001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面1999.7 第5届国际公共领域人类基因组测序会议,加快测序速度2000 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基 因组的测序工作2000.6.26 公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果2001.2.16 Science刊文发表Celera公司及其合作者结果Drosophila mela

8、nogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥结果:2003年完成精细图,产生30亿多个数据(碱基)AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCA

9、TCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATG

10、ACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAG

11、CATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGA

12、CCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAG

13、TGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCA

14、TGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATADNA序列数据增长趋势各种分子生物学数据库及其增长情况v生物数据爆炸性增长:生物数据量的积累已达到人类有史以来所说过的话的数百倍,而且还将以越来越快的速度增长。2022-11-1120 生物信息学的产生诞生HGP生物数据的激增(每15个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)的诞生2022-11-1121概念(广义)生物体系和过程中信息的存贮、传递和表达细胞、

15、组织、器官的生理、病理、药理过程的中各种生物信息信息科学生命科学中的信息科 学 广义广义 应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学生命科学中的信息科学信息科学。概念(狭义)生物分子数据深层次生物学知识分子生物信息学Molecular Bioinformatics挖掘获取生物分子信息的获取、存贮、分析和利用生物分子信息的获取、存贮、分析和利用总结:生物信息学生物信息学(Bioinformatics)是一门新兴的交叉学科,是生命科学领域中的新兴学科,面对人类

16、基因组计划等各种项目所产生的庞大的分子生物学信息,生物信息学的重要性将越来越突出,它将会为生命科学的研究带来革命性的变革。生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。生物信息学是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一,其研究重点主要体现在基因组学(Genomics)和蛋白组学(Proteomics)。林华安博士:CompBio,bioinforma-tique,bio-informatics,bioinformatics“生物信息学之父”n20世纪世纪50年代,生物信息学开始孕育年代,生物信息学开始孕育n20世

17、纪世纪60年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算 生物学和计算机科学联系起来生物学和计算机科学联系起来n20世纪世纪70年代,生物信息学的真正开端年代,生物信息学的真正开端n20世纪世纪70年代到年代到80年代初期年代初期,出现了一系列著,出现了一系列著 名的序列比较方法和生物信息分析方法名的序列比较方法和生物信息分析方法 n20世纪世纪80年代以后,出现一批生物信息服务机年代以后,出现一批生物信息服务机 构和生物信息数据库构和生物信息数据库n20世纪世纪90年代后年代后,HGP促进生物信息学的迅速促进生物信息学的迅速 发展发展vNCBI National Cente

18、r for Biotechnology Information(US)vEBI European Bioinformatics Institute(EU)vHGMP Human Genome Mapping Project Resource Centre(UK)vExPASy Expert of Protein Analysis System(Switzerland)vCMBI Centre of Molecular and Biomolecule(The Netherlands)vANGIS National Genome Information Service(Australia)vNIG

19、 National Institute of Genetics(Japan)vBIC National Bioinformatics Centre(Singapore)v北京大学生物信息中心北京大学生物信息中心 http:/http:/v中国生物信息中国生物信息http:/www.biosino.org/http:/www.biosino.org/v北京大学物理化学研究所北京大学物理化学研究所 http:/http:/v北京医科大学生物医学信息北京医科大学生物医学信息 http:/http:/v中国科学院微生物研究所中国科学院微生物研究所 http:/http:/v天津大学生物信息中心天津大学

20、生物信息中心 http:/http:/v中科院计算所智能信息处理重点实验室生物信息学研究中科院计算所智能信息处理重点实验室生物信息学研究组组 http:/ http:/ 90002%1、生物分子数据的收集与管理生物分子数据的收集与管理2、数据库搜索及序列比较数据库搜索及序列比较 3、基因组序列分析基因组序列分析 4、基因表达数据的分析与处理、基因表达数据的分析与处理 5、蛋白质结构预测、蛋白质结构预测 6、生物信息学的应用、生物信息学的应用分子生物学数据库分子生物学数据库 v种类核酸序列数据库蛋白质序列数据库生物大分子数据库v特点数量:1000个通常可通过WEB进入大小:10Gb更新频率:每天

21、 每年 基因组数据库 蛋白质序列数据库 蛋白质结构数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR核酸序列数据库核酸序列数据库欧洲分子生物学实验室的EMBLvhttp:/www.embl-heidelberg.de 美国生物技术信息中心的GenBankvhttp:/www.ncbi.nlm.nih.gov/Web/Genbank/index.html 日本遗传研究所的DDBJvhttp:/www.ddbj.nig.ac.jp vPIR(Protein Information Resource)http:/www.expasy.ch/sprot/sprot-top.htm

22、l)vUNIPROT提供提供 (1)蛋白质序列)蛋白质序列 (2)蛋白质的分类、蛋白质的来源;)蛋白质的分类、蛋白质的来源;(3)关于原始数据的参考文献;)关于原始数据的参考文献;(4)蛋白质功能和蛋白质的一般特征,包括基因)蛋白质功能和蛋白质的一般特征,包括基因 表达、翻译后处理、活化等;表达、翻译后处理、活化等;(5)序列中相关的位点、功能区域)序列中相关的位点、功能区域生物大分子结构数据库生物大分子结构数据库vPDB(Protein Data Bank)http:/www.rcs.org/pdb含有通过实验(X射线晶体衍射,核磁共振NMR)测定的生物大分子(蛋白质、核酸、糖类、其他复合物

23、)的三维结构vMMDB(Molecular Modeling Database)包括来自于实验的生物大分子结构数据分子的生物学功能、产生功能的机制、分子的进化历史生物大分子三维结构模型显示、结构分析和结构比较其它生物分子数据库其它生物分子数据库v单碱基多态性数据库dbSNPhttp:/www3.ncbi.nlm.nih.gov/SNP/v蛋白质结构分类数据库SCOPhttp:/scop.mrc-lmb.cam.ac.uk/scop/v蛋白质二级结构数据库DSSPhttp:/www.sander.embl-heidelberg.de/dssp/v蛋白质同源序列比对数据库HSSPhttp:/www

24、.sander.embl-heidelberg.de/hssp/v生物学、医学文献引用数据库PubMedhttp:/www.ncbi.nlm.nih.gov/2、数据库搜索及序列比较 v搜索同源序列在一定程度上就是通过序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列寻找相似序列 v序列比较的一个基本操作就是序列比较的一个基本操作就是比对比对(Alignment),即将两个序列的各个字符),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序或者置换关系进行对比排列,其结果是两个序列共有的排列顺

25、序,这是序列相似程度的一种列共有的排列顺序,这是序列相似程度的一种定性描述定性描述v多重序列比对多重序列比对研究的是多个序列的共性。序列研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。也可用于研究一组蛋白质之间的进化关系。发现同源分子3、基因组序列分析基因组序列分析 v基因识别基因识别v基因功能注释基因功能注释v基因调控信息分析基因调控信息分析v基因组比较基因组比较基因识别基因识别 v基因识别(基因识别(gene identification)是)是HGP的重的重要内容之一,其目的是识别全部人

26、类的基因。要内容之一,其目的是识别全部人类的基因。v基因识别包括:基因识别包括:识别基因组编码区识别基因组编码区识别基因结构识别基因结构v基因识别目前常采用的有二种方法:基因识别目前常采用的有二种方法:l从基因组序列中识别那些转录表达的从基因组序列中识别那些转录表达的DNA片段片段l从从cDNA文库中挑取并克隆。文库中挑取并克隆。基因组比较v各种生物完整基因组数据的增多使我们能够基于一个整体的思路出发,对不同生物的全基因组进行比较分析,发现基因组之间的差异,揭示期间蕴含的遗传奥秘,从而使我们能从遗传本质上合理解释若干重大生物问题。v生命是如何起源的?v生命是如何进化的?v遗传密码是如何起源的?

27、v估计最小独立生活的生物最少需要多少个基因?4、基因表达数据的分析与处理v基因表达数据分析是目前生物信息学研究的基因表达数据分析是目前生物信息学研究的热热 点和重点点和重点 v目前对基因表达数据的处理主要是进行聚类分目前对基因表达数据的处理主要是进行聚类分 析,将表达模式相似的基因聚为一类,在此基析,将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能础上寻找相关基因,分析基因的功能 v所用方法主要有:所用方法主要有:相关分析方法相关分析方法模式识别技术中的层次式聚类方法模式识别技术中的层次式聚类方法人工智能中的自组织映射神经网络人工智能中的自组织映射神经网络主元分析方法主元

28、分析方法 层次式聚类层次式聚类5、蛋白质结构预测、蛋白质结构预测 v蛋白质的生物功能由蛋白质的结构所决定蛋白质的生物功能由蛋白质的结构所决定,蛋,蛋白质结构预测成为了解蛋白质功能的重要途径。白质结构预测成为了解蛋白质功能的重要途径。v蛋白质结构预测分为蛋白质结构预测分为:二级结构预测二级结构预测空间结构预测空间结构预测 蛋白质折叠蛋白质折叠二级结构预测v在一定程度上二级结构的预测可以归结为在一定程度上二级结构的预测可以归结为模式识别问题模式识别问题 v在二级结构预测方面主要方法有:在二级结构预测方面主要方法有:立体化学方法立体化学方法图论方法图论方法统计方法统计方法最邻近决策方法最邻近决策方法

29、基于规则的专家系统方法基于规则的专家系统方法分子动力学方法分子动力学方法人工神经网络方法人工神经网络方法 v预测准确率超过预测准确率超过70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统空间结构预测空间结构预测v在空间结构预测方面,比较成功的理论方法是同源模型法 v该方法的依据是:相似序列的蛋白质倾向于折叠成相似的三维空间结构 v运用同源模型方法可以完成所有蛋白质10-30%的空间结构预测工作 生物信息学与新药研制生物信息学与新药研制未来的药物研究过程将是基于生物信息知识挖掘的未来的药物研究过程将是基于生物信息知识挖掘的过程过程数据处理和数据处理和关联分析关联分析发现

30、药物发现药物作用对象作用对象确定靶目标确定靶目标分子分子针对靶目标针对靶目标进行合理的进行合理的药物设计药物设计基于生物信息学的新药设计生物信息学与疾病检测生物信息学与疾病检测v基因组计划产生的基因及基因多态性数基因组计划产生的基因及基因多态性数据与临床医学检验结果之间的关系需要据与临床医学检验结果之间的关系需要利用生物信息学的方法去分析、去揭示利用生物信息学的方法去分析、去揭示v根据这样的分析结果,科学家能够更准根据这样的分析结果,科学家能够更准确地了解疾病产生的根本原因,更精确确地了解疾病产生的根本原因,更精确地预测某个人患癌症、糖尿病或者心脏地预测某个人患癌症、糖尿病或者心脏病的可能性,

31、从而彻底改变我们诊断、病的可能性,从而彻底改变我们诊断、治疗和预防疾病的方式治疗和预防疾病的方式 Nature 408 307(2000)生物信息学研究的意义生物信息学研究的意义Isaac Newton牛 顿Johannes Kepler 开普勒Tycho Brahe 第 谷天象观测天象观测 大量数据大量数据 行星运动定律行星运动定律 万有引力定律万有引力定律 航空航天技术航空航天技术 Dmitri Mendeleev门捷列夫大量原子光谱数据 量子论 量子力学 信息技术Max Karl Ernst Ludwig Planck 普朗克Albert Einstein 爱因斯坦Niels Bohr 玻尔Erwin Schrdinger 薛定谔 基因组超大量的序列和结构数据 重大的发现 When I give talks to young scientists seeking advice about areas of future intense scientific excitement,computational biology is my number one recommendation.,Director of HGP at NIH生物信息学研究的意义生物信息学研究的意义(续):拼的是人才智力,是我国赶超世界发达国家最有希望的领域之一,是我国重点支持的方向之一。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(生物信息学概论-课件1.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|