1、第7讲 蛋白质组学与生物信息学生物信息学 课 堂 内 容 一.蛋白质组学简介二.质谱技术基础三.质谱数据分析四.蛋白质组数据库2 生物信息学高通量大规模自动化高复杂低通量小规模人手工较简单3 四大组学-omics4相同的基因,不同的蛋白 基因与蛋白5 基因组学与蛋白质组学(Source:Science)6蛋白质组 VS 基因组(复杂性)7蛋白质的复杂性8Proteoform:描述蛋白质的复杂性9 人类蛋白质组计划Human Plasma ProteomeProject,USAHuman Disease Glycomics/Proteome Initiative(HGPI),Japan 10转录
2、组学转录组学蛋白质组学蛋白质组学代谢组学代谢组学表型组学表型组学相互作用组相互作用组 功能基因组学功能基因组学后基因组时代蛋白质组学蛋白质组学DNARNAProteinsMetabolitesProtein-DNA,Protein-RNAProtein-proteinGenomeTranscriptomeMetabolomeProteomeInteractomeAnd now for the proteome.Nature 409:747,2001Science 297:1221,2001)Proteomics in genomeland1 蛋白质组概念的提出 蛋白质组蛋白质组(proteom
3、e)一词是澳大利亚Macquarie 大学Wilkins 和Williams 在1994 年首次提出,最早见于文献是在1995 年7月Electrophoresis杂志上,是指由一个基因组,或一个细胞、组织表达的所有蛋白质。蛋白质组学(蛋白质组学(Proteomics)是研究在特定时间或环境下某个细胞或某种组织基因组表达的全部蛋白质。Wilkins2、蛋白质、蛋白质组学的研究意义组学的研究意义 蛋白质是生理功能的执行者,是生命现象的直接体现者,对蛋白质结构和功能研究将直接阐明生命在生理或病理条件下的变化机制。几乎所有的生理和病理过程,以及药物和环境因子的作用都依赖于蛋白质,并引起蛋白质的变化。
4、反之,对蛋白质组变化的分析也能提供对上述过程或结果的重要信息。蛋白质组学的研究手段也可以应用于农业研究、环境保护等多方面。蛋白质组研究不仅可实现与基因组的对接与确认,直接揭示生命活动规律和本质、人类重大疾患(病原体)致病的物质基础以及发生与发展的病理机制;而且可广泛推动生命科学基础学科以及分析、信息、材料等应用科学的发展;对提高我国生物医学原始创新能力、重大疾病防诊治能力和国民健康水平以及新药研发能力、对促进生物医药产业乃至国民经济的发展具有重大的战略意义 3、蛋白质、蛋白质组学的研究内容组学的研究内容 在蛋白质水平上定量、动态、整体地研究生物体,它旨在阐明生物体全部蛋白质的表达模式及功能模式
5、。1)组成(表达)蛋白质组学 蛋白质表达谱(组织、器官、细胞、亚细胞分布等)2)比较蛋白质组学 比较不同蛋白质组的差异与相似性;3)结构蛋白质组学 蛋白质三维结构的解析(X-ray/NMR/modelling);4)功能蛋白质组学 蛋白质的功能和相互作用;5)蛋白质组学研究的技术平台与生物信息学 分离、鉴定技术,分析软件和数据库。4、蛋白质、蛋白质组学的研究技术组学的研究技术 蛋白质分离技术 凝胶双向电泳、HPLC;蛋白质鉴定技术 Edman 测序、质谱技术;图像分析与生物信息 图像分析软件,数据库;相互作用研究技术 酵母双杂交技术、免疫共沉淀、蛋白质芯片等。5、蛋白质、蛋白质组学的发展趋势组
6、学的发展趋势基础研究方面基础研究方面 已被应用到各种生命科学领域,如细胞生物学、神经生物学等;涉及到各种重要的生物学现象,如信号转导、细胞分化、蛋白质折叠等等。在研究对象上,覆盖了原核微生物、真核微生物、植物和动物等范围;应用研究方面应用研究方面 蛋白质组学将成为寻找疾病分子标记和药物靶标最有效的方法之一。在对癌症、早老性痴呆等人类重大疾病的临床诊断和治疗方面蛋白质组技术也有十分诱人的前景,目前国际上许多大型药物公司正投入大量的人力和物力进行蛋白质组学方面的应用性研究。技术发展方面技术发展方面 蛋白质组学的研究方法将出现多种技术并存,各有优势和局限性,但难以形成比较一致的方法。除了发展新方法外
7、,更强调各种方法间的整合和互补,以适应不同蛋白质的不同特征。另外,蛋白质组学与其它学科的交叉也将日益显著和重要,蛋白质组学与其它大规模科学如基因组学,生物信息学等领域的交叉,所呈现出的系统生物学(System Biology)研究模式,将成为未来生命科学最令人激动的新前沿。人类肝脏蛋白质组的研究问题21 蛋白质组学与信息技术信息技术信息技术数据库数据库算法学算法学统计学统计学模式识别模式识别信息论信息论几何学几何学蛋白质组学蛋白质组学色谱技术色谱技术凝胶电泳凝胶电泳质谱技术质谱技术从头测序从头测序NMRNMRX-RayX-Ray22 利用串联质谱鉴定蛋白质氨基酸序列氨基酸序列VLDPNTVFA
8、L蛋白质数据库蛋白质数据库?查询?查询串联质谱图串联质谱图从头测序从头测序输入输入输出输出序列片段序列片段PNT23癌症的早期诊断问题(Source:Nature)24质谱与Biomarker发现25Biomarker 发现75001000012500150007500100001250015000C-B8D-B9E-B10C-B14D-B1502475001000012500150000123475001000012500150000123475001000012500150000123475001000012500150000247500100001250015000CCNNC26 “计算
9、蛋白质组学”Computational Proteomics:Computational Proteomics:以计算技术为主,专门研究蛋白质组学实验中产生的大以计算技术为主,专门研究蛋白质组学实验中产生的大规模数据的存储、管理、计算、分析与理解的一门蛋白规模数据的存储、管理、计算、分析与理解的一门蛋白质组学的主要分支学科。质组学的主要分支学科。Computational methods,Computational methods,algorithmsalgorithms,databasesdatabases,and,and methodologies used to methodologie
10、s used to managemanage,analyze and interpretanalyze and interpret the data produced in proteomics experiments.the data produced in proteomics experiments.27“计算蛋白质组学”的重要性1.1.人类基因组测序计划(人类基因组测序计划(HGPHGP)完成之后,自完成之后,自20012001年前年前后开始,蛋白质组学逐渐受到重视,人类蛋白质组计后开始,蛋白质组学逐渐受到重视,人类蛋白质组计划成为划成为HGPHGP之后又一重大国际合作大科学项目之后又
11、一重大国际合作大科学项目2.2.生化测试仪器技术的快速发展导致生化测试仪器技术的快速发展导致“数据泛滥、知识数据泛滥、知识困乏困乏”尴尬局面日益突出,尤其是在蛋白质组学领域尴尬局面日益突出,尤其是在蛋白质组学领域3.3.计算技术可以为在蛋白质组学中快速可靠地发现生物计算技术可以为在蛋白质组学中快速可靠地发现生物学关键知识和指导提高生物学实验的质量和效率提供学关键知识和指导提高生物学实验的质量和效率提供强大的技术方法支持强大的技术方法支持 28 由基因到蛋白人类基因组计划(人类基因组计划(HGPHGP)20032003年年4 4月宣布完成月宣布完成功能基因组学功能基因组学 蛋白质(生命功能的执行
12、者)蛋白质(生命功能的执行者)基因组转录组基因组转录组+蛋白质组蛋白质组 (中心法则中心法则)29 蛋白质组学的主要生物信息学问题1.蛋白质蛋白质(肽肽)鉴定鉴定 Protein/peptide identification2.翻译后修饰翻译后修饰 Post-translational modification3.蛋白质相互作用蛋白质相互作用 Protein-Protein Interacation4.蛋白质定位蛋白质定位 Protein Subcelluar Localization5.蛋白质功能预测蛋白质功能预测 Protein Function Prediction6.蛋白质结构预测蛋白
13、质结构预测 Protein Structure Prediction30 课 堂 内 容 一.蛋白质组学简介二.质谱技术基础三.质谱数据分析四.蛋白质组数据库3132Left:An LTQ mass spectrometer(image from University of Vermont)Right:A high-end Fourier Transform mass spectrometer(image from Pacific Northwest National Labs)33 质谱技术Mass Spectrometry:Mass Spectrometry:一种检测带电荷分子的质量的技术
14、。一种检测带电荷分子的质量的技术。是农药残留、石油成分、兴奋剂等应用非常广泛的检是农药残留、石油成分、兴奋剂等应用非常广泛的检测领域中的核心技术测领域中的核心技术蛋白质组学中是蛋白质鉴定的最主要技术蛋白质组学中是蛋白质鉴定的最主要技术特点:应用广泛,在蛋白质组学的质谱数据复杂、通量特点:应用广泛,在蛋白质组学的质谱数据复杂、通量高、规模大、分析难度高,更依赖于计算技术高、规模大、分析难度高,更依赖于计算技术34质谱技术在蛋白质组学中的地位1.1.质谱技术是鉴定蛋白质的最主要技术质谱技术是鉴定蛋白质的最主要技术2.2.质谱数据是蛋白质组学中最丰富的信息源质谱数据是蛋白质组学中最丰富的信息源3.3
15、.质谱技术与蛋白质鉴定是蛋白质组计划中启动最早,质谱技术与蛋白质鉴定是蛋白质组计划中启动最早,也是相对研究基础较强的方向也是相对研究基础较强的方向35质谱仪的组成36 质谱仪的组成与结构37IonizerSample+_Mass AnalyzerDetector MALDI Electro-SprayIonization(ESI)Time-Of-Flight(TOF)Quadrapole Ion-Trap ElectronMultiplier(EM)质谱仪的三大构件38 MALDIMALDI:Matrix-Assisted Laser Desorption and Ionization39El
16、ectrospray(ESI)40for the development of methods for identification and structure analyses of biological macromolecules for their development of soft desorption ionisation methods for mass spectrometric analyses of biological macromolecules NMRJohn B.Fenn Koichi Tanaka ESIMALDIb.1959 b.1917 2002年诺贝尔化
17、学奖4142 Time of Flight(TOF)43 Quadrupole Mass Filter44Fourier transform ion cyclotron resonance mass spectrometryAnalyst(2005)130,1828 FT-ICR45FT-ICR-MSAnalyst(2005)130,182846 Orbitrap47zmk/w=oscillation frequency k=instrumental const.m/z=.what we want!Orbitrap48 Orbitrap49 课 堂 内 容 一.蛋白质组学简介二.质谱技术基础三
18、.质谱数据分析四.蛋白质组数据库5051 Ion Trap(LCQ,LTQ)5253 一个应用示例54 恐龙胶原蛋白的质谱图55 第二个应用示例56 第三个应用示例57Primary Structure No.in UniProtKB58 一张串联质谱59What is a Protein?60The Structure of Protein61Primary Structure in a Database62Primary Structure No.in UniProtKB63Amino Acid Structure64Amino Acid Structure65Amino Acid66Am
19、ino Acid67Amino Acid Structure686970http:/www.proteomecenter.org/course/2005.jan.eng.pdf71Single Stage MShttp:/www.proteomecenter.org/course/2005.jan.eng.pdf72Tandem MShttp:/www.proteomecenter.org/course/2005.jan.eng.pdf73 Tandem MS74CID(Collision-Induced Dissociation)75Fragmenting a Peptidehttp:/ww
20、w.proteomecenter.org/course/2005.jan.eng.pdf76http:/www.proteomecenter.org/course/2005.jan.eng.pdf77串联质谱图78Edman degradationPeptide Sequencing79Bottom-up Proteomics2-D gelWash,in-gel digest with trypsinExcise spotRT:0.02-60.1251015202530354045505560Time(min)05101520253035404550556065707580859095100R
21、elative Abundance33.3734.0035.0937.4041.9137.805.8243.6438.214.8230.546.7740.3047.2147.4946.1329.413.968.9210.4958.9348.5450.8557.312.2953.4928.8619.1327.0811.8412.93NL:5.09E6Base Peak F:+c Full ms 400.00-2000.00搜索数据库蛋白质鉴定结果:KFDFDSFTFJYMKOJDFGFDDTGIPDGFAGFFGHYAQGGITFRHEW肽鉴定结果:IPDGFAGAQGGITFRDe novo搜
22、索数据库80Gel Electrophoresis81Peptide Mass Fingerprint82MSm/z Single Stage MS83Precursor selectionm/zm/z Tandem MS84Precursor selection+collision induced dissociation(CID)MS/MSm/zm/z Tandem MS85Tandem Mass Spectrum86 利用串联质谱鉴定蛋白质氨基酸序列氨基酸序列VLDPNTVFAL蛋白质数据库蛋白质数据库?查询?查询串联质谱图串联质谱图从头测序从头测序输入输入输出输出序列片段序列片段PNT
23、87Database Searching88De Novo Sequencing89Proteins Identified90 课 堂 内 容 一.蛋白质组学简介二.质谱技术基础三.质谱数据分析四.蛋白质组数据库91蛋白质组数据库 1.GELBANK 网址:http:/gelbank.anl.gov 简介:提供全基因组的二维凝胶电泳图谱,搜集了已知基因组信息生物的蛋白质组二维凝胶电泳图。可通过描述相对分子质量、等电点和蛋白质序列信息进行快速检索。2.SWISS-2DPAGE 网址:http:/www.expasy.org/ch2d/简介:提供人类、小鼠、大肠杆菌、酿酒酵母、盘基网柄菌的2D-P
24、AGE参考图。3.SysPIMP(Systematical Platform for Identifying Mutated Proteins)网址:http:/pimp.starflr.info/简介:通过质谱技术建立的蛋白质突变数据库。当蛋白质某一氨基酸残基发生改变时,其质谱图也会发生改变,通过蛋白质质谱图的改变,检测与疾病相关的突变。4.Sys-BodyFluid 网址:http:/www.biosino.org/bodyfluid/简介:人体体液蛋白组研究数据库。提供人体各种体液 的蛋白质组数据,包括血浆/血清、尿液、乳汁、泪、汗液、唾液、骨髓液、脑脊液、胃液等。5.BloodExpr
25、ess 网址:http:/hscl.cimr.cam.ac.uk/bloodexpress/简介:小鼠造血过程基因表达数据库工具软件 蛋白质蛋白质2D-PAGE图谱分析软件图谱分析软件 已有多种软件可自动迅速完成2D-PAGE图像,进行斑点检查与量化、背景过滤、图像匹配与比较及统计分析等,常用的有如BIORAD公司开发的PDQuest,Amersham Pharmacia Biotech开发的Im-ageMaster 2-DElite。Genomic Solutions开发的Biol-mage-2D Investigator等。蛋白质鉴定软件蛋白质鉴定软件 蛋白质的鉴定需要把实验室得到数据,通
26、过相关算法与程序,进行已知蛋白质数据库的搜索比对来完成。依据提交的信息类型可分为氨基酸组分比对、肽片段质量比对和部分肽段序列比对三类,常见的有SEQUEST,Aacomp ldent l peptide Search、Mascot,peptident、MS-Fit和Muhildent等。蛋白质结构和功能预测软件蛋白质结构和功能预测软件,如Findmod等。作业与问题94作业作业题题1.蛋蛋白质组与基因组数据分析有什么异同点白质组与基因组数据分析有什么异同点?2.质谱仪的功能与基本原理是什么质谱仪的功能与基本原理是什么?3.蛋白质鉴定的基本方法是什么蛋白质鉴定的基本方法是什么?4.蛋白质组常用数据库有哪些?蛋白质组常用数据库有哪些?5.谈谈蛋白质组的应用和研究意义。谈谈蛋白质组的应用和研究意义。
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。