1、植物代谢组学及其应用植物代谢组学及其应用河南农业大学生命科学学院赵会杰第1页,共42页。目 录一、植物代谢组学的概念和意义一、植物代谢组学的概念和意义二、代谢组学在系统生物学中的地位二、代谢组学在系统生物学中的地位三、植物代谢组学的研究方法三、植物代谢组学的研究方法四、代谢组学在植物科学中的应用四、代谢组学在植物科学中的应用五、展望五、展望第2页,共42页。一、植物代谢组学的概念和意义一、植物代谢组学的概念和意义1、概念、概念生物学中生物学中“组组”的概念:的概念:“组组”:来源于希腊语:来源于希腊语ome,意指每个、所有、全部。,意指每个、所有、全部。以它为后缀最先用于基因组:以它为后缀最先
2、用于基因组:genome,指一个物种的指一个物种的全部遗传组成。全部遗传组成。自基因组学概念提出后,带组学(自基因组学概念提出后,带组学(omics)的概念出的概念出现有现有200多种。如蛋白组学、代谢组学等。多种。如蛋白组学、代谢组学等。第3页,共42页。近年来近年来,随着生命科学研究的发展随着生命科学研究的发展,尤其是完成拟南尤其是完成拟南芥芥(Arabidopsis thaliana)和水稻(和水稻(Oryza sativa)等植等植物的基因组测序后物的基因组测序后,植物科学发生了翻天覆地的变化。植物科学发生了翻天覆地的变化。有人说生命科学研究跨入了后基因组时代。有人说生命科学研究跨入了
3、后基因组时代。人们已经把目光从基因的测序转移到了基因的功人们已经把目光从基因的测序转移到了基因的功能研究。在研究能研究。在研究DNA的基因组学、的基因组学、mRNA的转录组学的转录组学和蛋白质的蛋白组学后和蛋白质的蛋白组学后,接踵而来的是研究代谢物的代接踵而来的是研究代谢物的代谢组学。谢组学。第4页,共42页。代谢组:代谢组:是指细胞或者生物体内的所有代谢物的总和,也有人将它定义为细胞、组织、器官或者生物体内的所有小分子代谢组分的集合。代谢组学:代谢组学:通过大量代谢成分的定性、定量分析来定义生物体的生化表型(代谢表型)及其与基因型的关系,从而为研究基因功能、诠释生命现象提供大量的代谢信息,这
4、就是代谢组学(metabolomics)。第5页,共42页。2、意义、意义 通过研究不同物种的代谢产物通过研究不同物种的代谢产物,可以指导植物分类可以指导植物分类学学,对植物进行更加合理的分类对植物进行更加合理的分类;通过研究不同基因型植物的代谢物通过研究不同基因型植物的代谢物,可以发现新的功能基可以发现新的功能基因因,促进转基因植物的研究促进转基因植物的研究,同时还可以对转基因植物及其在同时还可以对转基因植物及其在食用方面的安全性进行代谢物组学水平上的评估食用方面的安全性进行代谢物组学水平上的评估;通过研究不同生态环境下植物的代谢产物通过研究不同生态环境下植物的代谢产物,了解植物的了解植物的
5、区域性分布。如果所研究的植物是某种药用植物区域性分布。如果所研究的植物是某种药用植物,则就可以则就可以应用于中药道地药材的确定应用于中药道地药材的确定;植物在受到某种内部或外界因素刺激之后会产生的特植物在受到某种内部或外界因素刺激之后会产生的特定的应激变化定的应激变化,最终会表现在代谢物的改变上最终会表现在代谢物的改变上,通过研究这通过研究这种变化规律种变化规律,为从植物中定向培养得到某一特定代谢物提供为从植物中定向培养得到某一特定代谢物提供指导。指导。第6页,共42页。20 20世纪末到本世纪初,大规模的基因组测序工作产世纪末到本世纪初,大规模的基因组测序工作产生了海量数据。但仅仅是依赖生了
6、海量数据。但仅仅是依赖DNADNA序列我们能够得到的信序列我们能够得到的信息还是有限的,科学家迫切希望在整体水平上了解基因息还是有限的,科学家迫切希望在整体水平上了解基因表达的特征和基因所编码的产物的功能。因此,表达的特征和基因所编码的产物的功能。因此,“功功能基因组学能基因组学(functional genomics)”(functional genomics)”的研究逐渐兴起。的研究逐渐兴起。它是通过大规模地分析细胞内转录水平它是通过大规模地分析细胞内转录水平(转录组转录组)和蛋白和蛋白质水平质水平(蛋白质组蛋白质组)上的变化,进而推测基因功能,这就上的变化,进而推测基因功能,这就开启了开
7、启了“功能基因组学功能基因组学”的研究。的研究。二、代谢组学在系统生物学中的地位二、代谢组学在系统生物学中的地位第7页,共42页。然而,转录组和蛋白质组不一定能很好地预测基因的功能。尽然而,转录组和蛋白质组不一定能很好地预测基因的功能。尽管转录组携带了细胞内蛋白质合成的密码子,但是管转录组携带了细胞内蛋白质合成的密码子,但是mRNAmRNA水平上的增水平上的增加与蛋白质水平的增加并不一致,况且蛋白质合成后的各种修饰往加与蛋白质水平的增加并不一致,况且蛋白质合成后的各种修饰往往带来活性的改变。考虑到这些因素,仅凭转录组或者蛋白质组的往带来活性的改变。考虑到这些因素,仅凭转录组或者蛋白质组的改变不
8、一定能够准确预测生化表型改变不一定能够准确预测生化表型(代谢物代谢物)的改变。的改变。另外,在建立转录谱和蛋白谱的时候,要鉴定一种另外,在建立转录谱和蛋白谱的时候,要鉴定一种mRNAmRNA或者蛋或者蛋白质,现代的技术手段主要是通过序列相似性比对和与数据库的匹白质,现代的技术手段主要是通过序列相似性比对和与数据库的匹配来确定的,这样的鉴定主要依赖于匹配度,因此不是直接的。由配来确定的,这样的鉴定主要依赖于匹配度,因此不是直接的。由于现有数据库信息的缺乏,转录组和蛋白质组也就只能提供有限的于现有数据库信息的缺乏,转录组和蛋白质组也就只能提供有限的信息。信息。代谢组可以在代谢物的基础上来区分表型;
9、不论是可见的还是代谢组可以在代谢物的基础上来区分表型;不论是可见的还是不可见的表型,用代谢物来区分可能是更无偏见的,至少是提供了不可见的表型,用代谢物来区分可能是更无偏见的,至少是提供了代谢水平上的证据。而且,在那些由突变体或者转基因造成的可以代谢水平上的证据。而且,在那些由突变体或者转基因造成的可以测量的表型变化的实例中,代谢组的方法可以被用来阐明造成这种测量的表型变化的实例中,代谢组的方法可以被用来阐明造成这种可见表型的生化原因或者结果。可见表型的生化原因或者结果。第8页,共42页。因此,以因此,以DNADNA、mRNAmRNA、蛋白质和代谢物为研究对象的基因组学、蛋白质和代谢物为研究对象
10、的基因组学、转录组学、蛋白质组学和代谢组学是一个密切相关的整体,他们共同转录组学、蛋白质组学和代谢组学是一个密切相关的整体,他们共同构成系统生物学(构成系统生物学(systems biology)systems biology)。基因组、转录组、蛋白质组和代谢组的关系基因组、转录组、蛋白质组和代谢组的关系第9页,共42页。系统生物学研究的四个层次系统生物学研究的四个层次第10页,共42页。代谢组学研究技术步骤代谢组学研究技术步骤三、植物代谢组学的研究方法三、植物代谢组学的研究方法植物材料培养植物材料培养数据分析与解释数据分析与解释样品制备样品制备成分分析与鉴定成分分析与鉴定第11页,共42页。
11、1、植物培养(栽培)、植物培养(栽培)对研究对象进行培育的目的是为了对样本的稳对研究对象进行培育的目的是为了对样本的稳定性进行控制定性进行控制,相对于微生物和动物而言相对于微生物和动物而言,植物的植物的人工栽培需要考虑更多的问题人工栽培需要考虑更多的问题,如中药材在不同年龄、如中药材在不同年龄、不同发育阶段、不同部位以及光照、水肥、耕作等不同发育阶段、不同部位以及光照、水肥、耕作等环境因素的微小差异都可引起生理状态的变化环境因素的微小差异都可引起生理状态的变化,而这而这些非可控及可控双重因素的影响很难进行精确的控些非可控及可控双重因素的影响很难进行精确的控制制,从而影响药用植物代谢组研究的重复
12、性。为了解从而影响药用植物代谢组研究的重复性。为了解决以上问题决以上问题,推荐使用大容量的培养箱推荐使用大容量的培养箱,定时更换定时更换培养箱中栽培对象的位置培养箱中栽培对象的位置,以及使用无土栽培技术等以及使用无土栽培技术等,利用无土栽培系统将水和养分直接引入植物根部利用无土栽培系统将水和养分直接引入植物根部,并并且对供给量进行精确地控制且对供给量进行精确地控制,大大提高了实验的重大大提高了实验的重复性。复性。第12页,共42页。植物代谢物样品制备分为组织取样匀浆抽提保存样品预处理等步骤。代谢产物通常用水或有机溶剂(如甲醇和己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性的亲脂相
13、和极性相分开。分析之前,通常先用固相微萃取、固相萃取和亲和色谱等方法进行预处理。然而植物代谢物千差万别,其中很多物质稍受干扰结构就会发生改变,且对其分析鉴定所采用的设备也不同。目前还没有适合所有代谢物的抽提方法,通常只能根据所要分析的代谢物特性及使用的鉴定手段选择合适的提取方法。而抽提时间、温度、溶剂成分和质量及实验者的技巧等诸多因素也将影响样品制备的水平。2、样品制备、样品制备第13页,共42页。对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤键步骤,也是最困难和多变的步骤。也是最困难和多变的步骤。与原有的各种组学技术只分析特
14、定类型的物质不同与原有的各种组学技术只分析特定类型的物质不同,代谢组学分析对代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大理化学参数差异很大,要对它们进行无偏向的全面分析要对它们进行无偏向的全面分析,单一的分离分析手单一的分离分析手段往往难以保证。色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸段往往难以保证。色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用
15、于代谢组学的研究。一般根据样品的特性和实验目的代谢组学的研究。一般根据样品的特性和实验目的,可选择最合适的分析可选择最合适的分析方法。方法。目前最常用的分离分析手段:目前最常用的分离分析手段:气相色谱和质谱联用气相色谱和质谱联用(GC/MS)(GC/MS)液相色谱和质谱联用液相色谱和质谱联用(LC/MS)(LC/MS)毛细管电泳质谱联用技术毛细管电泳质谱联用技术(CE/MS)(CE/MS)核磁共振核磁共振(NMR)(NMR)傅里叶变换红外光谱与质谱联用傅里叶变换红外光谱与质谱联用(FTIR/MS)(FTIR/MS)。3 3、成分分析鉴定、成分分析鉴定第14页,共42页。(1)气相色谱和质谱联用
16、气相色谱和质谱联用(GC/MS)液相色谱和质谱联用液相色谱和质谱联用(LC/MS)色谱是最常用和有效的分离分析工具色谱是最常用和有效的分离分析工具,其与质谱的联用则其与质谱的联用则可以完成从成分分离到鉴定的一整套工作。可以完成从成分分离到鉴定的一整套工作。GC/MSGC/MS和和LC/MSLC/MS可可以同时检测出数百种化合物以同时检测出数百种化合物,包括糖类、有机酸、氨基酸、脂包括糖类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物。肪酸和大量不同的次生代谢物。GC/MS GC/MS有很好的分离效率且相对较为经济有很好的分离效率且相对较为经济,但需要对但需要对样品进行衍生化预处理样品进行衍生化
17、预处理,这一步骤会耗费额外的时间这一步骤会耗费额外的时间,甚甚至引起样品的变化。受此限制至引起样品的变化。受此限制,GC/MS,GC/MS无法分析膜脂等热无法分析膜脂等热不稳定性的物质和分子量较大的代谢产物。不稳定性的物质和分子量较大的代谢产物。第15页,共42页。For example:Roessner等等(2000,2001)利用利用GC/MS对马铃薯对马铃薯进行高通量代谢物分析进行高通量代谢物分析,同时检测到同时检测到150种化合物种化合物,其中其中77种被鉴定为氨基酸、有机酸或糖。种被鉴定为氨基酸、有机酸或糖。利用利用GC/MS进行代谢组学研究的代表性工作进行代谢组学研究的代表性工作是
18、是Fiehn等等(2000)的一系列有关植物代谢的研究。的一系列有关植物代谢的研究。他们用他们用GC/MS对模式植物拟南芥的叶子提取物对模式植物拟南芥的叶子提取物进行了研究进行了研究,定量分析了定量分析了326个化合物个化合物,并确定了并确定了其中部分化合物的结构。其中部分化合物的结构。第16页,共42页。LC/MS LC/MS中目前应用较广的是高效液相色谱和质中目前应用较广的是高效液相色谱和质谱联用谱联用(HPLC/MS)(HPLC/MS)。HPLCHPLC与与GCGC原理相似原理相似,但在进样但在进样前不需进行衍生化处理前不需进行衍生化处理,适合那些不稳定、不易衍适合那些不稳定、不易衍生化
19、、不易挥发和分子量较大的化合物。生化、不易挥发和分子量较大的化合物。HPLC/MSHPLC/MS选择性和灵敏度都较好选择性和灵敏度都较好,但分析的时间相对较长但分析的时间相对较长,且需依赖纯的参照物。且需依赖纯的参照物。Fiehn(2003)Fiehn(2003)利用利用HPLC/MSHPLC/MS检测笋瓜检测笋瓜(Cucurbitamaxima Gelber Zentner)Cucurbitamaxima Gelber Zentner)叶柄和叶片抽叶柄和叶片抽提物提物,检测到了超过检测到了超过400400种代谢物种代谢物,有有9090种被定性种被定性,其中其中大部分是氨基酸、糖和糖苷。大部分
20、是氨基酸、糖和糖苷。Huhman Huhman和和Sumner(2002)Sumner(2002)在紫花苜蓿和蒺藜状苜在紫花苜蓿和蒺藜状苜蓿中各鉴定出蓿中各鉴定出1515个和个和2727个皂角甙个皂角甙,并在紫花苜蓿中找并在紫花苜蓿中找到了到了2 2个新的乙二酸皂角甙。个新的乙二酸皂角甙。第17页,共42页。(2)毛细管电泳质谱联用技术)毛细管电泳质谱联用技术(CE/MS)CE/MS CE/MS分离样品效率比普通的色谱质谱联分离样品效率比普通的色谱质谱联用要高得多用要高得多,更为便利的是其耗时很短更为便利的是其耗时很短,往往往往在在1010分钟内就能完成一个样品的分析过程。分钟内就能完成一个样
21、品的分析过程。Tolstikov Tolstikov等等(2003)(2003)用用CE/MSCE/MS对拟南芥进行对拟南芥进行代谢组分析代谢组分析,分离效果远远超过了分离效果远远超过了FiehnFiehn等用等用GC/MSGC/MS进行的先期工作进行的先期工作,检测到超过检测到超过700700个不同的个不同的色谱峰值色谱峰值,其中包括许多以前未检测到的脂类化其中包括许多以前未检测到的脂类化合物及次生代谢物。合物及次生代谢物。第18页,共42页。(3)核磁共振)核磁共振 在代谢组学领域在代谢组学领域,核磁共振最初被用于病理生理学和药核磁共振最初被用于病理生理学和药理毒理学方面,但目前也已被广泛
22、用于植物代谢组学研究。理毒理学方面,但目前也已被广泛用于植物代谢组学研究。其优点是:其优点是:A.A.不同于质谱具有离子化程度和基质干扰等问题不同于质谱具有离子化程度和基质干扰等问题,NMR,NMR没没有偏向性有偏向性,对所有化合物的灵敏度是一样的。对所有化合物的灵敏度是一样的。B.B.NMRNMR无损伤性无损伤性,不破坏样品的结构和性质不破坏样品的结构和性质,可在接近生理可在接近生理条件下进行实验条件下进行实验,可在一定的温度和缓冲液范围内选择实验条可在一定的温度和缓冲液范围内选择实验条件件,可以进行实时和动态的检测。可以进行实时和动态的检测。C.C.NMRNMR氢谱的谱峰与样品中各化合物的
23、氢原子是一一对氢谱的谱峰与样品中各化合物的氢原子是一一对应的应的,所测样品中的每一个氢原子在图谱中都有其相关的谱所测样品中的每一个氢原子在图谱中都有其相关的谱峰峰,图谱中信号的相对强弱反映样品中各组分的相对含量图谱中信号的相对强弱反映样品中各组分的相对含量,更为直观。更为直观。因此因此,NMR,NMR方法很适合研究代谢产物中的复杂成分。方法很适合研究代谢产物中的复杂成分。第19页,共42页。Examples:Examples:Ward Ward等等(2003)(2003)用用1 1H-NMRH-NMR对多种不同生态型的拟南芥进行了对多种不同生态型的拟南芥进行了代谢组分析代谢组分析,在碳水化合物
24、和脂肪族物质中都发现了差异在碳水化合物和脂肪族物质中都发现了差异,说明了说明了植物代谢物和生态型差异的相关性。植物代谢物和生态型差异的相关性。Hyung-Kyoon Hyung-Kyoon等等(2004)(2004)用用1 1H-NMRH-NMR对野生型和过表达水杨对野生型和过表达水杨酸合成基因的转基因烟草酸合成基因的转基因烟草(Nicotiana tabacumNicotiana tabacum)的叶片和叶脉的叶片和叶脉进行了研究进行了研究,通过进行通过进行TMVTMV嫁接和对照实验嫁接和对照实验,得到多个峰值变化得到多个峰值变化,大部分峰被鉴定为氯原酸、苹果酸和糖。此实验提供了一种有大部分
25、峰被鉴定为氯原酸、苹果酸和糖。此实验提供了一种有效的不需过多步预处理程序的区分野生型和转基因植物的方法。效的不需过多步预处理程序的区分野生型和转基因植物的方法。NMRNMR也有其缺点也有其缺点:与与GC/MSGC/MS和和LC/MSLC/MS相比相比,NMR,NMR的缺点是灵敏度低的缺点是灵敏度低,有可能形成有可能形成信号重叠信号重叠,且其对样品制备的要求很高。且其对样品制备的要求很高。因为动态范围有限因为动态范围有限,很难同时测定生物体系中共存的很难同时测定生物体系中共存的浓度相差较大的代谢产物。浓度相差较大的代谢产物。第20页,共42页。(4)傅里叶变换红外光谱)傅里叶变换红外光谱-质谱联
26、用质谱联用FTIR/MS FTIR FTIR主要测定样品中各成分的功能基团和高极性键的振动主要测定样品中各成分的功能基团和高极性键的振动,而特定的化学结构有特定的吸收频率而特定的化学结构有特定的吸收频率,通过测定实验样品的红通过测定实验样品的红外吸收频率和强度外吸收频率和强度,可以辨别出各个成分。可以辨别出各个成分。FTIRFTIR优点:优点:扫描速度快、光通量大、高分辨率、高信噪比及测扫描速度快、光通量大、高分辨率、高信噪比及测定光谱范围宽。定光谱范围宽。FTIRFTIR缺点:缺点:不可区分异构物不可区分异构物,且组分片段和一些络合离子也对且组分片段和一些络合离子也对其有影响其有影响,由于离
27、子抑制不能进行定量分析。由于离子抑制不能进行定量分析。第21页,共42页。ExamplesExamples:Aharoni Aharoni等等(2002)(2002)利用高分辨率的利用高分辨率的FTIR/MSFTIR/MS联用仪联用仪器对凤梨草莓器对凤梨草莓(Fragaria ananassa)(Fragaria ananassa)组织进行了分析组织进行了分析,依据不同的质荷比找到了依据不同的质荷比找到了5 8445 844个不同质量的物质个不同质量的物质,并并根据对化合物中高含量的元素的精确质量测定估计了根据对化合物中高含量的元素的精确质量测定估计了其中一半以上物质的化学结构式。其中一半以上
28、物质的化学结构式。结果表明结果表明,在草莓的不同组织中都含有多种类的在草莓的不同组织中都含有多种类的初生代谢物初生代谢物(如氨基酸、脂肪酸和碳水化合物如氨基酸、脂肪酸和碳水化合物)及次及次生代谢物生代谢物(如类黄酮和萜类化合物如类黄酮和萜类化合物)。第22页,共42页。4 4、数据分析与解释、数据分析与解释 样品成分分析鉴定之后样品成分分析鉴定之后,需要对所获得的数据进行需要对所获得的数据进行相应的整合处理相应的整合处理,这也是代谢组学研究中十分关键的步骤。这也是代谢组学研究中十分关键的步骤。应用高通量的检测分析工具可以得到海量的数据应用高通量的检测分析工具可以得到海量的数据,如果不如果不对其
29、进行合理的处理对其进行合理的处理,这些纷扰的数据反而对研究工作是这些纷扰的数据反而对研究工作是有害无利的。可应用模式识别和多维统计分析等方法从有害无利的。可应用模式识别和多维统计分析等方法从这些大量的数据中获得有用的信息这些大量的数据中获得有用的信息,这些方法能够为数据这些方法能够为数据降维降维,使它们更易于可视化和分类。使它们更易于可视化和分类。目前数据分析常用的方法有两类:目前数据分析常用的方法有两类:非监督方法非监督方法(unsupervised(unsupervised method)method)有监督方法有监督方法(supervised method)(supervised met
30、hod)第23页,共42页。(1 1)非监督(学习)方法)非监督(学习)方法 非监督方法是用来探索完全未知的数据特征非监督方法是用来探索完全未知的数据特征的方法的方法,对原始数据信息依据样本特性进行归类对原始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里把具有相似特征的目标数据归在同源的类里,并采并采用相应的可视化技术直观地表达出来。用相应的可视化技术直观地表达出来。应用在此领域的常见方法有应用在此领域的常见方法有:聚类分析聚类分析(cluster analysis)(cluster analysis)主成分分析主成分分析(principal components(pri
31、ncipal components analysis,PCA)analysis,PCA)第24页,共42页。聚类分析:依据依据物以类聚物以类聚的原理分析具有相似性的事物的原理分析具有相似性的事物,将分类对象置于一个将分类对象置于一个多维空间中多维空间中,根据事物彼此不同的属性进行辨认根据事物彼此不同的属性进行辨认,将性质相近的归入一将性质相近的归入一类类,这样归在同一类的事物具有高度的相似性这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按聚类分析就是把事物按其相似程度进行分类其相似程度进行分类,并找出每一类事物共同特征的分析工具。并找出每一类事物共同特征的分析工具。具体到代谢组学中具
32、体到代谢组学中,被归入一类的物质有相同的特征被归入一类的物质有相同的特征,可能可能有相同的功能作用有相同的功能作用,这样通过同一类事物中一个研究较为清晰的这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用。物质可以推断该类中其他物质的功能作用。聚类分析过程通常可分为以下步骤聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量数据收集并且收集相应的变量产生一个相似矩阵产生一个相似矩阵决定把目标总决定把目标总体细分为几类体细分为几类对每一种类别相应的定义对每一种类别相应的定义实施聚类分析实施聚类分析产生结产生结果。果。第25页,共42页。主成分分析(PCA):PCAP
33、CA是目前应用最为广泛的多维分析方法之一。其特点是目前应用最为广泛的多维分析方法之一。其特点是将分散在一组变量上的信息集中到某几个综合指标是将分散在一组变量上的信息集中到某几个综合指标,即即主成分主成分(principal component,PC)(principal component,PC)上上,利用这些主成分来利用这些主成分来描述数据集内部结构描述数据集内部结构,实际上也起着数据降维的作用。实际上也起着数据降维的作用。主成分是由原始变量按一定的权重经线性组合而成的主成分是由原始变量按一定的权重经线性组合而成的新变量。这些变量具有以下性质新变量。这些变量具有以下性质:每一个每一个PCPC
34、之间都是正交的之间都是正交的;第第1 1个个PCPC包含了数据集的绝大部分方差包含了数据集的绝大部分方差,第第2 2个次之个次之,依依此类推。此类推。这样这样,由头由头2 2个或个或3 3个个PCPC作图作图,就能够很好地代表数据集所就能够很好地代表数据集所包含的生物化学变化。包含的生物化学变化。第26页,共42页。如果存在一些有关数据的先验消息和假设如果存在一些有关数据的先验消息和假设,有监督方法有监督方法比非监督方法更适合且更有效。比非监督方法更适合且更有效。有监督方法在已有知识的基础上建立信息组有监督方法在已有知识的基础上建立信息组(class(class information),in
35、formation),并利用所建立的组对未知数据进行辨识、并利用所建立的组对未知数据进行辨识、归类和预测。归类和预测。在这类方法中在这类方法中,由于建立模型时有可供学习利用的训由于建立模型时有可供学习利用的训练样本练样本,所以称为有监督学习。所以称为有监督学习。应用于该领域的常见方法有:应用于该领域的常见方法有:线性判别分析线性判别分析(linear discrimination analysis)(linear discrimination analysis)偏最小二乘法偏最小二乘法-显著性分析显著性分析(PLS-discrimination analysis)PLS-discriminat
36、ion analysis)人工神经元网络人工神经元网络(artificial neural networksANN(artificial neural networksANN)(2 2)有监督(学习)方法)有监督(学习)方法第27页,共42页。(3)(3)网上数据库网上数据库 在信息时代在信息时代,利用网络资源进行研究是必不可少的。而对千利用网络资源进行研究是必不可少的。而对千头万绪的植物代谢物研究头万绪的植物代谢物研究,建立相应的网上数据库也是势在必行建立相应的网上数据库也是势在必行的。这些数据库的建立也有利于联结代谢组学与其他系统生物学的。这些数据库的建立也有利于联结代谢组学与其他系统生物
37、学分支的关系分支的关系.目前目前,最为成熟的数据库是关于模式植物拟南芥的最为成熟的数据库是关于模式植物拟南芥的:The Arabidopsis Information Resource(TAIR)http:/www.arabidopsis.org。其他常用的网上植物资源有其他常用的网上植物资源有:http:/www.york.ac.uk/res/garnet/garnet.htm http:/www.maizegdb.org http:/www.genome.ad.jp/kegg/pathway.html 第28页,共42页。此外网上已有一些与代谢和代谢组学有关的数据库此外网上已有一些与代谢和
38、代谢组学有关的数据库,主要介绍以下几主要介绍以下几个个:http:/www.armet.org 是一个涵盖大部分植物代谢组学研究工作的网站是一个涵盖大部分植物代谢组学研究工作的网站,包含了这些工作开展的包含了这些工作开展的时间时间,甚至还有详细的实验步骤甚至还有详细的实验步骤,并将代谢物信息标准化并将代谢物信息标准化,以便于研究者交流。以便于研究者交流。http:/medicago.vbi.vt.edu/dome.html 有许多关于代谢物的原始数据和分析结果有许多关于代谢物的原始数据和分析结果,同时也有对人们感兴趣的同时也有对人们感兴趣的一些植物物种的分子生物学研究一些植物物种的分子生物学研
39、究,分析结果用多维统计软件处理后可用于分析结果用多维统计软件处理后可用于OMEs的浏览器浏览。的浏览器浏览。http:/metacyc.org 是一个关于代谢物的数据库是一个关于代谢物的数据库,阐述了超过阐述了超过150种生物体中的代谢途径种生物体中的代谢途径,包含了从大量的文献和网上资源中得到的代谢途包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料。径、反应、酶和底物的资料。http:/www.chem.qmul.ac.uk/iubmb/enzyme 对主要代谢途径及涉及的关键酶进行了详尽的描述。对主要代谢途径及涉及的关键酶进行了详尽的描述。第29页,共42页。四、代谢组学
40、在植物科学中的应用四、代谢组学在植物科学中的应用 虽然植物代谢组学虽然植物代谢组学目前尚处于萌芽阶段目前尚处于萌芽阶段,但但其应用前景是十分广阔其应用前景是十分广阔的。下面介绍其中的部的。下面介绍其中的部分应用。分应用。第30页,共42页。1 1、代谢组分析、代谢组分析 应用代谢组学技术可同时对大量代谢物应用代谢组学技术可同时对大量代谢物进行定性定量分析进行定性定量分析,常用来观察植物在环境常用来观察植物在环境条件改变下的代谢物变化条件改变下的代谢物变化;也可用于研究同也可用于研究同一植物不同部位或不同时期的代谢物种类与一植物不同部位或不同时期的代谢物种类与含量变化含量变化;也可根据相关联的代
41、谢物的量的也可根据相关联的代谢物的量的变化变化,推测相应的代谢途径和代谢网络。推测相应的代谢途径和代谢网络。第31页,共42页。Example:Fiehn(2003)利用利用GC/MS对笋瓜对笋瓜(Cucurbita maxima GelberZentner)的叶柄脉管抽提物和叶片抽提物进行的叶柄脉管抽提物和叶片抽提物进行了代谢物分析了代谢物分析,得到了得到了400多个峰多个峰,通过与质谱数据库比对通过与质谱数据库比对,对其中一小部分进行了定性对其中一小部分进行了定性,初步判断为何种物质初步判断为何种物质;比较了比较了叶柄与叶片间代谢物组分的不同。叶柄与叶片间代谢物组分的不同。值得注意的是值得
42、注意的是,即使个体中每种代谢物的量变化很大即使个体中每种代谢物的量变化很大,其各组分间的比值也能一直维持稳定其各组分间的比值也能一直维持稳定,这说明了植物中的这说明了植物中的代谢物虽然种类繁多代谢物虽然种类繁多,但都是互相关联的。但都是互相关联的。植物利用复杂的机制来维持体内主要代谢物相对稳植物利用复杂的机制来维持体内主要代谢物相对稳定的水平。对代谢组的分析力求可检测样品中每种代谢定的水平。对代谢组的分析力求可检测样品中每种代谢物物,并可监测各种条件变化下代谢物的变化并可监测各种条件变化下代谢物的变化,这是进行功能这是进行功能基因组学研究的基础。基因组学研究的基础。第32页,共42页。2 2、
43、代谢途径的描述、代谢途径的描述 在对某一代谢途径中所有代谢物进在对某一代谢途径中所有代谢物进行了系统研究后行了系统研究后,下一步工作就是对代下一步工作就是对代谢途径的描述。在找到该途径一系列底谢途径的描述。在找到该途径一系列底物、产物、中间体和关键酶的基础上物、产物、中间体和关键酶的基础上,阐明这条代谢途径的调节机制和关键调阐明这条代谢途径的调节机制和关键调节位点。节位点。用代谢组学手段可以方便地找到用代谢组学手段可以方便地找到调节位点调节位点因为在该处因为在该处,底物和关键底物和关键酶的浓度将会发生相反的变化。酶的浓度将会发生相反的变化。第33页,共42页。For example:Tiess
44、en Tiessen等等(2002)(2002)用用HPLCHPLC对马铃薯块茎进行了代谢组对马铃薯块茎进行了代谢组分析分析,检测了淀粉合成途径中的一系列底物、中间物、酶检测了淀粉合成途径中的一系列底物、中间物、酶及产物量的变化及产物量的变化,再通过对野生株和含有异源腺苷二磷酸再通过对野生株和含有异源腺苷二磷酸葡萄糖焦磷酸化酶葡萄糖焦磷酸化酶(AGPase)(AGPase)转基因株马铃薯进行对比研转基因株马铃薯进行对比研究究,提出了淀粉合成途径中一种新的调节机制提出了淀粉合成途径中一种新的调节机制在离开在离开母体情况下母体情况下,马铃薯块茎中淀粉合成关键酶马铃薯块茎中淀粉合成关键酶AGPase
45、AGPase的催化的催化亚基亚基AGPBAGPB会发生可逆的氧化还原反应形成二聚体会发生可逆的氧化还原反应形成二聚体,使使AGPaseAGPase失活失活,从而抑制淀粉生成。从而抑制淀粉生成。目前目前,代谢组学应用于此方面的研究报道尚不多见代谢组学应用于此方面的研究报道尚不多见,主要原因是确定代谢途径比测定代谢物更为困难主要原因是确定代谢途径比测定代谢物更为困难,往往往往只能进行间接的定性估计只能进行间接的定性估计,从一个个点的代谢物到一条从一个个点的代谢物到一条完整的代谢途径还有很长的路要走。完整的代谢途径还有很长的路要走。第34页,共42页。3 3、基因功能研究、基因功能研究 代谢产物是基
46、因表达的终产物代谢产物是基因表达的终产物,基因表达基因表达上极微小的变化也可导致代谢物的大幅改变。上极微小的变化也可导致代谢物的大幅改变。以前往往通过可见的表型改变来判断基因表达以前往往通过可见的表型改变来判断基因表达水平的升降水平的升降,耗时较长耗时较长,且有时候基因表达变化且有时候基因表达变化无法引起表型改变无法引起表型改变,而此时植物体中某些代谢而此时植物体中某些代谢产物的含量却会发生变化。这时产物的含量却会发生变化。这时,利用代谢组利用代谢组学方法检测代谢物的变化就可以判断基因表达学方法检测代谢物的变化就可以判断基因表达水平的变化水平的变化,从而推断基因的功能及其对代谢从而推断基因的功
47、能及其对代谢流的影响。流的影响。第35页,共42页。Lytovchenko Lytovchenko等等(2002)(2002)通过对马铃薯叶通过对马铃薯叶片大量代谢物片大量代谢物,特别是光合作用途径中的中特别是光合作用途径中的中间体和终产物进行分析间体和终产物进行分析,研究了质体葡萄糖研究了质体葡萄糖磷酸变位酶磷酸变位酶(plastidial(plastidial phosphoglucomutase)phosphoglucomutase)基因在光合作用中对基因在光合作用中对碳流的影响碳流的影响,发现在其表达水平低的情况下发现在其表达水平低的情况下,虽然植物表型没有变化虽然植物表型没有变化,但
48、是植物组织中的但是植物组织中的淀粉、糖和有机酸的含量都有一定降低。淀粉、糖和有机酸的含量都有一定降低。这说明质体葡萄糖磷酸变位酶基因表达水这说明质体葡萄糖磷酸变位酶基因表达水平的变化对植物的几条主要代谢途径都有平的变化对植物的几条主要代谢途径都有很大的影响。很大的影响。第36页,共42页。4 4、与转录组学和蛋白质组学技术整合、与转录组学和蛋白质组学技术整合 转录组学、蛋白质组学和代谢组学是一个有机转录组学、蛋白质组学和代谢组学是一个有机的整体的整体,它们都是系统生物学它们都是系统生物学(system biology)(system biology)的的重要组成部分。重要组成部分。生物信息是按
49、生物信息是按DNAmRNADNAmRNA蛋白质蛋白质代谢产物方代谢产物方向流动的向流动的,将所获得的这几者的信息联系起来将所获得的这几者的信息联系起来,有利于有利于从整体研究生物系统对基因或环境变化的响应从整体研究生物系统对基因或环境变化的响应,如可如可判断代谢物的变化是从哪一个层面开始发生的。判断代谢物的变化是从哪一个层面开始发生的。第37页,共42页。Examples:Examples:Ferrario-Mery Ferrario-Mery等等(2002)(2002)整合了关于转录、酶活性及代谢物的数据整合了关于转录、酶活性及代谢物的数据研究研究烟草烟草中的碳氮代谢相互作用。通过对中的碳氮
50、代谢相互作用。通过对NHNH4 4代谢过程中主要代谢物的代谢过程中主要代谢物的定量分析定量分析,以及先前掌握的关于氮在转录层面的知识以及先前掌握的关于氮在转录层面的知识,分析了谷氨酰胺合分析了谷氨酰胺合成酶成酶(glutamine synthetase)(glutamine synthetase)在氮代谢过程中的作用在氮代谢过程中的作用,得到结论是代谢得到结论是代谢物量的变化与转录水平无关物量的变化与转录水平无关,而与转录后修饰调节有关。而与转录后修饰调节有关。YamazakiaYamazakia等等(2003)(2003)利用利用H P L C/P D A/E S I-M SH P L C/