1、11)这是一门为理、工、生、农、医类大学生、研究)这是一门为理、工、生、农、医类大学生、研究生和青年教师讲授的系统介绍系统生物学方法的课生和青年教师讲授的系统介绍系统生物学方法的课程。目标是对有兴趣投入研究的听众,能够在本课程。目标是对有兴趣投入研究的听众,能够在本课程后,程后,迅速进入前沿迅速进入前沿课题。因此,课程内容穿插了课题。因此,课程内容穿插了一些最新的研究成果。一些最新的研究成果。2)由于是方法,自然不是系统生物学的全面介绍,)由于是方法,自然不是系统生物学的全面介绍,既然是方法,当然又离不开应用的研究对象:生物既然是方法,当然又离不开应用的研究对象:生物系统。因此本课程不能系统地
2、研究生物系统,又必系统。因此本课程不能系统地研究生物系统,又必须要点地介绍其中的内容,以便表现特定方法的作须要点地介绍其中的内容,以便表现特定方法的作用和方法系统的意义。这里特称词汇用和方法系统的意义。这里特称词汇“方法系统方法系统”,其目的在于说明系统生物学方法不是各种实验、数其目的在于说明系统生物学方法不是各种实验、数学和计算机方法的简单汇总,而是正在形成独特的学和计算机方法的简单汇总,而是正在形成独特的方法体系,这正是本课程的意义。方法体系,这正是本课程的意义。23)一个难点在于授课对象的专业既有理工科又有)一个难点在于授课对象的专业既有理工科又有生物医学类,如何让听众在同一门课程中都能
3、理解生物医学类,如何让听众在同一门课程中都能理解方法以及获得需要的知识?为此,课程内容的自足、方法以及获得需要的知识?为此,课程内容的自足、完备性完备性是必须的,也是困难的。解决的方法是假设是必须的,也是困难的。解决的方法是假设听众具有普通大学微积分和高等代数的基础,甚至听众具有普通大学微积分和高等代数的基础,甚至医学院校的数学基础也基本够用。此外,必须的数医学院校的数学基础也基本够用。此外,必须的数学与计算机的知识将在本课程中介绍。学与计算机的知识将在本课程中介绍。4)同样的理由,数学建模与数据分析的专门知识将)同样的理由,数学建模与数据分析的专门知识将在本课程中讲授,并重点讲授生物模型;在
4、本课程中讲授,并重点讲授生物模型;5)16次课不间断,期间王淑栋老师代课次课不间断,期间王淑栋老师代课1、2次,次,1月月16日结束。日结束。3第一篇引言第一篇引言 第第1章章 什么是系统生物学什么是系统生物学 第第2章章 系统生物学方法系统生物学方法第二篇第二篇 生物学与数学的基础生物学与数学的基础 第第3章分子细胞生物学基础章分子细胞生物学基础 第第4章章 分子生物学基础分子生物学基础 第第5章章 实验技术概论实验技术概论 第第6章章 重要数学基础概述重要数学基础概述第三篇第三篇 生物系统模型与方法生物系统模型与方法 第第7章章 数据整合方法与表示数据整合方法与表示 第第8章章 生物系统与
5、生物过程生物系统与生物过程 第第9章章 代谢系统代谢系统 第第10章章 信号传导系统信号传导系统 第第11章章 正向基因网络建模正向基因网络建模 第第12章章 逆向基因网络建模逆向基因网络建模 第第13章章 蛋白质组建模蛋白质组建模 第第14章章 发育与进化模型发育与进化模型 第第15章章 细胞生物学仿真细胞生物学仿真第四篇第四篇 数据库与工具软件数据库与工具软件 第第16章章 数据库与数据整合数据库与数据整合 第第17章章 网络与常用软件网络与常用软件4主要参考书:主要参考书:系统生物学基础,北野宏明编,化学工业出版系统生物学基础,北野宏明编,化学工业出版社社 2007年;原著年;原著200
6、1年,是世界上第一本系年,是世界上第一本系统生物学教材;统生物学教材;系统生物学的理论、方法和应用,系统生物学的理论、方法和应用,E.Klipp等,等,复旦大学出版社,复旦大学出版社,2007年,原著年,原著2005年。北野年。北野作序。作序。5第一章第一章 什么是系统生物学什么是系统生物学 作为人类基因组计划的作为人类基因组计划的发起人发起人之一,美国科学之一,美国科学家莱诺伊家莱诺伊胡德(胡德(Leroy Hood)也是系统生物学的组)也是系统生物学的组学(学(omics)生物技术开创者之一。)生物技术开创者之一。依据依据Hood的的定义定义:系统生物学是研究生物系统中所系统生物学是研究生
7、物系统中所有组成成分(基因、有组成成分(基因、mRNA、蛋白质等)的构成,、蛋白质等)的构成,以及在以及在特定条件特定条件下这些组分间的相互关系的学科下这些组分间的相互关系的学科。也就是说,系统生物学不同于以往的实验生物也就是说,系统生物学不同于以往的实验生物学学仅关心个别的基因和蛋白质,它要研究仅关心个别的基因和蛋白质,它要研究所有所有的基因、的基因、所有所有的蛋白质、组分间的的蛋白质、组分间的所有所有相互关系。相互关系。6 正是在基因组学、蛋白质组学等新型大科学发正是在基因组学、蛋白质组学等新型大科学发展的基础上,孕育了系统生物学。反之,系统生物展的基础上,孕育了系统生物学。反之,系统生物
8、学的学的诞生诞生进一步提升了后基因组时代的生命科学研进一步提升了后基因组时代的生命科学研究能力。究能力。正如胡德所说正如胡德所说:“系统生物学将是系统生物学将是21世纪世纪医学和生物学的核心驱动力医学和生物学的核心驱动力”。胡德在胡德在1999年年底辞去了美国西雅图市华盛顿年年底辞去了美国西雅图市华盛顿大学的教职,与另外两名志同道合的科学家一起大学的教职,与另外两名志同道合的科学家一起创创立立了世界上第一个系统生物学研究所(了世界上第一个系统生物学研究所(Institute for Systems Biology)。)。7美国美国科学科学周刊登载了系统生物学专集。该专集周刊登载了系统生物学专集
9、。该专集导论中的第一句话这样写道:导论中的第一句话这样写道:“如果对当前流行的、如果对当前流行的、时髦的关键词进行一番分析,那么人们会发现,时髦的关键词进行一番分析,那么人们会发现,系统系统高居在排行榜上。高居在排行榜上。”系统生物学的系统生物学的核心概念核心概念是系统是系统正是要研究系统,所以必须使用正是要研究系统,所以必须使用整合整合的方法。的方法。89第一节、系统生物学是生物学理论体系第一节、系统生物学是生物学理论体系 生命科学是人类最早研究的学科,从农业到生命科学是人类最早研究的学科,从农业到医学。但是早期是医学。但是早期是归纳归纳为主的方法,研究农业技术为主的方法,研究农业技术提高产
10、量,医学归纳出生病与诊断、治疗的规律性提高产量,医学归纳出生病与诊断、治疗的规律性的方法,等等。的方法,等等。直到十六世纪末,显微镜的发现了使人们逐渐直到十六世纪末,显微镜的发现了使人们逐渐意识到不同的生物都是由形形色色的细胞构成的,意识到不同的生物都是由形形色色的细胞构成的,生物是层次构成的。开始了生物是层次构成的。开始了分析分析(特别对层次)的(特别对层次)的科学发展,直到二十世纪中叶的分子生物学,人类科学发展,直到二十世纪中叶的分子生物学,人类不仅积累了丰富的归纳的生物事实,而且开始对积不仅积累了丰富的归纳的生物事实,而且开始对积累的海量数据的分析。累的海量数据的分析。1.归纳与分析归纳
11、与分析10细胞水平:分子水平:DNA蛋白质生物系统分层结构生物系统分层结构个体水平:群体水平(种群与生态)群体水平(种群与生态)11生物学形成了今天理解的生物学形成了今天理解的层次层次:为什么说生物没有理论?为什么说生物没有理论?真正的理论生物学是什么?真正的理论生物学是什么?但是生物学的理论框架是什么?但是生物学的理论框架是什么?种群(生态学)种群(生态学)组织、器官与个体(农林医)组织、器官与个体(农林医)细胞(细胞生物学)细胞(细胞生物学)生物分子(分子生物学)生物分子(分子生物学)2.生物的层级结构生物的层级结构123.系统生物学的基本系统生物学的基本工作流程工作流程:1)对选定的某一
12、生物系统的所有组分进行了解和)对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机网络和代谢途径,以及细胞内和细胞间的作用机理等,以此构造出一个初步的理等,以此构造出一个初步的系统模型系统模型。特别包含了特别包含了层级之间层级之间的关联结构模型。的关联结构模型。2)系统地改变系统地改变被研究对象的内部组成成分(如基被研究对象的内部组成成分(如基因突变)或外部生长条件,然后观测在这些情况因突变)或外部生长条件,然后观测在这些情况下系统组分或结构所发生的相应变化,包括基因下系统组分或结
13、构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关化,并把得到的有关信息进行整合信息进行整合(系统与层(系统与层级)。级)。133)模型)模型现象求解现象求解、机理分析机理分析与与预测预测,把通过实验,把通过实验得到的数据与根据模型预测的情况进行比较,并得到的数据与根据模型预测的情况进行比较,并对初始模型进行对初始模型进行修正修正。4)根据修正后的模型的预测或假设,设定和实施)根据修正后的模型的预测或假设,设定和实施新的改变系统状态的实验,重复第二步和第三步,新的改变系统状态的实验,重复第二步和第三步,不断地通过实
14、验数据对模型进行修正和精练。不断地通过实验数据对模型进行修正和精练。系统生物学的系统生物学的目标目标就是要得到一个理想的模型,就是要得到一个理想的模型,使其机理分析与理论对于现象的理论预测能够反使其机理分析与理论对于现象的理论预测能够反映出生物系统的真实性。映出生物系统的真实性。14如果说如果说理论理论是有一组公理或大前题基础上逻辑推演是有一组公理或大前题基础上逻辑推演产生预测与结论的模式,那么,产生预测与结论的模式,那么,DNA序列就是事实序列就是事实的最初的最初前题前题,而,而各层次各层次的事实前题中数据信息的整的事实前题中数据信息的整合、解读就是理论方法,由此可以产生或解释全部合、解读就
15、是理论方法,由此可以产生或解释全部生命世界。这就是系统生物学在做的事情,因此是生命世界。这就是系统生物学在做的事情,因此是生物学的理论体系。生物学的理论体系。4.理论体系理论体系 对比对比理论物理,从工作流程可以看出,模型化理论物理,从工作流程可以看出,模型化和数学化成为基本的研究手段,这是理论生物学的和数学化成为基本的研究手段,这是理论生物学的开始。开始。系统生物学即是理论生物学的基本框架,研究模式:系统生物学即是理论生物学的基本框架,研究模式:数据分析数据分析 假设假设 建模建模 实验数据实验数据 理论输出理论输出15第二节、系统生物学是数据信息整合第二节、系统生物学是数据信息整合1.生物
16、是信息系统生物是信息系统在前分子生物学时代:生物学家把生命视为具有特在前分子生物学时代:生物学家把生命视为具有特殊殊“活力活力”的有机体的有机体,遵循着无机界不存在的法则,遵循着无机界不存在的法则进行生命活动;进行生命活动;在分子生物学时代:研究者们把生命视为一架在分子生物学时代:研究者们把生命视为一架精密精密的机器的机器,由基因和蛋白质根据物理、化学的规律来,由基因和蛋白质根据物理、化学的规律来运转;运转;在后基因组时代:像胡德这类科学家,把生命视为在后基因组时代:像胡德这类科学家,把生命视为信息的载体信息的载体,一切特性都可以从信息的流动中得到,一切特性都可以从信息的流动中得到实现。实现。
17、16胡德提出生物学为一门信息科学:胡德提出生物学为一门信息科学:生物学与所有其他学科,如物理学、化学、地生物学与所有其他学科,如物理学、化学、地理学,是完全不一样的科学,因为生物学以外的学理学,是完全不一样的科学,因为生物学以外的学科都只能通过类比的方式(科都只能通过类比的方式(analog)进行分析。既)进行分析。既然生物学研究的核心是数字化的,因此生物学可以然生物学研究的核心是数字化的,因此生物学可以被完全被完全破译、解读的破译、解读的。2)生命的数字化核心表现为两大类型的信息,第)生命的数字化核心表现为两大类型的信息,第一类信息是指编码蛋白质的一类信息是指编码蛋白质的基因基因,第二类信息
18、是指,第二类信息是指控制基因行为的控制基因行为的调控网络调控网络。(由一段。(由一段DNA序列组成的基序列组成的基因是数字化的。值得强调的是,基因调控网络的信息从本质因是数字化的。值得强调的是,基因调控网络的信息从本质上说也是数字化的,因为不仅网络是数据化的,而且控制基上说也是数字化的,因为不仅网络是数据化的,而且控制基因表达的转录因子结合位点也是核苷酸序列。)因表达的转录因子结合位点也是核苷酸序列。)1)生物学研究的核心)生物学研究的核心基因组,是数字化的基因组,是数字化的(digital)。)。173)生物信息是有等级次序的,而且沿着不同的层)生物信息是有等级次序的,而且沿着不同的层次流动
19、。一般说来,生物信息以这样的方向进行流次流动。一般说来,生物信息以这样的方向进行流动(中心法则的作用):动(中心法则的作用):DNAmRNA蛋白质蛋白质蛋白质相互作用网络蛋白质相互作用网络细胞细胞器官器官个体个体群体。群体。每个层次信息都对理解生命系统的运行提供有用的每个层次信息都对理解生命系统的运行提供有用的视角。整合是对于全部视角的信息数据的整合。视角。整合是对于全部视角的信息数据的整合。18 根据系统论的观点,构成系统的关键不是其组根据系统论的观点,构成系统的关键不是其组成的物质,而是组成部分的相互作用或部分之间的成的物质,而是组成部分的相互作用或部分之间的关系的全体关系的全体结构。这些
20、相互作用或者关系,从结构。这些相互作用或者关系,从本质上说就是信息,本质上说就是信息,结构是关联性的信息结构是关联性的信息。生命过程就是一个生命过程就是一个信息流的过程信息流的过程,系统生物学,系统生物学就是要研究并揭示这种信息的运行规律,要尽可能就是要研究并揭示这种信息的运行规律,要尽可能地获得每个层次的信息并将它们进行整合。地获得每个层次的信息并将它们进行整合。生命是远离平衡态的开放系统,为了维持其有序性,生生命是远离平衡态的开放系统,为了维持其有序性,生命系统必须不断地与外部环境交换能量,以抵消其熵增过程。命系统必须不断地与外部环境交换能量,以抵消其熵增过程。奥地利物理学家薛定谔早在奥地
21、利物理学家薛定谔早在1940年代发表的著作年代发表的著作生命是什生命是什么?么?中就已指出,生命以中就已指出,生命以“负熵流负熵流”为食,而为食,而“负熵负熵”其其实就是信息的另一种表示方法。实就是信息的另一种表示方法。192.生物理论基于整合生物理论基于整合 后基因组时代,系统生物学与基因组学、蛋白后基因组时代,系统生物学与基因组学、蛋白质组学等各种质组学等各种“组学组学”的不同之处在于,它是一种的不同之处在于,它是一种整合型大科学。整合型大科学。1)把系统内不同性质的构成)把系统内不同性质的构成要素要素(基因、(基因、mRNA、蛋白质、生物小分子等)蛋白质、生物小分子等)整合整合在一起进行
22、研究。在一起进行研究。Hood的系统生物学研究所的的系统生物学研究所的第一篇研究论文第一篇研究论文,就是,就是整合酵母的基因组分析和蛋白质组分析,研究酵母整合酵母的基因组分析和蛋白质组分析,研究酵母的代谢网络。由于不同生物分子的研究难度不一样,的代谢网络。由于不同生物分子的研究难度不一样,技术发展程度不一样,目前对它们的研究水平有较技术发展程度不一样,目前对它们的研究水平有较大的差距。例如,基因组和基因表达方面的研究已大的差距。例如,基因组和基因表达方面的研究已经比较完善,而蛋白质研究就较为困难,至于涉及经比较完善,而蛋白质研究就较为困难,至于涉及生物小分子的代谢组分的研究就更不成熟。生物小分
23、子的代谢组分的研究就更不成熟。20 2)对于多细胞生物而言,系统生物学要实现从)对于多细胞生物而言,系统生物学要实现从基因到细胞、到组织、到个体的各个基因到细胞、到组织、到个体的各个层次和系统层次和系统的整合。的整合。科学科学周刊系统生物学专集中一篇题为周刊系统生物学专集中一篇题为“心脏心脏的模型化的模型化从基因到细胞、到整个器官从基因到细胞、到整个器官”的论的论文,很好地体现了这种整合性。文,很好地体现了这种整合性。系统科学的系统科学的核心思想核心思想是:是:“整体大于部分之整体大于部分之和和”;系统的特性是不同组成部分、不同层次间;系统的特性是不同组成部分、不同层次间相互作用而相互作用而“
24、涌现涌现”的新性质;对组成部分或低的新性质;对组成部分或低层次的分析并不能真正地预测高层次的行为。层次的分析并不能真正地预测高层次的行为。213)研究思路和)研究思路和方法的整合方法的整合。经典的分子生物学研。经典的分子生物学研究是一种垂直型的研究,即采用多种手段研究个别究是一种垂直型的研究,即采用多种手段研究个别的基因和蛋白质。首先是在的基因和蛋白质。首先是在DNA水平上寻找特定的水平上寻找特定的基因,然后通过基因突变、基因剔除等手段研究基基因,然后通过基因突变、基因剔除等手段研究基因的功能;在基因研究的基础上,研究蛋白质的空因的功能;在基因研究的基础上,研究蛋白质的空间结构,蛋白质的修饰以
25、及蛋白质间的相互作用;间结构,蛋白质的修饰以及蛋白质间的相互作用;继而研究代谢和转导的途径等等。继而研究代谢和转导的途径等等。基因组学、蛋白质组学和其他各种基因组学、蛋白质组学和其他各种“组学组学”是是水平型研究,即以单一的手段同时研究成千上万个基水平型研究,即以单一的手段同时研究成千上万个基因或蛋白质。而系统生物学的特点,则是要把水平型因或蛋白质。而系统生物学的特点,则是要把水平型研究和垂直型研究整合起来,成为一种研究和垂直型研究整合起来,成为一种“三维三维”的研的研究。究。系统生物学还是典型的多学科交叉研究,它需要生命系统生物学还是典型的多学科交叉研究,它需要生命科学、信息科学、数学、计算
26、机科学等各种学科的共科学、信息科学、数学、计算机科学等各种学科的共同参与。同参与。22细胞网络细胞网络蛋白质相互作用蛋白质相互作用基因网络基因网络基因网络基因网络二维网络二维网络表达与调控表达与调控代谢代谢功能与行为功能与行为单个功能单个功能三维系统生物学三维系统生物学23第三节、系统生物学是建模第三节、系统生物学是建模 生物学要通过生物现象和复杂的生物过程去发生物学要通过生物现象和复杂的生物过程去发掘隐藏在背后的掘隐藏在背后的原因(机理)原因(机理)并且进行并且进行预测预测,但是,但是数据整合与分析并不能给出这种机理的描述。数据整合与分析并不能给出这种机理的描述。例如细胞的功能多数源于蛋白质
27、分子的作用,例如细胞的功能多数源于蛋白质分子的作用,而参与的蛋白质很多,无法通过实验全面确定,等而参与的蛋白质很多,无法通过实验全面确定,等等。等。因此,类似于理论物理的建模方法,使用因此,类似于理论物理的建模方法,使用数学数学建模建模,将研究对象或过程用数学语言表示出来,进,将研究对象或过程用数学语言表示出来,进而研究其状态的动态变化,理解机理、进行预测。而研究其状态的动态变化,理解机理、进行预测。因此系统生物学的主要理论方法就是数学建模。因此系统生物学的主要理论方法就是数学建模。1.为什么要建模为什么要建模242.传统的生物建模传统的生物建模 由数量遗传学和分子生物学开始,模型化方法由数量
28、遗传学和分子生物学开始,模型化方法已经在生物学研究中应用。用已经在生物学研究中应用。用A、T、C、G四个字四个字符表示的符表示的DNA序列就是一个数学模型,如果把相邻序列就是一个数学模型,如果把相邻字符用线段连接,而且形成一个一维链的网络模型,字符用线段连接,而且形成一个一维链的网络模型,这是表达这是表达DNA的序结构的数学模型。的序结构的数学模型。用微分方程用于描述生物系统的动力学过程,用微分方程用于描述生物系统的动力学过程,例如酶的反应动力学,种群的生态动力学,传染病例如酶的反应动力学,种群的生态动力学,传染病的传播动力学,而随机方程描述信号传播。的传播动力学,而随机方程描述信号传播。布尔
29、网络描述基因组的表达等等。布尔网络描述基因组的表达等等。253.系统生物学建模系统生物学建模 不同于以往的生物数学的建模,而是对于生物不同于以往的生物数学的建模,而是对于生物系统系统的建模,是整合目标下的建模。也就是,即要的建模,是整合目标下的建模。也就是,即要对于每个生物层次的各个生物系统建立模型,而且对于每个生物层次的各个生物系统建立模型,而且还要将不同层次的系统之间的关联结构建模。如果还要将不同层次的系统之间的关联结构建模。如果将不同系统的集合称为将不同系统的集合称为系统簇系统簇的话,系统生物学将的话,系统生物学将对生物系统的这个簇结构建模。对生物系统的这个簇结构建模。这种建模在生物系统
30、中特别重要,例如,研究血这种建模在生物系统中特别重要,例如,研究血液的凝固过程时,不仅要对由不同蛋白质的酶组成液的凝固过程时,不仅要对由不同蛋白质的酶组成的凝血因子系统建模,也要对于重要的凝血因子的凝血因子系统建模,也要对于重要的凝血因子血小板的细胞系统建模,这两个模型必然关联才发血小板的细胞系统建模,这两个模型必然关联才发生凝血功能,因此要对这种关联建立数学模型。生凝血功能,因此要对这种关联建立数学模型。26第四节、系统生物学是系统的生物实验第四节、系统生物学是系统的生物实验 目的目的 生物学一方面要了解生物系统的组成结构以及这生物学一方面要了解生物系统的组成结构以及这种结构产生的功能,另一
31、方面要揭示系统的行为方式,种结构产生的功能,另一方面要揭示系统的行为方式,这种这种“行为行为”即包括结构稳定时的系统动态行为,也即包括结构稳定时的系统动态行为,也包括系统结构改变的行为。也就是说,系统生物学研包括系统结构改变的行为。也就是说,系统生物学研究的并非一种静态的结构,而是动力学过程,同时要究的并非一种静态的结构,而是动力学过程,同时要在人为控制的下,揭示出特定的生命系统在不同的条在人为控制的下,揭示出特定的生命系统在不同的条件下和不同的时间里具有什么样的动力学特征。这就件下和不同的时间里具有什么样的动力学特征。这就需要特定的与以往不同的生物实验。需要特定的与以往不同的生物实验。系统生
32、物学的干涉实验系统生物学的干涉实验27干涉干涉 实验科学都有这样一种类型实验:对于某种或实验科学都有这样一种类型实验:对于某种或某些条件的改变去作用于被实验的对象,例如自然某些条件的改变去作用于被实验的对象,例如自然产生或人设定的条件,进行实验并观察结果。这种产生或人设定的条件,进行实验并观察结果。这种对实验对象的影响统称为干涉(对实验对象的影响统称为干涉(perturbation)。前)。前分子生物学时代,多数是非干涉方法如形态观察或分子生物学时代,多数是非干涉方法如形态观察或分类研究生物体。分子生物学实验特点是,在实验分类研究生物体。分子生物学实验特点是,在实验室内利用各种手段干涉生物学材
33、料,如通过诱导基室内利用各种手段干涉生物学材料,如通过诱导基因突变或修饰蛋白质,由此研究其性质和功能。因突变或修饰蛋白质,由此研究其性质和功能。系统生物学中的干涉是系统生物学中的干涉是系统性系统性的。例如,对酵母的的。例如,对酵母的系统生物学研究,胡德等人就是把已知的参与果糖系统生物学研究,胡德等人就是把已知的参与果糖代谢的代谢的9个基因逐一进行突变,研究在每一个基因个基因逐一进行突变,研究在每一个基因突变下的系统变化。突变下的系统变化。28 果蝇从受精开始到形成成熟个体一共有果蝇从受精开始到形成成熟个体一共有66个典个典型的发育阶段,不久前科学家利用基因芯片技术,型的发育阶段,不久前科学家利
34、用基因芯片技术,对每一个发育阶段的基因表达谱进行了系统的研究。对每一个发育阶段的基因表达谱进行了系统的研究。这也是一类系统性的干涉方式。这也是一类系统性的干涉方式。其次,系统生物学需要高通量的干涉能力,如其次,系统生物学需要高通量的干涉能力,如高通量的遗传变异。现有技术已经能做到在短时间高通量的遗传变异。现有技术已经能做到在短时间内,把酵母的全部内,把酵母的全部6000多个基因逐一进行突变。对多个基因逐一进行突变。对于较为复杂的多细胞生物,可以通过于较为复杂的多细胞生物,可以通过RNA干涉新干涉新技术来实现大规模的基因定向突变。随着研究技术技术来实现大规模的基因定向突变。随着研究技术的发展,一
35、定还会有许多新的干涉技术应用于系统的发展,一定还会有许多新的干涉技术应用于系统生物学。生物学。29 以测定基因组全序列或全部蛋白质组成的基因组以测定基因组全序列或全部蛋白质组成的基因组研究或蛋白质组研究等研究或蛋白质组研究等“规模型大科学规模型大科学”,并不属于,并不属于经典的实验科学。这类工作中也没有干涉,其目标只经典的实验科学。这类工作中也没有干涉,其目标只是把系统的全部元素测定清楚,以便得到一个含有所是把系统的全部元素测定清楚,以便得到一个含有所有信息的数据库。胡德把这种类型的研究称为有信息的数据库。胡德把这种类型的研究称为“发现发现的科学的科学”(discovery science),
36、而把上述依赖于干),而把上述依赖于干涉的实验科学称为涉的实验科学称为“假设驱动的科学假设驱动的科学”(hypothesis-driven science),因为选择干涉就是在做出假设。系),因为选择干涉就是在做出假设。系统生物学不同于一般的实验生物学就在于,它既需要统生物学不同于一般的实验生物学就在于,它既需要“发现的科学发现的科学”,也需要,也需要“假设驱动的科学假设驱动的科学”。首先。首先利用利用“发现的科学发现的科学”方法,对系统的所有元素进行测方法,对系统的所有元素进行测定;然后要设计一种条件(干涉),对此干涉做出新定;然后要设计一种条件(干涉),对此干涉做出新的假设,对系统在干涉条件
37、下利用的假设,对系统在干涉条件下利用“假设驱动的科学假设驱动的科学”研究手段进行研究。这两种不同研究策略和方法的互研究手段进行研究。这两种不同研究策略和方法的互动和整合,是系统生物学成功的保证。动和整合,是系统生物学成功的保证。30干、湿实验干、湿实验 系统生物学的理想就是要得到一个尽可能接近系统生物学的理想就是要得到一个尽可能接近真实生物系统的理论模型;建模过程贯穿在系统生真实生物系统的理论模型;建模过程贯穿在系统生物学研究的每一个阶段。离开了数学和计算机科学,物学研究的每一个阶段。离开了数学和计算机科学,就不会有系统生物学。也许正是基于这一考虑,科就不会有系统生物学。也许正是基于这一考虑,
38、科学家把系统生物学分为学家把系统生物学分为“湿湿”的实验部分(实验室的实验部分(实验室内的研究)和内的研究)和“干干”的实验部分(计算机模拟和理的实验部分(计算机模拟和理论分析论分析)。)。“湿湿”、“干干”实验的完美整合才是真实验的完美整合才是真正的系统生物学正的系统生物学。31第五节第五节 系统生物学发展简史系统生物学发展简史 1.系统论方法系统论方法 系统生物学的实验、计算与理论方法基于系统生物学的实验、计算与理论方法基于系统系统论论的基本思想和方法。的基本思想和方法。系统科学(包括控制论、信息论)源于生命科学,系统科学(包括控制论、信息论)源于生命科学,发展了计算机科学,应用于生物科学
39、,而且将开发发展了计算机科学,应用于生物科学,而且将开发出生物计算机。出生物计算机。系统生物学,最初开创于贝塔郎菲的一般系统理论系统生物学,最初开创于贝塔郎菲的一般系统理论与理论生物学,艾根的超循环理论发展了细胞、生与理论生物学,艾根的超循环理论发展了细胞、生物化学与分子层次的系统论。物化学与分子层次的系统论。20世纪世纪70年代国际召年代国际召开了开了“系统论与生物学(系统论与生物学(systems theory and biology)”的会议,的会议,80年代召开了生物化学系统论、年代召开了生物化学系统论、生物系统的计算机模型等探讨的国际会议生物系统的计算机模型等探讨的国际会议。32 维
40、纳与香农从动物与通讯行为的研究中提出控维纳与香农从动物与通讯行为的研究中提出控制论与信息论,以及后来的整个系统科学根植于有制论与信息论,以及后来的整个系统科学根植于有机体哲学思维,系统生物学的概念早在机体哲学思维,系统生物学的概念早在20世纪中叶世纪中叶已经提出,还有合成生物学的概念并提出于基因重已经提出,还有合成生物学的概念并提出于基因重组技术的产生,进化理论、有机分子合成等等,这组技术的产生,进化理论、有机分子合成等等,这些可以说是最早的探索。些可以说是最早的探索。系统生物学的发展历史经历了三个时期:第一系统生物学的发展历史经历了三个时期:第一期,生态系统,系统生态学与行为,开始于期,生态
41、系统,系统生态学与行为,开始于20世纪世纪60-70年代;第二期,生理系统,系统生理学与神年代;第二期,生理系统,系统生理学与神经、内分泌、免疫学,开始于经、内分泌、免疫学,开始于20世纪世纪70-80年代;年代;第三期,遗传系统,系统遗传学与胚胎、发育生物第三期,遗传系统,系统遗传学与胚胎、发育生物学,系统遗传学的概念于学,系统遗传学的概念于20世纪世纪90年代年代。33 1999年年Nature10月刊登了系统生物科学与工程月刊登了系统生物科学与工程网及世界联合会筹备及国际会议等信息,并确立生网及世界联合会筹备及国际会议等信息,并确立生物系统理论与实验、计算机、工程方法的生物系统物系统理论
42、与实验、计算机、工程方法的生物系统分析与人工生物系统研究。分析与人工生物系统研究。2000年同期,日本年同期,日本Kitnano举办国际系统生物举办国际系统生物学会议,美国学会议,美国Hood建立系统生物学研究所,美国建立系统生物学研究所,美国Kool重新提出合成生物学的概念。重新提出合成生物学的概念。21世纪伊始,权威刊物世纪伊始,权威刊物Nature、Science发表发表系统生物学、合成生物学等专刊,终于进入了系统系统生物学、合成生物学等专刊,终于进入了系统生物科学全球化时代。生物科学全球化时代。34第二章、系统生物学方法第二章、系统生物学方法第一节第一节 实验与测量实验与测量1.测量测
43、量 对生物系统的有机整合是系统生物学的灵魂,需要对生物系统的有机整合是系统生物学的灵魂,需要在实验、数据计算和理论建模的所有方面实现。在实验、数据计算和理论建模的所有方面实现。以往以往的实验与测量是在每个分层中,针对单一的实验与测量是在每个分层中,针对单一系统进行的。例如线虫是研究比较充分的多细胞模系统进行的。例如线虫是研究比较充分的多细胞模式生物。整个细胞系于式生物。整个细胞系于1983年被年被Sulston等鉴定,神等鉴定,神经系统的拓扑结构被经系统的拓扑结构被White等描述,等描述,1988年测定了年测定了DNA全序列,以及测量其神经活动、利用特殊的显全序列,以及测量其神经活动、利用特
44、殊的显微方法和先进的图象处理技术实时自动构建细胞系微方法和先进的图象处理技术实时自动构建细胞系(Yasuda/1999,Onami/2001)等等。)等等。其他许多生物也在被类似方法详细地实验研究。其他许多生物也在被类似方法详细地实验研究。35 系统生物学特定的测量目标,要求测量满足以系统生物学特定的测量目标,要求测量满足以下三点:下三点:1)全面性全面性,包括以下完备性:,包括以下完备性:a.因子完备性因子完备性 问题目标的因子需要全面测量。例如问题目标的因子需要全面测量。例如问题涉及到基因和蛋白质,则应该对于其中的所有因问题涉及到基因和蛋白质,则应该对于其中的所有因子全面测量,且须有一定的
45、有效性,例如在表达谱推子全面测量,且须有一定的有效性,例如在表达谱推导调控网络时,要测量所有相关基因的表达数据。导调控网络时,要测量所有相关基因的表达数据。b.条目的完备性条目的完备性 多数情况下,对于对目标的特征属多数情况下,对于对目标的特征属性应该全面测量。例如,转录水平、蛋白质相互作用、性应该全面测量。例如,转录水平、蛋白质相互作用、磷酸化、定位以及其他特征。但是条目的完备性很难磷酸化、定位以及其他特征。但是条目的完备性很难在同一组测试样本中实现,例如蛋白质相互作用网络在同一组测试样本中实现,例如蛋白质相互作用网络模型的数据就是这种情况,因为涉及的蛋白质种类很模型的数据就是这种情况,因为
46、涉及的蛋白质种类很多,很少有研究组可以提供多种测量技术。多,很少有研究组可以提供多种测量技术。36c.时序的完备性时序的完备性 在动态系统进行建模和分析时,在动态系统进行建模和分析时,在精细的时间序列内进行测量十分必要。而以往只在精细的时间序列内进行测量十分必要。而以往只是用是用“之前之前”或或“之后之后”作为动态分析的测量。作为动态分析的测量。373)定量精确性定量精确性 这个条件十分显然,但是事实上难这个条件十分显然,但是事实上难以达到基本要求,于是以达到基本要求,于是系统误差系统误差对于对于整合的影响的整合的影响的研究研究成为必不可少。例如,系统中某些部分或系统成为必不可少。例如,系统中
47、某些部分或系统的某些行为对于参数敏感,而另外一些比较稳定,的某些行为对于参数敏感,而另外一些比较稳定,此时整个系统的稳定性并不一定被敏感的误差所影此时整个系统的稳定性并不一定被敏感的误差所影响,而要具体分析稳定性的原因。例如,飞机发动响,而要具体分析稳定性的原因。例如,飞机发动机和座椅对于飞机稳定性的影响不同,这是研究系机和座椅对于飞机稳定性的影响不同,这是研究系统学常常遇到的问题。统学常常遇到的问题。2)系统性系统性 即测量所得到的数据有系统一致性,例即测量所得到的数据有系统一致性,例如多种数据来源于同一样本集,当这种要求达不到如多种数据来源于同一样本集,当这种要求达不到的时候,必须研究不同
48、实验条件下的数据可以整合的时候,必须研究不同实验条件下的数据可以整合的理由。目前达到系统一致性的数据非常少见,因的理由。目前达到系统一致性的数据非常少见,因此此整合条件的研究整合条件的研究已经成为有用的课题。已经成为有用的课题。382.下一代的实验系统下一代的实验系统 由于系统生物学的研究目标和方法,要求高精度、由于系统生物学的研究目标和方法,要求高精度、高通量、和多系统的全面数据,从而要求测量方法高通量、和多系统的全面数据,从而要求测量方法是是高度自动化高度自动化的。特别是系统生物学要求实验采用的。特别是系统生物学要求实验采用系统干扰的方法,这种方法的实施对于实验设备和系统干扰的方法,这种方
49、法的实施对于实验设备和测量仪器具有高度自动化。从而需要依赖一些尖端测量仪器具有高度自动化。从而需要依赖一些尖端技术,例如微流控系统、纳米技术、飞秒化学等等技术,例如微流控系统、纳米技术、飞秒化学等等来设计和构建下一代实验装置去观察和测量基因与来设计和构建下一代实验装置去观察和测量基因与蛋白质的活动。蛋白质的活动。这些目前还远远没有实现,从而对当前系统生物这些目前还远远没有实现,从而对当前系统生物学的研究带来学的研究带来新的思维新的思维。39第二节、生物系统建模方法第二节、生物系统建模方法1.生物系统的结构模型生物系统的结构模型 数学建模和计算机模拟是系统生物学的主要理论数学建模和计算机模拟是系
50、统生物学的主要理论研究方法,然而什么是生物系统的模型以及如何建研究方法,然而什么是生物系统的模型以及如何建模仍然有许多理论问题有待研究。结构主义建模是模仍然有许多理论问题有待研究。结构主义建模是其中重要的概念与方法。其中重要的概念与方法。模型概念模型概念:对问题的目标:对问题的目标(原型原型)抽象出原型的结构抽象出原型的结构并且用适当的语言表示。并且用适当的语言表示。目标不同关注的结构不同,不同语言的表示形成不目标不同关注的结构不同,不同语言的表示形成不同的模型,例如专业模型、数学模型或数据模型等。同的模型,例如专业模型、数学模型或数据模型等。40系统系统:元素或部件的集合:元素或部件的集合+