1、1上海大学系统生物技术研究所上海大学系统生物技术研究所 刘曾荣刘曾荣v背景v系统生物学的理解v三项目标v蛋白质作用网络的构建v进一步的工作2v2002-2003年提出复杂网络v从科学性上看复杂网络的研究v创建系统生物技术研究所v2009年接手系统生物技术研究所3认识是逐步深入的认识是逐步深入的 21世纪是生命科学世记,生命科学最根本问题是解决“What is life”;在历史上解决这个问题最重要有“Four great ideals”:遗传基础-基因 生命基本单位-细胞 生命过程中的化学反应 基于自然选择的进化论 系统生物学是生物学研究中“The fifth great ideal”-200
2、9 Systems Biology Nobel Symposium系统生物学是在系统层面上研究生命现象 系统生物学研究的是 multi-scale dynamic complex systems目前常提到的是 graph theory(network),control,dynamics总起来说:以系统科学理论和生物实验相结合,从系统层面上研究生命现象,为解释“what is life”开辟了一种全新研究模式v神经干细胞的系统生物学研究v水在生命过程中的多尺度研究v基于进化论的蛋白质作用网络的构建6v神经干细胞可以分化为神经元、胶质细胞v我们的前期研究表明DCF1与神经干细胞分化相关v高架十字迷
3、宫实验测试表明,DCF1敲除小鼠进入开放臂次数与停留时间显著减少dcf-1-/-敲除敲除WT 野生型野生型WT野生型Dcf1-/-敲除小鼠Dcf1-/-敲除后,小鼠胆怯,不敢进入中心区活动WT野生型Dcf1-/-敲除小鼠大脑结构分析表明:Dcf1-/-敲除小鼠5-TH神经元减少因此出现焦虑症状v在网络构建方面,只能从小的开始试。v二氧化钛纳米影响神经干细胞分化,此研究发表于Biomaterials,2010 题为:A protein interaction network for the analysis of the neuronal differentiation of neural st
4、em cells in response to titanium dioxide nanoparticles.11v网络分析方面己经开始做些外国人实验有新发现,我们通过原有网络改进,网络分析来解释这些最新成果。有microRNA对Cell Cycle影响;microRNA对p53调控的影响;对microRNA对胚胎干细胞的分化和更新的影响;p53磷酸化和乙酰化对p53调控的影响。12v水在生命活动中是极端重要的。v水在输运过程中体现了多尺度性质。v在微观层次上水分子表现出耦极子的特性。13v在具有电性的纳米尺度的奇异管中的流动特性。v在分子尺度上的二参数基本模型。v希望探索水在微观上如何通过细
5、胞膜上的纳米级尺度的管子携带生物分子一起运动。14三年来,七个研究人员共计发表SCI论文87篇,其中一区SCI论文3篇、二区SCI论文31篇。发表杂志有:PNAS、Biomaterial、Soft Matter、Mol.Biol.Evol、Plos One、Bioinformatics、JBC、JPR、NAR、BMC Genomics、BMC Systems Biology、Chaos等。15v生命的奧妙存在于基因之中v在生命活动中基因表达为蛋白质形式v基因与蛋白质之间关系服从中心法则v在分子水平的生命活动是表现为大量生物分子相互作用16v复杂网络是在分子水平研究生命现象的重要工具v蛋白质作用
6、网络是生物分子网络中一种,它是一种无向网络v应当从建模开始1718 分子水平的系统生物学的研究建模关键是构建生物网络,实测生物网络的特征:(1)生物网络具有稀疏性;(2)生物网络具有无标度(scale-free)性质,即度分布呈幂律分布;(3)生物网络具有小世界(small world)性质;(4)生物网络具有层次结构;(5)生物网络具有度的负关联性(disassortative),即度大的节点更倾向于和度小的节点相连接;(6)生物网络具有一定的鲁棒性。19生物网络构建的现状 生物网络构建中的一种思路是按照生物学进化论的基本原理来构建网络。我们把基于生物学进化论的基本原理:复制(Duplica
7、tion)和变异(Divergence)而建立的模型称为DD模型。目前科研工作者已经提出了各种基于复制和变异的网络增长模型 但几乎没有一个DD模型可以很好包含生物网络的各种特征。接下来我们以蛋白质作用网络为例来讨论它的构建和特征涌现。20(i)初始为单连通的随机图(初始的节点数目N一般取比较小)(ii)复制:在每一个时间步,随机选取一个节点 进行复制产生一个新的节点 ,并且连接到原节点 的所有的邻居.(iii)完全非对称变异:(1):对连接到新生成的节点 的每一条边,以概率 删除。另 外,新节点 与被复制的节点 以概率 发生二聚作用。(2):新生成的节点 以概率 连接到网络的其它节点上(要求没
8、有重边)。i ii i ii i21模型示意图复制 删边(亚功能化)二聚作用 重连(新功能化)一次步骤结束,进入下次iiiiiiiii22(1)初始取N=100,平均度为3.88的单连通随机图;(2)复制采取偏爱度小原则,即度为 的节点i以概率 被选取复制;(3)完全非对称变异;(4)二聚作用概率 ,其中 是常数,是节点i和新生成的节点i 的共同的邻居数目。若 ,则取ik11()/ijjP ikk0onn0cnn1123(1)实测的酵母蛋白质相互作用网络的节点为3891,所以我们假定网络模型的最终节点数为4000。(2)文献估计了酵母蛋白质相互作用网络中加边和删边的概率的比值为(3)在给定参数
9、后,取100个随机网络作为初始网络,然后用上述过程生成网络,再取平均,得到了数据点。(4)对这些样本所得数据进行线性回归分析,用 r square来判定线性回归直线拟合优度的好坏,P value 证实数值模拟结果的可靠性。/0.001 240.1(A)0.030.000250.150.55图2表示模型在,和 从到参数下的度分布2500.350.000250.0150.055图2.1(B)表示模型在,和从到参数下的度分布2600.350.0350.000150.00055图2.1(C)表示模型在,和 从到参数下的度分布上述数值模拟结果表明:(1)在各种参数条件下网络模型的度分布呈现出幂律分布(2
10、)从图2.1(A)和2.1(B)发现幂指数基本保持不变,图2.1(C)发现幂指数随着 增加而有所减少。(3)以 所得数据为例,进行线性回归分析得到 相应的幂指数为2.467,此结果表明数值模拟所得到的结论是可靠的。2700.450.030.00025,0.976,0.001,r squareP value2802.2(A)0.030.000250.150.55C()k图表示模型在,和 从到参数下的分布2902.2()0.350.000250.0150.055C()Bk图表示模型在,和从到参数下的分布3002.2(C)=0.350.0350.000150.00055C()k图表示模型在,和 从到
11、参数下的分布上述数值模拟结果表明:(1)在各种参数下,近似成立,这表明生物网络具有功能模块结构;(2)观察表明C(k)分布的幂指数随着的增加而减少,随着0的增加而增大;(3)我们发现当k小时,,而k大时,这已在实测数据中得到了证实;(4)以 网络模型所得到的数据为例,我们取前段,即k小时的数据进行线性回归分析得到 相应的幂指数为1.052,结果表明数值模拟所得结论是可靠的。311C()kk1C()kk2C()kk.40.030.000250=0 5,r square=0.965,p value0.001,3202.3()0.030.000250.150.55K()nnAk图表示模型在,和 从到
12、参数下的分布3302.3()0.350.000250.0150.055K()nnBk图表示模型在,和从到参数下的分布340nn.3(C)=0.350.0350.000150.00055K()k图2表示模型在,和从到参数下的分布35K()nnk0.5K()nnkk1K()nnkk.40.030.000250=0 5,r square=0.998,P value0.001,4.56994.27314.01823.77573.54900.10730.08100.06200.04880.03683.87924.25514.66104.94935.3838360.150.250.350.450.5500
13、.00025,0.035,r3.93393.99844.04724.10604.16220.03820.05350.06900.08460.09474.62224.65024.59824.65214.64063700.01500.02500.03500.04500.05500.350.00025,3.48304.04724.66635.28005.94750.08010.06900.06100.05500.05174.76554.59824.52824.39824.2716380.000150.000250.000350.000450.0005500.350.035,3.740.0664.85
14、39(1)复制是蛋白质相互作用网络进化的主要动力,所采取的偏爱小原则对网络的形成有重要的作用;(2)删边,加边和异源二聚三种变异对于蛋白质相互作用网络的统计特征的产生发挥着不同的作用;(3)网络模型的无标度性对模型参数是鲁棒的;(4)统计分析表明模型所得结果是可靠的4041 有文献指出上述模型采取的非对称变异与生物事实不相符,故我们对上述模型进行改进,采取对称变异,即原先只对连接到新生成的节点的边以概率随机删除,现在变成对连接到复制与被复制的节点的两条边随机选取一条以概率删除。其它步骤均保持不变,我们进行相同的数值模拟对称性模型42(1)数值模拟结果表明度分布,聚-度系数,度-度关联的结果在定
15、性上与非对称模型保持一致;(2)度分布,聚-度系数,度-度关联的定量结果变化不大;(3)因而对称与非对称变异不是生成生物网络特征的重要因素。我们知道生物系统对环境变化有适应性,但上述模型中没有考虑外界环境对网络增长的影响,因此我们进一步考虑在模型中引进一个新的参数fitness。但由于目前阶段,无法明确fitness的具体生物含义以及它如何影响网络的增长,不失一般性,我们全面考虑以下三种情况:43(1)适应性能够促进节点的复制;(2)适应性对节点的复制没有影响;(3)适应性能够抑制节点的复制;44具体模型过程:(1)度为 的节点以概率被选择复制。其中 的定义如下:当节点i被选择后,则 是个常数
16、,当促进复制时,取正常数 ,当没有影响时=0,当抑制复制时,取负常数 ,我们假定以上三种情况的发生是随机选择的;(2)接下来的变异过程同上述对称模型中完全一样。45ik11P()()/()iijjjikfkfifiiff0046000.250.0350.00025,0.02在,下得到的数值模拟结果与原有模型结果对比47000.250.0350.000250.02在,下得到的数值模拟结果与原有模型结果对比48000.250.0350.000250.02在,下得到的数值模拟结果与原有模型结果对比4950(1)Chaos 2010全球征文 Focus Issue on“Dynamics on Sys
17、tems Biology”(2)发起人:C.A.Brackley,O.Ebenhon,C.Grebogi,A.Moura,M.C.Romano,M.Thiel and J Kurth(3)专刊己出版,共24篇文章,我们文章是唯一的一篇出自中国人文章。国际反应51 发起人在介绍我们工作时指出:Presented here are some highly interesting contributions to this blossoming field of systems biology国际反应52 还指出:12(这儿12代表我们文章)studied a network growth mode
18、l,looking at how a network evolves based on simple rules,with the aim of producing a structure which reflects the topology of a real protein network.国际反应53 Chaos主编David K.Campbell在发给刘的亲笔签名信中指出:These focus issues have proved to be one of the most valuable and widely appreciated services of Chaos for
19、the nonlinear community,and you can be justifiably proud of the inclusion of your article in the issue.国际反应v解析结果v真实生物分子网络的研究v功能模块5455(1)Chaos 2010全球征文 Focus Issue on“Mesoscales in Complex Networks”(2)发起人:Juan A Almendral,Regino Criado,Inmaculada Leyva,Javier M.Buldu and Irene Sendina-Nadal(3)专刊己出版,共
20、12篇文章,我们文章是第二专题的唯一一篇文章。国际反应56 发起人在介绍我们工作时指出:The reader will find out why this mesoscale level has become an important topic of research through the latest advances carried out to improve our understanding of the dynamical behavior of modular networks.国际反应57 还指出:In 9(这儿9代表我们文章),they introduce a useful approach,called“impact strength index”,to measure the interaction between two groups,which takes into account both the heterogeneity and distance among them国际反应58参与本工作的有 蔡水明博士,郝军军博士,许醇穗硕士,万茜硕士,在此表示感谢.59Thank you for your attention!