1、科学家合作网络实证及其创造力模科学家合作网络实证及其创造力模型研究型研究o 曹艳青 蔡勖o华中师范大学物理科学与技术学院一 研究现状二 科学家合作网络实证研究三 科学家创造力模型研究四 展望一研究现状1.2001年,Newman对基于几个不同学科的数据库构成的科学家合作网做了较为系统的分析研究了网络的度分布、最大连通子图规模、聚类系数、最短路径分布等,并提出了一种基于合作频率和合作强度的权值算法2.2002年Barabsi等人则对数学和神经科学领域的合作网演化进行了分析,并且提出了一个演化模型,认为两个节点产生新连边的概率正比于它们的度乘积3.Hirsch将科学家个人h指数定义为:当且仅当某科
2、学家发表的N 篇论文中有h篇论文每篇至少获得了h次的引文数,其余的N 一h篇论文中各篇论文的引文数都h时,此h值就是该科学家的h指数。4.Jose M.Soler 提出了一个合理的科学创造力指数模型iijkijkcxx二复杂网络领域科学家合作网络的实证研究o从美国物理科学杂志(American Physical Society简称APS)搜索的PACS号为89.75.-k(Complex systems)和87.23.Ge(Dynamics of social systems)从2001年1月至2008年3月,共498篇文章,806位作者构成的科学家合作网,考察了该网络的度及其分布,聚集系数,
3、最短路径等基本物理量,分析该网络属于何种基本网络模型。网络构成:节点:科学家(复杂网络领域发表文章的作者)连线:在同一篇文章上署名(合作写文章)网络特点:无权、无向网络科学家网络的度分布,它反映了一位科学家与另外科学家的合作情况。一个节点的度越大,则该节点代表的科学家的合作越密集度及其分布度及其分布1101E-30.010.1 slope=-3.04126pdegree累积度分布累积度分布o累积度分布从图中也可看出,累积度分布所拟合的直线power-law分布更好了,点的分布也更均匀了。110110100 slope=-2.68945N(k)k聚集系数聚集系数o聚集系数反映的是与该科学家合作过
4、的科学家之间是否还有合作。算得的该网络中聚集系数出现了1和0,构成了完全图。1代表这些科学家之间都有合作,构成完全图;0代表都没有合作过。聚集系数为0-1之间则说明这些科学家之间有的合作过,有的则没有,具有一定的聚集效应,形成了一定的集团o度与聚集系数的图可以看到度越小的科学家他们的聚集系数越大,而度越大的科学家的聚集系数反而越小。与偏好连接得到的“富者更富,穷者更穷”是不一样的 1100.11 slope=-0.91151 C(kp)kp网络的最短路径说明了一个节点到达另一个节点最少经过的节点数,而在科学家合作网中最短路径则反映了一个科学家与另外一个科学家之间有联系(间接合作过)需要通过的科
5、学家的人数。得到该网络大多数科学家的最短路径为2,而网络中最大的最短路径(即直径)为7最短路径最短路径 12345670.000.050.100.150.200.250.30 p(L)Lo基本量的平均值可以反映网络的整体性质,该网络的基本量的平均值结果如下表:复杂网络领域科学家合著网基本量复杂网络领域科学家合著网基本量 平均聚集系数平均聚集系数 平均度平均度 平均最短路径平均最短路径 0.719213 2.99008 2.60827 相同尺寸下随机网络的基本量相同尺寸下随机网络的基本量聚集系数聚集系数/N平均最短路径平均最短路径ln(N)/ln0.0065.67oCCrand,LLrando可
6、以得到复杂网络领域科学家合著网具具有无标度的度分布和小世界网络的基本特征。o小结:o通过复杂网络领域科学家合作网络的实证研究我们得到了该网络具有无标度的度分布和小世界的基本特征。属于社会网络中一个很典型的例子。三 科学家创造力模型研究o考察、评价科学家(某一科学领域)的创造力,关键是要选择能够真实体现科学家创造力的、有代表性的评价样本和科学合理、易于操作的评价方法。科学家创造力的大小,主要看其所创造的知识对于知识的再创造所产生的影响力和推动作用如何,科学引文是知识生产与创造中对于人所创造知识表示承认和授予荣誉的最普遍的形式,是评价科学家对某个领域中科技知识增长所做贡献的常用方法。o基本模型与假
7、设o其中Bij表示i(第一作者)和j(第二作者)合作发表的创造力,f(i)是这篇文章所发表的期刊的影响因子,它只决定与第一作者发表期刊的倾向性。表示此时科学家i以第一作者发表的文章数.表示科学家j 以第 一作者发表的文章数.x是我们设置的一个参量.它的变换范围在1到0.5之间.它在一定程度上反映了两位科学家合作时第一作者与第二作者对于此篇文章创造力的贡献程度。kij()*Nik(1)*NjkkBf ixxkikAjkkAo比较科学家以不同的文章数加入时对整个网络的创造力的影响.通过改变参量x的值得到不同的结果 基本结果:1新加入节点以平均值为2的高斯分布加入网络2468101214161820
8、20040060080010001200246810121416182020040060080010001200246810121416182020040060080010001200246810121416182020040060080010001200246810121416182010020030040050060070080090010001100120024681012141618201002003004005006007008009001000110012002468101214161820100200300400500600700800900100011001200nImpact
9、 FactorX=0.9平均创造力随时间演化整个网络影响因子分布2468101214161820200400600800100012002468101214161820200400600800100012002468101214161820200400600800100012002468101214161820100200300400500600700800900100011001200246810121416182010020030040050060070080090010001100120024681012141618201002003004005006007008009001000110
10、012002468101214161820100200300400500600700800900100011001200nImpact Factor x=0.7 平均创造力随时间的演化整个网络的影响因子分布24681012141618202004006008001000120014002468101214161820200400600800100012001400246810121416182020040060080010001200140024681012141618201002003004005006007008009001000110012001300140024681012141618
11、2010020030040050060070080090010001100120013001400246810121416182010020030040050060070080090010001100120013001400246810121416182010020030040050060070080090010001100120013001400nImpact Factor x=0.5 平均创造力随时间的演化整个网络的影响因子分布2.新加入节点以优先连接原则加入网络2468101214161820100200300400500600700800900246810121416182010020
12、030040050060070080090024681012141618205010015020025030035040045050055060065070075080085090024681012141618205010015020025030035040045050055060065070075080085090024681012141618205010015020025030035040045050055060065070075080085090024681012141618205010015020025030035040045050055060065070075080085090024
13、6810121416182050100150200250300350400450500550600650700750800850900nImpact Factorx=0.9 平均创造力随时间的演化整个网络的影响因子分布24681012141618202004006008001000246810121416182020040060080010002468101214161820200400600800100024681012141618205010015020025030035040045050055060065070075080085090095010002468101214161820501
14、00150200250300350400450500550600650700750800850900950100024681012141618205010015020025030035040045050055060065070075080085090095010002468101214161820501001502002503003504004505005506006507007508008509009501000nImpact Factor x=0.7 平均创造力随时间的演化整个网络的影响因子分布246810121416182010020030040050060070080090024681
15、012141618201002003004005006007008009002468101214161820100200300400500600700800900246810121416182010020030040050060070080090024681012141618205010015020025030035040045050055060065070075080085090024681012141618205010015020025030035040045050055060065070075080085090024681012141618205010015020025030035040
16、0450500550600650700750800850900nImpact Factor x=0.5 平均创造力随时间的演化整个网络的影响因子分布第一作者的三维图(横轴是时间(用结点数的增加来表示),纵轴是影响因子,竖轴是结点数)1101000100200300400500600nk作者的度分布o结论:随着参数x的减小,平均创造力的波动较大,第一作者的影响较大o 设定的杂志的影响因子随网络演化波动较大,并不是集中在某个值,对于不同的x值,影响因子处在的峰值也不一样o 两种不同的添加新节点的方法对影响力的程度也不同,在优先连接的原则下,网络的平均创造力随着节点增加而增加,而高斯分布的方式加入新节点,则存在稳定区域o 两种方式加入节点,网络影响因子分布趋势随x减小也有不同展望o科学家的创造力衡量标准o现实网络中文章多而质量低,或是文章价值很高的薄产作者的处理方式o现实吻合的模型(或现实与真实的差距)敬请指教!谢谢!