1、3 强联系和弱联系强联系和弱联系Strong and Weak Ties1学习交流PPT主要内容 引言 三元闭包 弱联系的力量 关系强度、邻里重叠度 嵌入性与结构洞 图的划分2学习交流PPT引言:社会网络,不仅是人类的社会属性社会网络在人类社会体现社会网络在人类社会体现得最丰富,最多姿多彩得最丰富,最多姿多彩人类在社会网络中的行为,人类在社会网络中的行为,是否有生物性的影响因素,是否有生物性的影响因素,如基因?如基因?3学习交流PPT引言 社会网络结构为什么会变化? 社会网络结构有没有什么特性? 结构中是否可能隐含什么社会性含义?4学习交流PPT格兰诺维特的诧异为什么对找工作这种重要的事情,提
2、供有效帮助的为什么对找工作这种重要的事情,提供有效帮助的人更多只是一般熟人,而不是亲近的朋友?人更多只是一般熟人,而不是亲近的朋友?Mark Granovetter, Mark Granovetter, “The Strength of weak tiesThe Strength of weak ties” American Journal American Journal of Sociologyof Sociology, 1973., 1973. Google Scholar Citation 25596 Google Scholar Citation 25596Mark Granovet
3、ter, Mark Granovetter, Getting a Job: A study of Contacts and Getting a Job: A study of Contacts and careerscareers. University of Chicago Press, 1974. University of Chicago Press, 1974.Ties: a combination of the amount of time, the emotional Ties: a combination of the amount of time, the emotional
4、intensity, the intimacy (mutual confiding), and the reciprocal intensity, the intimacy (mutual confiding), and the reciprocal services which characterize the tie. services which characterize the tie. 5学习交流PPT讨论社会网络的一个视角 不仅考虑一个时刻(不仅考虑一个时刻(“快照快照”)上的性质)上的性质 还要研究随时间发生的变化(内部原因还要研究随时间发生的变化(内部原因 vs vs 外部原因
5、)外部原因)现象现象原理原理时间时间6学习交流PPT主要内容r三元闭包r弱联系的力量r关系强度、邻里重叠度r嵌入性与结构洞r图的划分7学习交流PPT三元闭包(闭合) 社会网络演化的基本结构性原因社会网络演化的基本结构性原因 Anatole RapoportAnatole Rapoport(阿纳托尔(阿纳托尔 拉波波特,拉波波特,19531953)如果两个互不相识的人有了一个共同的朋友,则他们俩如果两个互不相识的人有了一个共同的朋友,则他们俩将来成为朋友的可能性提高将来成为朋友的可能性提高。机会?机会? opportunity opportunity信任?信任? trust trust动机?动机
6、? incentive incentive当前时刻当前时刻一段时间后一段时间后8学习交流PPT三元闭包原理的拓展 两两个个人人的的共共同同朋朋友友越越多,多,则则他他们们成成为为朋朋友友的的可可能能性性越越高高 这这是是从从“量量”方方面面的的拓拓展展 两两个个人人与与共共同同朋朋友友的的关关系系越越密密切,切,则则他他们们成成为为朋朋友友的的可可能能性性越越高高 这这是是从从“质质”方方面面的的拓拓展展 三三个个原原因因(机机会、会、信信任、任、动动机)机)的的作作用用在在这这些些拓拓展展的的意意义义上上保保持持一一致致9学习交流PPT三元闭包:哪一种情形更有可能 如何验证这种认识的正确性(
7、程度)?如何验证这种认识的正确性(程度)?现在现在一段时间后一段时间后10学习交流PPT利用在线数据研究三元闭包的例子 电子邮件网络电子邮件网络社会网络社会网络 节点:一定范围的邮件地址(例如一个大学)节点:一定范围的邮件地址(例如一个大学) 边:一段时间(例如两个月)里有双向邮件通信边:一段时间(例如两个月)里有双向邮件通信 网络的演化网络的演化 什么叫两个相继的网络快照?什么叫两个相继的网络快照? 两个相继的快照是否能说明问题?(采用大量快照对的两个相继的快照是否能说明问题?(采用大量快照对的平均,以回避偶然性)平均,以回避偶然性) 如何定义考察三元闭包现象的测度?如何定义考察三元闭包现象
8、的测度? 当前当前共同朋友数与共同朋友数与后来后来成为朋友的概率关系成为朋友的概率关系11学习交流PPT结果及其含义 定量分析定量分析 vs vs 定性结论定性结论在电子邮件网络在电子邮件网络上三元闭包迹象上三元闭包迹象明显共同朋明显共同朋友有助于关系的友有助于关系的建立建立“Empirical Analysis of an evolving social network,” Science 200612学习交流PPT刻画三元闭包的体现:节点聚集系数节点节点A A的的聚集系数聚集系数 = A = A的任意两个朋友之间也是朋的任意两个朋友之间也是朋友的概率(即邻居间朋友对的个数除以总对数)友的概
9、率(即邻居间朋友对的个数除以总对数)1/63/613学习交流PPT社交网中关系的强度 假若我们可以让一个社交网假若我们可以让一个社交网中的每个人报告他和其邻居中的每个人报告他和其邻居关系的强度关系的强度 这里为简单起见,只分为这里为简单起见,只分为“强强”与与“弱弱” 注一:这并不是不可能,甚至是可以注一:这并不是不可能,甚至是可以“测量测量”的的 注二:强度也可以是一个区间中的数值注二:强度也可以是一个区间中的数值14学习交流PPT强三元闭包强三元闭包原理(三元闭包思想的一种延伸)强三元闭包原理(三元闭包思想的一种延伸)如果如果A-BA-B和和A-CA-C之间的关系为强关系;则之间的关系为强
10、关系;则B-C B-C 之间形成之间形成边的可能性应该很高边的可能性应该很高若若A A有两个强关系邻居有两个强关系邻居B B和和C C,但,但B-CB-C之间没有任何之间没有任何关系(关系(s s或或w w),则称节点),则称节点A A违背了强三元闭包原理违背了强三元闭包原理如果节点如果节点A A没有违背强三元闭包原理,则称节点没有违背强三元闭包原理,则称节点A A符合强三元闭包原理符合强三元闭包原理注意:一个节点是否符合强三元闭包是严格定义的,即在一注意:一个节点是否符合强三元闭包是严格定义的,即在一个标注网络中,每个节点要么个标注网络中,每个节点要么“符合符合”,要么,要么“违背违背”15
11、学习交流PPT哪些节点符合违背强三元闭包?S S16学习交流PPT弱联系的力量:桥,捷径 桥桥:具有特别性质的边,:具有特别性质的边,删除它,其两个端点之间删除它,其两个端点之间就不再有路就不再有路 删除它,增加图的连通分删除它,增加图的连通分量的个数量的个数 捷径捷径(Local Bridge)(Local Bridge):也:也是一种边,删除它,两个是一种边,删除它,两个端点之间的距离至少为端点之间的距离至少为3 3 桥可以看成是捷径的特例桥可以看成是捷径的特例17学习交流PPT捷径 = 弱关系?断言:断言:若节点若节点A A符合强三元闭包,且至少有两符合强三元闭包,且至少有两个强关系邻居
12、,则与个强关系邻居,则与A A相连的任何捷径必定意味相连的任何捷径必定意味着是弱关系着是弱关系r纯数学的证明,得到了一个具有社会学意义的结论,纯数学的证明,得到了一个具有社会学意义的结论,这个结论将一个局部概念(关系)和一个全局概念这个结论将一个局部概念(关系)和一个全局概念(捷径)连接了起来(捷径)连接了起来反证法:假设A至少涉及两个强联系边,A与B之间有一条捷径相连,且该捷径为强联系。需证明以上假设不成立。由于A、B间的边为捷径,则A和B必没有共同的朋友,即B-C边不存在;由于A-B、A-C均为强联系,根据强三元闭包性质,B-C边必然存在。两者相悖,假设不成立。18学习交流PPT在一定条件
13、下:捷径弱关系 上述结论的实质:两人关系的强度如何与是否有共上述结论的实质:两人关系的强度如何与是否有共同朋友相关(不等价)同朋友相关(不等价) 捷径意味着没有共同朋友,强度为捷径意味着没有共同朋友,强度为“弱弱” 统计推论:共同朋友越多,关系强度越高统计推论:共同朋友越多,关系强度越高 准确些,可以说共同朋友数在总朋友数中的占比(邻里准确些,可以说共同朋友数在总朋友数中的占比(邻里重叠度)重叠度) 这样的认识如何验证?这样的认识如何验证? 从从“推论推论”到到“结论结论”用什么社交网络?如何定义关系的强度?用什么社交网络?如何定义关系的强度?19学习交流PPT在手机通信网上的数据结果在手机通
14、信网上的数据结果 美国全国人口的美国全国人口的2020, 18 18周周的通信数据的通信数据 节点:手机号节点:手机号 边:通话关系边:通话关系 关系强度:通话时长关系强度:通话时长横轴表示边的关系强度(由低到高,)横轴表示边的关系强度(由低到高,)纵轴表示有关系的两个人的纵轴表示有关系的两个人的“邻里重叠度邻里重叠度”曲线走向表明这两个量正相关曲线走向表明这两个量正相关Onnela, Structure and tie strength in mobile communication networks,PNAS 2007关系强度、邻里重叠度20学习交流PPTThe stability of
15、the mobile communication network to link removal Onnela J et al. PNAS 2007;104:7332-733621学习交流PPT实例1-Facebookr定定义义三三种种类类型型连连接接(不不排排他)他) 保保持持联联系系 单单向向关关系系 相相互互关关系系r理理解解: :如如何何将将所所声声明明的的好好友友关关系系转转化化为为关关系系程程度度不不同同的的实实际际社社会会交交互互模模式式22学习交流PPT实例1-Facebooka) a) 所有朋所有朋友友b)b)保持关系保持关系c)c)单向关系单向关系d)d)相互关系相互关系2
16、3学习交流PPT实例1-Facebook结论结论1 1:即便公布的朋友总数:即便公布的朋友总数很大,但实际联系的在很大,但实际联系的在10-2010-20人人之间,关注的人数不到之间,关注的人数不到5050结论结论2 2:类似:类似FacebookFacebook这样的这样的媒介能够促进这种关注关系,媒介能够促进这种关注关系,使得信息通过紧密联系的网络使得信息通过紧密联系的网络快速传播出去快速传播出去24学习交流PPT实例2-Twitter 定定义:义: 弱弱关关系:系:关关注注许许多多人人的的消消息息而而无无需需直直接接交交谈谈 强强关关系:系:直直接接发发消消息息给给特特定定的的人人 实实
17、验:验: 弱弱关关系:系:追追随随对对象象个个数数 强强关关系:系:至至少少转转发发了了两两条条消消息息25学习交流PPT实例2-Twitter 结论:即使有大量的在线弱关系的用户,但强关系的数结论:即使有大量的在线弱关系的用户,但强关系的数量仍然相对不大量仍然相对不大26学习交流PPT嵌入性与结构洞 社会网络结构的一个基本意象社会网络结构的一个基本意象 用桥(或捷径,或邻里重叠度很低的边,用桥(或捷径,或邻里重叠度很低的边,弱关系弱关系)连接起来的相对比较密集互连的节点群连接起来的相对比较密集互连的节点群 其中,其中,A具有很高的聚具有很高的聚集系数,值得特别讨论集系数,值得特别讨论 嵌入性
18、:边的嵌入性为嵌入性:边的嵌入性为其两个端点的共同邻居其两个端点的共同邻居数量数量网络邻里有很强的三元网络邻里有很强的三元闭包特征闭包特征她有什么利弊?她有什么利弊?27学习交流PPT结构洞 其中,那些是多个桥的其中,那些是多个桥的端点的节点(端点的节点(B)值得)值得特别讨论特别讨论聚集系数较低聚集系数较低她与群组内部的节她与群组内部的节点(点(A A)相比,有什)相比,有什么利弊?么利弊?怎样与她打交道?怎样与她打交道?结构洞结构洞28学习交流PPT社会资本 “在文献中关于社会资本的共识正在提高,它在文献中关于社会资本的共识正在提高,它代表着执行者通过其在社会网络或其他社会结代表着执行者通
19、过其在社会网络或其他社会结构中的成员地位保障其利益的能力。构中的成员地位保障其利益的能力。”波斯特教授波斯特教授 之前所有论点,都是围绕从一个社会结构中推之前所有论点,都是围绕从一个社会结构中推导个体和群体利益的框架展开的,这就与社会导个体和群体利益的框架展开的,这就与社会资本(资本(social capitalsocial capital)的概念相关。)的概念相关。参考文献:参考文献:1 1、Coleman J S. Social capital in the creation of human Coleman J S. Social capital in the creation of h
20、uman capitalJ. American journal of sociology, 1988: S95-S120.capitalJ. American journal of sociology, 1988: S95-S120.2 2、 Lin N. Social capital: A theory of social structure and Lin N. Social capital: A theory of social structure and actionM. Cambridge university press, 2002.actionM. Cambridge unive
21、rsity press, 2002.29学习交流PPT社会资本 “社会资本社会资本”的表述方式使它成为一系列不同的表述方式使它成为一系列不同形式资本的一种形式资本的一种 物理资本和人力资本物理资本和人力资本詹姆斯詹姆斯科尔曼科尔曼 经济资本与文化资本经济资本与文化资本皮埃尔皮埃尔布迪厄布迪厄 社会资本含义变化的重要来源:社会资本含义变化的重要来源:1 1、社会群体特性与个体特性、社会群体特性与个体特性2 2、属于群体内在特性或群体与外界的交互、属于群体内在特性或群体与外界的交互博尔加蒂、琼斯、埃弗里特博尔加蒂、琼斯、埃弗里特参考文献:参考文献:Borgatti S P, Jones C, Ev
22、erett M G. Network measures of social Borgatti S P, Jones C, Everett M G. Network measures of social capitalJ. Connections, 1998, 21(2): 27-36.capitalJ. Connections, 1998, 21(2): 27-36.30学习交流PPT社会资本 基基于于社社会会资资本本的的概概念,念,我我们们可可以以将将社社会会结结构构看看成成是是个个体体和和群群体体有有效效行行动动的的助助推推器器 社社会会资资本本提提供供了了一一种种讨讨论论不不同同结结构构
23、带带来来不不同同方方面面好好处处的的方方式式 而而网网络,络,是是这这些些研研究究的的中中心,心,既既有有紧紧密密关关联联的的群群体,体,使使得得人人们们相相互互信信任,任,又又有有群群体体间间的的连连接,接,使使得得不不同同群群体体的的信信息息得得到到融融合合31学习交流PPT图的划分1:教练34.:创始人?32学习交流PPT图的划分33学习交流PPT图的划分 如何刻画社会网络中如何刻画社会网络中“相互紧密连接的相互紧密连接的节点群节点群”?能否有一种精确的方法将它?能否有一种精确的方法将它们找出来?们找出来? 分割法分割法 逐步去掉逐步去掉“跨接边跨接边” 聚集法聚集法 “滚雪球滚雪球”3
24、4学习交流PPTGirvan-Newman方法(一种分割法)(一种分割法) 最先应该删除哪最先应该删除哪条边?条边? 可以可以“一层层一层层” 进行进行35学习交流PPT如何发现那些最“弱”的边? 或者或者“最关键最关键”的边:许多节点之间的最短路径的边:许多节点之间的最短路径都要经过它都要经过它 介数介数(betweenness)(betweenness):一条边承载的一种:一条边承载的一种“流量流量” 两个节点两个节点A A和和B B,设想,设想1 1个单位的流量从个单位的流量从A A到到B B,均分到它,均分到它们之间所有的最短路径上们之间所有的最短路径上 K K条路径,则每条路径上分得
25、条路径,则每条路径上分得1/k1/k 若一条边被若一条边被m m条路径共用,则在它上面流过条路径共用,则在它上面流过m/km/k 所有节点对都考虑后,一条边上的累记流量就是它的介所有节点对都考虑后,一条边上的累记流量就是它的介数数36学习交流PPT逐步删除高介数边:例 b(7,8) = b(7,8) = 4949 两边各两边各7 7个节点,都要经过个节点,都要经过它,它,7 77 7;7 7个节点内部则个节点内部则不经过不经过 b(3,7)=b(6,7)=b(8,9)=bb(3,7)=b(6,7)=b(8,9)=b(8,12) = 33(8,12) = 33 3 37 73 34 4 b(1,
26、3)=b(1,3)= = 12 = 12 涉及涉及1 1和和3-143-14等等1212个节点个节点 b(1,2)=b(1,2)= b(13,14) = 1 b(13,14) = 1 仅涉及仅涉及1 1和和2 2两个节点两个节点去掉最高介数边后,重新计算剩下的去掉最高介数边后,重新计算剩下的37学习交流PPT介数计算的一种算法 从一个节点(从一个节点(A A)开始,做宽度优先搜索,将节点)开始,做宽度优先搜索,将节点分层(以便于下面的步骤)分层(以便于下面的步骤) 确定从确定从A A到其他每个节点的最短路径的条数到其他每个节点的最短路径的条数 确定当从节点确定当从节点A A沿最短路径向其他所有
27、节点发送沿最短路径向其他所有节点发送1 1个单位流量时,经过每条边的流量个单位流量时,经过每条边的流量对每一个节点,重复上述过程,累计,对每一个节点,重复上述过程,累计,除以除以2 2,即得每条边的介数,即得每条边的介数38学习交流PPT例:从A开始做广度优先搜索 从从A A到到K K有多少条最短路径?(系统化方法)有多少条最短路径?(系统化方法) 层次就是最短路径的长度(距离)层次就是最短路径的长度(距离)39学习交流PPT自上而下:自上而下:每个节点到每个节点到A A的路径数,等的路径数,等于它上面节点于它上面节点路径数之和。路径数之和。最短路径的条数?最短路径的条数?40学习交流PPT自
28、底向上:自底向上:根据最短路径数的根据最短路径数的分布,确定每条边分布,确定每条边上的流量上的流量注意:注意:每个节点得到的单位流量每个节点得到的单位流量在其上面的边上按最短路在其上面的边上按最短路径数的比例分配径数的比例分配想象从节点想象从节点A A,沿最短路,沿最短路径,向每个其他节点发出径,向每个其他节点发出了一个单位的信息流了一个单位的信息流注意:流入节点的流量减注意:流入节点的流量减去留在节点上的单位流量去留在节点上的单位流量等于流出节点的流量等于流出节点的流量41学习交流PPT小结 计算出 边的阶数、节点的阶数 Girvan-Newman方法适用于中型网络 寻找快速处理极大规模数据
29、的图划分方法,依然是人们很感兴趣的一个研究主题42学习交流PPT一些近期的研究成果Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives by Nicholas A. Christakis & James H. Fowler43学习交流PPT The influence of actions ripples through networks 3 degrees (to and from your friends friends friends) rInfluence dissipat
30、es after 3 degrees because:mIntrinsic decay: corruption of informationmNetwork Instability: social ties become unstable at 4+ degrees of separationmEvolutionary Purpose: we evolved in small groups where everyone was connected by 3 degrees or less44学习交流PPT A person is 15% more likely to be happy if d
31、irectly connected to a happy person (1 degree) At 2 degrees 10% more likely to be happy At 3 degrees 6% more likely to be happy Each unhappy friend deceases the likelihood of happiness 7%If You Wanna Be Happy45学习交流PPTAn increase of $10,000 of income per year yields only a 2%2% increase chance in hap
32、piness. Compare that to a 15%15% chance from a happy friend and a a 6-10%6-10% from someone you may have never met, but to whom you are indirectly tied! Photo by Andy PerkinsPhoto by Minoria HindsIf You Wanna Be Happy46学习交流PPTThe Obesity “Epidemic”Your Friends Friends Can Make You FatPhotos by Colin
33、 Rose and Sherrie G47学习交流PPT 66% of Americans are overweight or obese From 1990 to 2000, the percentage of obese people in the USA increased from 21% to 33%19751990Green Node: nonobeseYellow Node= obese (size of circle is proportional to BMI)The Obesity “Epidemic”48学习交流PPT总结 网络无处不在,行行色色,对社会影响巨大网络无处不
34、在,行行色色,对社会影响巨大 网络作为一门课程学习的两个重要角度:网络作为一门课程学习的两个重要角度:结构、行结构、行为;为;它们不同但相互影响它们不同但相互影响 图论:讨论网络结构的语言图论:讨论网络结构的语言 强连接引发行为,弱连接传递信息强连接引发行为,弱连接传递信息49学习交流PPT总结-(续) 社会学家:关心社会网络的角度与几个经典成果社会学家:关心社会网络的角度与几个经典成果(三元闭包,关系强度,结构洞)(三元闭包,关系强度,结构洞) 网络演化的结构性原因网络演化的结构性原因 原因后面的社会学含义原因后面的社会学含义 计算机科学家:研究社会网络的角度与基本方法计算机科学家:研究社会网络的角度与基本方法(利用获得(利用获得OSNOSN数据的可能性)数据的可能性) 考察社会网络研究的经典结果在考察社会网络研究的经典结果在OSNOSN上的体现上的体现 在在OSNOSN上发现具有社会学意义的新性质上发现具有社会学意义的新性质 关系强度研究展现出的范式:观察,假说,假说的论证关系强度研究展现出的范式:观察,假说,假说的论证(抽象、证明),数据验证(抽象、证明),数据验证50学习交流PPTrQ & A51学习交流PPT