社会网络分析
一、中心性分析——权力的量化研究
目的:在什么意义上说一个行动者有权力?一个子群体有权力?
指标:点或群体的中心度(centrality)和网络的中心势(centralization)
内容:
“中心性”是社会网络分析的重点之一。个人或组织在其社会网络中具有怎样的权力,或者说居于怎样的中心地位,这一思想是社会网络分析者最早探讨的内容之一。个体的中心度(Centrality)测量个体处于网络中心的程度,反映了该点在网络中的重要性程度。因此一个网络中有多少个行动者/节点,就有多少个个体的中心度。除了计算网络中个体的中心度外,还可以计算整个网络的集中趋势(可简称为中心势)(Centralization)。与个体中心度刻画的是个体特性不同,网络中心势刻画的是整个网络中各个点的差异性程度,因此一个网络只有一个中心势。根据计算方法的不同,中心度和中心势都可以分为3种:点度中心度/点度中心势,中间中心度/中间中心势,接近中心度/接近中心势。
1、点度中心性在一个社会网络中,如果一个行动者与其他行动者之间存在直接联系,那么该行动者就居于中心地位,在该网络中拥有较大的“权力”。在这种思路的指导下,网络中一个点的点度中心度,就可以网络中与该点之间有联系的点的数目来衡量,这就是点度中心度。网络中心势指的是网络中点的集中趋势,它是根据以下思想进行计算的:首先找到图中的最大中心度数值;然后计算该值与任何其他点的中心度的差,从而得出多个“差值”;再计算这些“差值”的总和;最后用这个总和除以各个“差值”总和的最大可能值。
2、中间中心性在网络中,如果一个行动者处于许多其他两点之间的路径上,可以认为该行动者居于重要地位,因为他具有控制其他两个行动者之间的交往能力。根据这种思想来刻画行动者个体中心度的指标是中间中心度,它测量的是行动者对资源控制的程度。一个行动者在网络中占据这样的位置越多,就越代表它具有很高的中间中心性,就有越多的行动者需要通过它才能发生联系。中间中心势也是分析网络整体结构的一个指数,其含义是网络中中间中心性最高的节点的中间中心性与其他节点的中间中心性的差距。该节点与别的节点的差距越大,则网络的中间中心势越高,表示该网络中的节点可能分为多个小团体而且过于依赖某一个节点传递关系,该节点在网络中处于极其重要的地位。
3、接近中心性点度中心度刻画的是局部的中心指数,衡量的是网络中行动者与他人联系的多少,没有考虑到行动者能否控制他人。而中间中心度测量的是一个行动者“控制”他人行动的能力。有时还要研究网络中的行动者不受他人“控制”的能力,这种能力就用接近中心性来描述。在计算接近中心度的时候,我们关注的是捷径,而不是直接关系。如果一个点通过比较短的路径与许多其他点相连,我们就说该点具有较高的接近中心性。对一个社会网络来说,接近中心势越高,表明网络中节点的差异性越大,反之,则表明网络中节点间的差异越小。
二、凝聚子群分析
当网络中某些行动者之间的关系特别紧密,以至于结合成一个次级团体时,这样的团体在社会网络分析中被称为凝聚子群。分析网络中存在多少个这样的子群,子群内部成员之间关系的特点,子群之间关系特点,一个子群的成员与另一个子群成员之间的关系特点等就是凝聚子群分析。由于凝聚子群成员之间的关系十分紧密,因此有的学者也将凝聚子群分析形象地称为“小团体分析”。
1、凝聚子群根据理论思想和计算方法的不同,存在不同类型的凝聚子群定义及分析方法。
1)派系(Cliques)。在一个无向网络图中,“派系”指的是至少包含3个点的最大完备子图。这个概念包含3层含义:①一个派系至少包含三个点。②派系是完备的,根据完备图的定义,派系中任何两点之间都存在直接联系。③派系是“最大”的,即向这个子图中增加任何一点,将改变其“完备”的性质。
2)n-派系(n-Cliques)。对于一个总图来说,如果其中的一个子图满足如下条件,就称之为n-派系:在该子图中,任何两点之间在总图中的距离(即捷径的长度)最大不超过n。从形式化角度说,令d(i,j)代表两点和n在总图中的距离,那么一个n-派系的形式化定义就是一个满足如下条件的拥有点集的子图,即:,对于所有的,,来说,在总图中不存在与子图中的任何点的距离不超过n的点。
3)n-宗派(n—Clan)。所谓n-宗派(n—Clan)是指满足以下条件的n-派系,即其中任何两点之间的捷径的距离都不超过n。可见,所有的n-宗派都是n-派系。
4)k-丛(k-Plex)。一个k-丛就是满足下列条件的一个凝聚子群,即在这样一个子群中,每个点都至少与除了k个点之外的其他点直接相连。也就是说,当这个凝聚子群的规模为n时,其中每个点至少都与该凝聚子群中n-k个点有直接联系,即每个点的度数都至少为n—k。
2、凝聚子群密度凝聚子群的密度(External—Internal Index,E-I Index)
主要用来衡量一个大的网络中小团体现象是否十分严重。这在分析组织管理等问题时十分有用。最糟糕的情形是大团体很散漫,核心小团体却有高度内聚力。另外一种情况就是大团体中有许多内聚力很高的小团体,很可能就会出现小团体间相互斗争的现象。凝聚子群密度的取值范围为[-1,+1]。该值越向1靠近,意味着派系林立的程度越大;该值越接近-1,意味着派系林立的程度越小;该值越接近0,表明关系越趋向于随机分布,看不出派系林立的情形。
E-I Index可以说是企业管理者的一个重要的危机指数。当一个企业的E-I Index过高时,就表示该企业中的小团体有可能结合紧密而开始图谋小团体私利,从而伤害到整个企业的利益。其实E-I Index不仅仅可以应用到企业管理领域,也可以应用到其他领域,比如用来研究某一学科领域学者之间的关系。如果该网络存在凝聚子群,并且凝聚子群的密度较高,说明处于这个凝聚子群内部的这部分学者之间联系紧密,在信息分享和科研合作方面交往频繁,而处于子群外部的成员则不能得到足够的信息和科研合作机会。从一定程度上来说,这种情况也是不利于该学科领域发展的。
三、核心一边缘结构分析
核心一边缘(Core—Periphery)结构分析的目的是研究社会网络中哪些节点处于核心地位,哪些节点处于边缘地位。核心边缘结构分析具有较广的应用性,可用于分析精英网络、科学引文关系网络以及组织关系网络等多种社会现象中的核心一边缘结构。
根据关系数据的类型(定类数据和定比数据),核心—边缘结构有不同的形式。定类数据和定比数据是统计学中的基本概念,一般来说,定类数据是用类别来表示的,通常用数字表示这些类别,但是这些数值不能用来进行数学计算;而定比数据是用数值来表示的,可以用来进行数学计算。如果数据是定类数据,可以构建离散的核心一边缘模型;如果数据是定比数据,可以构建连续的核心一边缘模型。而离散的核心一边缘模型根据核心成员和边缘成员之间关系的有无及关系的紧密程度,又可分为3种:
①核心一边缘全关联模型;
②核心一边缘局部关联模型;
③核心一边缘关系缺失模型。
如果把核心和边缘之间的关系看成是缺失值,就构成了核心一边缘关系缺失模型。这里介绍适用于定类数据的4种离散的核心一边缘模型。
1)核心一边缘全关联模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),另外一组的成员之间没有联系,但是,该组成员与核心组的所有成员之间都存在关系。
2)核心一边缘无关模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),而另外一组成员之间则没有任何联系,并且同核心组成员之间也没有联系。
3)核心一边缘局部关联模型。网络中的所有节点分为两组,其中一组的成员之间联系紧密,可以看成是一个凝聚子群(核心),而另外一组成员之间则没有任何联系,但是它们同核心组的部分成员之间存在联系。
4)核心一边缘关系缺失模型。网络中的所有节点分为两组,其中一组的成员之间的密度达到最大值,可以看成是一个凝聚子群(核心),另外一组成员之间的密度达到最小值,但是并不考虑这两组成员之间关系密度,而是把它看作缺失值。
相关阅读
进入社会后,我们会发现当一个社会人很难,而当一个靠谱的社会人更难。怎样才算是一个靠谱的社会人呢?曾经听过这样一句话,描述什么样的
公益404效果如图设置网站404页面是每个站长的必修课,404页面主要是为了在内容被删除或用户访问了网站没有的页面时提醒用户页面找
2017年被认为是人工智能在全球范围内开始受到极大关注的一年,如果你留意的话,几乎每天都有相关的消息传来:Google母公司Alphabet公开
干货|如何利用Social Listening从社会化媒体中“提炼”
在本文中,笔者将会介绍大数据分析主要的处对象—社会化媒体(Social Media),以及对社会化媒体进行分析的重要手段——社会化聆听(S
在前几天,我在WeMedia私享会的群里,给大家交流了一个话题:自媒体时代如何做社会化营销?当时就有许多朋友想入群,由于是联盟内部共享群,