




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、介绍了指数随机图( P * )社交网络模型(加里罗宾斯,皮普派特森,尤瓦尔卡利什,院长Lusher)心理学系,行为科学,墨尔本大学商学院。 3010 ,澳大利亚 摘要:本文提供的介绍总结,制定和应用指数随机的图模型的社交网络。网络的 各个节点之间的可能的关系被认为是随机的变量和假设,这些随机的领带变量 之间的依赖关系确定,一般形式的指数随机图模型的网络。不同的相关性假设 的例子及其相关的模型,给出了包括伯努利,对子无关,马尔可夫随机图模型。 在社会选择机型演员的加入属性也被审查。更新,更复杂依赖的假设进行了简 要介绍。估计程序进行了讨论,其中包括新的方法蒙特卡罗最大似然估计。我 们预示着在其它
2、组织了讨论论文在这款特别版:弗兰克和施特劳斯的马氏随机 图模型 弗兰克,澳,施特劳斯, D., 1986年马氏图。杂志美国统计协会 81, 832-842 不适合于许多观察到的网络,而 Snijders 等人的新的模型参数。Snijders , TAB派特森,P.,罗宾斯,GL, Handock M.新规范指数随机图模 型。社会学方法论,在记者 提供实质性的改善。关键词: 指数随机图模型 ;统计模型的社交网络 ; P * 模型在最近几年,出现了在指数随机图模型对于越来越大的兴趣社交网络,通常 称为 P * 类车型(弗兰克和施特劳斯, 1986; 派特森和沃瑟曼, 1999;罗宾斯等 人, 19
3、99; 沃瑟曼和帕蒂森, 1996 年)。这些概率模型对一组给定的演员网络 允许泛化超越了早期的P1模型类(荷兰和Leinhardt ,1981年)的限制二元独 立性假设。因此,它们允许模型从社会行为的结构基础的一个更为现实的构建。 这些模型车的研究多层次, multitheoretical 假说的有效性一直在强调(例如, 承包商等, 2006)。已经有一些自 Anderson 等重大理论和技术的发展。( 1999)介绍了他们对P * 型号知名底漆。我们总结了本文上述的进步。特别是,我们认为重要的是在 概念上从依赖假设的衍生地,这些模型,模型的基本依据,然后作出了明确, 并与有关(不可观察)社
4、会进程底层网络的形成假说更容易联系。正是通过新 的模式,可以开发一个有原则的方式,包括结合了演员的属性模型这样的做法。 在模型规范和估计最近的发展需要注意的是,因为这样做就设置结构和部分新 技术的步骤依赖的假设,不仅扩大了级车型,但具有重要意义的概念。特别是, 我们现在有一个更好的了解马尔可夫随机图,和有前途的新规格的性能已经提 出来克服他们的一些不足之处。本文介绍了模型,并总结当前方法的发展与扩展概念的阐述(更多技术总 结最近被沃瑟曼和罗宾斯, 2005 年定; 知更鸟和派特森, 2005; Snijders 等人, 出版。)我们首先简要介绍理分析社交网络的统计模型(第 1 节)。然后,我
5、们提供指数随机图模型的基本逻辑进行了概述,并概述我们框架模型构建(第 2节)。在第 3 节中,我们讨论的重要概念一个依赖假设的建模方法的心脏。 在第 4 节中,我们提出了一系列不同的相关性假设和模型。对于模型估计(第 5章),我们简单总结伪似然估计(PLE的方法,并检讨最近的事态发展蒙特 卡罗马尔可夫链最大似然估计方法。在第 6 节中,我们提出拟合模型,网络数据的简单的例子。总之,我们注意到的重要性新的型号规格是关注在这款特别 版的其他论文的重点。1. 为什么模型的社交网络?有许多公知的技术,用于测量网络性能的节点,或节点的子(如密度,中心 性和凝聚力的子集)的。这些技术服务有价值的目的,描述
6、和理解的网络功能, 可以承受在特定的研究问题。那么,为什么我们会想要超越这些技术和搜索合 身的一个观察到的社交网络的模型,特别是一个统计模型?原因这样做有以下 内容:( 1) 社会行为是复杂的,并且随机模型使我们能够同时捕获的规律在该过程 引起网络的联系,而在同一时间识别存在是可变性,我们是不太可能能 够进行详细建模。此外,如瓦( 1999)已令人信服地证明,“加入”少 量随机性的,否则便会定期进程可以极大地改变了这一进程的可能结果 的性质。它是因此,重要的是要允许的随机性,如果我们认为它最能反 映过程我们的目标模型。也许最重要的是,良好的特定的随机模型使我 们要了解与观察到的结果的不确定性:
7、我们可以了解可能结果的模型一 个给定的规格分布,或者我们可以估算,对于给定的观察到的数据,从 该数据可能已被产生的虚拟模型的参数(并且也获得与其相关联的不确 定性的定量估计估计)。( 2) 统计模型也允许关于是否特定网络子结构的推论 - 通常由一个或少量的 参数所表示的模型 - 在网络中被更普遍观察到可能比偶然预期。那么我 们可以假设开发了解可能产生这些结构性质的社会过程。( 3) 有时,不同的社会进程可能会做出类似的网络质量预测结构,它只有通 过仔细的定量模型,在预测的差异进行评估。例如,群集在网络可能产 生的内源性(自组织)结构的影响(例如,结构平衡),或者通过节点 级效果(例如,同质性)
8、。要在两个方案之间作出决定,需要一个模型, 结合这两种效应,然后评估每个的相对贡献。( 4) 在更复杂的网络上的数据结构,更有用的适当配制的模型可以在实现高 效的表示。值得注意的是,有 avariety 的确定性方法 FO ranalyzing 单 个二进制网络,但其中许多都是不恰当的,或者是太复杂,对于更复杂 的数据。为了了解网络的演进( Snijders ,2001)或多个网络结构(Lazega和派特森,1999),模型可以有很大的价值。( 5) 在社会网络分析的几个长期存在的问题,涉及到如何本地化的社会过程 和结构结合起来,形成全球网络模式,而这种本地化的进程是否足以说 明全球网络性能的
9、谜题。它是难以调查这些问题没有一个模型,如在所 有的除了相当简单的情况下,由许多小规模结构的组合所造成的全球结 果没有立即明显,即使是定性的。具有良好的本地指定型号的社交网络, 它可能会穿越这条微宏的差距,往往是通过模拟。我们特别强调显影可信模型,这些模型可估计从数据并因此经验为基础的 值。有多种型号的网络文学,这对于模拟,假设生成的重要工具,而“思想实验”。但是,我们的主要目标是估算数据模型的参数,然后评估如何充分的模 型表示的数据。这些互补的方法成为有用的,但不同的目的,用数据驱动的方 法显然是其支撑结构的模型假设的实证审讯能力的独特价值。2后面的 P * 模型对社会的逻辑网络,大纲我们描
10、述了作为观测到的网络的研究者已收集并且可以在网络数据有兴趣 建模。所观察到的网络是从一组可能的看作一个实现网络具有类似的重要特征 (至少是,行动者的数量相同),即是,由于一些(未知)的随机过程的结果。 换句话说,观察到的网络被看作是关系一个特定图案出一大组可能的图案。在 一般情况下,我们做不知道什么随机过程产生所观察到的网络和我们在制定目 标模型是提出一种可行的和理论上的原则假设此过程。例如,我们的研究课题之一可以是是否在所观察到的网络有显著更多,或 者更少,感兴趣结构特征比偶然预期。我们可能会看到这些特性当地社会进程 的成果。例如,我们可能会问的莫雷诺和詹宁斯( 1938 年)的统计数据,社
11、交 网络的第一个应用程序做了观察网络是否显示了对等的强烈倾向,超出了一些 回报的关系,如果关系的机会亮相发生完全是随机的。换句话说,你所观察到 的网络中的行动者往往回报关系的选择?这里的结构特点(投桃报李的关系) 是一个社会过程(个人选择来回报他人的选择)的结果。因此,作为一个简单 的例子,我们可以断定一个随机网络模型具有两个参数,一个反映的倾向关系 发生在随机和一种反映了一个额外的倾向往复运动的发生。在一般情况下,在质询帮助的结构特性来塑造模型的形式。一一个对等进 程的假设使我们提出一个模型,其中所述电平的指标互惠是参数。这个假设也 反映了什么样的期望网络更容易。对于一个给定的演员组成的网络
12、统计模型分 配概率就这些演员的所有可能的网络。例如,由于互惠关系是通常观察到的功 能,在友谊网络,良好的模式很可能意味着网络与往复运动是比较常见和网络 没有回报是相当不可能的。正如往常一样,我们代表的网络节点和边的图。对于一个给定的模型,所 述节点集合被认为是固定的。可能的网络的范围内,和它们发生的概率该模型 下,通过在该组的所有可能的曲线图上的概率分布表示同节点的这个号码。在 图的这种分布,这些图表有大量的水平往复运动都可能具有比图少往复运动的 概率较高,具有取决于相关的参数,值的精确概率,如对等参数。需要注意的 是所观察到的网络是在该分布的特定图形,所以它也具有特定概率。当然,在一开始,我
13、们不知道在分配概率在分布图形要使用的参数值。我 们的目标,更确切地说,是要找到最好的值(通过估算模型用所观察到的网络 作为引导参数)。必要的最大似然准则是选择的参数值以这样一种方式,往复 运动的最可能的程度是这发生在所观察到的网络。如果模型有一个对等的参数 (定义为零时相互关系发生偶然的),如果有,在许多往覆关系观测到的网络, 则一个模型,它是一种非常适合于数据中往复运动的程度方面将产生积极的对 等参数。如果我们估计互惠参数的观测网络,如果我们可以相信,这个参数是 正的,我们可以推断,还有更多互惠中所观察到的网络不是偶然的预期。一旦我们定义该组的所有图形的概率分布与节点的一个固定数目的,我们
14、也可以从分配根据分配给它们的概率绘制图形随机的,并且我们可以在任何其 他比较采样的曲线图,以观察到的 1 感兴趣的特征。如果该模型是一个很好的 数据,然后将采样的图形将类似于所观察到的 1 在很多不同的方面。在这种理 想的情况下,我们甚至可以推测这种建模的结构效应可以解释在网络的出现。 我们可以以了解网络,有可能从这些影响出现的性质研究采样图形的属性。作为一个例子,考虑在一所学校的教室友谊。所观察到的网络是为我们所 测得的友谊关系网络。有可能已经观察到对于特定的教室许多可能的网络。我 们检查了教室里所有可能的网络结构的情况下观察到的友谊结构在教室里。一 些结构在教室可以是相当容易和一些不太可能
15、发生,和该组所有可能的结构, 有关其相应的机率一些假设是曲线图上的概率分布。我们把观察到的这个网络 中的分布,而不是在其他教室观察网友谊网络进行比较。(当然,我们的模型 中所观察到的网络也可以是用于其它教室的良好模型,但是这并不是问题,在 这一点上)。注意,假设是,网络是由一个随机过程,其中关联关系进入在于,可通过 其它关系(和可能的节点级属性)的存在或不存在的形状的方式被产生。换句 话说,网络被概念化为关系型关系的自组织系统。实质上,索赔是有产生二元 关系,当地的社会进程,而这些社会过程可能取决于周围的社会环境(即在现 有的关系)。例如,我们可以假设,具有类似属性的行动者更可能形成友谊关 系
16、(同质性),或者,如果两个未连接的参与者被连接到第三演员,在某些时 候,他们有可能形成它们之间的友好提携(及物)。需要注意的是,除了随机 性的假设,这种描述也隐时间和动态。2.1 。为模型构建的总体框架在并主张指数随机图模型的社交网络,研究员隐含如下五个步骤。而研究 的重点是参数估计和解释的最后一步,它是通过所有的五个步骤,一个研究人 员,使连接理论的决策数据分析明确的选择。正如图所示,正是通过这些前面 的步骤,我们可以对指数随机图模型的专栏中查找某些早期的网络模型。2.1.1 。步骤 1:每个网络领带被视为随机变量这一步意味着与固定节点集合的随机框架。通过假设领带是我们不意味着 人们形成一种
17、特定的方式关系的随机变量:有些关系可能是很可能发生的。相 反,我们只是指出我们不知道的一切关系的形成,我们的模式是不会做出完美 的确定性预测,并因此有一些将要统计的“噪音”,或缺乏规律性,即我们不 能成功地解释。可能的网络关系建立为随机变量,应及时复习一些基本的符号。对于每个i和j谁是一组n个参与者的N个不同的成员,我们有一个随机变量丫 IJ其中Y IJ= 1 ,如果是从演员一个网络领带 i 到演员 j 以及其中 Y IJ=0 ,如果存在 就是不打领带。我们指定 丫 IJ 作为变量 丫 ij 的观测值,我们让 丫为所有变量 的矩阵为 丫观测关系的矩阵,所观察到的网络。当然, y 可能也被解释为
18、对节 点集合N的曲线图,与由那些对(I , J)为且y IJ=1指定的边集。丫可以被引 导(其中当丫 ij是杰出的选自丫声)或无定向(其中丫 IJ= 丫声和两个变量没 有区别)。它也可以为 y 将被重视,虽然本文中,我们将限制注意二元关系。2.1.2 。步骤 2:一个依赖假说提出,定义网络变量之间的意外这一假说体现了假设生成网络联系当地的社会过程。例如,关系可以认为 是相互独立的,也就是说,人们形成独立的其它的社会联系的社会关系。这通 常不是一个非常现实的假设。在学校教室的地方互惠的过程,的例子,如果一 个学生喜欢的学生B,那么学生B很有可能像学生一个暗示某种形式的二元依 赖。领带也可能取决于
19、节点级属性(见下文第 4.4 节),与在课堂实例可能同 质性的影响。请注意,这些过程可以表示为一个小规模的图形配置:例如,一 个投桃报李的领带,或者两个女孩之间的纽带 。2.1.3 。步骤 3:将依赖假设暗示某一特定形式的模型可以证明,以及指定的依赖假设意味着某一类车型(在哈默斯利 - 克利 福德定理, Besag, 1974年) 。每个参数对应于网络中的结构,即,可能的网 络关系(和 / 或演员的属性,尽管这是购买)的一小部分。这些配置的利益(例 如,往复式 cated 关系)的结构特点,上文提到的。该模型则表示其被假定为 从由配置所表示的本地化模式“建立”随机图的分布。例如,一个单一的领带
20、 是一个配置,可能是投桃报李领带(有向图),一个传递黑社会和二星级。与 每个所观察到的曲线图,这些配置中的存在的参数可以被包括在模型中。依赖假设和模型的一般形式在下文第 3节中讨论。特别依赖的假设都在第 4 节。2.1.4 。第 4 步:通过同质性或其他方面的限制简化参数为了清楚地定义了一个模型,我们需要减少参数的数量。这通常是通过征 收同质化约束进行。实际上,我们问一些参数是否等同于或以其他方式有关。 例如,我们通常建议对于整个网络的互惠效果的一个参数,通过假设互惠参数 为每个可能的往复式领带都是平等的。对于特定型号的参数约束中示出了第 4 节。2.1.5 。第 5 步:评估和解释模型参数当
21、然,估计和解释通常是特定的研究应用重点,但在到达这一步意味着, 其他四个都已经进行,即使只是含蓄。这个步骤是复杂的,如果相关结构是复 杂的,因为它可能需要为任何现实的模型。具有得到的参数估计值,以及估计 的不确定性的估算值,我们可以随后采取具有对于从可指定依赖的假设构成的 网络中的统计模型的充分利用,并且从观察到的网络数据进行估计。例如,我 们可以探讨通过模型,这一步骤可以是非常有益的评价有多好,模型预测结果 的网络的范围,我们可以对模型参数的推断。例如,我们可以推断出任何模型 参数是否显著不同于零,并因此进行相应的配置是否存在于所观察到的曲线图, 以或大或小的程度比偶然预期的,给定的其它参数
22、值。我们讨论了参数估计中 的第 5节。3指数随机图模型的一般形式为:依赖的假设和参数约指数随机图模型有如下形式:exp其中,(i )的总和超过所有配置 A; (ii) n A是对应于结构的参数(并且是非 零仅当在A中的所有对变量被假定为有条件地依赖);(三)克(Y) =?IJ A ?ij是对应于配置的网络统计数据;克(丫)=1,如果在网络中y为观察到的结 构中,并且是0;否则返回(iv) k是一个归一化量可确保(1)是一个适当的 概率分布。所有指数随机图模型方程的形式。(1),其描述了图的上n个节点的一 般概率分布。观察任何特定的图表 丫在该分布的概率由下式给定的,而这种概 率取决于两个对统计
23、克(y)的在网络y和对各非零参数n,一种用于在所有配 置中甲该模型。配置可能包括投桃报李的关系,传递黑社会等等,因此该模型 使我们能够研究各种可能的结构规律。那么,为什么依赖的假设很重要吗?依赖假设有挑选出不同类型的配置, 相关的模型的结果。从点注意上述(ii ),参数都是零,每当在一个配置变量 是有条件地相互独立。换句话说,这是相关的模型的唯一配置是其中配置中的 所有可能的关系是相互取决于对方。值得注意的是,如果一组可能的边缘代表模型中的结构,则(1)意味着可能的边缘的任意子集也是一种配置。因此,单一的边缘总是配置,这表现在 第4节。这样的依赖关系的假设是在约束其配置是可能的模型中是至关重要
24、的。我 们将讨论在第4具体实施例的结构A表示并列的变量的子集,并且对应于一个 小的子网络。举例来说,如果有向网络,我们采用一个二元依赖的假设(参见 第4章),将遵循互惠参数将在模型中。在这种情况下,在模型 1的配置是一 组变量Y12,Y21,另一个是Y13,Y31,等等,而每二分体设置其自己的配 置。显然,对于任何这些结构中,如果两个关系存在于所观察的图中,我们看 到一个往复运动的领带,这样的结构代表一种类型,可能在图表丫观察到网络子结构。我们可以概略地认为这个配置作为子结构,即投桃报李领带。但当然也不能保证,在一个给定的配置所有可能的边缘将出现在一个实现 图形丫,所以我们会看到其中的一些可能
25、的子结构,而不是其他。有些关系会 得到回报,有些则不会。配置代表的可能性。图形统计量,克(y)时,在另-方面,告诉我们是否在配置 A是实际上在网络?观察。对于一个对等结构的, 即统计干脆告诉我们是否有回报的相关节点对与否之间的关系。我们可以认为,在分布的曲线图,作为由这些潜在的重叠构型的产生。例 如,假设有在工作中的处理产生的网络中的对等效果。如果我们能观察到网络 的演进,以及网络开始与几个往复式关系,我们可能会看到更多的往复式关系 出现一段时间。在这样的想法,但是,我们必须记住,作为一个特殊的领带出 现过一代人的想象的过程中,它的存在可能会影响其他潜在的邻国关系。因此, 有一个隐式动态的,自
26、组织的质量这一假设的施工流程:为一个领带出现或消 失,其它相邻关系有可能出现或消失为好,并且有可能是没有天然的端点,以 这种持续的随机过程。然而,任何特定的参数值的强度和方向会影响到相应的 配置,如何频繁地观察到。如果该参数为大且为正,我们期望观察到在图中相 关的配置中分布( 1)比如果该参数为零更加频繁。所以,如果一个互惠参数又 大又积极,我们希望看到的观测网络的多个往复式关系。同样,当参数为大和 负我们希望看到的配置(例如,投桃报李的关系)相对较少比如果参数是零。因为:( 1)有一个指数项的右侧,这样的分布也被简称为指数随机图模 型。弗兰克和施特劳斯( 1986)的马尔可夫随机图是一个特定
27、类的指数随机图 模型。网络分析界也指指数随机图模型类为 p* 模型,因为他们是一个泛化的二 元独立模式,其中 p 为 1 款(荷兰和 Leinhardt ,1981 年)是一个流行的早期 例子。3.1 。在参数约束请注意,公式( 1)指的是用于设定不同节点的不同的配置。例如,用于与 对等模型存在于Y12, Y21,用于Y13, Y31,等等单独的配置。在这种一般 的形式,那么,该模型意味着许多参数。例如,有n(n-1 个)单独与可逆性 /2的参数。这是太多的参数和模型,不能从一个单一的网络,估计观察。某些参数需要 被设置为零时,等同于或以其他方式限制。以下弗兰克和施特劳斯(1986)中,我们经
28、常被等同参数,并处以同质性假设当它们指的是同一类型的配置。举例 来说,在考虑互惠,保可往往非常强烈的报答友谊提供来自别人,而是玛丽可 能更持谨慎态度。用于构成一个简单的模型的目的,然而,我们可以假设有是 互惠双方玛丽和保罗共享一个单一的倾向。由此产生的误差为消耗到模型的 统计噪声。这种方法假定某些规律性的同样对于整个网络,例如,有用于在对 等单一倾向网络,而不管其中的节点是包含的。我们称这种同质同构网络配置 中,其中的参数等同于如果该配置是相同的时我们忽略了节点(在这种情况下 的配置被认为是同构的)上的标签。一个不太激进的假设也有可能:例如,如 果我们能够衡量一切个人特点倾向于他们回报的关系,
29、我们可以让互惠效果依 赖于这些节点的特点。当我们把这种同质性假设,我们生产的具有相同形式式的典范。(1),但现在的(同构)配置是指一般的效果(例如,整体的互惠效应)。统计则成 为相应的配置的计数在网络中(例如,往复运动关系的数)。但也有在其中的参数限制可以应用于其他几种方式,并且不同的约束条件 导致不同的型号。施加约束的另一种方法可以是等同于涉及相似类型的行动者 的同构的配置参数。例如,在互惠课堂友谊网络的情况下,我们可以提出的女孩,女孩的配置,一个是女孩,男孩的配置和另一个男孩,男孩配置中的一种 互惠的参数。即使有了合理的同质化约束模型可能仍然有太多的参数,是难能可贵的。 在这种情况下,我们
30、可能会考虑通过一些参数设置为零限制的配置的数量(见 4.3节),或通过引入对较大的相关配置参数的值,假设约束(如提出 Snijders等人,在新闻界。参见 4.6节)。4.依赖的假设和模型4.1伯努利图:最简单的假设依赖当我们假设边缘是独立的,如果发生根据一个固定的概率a (;弗兰克和诺维奇,1993见埃尔德什和仁义,1959),例如它们随机地产生伯努利随机图 形分布。依赖性的假设是在这种情况下很简单:所有可能的不同的关系是相互 独立的。我们在上文指出,相关的模型的唯一配置是其中配置中的所有可能的 关系是有条件地依赖于彼此。当所有可能的关系是相互独立的,唯一可能的配 置涉及到单个边缘Y IJ。
31、所以从(1)的一般模式是:注意,相对于(1)的每个集合A包括单个可能的边缘yij是在该模型的结构, 并有一个参数n IJ为每个这些配置。网络统计克(Y) = G IJ (Y) = 丫 IJ告诉 我们,无论是观察还是没有该配置。如果我们施加均匀的假设,使每个领带的 效果是一样的,我们等于参数,使得 n IJ= B对所有的i和j,因此:Pr(Y = y)exp(九(y)其中,L (y)的=?我的jy ij是弧的图中的y中的数和参数B所涉及的是并列被观察的概率。参数9称为边缘或密度的参数。还有其他的可能性施加均匀性。假设我们有演员两个先验块,我们施加块 的均匀性,从而使n IJ= 9 11若i和j是
32、在数据块1,n IJ= 9 12,如果i是块 1和j中块2,并等等。然后它是简单的表明exp(6i iLn(y) + 如 L】2(y) + 如 SMy) + 如 S(y)其中,L11 (丫)是圆弧的第一个块内的编号和 L12 ( 丫)是从块1的弧的方框 2的数量,等等。4.2。二元模式:二元独立性假设对于向网络一个稍微较复杂的(但通常不很现实的)假设是二价基,而不 是边缘,是相互独立的。以这种依赖假设我们有两种类型的配置在模型中,单 个边缘和往复运动的边缘。随着同质化征收,模型就变成了:Pr(Y y) = (1) expexp(0L(y) +(3)其中,L (y)为在y和M (y)的关系的数量
33、=I,的jy IJy 声是y中的相互关 系的数目。一个稍微复杂的同质性假设,结果在第1页模型,荷兰和Lein hardt (1981)。相关但更复杂的和现实的车型包括 P 2模式(Lazega和面包车Duijn , 1997;范Duijn等人,2004),其假定矢独立,但条件是节点级属性效果。在 P2模型是在适当的时候结构有望从属性出现。它是在p1模型与发送机和接收机的影响视为随机效应和延伸与演员和二元的影响包括在内。更复杂的假设支 撑这种模式使其更现实的实际网络数据,特别是当属性效果预期要坚强。它不 同于一般的指数随机图模型中随机掺入的影响。当然,在非定向网络,伯努利 和二元组的依赖性模式的
34、情况下是相同的:非定向网络,式中的对等参数p (3)是不相关的,并该模型简化为等式(2)。4.3。马尔可夫随机图伯努利和二元依赖性结构在许多情况下,实际的假设,无论经验和理论。 弗兰克和Strauss (1986)介绍了马氏依赖性,其中从i的可能扎到j被假设 为基础上将i或j,即使在网络中的所有其它关系的状态是已知的任何其它可 能的领带。在这种情况下,这两个关系被认为是有条件地依赖于给定的所有其 它关系的值。7马尔可夫依赖性可以表征为,前提是两个可能的网络关系是有 条件地依赖于当它们有一个共同的演员。例如,彼得和玛丽之间的关系很可能 是依赖于玛丽和约翰(特别是如果关系是一个浪漫的一个!)之间的
35、关系存在 或不存在,我们可以表达这种更正式通过假设的可能关系之间的条件依赖?下午和丫 MJ。这两种可能的关系是有条件地依赖,因为它们共享节点m (玛丽)。如果我们还假设均匀性,我们得到马尔可夫随图模型,与配置(和相关的 参数),用于在图呈现定向和非定向的网络。1,这些参数与在网络文学一些知名的结构规律。对于有向网络,我们已经看到边缘(t 15)和互惠(t 11)从伯努利和二元独立模型的参数。有各种二星效应:在两个出星参数(T 12)可以被认为是与膨胀性,这两个混合星参数(T 13)涉及两个路径,n和双中星 参数(t 14)涉及的人气。需要注意的重要的传递和循环结构(9t和T 10)。 包含这些
36、参数是这些车型的强项,因为是从数据可估计的网络模型,将这些影 响(纽曼,2003年),和极少数确实很少。完整的参数集包括所有可能的高阶星为好,但如果所有这些星星都包含有太多的参数模型,是难能可贵的。虽然 马氏随机图模型的一些早期的应用包括仅两星效果,现在已知的是,以包括一 个非零参数,至少对许多社交网络的三星级效应模型中可能是重要的(Rob ins等,2004, 2005)。另一种方法(见下文)包括所有高阶星参数而规定了高阶 星参数之间的关系的约束低阶的。有大图(略)例如,马尔可夫随机图模型的非有向网络边缘,二星级,三星级和三角形 的效果是:Pr(Y = y) = (£ ) exp(
37、6L(y)十 6$2(y) + 6$3(y)+ rT(y)(4)其中,S2 ( 丫)和S3 (丫)是两分和三颗星,数字分别在网络 ?和T (y)为y 中的三角形的数量。请注意,对于马氏随机图形,但是也可以包括高阶三(四 颗星,五颗星,等等)的恒星参数。在该模型式。(4)是我们如何设置某些高 阶参数设置为零(3.1节)的一个例子。在这种情况下,我们假设恒星的分布(实际上,度分布)可以充分的二维和三星级的效果解释。但是应当注意的是,在马尔可夫模型的统计往往彼此相关的,在一些较高 阶给他人的意义。例如,假设有一个三星级的非定向网络中心节点i的。然后它也有三个二分(和三个边缘)的情况下,也集中在岛这类
38、似于在更熟悉的一 般线性模型程序高阶相互作用。这是有助于解释模型的一个重要特征。如果, 例如,一个网络有很多双恒星存在,则一定会形成三角形只是偶然,但如果在 一个马尔可夫随机图模型,大量的三角形的效果,这是超出任何两个明星效应 的,我们可以推断,三角测量的电平不发生,因为许多两分(或实际上的许多 边缘)的机会重叠的根本。在这种情况下,我们将推断三角测量是独立于其他 影响在这个网络中的一个重要的过程。也得到了发展这一基本马尔可夫随机图模型的几个阐述:对于多元网络(派特森和沃瑟曼,1999年);对值的网络(Rob ins等,1999);对于所属的网 络(Skvoretz和浮士德,1999;另见帕蒂
39、森和罗宾斯,2004)。4.4。依赖结构,节点级变量有引入节点级的效果(演员属性)为马尔可夫等指数随机图模型的各种方 法。我们假设二进制属性变量的向量 X与X 1=1,如果演员我有属性和X 1=0, 否则。矢量x是那么组观察X上是可能推广到多歧和连续属性的措施,但我们 将限制目前讨论到二进制属性。在这里,作为一个例子,我们将简要地描述其 中的属性被假设为对网络联系的外源预测社会选择模型(Robins等。,2001) 9,我们可以研究一个相似性或同质性假设,作为社会选择-社会关系往往具有相同属性的行动者之间建立的基础-通过观察给定属性的分配关系的分配。换句话说,从方程作为不同。(1)中,我们的兴
40、趣是在图中的概率 y所表示的 属性x的观测值,即,错(Y = Y| X= x )的。图形略)属性和网络变量之间的简单相关性的假设是, i 的属性影响涉及我(即 Y 九) 可能的关系,称为马尔可夫属性假设。例如,在组织设置,演员的资历(比如, 高级管理与初级管理人员),可能会影响该演员的可能联系。如果我们考虑马 尔可夫属性随着马氏网络的依赖关系,图 1 中所示的非定向网络模型中包含的 配置(多达三星级)。 2,用填充节点代表谁的资历属性(即男主角是一名高级 管理人员)的演员,和一个空节点(与虚线)只是表示,不论是否初级和高级 的演员。换句话说,配置(A)表示倾向的高级管理人员有相互联系;而配置(
41、B) 代表的高级管理人员有很多关系的倾向,等等。大的正参数估计构造(A)是证据为网络中的同质性的效果。它是由图明显。 2,随着属性的唯一的非二元结构包含两个或三个星,与在 恒星的中心属性的演员。为了产生三角形的结构与属性变量需要额外的依赖的 假设。4.5 。更复杂的依赖的假设对超越马尔可夫随机图指数随机图模型阐述了发展。派特森和罗宾斯 ( 2002)提出了两个创新。对于设置机构,他们只限于在社会环境的依赖。图 纸上费尔德( 1981),他们建议作为基于时空上下文可能的实例的设置,例如 一组人在同一时间和地点聚集 ; 基于更加抽象的社会文化空间的设置,如对他们 的政治承诺挂钩的人 ; 和设置,反
42、映外部“设计”的限制,例如组织结构。另外一个动机引进的设置是马氏的依赖似乎不现实的大型网络,其中个别 演员甚至不知道对方,并且也没办法接触到,但他们的领带可能仍然采取以影 响其他可能的联系。如果设置结构假说是有理有据的,是有一个需要收集社交 网络的充分了解数据类型的影响。对于进一步的解释,也见 Schweinberger 和 Snijders ( 2003)。由派特森和罗宾斯( 2002)提出的第二个方向是提出非马尔可夫依赖之间 的关系是不同意的演员,但通过第三方的链接可能会被相互依存的。例如, Y IJ可有条件地依赖于丫上的RS为四个不同的行动者是否有i或j和R或S之 间所观察到的领带。这些
43、实现依赖模型可以通过什么派特森和罗宾斯(2002)描述为部分依赖结构进行开发。这些模型还允许引进涉及的属性效果的三角形。4.6 。新的模型形式有越来越多的证据表明,马氏随机图模型并不好模型,观察到的许多社交 网络(见下文第 5.2 节),所以这些模型并不总是在实践中是有用的。基于实 现依赖结构, Snijders 等。(印刷中)开发的新的规格为指数随机图形的模型, 其中包括新的更高阶项。这些模型中引入约束日 k 星参数,以及新的更高的 k- 三角形的结构,允许对其中两个个体可以被连接到一个大的数目 k 他人的网络 的高度聚集的区域的测量(一个的 k 三角形)。对于这些模型中,包含许多高 次星形
44、和三角形的效果(而不是设置为 0),但是它们受限于进行加权求和, 具有交替的标志的形式。这些创新背后的动机,以及这些新的规格型号的成功, 在其他文件中这一特别版的讨论。5估计Anderson等人的(1999)在施特劳斯与池田大作(1990年),以估计马 尔可夫模型的参数介绍了 P*底漆用伪似然估计。我们现在知道,取决于数据, 可能有严重的问题,与伪似然估计这些模型。但对于马尔可夫随机图模型,标 准最大似然估计是因为在计算式中的常数标准化的困难,不听话的,但任何非 常小的网络,。1,这意味着该标准统计技术不能应用于这些模型。这些问题 已经被克服近来由新蒙特卡洛最大似然技术的发展。首先,我们做了一
45、些关于 伪可能性相当简短的评论,然后引入新的评价方法。5.1。伪似然估计:大约技术使用伪最大似然估计的互动模式最早由Besag( 1975),并提出了马尔可夫随机图模型由施特劳斯和池田(1990)。在一般统计界,假的可能性已经让 蒙特卡罗技术在可行情况下,尽管它仍然有它的信徒(见沃瑟曼和罗宾斯, 2005年,一些文献)。伪似然估计的指数随机图模型的上下文中的优点是,它 是比较容易的,以适应即使是复杂的模型。的缺点是,该估计器的性能没有得 到很好的理解,它是已知的,对于许多数据集的伪似然的估计是不准确的。伪似然估计是最好的转换公式的理解。(1)-模型的接头形式-为以 下等价条件表(见施特劳斯和池
46、田,1990年,更多的细节):加临)°g Pr(r7 = 0|y)=工口皿®)A(Yij)(5)其中,(1)之和超过包含? J所有配置A; (2) n A是对应于配置的参数;(3) D A (y)是变化的统计;在网络统计量Z A (Y当y IJ从1到0的变化值的变 化;(4) Y?IJ是y中的关系,除了观察? IJ所有的意见。变更统计的计算进行了广泛讨论,许多作者(Anderson等,1999;派特森 和罗宾斯,2002;沃瑟曼和派特森,1996;沃瑟曼和罗宾斯,2005),因此我们 不进入它进一步这里。与计算,以产生伪似然估计变动的数据,每一个可能的 领带ylJ成为一个标
47、准的回归过程的情况下,其中y IJ从该组的变化的统计预测(An derson 等,1999)。这个过程看起来像一个回归-或者实际上,一个对数线性模型-但事实 并非如此。Logistic回归假设独立的观察,我们明确不马尔科夫和高阶机型做 一个假设。因此,参数估计值可能会有所偏差;与标准误差是近似的,在最好的, 并且可能会太小。人们不应该依赖沃尔德统计为手段,以决定一个参数是显著 与否。同样,我们不能假设伪越轨行为的可能性是渐近分布卡方(这将是在正 常回归的情况下)。时间观测的依赖性没有那么强,所以一般认为PL估计将更加准确的情况。伪似然估计被用来日期作为一个实用的方便(考虑到替代品还 没有迄今一
48、直容易获得),并且该方法不具有原则基础。只要有可能,首选的 方案是使用蒙特卡罗估计程序。5.2 。马尔科夫链蒙特卡罗最大似然估计( MCMCM)LE最近的发展在蒙特卡洛估计技术指数随机图模型已提交和审查的一些作家 (见 Snijders , 2002; Handcock 等人, 2006; Snijders 等人,在记者 ;沃瑟曼 和罗宾斯, 2005),并在该专辑的其他文章中进一步讨论的,所以我们只包括 一个简要这里总结。首先,我们注意到,这些仿真模型可以在一个相对比较简单的方式来实现。 无需进入详细信息,模拟一组给定的参数值的曲线图中的分布可以通过多种算 法来实现(例如,算法中公知的统计更一般地,如对 Metropolis 算法)。仿真 是在蒙特卡洛的最大似然估计的心脏。用于模拟指数随机图形显示贡献程序已 经描述了由施特劳斯( 1986), Snijders (2002)和 Robins 等。 (2005)。虽然有不同的 Monte Carlo 估计技术( Snijders ,200
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 产品研发及技术研发合作协议
- 专业市场招商合作协议合同书
- 《营销策略》课件
- 销售代理业务委托协议书
- 消费全返协议书
- 城市交通管理智能化系统开发合同
- 车位租赁押金合同协议
- 连锁超市合作协议合同
- 安装工程内部承包协议
- 车位购销协议书范本
- 统编版语文一年级下册2024-2025学年度语文园地五(课件)
- 2024-2030年中国橡塑防滑垫市场竞争格局与前景发展策略分析报告
- 家具的类型(分类全面)-课件
- 重庆市巴蜀学校2024-2025学年九年级上学期12月月考语文试题
- 1、汽轮机冷端系统诊断和运行优化
- 《中国名牌大学简介》课件
- 火灾安全培训总结
- 《城镇液化石油气加臭技术规程》
- 初二英语语法归纳仁爱版单选题100道及答案解析
- 酒店防洪防汛培训
- 中小学校财务制度知识培训
评论
0/150
提交评论