2025年大学《统计学》专业题库- 社会网络分析在统计学中的应用_第1页
2025年大学《统计学》专业题库- 社会网络分析在统计学中的应用_第2页
2025年大学《统计学》专业题库- 社会网络分析在统计学中的应用_第3页
2025年大学《统计学》专业题库- 社会网络分析在统计学中的应用_第4页
2025年大学《统计学》专业题库- 社会网络分析在统计学中的应用_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2025年大学《统计学》专业题库——社会网络分析在统计学中的应用考试时间:______分钟总分:______分姓名:______一、名词解释(每题3分,共15分)1.社会网络2.网络密度3.度中心性4.中介中心性5.指数随机图模型(ERGM)二、简答题(每题5分,共20分)1.简述社会网络分析与传统统计学分析在社会现象研究中的主要区别。2.请说明网络中心性指标中,中介中心性和紧密性中心性分别衡量了节点怎样的网络地位或影响力?3.在社会网络分析中,什么是社群?识别社群有哪些常见的统计方法或指标?4.简述将社会网络数据转化为适合进行传统统计推断(如回归分析)的形式时,需要注意的关键问题。三、计算题(每题10分,共20分)1.假设有一个包含5个节点的简单无向网络,其邻接矩阵如下:```ABCDEA[01010]B[10100]C[01011]D[10101]E[00110]```请根据该邻接矩阵,计算节点A和节点C的度中心性、中介中心性(使用简化的中介中心性指标,如基于最短路径经过次数的比例)和紧密性中心性(假设存在一条连接所有节点的最小生成树,其总边长为6)。2.在一项关于学术合作网络的研究中,研究者假设网络的合作模式可以用指数随机图模型(ERGM)来描述,初步拟合的模型为`logLikelihood=-150;AIC=310;BIC=350`。模型包含两个参数:节点异质性参数`theta`(衡量节点合作意愿的差异)和三角闭合参数`gamma`(衡量三人组形成合作子三角形的可能性)。请解释参数`theta`和`gamma`的预期符号(正或负),并说明当模型中的`gamma`显著时(假设检验p<0.05),它对网络结构意味着什么?四、应用与分析题(每题12分,共24分)1.某研究者收集了一个小型社区成员间的信任网络数据。研究发现,该网络中度中心性较高的成员通常是社区中的老年人,而中介中心性较高的成员则多为社区活动的组织者。请结合社会网络分析和统计思维,分析这两种现象可能的原因,并说明研究者可以进一步运用哪些统计方法或网络分析方法来验证自己的初步观察。2.比较“结构对位”(StructuralEquivalence)和“网络位置”(NetworkPosition)这两种视角在解释社会现象时的侧重点。请分别举例说明,当研究“某个社会群体在决策过程中的影响力”时,结构对位视角和网络位置视角可能得出哪些不同的结论或需要关注的不同方面?试卷答案一、名词解释1.社会网络:指由一组行动者(节点)以及它们之间的多种关系(边)构成的集合。它关注行动者之间的相互连接和影响模式。2.网络密度:指一个网络中实际存在的连接数与所有可能存在的连接数之比。它衡量网络连接的紧密程度。3.度中心性:指一个节点拥有的直接连接(边)的数量。在高维网络中,度中心性也指节点与其直接邻居连接的强度(如加权网络的加权度)。它衡量节点连接的广度。4.中介中心性:指一个节点出现在其他节点对之间最短路径上的频率。它衡量节点控制信息或资源流动的能力,即节点在网络“桥梁”位置的重要性。5.指数随机图模型(ERGM):一种基于概率图模型的统计方法,用于描述和解释社会网络的生成机制。它假设网络是由一系列随机过程生成的,并通过参数来量化这些过程对网络结构的贡献。二、简答题1.区别:*数据类型:社会网络分析处理的是关系型数据(网络数据),关注节点间的连接模式;传统统计学分析通常处理变量型数据(个体数据或观测数据),关注变量的分布和关系。*分析焦点:社会网络分析关注结构模式和位置,如连接性、中心性、社群等;传统统计学分析关注变量的统计特征,如均值、方差、相关性、回归效应等。*理论基础:社会网络分析有独特的理论基础(如网络理论、平衡理论等);传统统计学分析基于概率论和数理统计理论。*分析目的:社会网络分析旨在揭示社会结构、关系模式及其对个体行为或社会现象的影响;传统统计学分析旨在推断总体特征、检验假设、建立预测模型等。2.中介中心性:衡量一个节点在网络中作为“桥梁”或“中介”的重要性。如果一个节点具有高中介中心性,意味着许多其他节点对之间的信息或资源流动必须经过该节点。这表明该节点能够“控制”或“监管”网络中的互动,具有较大的影响力或战略地位。紧密性中心性:衡量一个节点与其直接邻居(一阶邻居)的平均距离。距离越近(紧密性越高),说明该节点与其同伴联系越紧密,越容易形成紧密的小团体或核心圈。它反映了节点在网络局部结构中的融合程度。3.社群:社群是指在网络中一组相互连接较为紧密、而与其他组别连接较为稀疏的节点集合。社群内部的连接密度高,成员之间互动频繁,而社群之间的连接密度低,互动较少。社群可以看作是网络中的“社区”或“块”。识别方法/指标:常见的统计方法或指标包括:派系系数(ClusteringCoefficient)、导率(Diameter)、模块度(Modularity)及其相关算法(如Louvain算法)、层次聚类分析等。这些方法旨在寻找网络中连接模式显著不同于整体网络的子结构。4.关键问题:*数据表示:如何将网络数据(如邻接矩阵、网络图)转化为可用于传统统计软件(如R,SPSS)分析的格式(如节点属性矩阵、边列表、距离矩阵)。*因果关系:传统统计方法(如回归)通常处理变量间的因果关系或相关性,而网络分析中的连接本身往往是相互的、非对称的(如互惠关系),需要采用适合网络结构的分析方法(如网络回归、ERGM)。*网络依赖:网络数据通常具有空间自相关或聚类性,即一个节点的属性或行为可能受其邻居的影响。使用传统独立样本的统计方法可能无法正确处理这种依赖性,导致伪零假设。*中心性与位置:网络分析中的核心概念(如中心性、社群)与传统统计变量不同,需要特定的网络统计方法来测量和检验。三、计算题1.计算过程:*度中心性(DegreeCentrality):*A:出度=2(B,D),入度=1(B),总度=3*C:出度=3(B,D,E),入度=2(B,D),总度=5*A的度中心性=3/(5-1)=3/4=0.75*C的度中心性=5/(5-1)=5/4=1.25*中介中心性(SimplifiedBetweennessCentrality):*计算A经过的最短路径:*A-B:A(0),B(1)->Pathlength1*A-D:A(0),D(1)->Pathlength1*A-B-C:A(0),B(1),C(2)->Pathlength2*A-D-C:A(0),D(1),C(2)->Pathlength2*A-B-E:A(0),B(1),E(2)->Pathlength2*A-D-E:A(0),D(1),E(2)->Pathlength2*总共6条最短路径经过A。*计算C经过的最短路径:*C-B:C(0),B(1)->Pathlength1*C-D:C(0),D(1)->Pathlength1*C-E:C(0),E(2)->Pathlength2*C-B-A:C(0),B(1),A(2)->Pathlength2*C-D-A:C(0),D(1),A(2)->Pathlength2*C-B-E:C(0),B(1),E(2)->Pathlength2*C-D-E:C(0),D(1),E(2)->Pathlength2*总共7条最短路径经过C。*网络总边数=10,总节点数=5,可能的最短路径对数约为10!/(2!*(5-2)!)=225。假设所有路径均等可能,单条路径经过A的概率=6/225,经过C的概率=7/225。简化中介中心性可视为该概率值。*A的中介中心性≈6/225=2/75≈0.0267*C的中介中心性≈7/225=7/225≈0.0311*紧密性中心性(ClosenessCentrality-basedonminimumspanningtreewithtotallength6):*计算每个节点到其他所有节点的最短路径总长度(基于最小生成树):*A:A-B(1)-C(2)-D(3)=6;A-D(1)=1.Total=6+1=7*B:B-A(1)-D(1)=2;B-C(1)=1;B-E(2)=2.Total=2+1+2=5*C:C-B(1)-A(1)=2;C-D(1)=1;C-E(2)=2.Total=2+1+2=5*D:D-A(1)-B(1)=2;D-C(1)=1;D-E(2)=2.Total=2+1+2=5*E:E-C(1)-B(1)=2;E-D(1)=1.Total=2+1=3*网络总边数(MST)=6。紧密性中心性=(M-1)/sum(d_i),其中M为网络总边数,d_i为节点i的总距离。*A的紧密性中心性=(6-1)/7=5/7≈0.714*B的紧密性中心性=(6-1)/5=5/5=1.0*C的紧密性中心性=(6-1)/5=5/5=1.0*D的紧密性中心性=(6-1)/5=5/5=1.0*E的紧密性中心性=(6-1)/3=5/3≈1.667**(注意:此题计算紧密性时基于最小生成树,且未明确说明是计算平均值还是使用其他定义,此处采用基于总距离除以(N-1)的简化定义)*2.解释:*参数符号预期:*`theta`(节点异质性参数):预期符号为正。`theta`衡量网络中节点合作意愿的差异程度。`theta`值越高,表示节点之间合作意愿的差异越大,网络结构可能越异质(例如,可能形成多个由高意愿合作者组成的紧密子群,以及一些孤立或低意愿合作者)。`theta`值越低(接近0),表示节点合作意愿越相似,网络结构可能越同质。*`gamma`(三角闭合参数):预期符号为正。`gamma`衡量三人组(三元组)形成闭合三角形的倾向。正的`gamma`值意味着如果两个节点之间已经存在连接,那么这两个节点共同的邻居更有可能与它们也建立连接,从而形成闭合三角形。这反映了网络中的“合作三角”现象。*`gamma`显著时的意义:当模型中的`gamma`显著时(p<0.05),它表明在网络生成过程中,“三角闭合”是一个重要的统计显著的机制。这意味着观察到的高度的三角闭合现象(即合作三角普遍存在)不仅仅是随机因素作用的结果,而是网络结构的一个系统性特征。研究者可以据此解释,该网络倾向于形成紧密的、相互连接的小团体,合作行为具有强传染性或模仿性。显著的`gamma`值有助于验证关于网络结构形成的社会或文化假设。四、应用与分析题1.分析:*老年人度高中心性原因:老年人度中心性高可能意味着他们拥有更多的直接社交联系(朋友、亲戚、邻居)。这可以归因于几个因素:老年人通常生活圈子相对固定,社交网络发展时间较长且稳定;他们可能更倾向于参与传统社区活动,从而增加接触机会;社会文化可能赋予老年人某种地位,使他们成为信息或资源的重要传递者;或者老年人可能更愿意与他人建立和维护联系。*活动组织者高中介中心性原因:活动组织者中介中心性高,表明他们经常出现在连接不同群体或个体之间的路径上。这可以归因于他们的角色:他们需要与网络中广泛的人打交道以组织活动;他们可能位于信息传播的关键位置,帮助协调不同成员;他们的社交网络可能跨越多个社群边界;或者他们的活动本身促进了跨群体互动。*进一步验证方法:*统计检验:使用统计方法检验中心性与角色(老年人、活动组织者)之间的关联性。例如,可以计算不同群体(如按年龄分层)的中心性得分,进行假设检验(如t检验、方差分析)看是否存在显著差异。或者使用回归模型,将中心性得分作为因变量,年龄、是否为活动组织者等作为自变量。*网络分析:进一步分析网络结构。例如,绘制网络图观察老年人是否形成了紧密的核心圈,活动组织者是否位于网络桥梁或枢纽位置。计算社群结构,看这些角色是否跨越或位于不同的社群。*内容分析/访谈:对老年人、活动组织者进行访谈或分析他们的社交日志,了解他们实际的社交行为、网络构建策略以及在网络中扮演的角色感知。2.比较:*结构对位(StructuralEquivalence):关注节点之间是否存在完全相同的关系模式。如果两个节点与其他所有节点的连接方式完全一致(如同是所有人的朋友,或同是所有人的敌人),它们就是结构对等的。这种视角侧重于节点在网络结构中的“身份”或“角色”是否相同,强调群体归属和角色相似性。在解释现象时,它关注群体内部的同质

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论