社会网络分析中缺失数据的处理方法_第1页
社会网络分析中缺失数据的处理方法_第2页
社会网络分析中缺失数据的处理方法_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会网络分析中缺失数据的处理方法社会网络分析中缺失数据的处理办法

分类号B841.2

DOI:10.16842/jki.issn2095-5588.2022.08.0021引言

“社会网络分析〞〔SocialNetworkAnalysis,SNA〕是在人类学、社会学、心理学等众多领域中开展起来的研究个体之间关系结构的分析办法,是对社会关系进行量化分析的一门艺术和技术。SNA主要用于描述和测量个体之间的关系以及这些关系中所包含的资源、信息等,并根据这些关系建立模型,进而研究关系与行为之间的相互影响〔刘军,2022〕。SNA从“关系〞角度来揭示社会情境与嵌套于其中的个体的心理和行为的互动影响,即个体可以能动地构造他们的关系网络〔选择效应,selectioneffect〕,同时这些关系又反过来影响个体的心理与行为〔影响效应,influenceeffect〕。因此,个体既形塑社会网络,也被社会网络形塑〔刘军,2022;马绍奇,2022;马绍奇,焦璨,张敏强,2022〕。在SNA中,反映个体之间关系的数据称为关系数据〔relationaldata〕,通常的数据类型是0、1二分变量数据,即1表示两个行动者之间存在关系,0表示不存在关系〔马绍奇,2022〕。

SNA从嵌入社会情境的个体之间的关系出发,分析群体结构及其与心理行为的相互作用,更能反映人际交往的社会性特点。如,运用SNA办法系统研究中学生班级的学习关系、友谊关系、咨询关系、信息交流关系等,运用SNA办法研究中学生的支持网络对中学生学业和心理健康等方面的影响。这不仅有利于从社会关系的视角理解学生人际关系的形成、特征和影响因素,还能及时掌握学生的心理动态,维护学生的心理健康〔唐文清等,2022〕。但是,由于SNA的应用波及到更多的人事物,数据的缺失是必然现象。研究者在SNA中常常会遇到数据应答率在65%至90%的情况〔Albrecht,1984;Dean&Brass,1985;Moch,1980;Monge,Edwards,&Kirste,1983;Roberts&O′Reilly,1978,1979〕。此外,由于数据结构的依赖性,如果网络中的行动者或者关系存在缺失,就难以全面地描述缺失行动者及其邻近行动者的网络环境〔Robins,Pattison,&Woolcock,2022〕。已有研究发现,缺失数据不仅对网络结构描述产生消极影响,还会低估关系强弱和聚类系数,并使得中心性和度数的测量出现不稳定的情况〔Burt,1987;Borgatti&Molina,2022;Costenbader&Valente,2022;Kossinet,2022;Huisman,2022〕。这表明,网络结构描述和网络数据分析的结果会因为缺失数据而产生偏差。

心理技术与应用4卷

8期黄菲菲张敏强:社会网络分析中缺失数据的处理办法

要使SNA办法得到更好的应用及认可,既要介绍理论及应用办法,同时还要解决办法使用中可能出现的各种问题。示例,在数据收集和研究结论的推广方面,如何在实际的应用分析中,完善相关的统计模型和参数估计办法的开展,如何提高数据收集的信效度,如何处理缺失值等问题〔马绍奇,焦璨,张敏强,2022;焦璨,吴换杰,黄《h娜,黄菲菲,张敏强,2022〕。由于社会网络数据的相互依赖性,对缺失数据的处理不能采用常规的缺失处理办法。本文就SNA中缺失数据的原因及缺失机制,比拟分析了常用的四种缺失数据处理办法在实际应用中的优缺点,并就SNA中如何处理缺失数据提出倡议。

2缺失数据的原因

21边界标准问题

边界标准问题指的是在网络研究中指定行动者或者关系之间包含的规那么〔Laumann,Marsden,&Prensky,1983〕。示例,学者在研究青少年的冒险行为过程中,想了解他们在学校里的人际关系情况。图1中的A、B、C、D是四位青少年在学校里的人际关系网络,E、F、G三位青少年虽然和A、B、C、D四位青少年的交往密切,但是学校外的人际关系与研究目的无关,因此,E、F、G三者和研究中的青少年的人际关系就容易被无视〔Valente,Fujimoto,Unger,Soto,&Meeker,2022〕。总体而言,边界标准是由研究者自行决定的。在实际包含网络的例子中,组织成员或者由位置界定的正式定义大局部取决于一个正式组织团队中成员占据的排列位置,示例一个学校最受欢迎的前10名老师或者一个班级成绩最好的前五名同学〔Kossinets,2022〕。

社会网络是由行动者及行动者之间的关系组成的,因此研究者在标准网络边界时,除了需要考虑通过一组行动者来界定网络边界外,还要决定哪些关系应该纳入研究范围里。对于如何有效地标准网络边界,学者们提出了一个准那么,即根据可测量行动者的交互作用确定。因此,研究中的网络边界被定义为该边界记录了在特定情境中行动者间的交互作用〔Laumann,Marsden,&Prensky,1983〕。但是,无论是情景还是交互作用的设置,研究者首先需要根据研究目的给出操作性定义,然后再确定在这个情境中包含哪些存在交互作用的行动者。随着电子科技时代的开展与进步,这个准那么不再仅限于小网络,因为大规模的社会网络交互作用数据可以通过邮件传递或者虚拟社区的记录得到〔Newman,2022;Ebel,Mielsch,&Bornholdt,2022;Guimera,Danon,DiazGuilera,Giralt,&Arenas,2022;Holme,Edling,&Lijeros,2022〕。22固定选择的研究设计

固定选择的研究设计指的是网络中行动者和关系的缺失依赖于研究设计中提名选择的限定〔Holland&Leinhard,1973〕,即网络数据的偏差是由于研究设计造成的。若图2中的行动者A属于Z团体,在这个团体中,他和其他5个行动者有关系,现研究者要求行动者A提名y个和他关系最好的行动者。如果y≤5,那么行动者A和其他5个行动者之间的所有关系都包含在数据集中;如果y>5,那么行动者会失去5-y个关系。示例,学者想研究班级的学业咨询网络对学生学业拖延的影响,要求学生提名2个在学习上遇到困难或疑问时会请教的同学。如果学生平时向同学请教问题的人数普遍都是3个,则学者得到的学业咨询网络数据是有偏差的。因为在该网络中,大局部行动者〔学生〕都失去了1个关系。

在固定选择的研究设计中,会出现互惠提名〔有关系的双方相互提名〕,非互惠提名〔有关系的双方只有一方提名〕和无提名〔有关系的双方均不提名〕三种情况。从本质上而言,非互惠提名和其他两种提名的情况不一样〔示例:好朋友和普通朋友的区别〕,因此,研究者需要考虑是否将其纳入到研究范围内。固定选择的研究设计还容易使数据呈现非随机缺失的模式,如受欢迎的个体更有可能被其他行动者提名〔Feld,1991〕。但是,在不同结构的网络中,这种影响会不一致〔Newman,2022;Vázquez&Moreno,2022〕。示例,在非相称混合性〔即受欢迎的行动者倾向于和不受欢迎的行动者相联系〕的网络中,互惠提名将会导致更多关系缺失的情况出现。

23网络调查中的无应答

网络调查中的无应答包括应答者完全缺失和特定工程的数据缺失〔Stork&Richands,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论