社会调查研究方法——统计分析_第1页
社会调查研究方法——统计分析_第2页
社会调查研究方法——统计分析_第3页
社会调查研究方法——统计分析_第4页
社会调查研究方法——统计分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会调查研究方法统计分析,汇报人:殷文文日期:2016.12.23,一、统计分析概述,1、定义统计分析就是运用统计学方法对调查得到的数据资料进行定量分析,以揭示事物内在的数量关系、规律和发展趋势的一种资料分析方法。,2、统计分析的作用(1)统计分析的方法提供一种清晰精确的形式化语言,对资料进行简化和描述(2)统计分析是进行科学预测、探索未来的重要方法。人们对社会现象进行调查,首先要了解社会现象是什么状态,接着要回答为什么会出现这种状态,找出其中的规律,然后再根据过去和现在的实际资料,运用科学知识,探索今后的发展趋势,并作出估计和判断。(3)对变量关系进行深入分析,通过样本推论总体。,3、统计分析的特点(1)统计分析要以定性分析为基础在定性分析的基础上进行统计分析是保证正确使用统计分析的必要条件。这是因为:A、统计分析是根据数据资料进行的,而社会调查中的数据不是抽象的数字而是反映了事物属性的统计指标。定性分析要为定量分析规定方向,划分范畴。B、统计分析是依据一定公式计算的,公式的选择依赖于一定的理论知识、专业知识和必要的经验。事实上在定量分析开始之前已经通过定性分析,从理论和经验上判明了事物之间的联系,决定了要采用的公式。,(2)统计分析方法必须和其他分析方法结合运用统计分析方法还必须和其他分析方法结合运用才能更好地发挥作用。其原因是:A、数量关系只是客观事物存在的诸种关系的一种,而不是全部。统计分析方法不是万能的,它有自身独特的长处,也有无法克服的局限性,它不能代替其他分析方法。B、统计分折方法能够帮助发现社会现象中不易察觉的规律,但对规律的解释要借助于有关学科的理论。,(3)统计分析有一套专门的方法和技术随着大数据时代的来临,数据分析技术显得尤为重要,正如某人所言“大数据时代不会数据分析,就等于慢性自杀”。SPSS作为当今世界三大权威统计软件之一,以其窗口式、菜单式操作、无需编程、操作简单、图像完美等表现,占据着数据分析市场80%的份额。SPSS是一个非专业统计人员处理专业统计学数据的最佳选择。,二、概念,SPSS的全称是:StatisticalProgramforSocialSciences,即社会科学统计程序。作为统计分析工具,理论严谨、内容丰富,数据管理、统计分析、趋势研究、制表绘图、文字处理等功能,几乎无所不包。,三、几种常用的SPSS分析,SPSS常用的绘图功能简介信度与效度分析描述性统计分析相关分析主成分分析,四、SPSS统计绘图功能详解,相比Excel,SPSS的绘图更为美观、强大。下方的其他菜单项是我们最为常用的普通统计图,具体来说有:,1、散点图是各种统计图中比较简单的一种,共分为simple、matrix(以矩阵的形式显示多个变量间两两的散点图)、overlay(将多个变量间两两的散点图同时做在一张图上)和3D(将X、Y、Z三个变量间的相关散点图做在一个立体空间中)四种,其中需要解释的比较特殊的内容有:Setmarksby框:选入一个标记变量,根据该变量取致的不同对同一个散点图中的各点标以不同的颜色(或形状),例如在数据cars中我们以horse和weight做图,如果用orgion的大小来做marks,则两次做出的图如下:,没有mark变量时的情况,用orgion做mark变量时的情况,2、直方图直方图用于观察某个变量的分布情况,如果选择了displaynormalcurve复选框,则会同时做出一条当前变量理想状况的正态分布曲线来,和该曲线相比,你就可以知道变量的实际分布究竟差了多远。,3、P-P图和Q-Q图都是用来观察变量是否服从正态分布的;质量控制图则用来观察个体值是否有超过正常值范围的情况出现;箱式图的作用和它类似,只是换了一种表达方式;其余的几种图几乎都是用与时间序列模型的。,五、信度与效度分析,信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分析,才能确保我们的问卷有意义。信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内在信度项目之间是否具有较高的内在一致性。通常认为,信度系数应该在01之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.80.9之间,表示量表的信度可以接受;如果量表的信度系数在0.70.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。信度分析是:“分析”“度量”“可靠性分析”,把所有主观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选中,得出先关维度的信度。,具体步骤:分析度量可靠性分析,结果分析:分析各个维度和总量的信度后,将它们列出一个表格,其中每个维度的a信度系数都大于0.7,说明该量表信度较好,符合问卷调查。,效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所要测量的特征,反之,则效度越低。常用于调查问卷效度分析的方法主要有以下几种。1、单项与总和相关效度分析这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项总分的相关系数,根据相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算总分。2、准则效度分析准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显著差异,则为有效的题项。评价准则效度的方法是相关分析或差异显著性检验。在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的应用受到一定限制。,3、结构效度分析结构效度是指测量结果体现出来的某种结构与测值之间的对应程度。结构效度分析所采用的方法是因子分析。有的学者认为,效度分析最理想的方法是利用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能是从量表全部变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。在结束本文时应再次强调,为了提高调查问卷的质量,进而提高整个研究的价值,问卷的信度和效度分析绝非赘疣蛇足,而是研究过程中必不可少的重要环节。其中因子分析是:分析降维因子分析,把所有主观题选到:“项目”中,点击描述,选择KMO和Bartletts检验。点击旋转,选择最大方差法。点击选项,按大小排序。其中,KMO值大于0.7,说明问卷的结构效度良好。,具体步骤:“分析”“降维”“因子分析”,(1)将问卷的主观题部分全部选择为“变量”。点击“描述”,设置如下:,(2)点击“旋转”,设置如下:,(3)点击“选项”,设置如下:,结果分析:,在输出结果中,第一个表格中,第一行的的位置的值为0.927,即KMO值大于0.7,说明问卷的结构效度良好。,这个是旋转成分,总共有9个成分,前8个是第一维度,在后面6个是第二维度,类推。找出因子的维度。,六、描述性统计分析,数据处理和统计分析过程往往是从了解数据的基本特征开始的,即从基本统计量的计算和描述开始。统计分析是关于数据可以分为两个部分:描述性统计与推断性统计。描述性统计提供了将原始数据整理成有用图表形式的方法,这些方法包括收集、整理、描述及给出数据信息。如果在研究中始终利用全部资料(总体),那么描述性统计就足够了。但有时可以利用的只是总体的一小部分(称为样本),此时要求由有限的、不确定的样本信息,对整个总体做出判断及决策的方法,这是推断性统计分析的领域。统计学的理论基础是数理统计学。数理统计学是数学的一个分支,由一系列的公理、定理以及严格证明来组成。,描述性统计分析,数据的描述性分析即是从数据出发概括数据特征,主要包括数据的位置特性、分散性、关联性等数字特征和反映数据整体结构的分布特征,它是数据分析的第一步,也是对数据进行更进一步分析的基础。描述性统计分析主要包括以下几个方面:(一)数据的收集-统计资料的特征(二)数据的整理-将统计资料整理成表格形式(三)数据的图形化-统计资料的图形化(四)数据的描述(1)集中趋势分析集中趋势在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势的测定就是寻找反映数据水平的代表值或中心值。集中趋势的描述指标(a)算术平均值(b)几何平均值(c)众数(d)中位数,描述性统计分析,(2)离中趋势分析数据的离散程度是数据分布的另一个重要特征,是指各变量值远离中心值的程度,因此也叫离中趋势。离中趋势的描述指标(a)极差:也称全距,是一组数据的最大值和最小值的差。(b)四分位数:处在数据一半位置的观测值被称为中位数,则处在数据的25%和75%位置的观测值分别叫做下十分位数(Q1)和上四分位数(Q3),四分位差即为(Q3-Q1)。(c)方差与标准差:方差是各变量值与其均值的平均离散程度,标准差为方差的平方根。(标准差越大,表示分布越分散;而标准差越小,表示分布越集中。)(3)分布形态的分析(a)偏度:偏态是对数据分布对称性的描述,测度偏态的统计量是偏度。如果一组数据的分布是对称的,则偏度等于0;如果偏度明显不等于0,表明分布是非对称的。(b)峰度:峰态是对数据分布平峰或尖峰程度的描述,测度峰态的统计量是峰度。峰度通常是与标准正态分布相比较而言的。若一组数据服从标准正态分布,则峰度的值等于0;若峰度的值明显不等于0,则表明分布比正态分布更平或更尖。,七、相关分析,相关性是指两个变量之间的变化趋势的一致性,如果两个变量变化趋势一致,那么就可以认为这两个变量之间存在着一定的关系(但必须是有实际经济意义的两个变量才能说有一定的关系)。;一般地,|r|0.95存在显著性相关;|r|0.8高度相关;0.5|r|0.8中度相关;0.3|r|0.5低度相关;|r|0.3关系极弱,认为不相关相关性分析也是常用的统计方法,用SPSS统计软件操作起来也很简单,具体方法步骤如下:,从总体上来看,X和Y的趋势有一定的一致性,选取在理论上有一定关系的两个变量,如用X,Y表示,数据输入到SPSS中。,为了解决相似性强弱用SPSS进行分析,从分析-相关-双变量。,打开双变量相关对话框,将X和Y选中导入到变量窗口。,然后相关系数选择Pearson相关系数,也可以选择其他两个,这个只是统计方法稍有差异,一般不影响结论。,点击确定在结果输出窗口显示相关性分析结果,可以看到X和Y的相关性系数为0.766,对应的显著性为0.076,如果设置的显著性水平位0.05,则未通过显著性检验,即认为虽然两个变量总体趋势有一致性,但并不显著。,八、主成分分析,主成分分析,是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。它是因子分析的一种。原理:在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。作用:设法将原来众多具有一定相关性的指标,重新组合成一组新的互相无关的综合指标来代替原来的指标。,步骤:分析-降维-因子分析-选择进行主成分分析的变量,单击“描述”按钮可选定进行检验,“抽取”按钮中可设置抽取标准,通常是基于特征值大于1,单击“旋转”按钮选定,旋转方法,改变方法可轻微修改累积方差%,主成分分析方法需要注意:1.经过KMO检验和Bartlett检验KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。常用的kmo度量标准:0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合。一般在0.8左右可以接受。,1、Bartlett检验显著性SIG0.05才可以接受,2.累积方差贡献率应在80%以上,在已有变量的基础上,经过多次尝试,去除“公因子方差”表中提取值较低的指标,能有效提高累积方差贡献率。最终的成果主要是旋转矩阵,如下确定为2个主成分。各指标两个主成分下的数值,表示相互关系的紧密程度,负数表示为反向关系。同一指标在成分1和成分2下,绝对值较大的,可归为此成分。,九、SPSS学习方法,1、统计基础:不要多,一点足矣我们多数SPSS学习者,学完之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论