社会调查研究方法——统计分析_第1页
社会调查研究方法——统计分析_第2页
社会调查研究方法——统计分析_第3页
社会调查研究方法——统计分析_第4页
社会调查研究方法——统计分析_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、汇报人:殷文文 日期:2016.12.23 2 2、统计分析的作用、统计分析的作用 (1)(1)统计分析的方法提供一种清晰精确清晰精确的形式化语言, 对资料进行简化和描述简化和描述 (2)(2)统计分析是进行科学预测预测、探索探索未来的重要方法。 人们对社会现象进行调查,首先要了解社会现象是什是什 么么状态,接着要回答为什么为什么会出现这种状态,找出其中的 规律,然后再根据过去和现在的实际资料,运用科学知识 ,探索今后的发展趋势,并作出估计和判断估计和判断。 (3)(3)对变量关系变量关系进行深入分析,通过样本推论总体推论总体。 3 3、统计分析的特点、统计分析的特点 (1 1)统计分析要以定

2、性分析为基础)统计分析要以定性分析为基础 在定性分析的基础上进行统计分析是保证正确使用统 计分析的必要条件。这是因为: A A、统计分析是根据数据资料进行的,而社会调查中 的数据不是抽象的数字而是反映了事物属性的统计指标。 定性分析要为定量分析规定方向,划分范畴。 B B、统计分析是依据一定公式计算的,公式的选择依 赖于一定的理论知识、专业知识和必要的经验。 事实上在定量分析开始之前已经通过定性分析,定量分析开始之前已经通过定性分析,从理 论和经验上判明了事物之间的联系,决定了要采用的公式 。 (2 2)统计分析方法必须和其他分析方法结合运用)统计分析方法必须和其他分析方法结合运用 统计分析方

3、法还必须和其他分析方法结合运用才能 更好地发挥作用。其原因是: A A、数量关系只是客观事物存在的诸种关系的一种, 而不是全部。统计分析方法不是万能的,它有自身独特 的长处,也有无法克服的局限性,它不能代替其他分析 方法。 B B、统计分折方法能够帮助发现社会现象中不易察觉 的规律,但对规律的解释要借助于有关学科的理论有关学科的理论。 (3 3)统计分析有一套专门的方法和技术)统计分析有一套专门的方法和技术 随着大数据时代的来临,数据分析技术显得尤为重要 ,正如某人所言“大数据时代不会数据分析,就等于慢性 自杀”。 SPSS的全称是:Statistical Program for Social

4、 Sciences,即社会科学统计程序。 作为统计分析工具,理论严谨、内容丰富,数据 管理、统计分析、趋势研究、制表绘图、文字处理等 功能,几乎无所不包。 SPSS常用的绘图功能简介 信度与效度分析 描述性统计分析 相关分析 主成分分析 相比Excel, SPSS的绘图更为美 观、强大。下方的其 他菜单项是我们最为 常用的普通统计图, 具体来说有: 1、散点图是各种统计图中比较简单的一种,共分为simple、 matrix(以矩阵的形式显示多个变量间两两的散点图)、overlay (将多个变量间两两的散点图同时做在一张图上)和3D(将X、Y、 Z三个变量间的相关散点图做在一个立体空间中)四种,

5、其中需要 解释的比较特殊的内容有: Set marks by框:选入一个标记变量,根据该变量取致的不同 对同一个散点图中的各点标以不同的颜色(或形状),例如在数据 cars中我们以horse和weight做图,如果用orgion的大小来做 marks,则两次做出的图如下: 没有mark变量时的情况 用orgion做mark变量时的情况 2、直方图 直方图用于观察某个变 量的分布情况,如果选择了 display normal curve复选 框,则会同时做出一条当前变 量理想状况的正态分布曲线来, 和该曲线相比,你就可以知道 变量的实际分布究竟差了多远。 3、P-P图和Q-Q图都是用来观察变量是

6、否服从正态分布的; 质量控制图则用来观察个体值是否有超过正常值范围的情况出 现;箱式图的作用和它类似,只是换了一种表达方式;其余的 几种图几乎都是用与时间序列模型的。 信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标 准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分 析,才能确保我们的问卷有意义。 信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测 量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一 事物反复多次测量,其结果应该始终保持不变才可信。 目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内 在信度项目之间是

7、否具有较高的内在一致性。通常认为,信度系数应 该在01之间,如果量表的信度系数在0.9以上,表示量表的信度很好; 如果量表的信度系数在0.80.9之间,表示量表的信度可以接受;如果量 表的信度系数在0.70.8之间,表示量表有些项目需要修订;如果量表的 信度系数在 0.7以下,表示量表有些项目需要抛弃。 信度分析是:“分析”“度量”“可靠性分析”,把所有主 观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选 中,得出先关维度的信度。 具体步骤:分析度量可靠性分析 结果分析: 分析各个维度和总量的信度后,将它们列出一个表格,其 中每个维度的a信度系数都大于0.7,说明该量表信度较好

8、,符 合问卷调查。 效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价 目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越 高,即表示测量结果越能显示其所要测量的特征,反之,则效度越低。常用于 调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度, 它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑 分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所 选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和 相关分析法获得评价结果

9、,即计算每个题项得分与题项总分的相关系数,根据 相关是否显著判断是否有效。若量表中有反意题项,应将其逆向处理后再计算 总分。 2、准则效度分析 准则效度又称为效标效度或预测效度。准则效度分析是根据已经得到确定 的某种理论,选择一种指标或测量工具作为准则(效标),分析问卷题项与准 则的联系,若二者相关显著,或者问卷题项对准则的不同取值、特性表现出显 著差异,则为有效的题项。评价准则效度的方法是相关分析或差异显著性检验。 在调查问卷的效度分析中,选择一个合适的准则往往十分困难,使这种方法的 应用受到一定限制。 3、结构效度分析 结构效度是指测量结果体现出来的某种结构与测值之间的对应程度。结构 效度

10、分析所采用的方法是因子分析。有的学者认为,效度分析最理想的方法是利 用因子分析测量量表或整个问卷的结构效度。因子分析的主要功能是从量表全部 变量(题项)中提取一些公因子,各公因子分别与某一群特定变量高度关联,这 些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出 研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的 主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问 卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映 原变量与某个公因子的相关程度。在结束本文时应再次强调,为了提高调查问卷 的质量,进而提高整个研究的价

11、值,问卷的信度和效度分析绝非赘疣蛇足,而是 研究过程中必不可少的重要环节。 其中因子分析是:分析降维因子分析,把所有主观题选到:“项目” 中,点击描述,选择KMO和Bartletts检验。点击旋转,选择最大方差法。点 击选项,按大小排序。其中,KMO值大于0.7,说明问卷的结构效度良好。 具体步骤: “分析”“降维”“因子分析” (1)将问卷的主观题部分全部 选择为“变量”。点击“描述”, 设置如下: (2)点击“旋转”,设置如下: (3)点击“选项”,设置如下: 结果分析: 在输出结果中,第一个表格中,第一行的 的位置的值为0.927,即KMO值大于0.7, 说明问卷的结构效度良好。 这个是

12、旋转成分,总共有9个成分,前8个是第一维度,在后面6个 是第二维度,类推。找出因子的维度。 数据处理和统计分析过程往往是从了解数据的基本特征开始的,即 从基本统计量的计算和描述开始。统计分析是关于数据可以分为两个 部分:描述性统计与推断性统计。描述性统计提供了将原始数据整理 成有用图表形式的方法,这些方法包括收集、整理、描述及给出数据 信息。如果在研究中始终利用全部资料(总体),那么描述性统计就 足够了。但有时可以利用的只是总体的一小部分(称为样本),此时 要求由有限的、不确定的样本信息,对整个总体做出判断及决策的方 法,这是推断性统计分析的领域。 统计学的理论基础是数理统计学。数理统计学是数

13、学的一个分支, 由一系列的公理、定理以及严格证明来组成。 数据的描述性分析即是从数据出发概括数据特征,主要包括数据的位置特 性、分散性、关联性等数字特征和反映数据整体结构的分布特征,它是数据分 析的第一步,也是对数据进行更进一步分析的基础。描述性统计分析主要包括 以下几个方面: (一) 数据的收集-统计资料的特征 (二) 数据的整理-将统计资料整理成表格形式 (三) 数据的图形化-统计资料的图形化 (四) 数据的描述 (1)集中趋势分析 集中趋势在统计学中是指一组数据向某一中心值靠拢的程度,它反映了 一组数据中心点的位置所在。集中趋势的测定就是寻找反映数据水平的代表值 或中心值。 集中趋势的描

14、述指标 (a)算术平均值 (b)几何平均值 (c)众数 (d)中位数 (2)离中趋势分析 数据的离散程度是数据分布的另一个重要特征,是指各变量值远离中心值 的程度,因此也叫离中趋势。 离中趋势的描述指标 (a)极差:也称全距,是一组数据的最大值和最小值的差。 (b)四分位数:处在数据一半位置的观测值被称为中位数,则处在数据的 25%和75%位置的观测值分别叫做下十分位数(Q1)和上四分位数(Q3), 四分位差即为(Q3-Q1)。 (c)方差与标准差:方差是各变量值与其均值的平均离散程度,标准差为 方差的平方根。(标准差越大,表示分布越分散;而标准差越小,表示分布越集 中。 ) (3)分布形态的

15、分析 (a)偏度:偏态是对数据分布对称性的描述,测度偏态的统计量是偏度。 如果一组数据的分布是对称的,则偏度等于0;如果偏度明显不等于0,表明分 布是非对称的。 (b)峰度:峰态是对数据分布平峰或尖峰程度的描述,测度峰态的统计量 是峰度。峰度通常是与标准正态分布相比较而言的。若一组数据服从标准正态分 布,则峰度的值等于0;若峰度的值明显不等于0,则表明分布比正态分布更平 或更尖。 相关性是指两个变量之间的变化趋势的一致性,如果两个变量变化趋势一致, 那么就可以认为这两个变量之间存在着一定的关系(但必须是有实际经济意义的 两个变量才能说有一定的关系)。;一般地,|r|0.95 存在显著性相关;

16、|r|0.8 高度相关;0.5|r|0.8 中度相关;0.3|r|0.5 低度相关; |r|0.3 关系极弱,认为不相关 相关性分析也是常用的统计方法,用SPSS统计软件操作起来也很简单,具体 方法步骤如下: 从总体上来看,X和Y的趋势有一 定的一致性 选取在理论上有一定关系的两个变量,如 用X,Y表示,数据输入到SPSS中。 为了解决相似性强弱用SPSS进 行分析,从分析-相关-双变量。 打开双变量相关对话框,将X和Y选中 导入到变量窗口。 然后相关系数选择Pearson相关系 数,也可以选择其他两个,这个只是 统计方法稍有差异,一般不影响结论。 点击确定在结果输出窗口显示相 关性分析结果,

17、可以看到X和Y的相 关性系数为0.766,对应的显著性 为0.076,如果设置的显著性水平 位0.05,则未通过显著性检验,即 认为虽然两个变量总体趋势有一 致性,但并不显著。 主成分分析,是一种统计方法。通过正交变换将一组可能存在相关性 的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。它是 因子分析的一种。 原理:在用统计分析方法研究多变量的课题时,变量个数太多就会增 加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多 情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系 时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析 是对于原先提出的

18、所有变量,将重复的变量(关系紧密的变量)删去多余, 建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变 量在反映课题的信息方面尽可能保持原有的信息。设法将原来变量重新组 合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出 几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成 分分析或称主分量分析,也是数学上用来降维的一种方法。 作用:设法将原来众多具有一定相关性的指标,重新组合成一组新的 互相无关的综合指标来代替原来的指标。 步骤: 分析-降维-因子分析-选择进行主成 分分析的变量 单击“描述”按钮可选定进行检 验,“抽取”按钮中可设置抽取 标准,通常是基于特征值大于1 单击“旋转”按钮选定,旋转方法, 改变方法可轻微修改累积方差% 主成分分析方法需要注意: 1.经过KMO检验和Bartlett检验 KMO统计量是取值在0和1之间。当所有变量间的简

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论