已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5讲 SPSS方差分析 本章内容 5 1方差分析概述5 2单因素方差分析5 3多因素方差分析5 4协方差分析5 5多因变量的方差分析 例子 某研究者在某单位工作人员中进行了体重指数 BMI 抽样调查 随机抽取不同年龄组男性受试者各16名 测量了被调查者的身高和体重值 由此按照BMI 体重 身高2公式计算了体重指数 请问 不同年龄组的体重指数有无差异 一 概念 又叫变量分析 是英国著名统计学家R A Fisher于20世纪提出的 它是用以检验两个或多个均数间差异的假设检验方法 它是一类特定情况下的统计假设检验 或者说是平均数差异显著性检验的一种引伸 要求 各组观察值服从正态分布或近似正态分布 并且各组之间的方差具有齐性 Analysisofvariance ANOVA 方差分析概述 其基本思想是把所有观察值之间的变异分解为几个部分 即把描写观察值之间的变异的离均差平方和分解为某些因素的离均差平方和及随机抽样误差的离均差平方和 进而计算其相应的均方差 构成F统计量 分类 单因素方差分析多因素方差分析协方差分析多因变量方差分析 6 二 思想来源 观察值总变异可以分解为组间变异和组内变异 7 总变异 Totalvariation 全部测量值Xij与总均数间的差异组间变异 betweengroupvariation 各组的均数与总均数间的差异组内变异 withingroupvariation 每组的每个测量值与该组均数的差异 可用离均差平方和反映变异的大小 总平方和 处理间平方和 处理内平方和 同样道理 总自由度也可分解为处理间自由度和处理内自由度 dfT dft dfe 总df 处理间df 处理内df F检验 一般把处理间方差作为分子 称为大方差 误差方差作为分母 称为小方差 求出两者之比为F值进行F检验 从而确定各种原因 处理效应 试验误差 在总变异中所占的重要程度 二者相比 如果相差不大 说明不同处理的变异在总变异中所占的位置不重要 也就是不同试验处理对结果影响不大 如果相差较大 也就是处理效应比试验误差大得多 说明试验处理的变异在总变异中占有重要的位置 不同处理对结果的影响很大 不可忽视 综上所述 可归纳成方差分析表 analysisofvariancetable 如果F值不显著 则方差分析结论是变异来源主要是误差引起的 所以过程到此结束 而如果F值显著 说明变异来源主要是因为处理的差异 具体何种处理存在差异 还需要进一步多重比较 5 2单因素方差分析 5 2 1单因素方差分析的基本思想1 定义 单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响 例如 分析不同施肥量是否给农作物的产量产生显著影响 研究不同学历是否对工资收入产生显著影响等 2 观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分 分别表示为 其中 SST为观测变量的总离差平方和 SSA为组间离差平方和 是由控制变量不同水平造成的观测变量的变差 SSE为组内平方和 是由抽样误差引起的观测变量的变差 其中 2 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果组间离差平方和所占比例较大 则说明观测变量的变动主要是由于控制变量引起的 可以主要由控制变量来解释 即控制变量给观测变量带来了显著影响 这里我们用F统计量来表示这种比例关系 如果控制变量的不同水平对观测变量造成了显著影响 那么观测变量总变差中控制变量所占的比例较大 则F值就比较大 反之 如果控制变量的不同水平对观测变量没有造成显著影响 那么观测变量总变差中控制变量所占的比例较小 则F值就比较小 5 2 2单因素方差分析的基本步骤提出原假设 控制变量不同水平下观测变量各总体的均值无显著差异计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 5 2 3单因素方差分析的应用举例mydataA sav 请利用SPSS判断不同爱好的学生在 语文1 成绩上是否存在显著性差异 5 2 4单因素方差分析的基本操作步骤在利用SPSS进行单因素方差分析时 应注意数据的组织形式 SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值 基本操作步骤如下 1 SPSS单因素方差分析中 要求因变量为正态分布的高测度数据 故首先检验正态性 分析 非参数检验 旧对话框 1样本K S2 系统要求自变量必须为数值离散型变量转换 重新编码为不同变量3 单因素方差分析分析 比较均值 单因素ANOVA至此 SPSS便自动分解观测变量的方差 计算组间方差 组内方差 F统计量以及对应的概率p值 完成单因素方差分析的相关计算 并将结果显示到输出窗口中 方差齐次性检验概率为0 587 0 05 表示原假设 方差齐性 是成立的 满足单因素方差分析的前提条件本案例最终显著性检验概率为0 676 0 05 说明原假设成立 7 2 5单因素方差分析的进一步分析1 方差齐性检验由于方差分析的前提是各水平下的总体服从正态分布并且方差相等 因此有必要对方差齐性进行检验 即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析 SPSS单因素方差分析中 方差齐性检验采用了方差同质性 HomogeneityofVariance 的检验方法 其零假设是各水平下观测变量总体方差无显著性差异 实现思路同SPSS两独立样本t检验中的方差齐性检验 2 多重比较检验上面的基本分析可以判断控制变量是否对观测变量产生了显著影响 如果控制变量确实对观测变量产生了显著影响 进一步还应确定 控制变量的不同水平对观测变量的影响程度如何 其中哪个水平的作用明显大于其它水平 哪些水平的作用是不显著的 例如已经确定不同施肥量会对农作物的产量产生显著影响 便希望进一步了解究竟是10公斤 20公斤还是30公斤施肥量最有利于提高产量 哪种施肥量对农作物产量没有显著影响 掌握了这些信息 我们就能够制定合理的施肥方案 多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较 判断两均值之间是否存在显著差异 其零假设是相应组的均值之间无显著差异 SPSS提供的多重比较检验的方法比较多 有些方法适用在各总体方差相等的条件下 有些适用在方差不相等的条件下 其中LSD方法适用于各总体方差相等的情况 特点是比较灵敏 Tukey方法和S N K方法适用于各水平下观测变量个数相等的情况 Scheffe方法比Tukey方法不灵敏 3 其他检验 1 先验对比检验如果发现某些水平与另一些水平的均值差距显著 就可以进一步比较这两组总的均值是否存在显著差异 在检验中 SPSS根据用户确定的各均值的系数 再对其线性组合进行检验 来判断各相似性子集间均值的差异程度 2 趋势检验当控制变量为定序变量时 趋势检验能够分析随着控制变量水平的变化 观测变量值变化的总体趋势是怎样的 3 Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验 如果进行趋势检验 则应选择Polynomial选项 然后在后面的下拉框中选择趋势检验的方法 其中Linear表示线性趋势检验 Quadratic表示进行二次多项式检验 Cubic表示进行三次多项式检验 4th和5th表示进行四次和五次多项式检验 如果进行先验对比检验 则应在Coefficients后依次输入系数ci 并确保 ci 0 应注意系数输入的顺序 它将分别与控制变量的水平值相对应 25 可编辑 5 3多因素方差分析 7 3 1多因素方差分析的基本思想1 定义 多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响 多因素方差分析不仅能够分析多个因素对观测变量的独立影响 还能够分析多个控制变量的交互作用能否对观测变量产生显著影响 例如 分析不同品种 不同施肥量是否给农作物的产量产生显著影响 并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合 2 观测变量方差的分解将观测变量总的离差平方和分解为 其中 SST为观测变量的总离差平方和 SSA SSB分别为控制变量A B独立作用引起的变差 SSAB为控制变量A B两两交互作用引起的变差 SSE为随机因素引起的变差 其中 3 比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中 如果SSA所占比例较大 则说明控制变量A是引起观测变量的变动主要因素之一 观测变量的变动可以部分的由控制变量A来解释 即控制变量A给观测变量带来了显著影响 对SSB SSAB同理 5 3 2多因素方差分析的基本步骤提出原假设 各控制变量不同水平下观测变量各总体的均值无显著差异 控制变量交互作用对观测变量无显著影响 计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 5 3 3多因素方差分析应用举例SPSS数据文件mydataA sav 请利用SPSS判断性别 专业 爱好 籍贯是否会对历史成绩产生影响 了解哪些因素对历史成绩的影响是显著的 哪些影响是不显著的 1 因变量正态性检验分析 非参数检验 旧对话框 1样本K S 2 自变量数值化编码转换 重新编码为不同变量 3 多因素方差分析分析 一般线性模型 单变量 结果解读 32 7 3 6多因素方差分析中进一步分析的操作步骤1 建立非饱和模型的操作SPSS多因素方差分析中默认建立的是饱和模型 如果希望建立非饱和模型 则应在主窗口中单击Model按钮 出现窗口 默认的选项是Fullfactorial 表示饱和模型 此时Factors Covariates框 Model框以及BuildTerm s 下拉框均呈不可用状态 如果选择Custom项 则表示建立非饱和模型 且Factors Covariates框 Model框以及BuildTerm s 下拉框均变为可用状态 此时便可自定义非饱和模型中的数据项 其中Interaction为交互作用 Maineffects为主效应 All2 way All3 way等表示二阶 三阶或更高阶交互作用 5 4协方差分析 5 4 1协方差分析的基本思想无论是单因素方差分析还是多因素方差分析 控制变量是可以控制的 其各个水平可以通过人为努力得到控制和确定 但是在实际问题中 有些控制变量很难人为控制 但他们的不同水平确实对观测变量产生较为显著的影响 比如 不同地块对农作物产量的影响 在方差分析中 如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响 往往会夸大或缩小其他因素对观测变量的影响 使分析结论不准确 因此 为了更加准确的研究控制变量不同水平对观测变量的影响 应尽量排除其他因素对分析结论的影响 1 定义 协方差分析就是将那些很难人为控制的因素作为协变量 并在排除协变量对观测变量影响的条件下 分析控制变量对观测变量的影响 从而更加准确的对控制变量进行分析 2 协方差分析的特点方差分析中的控制变量都是定性变量 包括定类和定序变量 线性回归分析中的解释变量 自变量 都是定量变量 而协方差分析中的控制变量是定性变量 而协变量一般是定量变量 所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法 例如 在研究生猪的饲养问题的协方差分析中 饲料是控制变量 生猪的初始体重是协变量 协方差分析中要求多个协变量之间无交互作用 且观测变量与协变量之间有显著的线性关系 3 离差平方和的分解在协方差分析中 将观测变量的总离差平方和分解为由控制变量独立作用引起的 由控制变量交互作用引起的 由协变量引起的和随机变量引起的 以单因素协方差分析为例 观测变量的总变差可以分解为 4 比较观测变量总离差平方和各部分的比例可以部分的由控制变量A来解释 在观测变量总离差平方和中 如果SSA所占比例较大 则说明控制变量A是引起观测变量的变动主要因素之一 观测变量的变动即控制变量A给观测变量带来了显著影响 对SSB SSAB同理 5 4 2协方差分析的基本步骤提出原假设 协变量对观测变量的线性影响是不显著的 在扣除协变量的影响条件下 控制变量各水平下观测变量的各总体均值无显著差异 计算检验统计量和概率P值给定显著性水平与p值做比较 如果p值小于显著性水平 则应该拒绝原假设 反之就不能拒绝原假设 5 4 3协方差分析的应用举例案例 某小学在一年级新生入学时测量了其智力水平 即IQ值 并调查了学生参加学前教育并获取知识的情况 学生的生源情况 父母的文化程度 现在需要了解学前教育情况和生源是否对学生的智力水平产生了影响 在此过程中 需要屏蔽父母文化程度对学生智力因素产生的影响 操作步骤 1 因变量正态性检验分析 非参数检验 旧对话框 1样本K S 2 自变量数值化编码转换 重新编码为不同变量 3 多因素方差分析分析 一般线性模型 单变量 40 结果解读 5 5多因变量的方差分析 5 5 1多因变量多因素方差分析在数据分析中 如果需要分析某些因素对多个因变量的影响 就需要对研究问题具体分析 若待分析的多个因变量之间没有关联性 多个单因变量多因素方差分析 若待分析的多个因变量之间有关联性 多变量方差分析技术 41 案例 某小学在一年级新生入学时测量了其智力水平 即IQ值 并调查了学生参加学前教育并获取知识的情况 学生的生源情况 父母的文化程度 现在需要了解学前教育情况和生源是否对学生的智力水平 入学测试成绩产生了影响 操作 分析 一般线性模型 多变量选项 SSCP矩阵 42 43 5 5 2带重复测量的方差分析案例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年湖南省岳阳市中小学教师招聘考试试卷及答案
- 2026年安徽芜湖市中考历史考试真题及答案
- 2026年安徽淮北市中考英语试题(附答案)
- 电子表格格式化教学设计中职专业课-计算机应用基础-计算机类-电子与信息大类
- 12345政务服务便民热线服务提供方要求
- 高中生物(新人教版必修1)教案:5.4《能量之源-光与光合作用》第2课时
- 全国川教版信息技术八年级下册第1课《计算机网络及应用》教学设计
- AI赋能食品安全检测:技术创新与实践应用
- 河南省新乡市辉县市城北初级中学等校2025~2026学年集团订制第一学期期末学情监测试卷 八年级英语(含答案无听力原文及音频)
- AI赋能光伏运维:智能监测、诊断与效能优化实践指南
- 2026年山西经贸职业学院单招职业适应性考试题库带答案详解(巩固)
- 足疗店内部管理相关规定制度
- 2025年郑州信息科技职业学院单招职业技能测试题库附答案解析
- 2026年初中历史七年级下册单元测试卷(冲刺押题)
- 2026年春季小学一年级下册美术(人美版2024版)教学计划附教学进度表
- 索尼拍照行业现状分析报告
- 5年高考数学真题分类汇编专题02常用逻辑用语(原卷版)
- 安徽2021-2025真题及答案
- JJG 1148-2022 电动汽车交流充电桩(试行)
- 向量为基,几何为本-以2025年全国新高考数学Ⅰ卷17题为例说题比赛
- 2026-2031年中国鲜冻马肉行业市场发展趋势与前景展望战略研究报告
评论
0/150
提交评论