下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第6章 SPSS的方差分析,6.1 方差分析概述 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于多个样本均数差别的显著性检验。,(一)为什么要进行方差分析?两样本T检验存在的问题是什么? 1、检验过程烦琐 例如,一试验包含5个处理,采用t检验法要进行 10次两两平均数的差异显著性检验;若有k个处理,则要作 k(k-1)/2次类似的检验。 2、误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由于每次比较需计算一个,故使得各次比较误差
2、的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。,例如,试验有5个处理 ,每个处理 重复 6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差 ,误差自由度为 2(6-1)=10 ;若利用整个试验的30个观测值估计试验误差 ,显然估计的精确性高,且误差自由度为5(6-1)=25。可见,在用t检法进行检验时 ,由 于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。,3、推断的可靠性低。若用u、t 检验法进行4个处理平均数间的差异显著性检验,若两两比较推断正确的概率为95%,则所有比较都正确的
3、概率为0.956=0.74,则降低了推断的可靠性。 由于上述原因,多个平均数的差异显著性检验不宜用 u、t 检验,须采用方差分析法。(analysis of variance),(二)涉及的概念 1.观察因素: 观测变量 2.影响因素: (1)控制因素(控制变量)将控制因素的不同情况称为控制因素的不同水平. (2)随机因素.,观测变量,控制因素,三个水平,控制因素,(三)分析目的: 方差分析正是要分析观测变量的变动是否主要是由控制因素造成还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的。 影响某农作物亩产量的因素(品种、施肥量、气候等) 影响推销某种商品的推销额(不同的推
4、销策略、价格、包装方式、推销人员的形象等),(四)方差分析的类型 单因素方差分析 多因素方差分析 协方差分析 多元方差分析,(五)方差分析的假定条件 (1)样本相互独立。 (2)定距数据。 (3)随机抽样。 (4)正态分布。 (5)等方差性。,6.2 单因素方差分析 检验某一个控制因素的改变是否会给观察变量带来显著影响。由于仅研究单个因素对观测变量的影响,因此称为单因素方差分析。 明确观测变量和控制变量 考察不同肥料对某农作物亩产量是否有显著差异. 考察妇女生育率在不同地区是否有显著差异. 考察不同学历是否对工资收入产生显著影响. 考察不同的推销策略是否对推销额产生显著影响.,6.2.1 单因
5、素方差分析的基本思想 方差分析认为:观测变量值得变动会受控制变量和随机变量两方面的影响。据此,单因素方差分析将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,用数学形式表述为:SST=SSA+SSE。,原始数据对于它们组均值的偏差,称作组内方差;各组均值之间的偏差,则被称作组间方差。原始数据对于总体均值的偏差,称作总方差,组内方差,组间方差,案例,组内离差平方和(SSE),=22+82+78+262 =444,组间离差平方和(SSA),总离差平方和(SST),总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系,SST = SSA +
6、SSE,6.2.3 单因素方差分析的基本步骤 1、提出原假设:不同水平下,各总体均值无显著差异(不同水平下控制因素的影响不显著)。 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等。,2、选择检验统计量:方差分析采用的检验统计量是F统计量,即F值检验。,平均组间平方和,平均组内平方和,在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由控制变量引起的,可以主要由控制变量来解释,控制变量给观测变量带来了显著影响; 反之,如果组间离差平方和所占比例小,则说明观测变量的变动不是主要由控制变量引起的,不可以主要由控制变量来解释,控制变量
7、的不同水平没有给观测变量带来显著影响,观测变量值的变动是由随机变量因素引起的。,SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小 如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均方与组内平方和SSE和除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差 判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小,3、计算检验统计量的观测值和概率P值:该步骤的目的就是计算检验统计量的观测值和相应的概率P值。 4、给定显著性水平 ,并作出决策
8、,6.2.4 单因素方差分析的基本操作 从菜单中选择: 分析 比较均值 单因素 ANOVA. 选择一个或多个因变量。 选择一个自变量因子变量。,6.2.5 单因素方差的应用举例,6.2.6 单因素方差分析的进一步分析 6.2.6.1方差齐性检验,SPSS单因素方差分析中,方差齐性检验采用了方差同质性(homogeneity of variance)检验方法,其原假设是:各水平下观测变量总体的方差无显著差异。,Brown-Forsythe。计算 Brown-Forsythe 统计量以检验组均值是否相等。当方差相等的假设不成立时,这种统计量优于 F 统计量。 Welch。计算 Welch 统计量以
9、检验组均值是否相等。当方差相等的假设不成立时,这种统计量优于 F 统计量。,BrownForsythe test,Welch法近似t检验 Welch法也是对自由度进行校正。校正公式为,6.2.6.1多重比较检验 单因素方差分析的基本分析只能判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显区别于其他水平,哪个水平的作用是不显著的,等等。 如果确定了不同施肥量对农作物的产量有显著影响,那么还需要了解哪种施肥量水平对提高农作物产量的作用不明显,哪种施肥量水平最有利于提高产量等。,LSD
10、. 使用t检验执行组均值之间的所有成对比较。对多个比较的误差率不做调整。 Bonferroni. 使用 t 检验在组均值之间执行成对比较,但通过将每次检验的错误率设置为实验性质的错误率除以检验总数来控制总体误差率。这样,根据进行多个比较的实情对观察的显著性水平进行调整。 Sidak. 基于 t 统计量的成对多重比较检验。Sidak 可调整多重比较的显著性水平,并提供比 Bonferroni 更严密的边界。,Scheffe. 为均值的所有可能的成对组合执行并发的联合成对比较。使用 F 取样分布,子集一致检验。可用来检查组均值的所有可能的线性组合,而非仅限于成对组合。 R-E-G-W F.(Rya
11、n-Einot-Gabriel-Welsch F)基于 F 检验的多重比较,子集一致检验。 R-E-G-W Q.(Ryan-Einot-Gabriel-Welsch Q)基于学生化范围的多重比较,子集一致检验。,S-N-K.(Student Newman Keuls)使用学生化的范围分布在均值之间进行子集一致检验。比较具有相同样本大小的同类子集内的均值对。均值按从高到低排序,首先检验极端差分。 Tukey.使用学生化的范围统计量进行组间所有成对多重比较,还进行子集一致检验。将试验误差率设置为所有成对比较的集合的误差率。 Tukeys b. 使用学生化的范围分布在组之间进行子集一致检验。临界值是
12、Tukeys 真实显著性差异检验的对应值与Student-Newman-Keuls的平均数。,Duncan. 使用与 Student-Newman-Keuls 检验所使用的完全一样的逐步顺序成对比较子集一致检验。但要为检验的集合的错误率设置保护水平,而不是为单个检验的错误率设置保护水平。使用学生化的范围统计量。 Hochbergs GT2. 使用学生化最大模数的多重比较和子集一致检验。与 Tukeys 真实显著性差异检验相似。 Gabriel.使用学生化最大模数的多重比较和子集一致检验。 当单元格大小不相等时,它通常比 Hochbergs GT2 更为强大。当单元大小变化过大时,Gabriel
13、 检验可能会变得随意。,Waller-Duncan. 基于 t 统计的子集一致性比较检验;使用 Bayesian 方法。 Dunnett. 将一组处理与单个控制均值进行比较的成对多重比较 t 检验。 最后一类是缺省的控制类别。另外,您还可以选择第一个类别。双面检验任何水平(除了控制类别外)的因子的均值是否不等于控制类别的均值。 控制检验任何水平的因子的均值是否大于控制类别的均值。,Tamhanes T2. 基于 t 检验的保守成对比较。当方差不相等时,适合使用此检验。 Dunnetts T3. 基于学生化最大值模数的成对比较检验。当方差不相等时,适合使用此检验。 Games-Howell. 有
14、时会变得随意的成对比较检验。当方差不相等时,适合使用此检验。 Dunnetts C. 基于学生化范围的成对比较检验。当方差不相等时,适合使用此检验。,进行均值多重比较的选项: LSD、 Bonferroni、 Sidak、 Dunnett、 Tamhanes T2、 Dunnetts T3、 Games-Howell、 Dunnetts C 进行子集一致性检验的选项 R-E-G-W F、 R-E-G-W Q、 S-N-K、 Tukeys b、 Duncan、 Waller-Duncan 进行均值多重比较和子集一致性检验的选项: Scheffe、 Tukey、Gabriel、 Hochbergs
15、 GT2,6.2.6.2其他检验 先验对比检验,趋势检验,6.2.7 单因素方差应用举例的进一步分析,描述性。 计算每组中每个因变量的个案数、均值、标准差、均值的标准误、最小值、最大值和 95% 置信区间。,固定和随机效应。 显示固定效应模型的标准差、标准误和 95% 置信区间,以及随机效应模型的标准误、95% 置信区间和成分间方差估计。(P166),均值图,6.2.7 单因素方差进一步分析应用举例 比较四种饲料对猪体重增加的作用有无不同。数据:SPSS for Windows统计分析(第3版)data07-01 检验A、D饲料对体重增加的效应及其之间是否有显著差异。 检验A、C饲料之和效应是
16、否与B、D之和效应有显著差异。,练习题,1.比较四种饲料对猪体重增加的作用有无不同。数据:SPSS for Windows统计分析(第3版)data07-01 2.分析不同细菌对三叶草含氮量的影响。 数据:SPSS for Windows统计分析(第3版)data07-02 3.分析不同服务行业服务质量的差异。数据:SPSS for Windows统计分析(第3版)data07-12 4.检验施肥量与亩产量之间的关系。数据:SPSS统计分析从入门到精通Chapter 09施肥量与亩产量关系数据.sav,6.3 单变量多因素方差分析 6.3.1基本思想 多因素方差分析用来研究两个及两个以上控制变
17、量是否对观测变量产生显著影响。由于研究多个因素对观测变量的影响,因此称为多因素方差分析。 多因素方差分析不仅能够分析多个因素对观测变量的独立影响,更能够分析多个控制因素的交互作用能否对观测变量的分布产生显著影响,进而最终找到利于观测变量的最优组合。,观测变量的方差 1.控制变量独立作用的影响 2.控制变量交互作用的影响 3.随机因素的影响,观测变量变差,主效应,交互效应,剩余,品种甲,品种乙,6.3.2 多因素方差分析的数学模型 设有两个因素A,B作用于试验的指标,因素A有r个水平A1,A2,Ar,因素B有s个水平B1,B2,Bs, 设xijkN(ij ,2), i=1,2,r;j=1,2,s
18、; k=1,2,t,各xijk独立。这里ij,2均为未知参数,或写为,6.3.3 多因素方差分析的基本步骤 我们要检验因素A,B及交互作用AB是否显著,要检验以下3个假设:,当H01:1=2=r=0为真时,,当假设H02为真时,,当假设H03为真时,,F(r-1)(s-1),rs(t-1).,FA=,F(r-1,rs(t-1);,FB=,F(s-1,rs(t-1);,FAB=,6.3.4 多因素方差分析的基本操作 从菜单中选择: 分析 一般线性模型 单变量. 选择一个因变量。为“固定因子”、“随机因子”和“协变量”选择变量(如果适用于您的数据)。 您还可以使用“WLS 权重”为加权最小二乘分析
19、指定权重变量。如果加权变量的值为 0、负数或缺失,则将该个案从分析中排除。已用在模型中的变量不能用作加权变量。,6.3.5 多因素方差分析的应用举例,SST,主效应,SSA,SSB,SSAB,SSE,6.3.6 多因素方差分析的进一步分析 6.3.6.1饱和与非饱和模型 建立非饱和模型的前提:交互作用对观测变量未产生显著影响 公式(1)两因素非饱和模型,案例1. 四种雌性白鼠,注射不同剂量雌激素,观察子宫重量变化。数据:SPSS for Windows统计分析(第3版)data07-03.,案例2.本书案例 广告、地区、销售量,案例3. 数据:SPSS for Windows统计分析(第3版)
20、data07-07.,6.3.6.2多因素方差分析的其他功能 (一)对比检验 对比用来检验因子(控制变量)的水平之间的差值。可以为模型中的每个因子指定对比(在重复度量模型中,则是为每个主体间因子)。,(二)图形分析,(三)多重比较,(四)保存,可以在数据编辑器中将模型预测的值、残差和相关测量另存为新变量。这些变量中有许多可用于检查关于数据的假设。 1.预测值。模型为每个个案预测的值。 未标准化. 模型为因变量预测的值。 加权. 加权未标准化预测值。仅在之前已选择了 WLS 变量的情况下可用。 标准误. 对于自变量具有相同值的个案所对应的因变量均值标准差的估计。,2.残差。未标准化残差是因变量的
21、实际值减去由模型预测的值。还提供标准化残差、Student 化的残差以及剔除残差。如果选择了 WLS 变量,则提供加权的未标准化残差。 未标准化. 观察值与模型预测值之间的差。 加权. 加权未标准化残差。仅在之前已选择了 WLS 变量的情况下可用。 标准化. 残差除以其标准差的估计。标准化残差也称为 Pearson 残差,它的均值为 0,标准差为 1。 学生化. 残差除以其随个案变化的标准差的估计,取决于每个个案的自变量值与自变量均值之间的距离。 删除. 当某个案从回归系数的计算中排除时,该个案的残差。它是因变量的值和调整预测值之间的差。,3.诊断。标识以下个案的测量:自变量的值具有不寻常组合
22、的个案,以及可能对模型产生很大影响的个案。 Cook 距离. 在特定个案从回归系数的计算中排除的情况下,所有个案的残差变化幅度的测量。较大的 Cook 距离表明从回归统计量的计算中排除个案之后,系数会发生根本变化。 杠杆值. 未居中的杠杆值。每个观察值对模型拟合的相对影响。,4.系数统计。将模型中的参数估计值的协方差矩阵写入当前会话中的新数据集,或写入外部 PASW Statistics 数据文件。而且,对于每个因变量,将存在一行参数估计值、一行与参数估计值对应的 t 统计量的显著性值以及一行残差自由度。对于多变量模型,每一个因变量都存在类似的行。您可以在读取矩阵文件的其他过程中使用此矩阵文件
23、。,(五)选项,1.估计边际均值。选择需要的单元中的总体边际均值估计的因子和交互作用。为协变量(如果存在)调整这些均值。 比较主效应。对于主体间和主体内因子,为模型中的任何主效应提供估计边际均值未修正的成对比较。只有在“显示以下项的均值”列表中选择了主效应的情况下,此项才可用。 置信区间调节。选择最小显著性差异 (LSD)、Bonferroni 或对置信区间和显著性的 Sidak 调整。此项只有在选择了比较主作用的情况下才可用。,2.输出。 选择描述统计以生成所有单元中的所有因变量的观察到的均值、标准差和计数。 功效估计给出了每个作用和每个参数估计值的偏 Eta方值。Eta 方统计量描述总变异
24、性中可归因于某个因子的部分。当基于观察到的值设置备用假设时,选择检验效能可获取检验的效能。 选择参数估计可为每个检验生成参数估计值、标准误、t 检验、置信区间和检验效能。 选择对比系数矩阵可获取 L 矩阵。,6.3.7 多因素方差分析应用举例的进一步分析 (1)销售额多因素方差分析的饱和模型 (2)不同广告形式下的销售额均值比较 (3)交互效应中的随机因素分析 (SPSS统计分析从入门到精通Chapter 09心理实验数据.sav),练习题,1.使用两种药物治疗缺铁性贫血,根据红细胞数目增减,分析药物A、B的治疗效果。数据:SPSS for Windows统计分析(第3版)data07-04.
25、 问题:(1)零假设是什么?检验假设 (2)绘制控制变量交互图。 2.四种雌性白鼠,注射不同剂量雌激素,观察子宫重量变化。数据:SPSS for Windows统计分析(第3版)data07-03. 问题: 零假设是什么?检验假设 比较1和2数据结构的异同。,3.varirty(甜菜种类)、rep(地块行)、col(地块列)、havrvest(收获次数)、yield(产量)。数据:SPSS for Windows统计分析(第3版)data07-05. 要求:分析六种甜菜品种在相同土壤条件下的产量是否有显著性差异。 4.检验不同包装方式和柜台种类对超市销售额是否有显著性影响。数据:SPSS统计分析从入门到精通Chapter 09包装与柜台对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026北京考编面试题及答案
- 2026北清附小面试题及答案
- 2026边境问题面试题及答案大全
- 2026编辑人员面试题及答案
- 2026辩论讨论面试题型及答案
- 2026博弈策略面试题及答案
- 2026广东清远市英德市西牛镇人民政府招聘见习岗位3人笔试题库附完整答案详解【考点梳理】
- 2026年(第一批)中国港口博物馆编外人员招聘2人(浙江)笔试题库附答案详解AB卷
- 遂宁市青少年宫公开招聘3名编外全职工作人员备考题库及答案详解(名师系列)
- 2026湖南株洲市教育局直属学校高层次人才、急需紧缺人才招聘16人笔试题库及参考答案详解【巩固】
- 基于单片机的智能水族箱控制系统的研发设计
- 生活助理工作合同协议
- 2025年版高等职业教育专科专业教学标准 560216 全媒体广告策划与营销
- 《水土保持监测技术规范SLT 277-2024》知识培训
- 《创伤急救处理》课件
- 交通事故12123培训
- 痹症中医护理方案
- 2024年10月自考00067财务管理学试题及答案含评分参考
- 家庭分家析产协议书范文填写模板
- XX公司行政岗位2024年度正式劳动协议版
- 小学六年级路程应用题100道附答案(完整版)
评论
0/150
提交评论