




免费预览已结束,剩余41页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第5讲,SPSS方差分析,本章内容,5.1方差分析概述5.2单因素方差分析5.3多因素方差分析5.4协方差分析5.5多因变量的方差分析,例子:某研究者在某单位工作人员中进行了体重指数(BMI)抽样调查,随机抽取不同年龄组男性受试者各16名,测量了被调查者的身高和体重值,由此按照BMI=体重/身高2公式计算了体重指数,请问,不同年龄组的体重指数有无差异。,一、概念,又叫变量分析,是英国著名统计学家R.A.Fisher于20世纪提出的。它是用以检验两个或多个均数间差异的假设检验方法。它是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一种引伸。要求:各组观察值服从正态分布或近似正态分布,并且各组之间的方差具有齐性。,(Analysisofvariance,ANOVA),方差分析概述,其基本思想是把所有观察值之间的变异分解为几个部分。即把描写观察值之间的变异的离均差平方和分解为某些因素的离均差平方和及随机抽样误差的离均差平方和,进而计算其相应的均方差,构成F统计量。分类:单因素方差分析多因素方差分析协方差分析多因变量方差分析,6,二、思想来源:观察值总变异可以分解为组间变异和组内变异,7,总变异(Totalvariation):全部测量值Xij与总均数间的差异组间变异(betweengroupvariation):各组的均数与总均数间的差异组内变异(withingroupvariation):每组的每个测量值与该组均数的差异,可用离均差平方和反映变异的大小,总平方和:,处理间平方和,处理内平方和:,同样道理,总自由度也可分解为处理间自由度和处理内自由度:,dfT=dft+dfe,总df,处理间df,处理内df,F检验,一般把处理间方差作为分子,称为大方差,误差方差作为分母,称为小方差,求出两者之比为F值进行F检验。从而确定各种原因(处理效应、试验误差)在总变异中所占的重要程度。,二者相比,如果相差不大,说明不同处理的变异在总变异中所占的位置不重要,也就是不同试验处理对结果影响不大。,如果相差较大,也就是处理效应比试验误差大得多,说明试验处理的变异在总变异中占有重要的位置,不同处理对结果的影响很大,不可忽视。,综上所述,可归纳成方差分析表(analysisofvariancetable),如果F值不显著,则方差分析结论是变异来源主要是误差引起的,所以过程到此结束。而如果F值显著,说明变异来源主要是因为处理的差异,具体何种处理存在差异?还需要进一步多重比较!,5.2单因素方差分析,5.2.1单因素方差分析的基本思想1、定义:单因素方差分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。例如:分析不同施肥量是否给农作物的产量产生显著影响;研究不同学历是否对工资收入产生显著影响等。2、观测变量方差的分解将观测变量总的离差平方和分解为组间离差平方和和组内离差平方和两部分,分别表示为:其中,SST为观测变量的总离差平方和;SSA为组间离差平方和,是由控制变量不同水平造成的观测变量的变差;SSE为组内平方和,是由抽样误差引起的观测变量的变差。,其中:,2、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果组间离差平方和所占比例较大,则说明观测变量的变动主要是由于控制变量引起的,可以主要由控制变量来解释,即控制变量给观测变量带来了显著影响。这里我们用F统计量来表示这种比例关系,如果控制变量的不同水平对观测变量造成了显著影响,那么观测变量总变差中控制变量所占的比例较大,则F值就比较大;反之,如果控制变量的不同水平对观测变量没有造成显著影响,那么观测变量总变差中控制变量所占的比例较小,则F值就比较小。,5.2.2单因素方差分析的基本步骤提出原假设:控制变量不同水平下观测变量各总体的均值无显著差异计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,5.2.3单因素方差分析的应用举例mydataA.sav,请利用SPSS判断不同爱好的学生在“语文1”成绩上是否存在显著性差异。,5.2.4单因素方差分析的基本操作步骤在利用SPSS进行单因素方差分析时,应注意数据的组织形式。SPSS要求定义两个变量分别存放观测变量值和控制变量的水平值。基本操作步骤如下:1、SPSS单因素方差分析中,要求因变量为正态分布的高测度数据,故首先检验正态性。分析非参数检验旧对话框1样本K-S2.系统要求自变量必须为数值离散型变量转换重新编码为不同变量3.单因素方差分析分析比较均值单因素ANOVA至此,SPSS便自动分解观测变量的方差,计算组间方差、组内方差、F统计量以及对应的概率p值,完成单因素方差分析的相关计算,并将结果显示到输出窗口中。,方差齐次性检验概率为0.5870.05,表示原假设”方差齐性”是成立的。满足单因素方差分析的前提条件本案例最终显著性检验概率为0.6760.05,说明原假设成立,7.2.5单因素方差分析的进一步分析1、方差齐性检验由于方差分析的前提是各水平下的总体服从正态分布并且方差相等,因此有必要对方差齐性进行检验,即对控制变量不同水平下各观测变量不同总体方差是否相等进行分析。SPSS单因素方差分析中,方差齐性检验采用了方差同质性(HomogeneityofVariance)的检验方法,其零假设是各水平下观测变量总体方差无显著性差异,实现思路同SPSS两独立样本t检验中的方差齐性检验。,2、多重比较检验上面的基本分析可以判断控制变量是否对观测变量产生了显著影响。如果控制变量确实对观测变量产生了显著影响,进一步还应确定,控制变量的不同水平对观测变量的影响程度如何,其中哪个水平的作用明显大于其它水平,哪些水平的作用是不显著的。例如已经确定不同施肥量会对农作物的产量产生显著影响,便希望进一步了解究竟是10公斤、20公斤还是30公斤施肥量最有利于提高产量,哪种施肥量对农作物产量没有显著影响。掌握了这些信息,我们就能够制定合理的施肥方案。多重比较检验就是分别对每个水平下的观测变量均值进行逐对比较,判断两均值之间是否存在显著差异。其零假设是相应组的均值之间无显著差异。,SPSS提供的多重比较检验的方法比较多,有些方法适用在各总体方差相等的条件下,有些适用在方差不相等的条件下。其中LSD方法适用于各总体方差相等的情况,特点是比较灵敏;Tukey方法和S-N-K方法适用于各水平下观测变量个数相等的情况;Scheffe方法比Tukey方法不灵敏。,3、其他检验(1)先验对比检验如果发现某些水平与另一些水平的均值差距显著,就可以进一步比较这两组总的均值是否存在显著差异。在检验中,SPSS根据用户确定的各均值的系数,再对其线性组合进行检验,来判断各相似性子集间均值的差异程度。(2)趋势检验当控制变量为定序变量时,趋势检验能够分析随着控制变量水平的变化,观测变量值变化的总体趋势是怎样的。,(3)Contrasts选项Contrasts选项用来实现先验对比检验和趋势检验。如果进行趋势检验,则应选择Polynomial选项,然后在后面的下拉框中选择趋势检验的方法。其中Linear表示线性趋势检验;Quadratic表示进行二次多项式检验;Cubic表示进行三次多项式检验,4th和5th表示进行四次和五次多项式检验。如果进行先验对比检验,则应在Coefficients后依次输入系数ci,并确保ci0。应注意系数输入的顺序,它将分别与控制变量的水平值相对应。,5.3多因素方差分析,7.3.1多因素方差分析的基本思想1、定义:多因素方差分析用来研究两个及两个以上控制变量的不同水平是否对观测变量产生了显著影响。多因素方差分析不仅能够分析多个因素对观测变量的独立影响,还能够分析多个控制变量的交互作用能否对观测变量产生显著影响。例如:分析不同品种、不同施肥量是否给农作物的产量产生显著影响,并进一步研究哪种品种和哪种施肥量是提高农作物产量的最优组合。2、观测变量方差的分解将观测变量总的离差平方和分解为:其中,SST为观测变量的总离差平方和;SSA、SSB分别为控制变量A、B独立作用引起的变差;SSAB为控制变量A、B两两交互作用引起的变差;SSE为随机因素引起的变差。,其中:,3、比较观测变量总离差平方和各部分的比例在观测变量总离差平方和中,如果SSA所占比例较大,则说明控制变量A是引起观测变量的变动主要因素之一,观测变量的变动可以部分的由控制变量A来解释,即控制变量A给观测变量带来了显著影响。对SSB、SSAB同理。,5.3.2多因素方差分析的基本步骤提出原假设:各控制变量不同水平下观测变量各总体的均值无显著差异,控制变量交互作用对观测变量无显著影响。计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,5.3.3多因素方差分析应用举例SPSS数据文件mydataA.sav,请利用SPSS判断性别、专业、爱好、籍贯是否会对历史成绩产生影响,了解哪些因素对历史成绩的影响是显著的,哪些影响是不显著的。(1)因变量正态性检验分析非参数检验旧对话框1样本K-S(2)自变量数值化编码转换重新编码为不同变量(3)多因素方差分析分析一般线性模型单变量,结果解读:,31,7.3.6多因素方差分析中进一步分析的操作步骤1、建立非饱和模型的操作SPSS多因素方差分析中默认建立的是饱和模型。如果希望建立非饱和模型,则应在主窗口中单击Model按钮,出现窗口:,默认的选项是Fullfactorial,表示饱和模型。此时Factors&Covariates框、Model框以及BuildTerm(s)下拉框均呈不可用状态;如果选择Custom项,则表示建立非饱和模型,且Factors&Covariates框、Model框以及BuildTerm(s)下拉框均变为可用状态。此时便可自定义非饱和模型中的数据项。其中Interaction为交互作用;Maineffects为主效应;All2-way、All3-way等表示二阶、三阶或更高阶交互作用。,5.4协方差分析,5.4.1协方差分析的基本思想无论是单因素方差分析还是多因素方差分析,控制变量是可以控制的,其各个水平可以通过人为努力得到控制和确定。但是在实际问题中,有些控制变量很难人为控制,但他们的不同水平确实对观测变量产生较为显著的影响。比如:不同地块对农作物产量的影响。在方差分析中,如果忽略这些因素的存在而单纯去分析其他因素对观测变量的影响,往往会夸大或缩小其他因素对观测变量的影响,使分析结论不准确。因此,为了更加准确的研究控制变量不同水平对观测变量的影响,应尽量排除其他因素对分析结论的影响。1、定义:协方差分析就是将那些很难人为控制的因素作为协变量,并在排除协变量对观测变量影响的条件下,分析控制变量对观测变量的影响,从而更加准确的对控制变量进行分析。,2、协方差分析的特点方差分析中的控制变量都是定性变量(包括定类和定序变量),线性回归分析中的解释变量(自变量)都是定量变量。而协方差分析中的控制变量是定性变量,而协变量一般是定量变量。所以说协方差分析是一种介于方差分析和线性回归分析之间的分析方法。例如:在研究生猪的饲养问题的协方差分析中,饲料是控制变量,生猪的初始体重是协变量。协方差分析中要求多个协变量之间无交互作用,且观测变量与协变量之间有显著的线性关系。,3、离差平方和的分解在协方差分析中,将观测变量的总离差平方和分解为由控制变量独立作用引起的、由控制变量交互作用引起的、由协变量引起的和随机变量引起的。以单因素协方差分析为例,观测变量的总变差可以分解为:,4、比较观测变量总离差平方和各部分的比例可以部分的由控制变量A来解释,在观测变量总离差平方和中,如果SSA所占比例较大,则说明控制变量A是引起观测变量的变动主要因素之一,观测变量的变动即控制变量A给观测变量带来了显著影响。对SSB、SSAB同理。,5.4.2协方差分析的基本步骤提出原假设:协变量对观测变量的线性影响是不显著的;在扣除协变量的影响条件下,控制变量各水平下观测变量的各总体均值无显著差异。计算检验统计量和概率P值给定显著性水平与p值做比较:如果p值小于显著性水平,则应该拒绝原假设,反之就不能拒绝原假设。,5.4.3协方差分析的应用举例案例:某小学在一年级新生入学时测量了其智力水平(即IQ值),并调查了学生参加学前教育并获取知识的情况、学生的生源情况、父母的文化程度。现在需要了解学前教育情况和生源是否对学生的智力水平产生了影响?在此过程中,需要屏蔽父母文化程度对学生智力因素产生的影响。操作步骤:(1)因变量正态性检验分析非参数检验旧对话框1样本K-S(2)自变量数值化编码转换重新编码为不同变量(3)多因素方差分析分析一般线性模型单变量,39,结果解读:,5.5多因变量的方差分析,5.5.1多因变量多因素方差分析在数据分析中,如果需要分析某些因素对多个因变量的影响,就需要对研究问题具体分析、若待分析的多个因变量之间没有关联性多个单因变量多因素方差分析。若待分析的多个因变量之间有关联性多变量方差分析技术,40,案例:某小学在一年级新生入学时测量了其智力水平(即IQ值),并调查了学生参加学前教育并获取知识的情况、学生的生源情况、父母的文化程度。现在需要了解学前教育情况和生源是否对学生的智力水平、入学测试成绩产生了影响?操作:分析一般线性模型多变量选项SSCP矩阵,41,42,5.5.2带重复测量的方差分析案例
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 知识型培训班课件
- 隐式并行跨平台适配-洞察及研究
- 知识分子培训班课件
- 人口与资源平衡研究-洞察及研究
- 复制标准与数字twin技术的协同研究-洞察及研究
- 2025年大学生安全知识模拟考试题+答案(附解析)
- 知识付费培训主播
- 知识产权销售培训资料课件
- 钻孔地质基础知识培训课件
- 知识产权法律培训
- 2024年度国网基建安全(变电土建)安全准入备考试题库(附答案)
- 小学数学课标培训课件:“数与代数”版块内容分析及教学建议
- 《HSK标准教程3》第1课
- 中国甲状腺相关眼病诊断和治疗指南2022年解读
- 石油储量与产量预测模型研究
- 《忆秦娥~ 娄山关》
- 新八年级上册数学开学第一课
- 安全挂梯施工方案
- 高速铁路接触网运行维修规则
- 《项目管理飞行检查管理办法》宣贯交底
- 易制爆化学品危险物品单位治安防范情况检查评估表
评论
0/150
提交评论