第6章群体间的差异比较方差分析_第1页
第6章群体间的差异比较方差分析_第2页
第6章群体间的差异比较方差分析_第3页
第6章群体间的差异比较方差分析_第4页
第6章群体间的差异比较方差分析_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

组间差异比较方差分析,第6章,执行摘要,6.1方差分析概述,(1)方差分析介绍,数据文件“社区”。sav”是对大学生参与社区活动的兴趣调查。课程分为四个年级:一年级、其他四年级本科生、硕士研究生和博士研究生。人们对社区活动的兴趣程度是通过每周花在社区活动上的时间来衡量的。经验表明,随着年级的增加,对社区活动的兴趣下降。因此,有必要比较四个年级学生每周参加社区活动的平均时间是否有差异。首先,进行描述性统计:平均比较和方框图展示。方法1:探索过程方法2:比较方法均值过程法律对话框箱线图,(1)引入方差分析,首先用均值过程比较各组之间的平均数,(1)引入方差分析,用箱线图显示不同等级组之间的差异,(1)引入方差分析,比较各组之间的平均数,一种方法是通过独立样本的T检验进行两次比较,所以C42=6次,需要两次比较,也就是说,需要6次独立样本的T检验。在T检验中,原始假设是否成立是由显著性来判断的(Sig。值)。显著性=0.05表示以5%的误差水平拒绝或接受原始假设。六次T检验将产生六个Sig值,综合Sig值为1-0.956=0.265,大于0.05的预设显著性水平。因此,T检验不再适用于多组的比较。(2)方差分析的思想,假设四个年级的学生来自四个不同的群体,各组的方差相等,数据服从正态分布,各组的样本是独立的随机样本。也就是说,这四组具有相同的分布。通过比较各组之间的平均值,可知参与社区活动的四个组按年级划分的平均值是不同的。要回答的问题是:平均值的差异是由抽样因素引起的吗?还是因为不同的群体总体上有不平等的平均值?通过方差分析,可以将样本的方差分解为分组因子的方差和抽样波动的方差。如果分组得出的方差远远大于抽样波动得出的方差,就有理由认为每组的平均值明显不相等。换句话说,这些亚群体不是来自具有相同均值和方差的同一个大群体,至少有一个亚群体来自具有不同均值的其他群体。(3)方差分析涉及的主要概念,元素:指定距离的因变量。方差分析用于检验各组因变量的平均值是否相等。因子:用于分组的变量称为“因子”。例如,变量“等级”是一个因子,通常用来解释因变量的方差。水平:因子的值称为“水平”。例如,“等级”有4个值,即有4个“等级”;组内方差:表示组内每个样本的值相对于组内平均值的离差程度,代表总方差中不能用分组因子解释的部分;组间方差:代表各组平均值相对于总平均值的分布离散度,代表总方差中可以用分组因子解释的部分。(3)方差分析涉及主要概念,例如,有必要比较三个班的英语成绩。每班随机抽取五名学生,他们的英语成绩见下表1。从一个班级中随机选出三名学生,他们的分数每次都不一样。见表2。表1:三个班级的英语成绩样本,表2:同一个班级三个样本的英语成绩样本,由抽样波动引起的平均差异(组内差异),或整个人群之间的显著差异?(组间差异),(3)差异分析涉及主要概念,1。计算组之间的差异:组之间的差异可以从表1中获得,组之间的差异可以从第二组中获得,(3)差异分析涉及主要概念,计算,3。计算f比率,2。计算组内方差:g内方差(4)方差分析的适用范围。方差分析是一种假设检验。当使用方差分析时,分析中涉及的变量来自人群的要求和假设。数据需要一个因变量(常数距离变量)和一个或多个自变量(分类变量)的基本假设:独立随机性:每个种群中的样本必须是每个种群独立随机抽样所需的正态分布;每组样本来自正态种群因变量的常数方差;每组样本中因变量的方差在总体水平上是相等的。(5)方差分析假设,在方差分析中,原始假设为:被测人群的平均值相等;替代假设:至少其中一个群体的平均值不同于其他群体的平均值。(5)方差分析的假设是在原假设下进行的方差分析,即集团内的方差不依赖于原假设的建立,不受样本均值的影响,是一个相对“稳定”的值;只有当原始假设成立时,组间方差的估计才是正确的,否则组间方差将非常大。结论根据组内差异,可以看出同一组中不同病例值的差异程度。根据各组之间的差异,可以观察到不同组之间的差异程度。如果组间的方差远大于组内的方差,那么群体平均值之间没有差异的原始假设就可以被拒绝。(6)判断方差分析的结果,构造服从已知F分布的F统计量。如果原来假设各组均值相等,组间方差主要是由随机误差引起的,即组间方差的值应接近组内方差,即F值不要太大,接近1;如果自变量对因变量有显著影响,那么自变量的每个因子对组间均方偏差的影响必须远大于随机误差,并且F值显著大于1。给出了显著性水平,并将其与检验统计量f的概率P值进行了比较。如果P值小于,则应拒绝零假设,并且认为在自变量的不同水平上,因变量的总体平均值存在显著差异。如果P的值大于,则不能拒绝零假设。据信,在独立变量的不同水平上,因变量的总体平均值之间没有显著差异。病例6.1单变量方差分析,根据数据“社区。sav”推断不同年级的学生参与社区活动的兴趣是否存在差异。分析比较均值单因素方差分析,因变量,自变量,趋势检验,多重比较检验,等方差假设成立,等方差假设不成立,两种常用的多重比较方法,输出结果选项,方差同质性检验,均值图,结果描述,步骤1:描述性统计结果:表格或方框图,结果描述,步骤2:总体的方差同质性检验。当样本总数较大且样本中病例数相对接近时,方差分析对总体的正态分布和等方差性要求不高。当样本量不大且样本中病例数变化很大时,方差分析需要正态总体和等方差。方差齐性检验的最初假设是各组的方差相等。因此,P值大于0.05,方差齐性检验通过。结果显示第三步:整体正态检验:直方图或Q-Q图。数据可以被分割,直方图可以用来观察每一组的正态性。它也可以通过从探索过程输出的Q-Q图或KS测试结果来判断。三组的正态性检验都失败了。然而,只要样本量足够大,非正态性就不会影响方差分析的结果。结果表明,第四步:方差分析结果,F值远大于1,表明组间方差远大于组内方差,分组引起的差异远远超过抽样误差。P v在上面的例子中,我们只考虑了自变量“年级”对因变量“参加社区活动的时间”的影响。如果我们考虑“性别”和“年级”这两个因素对“参加社区活动的时间”的影响,此时的分析不能用单因素方差分析来完成。双因素方差分析是检验当有两个独立变量时,各组的平均值是否相同。(1)双因素方差分析原理,1。测试假设当同时考虑年级和性别时,要测试的假设变成三个,最后一个是两个因素的交互作用是否显著:不同年级的学生是否有相同的平均每周参加社区活动的时间;男女学生每周参加社区活动的平均时间是否相等;经过年级和性别的交互分析,各组的平均值是否相等。2.数据要求要求所有数据组来自正态分布总体中的随机样本,并且每组的方差是恒定的。(1)双因素方差分析原理,(3)主效应和交互效应在方差分析中,主效应是指各因素分别对因变量的影响。在这种情况下,等级和性别构成两个主要影响。交互效应是指第三个因素(年级和性别交互作用)对因变量的影响。(1)双因素方差分析原理,参与社区活动的平均时间=年级因素的影响,性别因素的影响,以及交互作用的缺失;(1)双因素方差分析原理,案例的交互效应,平均年薪的起点=性别因素的影响工作单位属性的影响性别和工作单位属性的交互效应;(1)双因素方差分析原理,以及(4)双因素方差分析的检验原理也被用来通过比较组间和组内的方差来解释每个自变量的影响是否显著。双因素方差分析中的组内方差之和是两个独立变量相互作用形成的各组方差之和。例如,在性别和年级的交互作用中,组内方差的总和应考虑24=8组内每组的平均差的总和。案例6.2双因素方差分析,针对数据“社区”。sav”分析了年级和性别对参加社区活动时间的影响。分析一般线性模型单变量,案例6.2双因素方差分析,模型选项卡,三个变量包括年级,性别和交互作用。如果交互作用不显著,请返回此选项卡以移除交互作用。案例6.2双因素方差分析,配置文件复制选项卡:输出一个均值图,单击添加将输出一个考虑交互影响的均值图。案例6.2双因素方差分析,选项选项卡,输出描述性统计,方差同质性测试,方差同质性测试通过。(最初的假设是各组的方差相等),主效应显著,交互效应不显著。案例6.2双因素方差分析。当交互作用不显著时,需要重新分配模型选项卡中的变量来消除交互作用。案例6.2双因素方差分析,由于主效应显著,可以做比较后的事情:事后比较,自变量水平应大于三。误差项中引入了相互作用效应,然后用最小二乘法对结果进行比较。“手机购买数据显示。不同年级的学生购买手机有什么不同的动机吗?如果性别也考

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论