精编第五章方差分析资料_第1页
精编第五章方差分析资料_第2页
精编第五章方差分析资料_第3页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 方差分析如果要检验两个总体的均值是否相等, 我们可以用 t 检验。当要检验多个总体的 均值是否相等,则需要采用方差分析。方差分析是 发明的,它是通过对误差的分析研究来检验两个或多个正 态总体均值间差异是否具有统计意义的一种方法。由于各种因素的影响,研究所得的数据呈现波动,造成波动的原因可分成两类, 一是不可控的 随机因素 ,另一是研究中 施加的对结果造成影响的可控因素 ,方差分析 认为不同处理组的均值间的差异基本来源有两个:组内差异: 由随机误差造成的差异, 用变量在各组的均值与该组内变量值之差平 方和的总和表示,记作 SSE。组间差异:由因素中的不同水平造成的差异,用变量在各组的均值

2、与总均值之差 平方和的总和表示,记作 SSA。方差分析的基本思想是:通过分析研究中不同来源的变异对总变异的贡献大小, 从而确定可控因素对研究结果影响力的大小。方差分析的三个条件:? 被检验的各总体均服从正态分布;? 各总体的方差皆相等;? 从每一个总体中所抽出的样本是随机且独立的;方差分析的基本步骤:建立原假设HO:两个或多个总体均值相等。将各不同水平间的总离差分成两个部分:组间差异 SSA组内差异 SSE构造检验统计量: F= MSA / MSE判断:在零假设为真时,FF(k-I),(n-k)的F分布。若各样本平均数的差异很大,则分子组间差异会随之变大,而 F值也随之变大,故F检验是右尾检

3、验。当检验统计量F大于临界值时则拒绝原假设;或者根据 p值来判断,若 p< a,则拒绝原假设§ 5.1 单因素方差分析(On e-Way ANOV过程)On e-WayA NOVAi程用于进行两组及多组样本均数的比较,即成组设计的方差分 析,如果做了相应选择,还可进行随后的两两比较,甚至于在各组间精确设定哪 几组和哪几组进行比较。5.1.1 界面说明【Dependent List 框】选入需要分析的变量,可选入多个结果变量(应变量)。【 Factor 框】选入需要比较的分组因素,只能选入一个。【 Contrast 钮】弹出 Contrast 对话框,用于对精细趋势检验和精确两两

4、比较的选项进行定义, 由于该对话框太专业,也较少用,这里只做简单介绍。o Polynomial 复选框 定义是否在方差分析中进行趋势检验。o Degree 下拉列表 和 Polynomial 复选框配合使用,可选则从线性趋势一 直到最高五次方曲线来进行检验。o Coefficients 框 定义精确两两比较的选项。 这里按照分组变量升序给每 组一个系数值,注意最终所有系数值相加应为 0。如果不为 0 仍可检验, 只不过结果是错的。 比如说在下面的例 5.1 中要对第一、 三组进行单独比 较,则在这里给三组分配系数为 1、0、-1 ,就会在结果中给出相应的检 验内容。【 Post Hoc 钮】弹

5、出 Post Hoc Multiple Comparisons 对话框,用于选择进行各组间两两比较的 方法,有:o Equar Variances Assumed 复选框组 一组当各组方差齐时可用的两两比 较方法,共有14中种这里不一一列出了,其中最常用的为 LSD和S-N-K 法。o Equar Variances Not Assumed 复选框组 一组当各组方差不齐时可用的 两两比较方法,共有 4 种,其中以 Dunnetts's C 法较常用。o Significance Level 框 定义两两比较时的显著性水平,默认为 0.05 。11此处只是介绍可用的方法,并不是要推荐说那

6、种最好,使用时请认真参考有 关统计书籍。【Options钮】弹出Options对话框,用于定义相关的选项,有:o Statistics复选框组选择一些附加的统计分析项目,有统计描述(Descriptive )和方差齐性检验(Homogeneity-of-varianee )。o Means plot复选框用各组均数做图,以直观的了解它们的差异。o Missing Values单选框组定义分析中对缺失值的处理方法,可以是具体 分析用到的变量有缺失值才去除该记录(Excludes cases an alysis by analysis ),或只要相关变量有缺失值,则在所有分析中均将该记录去除 (E

7、xcludes cases listwise)。默认为前者,以充分利用数据。5.1.2 分析实例例5.1某职业病防治院对31名石棉矿工中的石棉肺患者、可疑患者及非患者进 行了用力肺活量(L)测定,问三组石棉矿工的用力肺活量有无差别(卫统第三 版例5.1)?石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.81.92.62.71.72.53.01.82.33.41.92.43.01.82.43.41.83.32.03.5检验:HO:三组石棉矿工的用力肺活量没有差别H1 :三组石棉矿工的用力肺活量有差别解:设数据已经输好,分组变量为 group,三组取值

8、分别为1、2、3,结果变量 为X。此处先进行单因素方差分析,然后进行两两比较,这里选择 S-N-K法进行 两两比较。操作如下:o Dependent List 框:选入 Xo Factor 框:选入 groupo Post Hoc钮:选中S-N-K复选框:单击 Continue钮o 单击OK钮5.1.3 结果解释上题的输出结果如下:On ewayANOVA用力神溶是Sum of Squar«sdfMean- SquareFSigBetween Groups92B624.63364.544.000Within Groups134266.48OE2T ata10.30030上面实际上是一

9、个典型的方差分析表。给出了单因素方差分析的结果,可见F=84.544,PvO.001。因此可认为三组矿工用力肺活量不同。上表的标题内容翻译如下:离均差平方和SS自由度均方mSI F值P值组间变异9.26624.63384.544.000组内变异1.534285.480E-02总变异10.80030Post Hoc TestsHomoge neous SubsetsStu dent-h from an“ Keulsa,t)Subset for jlpha = .05M123石郴帅崽者1117609G2 3111113 0318Slfl.1.0001.000roooMeddf for groups

10、 iti hcrric&neous fubfeis are displayed.3.w就 Hannoblt ll«aiorpte- 1D2«tt-Ttate 冶q*mLT治 katmoitoottieitoipi lief * ueo.T kror闰畔比目齢Ktgoraittd.上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按 大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的 P值则大于0.05。从上表可见,石棉肺 患者、可疑患者和非患者被分在了三个不同的亚组中,因此三组间两两比较均

11、有 差异;由于各个亚组均只有1个组别进入,因此最下方的组内两两比较 P值均为 1.000 (自己和自己比较,当然绝对不会有差异了)。从上面的解释大家可以得知:SPSS4行两两比较时,如果有差异,则只会告诉你P值小于预定的界值(默认为0.05),而不会给出具体的概率P有多大§ 5.2两因素方差分析例5.2对小白鼠喂以A B C三种不同的营养素,目的是了解不同营养素增重 的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素 对体重增长的影响。现将同品系同体重的 24只小白鼠分为8个区组,每个区组 3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂

12、养后所增体重有无差别?检验:H0:三种不同营养素喂养后所增体重没有差别H1:三种不同营养素喂养后所增体重有差别区组号A营养素B营养素C营养素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20根据统计分析的要求,我们建立了三个变量来包括上述信息,即group表示区组,food代表使用的营养素,weight表示最终的重量,即:group foodweight1150.011258.201364.

13、5依此类推对话框界面说明这里只有一个结果变量 weight,要采用univarate对话框,如下所示:在上面的这些框框钮钮中,最常用的有:Dependent Variable 框、FixedFactors框、Model钮、Post Hoc钮,下面我们来一一解释。【Depe ndent Variable 框】选入需要分析的变量(应变量),只能选入一个。这里我们的应变量为 weight,将他选入即可。Fixed Factors 框】即固定因素,固定因素指的是在样本中它所有可能的取值都出现了,比如 例中的 food ,只可能有 1、2、3 这三个值,并且都出现了,就被称作固定效应。 必须是分类变量。

14、可多选。【 Random Factors 框】用于选入随机因素,随机效应的因素指的是所有可能的取值在样本中没有 都出现,或不可能都出现,如本例中的 group ,实际上总体中当然不可能只有这 8 成绩组, 因此要用样本中 group 的情况来推论总体中 group 未出现的那些取值 的情况时就会存在误差,因此被称为随机因素。必须是分类变量。可多选。 注意:把随机因素当作固定因素选入,其结果是一样的。【 Covariate 框】用于选入协方差分析时的协变量,进行协方差分析。【WLS Weight框】即用于选入最小二乘法权重系数。别理他,一般不用。【 Model 钮】单击后出现一个对话框,用于设置

15、在模型中包含哪些主效应和交互因子, 默认情况为 Full factorial ,即分析所有的主效应和交互作用。 我们这里没有 交互作用可分析,所以要改一下,否则将作不出结果来。将按钮切换到右侧的 custum,这时中部的Build Term下拉列表框就变黑可用,该框用于选择进入模 型的因素交互作用级别, 即是分析主效应、 两阶交互、三阶交互、还是全部分析。 这里我们只能分析主效应:选择 main,再用黑色箭头将group和food选入右侧 的 model 框中,如果对这段叙述不太清楚,请参考下面的动画。该对话框中还有两个元素:左下方的 Sumof squares框用于选择方差分析 模型类别,有

16、1型到4型四种,如果你搞不清他们之间的区别,使用默认的 3 型即可;右下方的In elude in tercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可。【Contrast钮】弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定 义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少,反 正我都没用过,就干脆就不介绍了。【Plots钮】用于指定用模型的某些参数作图,比如用food和group来作图,用的也比 较少(指国内,因为它主要是用来做模型诊断用的)Post Hoc 钮】 该按钮弹出的两两比较对话框和单因素方差分析中的一模

17、一样, 不再重复本题对food作两两比较,方法为SNK法。【Save钮】将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保 存的结果有预测值、残差、诊断用指标等。【 Options 钮】可以定义输出哪些指标的估计均数、并做所选择的两两比较,还有其他一 些输出,如常用描述指标、方差齐性检验等。好了,都解释完了,再重复以下,我们所作的操作为:1. Analyze=>General Lineal model=>Univariate2. Dependent Variable 框:选入 weight3. Fixed Factors 框:选入 group 和 food4. Mod

18、el 钮:单击5. Custom 单选钮:选中6. Model 框:选入 group 和 food7. 单击 OK8. Post Hoc 钮:单击9. Post Hoc test for 框:选入 food10. SNK复选框:选中11. 单击 OK12. 单击 OK按照上题的操作,结果输出如下:Univariate Analysis of VarianceBeiweeibSiibjects Factoi s村GROUP1 0032.0033.0034 0035.0036.0037.0033FOOD1.0082.0093.D08这是一个所分析因素的取值情况列表,没有什么不好懂的Tests of

19、 BetweeibSulijects EffectsDependent Variable: WEIGHTSourceType III Sum ofSquaresdfMean SquareFSig.Corrected Model2521,294*9280.14411 517.000Intercept74359.534174359 5343056,985000GROUP2376.3761339.48213.956000FOOD144.917272.4592 979084Error340 5431424.324Total77221.37024Corrected Total2B61J3523a. R

20、Squared = .881 (Adjusted R Squared 二.805)现在大家看到的是一个典型的方差分析表,只不过是两因素的而已,我来 解释一下:首先是 所用方差分析模型的检验,F值为11.517, P小于0.05,因此 所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行 是截距,它在我们的分析中没有实际意义,忽略即可,如果不想看到这一项结果, 可以不选择In elude in tercept in model复选框;第三行是变量 GROUP可见它也有统计学意义,不过我们关心的也不是他;第四行是我们真正要分析的FOOD非常遗憾,它的P值为0.084,还没有统计学

21、意义。我们的结论也只能是: 尚不能认为三种营养素喂养的小白鼠体重增量有差别。上表的标题内容翻译如下:变异来源III型方差SS自由度均方MS统计量FP值校正的模型2521.2949280.14411.517.000截距74359.534174359.5343056.985.000GROUP2376.3767339.48213.956.000FOOD144.917272.4592.979.084误差340.5431424.324合计77221.37024n校正的合计2861.8362311Post Hoc TestsFOODHomoge neous SubsetsWEIGHTStuderit-Newnnari'keulsJ<t>FOODNSubset11.00853,00002 0085195003.00859.1375Sia.121Means for groups in homogeneous subsets aw displayedi. Based

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论