




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第9章方差分析 介绍1 方差分析的概念2 方差分析的过程 本章内容 9 1方差分析的概念与方差分析的过程9 2单因素方差分析9 3单因变量多因素方差分析过程9 4多因变量线性模型的方差分析9 5重复测量设计的方差分析9 6方差成分分析9 7正交实验设计练习题 对银行数据进行方差分析 9 1 1方差分析的概念 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响 通常是比较不同实验条件下样本均值间的差异方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法 例如医学界研究几种药物对某种疾病的疗效 农业研究土壤 肥料 日照时间等因素对某种农作物产量的影响不同饲料对牲畜体重增长的效果等都可以使用方差分析方法去解决 方差分析基本原理 认为不同处理组的均值间的差别基本来源有两个 1 随机误差 如测量误差造成的差异或个体间的差异 称为组内差异 用变量在各组的均值与该组内变量值之偏差平方和的总和表示 记作SSw 组内自由度dfw 2 实验条件 即不同的处理造成的差异 称为组间差异 用变量在各组的均值与总均值之偏差平方和表示 记作SSb 组间自由度dfb总偏差平方和SSt SSb SSw的公式P147 方差分析基本原理 续 组内SSw 组间SSb除以各自的自由度 组内dfw n m 组间dfb m 1 其中n为样本总数 m为组数 得到其均方MSw和MSb 一种情况是处理没有作用 即各组样本均来自同一总体 MSb MSw 1 另一种情况是处理确实有作用 那么 MSb MSw 远远大于 MSb MSw比值构成F分布 用F值与其临界值比较 推断各样本是否来自相同的总体 方差分析的假设检验 零假设H0 m组样本均值都相同 即 1 2 m如果经过计算结果组间均方远远大于组内均方 MSb MSw F F0 05 dfb dfw p0 05不能拒绝零假设 说明样本来自相同的正态总体 处理间无差异 9 1 2方差分析中的术语 1 因素与处理 因素是影响因变量变化的客观条件 处理是影响因变量变化的人为条件 也可通称为因素 用分类变量表示 取有限的离散值2 水平 因素的不同等级称作水平 水平值取有限的离散值 如 性别中的0 1 男 女 等3 单元 cell 指各因素的水平之间的每个组合 如性别 0 1 和年龄 10 11 12 的六种组合 9 1 2方差分析中的术语 续 4 因素的主效应和因素间的交互效应 如药物A B的主效应及AB的交互效应 5 均值比较 均值的相对比较是比较各因素对因变量的效应大小的相对比较 如研究A B的单独效应之和是否等于它们的交互效应 或A B的效应是否相等 均值的多重比较是研究因素单元对因变量的影响之间是否存在显著性差异 如A B的疗效是否存在显著性差异 6 单元均值 边际均值 在多因素方差分析中 每种因素水平组合的因变量均值称为单元均值 一个因素水平的因变量均值称为边际均值 MarginalMeans 方差分析中的术语 续 7 协方差分析 在一般进行方差分析时 要求除研究的因素外应该保证其他条件的一致 作动物实验往往采用同一胎动物分组给予不同的处理 研究不同处理对研究对象的影响就是这个道理 如研究身高与体重的关系时要求按性别分别进行分析 以消除性别因素的影响 要消除其他因素的影响 应采用协方差分析 8 重复测量 组内变异的主要的原因是实验对象之间的个体差异 由于个体差异存在 即使实验对象受到相同的处理 他们的因变量值也可能相当不同 重复测量设计的方差分析也是像协方差分析一样 是在研究中减少个体差异带来的误差方差的一种有效方法 而且由于对相同个体进行重复测量 在一定程度上降低了人力 物力 财力的消耗 如果重复测量是在一段时间内或一个温度间隔内进行的 还可以研究因变量对时间 温度等自变量的变化趋势 这种重复测量研究称为趋势研究 9 1 3方差分析过程 1 One Way过程 单因素简单方差分析过程 在CompareMeans菜单项中 可以进行单因素方差分析 均值多重比较和相对比较 2 GeneralLinearModel 简称GLM 过程 GLM过程由Analyze菜单直接调用 这些过程可以完成简单的多因素方差分析和协方差分析 不但可以分析各因素的主效应 还可以分析各因素间的交互效应 GeneralLinearModel 简称GLM 过程 在GeneralLinearModel菜单项下有四项 Univariate 提供回归分析和一个因变量和一个或几个因素变量的方差分析 Multivariate 可进行多因变量的多因素分析RepeatedMeasure 可进行重复测量方差分析VarianceComponent 可进行方差成分分析 通过计算方差估计值 可以帮助我们分析如何减小方差 9 单因素方差分析 也称有一维方差分析 对二组以上的均值加以比较 检验由单一因素影响的一个 或几个相互独立的 分析变量由因素各水平分组的均值之间的差异是否有统计意义 并可以进行两两组间均值的比较 称作组间均值的多重比较 还可以对该因素的若干水平分组中哪些组均值不具有显著性差异进行分析 即一致性子集检验 One WayANOVA过程要求 因 分析 变量属于正态分布总体 若因 分析 变量的分布明显的是非正态 应该用非参数分析过程 对被观测对象的实验不是随机分组的 而是进行的重复测量形成几个彼此不独立的变量 应该用RepeatedMeasure菜单项 进行重复测量方差分析 条件满足时 还可以进行趋势分析 9 1简单的一维方差分析 使用系统默认值进行一维方差分析 P151比较四种饲料对猪体重增加的作用有无不同 注意 分组变量的定义 data09 01Analyze CompareMeans One WayANOVADependentList weightFactor fodder结果只有方差分析表结果中比较有用的值 Sig显著性概率值 结论 四种饲料对猪体重增加的作用有显著性差异 零假设H0 组间均值无显著性差异 即四种饲料对猪体重增加的平均值无显著性差异 9 2 9 3单因素方差分析的选择项和例子 使用选择项的单因素方差分析 P155比较四种饲料对猪体重增加的作用data09 01Analyze CompareMeans One WayANOVADependentList weightFactor fodderContrasts选项 多项式比较 AD与BC比较和AC与BD比较 PostHoc选项 均值多重比较LSD和Tamhane sT2 一致性子集检验Duncan 各种方法的使用条件 方差齐或不齐 Options选项 Descriptive描述统计量 Homogeneity of variance方差齐次性检验 Meansplot均值分布图结果除了方差分析表 还有很多选项相应的结果结论 四种饲料对猪体重增加的作用有显著性差异 还可得知ABCD四种饲料对猪平均体重增加多少 越来越多 P159同种三叶草被接种上不同的菌种 其含氮量情况data09 02 注意PostHoc各种方法结果的使用条件 方差齐或不齐 9 3单因变量多因素方差分析过程 多因素 2 1 单因变量多因素方差分析概述2 单因变量多因素方差分析的菜单和选择项3 使用系统默认值进行随机区组设计资料的方差分析4 2 2析因实验方差分析实例5 拉丁方区组设计的方差分析实例6 协方差分析实例7 多维交互效应方差分析实例 9 3 1单因变量多因素方差分析概述 1 概述是对一个独立变量是否受多个因素或变量影响而进行的方差分析 SPSS调用UNIANOVA过程 检验不同水平组合之间因 分析 变量均值由于受不同因素影响是否有差异的问题 UNIANOVA过程可以分析每一个因素的作用 主效应 也可以分析因素之间的交互作用 交互效应 可以进行协方差分析 以及各因素变量与协变量之间的交互作用 UNIANOVA过程要求因变量是从多元正态总体随机采样得来 且总体中各单元的方差相同 也可以通过方差齐次性检验选择均值比较结果 因变量和协变量必须是数值型变量 协变量与因变量彼此不独立 因素变量是分类变量 可以是数值型和字符型 固定因素变量 FixedFactor 是反应处理的因素 随机因素是随机设置的因素 是在确定模型时需要考虑会对实验有影响的因素 对实验结果影响的大小可以通过方差成分分析确定 2 关于模型 GLMUnivariate功能很强 可以建立包括各种主效应 交互效应的模型 必须认真分析因素变量的具体情况 来确定自己的模型 否则会产生不可解释的输出结果 9 3 2单因变量多因素方差分析的菜单和选择项 菜单 Analyze GeneralLinearModel Univariate选项 选择分析模型Model 默认全模型FullFactorial 包括所有因素变量的主效应 所有协变量的主效应 所有因素与因素的交互效应 不包括协变量与其他因素的交互效应 自定义模型Custom 主效应 Maineffects及其因素变量 交互变量 有交互效应维数之分 选择分解平方和的方法 默认为TYPEIII IncludeInterceptinmodel 系统默认截距包括在回归模型中 选择对照方法Contrasts选择分布图形Plots选择多重比较分析PostHoc保存运算结果的选择项Save选择输出项Options 9 3 3使用系统默认值进行随机区组设计资料的方差分析 P168比较不同种系 剂量的雌性大白鼠子宫重量 看不同种系 不同剂量对雌性大白鼠子宫重量是否有显著性作用data09 03Analyze GeneralLinearModel UnivariateDependent wuteriFixedFactor s mouse etrogenModel选项 Custom Maineffect mouse和etrogen 主效应方差分析检验结果 截距 主效应 误差Error 结果中比较有用的值 Sig显著性概率值 各自主效应 截距 线性回归关系 结论 不同种系 不同剂量对雌性大白鼠子宫重量均有有显著性作用 注意 选择只有主效应 原因是每种组合只有一个观测量 如果分析交互作用 无法计算差异的显著性 9 3 4析因实验方差分析概念 多因素析因实验的方差分析 析因实验是把各因素的各水平的全部组合排列出来 然后按每个条件的组合作一次或多次重复的实验 所得的全部数据个数n a b k 其中a b 为各因素的水平数 k为每种组合内的重复数 析因分析的好处在于对各因素间的交互影响项的方差都可以加以析离并检验其显著性 9 3 42 2析因实验方差分析实例 两因素 两水平的实验设计 例子 P171使用两种药物A 0 不用 1 用 和B 0 不用 1 用 治疗缺铁性贫血 2 2 4种组合 每种组合有3个病人 看A B AB的作用data09 04Analyze GeneralLinearModel UnivariateDependent redcellFixedFactors drugA drugB保留全模型选项 不对Model操作 选择Plot选项 作三个图drugA drugB drugA drugB选择输出Option选项 选drugA drugB drugA drugB Overall进入DisplayMeansfor框中结果除了方差分析表 截距 主效应 交叉效应 误差Error 还有很多选项相应的结果结论p173 两种药物A和B均对治疗缺铁性贫血有显著疗效 两种药物A和B的协同作用也很显著 9 3 5拉丁方区组设计的方差分析实例 拉丁方实验设计的特点 有两个以上因素变量 每个因素变量的水平数相等 例子 P174为了评价六种不同甜菜 选择地块土壤条件相同 将六种甜菜 变量variety 种子播种在六行 变量rep 六列 变量Col 的地块上 记录两次收获 变量Harvest 的产量 变量yield data09 05 3因素6 6拉丁方 n 6 6 2 72Cases 实验的假设是 不同地块 行 列 对产量均值无影响 不同种子产量均值无影响Analyze GeneralLinearModel UnivariateDependent yieldFixedFactors rep col varietyModel 只分析三个主效应rep col variety Maineffects 主效应方差分析检验结果 截距 主效应 误差Error 结果中比较有用的值 Sig显著性概率值 各自主效应 不同品种的甜菜variety有显著性差异 即平均产量的差异主要是品种不同造成的 而跟地块无关 9 3 6协方差分析实例 协方差分析是利用线性回归方法消除混杂因素的影响后进行的方差分析 例子 P176镉作业工人按暴露于镉烟尘的年数大于等于10年和不足10年两组 两组工人的年龄未经控制 人随着年龄的增长 肺活量也会有所下降 测量了每个工人的肺活量 课题研究暴露于镉粉尘的年数和肺活量的关系 要消除年龄的影响 Data09 06 Time接触镉粉尘时间分组 1为 10年 2为GeneralLinearModel UnivariateDependent VitalcpFixedFactors timeCovariate AgeOption DisplayMeansFor time 分Time显示肺活量均值 Display ParameterEstimates 肺活量与年龄的线性回归方程 分time 结果中比较有用的值 Sig显著性概率值 各主效应 年龄Age有显著性差异 TIME无显著性差异 即肺活量的差异是由于被试者的年龄差异所致 与被试者接触镉粉尘时间的时间是否大于10年无关 9 3 7多维交互效应方差分析实例 p178实验数据为教育心理学实验 心理运动测验分数与被试者必须瞄准的目标大小关系的资料Data09 07四个大小不同的目标 Target三部测验设备 Device两种不同明暗程度的照明环境 Light4 3 2的析因实验设计 24个组合单元 每组5个Cases 共24 5 120Cases Analyze GeneralLinearModel UnivariateDependent ScoreFixedFactors Target Device LightModel 保留全模型选项 不对Model操作 选择输出Option选项 选Target Device Light进入DisplayMeansfor框中 各种组合均值选择Plot选项 作四个图Target Device Light Target Device Light结果中比较有用的值 Sig显著性概率值 各主效应 交互效应 均对Score有显著性作用 9 4多因变量线性模型的方差分析P181 概述 GLMMultivariate过程提供回归分析和多因变量的方差分析 多因变量方差分析模型除包括多个因变量外 还可以包括一个或几个因素变量或协变量 因素变量把总体分为几个组 使用这个一般线性模型过程 可以检验因素变量在因变量的联合分布的各组均值的效应 可以研究因素间的交互效应和单一因素的效应 另外还包括协变量效应和协变量与因素间的交互效应 对回归分析 协变量作为自变量 预测变量 GLMMultivariate过程可以检验平衡和不平衡模型 模型中每个单元包括相同数量的观测量为平衡设计 9 4 3多因变量线性模型方差分析实例 实例 数据是对男33人 女26人的头部四个解剖部位的测量结果 研究男女头部有无显著性差异 Data09 08菜单 Analyze GeneralLinearModel MultivariateDependent Basilar length postorb zygomaFixedFactors SexModel 保留全模型选项 不对Model操作 Option DescriptiveStatistics结果中比较有用的值 Sig显著性概率值 不同性别的头部四个解剖部位没有显著性差异 9 5重复测量设计的方差分析 概述P187 重复测量设计方差分析的样本必须包括同质的实验单位或进行多次重复测量的实验 GLM重复测量属于高级分析过程 是对同一因变量进行重复测量 可以是同一条件下进行的重复测度 目的在于研究各种处理之间是否存在显著性差异的同时 研究被试着之间的差异 也可以是不同条件下的重复测度 目的在于研究各种处理间是否存在显著性差异的同时 研究形成重复测量条件间的差异以及这些条件与处理间的交互效应 重复测量设计方差分析的数据文件结构 若干次重复测量结果作为不同因变量出现在数据文件中 9 5重复测量方差分析实例1 P188实例1 Data09 09 设置了三个级别的视觉刺激作为处理因素变量vsno 视觉刺激等级1 2 3 4位被试者均接受三个级别的视觉刺激 并在同样条件下测试三次 time1 time2 time3 H0 三个级别的视觉刺激之间 被试者内 无显著性差异 菜单 Analyze GeneralLinearModel RepeatedMeasureWithin SubjectFactorName timeNuberofLevels 3Define Within SubjectsVariables time time1 time2 time3Between SubjectFactor vsno结果中比较有用的值 Sig显著性概率值 三次测量之间没有显著性差异 4位被试者之间对每种相同视觉刺激的反映也没有显著性差异 而对不同的视觉刺激等级有显著性差异 9 5 4重复测量方差分析实例2 P191实例 Data09 10a 研究四种药物对某生化指标的作用 med1 med2 med3 med4 5位被试者参与实验 零假设H0 四种药物对某生化指标作用之间 被试者内 无显著性差异 菜单 Analyze GeneralLinearModel RepeatedMeasureWithin SubjectFactorName medNuberofLevels 4Define Within SubjectsVariables med med1 med4Option DisplayMeansfor MedDisplay DescriptiveStatistics结果中比较有用的值 Sig显著性概率值 四种药物对某生化指标作用之间有显著性差异 而5位被试者之间对每种相同药物的反映也有显著性差异 9 5 5关于趋势分析 P194概念 当重复测量的条件是某些顺序变量时 可以分析重复测量的因变量随顺序变量变化的趋势 实例 Data09 11 选择16名实验对象 no 使用两种方法 group 锻炼他们的记忆力 训练一段时间后 每隔一天测试一次记忆情况 共测试5次 每次测试对每个参与实验的人员均按一定的法则打分 day1 day5 这是一个组内因素 一个组间因素的重复测量设计的例题 因为组内因素是与时间有关的变量 因此不但可以分析比较两种训练记忆的方法哪个更有效 还可以得到随时间的推移 记忆分数随时间下降的数学模型 线性关系Linear 二次关系Quadratic 三次关系Cubic 菜单 Analyze GeneralLinearModel RepeatedMeasureWithin SubjectFactorName days NuberofLevels 5 Define Within SubjectsVariables days day1 day5Between SubjectFactor groupModel Maineffects days Group Plots Days GroupOption DisplayMeansfor Days group overallDisplay DescriptiveStatistics和Estimateofeffectsize结果中比较有用的值 Sig显著性概率值 多元 组内 趋势分析 和趋势图 Days group的Plot图 9 6方差成分分析 概述P198 是对混合效应模型中各随机效应对因变量变异的贡献进行分析 菜单 Analyze GeneralLinearModel VarianceComponents定义因变量和随机因素选分析模型Model FullModel或Custom选分析方法Option 四选一MINQUE正态最小二次无偏估计 默认方法ANOVA AnalysisofVariance Maximumlik
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生宿舍安全管理与应急预案方案
- 水痘病人的护理
- 展示设计中的平面构成2024091783课件
- 水电安装安全知识培训课件
- 二零二五年度高品质地砖批量供货合作协议
- 二零二五年度房屋租赁合同违约金上诉状制作
- 2025版教育机构临时用工人员服务协议书
- 2025版新能源汽车短期租赁借车协议书
- 2025版在线教育平台课程订购及服务合同
- 2025版公共建筑照明设备更新改造合同
- 2025年医院血透室人员培训工作计划
- 2025年公务员考试时政热点必做题(附答案)
- 厨房刀具安全培训课件
- 护理烫伤不良事件分析及整改措施
- 执勤警示教育
- 供热企业运营管理制度
- 2025年外企德科人力资源服务招聘笔试参考题库含答案解析
- 生态环境综合整治工程项目投资估算
- CJ/T 341-2010混空轻烃燃气
- MSC:破解能源转型密码:中国清洁能源投资实践指南
- 存款代为保管协议书
评论
0/150
提交评论