




已阅读5页,还剩78页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
方差分析,方差分析,实际工作中这样的问题:几种不同的原料对产品质量有无显著影响这里考察的对象:原料称为因素把因素所对应的状态称为水平当考察的因素只有一个时,称为单因素问题。,Minitab,方差分析(analysisofvariance简称ANOVA).,方差分析,例考察温度对某一化工产品的得率的影响,选了五种不同的温度,同一温度作了三次试验,测得的结果如下:,Minitab,要分析不同的温度对得率的影响,考虑如下的问题:同一温度下的得率不一样,差异原因称为试验误差;温度的不同引起的得率的差异称为条件误差。,方差分析,Minitab,当我们要问温度对得率到底有无确切的影响时,由于上述多种误差原因的存在,就不能随意回答.,方差分析,Minitab,方差分析的功能:分析实验数据中不同来源的变异对总变异的贡献大小,确定实验中的自变量是否对因变量有重要影响。方差分析的方法:检验各总体的均值是否相等来判断分类型自变量(因素)对数值型因变量是否有影响。,方差分析,Minitab,方差分析,方差分析与回归分析的区别:当研究的是两个数值型变量的关系时是回归分析.回归分析沿水平轴的自变量是数值型变量,而方差分析中是分类变量。,Minitab,方差分析,在因素只有一个时不一定要采用方差分析,可以采用t-检验和z-检验t-检验和z-检验不能用于多于2个样本的数据.此时就要采方差分析。方差分析有单因素与多因素的区分。,Minitab,单因素方差分析理论基础,单因素方差分析单因子试验的一般概述(记号),在一个试验中只考察一个因子A及其r个水平A1,A2,Ar在水平Ai下重复mi次试验,总试验次数n=m1+m2+mr记yij是第i个水平下的第j次重复试验的结果,这里i水平号,j重复号经过随机化后,所得的n个试验结果列于下表单因子试验的数据:,Minitab,单因素方差分析单因子试验的三项基本假定,A1.正态性。在水平i下的数据yi1,yi2,yimi是来自正态总体的一个样本,i=1,2,rA2.方差齐性。r个正态总体的方差相等,即A3.随机性。所有数据yij都相互独立,单因子试验所涉及的多个正态总体,Minitab,单因素方差分析单因子试验的统计模型,其中是因子A的第i个水平下第j次试验结果;是因子A的第i个水平的均值,是待估参数;是因子A的第i个水平下第j次试验误差,它们是相互独立同分布的随机变量由此可知:,单因子试验的三项基本假定用到试验数据yij上去,可得到如下统计模型:,Minitab,单因子方差分析,Minitab,单因子方差分析总平方和的分解公式,Minitab,单因子方差分析,Minitab,单因子方差分析总平方和的分解公式,Minitab,单因子方差分析均方和,Minitab,单因子方差分析F检验,Minitab,单因素方差分析方差分析表,Minitab,例2:茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。为测定试验误差,需要重复。我们选用水平重复数不等的不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品等待测试。,单因素方差分析,Minitab,单因素方差分析,采用随机化试验方法,填写试验结果.,Minitab,四个产地绿茶叶酸含量的打点图(dotplot),图上表示叶酸含量,线表示样本均值。下述一些直观的印象是重要.图中每种绿茶的叶酸含量有高有低.从样本均值看,A1与A2的叶酸含量偏高一些.从样本极差看,A1,A2,A3的极差接近,A4的略小一点。,单因素方差分析,Minitab,单因素方差分析,Minitab,单因素方差分析诸均值的参数估计,Minitab,单因素方差分析小结,Minitab,多重比较,多重比较,r个水平均值是否彼此相等?用方差分析方法假如r个均值不全相等,哪些均值间的差异是重要的?用多重比较,Minitab,多重比较,Minitab,多重比较重复数相等情况的多重比较(T法),Minitab,多重比较重复数相等情况的多重比较(T法),Minitab,多重比较重复数不等情况的多重比较(S法),Minitab,多重比较重复数不等情况的多重比较(S法),Minitab,多重比较的Minitab参数设置,个别误差率与全族误差率(显著性水平)与多重比较关联的类型I误差率(假设检验第I类错误的概率)通常用于确定方差分析中的特定因子水平之间的显著差异。,Minitab,个别误差率单一比较错误地断定实测差异与原假设显著不同的最大概率。此概率等于为假设检验选择的显著性水平。全族误差率由多个比较组成的过程错误地断定至少有一个实测差异与原假设显著不同的最大概率。全族误差率基于个别误差率和比较次数。对于单一比较,全族误差率等于个别误差率。但是,每个附加比较都会导致全族误差率不断增加。,Minitab,多重比较的误差率,示例查看五个不同钢铁厂的钢强度(在每个工厂中使用25个样本),可以运行单因子方差分析。方差分析产生的p值小于0.05,断定至少有一个工厂的平均值不同于其他工厂的平均值。查看五个工厂之间所有的10个比较,以明确确定哪些平均值是不同的。,Minitab,多重比较的误差率,如果为10个比较中的每一个指定的Alpha均为0.05(个别误差率),则Minitab将针对由10个比较组成的一组计算全族误差率,即0.28。但是,如果要让整个一组比较的全族误差率为0.05,则Minitab为每个单个比较指定的Alpha均为0.007。,Minitab,多重比较的误差率,许氏与最佳值的多重比较(MCB)专门用于确定最佳因子水平、与最佳值稍有差异的因子水平、以及与最佳值有显著差异的因子水平的多重比较方法。可以将“最佳值”定义为最高平均值或最低平均值。许氏MCB将为每个水平均值与其余水平均值的最佳值之间的差异创建置信区间。,Minitab,Minitab多重比较方法,具体地说:最高为最佳最低为最佳置信区间包含零无差异无差异置信区间整个大于零明显更好明显更差置信区间整个小于零明显更差明显更好,Minitab,Minitab多重比较方法,Fisher最低显著性差异(LSD)法将个别误差率控制到指定水平的同时,为因子水平均值之间的配对差异创建置信区间。Fisher法随后使用个别误差率和比较次数为所有置信区间计算同时置信水平。此同时置信水平是所有置信区间包含实际差值的概率。,Minitab,Minitab多重比较方法,Minitab,例,测量内存芯片的响应时间。从五个不同的制造商处抽取25个芯片作为样本。方差分析产生的p值为0.01,至少有一个制造商的平均值不同于其他制造商。查看五个工厂之间所有的10个比较,以明确确定哪些平均值是不同的。使用Fisher法,可以指定每个比较的个别误差率都应为0.05(等效于95%置信水平)。Minitab将创建这十个95%置信区间,并计算出这一组置信区间的71.79%同时置信水平。,Minitab多重比较方法,多重比较的Dunnett法用于为每个因子水平的平均值与控制组平均值之间的差异创建置信区间。为所有比较指定全族误差率,Dunnett法针对每个单个比较相应地确定置信水平。,Minitab,Minitab多重比较方法,Tukey,全族误差率:选中此项可通过使用Tukey方法(在不平衡情况下也称为Tukey-Kramer)获得水平平均值之间的所有配对差异,然后输入介于0.5和0.001之间的全族误差率。大于等于1.0的值解释为百分比。默认误差率为0.05。,Minitab,Minitab多重比较方法,Fisher,个别误差率:选中此项可通过使用Fisher的LSD过程获得水平平均值之间的所有配对差异,然后输入介于0.5和0.001之间的个别误差率。,Minitab,Minitab多重比较方法,Dunnett,全族误差率:选中此项可为每个处理平均值和控制平均值之间的差异提供双侧置信区间,然后输入介于0.5和0.001之间的全族误差率。对照组水平:输入用于对照组因子水平的值,Minitab,Minitab多重比较方法,许氏MCB,全族误差率:选中此项将获得每个水平平均值与其他水平均值中的最佳值之间的差异的置信区间。最佳有两种选择。如果将最小平均值视为最佳,则设置K=-1;如果将最大平均值视为最佳,则设置K=1。最大为最佳:选择此项会将最大平均值视为最佳。最小为最佳:选择此项会将最小平均值视为最佳。,Minitab多重比较方法,残差检验,残差是否正态分布正态概率图、直方图残差是否序列相关残差与顺序图残差是否异方差残差与拟合值图,残差概率图,Minitab,残差概率图,Minitab,方差齐性检验,Minitab,某项研究对三类公路上有行驶经验以及无行驶经验的驾驶员进行比较。这两个因子是:驾驶经验。在此次研究中,分别采用了8名无经验和8名有经验的驾驶员。经验具有两个水平,其代码分别为有经验=1,无经验=0。道路类型。每位驾驶员在三种道路的其中一种上驾驶。三个水平分别编码为一级公路=1,二级公路=2,土路=3。检验人员记录了每位驾驶员在每种公路上所做的控制校正次数。响应变量为“校正”。下面给出了数据集:道路类型经验12304231618152782123101314162204615138871217数据:驾车.MTW,95%标准差Bonferroni置信区间道路类型经验N下限标准差上限1042.803845.8878440.49901141.844353.8729826.64002042.267214.7609532.74782141.982614.1633328.63713042.883596.0553041.65093142.428205.0990235.0732解释对于驾车数据,第一个因子为经验,第二个因子为道路类型。在六个因子水平组合的每一单元中有四个观测值。s的第一个值5.88784与道路类型=1和经验=0对应。区间(2.80384,40.4990)估计道路类型=1和经验=0的总体标准差。根据此区间,s介于2.80384和40.4990之间。标准差的最大值6.05530与道路类型=3和经验=0对应。,输出示例,Bartlett检验(正态分布)检验统计量=0.85,p值=0.974Levene检验(任何连续分布)检验统计量=0.42,p值=0.830解释如果检验的p值较高(0.974和0.830),则表明方差之间不存在差异。,输出示例,输出示例:等方差检验图形,对于驾车数据,置信区间图表明:在所有道路类型的控制校正次数中,经验越少的驾驶员具有更大的变动性。,调查员比较了四种不同配方的油漆的硬度。将每种油漆配方取六份样品涂到一小块金属上,然后待其凝固,测量其硬度。此外,还记录每份样品的凝固温度以及涂油漆的人(操作员)的编号。数据:油漆硬度.MTW,输出示例来源自由度SSMSFP油漆3281.793.96.020.004误差20312.115.6合计23593.8S=3.950R-Sq=47.44%R-Sq(调整)=39.56%解释油漆硬度方差分析得到的p值是0.004。因此,假设选择常用的a水平0.05进行检验,则将断定油漆配方之间的硬度存在显著差异。对于油漆数据,S为3.950,R为47.44%,调整的R为39.56%。,方差分析输出第一部分:方差分析表,S、R和调整的R是模型对数据的拟合优度的度量。这些值有助于您选择具有最佳拟合的模型。S表示数据值与拟合值的标准距离。对于给定研究,模型预测响应的效果越好,S越小。R(R平方)描述在观测的响应值中由预测变量解释的变异量。R始终随预测变量的增加而增大。例如,最佳的五预测变量模型的R始终比最佳的四预测变量模型的高。因此,比较相同大小的模型时R最有效。调整的R表示已根据模型中的项数调整的修正R。如果包括了不必要的项,R会人为地变得很高。与R不同,调整的R在您向模型中添加项时可能变小。使用调整的R比较预测变量数不同的各个模型。,使用单个统计量的表评定数据的以下属性:N。因子每个水平所包括的观测值数。均值。每个水平观测值的均值。这些样本均值是对每个水平总体均值的估计值。标准差。每个水平的样本标准差。方差分析假定所有水平的总体标准差相等。因此,如果样本标准差差异很大,则可能需要使用等方差检验命令来检验数据的方差相等性。合并标准差。合并标准差是对所有水平公共标准差的估计值。,方差分析输出第二部分:个体值估计及置信区间,输出示例均值(基于合并标准差)的单组95%置信区间水平N均值标准差+-+-+-+-混料1614.7333.363(-*-)混料268.5675.500(-*-)混料3612.9833.730(-*-)混料4618.0672.636(-*-)+-+-+-+-5.010.015.020.0合并标准差=3.950解释油漆硬度分析的结果表明:配方2的硬度均值最低(8.567),配方4的最高(18.067)。不同配方的标准差之间的差异还不足以引起关注。合并标准差为3.950。,输出示例均值(基于合并标准差)的单组95%置信区间水平N均值标准差+-+-+-+-混料1614.7333.363(-*-)混料268.5675.500(-*-)混料3612.9833.730(-*-)混料4618.0672.636(-*-)+-+-+-+-5.010.015.020.0合并标准差=3.950解释在油漆硬度的结果中,配方2和配方4均值的区间不重叠。这表明这些水平的总体均值不同。,Minitab为因子的每个水平都提供95%的置信区间。当方差分析表中的p值表明因子水平均值之间有差异时,可以使用单个置信区间的表来研究差异:每个星号都表示样本均值。每对圆括号都表示总体均值的95%的置信区间。每个水平的总体均值位于相应区间内的可信度为95%。如果两个均值的区间不重叠,则表明总体均值不同。,使用Tukey法对信息进行分组油漆N均值分组混料4618.067A混料1614.733AB混料3612.983AB混料268.567B不共享字母的均值之间具有显著差异。,方差分析输出第三部分:多重比较(Tukey比较),Tukey95%整体置信区间油漆水平间的所有配对比较单组置信水平=98.89%,解释油漆硬度数据的分组信息显示组A包含混料1、3和4,而组B包含混料1、2和3。这两个组都包含混料1和3。组内的因子水平之间并不存在显著差异。因为混料2和4并不共享同一个字母,混料4具有一个比混料2显著高很多的均值。置信区间显示所有均值差异的可能范围:配方2和配方4的均值之间差异的置信区间为(3.114,15.886)。此范围不包括0,表明这些均值之间差异显著。其余均值对的置信区间都包括0,表明这些均值之间差异不显著。,多重比较-Fisher最低显著性差异(LSD),输出示例使用Fisher方法对信息进行分组油漆N均值分组混料4618.067A混料1614.733AB混料3612.983BC混料268.567C不共享字母的均值之间具有显著差异。,Fisher95%两水平差值置信区间油漆水平间的所有配对比较同时置信水平=80.83%,解释油漆硬度数据的分组信息显示组A包含混料1和4;组B包含混料1和3;而组C包含混料2和3。混料1和3分别位于两个组中。组内的因子水平之间并不存在显著差异。因为下列因子水平组合不共享同一个字母,所以它们的均值存在显著差异:混料1和2混料2和4混料3和4置信区间显示所有均值差异的可能范围:配方1和配方2的均值之间差异的置信区间为(-10.924,-1.409)。此范围不包括0,表明这些均值之间差异显著。类似地,配方2和配方4之间差异的置信区间(4.743,14.257)以及配方3和配方4之间差异的置信区间(0.326,9.841)也不包括0,表明这些差异也显著。其余均值对的置信区间都包括0,表明这些均值之间差异不显著。,多重比较-许氏与最佳值的多重比较(MCB),输出示例许氏MCB(与最佳值的多重比较)全族误差率=0.05临界值=2.19,解释对于油漆硬度分析,将最大均值指定为最佳。因此,配方1的均值(14.733)、配方2的均值(8.567)和配方3的均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025四川宜宾三江新区招募医疗卫生辅助岗位10人考试参考试题及答案解析
- 2025宁波慈溪市桥头初级中学公开招聘派遣制工作人员1人考试参考试题及答案解析
- 2025河北水利电力学院第二次选聘5人考试参考试题及答案解析
- 充电站用户体验优化方案
- 2025年安徽中澳科技职业学院招聘任务型教师考试参考试题及答案解析
- 2025年合肥市方桥小学教师招聘备考练习题库及答案解析
- 2025年江西技师学院秋季学期非全日制兼职教师招聘24人考试参考试题及答案解析
- 2025上海市口腔医院工作人员公开招聘备考练习试题及答案解析
- 混凝土施工机械配置方案
- 混凝土施工现场临时设施建设方案
- 医院培训课件:《肺源性心脏病》
- 2025年承包学校食堂餐饮废弃物处理合同
- 部编版道德与法治小学四年级上册期末复习专练试题及答案(全套)
- GB/T 10257-2025核仪器和核辐射探测器质量检验规则
- 2025-2026人教版(2024)一年级上册数学教学计划
- 二零二五年度炉渣资源化利用项目合作协议书
- 2025-2026学年鲁科版(五四学制)(2024)初中生物六年级上册教学计划及进度表
- 2025年事业单位招聘考试综合类专业知识试卷(环境工程知识)2025年试题集
- 2025年湖南省教师招聘考试(公共基础知识)历年参考题库含答案详解(5卷)
- 施工进度计划管理制度
- 以工代赈务工协议书
评论
0/150
提交评论