《方差分析建模》PPT课件.ppt_第1页
《方差分析建模》PPT课件.ppt_第2页
《方差分析建模》PPT课件.ppt_第3页
《方差分析建模》PPT课件.ppt_第4页
《方差分析建模》PPT课件.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差分析作为分析试验数据的一种重要工具 是数理统计的基本方法之一 方差分析是研究一些因素 自变量 对某个指标 因变量 的相关关系 研究哪些因素对指标的影响是显著的 哪些因素对指标的影响不显著 最终找到有力的试验条件 方差分析建模 当试验中考察的因素只有一个时 称为单因素试验 若同时研究两个或两个以上的因素对试验指标的影响时 则称为两因素或多因素试验 通常方差分析简称为ANOVA AnalysisofVariance 单因素方差分析 1单因素方差分析模型 设指标变量为Y 因素为A 它可以取几个不同的水平 记为A1 Aa 在水平Ai上作若干次试验 试验结果为yi1 yini 需要考虑因素A对指标的影响是否显著 将A在某个水平下的试验结果看成一个随机变量 总体 因此考虑A取不同水平时的指标有无显著差异 就是检验几个总体的均值是否相等 假定在水平Ai下的总体服从正态分布 他们可以有不同的均值 i 但有相同的方差 2 需要检验假设 将每次试验结果yij分解为 建立方差分析模型如下 3 2 2 单因素方差分析的Matlab实现 p c s anova1 X group 输入 X是一个向量 从第一个总体的样本到第r个总体的样本依次排列 group是与X有相同长度的向量 表示X中的元素是如何分组的 group中某元素等于i 表示X中这个位置的数据来自第i个总体 因此group中分量必须取正整数 从1直到r p c s anova1 X 比较X各列数据的均值是否相等 输出p是零假设成立时概率 对给定的 若p 则有显著差异 c是方差分析表 s用于多重比较的输入 输入X各列的元素相同 即各总体的样本大小相等 称为均衡数据的方差分析 不均衡时用下面的命令 例3 1 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果 选取了条件基本相同的鱼20尾 随机分成四组 投喂不同饲料 经一个月试验以后 各组鱼的增重结果列于下表 表3 1饲喂不同饲料的鱼的增 单位 10g 四种不同饲料对鱼的增重效果是否显著 解 这是单因素均衡数据的方差分析 Matlab程序如下 A 31 927 931 828 435 924 825 726 827 926 222 123 627 324 925 827 030 829 024 528 5 原始数据输入 B A 将矩阵转置 Matlab中要求各列为不同水平 p c s anova1 B 运行后得到一表一图 表是方差分析表 重要 图是各列数据的盒子图 离盒子图中心线较远的对应于较大的F值 较小的概率p 表中所列出的各项意义如下 因为p 0 0029 0 01 故不同饲料对鱼的增重效果极为显著 四种不同饲料对鱼的增重效果极为显著 那么哪一种最好呢 请看下图 此时 第一个图对应第一种饲料且离盒子图中心线较远 效果最突出 如果从原始数据中去掉第一种饲料的试验数据 得到的结果为各种饲料之间对鱼的增重效果不显著 p anova1 B 2 4 例3 2为比较同一类型的三种不同食谱的营养效果 将19支幼鼠随机分为三组 各采用三种食谱喂养 12周后测得体重 三种食谱营养效果是否有显著差异 解 这是单因素非均衡数据的方差分析 A 164190203205206214228257185197201231187212215220248265281 group ones 1 8 2 ones 1 4 3 ones 1 7 p anova1 A group 表3 2饲喂不同食谱鼠的增重 方差分析表 均值盒子图 由于概率p 0 1863比较大 故认为三种食料没有显著差异 3 多重比较的MATLAB实现 为方便找到具有显著差异的方案 我们给出多重比较的MATLAB命令 C multcompare s 其中输入s 由 p c s anova1 b 得到输出的结果 输出C共有5列 其中前两列给出样本编号 后三列分别为两个样本均值差的置信区间与估计量 练习 对于例3 1 利用多重比较命令进行分析 关键理解输出的含义 例3 3四个实验室试制同一型号纸张 为了比较光滑度每个实验室测量了8张纸 进行方差分析 解 a 38 7 41 5 43 8 44 5 45 5 46 47 7 5839 2 39 3 39 7 41 4 41 8 42 9 43 3 45 834 35 39 40 43 43 44 4534 34 8 34 8 35 4 37 2 37 8 41 2 42 8 输入数据 b a MATLAB只对各列进行分析 p c s anova1 b 方差分析 c multcompare s 多重比较 表3 3纸张光滑度数据 若置信区间包含原点则无显著差异 可见只有1 4实验室有显著差异 另外 软件输出一幅图形 告知1 4有显著差异 例3 4内蒙古网络挑战赛C题 就可以用方差分析 比如 考虑承保车辆的车龄统计数据 从2010年9月到2011年3月共有7个月统计数据 我们看成7个水平 根据表3 4分析到期车辆续保率有无差异 MATLAB程序如下 A 24 83025 22025 06025 84037 27037 76037 81027 45029 08028 81029 22044 77046 28045 35021 64022 24022 19022 37037 09039 03037 22021 16021 95021 86021 71035 31036 85035 34018 50018 42018 34018 70033 68032 78029 00017 23017 82018 00018 34038 24038 21037 24018 01018 45018 74018 96043 78039 22036 39019 66020 07020 06020 14036 84032 49034 41018 92019 80020 24020 21028 00026 42026 85016 47017 12016 82017 71035 71033 87025 36016 51016 49016 41016 76018 52025 48025 650 B A 为何转置 p c s anova1 B C multcompare s 输出概率为p 0 0438 0 05 故不同车龄的到期车辆续保率有显著差异 进一步由多重比较结果可知是1 2年车龄与10年以上的车龄有显著差异 双因素等重复试验下的方差分析 设试验变化的因素为A B 他们分别取a b个不同的水平 记为A1 Aa B1 Bb 将在水平组合 Ai Bj 下的试验结果看成随机变量 考虑因素A B对指标的影响是否显著 仍然假定在水平组合 Ai Bj 下的指标服从正态分布 1统计模型 设影响因变量Y的因素只有两个 分别记为A B其中因素A有a个不同水平A1 A2 Aa 因素B有b个不同水平B1 B2 Bb在每种水平组合 Ai Bj 上均做c次 c 1 试验 将实验结果yij列成下面的形式 对于任一水平组合 Ai Bj 假设yij1 yij2 yijc为来自正态总体N ij 2 的一个样本 可得模型 例3 5在某化工产品的生产中 对不同反应温度和催化剂种类重复试验二次 测得产量如下 表3 5化工实验数据 2 双因素有交互作用的方差分析的MATLAB实现 p t s anova2 X resp 其中输入X是一个矩阵 resp表示试验的重复次数输出的p值有三个 分别为各行 各列以及交互作用的概率 t是方差分析表 s用于各因素均值估计与比较 程序如下 X 2 71 382 352 263 31 351 952 131 71 741 673 412 141 561 52 561 93 141 633 172 02 291 053 182 723 511 392 221 853 151 722 19 p t s anova2 X 2 从方差分析表可以看出 不同的温度之间有高度显著差异 温度与催化剂的交互作用也具有高度显著差异 注意 由于此时交互作用显著 因此利用多重比较可能出现问题 多因素方差分析 在MATLAB软件统计工具箱有多因素方差分析的命令 调用格式如下 p t st anovan X group 例3 6某集团为了研究商品销售点所在的地理位置 销售点处的广告和销售点的装潢这三个因素对商品的影响程度 选了三个位置 如市中心黄金地段 非中心的地段 城乡结合部 两种广告形式 两种装潢档次在四个城市进行了搭配试验 表3 6是销售量的数据 试在显著水平0 05下 检验不同地理位置 不同广告 不同装潢下的销售量是否有显著差异 表3 6四城市销售量的数据 Q 955967960980927949950930905930910920855860880875880890895900860840850830870865850860830850840830875888900892870850847965870863845855821842832848 g1 ones 4 1 2 ones 4 1 3 ones 4 1 g2 ones 2 1 2 ones 2 1 ones 2 1 2 ones 2 1 ones 2 1 2 ones 2 1 g3 1 2 1 2 1 2 1 2 1 2 1 2 forj 1 4p j anovan Q j g1 g2 g3 endp 程序如下 p 0 00360 00390 00040 05880 00550 04420 00180 03460 00990 02040 01490 3111 其中P的每一列分别表示每个城市三因素方差分析的概率 每一行分别表示销售点地理位置 广告和装潢的概率 请同学们给出结果的合理解释 练习 1992年A题 施肥效果分析 某地区作物生长所需的营养素主要是氮 N 钾 K 磷 P 某作物研究所在该地区对土豆与生菜作了一定数量的实验 实验数据如下列表格所示 其中ha表示公顷 t表示吨 kg表示公斤 当一个营养素的施肥量变化时 总将另两个营养素的施肥量保持在第七个水平上 如对土豆产量关于N的施肥量作实验时 P与K的施肥量分别取为196kg ha与372kg ha 对于 0 1 试分析施肥量与产量之间的关系 提示 首先利用EXCLE表将原始表格进行整理后用三因素方差分析 表1土豆产量与施肥量的关系 A 019637215 18 3419637221 36 6719637225 72 10119637232 2903 20219637239 45 25919637243 15 33619637243 46 40419637240 83 47119637230 75259037233 46 2592437232 47 2594937236 06 2597337237 962599837241 04 25914737240 09 25919637241 26 25924537242 1725929437240 36 25934237242 73 259196018 98 2591964727 352591969334 86 25919614038 52 259

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论