数学建模之方差分析课件_第1页
数学建模之方差分析课件_第2页
数学建模之方差分析课件_第3页
数学建模之方差分析课件_第4页
数学建模之方差分析课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一讲 方差分析1.1 方差分析的概念1.2 单因素方差分析1.3 有交互作用的双因素方差分析1.4 无交互作用的双因素方差分析第一讲 方差分析1.1 方差分析的概念 一、问题的引入 在实际应用中,我们常常会遇到需要对两个以及两个以上总体均值是否相等进行检验,从而判断某一种因素对我们所研究的对象是否产生了显著的影响。 1.1 方差分析的概念 一、问题的引入 1.1 方差分 例1:某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄色、粉色、绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时

2、期该饮料的销售情况,见下表,试分析饮料的颜色是否对销售量产生影响。 该饮料在五家超市的销售情况超市无色粉色橘黄色绿色1234526.528.725.129.127.231.228.330.827.929.627.925.128.524.226.530.829.632.431.732.8 例1:某饮料生产企业研制出一种新型饮料。 例2 某公司为了研究三种不同内容的广告宣传对某种无季节性的大型机械的销售量是否有显著影响,经调查统计,一年四个季度的销售量(单位:台)如下: A1是强调运输方便性的广告,A2是强调节省燃料的经济性的广告,A3是强调噪音低的优良性的广告.试判断:新闻广告的类型对该种机械的

3、销售量是否有显著影响?若影响显著,哪一种广告内容为好?广告类型第一季度第二季度第三季度第四季度A1163176170185A2184198179190A3206191218224 例2 某公司为了研究三种不同内容的广告宣传对某方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存在差异以及分析差异原因的方法和技术。方差分析由英国统计学家R.A.Fisher首创,为纪念Fisher,方差分析又称 F 检验 (F test)。用于推断多个总体均值有无差异方差分析:在若干个能够相互比较的资料组中,判别各组资料是否存二、基本概念 1.因素又称因子,指需要考察的引起数据变动的主要原因,通常用A、B

4、、C表示。 如:要分析饮料的颜色对销售量是否有影响,颜色是要检验的因素或因子. 又如:要分析新闻广告的内容对某种机械的销售量是否有显著影响,新闻广告类型是所要检验的因素。可以控制的试验条件单因素方差分析:在实验中考察的因素只有一个。多因素方差分析:在实验中考察的因素有两个以上。双因素方差分析:在实验中考察的因素有两个。二、基本概念 1.因素又称因子,指需要考察的引起数2.水平:因子在实验中的不同状态。 如:例1中橘黄色、粉色、绿色和无色透明四种颜色就是因素的四个水平。3.交互影响:如果因子间存在相互作用,称之为“交互影响”;如果因子间是相互独立的,则称为无交互影响。4.观察值:在每个因素不同水

5、平下得到的样本值。 如例1中每种颜色饮料的销售量就是观察值。2.水平:因子在实验中的不同状态。3.交互影响:如果因子间存三、方差分析的基本思想比较两类误差 以检验均值是否相等随机误差和系统误差 随机误差:在因素的同一水平(同一个总体)下,样本的各观察值之间的差异。 比如,同一种颜色的饮料在不同超市上的销售量是不同的。不同超市销售量的差异可以看成是随机因素的影响,或者说是由于抽样的随机性所造成的,称为随机误差 。 三、方差分析的基本思想比较两类误差 以检验均值是否相等 系统误差:在因素的不同水平(不同总体)下,各观察值之间的差异。 比如,同一家超市,不同颜色饮料的销售量也是不同的。这种差异可能是

6、由于抽样的随机性所造成的,也可能是由于颜色本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。比较的基础是方差比组内方差、组间方差 组内方差:因素的同一水平(同一个总体)下样本数据的方差。 比如,无色饮料在5家超市销售数量的方差。组内方差只包含随机误差 系统误差:在因素的不同水平(不同总体)下,各观察值组间方差:因素的不同水平(不同总体)下各样本之间的方差 比如,例1中橘黄色、粉色、绿色和无色透明四种颜色饮料销售量之间的方差。组间方差既包括随机误差,也包括系统误差。方差的比较 如果不同颜色(水平)对销售量(结果)没有影响,那么在组间方差中只包含有随机误差,而没有系统误差。这时,组

7、间方差与组内方差就应该很接近,两个方差的比值就会接近1。组间方差:因素的不同水平(不同总体)下各样本之间的方差 如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1。 当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。 如果不同的水平对结果有影响,在组间方差中除了包含随机四、基本假定1.每个总体都应服从正态分布对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本比如,每种颜色饮料的销售量必须服从正态分布2.各个总体的方差必须相同对于各组观察数据,是从具有相同方差的总体中抽取的。

8、比如,四种颜色饮料的销售量的方差都相同。 3.不同水平下的样本相互独立四、基本假定一、数学模型表1观察结果水平样本总和样本均值总体均值1.2 单因素方差分析一、数学模型表1观察结果水平样本总和样本均值总体均值1.2 假设假设单因素试验方差分析的数学模型需要解决的问题1.检验假设单因素试验方差分析的数学模型需要解决的问题1.检验假设数学模型的等价形式总平均s个水平数学模型的等价形式总平均s个水平原数学模型改写为原数学模型改写为检验假设等价于检验假设检验假设等价于检验假设数据的总平均总离差平方和(总变差)二、平方和的分解数据的总平均总离差平方和(总变差)二、平方和的分解数学建模之方差分析课件误差(

9、残差)平方和组间离差平方和(效应平方和)组内平方和误差(残差)平方和组间离差平方和(效应平方和)组内平方和ST是全部观察值与总平均值的离差平方和,反映全部观察值的离散状况,从而反映了全部数据总的误差程度。SA既包括随机误差,也包括系统误差,反映的是随机误差和系统误差的大小。ST是全部观察值与总平均值的离差平方和,反映全部观察值的离散总误差平方和=组间误差平方和+组内误差平方和 如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果存在显著的影响; 反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验

10、或抽样的结果有显著作用。 判断因子的不同水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小。 检验这种差异,需要构造一个用于检验的统计量。总误差平方和=组间误差平方和+组内误差平方和检验假设拒绝域为组间均方差组内均方差三、假设检验检验假设拒绝域为组间均方差组内均方差三、假设检验单因素试验方差分析表方差来源因素A误差总和平方和自由度均方F比单因素试验方差分析表方差来源因素A误差总和平方和自四、单因素方差分析的Matlab实现p=anova1(X,group)输入:X是一个向量,从第一个总体的样本到第r个总体的样本依次排列,group是与X有相同长度的向量,表示X中的元素是如

11、何分组的. group中某元素等于i,表示X中这个位置的数据来自第i个总体.因此group中分量必须取正整数,从1直到r.p=anova1(X) %比较X中各列数据的均值是否相等此时输出的p是零假设成立时,数据的概率,当p0.05称差异是显著的,当p0.01称差异是高度显著的.输入X各列的元素相同,即各总体的样本大小相等,称为均衡数据的方差分析,不均衡时用下面的命令四、单因素方差分析的Matlab实现p=anova1(X,g例1 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼20尾,随机分成四组,投喂不同饲料,经一个月试验以后,各组鱼的增重结果列于下表。表1 饲喂不

12、同饲料的鱼的增(单位:10g)饲料鱼的增重(xij)A131.927.931.828.435.9A224.825.726.827.926.2A322.123.627.324.925.8A427.030.829.024.528.5四种不同饲料对鱼的增重效果是否显著 ?例1 某水产研究所为了比较四种不同配合饲料对鱼的饲喂效果,解:这是单因素均衡数据的方差分析,Matlab程序如下:A=31.9 27.9 31.8 28.4 35.9 24.8 25.7 26.8 27.9 26.2 22.1 23.6 27.3 24.9 25.8 27.0 30.8 29.0 24.5 28.5; %原始数据输入

13、 B=A; % 将矩阵转置,Matlab中要求各列为不同水平p=anova1(B) 运行后得到一表一图,表是方差分析表(重要);图是各列数据的盒子图,离盒子图中心线较远的对应于较大的F值,较小的概率p.解:这是单因素均衡数据的方差分析,Matlab程序如下:A=Source方差来源SS平方和df自由度MS均方差F统计量P值Columns(因素A组间)SSAr-1SS/(r-1)7.140.0029Error误差(组内)SSEn-rSS/(n-r)Total总和SSTn-1表中所列出的各项意义如下:因为p=0.00291时,anova2还返回第三个p值: H0AB:因素A与因素B没有交互效应。解

14、释:如果任意一个p值接近于0,则认为相关的零假 设不成立。 双因素方差分析的Matlab实现调用格式:p=anova2(数学建模之方差分析课件Matlab程序:disp1=58.2 56.2 65.3;49.1 54.1 51.6;60.1 70.9 39.2;75.8 58.2 48.7;p=anova2(disp1,1) 输出结果:方差分析表ANOVA TableSource SS df MS F ProbFColumns 157.59 3 52.53 0.43059 0.73875Rows 223.8467 2 111.9233 0.91743 0.44912Error 731.98 6

15、 121.9967 Total 1113.4167 11 由于燃料和推进器对应的p值均大于0.05,所以可以接受零假设H0A和H0B,认为燃料和推进器对火箭的射程没有显著影响。 Matlab程序:输出结果:方差分析表 由于燃料和推进数学建模之方差分析课件Matlab程序:disp2=58.2 52.6 49.1 42.8 60.1 58.3 75.8 71.5;56.2 41.2 54.1 50.5 70.9 73.2 58.2 51.0;65.3 60.8 51.6 48.4 39.2 40.7 48.7 41.4;p=anova2(disp2,2)输出结果:方差分析表ANOVA TableSou

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论