




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第五章方差分析,5.1单因素方差分析,5.2双因素方差分析,方差分析的基本概念,5.1为了比较五个品牌的合成木板的耐久性,从每个品牌中抽取四个样品进行测试,并测量磨损量。推断不同品牌的服装是否有显著差异。方差分析的基本概念(续1)方差分析研究分组变量对数值变量的影响。分组变量被称为因子,并且分组变量的每个值被称为因子级别。只考虑一个因素的方差分析称为单因素方差分析,而考虑两个因素的方差分析称为双因素方差分析。在本例中,品牌是一个分组变量,磨损量是一个数值变量,品牌是一个因素,而A、B、C、D和E是五个层次的因素,属于单因素方差分析。研究品牌对服装的影响,即比较五个品牌的服装是否有显著差异,并将
2、每个品牌的服装作为一个整体,比较五个独立群体的均值是否有显著差异,是一个假设检验问题,即多个群体的均值相等。5.1。单向方差分析1。该数学模型假设因子A具有R水平,并且在每个水平上进行M检验。观测数据yij表示第一水平的第J次试验的观测数据,i=1,2,R;j=1,2,m .每个层次的量化指标是一个整体。例如,每个品牌的磨损都是一个整体,每个级别的所有测试数据都是整体的样本。单变量方差分析是用R样本来检验R总体的平均值是否相等。也就是说,h0: 1=2=r,h1: 1,2,r不都是相等的;模型的假设单因素方差分析需要以下假设:a)所有观测数据都是独立的;(可以直观判断)b)每个种群服从正态分布
3、;(正态性检验是必需的)所有人群的方差是相等的。(需要方差齐性检验)在上述假设下,可以假设对应于ith水平的总体服从正态分布,对应的样本为。根据yij和种群的相同分布,可以设置yij=1ij,1ir,1jm。其中,I表示第I个总体的平均值,ij是服从正态分布的随机误差。方差分析表方差分析将总波动分为误差引起的波动和因素引起的波动。当因素引起的波动大于误差引起的波动时,表明因素显著,即因素对量化指标有显著影响。总偏差平方和,反映数据的总波动。因子a的偏差平方和。SST第一级的每个观测数据都被其样本平均值代替,以获得SSM,因此SSM反映了不同因子引起的波动。误差的偏差平方和,反映误差或其他随机因
4、素引起的波动。在H0条件下,可以证明SST=SSM SSE,为了消除自由度对波动的影响,将波动除以各自的自由度得到平均和:因子的平均和与误差之比和两个:的平均和得到检验统计量;概率p值是从测试统计中获得的,从而做出推断。方差分析表来源平方自由度均方和F比率系数SSM系数=R-1 MSA=SSM/FA系数=(MSA/MSE) F (FA,Fe)误差SSE fe=n-r MSE=SSE/fe总和SST FT=N-1,条件2:通过使用统一过程标准选项和语句测试每个样本与整体的独立性;程序如下:proc排序数据=数据集名称;变量名称分组依据;快跑。Proc统一数据=数据集名称正常;变量名称分组依据;变
5、量数值变量名;快跑。条件3:方差齐性,在方差分析过程中使用均值陈述的hovest选项。程序如下:proc anova data=数据集名称;类分组变量名;模型数值变量名=分组变量名;表示分组变量名/hovest;/*或hove ST=levene */run;在第二步中,输出方差分析表上的方差齐性程序可以产生方差分析表。可以根据表中的概率p值进行推断。如果只需要输出方差分析表,而不需要检查方差是否相等,则上述程序可以删除均值过程并保留其他语句。5.多重T检验如果方差分析的检验结果显示均值之间有显著差异,我们可以进一步检验哪些均值有显著差异,从而找到最优水平的因子。这需要多次t检验,检验任何两个
6、总体平均值是否相等。事实上,多重T检验是两个独立群体之间的比较问题。多重t检验的程序如下:proc anova data=数据集名称;类分组变量名;模型数值变量名=分组变量名;表示分组变量名/t;/* t*/运行均值语句选项;非参数检验当方差分析的正态性或同质性假设不能满足时,使用kruskal-wallis非参数检验。程序如下:proc npar1way data=数据集名称wilcoxon;类分组变量名;变量数值变量名;快跑。该程序与两个独立组的程序相同,但使用kruskal-wallis检验代替wilcoxon秩和检验。7.单向方差分析5.1的应用示例为了比较五个品牌的合成木板的耐久性,
7、从每个品牌中抽取四个样本来测量磨损量,数据如下。尝试编程方法来推断不同品牌的磨损量是否存在显著差异。5.2双因素方差分析双因素方差分析研究两个分类变量对一个数值变量的影响。双因素方差分析可分为两类:非交互方差分析和交互方差分析。有两个分组变量,即因子A和b,以及一个数值变量y。A:a1,A2,Ar,即A具有r级b: B1,B2,Bs,即b具有s级。如果y只受Ai和Bj的影响,与组合无关(Ai,Bj),则称之为无交互,否则称之为交互。5.2.1无交互作用的方差分析(无重复试验的方差分析)1。该模型的假设是yij是组合下的检验结果(Ai,Bj)。该模型的假设是:a)独立的观测数据;yij来自正常人
8、群。含义:假设总体服从正态分布,方差相等,每种组合下的数量指标都被视为一个总体。每个组合只进行一次测试,因此每个群体的样本量为1。从样本的每个分量与总体具有相同的分布这一事实可以知道:因此,yij=ij ij,ij是总体平均值,ij是随机误差,1ir,1j和ij服从正态分布。为了便于描述,无交互作用方差分析的数据模型引入了以下定义:记住因子A的第一个水平效应和因子B的第三个水平效应,则称无交互作用;如果是这样,就有互动。在非交互方差分析的数据模型下,同样可以证明:3。假设性方差分析的目的是检验所有总体均值是否相等。对于非交互方差分析,有两个检验:H0 H0B:1=2=j,h1b: 1,2,j不
9、全相等;第一个检验因子A对定量指标有显著影响,第二个检验因子B对定量指标有显著影响。然而,该模型没有显著的效果(即它接受原始假设),这意味着上述两个假设的原始假设同时成立。测试统计的平方和分解为总偏差的平方和:反映了数据的总波动。因子a的偏差平方和。它反映由因子a引起的波动。因子b的偏差平方和反映由因子b引起的波动。误差的偏差平方和,反映由误差或其他随机因素引起的波动。在H0条件下,可以证明SST=SSA SSB SSE,为了消除自由度对波动的影响,将波动除以各自的自由度得到均方:因子A和因子B的均方为:误差的均方为:因子a的检验统计如下:fA=r-1,Fe=(r-1)(s-1);因子b的测试
10、统计如下:fB=s-1,fe=(r-1)(s-1)。无交互作用的双因素方差分析表是由平方自由度均方和F比推导出来的,其中,平方自由度和F比的误差分别为。首先,测试模型的假设。条件1:观测数据独立,可以直观判断;条件2:数据来自正常人群,方差相等。由于每个群体只有一个容量为1的样本,因此无法检查这种情况。使用方差分析程序推断方差分析。程序如下:proc anova data=数据集名称;类别组变量名称列表;/*如a b;*/model数值变量名称=分组变量名称列表;/*如y=a b*/表示组变量名列表/t;/*这句话需要多次测试*/运行;5.2.2交互作用的多变量方差分析(重复试验)1。数据模型
11、假设观测数据yjk是在(A1,Bj),i=1,2,R;j=1,2,s。k=1,2,t .采用了以下数据模型:yijk=1 jjijk,1ir,1js,1kt,表示平均效应,I和j分别表示因子a的第I级和因子b的第j级的效应,ij表示因子a的第I级和因子b的第j级的交互效应。2.待测假设H0 (a * b): Ij=0,HL (a * b): Ij不全为零H0A:1=2=r,H1A: 1,2,R不全相等H0B: 1=2=S,H1B: 1=2=s不完全其中(1ir,1j)。三个假设被用来检验搭配是否对数值变量有显著影响,因素A是否对数值变量有显著影响,因素B是否对数值变量有显著影响。3。试验统计数
12、据可以在H0条件下得到证明:SST=SSASSB SSABSE,其中Fe=RS (T-1),Fab=(R-1) (S-1),甲乙类;/*A和B分别是两个分组变量名*/模型Y=A B A * B/*Y是一个数字变量*/表示a b a * b/t;/*表示模型的重要性;此语句用于多次测试*/运行;双因素方差分析的应用实例1)单因素2)双因素方差分析与交互作用如表5-3所示。表5-3交互作用的双因素方差分析,其中MSA=SSMA/(l 1),MSB=SSMB/(m 1),MS(A*B)=SSM(A*B)/(l 1) (m 1),MSE=SSE/lm(n1)。利用表格中的信息,我们可以判断各因素之间的
13、相互作用是否显著,以及各因素与各水平之间的差异是否显著。5.1.3方差分析中的基本假设方差分析中常用的基本假设是:正态性:每个群体服从正态分布,也就是说,对于每个水平,其观察值是正态分布的简单随机样本。方差的同质性:每个群体的方差是相同的。独立性:从每个群体中采集的样本是相互独立的。在SAS中,正态性可以用第三章介绍的方法或本章介绍的“残差的正态性检验”来验证。方差同质性可以在方差分析过程中得到验证,独立性可以通过实验的随机化来确定。单因素方差分析5.2.1单因素方差分析5.2.2单因素方差分析5.2.3单因素方差分析5 . 2 . 3单因素方差分析5.2.1单因素方差分析5 . 2 . 1单
14、因素方差分析1。消费者与生产者、销售者或服务提供者之间经常发生纠纷。当纠纷出现时,消费者经常向消费者协会投诉。为了评价几个行业的服务质量,消费者协会以零售业、旅游业、航空业和家电制造业的不同企业为样本。每个行业选出5家企业,所选企业在服务对象、服务内容和企业规模上基本相同。然后统计近几年消费者对20家企业的投诉数量。结果如表5-4所示。表5-4消费者对四个行业的投诉通常,他们收到的投诉越多,服务质量越差。消费者协会想知道这些行业之间的服务质量是否存在显著差异,即检验方差分析中的原始假设:四个行业的平均投诉数量是相等的。2.分析步骤1)将表5-4中的数据组织成具有左图所示结构的数据集,并将其存储在Mylib.xfzts中;2)打开数据集Mylib.xfzts在INSIGHT模块中;3)选择菜单“分析”和“拟合”,并根据打开的“拟合(X Y)”
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版建筑工程设计变更及洽商费用结算合同
- 二零二五年度智能交通系统建设劳动合同附属协议书
- 二零二五年度文化产业园建设劳务分包清包工合同样本
- 二零二五年度建筑工人劳务派遣及用工管理合同
- 2025版住宅室内空气质量检测与治理合同
- 二零二五年度建筑劳务分包及施工现场监督服务协议
- 二零二五年度医疗器械担保销售合同规范版
- 二零二五版专业自建房施工及装修一体化服务合同
- 2025年货物运输安全监管合作协议书
- 2025版现代服务业人才劳动合同与劳务合作协议范本正规范本
- 2025至2030中国天河石项链市场需求量调研及未来投资商机研究报告
- 银行内部审计与合规工作的关联试题及答案
- 2025年水运工程试验检测师水运材料真题卷(附答案)
- 疼痛质控原因分析及整改措施
- 各类档案管理员考试试题及答案汇编
- 2024年记者证考试往年真题试题及答案
- 美国教育体系探秘:理念与实践
- 2025年《新课程标准解读》标准课件
- 潜水事故与现场急救措施课件
- 商品陈列员工培训
- 塑料再生料质量控制-洞察分析
评论
0/150
提交评论