




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计培训教材方差分析第一页,共五十二页,2022年,8月28日主要内容变异方差分析假设检验假设模型ANOVA模型单因子方差分析(One-WayANOVA)双因子方差分析(Two-WayANOVA)多因子方差分析(Multi-FactorANOVA)第二页,共五十二页,2022年,8月28日变异的类型固有变异由许多不可避免的小因素累积而成的变异通常也叫噪声(noise)特殊变异a)不适当地调教机器
b)操作错误
c)原材料有缺陷第三页,共五十二页,2022年,8月28日方差分析(ANOVA)方差分析(ANOVA)是R.A.Fisher在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法。方差分析做法:通过试验,以观察某一种或多种因素的变化,对试验结果的观察数值是否有显著影响,从而选取最优方案。例:在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有显著影响的,哪些因素是不重要的,没有显著影响的。第四页,共五十二页,2022年,8月28日方差分析(ANOVA)试验中考虑的因素只有一个,即只有一个因素在变,其他因素保持不变,这种试验称为单因素方差分析(One-WayANOVA)。试验中考虑的因素有两个,这种试验称为双因素方差分析(Two-WayANOVA)。试验中考虑的因素有k个,这种试验称为k因素方差分析(k-WayANOVA)。第五页,共五十二页,2022年,8月28日ANOVA的应用因素所处的状态,称为水平(Level)。例如,温度是一个因素,可在50℃,60℃,70℃三个水平下做试验。ANOVA可用于估计每个变异来源对总变异的贡献。明确各效应的显著性估计过程中的随机误差或噪声计算方差的成份第六页,共五十二页,2022年,8月28日ANOVA—假设检验
H0: 1=2==r
所有总体均值相等
H1: 至少有两个总体的均值不等
ANOVA通过比较组间差和组内差来进行F-检验:如果,则拒绝原假设。 .第七页,共五十二页,2022年,8月28日ANOVA—假设检验N(1,1²)N(2,2²)N(3,3²)N(4,4²)N(groups,between²)第八页,共五十二页,2022年,8月28日ANOVA—假设观察值相互独立.各水平的数据服从正态分布,即因子水平i~N(i,i²)各水平的方差相同,即1²=2²==r²第九页,共五十二页,2022年,8月28日ANOVA—模型固定效应模型(ANOVAI)因子水平是指定的相关结论只能对指定的因子水平而言随机效应模型(ANOVAII)因子水平是随机抽取的结论对整个处理总体有效混合效应模型(ANOVAIII)有些因子是固定的,有些因子是随机的第十页,共五十二页,2022年,8月28日ANOVA—模型一个k–WayANOVA
模型,是指试验中包含有k
个因素.k–WayANOVAI : k
个因素; 所有因素效应固定k–WayANOVAII : k
个因素; 所有因素效应随机k–WayANOVAIII : k
个因素; 有些因素效应固定,有些 因素效应随机注意:当k
大于等于2时,还要考虑各因素之间的相互作用(或交互效应)(Interaction).第十一页,共五十二页,2022年,8月28日我们要观察的一个
input
变量(因子)有多个样本时,我们实际上在实施
单因子实验(SingleFactorExperiment).我们要分析对象的
因子是否有水平间的差异确定3个供应商的平均交货期是否有差异确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同现在开始做第一次实验!…观察.OnewayANOVA的概念(1)–概要第十二页,共五十二页,2022年,8月28日OneANOVA的概念(2)–例题考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中5种不同的电流设置对焊接强度的影响
她要研究的电流范围为15-19安培。她将调查5个水平的输入变量(因子):15A,16A,17A,18A和19A。她将对每个水平进行5次实验
输出:焊接强度输入:电流这是一个具有5个水平的单因子实验(电流)该实验的结果参考下页.
第十三页,共五十二页,2022年,8月28日이용접기에대해당신은어떤전류세기를선택하겠는가?그결론은얼마나신뢰할수있다고말할수있는가?OneANOVA的概念(3)–例题存在电流对焊接强度的影响吗?对于这个设备使用哪个电流,你的结论是什么?为什么?
第十四页,共五十二页,2022年,8月28日输入结果DATA的designmatrix同下.实习:打开窗口
Mont52.mtw
制作各列数据的dotplot.使用对所有变量相同的格式(SCALE)!OneANOVA的概念(3)–例题第十五页,共五十二页,2022年,8月28日各均值的
95%置信区间(CI)如下.DATA
Stack后
Stat>ANOVA>IntervalPlot对电流和焊接强度的关系做什么结论?这结论的置信度是怎样?OnewayANOVA的概念(3)–例题第十六页,共五十二页,2022年,8月28日设定假设!!!OneANOVA的概念(4)–假设Ha:至少有一个水平产生不同过程
H0:数据只描述一个过程的自然散布
你认为答案是什么?为什么?
第十七页,共五十二页,2022年,8月28日OneANOVA的概念(5)–假设此设计的数学模型是:Ho假设处理项是零
数学模型假设
常规假设
Yti=μ+τt+εti其中:yti=来自处理t的单个响应μ=总平均值τt=处理tεti=随机误差第十八页,共五十二页,2022年,8月28日OneANOVA的概念(6)–变量选定输入变量作为一个因子。
在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。
如果因子自然为连续型的,可以把它分类成子群。-例如,我可以采用低和高来度量生产线的压力值。-我们可以作中值分离(MedianSplit)来把因子分成两个水平:低和高。-对于我们的例子,因为电流是连续型变量,我们把它分成5个等级。输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出变量可以是分离型或间隔/比率变量第十九页,共五十二页,2022年,8月28日ANOVA的原理(1)–总变动
因子A的水平是I个,各水平的反复数都是m次,则数据矩阵排列成下面的样子因子的水平A1A2A3A4A5A6…Al实验的反复x11x21x31x41x51x61…
xl1x12x22x32x42x52x62…
xl2
x13x23x33x43x53x63…
xl3
x14x24x34x44x54x64…
xl4
x15x25x35x45x55x65…
xl5x1mx2mx3mx4mx5mx6m…
xlm合计T1T2T3T4T5T6…TlT均值x1x2x3x4x5x6…
xlx第二十页,共五十二页,2022年,8月28日
总均值是用右边的公式求.
利用各个DATA
和总均值
把总均值
分解为两个,同下表示.
左边和右边平方时同下.ANOVA的原理(2)–总变动第二十一页,共五十二页,2022年,8月28日
上面的第三项变为如下.SS(total) SS(error) SS(factor)
同样第8页式从写如下,这意义的略写SS(SumofSquares)来表示.ANOVA的原理(3)–总变动第二十二页,共五十二页,2022年,8月28日SS(total)的自由度
是, SS(factor)的自由度
是, SS(error)的自由度
是, 因此
ANOVA的原理(4)–自由度在一个系统中不影响其他变量能够独立移动的数Ex)a*b*c=4
这式中变量的自由度是2.
假如
a,b定为1,2,c必须是2.
即能够自然的移动的变量。
自由度是?
自由度的计算第二十三页,共五十二页,2022年,8月28日因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均值平方(MeanSquare)F值AErrorTotalANOVA的原理(5)–方差分析表
方差分析表的制作
对错误的均值平方因子,利用A的均值平方的大小
观察
A效果的大小.
F越大
A效果越大.(利用F分布确认
P-value)第二十四页,共五十二页,2022年,8月28日ANOVA的原理(6)–F分布
F分布的参考
自由度
k1,k2的变量的
F值的
F(k1,k2:α)按
α的大小
占有面积(发生概率).α(显著水平)F(k1,k2)F(k1,k2:α)第二十五页,共五十二页,2022年,8月28日F-分布
65432100.70.60.50.40.30.20.10.0ScoresProb10%1%5%第二十六页,共五十二页,2022年,8月28日Exercise某个
coating工程认为
反应温度对生产的
产品的强度有影响,所以对反应温度变化强度有什么变化,还有温度在什么水平时强度最好,进行了实验.反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理.这结果同下表.制作方差分析表(ANOVAtable).(参考Excelsheet.)ANOVA的原理(7)–例题第二十七页,共五十二页,2022年,8月28日因子(factor)平方和(SumofSquares)自由度(DegreeofFreedom)均值平方(MeanSquare)F值AErrorTotalANOVAtableANOVA的原理(8)–例题F分布表中
F是(3,8:0.05)=4.07,F(3,8:0.01)=7.59.那么
A是显著水平1%中是否采用零假设?还是推翻?----------要推翻.第二十八页,共五十二页,2022年,8月28日ANOVA的原理(9)–统计的假定输出的总体方差在给定因子所有水平上都相等(方差均一性(TestforEqualVariance)。我们可以用Stat>ANOVA>TestforEqualVariance程序来检验这个假设。
响应均值是独立的,并服从正态分布。-如果使用随机化和适当的样本数,这个假设一般有效。
-警告:在化学过程中,均值相关的风险很高,应永远考虑随机化。
残差(数学模型的误差)是独立的,其分布是均值=0,方差为恒量的正态分布。第二十九页,共五十二页,2022年,8月28日
单一因子实验分析实验结果移动到
MINITAB
Worksheet.数据有没有异常点利用管理图进行确认.(稳定性分析)利用Stat>ANOVA>TestforEqualVariance
进行等方差检验.方差同一时实施(p-value<0.05)ANOVA.用Stat>ANOVA>One-way
进行分析.所有的数据在1列时(Stacked):One-way按水平别数据分几列时(Unstacked):采用
One-way(Unstacked..).解释F-ratio.F-value高
p-value显著水平时(一般
5-10%)推翻零假设(Ho).推翻零假设时,利用Stat>ANOVA>MainEffectsPlot
或Stat>ANOVA>IntervalPlot
对均值差异利用区间图说明.利用Minitab的
Anova视窗中的
残差项目(残差
Plot)
对残差实施评价.为测试实际的显著性,对有影响的
Epsilon-Squared
进行计算.根据分析结果找出方案.应用MINITAB分析(1)–分析顺序第三十页,共五十二页,2022年,8月28日零假设(Ho):3名作业者刷漆厚度相同.备择假设(Ha):作业者中至少有一名刷的厚度与其他作业者刷的厚度不同(或大或小).应用MINITAB分析(1)–老板的思考是谁刷漆刷的这么厚?Bob?Jane?Walt?一定要查找出来!!!(显著水平设为5%)
设置假设第三十一页,共五十二页,2022年,8月28日按照下列样式在Minitab中输入数据打开[ANOVA.MPJ]的
(3LevelANOVA
)worksheet Bob Jane Walt25.2969 26.0056 28.426826.0578 25.9400 27.508524.0700 26.0063 27.582524.8199 26.4356 27.401825.9851 25.9927 24.9209 … … ...应用MINITAB分析(2)–输入数据1、判信2、判量参考《MSA》章节参考《抽样与样本大小》章节第三十二页,共五十二页,2022年,8月28日应用MINITAB分析(3)–稳定性分析①目的:确认各水平数据中是否有异常现象(逃逸点、不随机等).②路径:Stat->ControlChart(参考下图)3、判异第三十三页,共五十二页,2022年,8月28日应用MINITAB分析(3)–稳定性分析③输出结果④结论各水平中的数据没发现有异常点,可继续往后分析第三十四页,共五十二页,2022年,8月28日应用MINITAB分析(4)–正态性分析①目的:确认各水平数据是否服从正态分布.②路径:Stat->BasicStatistics->NormalityTest(参考下图)4、判形第三十五页,共五十二页,2022年,8月28日应用MINITAB分析(4)–正态性分析③输出结果④结论各水平中的数据都服从正态分布,可继续往后分析第三十六页,共五十二页,2022年,8月28日应用MINITAB分析(5)–等方差检验①目的:确认各水平数据之间方差是否相等.②数据堆栈:路径:Data->Stack->Columns(参考下图)5、判散第三十七页,共五十二页,2022年,8月28日应用MINITAB分析(5)–等方差检验③等方差检验路径:Stat->ANOVA->TestforEqualVariances…(参考下图)第三十八页,共五十二页,2022年,8月28日P值大于0.05④输出结果⑤结论:故3个人所油漆的厚度数据方差相等应用MINITAB分析(5)–等方差检验第三十九页,共五十二页,2022年,8月28日应用MINITAB分析(6)–均值检验①目的:确认各水平数据集所对应的总体均值是否相等.②路径:(堆栈型)Stat->ANOVA->One-Way…(参考左下图)(非堆栈型)Stat->ANOVA->One-Way(Unstacked)6、判中第四十页,共五十二页,2022年,8月28日应用MINITAB分析(6)–均值检验第四十一页,共五十二页,2022年,8月28日应用MINITAB分析(6)–均值检验③均值检验输出结果④均值检验结论各水平数据集所对应的总体之间的均值至少有一个不相等One-wayANOVA:Bob,Jane,WaltSourceDFSSMSFPFactor280.38640.19344.760.000Error8778.1160.898Total89158.502S=0.9476R-Sq=50.72%R-Sq(adj)=49.58%32322212ssssPooled++=P值小于显著水平
5%时,得到至少有一个总体均值与其他总体均值不同的结论.
(推翻零假设)这时,推翻所有总体均值相同的零假设(Ho)-
即至少有一个均值不同.因随机现象得到这样大的F-值,实际上其概率不足1/10,000.这与抛硬币时,10次连续相同的情况是相同的.群间方差与群内方差相近时,F值接近1.本例中,F-值很大.子群大小相同时共有标准差第四十二页,共五十二页,2022年,8月28日应用MINITAB分析(7)–残差分析
①目的:二次检验前面的分析是否有不可信的证据(残差有异常现象)
②路径:Stat->ANOVA->One-Way…点击Graph->点Fourinone7、判差第四十三页,共五十二页,2022年,8月28日应用MINITAB分析(7)–残差分析
③残差输出结果:
④残差分析结论:没有足够的证据证明其残差分析有异常第四十四页,共五十二页,2022年,8月28日主效果图、箱图及区间图应用MINITAB分析(8)–Plots8、附图第四十五页,共五十二页,2022年,8月28日主效果图及
箱图应用MINITAB分析(8)–PlotsStat>ANOVA>MainEffectsPlot选择Graph>Boxplot第四十六页,共五十二页,2022年,8月28日IntervalPlot(95%置信区间)区间图应用MINITAB分析(8)–Plots第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 内蒙古呼伦贝尔农垦集团有限公司招聘笔试题库及答案详解(名校卷)
- 教师招聘之《小学教师招聘》综合练习附参考答案详解【研优卷】
- 2025年内蒙古呼伦贝尔农垦牙克石莫拐免渡河农牧场有限公司招聘笔试参考题库附答案详解(黄金题型)
- 教师招聘之《幼儿教师招聘》考前冲刺训练试卷附参考答案详解【b卷】
- 教师招聘之《小学教师招聘》考试押题密卷附答案详解【培优b卷】
- 教师招聘之《幼儿教师招聘》考前冲刺练习题及参考答案详解(培优)
- 2025年教师招聘之《小学教师招聘》练习题包含答案详解【培优b卷】
- 2025年教师招聘之《幼儿教师招聘》题库及答案详解(网校专用)
- 2025年教师招聘之《小学教师招聘》题库检测试卷及完整答案详解(典优)
- 教师招聘之《小学教师招聘》检测卷讲解【夺分金卷】附答案详解
- 软件工程导论课件(第六版)(张海潘编著)(1-13章)
- 中建硅墨烯保温板外墙保温施工方案
- 第三讲 神话学
- 山东大学核心期刊目录(文科)
- 中医基础理论-脏象学说
- ICU患者的早期活动
- GB/T 8566-2007信息技术软件生存周期过程
- GB/T 13452.2-2008色漆和清漆漆膜厚度的测定
- GB/T 12730-2008一般传动用窄V带
- ps6000自动化系统用户操作及问题处理培训
- 手机拍照技巧大全课件
评论
0/150
提交评论