第8章方差分析及回归分析课件_第1页
第8章方差分析及回归分析课件_第2页
第8章方差分析及回归分析课件_第3页
第8章方差分析及回归分析课件_第4页
第8章方差分析及回归分析课件_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《概率论与数理统计》教程方差分析与回归分析第八章数计学院数学教研室本章目录§8.1

单因素方差分析§8.2

双因素方差分析§8.3

一元线性回归分析工业生产中产品质量的影响因素:原材料、设备、技术及员工素质等;工作中影响个人收入的影响因素:除学历、专业、工作时间、性别等方面外,还有个人能力、经历及机遇等偶然因素.

在这众多因素中,每一个因素的改变都可能影响最终的结果,各因素的影响有大有小。故在实际问题中,就有必要找出对事件最终结果有显著影响的那些因素.如何分析这些诸多因素中哪些因素对结果会产生显著影响?——这是方差分析的主要任务!§8.1

单因素方差分析基本概念:试验指标:在试验中要考察的指标,如产品的质量等。因素:影响试验指标的条件。包括可控因素和不可控因素。单因素试验:在一项试验中只有一个因素在改变的试验。多因素试验:在一项试验中多于一个因素在改变的试验。水平:因素所处的状态。随机误差:同一水平下,样本各观察值之间的差异,称为随机误差。这种差异可以看成是随机因素的影响。系统误差:不同水平下,各观察值之间的差异。这种差异可能是由于行业本身所造成的,称为系统误差。§8.1

单因素方差分析一、单因素方差分析问题的提法§8.1

单因素方差分析试验指标:薄板的厚度因素:机器水平:三台不同的机器即为三个不同的水平单因素试验试验目的:考察机器这一因素对薄板的厚度有无显著的差异§8.1

单因素方差分析试验指标:电路响应时间因素:电路类型水平:四种不同的电路即为四个不同的水平单因素试验试验目的:考察电路类型这一因素对响应时间有无显著影响§8.1

单因素方差分析试验指标:射程因素:燃料(A)、推进器(B)水平:因素A有4个水平,因素B有3个水平双因素试验试验目的:考察推进器和燃料这两个因素对射程是否有显著影响§8.1

单因素方差分析以例1讨论单因素方差分析的方法:在因素的每个水平下进行独立试验,其结果就是一个样本,表中数据可看成来自三个不同总体的样本值,本题需要检验假设:§8.1

单因素方差分析§8.1

单因素方差分析假设:未知,不同水平

下的样本之间相互独立.由假设,有随机误差记则有单因素试验方差分析的数学模型§8.1

单因素方差分析方差分析的任务:为便于讨论,记()引入记号()的效应总平均(1.1)因为§8.1

单因素方差分析记水平Ai下的样本均值;总偏差平方和:总的样本均值.组内偏差平方和:组间偏差平方和:(误差平方和)反映了全部试验数据之间的差异反映了水平Aj

内由随机误差而引起的波动由水平Aj的效应的差异以及随机误差引起总离差平方和分解式:…(1.5)§8.1

单因素方差分析二、平方和的分解(总变差)(效应平方和)§8.1

单因素方差分析三、SE,SA的统计特性各项间相互独立1、SE的统计特性§8.1

单因素方差分析四、假设检验问题的拒绝域2、SA的统计特性§8.1

单因素方差分析§8.1

单因素方差分析§8.1

单因素方差分析§8.1

单因素方差分析§8.1

单因素方差分析【例5】工程师测量了四种不同类型外壳的彩色显像管的传导率,得传导率的观察值如下表:显像管型号传导率值A1(类型1)143141150146A2(类型2)152144137143A3(类型3)134136133129A4(类型4)129128134129问:外壳类型对传导率是否有显著影响?§8.1

单因素方差分析解:设水平Ai下的总体为检验假设:

VS不全相等已知:§8.1

单因素方差分析方差来源平方和自由度F值临界值因素A总和试验误差方差分析表因为故拒绝原假设H0,即认为因子是显著的。§8.1

单因素方差分析本章目录§8.1

单因素方差分析§8.2

双因素方差分析§8.3

一元线性回归分析一、问题的提出实际应用中,影响试验结果的因素往往不止一个,为此需要讨论多因素方差分析问题。(在此只讨论双因素方差分析):因素A因素BB1B2A1A220605090因素A因素BB1B2A1A2201005080表1表2从表1看出:因素A与因素B各自单独地对试验结果产生影响,相互之间无影响;从表2看出:因素A与因素B之间的搭配对试验结果产生影响(称为交互作用)。为简单起见,只讨论A、B无交互作用下的双因素方差分析问题,此时对A、B的每一种搭配只进行一次试验。§8.2

双因素方差分析假定要考察两个因素A、B对某项指标值的影响,因素A取s个水平A1,A2,…,As,因素B取r个水平B1,B2,…,Br,在A、B的每对组合水平(Ai,Bj)上作一次试验,试验结果为Xij,i=1,…,s;j=1,…,r。所有Xij独立,数据列于下表:要考察因素A、B是否指标值产生显著性影响?§8.2

双因素方差分析设搭配(Ai,Bj)下的试验结果为Xij,假定则问题归结为检验假设:§8.2

双因素方差分析类似于单因素方差分析的方法,在检验之前,必须把因素A,因素B及随机误差引起的数据波动从总波动中分离出来:记:于是§8.2

双因素方差分析SA是由因素A的不同效应和随机误差引起的偏差;SB是由因素B的不同效应和随机误差引起的偏差;Se表示由随机误差引起的偏差.定理:(1)ST,SA,SB相互独立,且(2)当H0A成立时,当H0B成立时,因此,可用比较SA与SE的值来检验假设H0A,用比较SB与SE的值来检验假设H0B.§8.2

双因素方差分析可以证明:(1)ST,SA,SB相互独立,且(2)当H0A成立时,当H0B成立时,当H0A成立时,有当H0B成立时,有H0A的拒绝域为H0B的拒绝域为给定显著性水平,则有§8.2

双因素方差分析B1B2…BSA1x11x12…x1sA2x21x22…x2s……………Arxr1xr2…xrs因素A因素B……………数据计算表§8.2

双因素方差分析方差来源平方和自由度F值临界值因素A总和试验误差方差分析表拒绝域为:因素B§8.2

双因素方差分析【例1】为了研究不同地点,不同季节大气飘尘含量的差异性,对地点(A)取三个不同水平,对季节(B)取四个不同水平,在不同组合(Ai,Bj)下各测得一次大气飘尘含量(mg/m2),结果列于表11.8,试求研究地点间的差异及季节间的差异对大气飘尘含量有无影响?显像管型号因素B冬季春季夏季秋季A11.1500.6140.4750.667A21.2000.6200.4200.880A30.9400.3790.2000.540§8.2

双因素方差分析解:方差来源平方和自由度F值临界值因素A总和试验误差方差分析表因素B§8.2

双因素方差分析本章目录§8.1

单因素方差分析§8.2

双因素方差分析§8.3

一元线性回归分析§8.3

一元线性回归8.3.1问题的提法确定性关系,

不确定性关系,

如V=IR,S=vt变量间的关系

如树干直径与树高变量间的不确定关系(即由度量上的误差与其他不可控的随机因素导致的这种关系)称为相关关系。(一元)线性回归就是这种关系中的最简单的一种。回归分析就是寻找这类不确定的变量之间的数学关系式并进行统计推断的一种方法。相关关系显然,函数关系是相关关系的特例.【父与子的身高关系】(单位:英寸)(单位:厘米)19世纪,英国生物学家、统计学家高尔顿(F.Galton)在研究父与子的身高关系时,提出了“回归”一词,并得到如下回归方程:通过方程发现:父亲身高每每增加一个单位,儿子身高平均增加0.516个单位;父亲身高小于177cm时,儿子是身高高于父辈平均身高;反之,儿子身高低于父辈平均身高。父子两代的平均身高有向中心回归的的趋势——回归分析因此而提出。§8.3

一元线性回归8.3.1问题的提法散点图与一元线性回归模型§8.3

一元线性回归8.3.1问题的提法设x是一可控制的变量(普通变量),是与x

有关的随机变量,如何确定这两者的关系呢?甲醛浓度x18202224262830缩醛化度26.8628.3528.7528.8729.7530.0030.36【例1】在维尼纶的生产过程中经常使用甲醛浓度x来控制缩醛化度

,试验结果如下:随机误差

一般假定与x无关独立同分布于与x具有如下关系:………………..(1)

对于每一个观察点(xi,yi),满足….(2)

(1)、(2)称为一元(正态)线性回归模型,a、b称为回归系数,建立在一元线性回归模型基础上的统计分析称为一元线性回归分析。§8.3

一元线性回归8.3.1问题的提法一元线性回归分析的研究内容因为记则……………(1)

……(3)

(3)式称为一元线性回归方程,其图形称为回归直线。(反映了的“平均”或“主要部分”)一元线性回归分析的主要内容有:(1)对参数a,b进行点估计,估计量称为样本回归系数或经验回归系数,于是有………………(4)

(4)式称为经验直线回归方程,其图形称为经验回归直线。§8.3

一元线性回归8.3.1问题的提法(2)检验与x之间是否线性相关。如果不线性相关,所建立的回归直线方程也就失去了应用价值。(3)如何利用所取得的线性关系,通过x来对进行预测或由来控制x的范围。注:(1)实际问题中,x可能是一个随机变量,但由于假定其可控制,故认为x是非随机变量。(2)较一元线性回归模型更为一般的回归模型为:常见的是多元线性回归模型:§8.3

一元线性回归8.3.1问题的提法§8.3

一元线性回归8.3.2回归系数a,b的最小二乘估计求a,b的估计量实际上就是要确定一条经验回归直线用它来近似表示和x的关系。··为便于研究,引入越小越好最小二乘法就是求得使达到最小值:注1:一元线性回归分析中的最小二乘法估计量即是极大似然法估计量,但前者比后者更方便——不必知道随机变量的概率分布。注2:为的无偏估计量。其中§8.3

一元线性回归8.3.2回归系数a,b的最小二乘估计§8.3

一元线性回归8.3.3相关性检验如果与x不具有近似的线性相关性(即b=0),则经验回归方程就失去了其应用价值,为此必须对与x之间是否具有线性相关关系进行检验。原假设:检验方法:(1)F检验法;(2)相关系数检验法;(3)T检验法.数据间的总波动偏差平方和的分解式:由x的线性作用引起的波动x的线性作用外其他因素引起的波动总偏差平方和回归平方和残差平方和.......1、F

检验法检验函数:拒绝域:若方程的线性相关程度较高,则总波动应主要由线性作用所引起,因此U较大,Q相对较小;反之,如果方程不具有线性关系或程度较低,则总波动应由其他因素所引起,即U较小,Q较大。双边?左单边?右单边?右单边其中由确定由x的线性作用引起的波动x的线性作用外其他因素引起的波动回归平方和残差平方和§8.3

一元线性回归8.3.3相关性检验说明:(1)(2)越接近1,线性相关性越强(即方程越显著).对给定的检验水平,利用附表9,按自由度n-2,查表确定若,则拒绝H0,即认为回归方程是显著的。2、相关系数检验法记该值越大,方程的线性相关性越显著检验函数:拒绝域:§11.3

一元线性回归11.3.3相关性检验不应该太大即3、T

检验法可以证明检验函数:拒绝域:H0为真检验方法:(1)F检验法;(2)相关系数检验法;(3)T检验法.以上三种检验方法效果一致,但(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论