概率论 教学课件-第九章 方差分析及回归分析.doc_第1页
概率论 教学课件-第九章 方差分析及回归分析.doc_第2页
概率论 教学课件-第九章 方差分析及回归分析.doc_第3页
概率论 教学课件-第九章 方差分析及回归分析.doc_第4页
概率论 教学课件-第九章 方差分析及回归分析.doc_第5页
免费预览已结束,剩余17页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章 方差分析及回归分析 1单因素试验的方差分析方差分析是对试验结果所得数据作分析的一种常用的数理统计方法。在第八章曾讨论过两个正态总体均值是否相等的假设检验法,在那里建立了t检验法,本章要讨论三个或三个以上正态总体的均值是否相等的假设法。当试验中仅有一个因素在改变,其他保待不变的情形称为单因素试验,因素所处的状态称为水平,例子见书P270例1,2,例3则为多因素试验法。对例1,数据(表9.1)可看成来自三个不同的总体的样本值,为各个总体的均值,需检验假设 一般地,设因素A有s个水平,今考虑这s个水平对于某总体X的效应:设在每个水平下,总体服从,其中均未知。在下,取得样本为并假定这S组样本相互独立。(表9.4)A A . 样本总和 样本均值 总体均值 下面用线性模型加以研究故=称作随机误差。 或写 +, i=1,2,n j=1,2,.s.其中是相互独立的随机变量列,常称不可观察随机变量。记总平均, 其中n=.令 (1.4)称它为水平的效应,它反映因素在第j个水平下对试验指标的“纯”作用大小,易知之间的差异是等价的,且由(1.2),(1.3)知 .(1.5)于是(1.1)的数学模型可改写为 当不同的水平并不影响总体时,即在水平下有这时反之,若在某些水平下对总体有影响,这时相应的值就不为0。 方差分析的任务是寻求一个统计量,对未知参数作假设检验,即假定有S个正态总体去检验假设法国数学家费歇尔(Fisher)在对总平方和作深入分析后,获得适当的统计量。具体分析为 记为第j个总体的样本均值为第j个总体的样本方差为样本总平均为总离差平方和或总变并差下面分析但是故若令,.(1.12)则其中反映样本内部随机误差,称样本组内平方和或误差平方和。(书上称误差)反映样本之间差异,称样本组间平方和。(书上称因素)此外,若记,于是,由(1.5),(1.6)式,就有这时式(1.12)可改写为由此可见只与有关,不仅与且与有关,再由式(1.12)及(1.15)就有注意到仅有一个约束条件式(1.10),故自由度为n-1 有S个约束条件式(1.8)。为n-s则有如下一个约束条件式:故自由度为s-1.所以,由式(1.16)知是(n-s)个服从N(0,1)的独立随机变量的平方和,因有 (1.18)而当成立时,因为且相互独立 所以 又可证与独立,且当成立时有 所以当成立时,就有对已给水平,存在数使得 故得拒绝域的区域为式(1.15) 反映重复试验中误差的总大小,而反映各总体样本平均之间差异程度,而是的无偏,有效估计量,故一定程度所映假设是否成立,如,说明可能不成立,故称这种比较方差大小来断定是否成立方法为方差分析法。 单因素方差分析表方差来源 平方和 自由度 均方 F比组间(因素) s-1 F=组内(误差) n-s 总和 n-1 拒绝域:F简便计算,和的公式为: 记则关于未知参数的估计 即是无偏估计且所以的无偏估计。当被拒绝时,不全为0,但当拒绝时,需求的区间估计及并且独立,故置信区间为例子见书P280 例5,例6 2 双因素试验的方差分析P.272例3是一个双因素试验和例子再如在橡胶生产过程中,不同的配料方案与与不同的硫化时间影响着橡胶的抗断强度,这又是一个双因素试验的例子,一般当硫化时间不同时,不同的配料方案对生产的影响往往不是一样的,这两个因素对橡胶的抗断强度起着交互作用。检验两因素的交互作用是否存在是双因素的方差分析与单因素方差分析的一大差别。(一) 双因素无重复试验的方差分析设对总体X影剧院响的有A,B两个因素,对A有r个水平这样每一对组合作观察可得观察值共rs个数据(见表9.14 P.291).设它们相互独立,假定,并且 其中且此处假定两因素A,B无交互作用。表示A因素的各个水平影响的大小。.B.。要检验的假设为:与单因素时想法一样,考察总平方和 记并写其他交叉乘积项均为0,只举一例。令:故可写注意到式(2.1)并令则可改写并且又因中有一线性关系(约束条件) 故的自由度为rs-1.中有一线性关系 故自由度为r-1.中有一线性关系 故的自由度为s-1中有线性关系:及又这r+s个关系不是独立的,只因有线性关系式可由其他r+s-1个线性关系式得出,故自由度为 易知在成立时,有 故在成立时,有 在成立时,有 (2.12)故对已给水平,的拒绝哉各为;.(2.13) P .292列出了表9.15.(二)双因素等重复试验方差分析 设有两因素A,B,A有水平B有水平;对每组作t(次重复试验得表9.8(P.282) 设;且各个称为总平均。为A与B的每个水平搭配后总体期望平均值。为B与A的每个水平搭配后总体期望平均值。 为的效应 为 的效应。易知.(2.15)显然 =同理作检验假设: 记 则总平方和 可证各有自由度为 rst-1, rs(t-1),r-1,s-1,(r-1)(s-1) 并且同理当成立时,故拒绝域为同理拒绝域为拒绝域为双因素方差分析表见书表9.9(P.287)对具体例题的计算,可令则 , 3 一元线性回归一 基本概念 在商品生产和科学实验中,经常用到一些变量,客观存在们相互联系,相互依赖,容观上存在着一定的关系,这种相互关系一般可分为两类,即(1) 确定性关系:如电路中欧姆定律V=IR,匀加速运动中关系式S=vt+1/2at, v,a均已知,又在一定质量的理想气体V中,压强P与绝对温度T之间有关系式PV=CT,C为常数。(2) 非确定性关系或相关关系比如:人的年令与血压之间的关系,晶体三极管的放大倍数与电路输出电压V之间的关系,输出电流与温度之间关系,一般,它们不具有数学公式的表示关系,称这类变量之间的关系为非确定性关系或相关关系。 确定这类变量之间关系的数学方法称回归分析,主要内容为(a) 从一组观察(测量)数据出发,确定这类变量间的定量关系式。(b) 对这一类关系式的置信程度作统计检验。(c) 根据一个或几个变量的值去预测或控制可达到什么样的精度。(d) 进行因素分析,即对共同影响某一个量的许多变量之间,找出哪些是重要因素,哪些是次要因素,以及它们这 间关系如何等等。(e) 利用已求得的关系式对生产(或实验)过程作出预报或控制。(f) 据回归分析方法,选择试验点,对试验进行某些设计。一元线性回归一元线性回归实际上就是生产(或工程,或科研)中常迂到的配直线的问题。 设变量度X,Y存在一定的相关关系,希望通过观察(或测量)数据去找出两者之间的经验公式。一般总假定Y是一随机变量。先从例子出发建立数学模型。已知一个作等速直线运动的质点,在时刻x的位置为s,设质点在x=0时刻的初始位置为,其平均速度为V均未知,则应有公式 S=+Vx为求解,V,只要知道两个不同时刻及其相应位置即可,因各种原因,质点的位置不可能精确地观察到,往往带有随机智的观察(测量)误错。故实际观察值Y可写为Y=S+=+Vx+。此处是随机变量,且设则EY=+Vx=。一般,若已知变量x,y有n对观察(测量)值,我们用一线性函数作为=EY的估计值,并且,对x的每一个值,假定YN(,),故可设数学模型为 均不依赖x,又称b为回归系数。书中P296例1 ,共给出10对观察数据需从这10对数据出发,给出a,b 的估计值。于是称 (3.2)为y对于x的(一元)回归方程或回归直线。2下边阐述a,b的估计 取x的n个不全相同的值作独立试验,得样本,于是+相互独立也相互独立, (3.3)且的 n元联合密度为(或似然函数) ab可用极大似然估计法去估计得到,显然:欲使L取极大值,只要 取极小,其必要条件为:或写记则有将代入(3.2)就是可求的回归直线方程 由于点在回归直线上,故从力学观点点就是n个散(布)点的重心位置,即知回归直线必经过散点的重心。在的实际计算时,常令则 例子见书P.300.例2。.的估计及的估计 记与回归值之差的平方和称残差平方和 (3.13)回头计算令.(3.14) 又因再利用所以.(3.19)将它们代入(3.13),得到 即无偏估计又因是正态分布,且由式(3.6)知 这就说明实际上是(n-2)个相互独立的分布的平方和,故 同理可得 线性假设的显著性检验。为检验是否合适相当于去检验 方法一 ,故由t分布定义知 故在成立时有所以对已给水平,的拒绝域为 当被拒绝时,即有,可认为回归效果显著,反之,就认为回归效果不显著(其佘见书P304)方法二 为考虑n个观察值之差异,可用与其平均值的离差平方和表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论