




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第八章第八章 方差分析与回归分析方差分析与回归分析单要素方差分析单要素方差分析回归分析的根本概念回归分析的根本概念一元线性回归模型的建立与检验一元线性回归模型的建立与检验方差分析的概念与根本思想方差分析的概念与根本思想消费者对四个行业的投诉次数消费者对四个行业的投诉次数 观测值观测值零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业12345766494034683929455631492134404451657758四个行业之间的效力质量能否有显著差别?四个行业之间的效力质量能否有显著差别?一、方差分析的概念与根本思想一、方差分析的概念与根本思想 1.问题的提出问题的提出分析四个行
2、业之间的效力质量能否有显著差别作出这种判别最终被归结为检验这四个行业被赞扬次数的均值能否相等?均值相等均值不全相等效力质量没有显著差别效力质量有显著差别例题例题8.2 8.2 在饲料养鸡增肥研讨中,某饲料研讨所提出三种配方:在饲料养鸡增肥研讨中,某饲料研讨所提出三种配方: A1A1以鱼粉为添加料,以鱼粉为添加料, A2 A2以槐树粉为添加料,以槐树粉为添加料, A3 A3以苜蓿粉添加料。以苜蓿粉添加料。为比较三种饲料的效果,特选为比较三种饲料的效果,特选2424只类似的雏鸡随机分为三组,每只类似的雏鸡随机分为三组,每组用一种饲料喂养,组用一种饲料喂养,6060天后测其体重,获得数据如下表天后测
3、其体重,获得数据如下表饲料A鸡重/gA11073 1009 1060 1001 1002 1012 1009 1028A21107 1092 990 1109 1090 1074 1122 1001A31093 1029 1080 1021 1022 1032 1029 1048比较三种饲料的增重效果能否一致利用样本比较三个总体均值能否相等 直观上看该问题可以用两个总体均值差别显著性检验处理,但细想想还是存在一定问题,由于这样的比较能增大犯错误的概率。为处理这类问题,英国统计学家R.A.Fisher于1924年提出理处理此类问题的通用方法-方差分析法。2.2.方差分析的概念方差分析的概念实验目
4、的:实验目的: 实验结果。实验结果。可控要素:可控要素: 在影响实验结果的众多要素中,可人在影响实验结果的众多要素中,可人为控制为控制 的要素。的要素。单要素实验:单要素实验: 假设在一项实验中只需一个要素改动,假设在一项实验中只需一个要素改动,其其 它的可控要素不变,那么该类实它的可控要素不变,那么该类实验称为单因验称为单因 素实验。素实验。程度程度可控要素所处的各种各种不同的形状。每个可控要素所处的各种各种不同的形状。每个 程度又称为实验的一个处置。程度又称为实验的一个处置。随机误差随机误差要素的同一程度要素的同一程度(总体总体)下,样本各察下,样本各察看值之间的差别这种差别可以看成是随机
5、要素的影看值之间的差别这种差别可以看成是随机要素的影响,称为随机误差响,称为随机误差 系统误差系统误差要素的不同程度要素的不同程度(不同总体不同总体)下,各察下,各察看值之间的差别看值之间的差别这种差别能够是由于抽样的随机性所呵斥的,也能这种差别能够是由于抽样的随机性所呵斥的,也能够是由够是由于行业本身所呵斥的,后者所构成的误差是由系统于行业本身所呵斥的,后者所构成的误差是由系统性要素性要素呵斥的,称为系统误差呵斥的,称为系统误差数据的误差用平方和数据的误差用平方和(sum of squares)表示,称表示,称为方差为方差组内方差组内方差(within groups) 要素的同一程度要素的同
6、一程度(同一个总体同一个总体)下样本数据的下样本数据的方差方差比如,零售业被赞扬次数的方差比如,零售业被赞扬次数的方差组间方差组间方差(between groups)要素的不同程度要素的不同程度(不同总体不同总体)下各样本之间的方差下各样本之间的方差比如,四个行业被赞扬次数之间的方差比如,四个行业被赞扬次数之间的方差v假设不同行业对赞扬次数没有影响,那么组间误差中只包含随机误差,没有系统误差。这时,组间误差与组内误差经过平均后的数值就应该很接近,它们的比值就会接近1v假设不同行业对赞扬次数有影响,在组间误差中除了包含随机误差外,还会包含有系统误差,这时组间误差平均后的数值就会大于组内误差平均后
7、的数值,它们之间的比值就会大于1v当这个比值大到某种程度时,就可以说不同程度之间存在着显著差别,也就是自变量对因变量有影响v 判别行业对赞扬次数能否有显著影响,实践上也就是检验被赞扬次数的差别主要是由于什么缘由所引起的。假设这种差别主要是系统误差,阐明不同行业对赞扬次数有显著影响3.方差分析的思绪方差分析的思绪4.4.方差分析的根本思想方差分析的根本思想 实验目的的变化可以用目的值的方差反映,导致目实验目的的变化可以用目的值的方差反映,导致目的值的值发生变化的缘由有两方面:一是可控要素,二是不可发生变化的缘由有两方面:一是可控要素,二是不可控因控因素。方差分析就是将目的值的方差分解成组间方差与
8、素。方差分析就是将目的值的方差分解成组间方差与组内组内方差,然后根据概率比较组间方差与组内方差的大小方差,然后根据概率比较组间方差与组内方差的大小关关系,从而决议引起目的值的变化的主要缘由。系,从而决议引起目的值的变化的主要缘由。5.5.方差分析的根本假定方差分析的根本假定不同要素对实验目的值的影响作用是加性效应,即不同要素对实验目的值的影响作用是加性效应,即实验实验目的值的变化是各种要素所起作用的累加;目的值的变化是各种要素所起作用的累加;实验目的服从正态分布;实验目的服从正态分布;实验数据是随机的,并且可控要素不同程度的实验实验数据是随机的,并且可控要素不同程度的实验数据具有数据具有方差齐
9、性。方差齐性。二:单要素方差分析的统计模型二:单要素方差分析的统计模型 1. 1.单要素方差分析的数据构造单要素方差分析的数据构造因素-水平试验数据和平均1A2AaA11xjx112x1rx21x22xjx22rx1ax2axjx2arx1T2TaTax2x1xTx1111j,.ijraraiiijiijijijixAiTTTxxTxTxrar其中 是因素 第 水平下第 次重复试验结果 2.单要素方差分析的统计模型 在方差分析统计模型下,方差分析要处理的问题转化为以下假设检验问题:012112:0;:,aaHH 不全为零对试验指标影响明显。因素,说明;接受对试验指标影响不明显,说明因素接受AH
10、AH1021,2,1,2,(0,),;ijijiijijiiijxxiajrNAiA试验数据 满足且相互独立其中 为总体平均,为因素 的第 个水平 下,试验指标的主效应为随机因素对试验指标值的影响。 三、单要素方差分析的原理三、单要素方差分析的原理 1. 1.实验数据离差平方和分解实验数据离差平方和分解21122111211()()()()arTijijarrAiiijiareijiijSSxxSSxxrxxSSxx总离差平方和组间离差平方和组内离差平方和离差平方和分解式11()()0ariijiijxxxxTAeSSSSSS11()()arijiiijxxxx22111()()aariiji
11、iijAer xxxxSSSSAeSSASS其中反映因素 不同水平引起的试验指标值的变化;反映没有控制因素引起的试验指标值的变化。111121122()()()()arararijijijiijijiiixxxxxxxx211211()ijiararijijixxxx221111()()ararTijijjijiiixxSSxxxx222111111()ijararaeijiiijijiSSxxxTr2221111()ararTijijijijTSSxxxar2221111()araAiiijiTSSxxTrar00(1)(1, (1)(1)(1, (1)(1, (1)(1, (1);.Aea
12、 rSSFF aa raSSF aa rP FF aa rFF aa rHH所以有对于给定的小概率 ,存在使得故当时,拒绝反之,接受2. 方差分析原理02222(1)( (1)eTHSSSSara r如果试验数据满足单因素方差分析的模型,且统计假设成立,记 为共同均值,则有2(1)AeaSSSS且与相互独立2ASS1(1)1(,).AeTTAeAAAeeeAAeefafa rfarfffSSMSfSSMSfMSFF ffMS引入记号,称为组间离差平方和自由度;,称为组内离差平方和自由度;,称为总离差平方和自由度;显然有,称为组间均方差;,称为组内均方差;又叫均方误。显然有记号及其含义在实践运用
13、中,方差分析结果以方差分析表方式给出。单要素方差分析表方差来源方差来源平方和平方和自由度自由度均方均方F F临界值或临界值或SigSig组间组间SSAa-1SSA/(a-1)MSAMSe组内组内SSea(r-1)SSea(r-1)总和总和SSTar-10.05(,)Sig0.01(,)SigAeAeFFffFFff如果在检验水平下,或,就均值差异显著,用“ ”表示;如果在检验水平下,或,就均值差异极显著,用“”表示。例题例题8.2 8.2 在饲料养鸡增肥研讨中,某饲料研讨所提出三种配在饲料养鸡增肥研讨中,某饲料研讨所提出三种配方:方: A1 A1以鱼粉为添加料,以鱼粉为添加料, A2 A2以槐
14、树粉为添加料,以槐树粉为添加料, A3 A3以苜蓿以苜蓿粉添加料。为比较三种饲料的效果,特选粉添加料。为比较三种饲料的效果,特选2424只类似的雏鸡随只类似的雏鸡随机分为三组,每组用一种饲料喂养,机分为三组,每组用一种饲料喂养,6060天后测其体重,获数天后测其体重,获数据如下表,试以此数据断定不同饲料能否有差别?据如下表,试以此数据断定不同饲料能否有差别?饲料A鸡重/g-1000A1 73 9 60 1 2 12 9 281943763610024A2107 92 -10 109 90 74 122 158534222560355A3 93 29 80 21 22 32 29 4835412
15、531620984113350517791363iT2iT21rijjx果无差异。三种饲料对鸡的增肥效解:建立统计假设:0H21) 18(32132312496.2821508.966004.3787608.9660241133850517704.378762411339136322eATATeATfffSSSSSSSSSS计算有关量方差分析表方差来源平方和自由度均方F临界值临界值组间9660.0822830.043.59*3.47组内28215.96211343.62总和37876.0423 四、单要素方差分析模型参数的估计四、单要素方差分析模型参数的估计 当方差分析结果为否认原假设时,就需
16、求估计模型的有关参数 ,下面就讨论方差分析模型参数的估计。2211111,2,1,2,(0,),;,111ijiijijiiijiarrarijiijijijjijxiajrNAiAxxxarrar 单因素方差分析的模型为且相互独立其中 为总以平均效应,为因素 的第 个水平 下,试验指标的均值为随机因素对试验指标值的影响。需要估计的参数有。不难证明这些参数的极大似然估计量为:221111()arijeijxSSarar五、多重比较法回绝H0,接受H1, 表示总体均数不全相等哪两个平均数之间相等?哪两个平均数之间不等? 需求进一步作多重比较。方差分析结果 不回绝H0,表示回绝总体均数相等的证据缺
17、乏, 分析终止。 常用多重比常用多重比较法较法( (1)2ijijxxexxLSDta rSMSSrq q法法( (又称又称SNK (student-Newman-Keuls)SNK (student-Newman-Keuls)检验法检验法) ) q检验方法是将r个平均数由大到小陈列后,根据所比较的两个处置平均数的差数是几个平均数间的极差分别确定最小显著极差LSR值的。( ,)/eEEeLSRqa f SSMSra其中 表示与比较的两个均值之间的跨度。,( ,1,2, ,),ijijijLSDx x i ja ijxxLSDi jxxLSDi j以为两均值比较的最小显著差。如果表示两个样本均值
18、。当时,就认为第水平间均值差异显著;当时,就认为第水平间均值差异不显著。,( ,1,2, ,),ijijijLSRx xi ja ijxxLSRi jxxLSRi j以为两均值比较的最小显著差。如果表示两个样本均值。当时,就认为第水平间均值差异显著;当时,就认为第水平间均值差异不显著。Tukey法(又称honestly significant difference,简称HSD )( , (1)2ijijxxexxHSDqa a rSMSSr,( ,1,2, ,),ijijijHSDx x i ja ijxxHSDi jxxHSDi j以为两均值比较的最小显著差。如果表示两个样本均值。当时,就认
19、为第水平间均值差异显著;当时,就认为第水平间均值差异不显著。BonferroniBonferroni法法Bonferroni法是根据所比较的两个处置平均数的个数法是根据所比较的两个处置平均数的个数k,将检验程度将检验程度 减少减少k倍做为真实比较程度倍做为真实比较程度 ,确定是几个,确定是几个平均数间的极差分别确定最小显著差数平均数间的极差分别确定最小显著差数LSD值的。值的。( (1)2ijijxxexxLSDta rSMSSr。水平间均值差异不显著时,就认为第当水平间均值差异显著;时,就认为第当表示两个样本均值。如果著差。为两均值比较的最小显以jiLSDxxjiLSDxxjirjixxLS
20、Djijiji,), 2 , 1,(,多重比较法选择1.实验事先确定比较的规范,凡是与对照相比较,或与预定要比较的对象比较,普通可选用最小显著差数法LSDa法;2.根据否认一个正确的H0和接受一个不正确的H0的相对重要性来决议。参考以下观念: 根据实验的偏重点选择。三种方法的显著尺度不一样,LSD法最低,HSD法次之,SNK法最高。故对于实验结论事关艰苦或有严厉要求时,用SNK法,普通实验可采用HSD法。当比较次数不多时,Bonferroni法的效果较好;但当比较次数较多(例如在10次以上)时,那么由于其检验水准选择得过低,结论偏于保守。例题例题8.38.3试以试以LSDLSD法检验各种药剂处
21、置的苗高平均数之间法检验各种药剂处置的苗高平均数之间的差别显著性。的差别显著性。2 8.172.02()4ijxxScmr(m-1)=12时,t0.05(12)=2.179,t0.01(12)=3.055故 LSD0.05=2.1792.02=4.40 LSD0.01=3.0552.02=6.17处理苗高平均数差异显著性0.050.050.010.01D29aa B23ba bA18cb cC14cc 双要素方差分析背景双要素方差分析背景 双要素方差分析的类双要素方差分析的类型型假设把种类看成影响产量的要素A,肥料那么是影响产量的要素B。对要素A、要素B和二者互作同时进展分析,就属于双要素方差
22、分析。在实践问题的研讨中,有时需求思索两个要素对实验结果的影响。如研讨小麦产量问题,除了关怀种类对产量的作用之外,我们还想了解化肥的运用对产量的作用,有时甚至要思索种类与肥料的相互促进作用。假设不同种类、不同施肥量对产量作用存在显著的差别,就需求分析缘由。选择适宜的种类,决议恰当的施肥量,以到达增产的目的。双要素方差分析双要素方差分析的类型 无交互作用的双无交互作用的双要素方差分析要素方差分析 有交互作用的双有交互作用的双要素方差分析要素方差分析 假定要素A和要素B的效应之间是相互独立的,不存在相互关系 假定要素A和要素B的结合会产生出一种新的效应(交互效应) 交互作用的概念交互作用的概念有人
23、在研讨油菜产量受氮肥与磷肥影响问题时,获得如下实验数据。显然512-470-2-10=30既不是单纯氮肥引起的产量变化,也不是单纯磷肥引起的产量变化,这就是交互作用。氮肥 磷肥06047047215480512不思索交互作用的双要素方差分析不思索交互作用的双要素方差分析 因素B 数据因素A 双要素不思索交互作用方差分析的数据构造双要素不思索交互作用方差分析的数据构造 双要素不思索互作方差分析实验数据具有以下构造方式。双要素不思索互作方差分析实验数据具有以下构造方式。1B2BbB1AaA2AjTjx 1T11x ix iT21x12xbx1 1x axbx2 2T 2x2 T1 T1ax2ax
24、aT x2 x1 x T22xabxbTabxabTxTTxTaTxxTbTxxTjBiAxbjjaiiaibjijjjaiijjiibjijiij 111111如下:验结果,其它记号含义次水平交叉位置的试第水平与因素第是因素其中 双要素不思索交互作用方差分析的统计模型双要素不思索交互作用方差分析的统计模型的影响。随机因素对试验指标值为用个水平对试验指标的作的第为因素标的作用个水平对试验指的第为因素为总以平均效应,其中且相互独立满足试验数据ijjiijijjiijijjBiAbjaiNxx;, 2 , 1, 2 , 1), 0(2该方式称为双要素不思索交互作用方差分析的统计模型。 在方差分析统
25、计模型下,方差分析要处理的问题转化为以下假设检验问题:不全为零不全为零bbaaHHHH,:; 0:,:; 0:2121212021112110指标影响明显对试验,说明因素;接受对试验指标影响不明显,说明因素接受对试验指标影响明显;说明因素,;接受对试验指标影响不明显,说明因素接受BHBHAHAH21201110 双要素不思索交互作用方差分析原理双要素不思索交互作用方差分析原理实验数据离差平方和分解实验数据离差平方和分解 aibjijTxxSS112)(总离差平方和 aibjjiijebjjaibjjBaiiaibjiAxxxxSSxxaxxSSBxxbxxSSA1121211212112)()
26、()()()(组内离差平方和离差平方和因素离差平方和因素的试验指标值的变化。反映没有控制因素引起标值的变化;不同水平引起的试验指反映因素标值的变化;不同水平引起的试验指反映因素其中易证明有eBAeBATSSBSSASSSSSSSSSS)1)(1( , 1(),1)(1( , 1()1)(1( , 1() 1()1)(1( , 1() 1(,)1)(1(,) 1() 1() 1(,2220102222222010babFbaaFbabFSSSSaFbaaFSSSSbFSSSSSSCochranbaSSHHbSSaSSabSSHHeBBeAAeBAeBAT,存在对于给定的相互独立。所以有与定理得解
27、式和于是,由离差平方和分是否成立,总有无论统计假设为共同均值,于是有成立,则且统计假设分析的模型,素不考虑交互作用方差如果试验数据满足双因.;)1)(1( , 1(;)1)(1( , 1()1)(1( , 1()1)(1( , 1(20201010HHbabFFHHbaaFFbabFFPbaaFFPBABA反之,接受时,拒绝故当反之,接受时,拒绝故当使得;又叫均方误。,称为随机误差均方差方差;均称为因素均方差;称为因素显然有和自由度。称为随机误差离差平方度;称为总离差平方和自由离差平方和自由度;称为因素引入记号eeeBBBAAAeBATeTBAfSSMSBfSSMSAfSSMSffffbafa
28、bfBAbfaf) 1)(1(1,1, 1),(),(eBeBBeAeAAffFMSMSFffFMSMSF显然有双要素不思索交互作用方差分析表方差来源方差来源平方和平方和自由度自由度均方均方F临界值临界值或或Sig因素因素ASSAa-1SSA/(r-1)MSAMSeMSBMSe因素因素B SSBb-1SSB/(b-1)误差误差SSe(a-1)(b-1) SSe(a-1)(m-1)总和总和SSTab-1例例8.4 8.4 对于四种不同种源的油松种子,在三种不同土质对于四种不同种源的油松种子,在三种不同土质的土壤上进展育苗实验,两年后测定苗木高度,所得实的土壤上进展育苗实验,两年后测定苗木高度,所
29、得实验数据如表所示。假定实验数据满足正态、等方差条件验数据如表所示。假定实验数据满足正态、等方差条件试在检验程度试在检验程度0.050.05下,分析种源、土质对油松苗木高度下,分析种源、土质对油松苗木高度的影响?的影响? 因素B 数据因素A因素BB1B2B3因素AA144534714448.0A237443511638.7A336473311638.7A445483112441.316219214650040.548.036.541.7 iT ixjTjx影响种源对油松苗高无显著影响;土质对油松苗高无显著解:建立统计假设:2010HH6, 2, 3,113 .877 .2727 .1747 .
30、5347 .2723 .208330 .2110617 .1743 .208330 .2100817 .5343 .208330 .213683, 4),(),(,2122122112 eBATBATebjjBaiiAaibjijTeBeABAffffSSSSSSSSabTTaSSabTTbSSabTxSSbaffFffFFF,由题设知,确定计算 双要素方差分析的模双要素方差分析的模型型., 2 , 1;, 2 , 1;, 2 , 1)(rkbjaiXijkijjiijk。不可测定表示随机效应的交互效应,与表示因素个水平处理效应,的第表示因素应,个水平处理效第表示因素表示总体平均数,式中)()
31、(ijkijjiBAjBiA著影响。即种源对油松苗高有显拒绝显著影响;,即土质对油松苗高无所以,接受:15. 5)6 , 2(,76. 4)6 , 3(4 . 96/3 .873/7 .272/0 . 46/3 .873/7 .174/201005. 005. 0HHFFfSSfSSFfSSfSSFeeBBBeeAAA 数据构造数据构造A A因素因素B B因素因素总和总和T Ti.i.平均平均B B1 1B B2 2B Bb bA A1 1x x111111x x121121x x1b11b1T T1.1.x x112112x x122122x x1b21b2x x11r11rx x12r12
32、rx x1br1brT Tij.ij.T T11.11.T T12.12.T T1b.1b.A Aa ay ya11a11x xa21a21x xab1ab1T Ta.a.x xa12a12x xa22a22x xab2ab2x xa1ra1rx xa2ra2rx xabrabrT Tij.ij.T Ta1.a1.T Ta2.a2.T Tab.ab.T T.j.j.T T.1.1.T T.2.2.T T.b.b.T T.平均平均 1x ax ix1xjx2xbx x 离差平方和的分离差平方和的分解解eBABAaibjrkijijkaibjjiijbjjaiiijijkjaibjrkijiija
33、ibjrkijkTSSSSSSSSXXXXXXrXXarXXbrXXXXXXXXXXXXSS 111212121221111112)()()()()()()(eBABATaibjrkijijkeaibjjiijBAbjjBaiiAaibjrkijkTSSSSSSSSSSXXSSXXXXrSSXXarSSXXbrSSXXSS 11121212121112)()()()(离差平方和表达式eeeBABABABBBAAAeBABATeeBABABBAATTfSSMSfSSMSfSSMSfSSMSfffffrabfSSbafSSbfSSafSSabrfSS均方误离差平方和相应自由度) 1() 1)(1(
34、111),(),(),(, 0:;, 0:0:;, 2 , 1, 0:0:;, 2 , 1, 0:030301,2, 1,2, 111,2, 1,2, 10312021101EBAeBABAEBeBBEAeAAaibjijaibjijjjiiffFMSMSFffFMSMSFffFMSMSFHHHHHHbjHHaiH成立,则有如果至少存在一个至少存在一个至少存在一个验双因素方差分析模型检.),(.),(.),(),(),(),(030201HffFFHffFFHffFFffFffFffFEBABAEBBEAAEBAEBEA,否定如果,否定如果,否定如果,查表得对于小概率 XXXXXXXXMSXj
35、iijijjjiie)(,2对应的参数估计为双因素方差分析模型,例例8.5 8.5 用用3 3种深翻,种深翻,4 4种施肥方案组成种施肥方案组成1212种育苗作业方式种育苗作业方式实验,所得实验数据如表所示。假定实验数据满足正态、实验,所得实验数据如表所示。假定实验数据满足正态、等方差条件试在检验程度等方差条件试在检验程度0.050.05下,分析深翻、施肥及其下,分析深翻、施肥及其它们之间的交互作用对苗木高度的影响?它们之间的交互作用对苗木高度的影响? 施肥A深翻BA1A2A3A3B152 43 3948 37 2934 42 3645 58 42B241 47 5350 41 3036 39
36、 4444 46 60B339 38 4236 48 4737 40 32 43 56 41;深翻对苗高无显著影响;施肥对油高无显著影响解:建立统计假设:2010HH油松苗高无显著影响。深翻与施肥交互作用对:30H00.1170889.1191222.48694.65450916.654981194.551694.65450888.660011306.1888694.6545067339, 3, 3, 4),(),(),(,211221221221112 BABATeBAaibjijBAbjjBaiiAaibjrkijkTeBAeBeABABASSSSSSSSSSSSSSabrTTrSSabr
37、TTaSSabrTTbrSSabrTxSSrbaffFffFffFFFF由题设知,确定计算51. 2)24, 6(,41. 3)24, 2(,01. 3)24, 3(406. 0/,495. 0/,769. 3/24, 6, 2, 3,3505. 005. 005. 0FFFfSSfSSFfSSfSSFfSSfSSFfffffeeBABABAeeBBBeeAAAeBABAT影响。无显著深翻交互作用对苗高均影响,而深翻、施肥与,即施肥对苗高有显著,而接受所以,拒绝由于03021005. 005. 005. 0,)24, 6(),24, 2(),24, 3(HHHFFFFFFBABA水平。水平为第
38、显著,这说明施肥较优显著其它水平差异均不水平差异水平与第的第多重比较法知仅有施肥经用交友水平。进行多重比较,以选出于是,需对施肥进一步3 43SNK 在现实问题中,处于同一个过程中的一些变量,在现实问题中,处于同一个过程中的一些变量,往往是相互依赖和相互制约的,它们之间的相互往往是相互依赖和相互制约的,它们之间的相互关系大致可分为两种:关系大致可分为两种: 相关关系表现为这些变量之间有一定的依赖关,但这种关系并不完全确定,它们之间的关系不能准确地用函数表示出来,这些变量其实是随机变量,或至少有一个是随机变量。他们之间相互依赖但又不能有一个确定另一个。因此,相关关系的分析根据研讨的目的不同分为相
39、关分析(平行分析)和回归分析(因果分析)。相关关系与回归关系相关关系与回归关系1确定性关系确定性关系函数关系;函数关系;2非确定性关系非确定性关系相关关系。相关关系。 相关关系举例相关关系举例 例如:在气候、土壤、水利、种子和耕作技术等条件例如:在气候、土壤、水利、种子和耕作技术等条件根本一样时,某农作物的亩产量根本一样时,某农作物的亩产量Y Y与施肥量与施肥量X X之间有一定的之间有一定的关系,但施肥量一样,亩产量却不一定一样。亩产量是一关系,但施肥量一样,亩产量却不一定一样。亩产量是一个随机变量。个随机变量。 又如:人的身高又如:人的身高Y Y与人的腿长与人的腿长X X之间具有一定的依赖关
40、之间具有一定的依赖关系,普通来说,身高越高,其腿越长,但身高一样的两个系,普通来说,身高越高,其腿越长,但身高一样的两个人的腿长不一定相等;同样腿长一样的两个人的身高也未人的腿长不一定相等;同样腿长一样的两个人的身高也未必一样,必一样,X X与与Y Y是一个随机变量。是一个随机变量。 农作物的亩产量与施肥量、身高与腿长之间农作物的亩产量与施肥量、身高与腿长之间的这种关系称为相关关系。在这些变量中,施肥的这种关系称为相关关系。在这些变量中,施肥量、年龄是可控变量,亩产量、血压是不可控变量、年龄是可控变量,亩产量、血压是不可控变量。普通在讨论相关关系问题中,可控变量称为量。普通在讨论相关关系问题中
41、,可控变量称为自变量,不可控变量称为因变量。自变量,不可控变量称为因变量。 相关关系的检验相关关系的检验在概率论中,我们曾经学过两个随机变量线性相关性强弱可利用相关系数来衡量。在知随机变量二阶矩的情况下,两个随机变量间的相关系数为)()(),(YDXDyxCovXY样本相关系数niiniiniiinnyyxxyyxxryxyxyxnYXDef121212211)()()(),( ,),(),(),(样本相关系数。,则下式规定的量称为次独立观测结果为的设随机向量)2()2()2()2()2/()1 ()2()2()2/()1 (0:),(22222220ntnntrPntnrrPntntnrrH
42、YXrXYXY使得下式成立:,可找到对于给定小概率有成立下,假设服从正态分布,在统计果的矩估计量。如是相关系数不难证明样本相关系数系不明显。线性相关关与,说明随机变量,则接受之,当样本实现使得线性相关关系明显;反与机变量,说明随,则否定所以,当样本实现使得于是有引入记号YXHnrrYXHnrrnrrPntnntnr00222)2()2()2(.)2()2()2()2(利用样本相关系数检验线性相关性,做判定。与比较,查对于给定的计算样本相关系数)2(. 3);2(. 2;. 1nrrnrr例例8.5 8.5 某项研讨需了解水稻种类播种至齐穗的天数某项研讨需了解水稻种类播种至齐穗的天数x x与播种
43、与播种至齐穗的总积温至齐穗的总积温y y之间能否有关系,实测如下数据,试以之间能否有关系,实测如下数据,试以此数据检验此数据检验x x与与y y的线性相关性强弱。的线性相关性强弱。 xi70.067.055.052.051.052.051.060.064.0yi1616.31610.91440.01440.71423.31471.31421.81547.11533.0线性相关显著。与,说明,由于查,从而样本相关系数为解:计算样本相关系数YXnrrrryyxxyyxxiiiiiii)2(798. 0)29(9594. 007.4906800.44420.447820.4478)(70.49068
44、)(00.444)(01. 091912912每月家庭可每月家庭可支配收入支配收入X X800 1100 1400 1700 2000 2300 2600 2900 3200 3500每月消费支出Y561 638 869 1023 1254 1408 1650 1969 2090 2299594 748 913 1100 1309 1452 1738 1991 2134 2321627 814 924 1144 1364 1551 1749 2046 2178 2530638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 14
45、08 1650 1848 2101 2345 2860 某社区家庭每月可支配收入和消费统计表某社区家庭每月可支配收入和消费统计表引例引例8.6回归分析回归分析回归关系与回归分析回归关系在相关关系中,假设关怀的是容易测定或控制变量X对变量Y的决议作用大小,将X看成一个普通变量,这时变量X与Y之间就成为回归关系。回归模型假设普通变量x与随机变量Y具有回归关系,那么Y除过受变量x的作用以外,还遭到控制不严厉和未知要素的作用。所以,x与Y应满足关系式)(xgY。随机误差,一般的干扰作用。称为意外因素对随机变量反映了数,回归函决定作用的大小,称为对随机变量反映了变量的回归模型。其中对普通变量该式称为随机
46、变量2)(, 0)()(DEYxYxxgxY对于回归模型,显然有2)(),()(YDxgxYE的回归方程。对普通变量,称为随机变量令xYxgy)(Yx回归方程反映了因变量回归方程反映了因变量 随自变量随自变量 的变化而变化的平的变化而变化的平均变化情况。均变化情况。xy()fy x1x2x3x()E Y x下图展示:观地用之间的回归关系,可直对普通变量随机变量xY回归模型分类;( )( )xxkkg xg x如果 是一个变量,则称回归模型为如果 是 维向量,则称回归模型为如果是变量的线性函数,则称回归模型为;如果是变量的非线性一元回归模型元回归模型。线性函数,则称回归回归模型曲线回模型为归模型
47、。回归分析研讨一个随机变量与一个或几个可控变量之间回归关系,从而找出回归关系的模型,用于预测、优化和控制,这种统计方法称为回归分析。回归分析主要处理三个问题:提供建立具有回归关系的变量之间的数学关系式(称为阅历公式)的普通方法;判别所建立的阅历公式能否有效,并从影响随机变量的诸变量中判别哪些变量的影响是显著的,哪些是不显著;利用所得到的阅历公式进展预测和控制。一元线性回归一元线性回归模型xYYxxY设普通变量 与随机变量 共处同一系统中, 的取值随的变化而变化,但 不能唯一确定 的取值,它们满足下列关系式,并称其为线归一元性回模型:xY10201(0,)N其中,为未知常数,称为; 为服从的随机
48、变量,称为随机误差。归数回系回归模型,显然有:,称其为回归方程。由令xy10),(21010 xNxY一元线性阅历回归方程及其建立各对象观测的样本:中随机抽取性回归模型。从该系统满足一元线与随机变量通变量设共处同一系统中的普nYx),( ,),( ,),(),(2211nniiyxyxyxyx为经验回归系数。其为经验回归方程,称。称的估计式就可以得到回归方程,那么,的估计回归系数如果能由样本出发建立1010101010,xyxy。值影响。以后将简其为以外因素对变量反映变量称为剩余离差平方和,其中QYxxyQQniii12101010),(10)(),(),(minarg),(10最小二乘法(T
49、he least square method)yxoyxo01()iiyxixxy,iix y0112()0niiiyx 1Q 201011(,)()niiiQyx 0Q 0112()0niiiiyx x 011011()0()0niiiniiiiyxyx x 011()niiiyx 011110nnniiiiiyx01110nniiiiynx1011nniiiiyxn101111nniiiiyxnn01yx011()0niiiyx 2011110nnni iiiiiiy xxx 011()niiiiyx x 2111110nnni iiiiiiy xyxxx 21111110nnnni ii
50、iiiiiiy xyxxxx 21111110nnnni iiiiiiiiy xyxxxx 2111111nnnni iiiiiiiiy xyxxxx111211nni iiiinniiiiy xyxxxx 11221niiiniix ynxyxnx 010101112()02()0niiiniiiiQyxQyx x 1112221101()()()nniiiiiinniiiixxyyx ynxyxxxnxyx 化简求解得niiniiynyxnx111,1其中 1niiiiix yx yxyxy 1niiix ynxy 1111nnnniiiiiiiix yx yxyxy 1()()niiix
51、xyy =112101()()()niiiniixxyyxxyx22111() ,() ,()()nnnxxiyyixyiiiiiLxxLyyLxxyy令101xyxxLLyx 某企业对车间某企业对车间9名学徒工进展调查,得到学徒工与每天产量名学徒工进展调查,得到学徒工与每天产量情况如下表,要求建立以日产量为因变量的回归方程。情况如下表,要求建立以日产量为因变量的回归方程。引例引例8.7回归分析回归分析编号123456789学徒期(年)0.5111.52222.52.5日产量(件)5080100130150170180220240建立阅历回归方程 01yx确定回归系数 和 : 01编号编号12
52、3456789x0.5111.52222.52.515y50801001301501701802202401320 x20.25112.254446.256.2529xy25801001953003403605506002550所以,所求的阅历回归方程为 87.50.83yx0113201587.50.8399yx 11221niiiniix ynxyxnx 2151320255093509987.54152999 一元线性回归有关检验离差平和分解21()niiUyy回归离差平方和21()niiiQyy剩余离差平方和yyLUQ21()nyyiiLyy总离差平方和ixiyiyyiyyiiyy01
53、 yxyxy离差平方和的分解离差平方和的分解 22iiiiyyyyyy 2211nniiiiiiyyyyyy221112nnniiiiiiiiiyyyyyyyy2211nniiiiiyyyy。,其中相应自由度分解为:式为:从而,离差平方和分解2, 1, 1nffnffffQULQUyyQUyyyy iiiiyyyyyy2221111()()nniixxiiUyyyxxyL2211122111()()2nniiiiiiyyxxxyyyxxyyQyyyyxxLLLLLLUyyLUQ回归显著性检验).2(/) 1 (/,. 0:; 0:222201110nQUQUHYxHHYx,相互独立,且与明成立条件下,可以证满足线性回归模型,在变量验统计假设线性回归关系就是要检是否客观存在与随机变量量共处同一系统中普通变F
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年综合类-中学化学(高级)-中学化学(高级)-第一章 高中化学课程内容及分析历年真题摘选带答案(5卷单选100题合辑)
- 外部学员培训管理办法
- 2025年综合类-中医外科学-疮疡历年真题摘选带答案(5卷单选100题合辑)
- 山西燃气许可管理办法
- 安徽乡镇土地管理办法
- 学前儿童进餐管理办法
- 大学技术合同管理办法
- 2025年综合类-一级注册建筑师-一级注册建筑师-第五章暖通空调历年真题摘选带答案(5卷单选100题合辑)
- 大学食堂自营管理办法
- 大气设备参数管理办法
- 护理人员职业防护课件讲义
- 减刑假释工作 全国获奖
- 耳鼻咽喉应用解剖与生理
- 西游记西游记
- RB/T 303-2016养老服务认证技术导则
- GB/T 32227-2015船用工作救生衣
- GB/T 22258-2008防伪标识通用技术条件
- GB 38454-2019坠落防护水平生命线装置
- FZ/T 01082-2017粘合衬干热尺寸变化试验方法
- 3、《广播电视音像资料编目规范-电视资料部分》标准设计及应用说明【精选文档】
- GB∕T 30074-2013 用电化学技术测量金属中氢渗透(吸收和迁移)的方法
评论
0/150
提交评论