经济学统计多元正态分布统计推断学习教案_第1页
经济学统计多元正态分布统计推断学习教案_第2页
经济学统计多元正态分布统计推断学习教案_第3页
经济学统计多元正态分布统计推断学习教案_第4页
经济学统计多元正态分布统计推断学习教案_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1经济学统计多元经济学统计多元(du yun)正态分布统计正态分布统计推断推断第一页,共83页。第1页/共83页第二页,共83页。第一节第一节 引言引言 第二节第二节 均值向量的检验均值向量的检验 第三节第三节 协差阵的检验协差阵的检验 第2页/共83页第三页,共83页。第3页/共83页第四页,共83页。n同的检验给出不同的统计量,而同的检验给出不同的统计量,而有关统计量的给出大多用似然比有关统计量的给出大多用似然比方法得到。由于方法得到。由于(yuy)多变量问多变量问题的复杂性,本章只侧重于解释题的复杂性,本章只侧重于解释选取统计量的合理性,而不给出选取统计量的合理性,而不给出推导过程

2、,最后给出几个实例。推导过程,最后给出几个实例。n为了更好的说明检验过程中统计为了更好的说明检验过程中统计量的分布,本章还要介绍量的分布,本章还要介绍HotellingT2分布和分布和Wilks分布的定分布的定义。义。第4页/共83页第五页,共83页。一一 单一变量检验的回顾及单一变量检验的回顾及HotellingT2分布分布二二 一个正态总体一个正态总体均值向量的检验均值向量的检验三三 两个正态总体均值向量的检验两个正态总体均值向量的检验四四 多个正态总体均值向量的检验多个正态总体均值向量的检验第5页/共83页第六页,共83页。第6页/共83页第七页,共83页。第7页/共83页第八页,共83

3、页。第8页/共83页第九页,共83页。第9页/共83页第十页,共83页。n例例3.1测量测量(cling)20名健康女性排汗量名健康女性排汗量x1、钠、钠含量含量x2 、钾含量、钾含量x3得表得表3.1。问健康女性。问健康女性x1 、x2 、 x3的均值是不是的均值是不是4、50、10? 第10页/共83页第十一页,共83页。排汗量排汗量x1钠含量钠含量x2钾含量钾含量x33.73.748.548.59.39.35.75.765.165.18.08.03.83.847.247.210.910.93.23.253.253.212.012.03.13.155.555.59.79.74.64.636

4、.136.17.97.92.42.424.824.814.014.07.27.233.133.17.67.66.76.747.447.48.58.55.45.454.154.111.311.3排汗量排汗量x1钠含量钠含量x2钾含量钾含量x33.93.936.936.912.712.74.54.558.858.812.312.33.53.527.827.89.89.84.54.540.240.28.48.41.51.513.513.510.110.18.58.556.456.47.17.14.54.571.671.68.28.26.56.552.852.810.910.94.14.144.144

5、.111.211.25.55.540.940.99.49.4第11页/共83页第十二页,共83页。n例例3.1的数学模型就是:的数学模型就是: 服从服从 要根据要根据20个样品做复合检验:个样品做复合检验: ),(321xxxx ),(N10504:,10504:32113210HHnXXX,21),(1pN0100:;:HHn其中其中(qzhng)0为已知为已知p维向量。维向量。第12页/共83页第十三页,共83页。第13页/共83页第十四页,共83页。第14页/共83页第十五页,共83页。第15页/共83页第十六页,共83页。第16页/共83页第十七页,共83页。n例例3.1测量测量(cl

6、ing)20名健康女性排汗量名健康女性排汗量x1、钠含量钠含量x2 、钾含量、钾含量x3得表得表3.1。问健康女性。问健康女性x1 、x2 、 x3的均值是不是的均值是不是4、50、10? 解:建立解:建立(jinl) 10504:,10504:32113210HH用用SAS, SPSS等软件等软件(run jin)都可算出都可算出 3.6276579 5.6400000- 1.8090526- 5.6400000- 1199.788421 10.01000001.8090526- 10.0100000 2.8793684,965. 94 .4564. 4SX74. 9)()(200102XS

7、XT44. 2)10. 0(90. 2)3*19/(*)320(17, 32FTF所以否定原假设,即在所以否定原假设,即在0.10显著水平下拒绝显著水平下拒绝 0H第17页/共83页第十八页,共83页。第18页/共83页第十九页,共83页。P值为值为0.0649,所以否定原假设,即在所以否定原假设,即在0.10显著显著水平下拒绝水平下拒绝 0H第19页/共83页第二十页,共83页。例例 3.2 为了研究日美两国在华企业对中国经营环境的评价为了研究日美两国在华企业对中国经营环境的评价(pngji)是否存是否存在差异,从两国在华企业对中国的政治、经济、法律、文化等环在差异,从两国在华企业对中国的政

8、治、经济、法律、文化等环境打分,得表境打分,得表3-2。试分析日美两国在华企业对中国经营环境的。试分析日美两国在华企业对中国经营环境的评价评价(pngji)是否存在差异?是否存在差异?美国企业号美国企业号政治环境政治环境X1X1经济环境经济环境X2X2法律环境法律环境X3X3文化环境文化环境X4X4美美1 16565353525256060美美2 27575505020205555美美3 36060454535356565美美4 47575404040407070美美5 57070303030305050美美6 65555404035356565美美7 76060454530306060美美8

9、 86565404025256060美美9 96060505030307070美美10105555555535357575第20页/共83页第二十一页,共83页。例例 3.2 为了研究日美两国在华企业对中国经营为了研究日美两国在华企业对中国经营(jngyng)环境的评价是否存环境的评价是否存在差异,从两国在华企业对中国的政治、经济、法律、文化等环在差异,从两国在华企业对中国的政治、经济、法律、文化等环境打分,得表境打分,得表3-2。试分析日美两国在华企业对中国经营。试分析日美两国在华企业对中国经营(jngyng)环境的环境的评价是否存在差异?评价是否存在差异?日本企业号日本企业号政治环境政治环

10、境Y1Y1经济环境经济环境Y2Y2法律环境法律环境Y3Y3文化环境文化环境Y4Y4日日1 15555555540406565日日2 25050606045457070日日3 34545454535357575日日4 45050505050507070日日5 55555505030307575日日6 66060404045456060日日7 76565555545457575日日8 85050656535358080日日9 94040454530306565日日10104545505045457070第21页/共83页第二十二页,共83页。),(4321XXXXX ),(xxN),(4321YY

11、YYY ),(yyN43214321yyyyxxxx一般情况下,考虑一般情况下,考虑 为取自为取自p维正态总体维正态总体 的一个样本,的一个样本, 为取自维正态总体为取自维正态总体 的一个样本。假定两组样本相互独立,且的一个样本。假定两组样本相互独立,且),(4321XXXX),(1pN),(4321YYYY),(2pNmiiniiYmYXnX111,1第22页/共83页第二十三页,共83页。第23页/共83页第二十四页,共83页。第24页/共83页第二十五页,共83页。第25页/共83页第二十六页,共83页。第26页/共83页第二十七页,共83页。第27页/共83页第二十八页,共83页。第2

12、8页/共83页第二十九页,共83页。第29页/共83页第三十页,共83页。第30页/共83页第三十一页,共83页。第31页/共83页第三十二页,共83页。例例3.2的解:作假设的解:作假设(jish) yxyxHH:;:105 .70405151,635 .304364YX756.6666666 928.8888888 434.4444444 227.2222222- 928.8888888 335.8333333 1.11111111 313.3333333- 434.4444444 1.11111111 756.6666666 918.8888888- 227.2222222- 313.3

13、333333- 918.8888888- 454.4444444 xS335.8333333 111.1111111- 426.9444444 0.83333333- 111.1111111- 050.0000000 2.77777778 419.4444444426.9444444 2.77777778 355.8333333 5.83333333 0.83333333- 419.4444444 5.83333333 355.8333333yS第32页/共83页第三十三页,共83页。所以日美两国在华企业对中国经营环境的所以日美两国在华企业对中国经营环境的评价存在显著差异。评价存在显著差异。

14、0H8625.29)()(101010*1012YXSYXT)01. 0(2214. 68625.29*)4*)210910/() 141010(15, 4FF第33页/共83页第三十四页,共83页。第34页/共83页第三十五页,共83页。0.0037P值为值为0.0037,水平下拒绝因而日美两国在华企,水平下拒绝因而日美两国在华企业业(qy)对中国经营环境的评价存在显著差异对中国经营环境的评价存在显著差异。 第35页/共83页第三十六页,共83页。第36页/共83页第三十七页,共83页。第37页/共83页第三十八页,共83页。n现在分析温度的变化对得率的影响。从平均得率来看,好象温度对得率是

15、有一现在分析温度的变化对得率的影响。从平均得率来看,好象温度对得率是有一定的影响,但详细观察一下数据就会发现问题,表现在:定的影响,但详细观察一下数据就会发现问题,表现在:n(1)同一温度下得率并不完全一样,产生这种差异的原因是由于试验过程中)同一温度下得率并不完全一样,产生这种差异的原因是由于试验过程中各偶然因素的干扰及测量误差所致,这一类误差称为试验误差,或随机误差。各偶然因素的干扰及测量误差所致,这一类误差称为试验误差,或随机误差。n(2)两种温度的率不同的试验中的倾向有所差别。如)两种温度的率不同的试验中的倾向有所差别。如65与与70相比,第一相比,第一产产65比比70好,而后二次好,

16、而后二次70比比65好。产生这种矛盾现象,显然也可能是好。产生这种矛盾现象,显然也可能是由于随机误差的干扰。由于随机误差的存在,对于不同温度下的得率的差异自由于随机误差的干扰。由于随机误差的存在,对于不同温度下的得率的差异自然要提出疑问,这差异是随机误差造成的呢,还是温度不同的影响。由于温度然要提出疑问,这差异是随机误差造成的呢,还是温度不同的影响。由于温度的不同而引起得率的差异我们称为组间误差或系统误差。的不同而引起得率的差异我们称为组间误差或系统误差。n上例全部上例全部15个数据参差不齐,它们个数据参差不齐,它们(t men)的差异叫总变差。产生总变差的原的差异叫总变差。产生总变差的原因有

17、两个因有两个n1) 随机误差随机误差 2) 系统误差系统误差 第38页/共83页第三十九页,共83页。第39页/共83页第四十页,共83页。 设因素设因素A取了取了M个水平,每个水平重复了个水平,每个水平重复了N次实验得到次实验得到MN个样本个样本(yngbn),在水平,在水平Ai下的第下的第 j 次实验结果(样本次实验结果(样本(yngbn))Xij 可以可以分解为:分解为:ijiijX 这里这里ij N(0,1)。)。为了为了(wi le)看出因素各水平影响的大小,将看出因素各水平影响的大小,将 Xij 再进行分解再进行分解, 令令 MiiM11 令令Miaii, 2 , 1第40页/共8

18、3页第四十一页,共83页。njmiaXijiij, 2 , 1;, 2 , 1显然显然(xinrn)ai之间有关系之间有关系01 Miiaai 表示水平表示水平(shupng) Ai 对实验结果产生的影响,它称做水平对实验结果产生的影响,它称做水平(shupng) Ai 的效应。的效应。方差分析模型就是建立在以下假定之下:方差分析模型就是建立在以下假定之下:njMiaXijiij, 2 , 1;, 2 , 101 Miia 1 , 0 Nij 1)2)3)第41页/共83页第四十二页,共83页。(一)参数估计(一)参数估计即通过即通过(tnggu)实验估计实验估计和和ai,其估计量记为和,其估

19、计量记为和和和ai 。令。令 MjijiN11 MiNjijMN111 则则 iiijiNjijiaaNXNX 111MiNjijiarX111这里这里(zhl)MNr 第42页/共83页第四十三页,共83页。取取 是是的一个无偏估计。的一个无偏估计。类似地可以推出类似地可以推出 的无偏估计是的无偏估计是Xiaia XXaii 此时方差分析模型可以此时方差分析模型可以(ky)改写为:改写为:ijiijlaXX 反映了误差反映了误差 。由于。由于 , , 均为已知故均为已知故可以通过样本求得。可以通过样本求得。ijlij ijXXia ijl第43页/共83页第四十四页,共83页。(二)统计检验

20、(二)统计检验如果因素如果因素A对指标有显著的影响,效应对指标有显著的影响,效应ai不全部为零,反之则全为零。不全部为零,反之则全为零。因此我们因此我们(w men)假设假设或或基本思想是将总变差进行分离,即系统误差和随机误差。基本思想是将总变差进行分离,即系统误差和随机误差。设:设:Stotal 总变差,即总变差,即mH210: MiNjMiNjiiijijXXXXXXStotal111122 )(2)(1122MiNjiiijiiijXXXXXXXX0:210maaaH第44页/共83页第四十五页,共83页。 MiNjMiNjiiijXXXX111122AESS 注:交叉项在线性假设下为注

21、:交叉项在线性假设下为 0。这里。这里(zhl)统计量统计量 MiMiiiiAaNXXNS1122 MiMiMiiiiiNaNaN11122 MiNjMiNjiijiijEXXS111122 第45页/共83页第四十六页,共83页。对它们对它们(t men)(t men)取期望值,利用取期望值,利用 有有 0 EEi 221 MaNSEiA 2 MNSEE 令令AASMS11 eESMNS 1则有则有 MiAiANaMNNSE12222 2 ESE第46页/共83页第四十七页,共83页。如果如果H0:成立,则:成立,则 ,从而,从而 与与 之比应近于之比应近于1,即,即 统计统计量量 F 值应

22、近于值应近于 1。如果因素。如果因素 A 对指标有显著的影响对指标有显著的影响 则则 将显著的大于将显著的大于1,这就是为什么可以,这就是为什么可以(ky)用统计量用统计量 F来进行检验因素来进行检验因素 A 是否显著的道理。是否显著的道理。由统计理论推知,在线性模型假设下,由统计理论推知,在线性模型假设下, 服从(服从(M-1)个自由度的)个自由度的 分布,分布, 服从(服从(NM)个自由的)个自由的 分布,且两者独立,从而分布,且两者独立,从而 服从以(服从以(M-1),(),(N-M)为自由度的)为自由度的F分布。分布。02 A ASESBASSF/ /AS)1(2 M /ES)(2MN

23、 BASSF/第47页/共83页第四十八页,共83页。15:11:2749iY(1,)AEMSFF anaMS0()( (1,)HpPFfP F anaf22(1)ASSn第48页/共83页第四十九页,共83页。方差分析表的一般方差分析表的一般(ybn)形式为:形式为:第49页/共83页第五十页,共83页。15:11:2751proc anova data= Manova 按多元分析的要求略去有任一缺失值的记录outstat=;指定统计结果输出的数据集名class;必需,指定要分析的处理(chl)因素model/选项;必需, 给出分析用的方差分析模型means/选项; 指定要两两比较的因素及比

24、较方法BY;FREQ;MANOVA H=效应 E=效应 M= 公式.; 指定多元方差分析的选项第50页/共83页第五十一页,共83页。15:11:2752输出(shch)的结果如下: Source DF SumofSquares MeanSquare FVal Pr F Model 2 119.8313867 59.9156933 14.32 .0001 Error 27 112.9711500 4.1841167 Total 29 232.8025367 第51页/共83页第五十二页,共83页。15:11:2753第52页/共83页第五十三页,共83页。15:11:2754第53页/共83页

25、第五十四页,共83页。15:11:2755第54页/共83页第五十五页,共83页。15:11:2756第55页/共83页第五十六页,共83页。15:11:2857第56页/共83页第五十七页,共83页。15:11:2858第57页/共83页第五十八页,共83页。第58页/共83页第五十九页,共83页。1) 无重复无重复(chngf)三因素方差分析三因素方差分析记三个因素分别为记三个因素分别为A,B,C,它们的水平数分别为,它们的水平数分别为a,b,c,样本记为:,样本记为:), 2 , 1;, 2 , 1;, 2 , 1(ckbjaixijk 令令 表示实验数据的总体均值,表示实验数据的总体均

26、值, 分别表示三分别表示三个因素各自的效应,而个因素各自的效应,而 分别表示因素分别表示因素A,B,C两两的混合效应,则多因素方差分析线性模型可表示为:两两的混合效应,则多因素方差分析线性模型可表示为: CkBjAiaaa,ACikBCjkABijaaa,ijkACikBCjkABijCkBjAiijkaaaaaax 这里这里(zhl), 独立同分布。独立同分布。), 0(2 Nijk第59页/共83页第六十页,共83页。我们我们(w men)的的 假设为:假设为:0H 00:0ACikBCjkABijCkBjAiaaaaaaH2)可重复)可重复(chngf)多因素方差分析模型多因素方差分析模

27、型在在 l l 次重复实验的情况次重复实验的情况(qngkung)(qngkung)下,多因素方差分析线性模下,多因素方差分析线性模型为:型为: ijklABCijkACikBCjkABijCkBjAiijkaaaaaaax 000:0ABCijkACikBCjkABijCkBjAiaaaaaaaH第60页/共83页第六十一页,共83页。一般对一般对 r 个因素(个因素( )的多因素方差分析中)的多因素方差分析中, 对于观察对于观察(gunch)值值的线性模型,有的线性模型,有 个各因素主效应,个各因素主效应, 个两两不同因素的交互效应,个两两不同因素的交互效应, 个(个(r-1)个因素的交互

28、效应以及随机误差项之和。)个因素的交互效应以及随机误差项之和。平方和分解平方和分解2 rriiix211rC2rC1 rrC ijkACikBCjkABijCkBjAiijkaaaaaax2)(min 在假设在假设(jish)(jish)之下,可得估计量。之下,可得估计量。 第61页/共83页第六十二页,共83页。 最小二乘估计最小二乘估计 AiaBjaCkaABijaBCjkaACika.X.XiX .XjX .XXk .XjXiXijX .XkXjXjkX .XkXiXkiX 三因素三因素(yn s)(yn s)方差分析各影响得估计量方差分析各影响得估计量 第62页/共83页第六十三页,共

29、83页。 分离分离(fnl)(fnl)总平方和为总平方和为 ijkEACBCABCBAijkSSSSSSSxx2.其中其中(qzhng) (qzhng) 为残差平方和项,我们可以得到三因素方差分为残差平方和项,我们可以得到三因素方差分析表析表 ES第63页/共83页第六十四页,共83页。第64页/共83页第六十五页,共83页。两因素两因素(yn s)方差分析方差分析anova2语法:语法:Two-way Analysis of Variance (ANOVA) p = anova2(X,reps) p = anova2(X,reps,displayopt) p,table = anova2(.

30、)p,table,stats = anova2(.)这里:这里:X:数据矩阵:数据矩阵reps:重复:重复(chngf)次数次数第65页/共83页第六十六页,共83页。数据数据(shj)的结构为:的结构为:下标第一位:下标第一位:A因素水平因素水平(shupng)数数下标第二位:下标第二位:B因素水平因素水平(shupng)数数下标第三位:重复次数下标第三位:重复次数本例的数据本例的数据(shj)为:为:3131 33 3533 353333 34 37 34 373434 36 37 36 3736 37 3836 37 383535 37 39 37 393636 39 40 39 403

31、939 38 42 38 4238 41 4438 41 44 A1 A2 A3B1B2B4B3第66页/共83页第六十七页,共83页。% 两因素两因素(yn s)方差分析方差分析X=load(e:dataanov_2.txt) % 读入数据读入数据p = anova2(X,2) % 求两因素求两因素(yn s)方差分析方差分析结果分析结果分析(fnx):A因素有显著性影响,因素有显著性影响,B因素有显著影响。因素有显著影响。AB的交叉因素则没有影响。的交叉因素则没有影响。第67页/共83页第六十八页,共83页。多因素多因素(yn s)方差分析方差分析anovan语法:语法:N-way ana

32、lysis of variance (ANOVA) p = anovan(x,group) p = anovan(x,group,Param1,val1,Param2,val2,.)p,table = anovan(.)p,table,stats = anovan(.) p,table,stats,terms = anovan(.) 例设三因素各有二水平例设三因素各有二水平(shupng),每个水平,每个水平(shupng)搭配下实验搭配下实验一次。一次。52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0 实验数据实验数据 1 2 1 2 1 2 1 2 A因素因素

33、 1 1 2 2 1 1 2 2 B因素因素 1 1 1 1 2 2 2 2 C因素因素第68页/共83页第六十九页,共83页。y = 52.7 57.5 45.9 44.5 53.0 57.0 45.9 44.0g1 = 1 2 1 2 1 2 1 2; g2 = 1 1 2 2 1 1 2 2; g3 = 1 1 1 1 2 2 2 2; p = anovan(y, g1 g2 g3, model, interaction,. varname,A,B,C)第69页/共83页第七十页,共83页。结果结果(ji gu)分析:从方差分析表中我们可以看出分析:从方差分析表中我们可以看出A因素对数据

34、具有显著影响,因为因素对数据具有显著影响,因为p=0.03470.05B因素对数据具有显著影响,因为因素对数据具有显著影响,因为p=0.00480.05AB因素对数据具有显著影响,因为因素对数据具有显著影响,因为p=0.0150.05BC因素对数据没有显著影响,因为因素对数据没有显著影响,因为p=0.50.05第70页/共83页第七十一页,共83页。4.4 多因素多因素(yn s)方差分析数据统一方差分析数据统一处理处理 上面两因素方差分析的例子中,数据文件的准备相当麻烦。我们上面两因素方差分析的例子中,数据文件的准备相当麻烦。我们统一统一(tngy)将变量将变量X,因素,因素A1,A2,AP看作变量,作为二维看作变量,作为二维数组的列,这样方差分析的数据为:数组的列,这样方差分析的数据为:第71页/共83页第七十二页,共83页。可以可以(ky)整理成数据文件名为整理成数据文件名为anon_2_2.txt,数据为:,数据为: 31

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论