第3章 区间估计和假设检验_第1页
第3章 区间估计和假设检验_第2页
第3章 区间估计和假设检验_第3页
第3章 区间估计和假设检验_第4页
第3章 区间估计和假设检验_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第三章第三章 区间估计和假设检验目录区间估计和假设检验目录 n区间估计和假设检验区间估计和假设检验n3.1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计n3.2 均值、方差的假设检验均值、方差的假设检验n3.3 正态性检验正态性检验n3.4 非参数秩和检验非参数秩和检验n3.4.1 配对的符号检验配对的符号检验n3.4.2 成组数据的秩和检验成组数据的秩和检验返回返回2区间估计和假设检验区间估计和假设检验 n利用样本的信息对总体的特征进行统计推断,是统利用样本的信息对总体的特征进行统计推断,是统计学要解决的主要问题之一。计学要解决的主要问题之一。n它通常包括两类方面:一类是进

2、行估计,包括参数它通常包括两类方面:一类是进行估计,包括参数估计、分布函数的估计以及密度函数的估计等;另估计、分布函数的估计以及密度函数的估计等;另一类是进行检验。一类是进行检验。n在这里,首先利用在这里,首先利用SAS提供的提供的MEANS、UNIVARIATE和和TTEST等过程对应用广泛的正态总等过程对应用广泛的正态总体参数进行区间估计和假设检验,其次再来介绍对体参数进行区间估计和假设检验,其次再来介绍对观测数据的正态性进行检验,最后介绍一些常用的观测数据的正态性进行检验,最后介绍一些常用的非参数检验方法。非参数检验方法。 本章目录本章目录3区间估计和假设检验区间估计和假设检验1 正态总

3、体的均值、方差的区间估计正态总体的均值、方差的区间估计 区间估计区间估计是通过构造两个统计量是通过构造两个统计量 ,能以,能以 的置信度使总体的参数落入的置信度使总体的参数落入 区间中,即区间中,即 。其中。其中 称为显著性称为显著性水平或检验水平,通常取水平或检验水平,通常取 或或 ; 分别称为置信下限和置信上限分别称为置信下限和置信上限 ,)%1 (100,1P05. 001. 0,本章目录本章目录4区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 v对于单个子样而言,设对于单个子样而言,设 是取自是取自 的一个样本;的一个样本;v对两

4、个子样而言,设对两个子样而言,设 , 是分别取自是分别取自 和和 的样本的样本( 分别为二者的样本方差),则有分别为二者的样本方差),则有如下结论如下结论 ),(2N2,.,21nYYY),(121N),(222Nyxss22,nXXX,.,211,.,21nXXX5区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 nuX/2nuX/22nstXn/)(21nstXn/)(2122)()(2212nniiX)1()(2212nniiX)()1(2122nsn)1()1(2122nsn 待估待估参数参数置信下限置信下限置信上限置信上限备注备注

5、单单个个子子样样 已知已知 未知未知 已知已知 未知未知本章目录本章目录6区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 212221122)(nnuXY2221122)(nnuXY2212,212121222122/ ) 2()() 1()()(21nnnnnnsnsntXYyxnn212121222122/)2()() 1()()(21nnnnnnsnsntXYyxnn2212,2212)(21, 12221 nnyxFss)1 (21, 12221 nnyxFss2212, 待 估待 估参数参数置信下限置信下限置信上限置信上限 备注

6、备注两两个个子子样样 已知已知 未知未知 未知未知本章目录本章目录7区间估计和假设检验区间估计和假设检验1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计注:注: , , , 分别表示标准正分别表示标准正态分布,态分布, (自由度为(自由度为 ),),-分布分布( 自 由 度 为( 自 由 度 为 ) , 分 布 ( 自 由 度) , 分 布 ( 自 由 度为为 )的上)的上 分位点。分位点。u)(1nt)(12n)(1, 121 nnF分布t1n21n1nF) 1, 1(21nn本章目录本章目录8区间估计和假设

7、检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n例例1n设某厂一车床生产的钮扣,其直径据经设某厂一车床生产的钮扣,其直径据经验服从正态验服从正态 , 。为了判断。为了判断其均值的置信区间,现抽取容量其均值的置信区间,现抽取容量n=100的子样,其子样均值的子样,其子样均值=26.56,求其均值,求其均值的的95%的置信区间的置信区间.),(20N2 .50本章目录本章目录9区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 SAS程序为程序为:data val1; xbar=26.56; sigma

8、=5.2;n=100; u=probit(0.975); delta=u*sigma/sqrt(n); l c l = x b a r - d e l t a ; ucl=xbar+delta;Run;proc print data=val1; var lcl xbar ucl;run;本章目录本章目录10区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 SAS程序为程序为其输出结果为其输出结果为: LCL XBAR UCL 25.5408 26.56 27.5792即总体均值的即总体均值的95%的置信区间为的置信区间为25.5408,27

9、.5792;本章目录本章目录11区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n例例2n检验某种型号玻璃纸的横向廷伸率。测得的数据如下检验某种型号玻璃纸的横向廷伸率。测得的数据如下 横向廷伸率横向廷伸率% 35.5 37.5 39.5 41.5 43.5 45.5 47.5 49.5 51.5 53.5 55.5 57.5 59.5 61.5 63.5频数频数 7 8 11 9 9 12 17 14 5 3 2 0 2 0 1现在要检验假设现在要检验假设 ,并求出其并求出其95%的置信区间。的置信区间。 65:00H本章目录本章目录12

10、区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 SAS程序为:程序为:data var22; input x fx; y=x-65;cards;35.5 7 37.5 8 39.5 11 41.5 9 43.5 9 45.5 12 47.5 17 49.5 1451.5 5 53.5 3 55.5 2 57.5 0 59.5 2 61.5 0 63.5 1;proc means data=var22 t prt clm; var y; freq fx;run;CLM表示要输出表示要输出95%95%置信区间置信区间 本章目录本章目录13区间

11、估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n输出结果:输出结果: 分析变量分析变量 : Y T- 统计量统计量 Prob|T| 95.0% 置信下界置信下界 95.0% 置信上界置信上界- -34.29 |t| fatpct Pooled Equal 21 -1.70 0.1031 fatpct Satterthwaite Unequal 20.5 -1.73 0.0980 Equality of Variances Variable Method Num DF Den DF F Value Pr F fatpct Folded F 1

12、2 9 1.29 0.7182本章目录本章目录其结论为其结论为:n所测不同性别的人的脂肪含量所测不同性别的人的脂肪含量没有显著差别。没有显著差别。17区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 本章目录本章目录注:例注:例3的数据特点是的数据特点是独立组样本独立组样本,检验方法是,检验方法是T检验检验。n独立组样本独立组样本T检验要求数据符合以下检验要求数据符合以下3个条件:个条件:(1)观察值之间是独立的;)观察值之间是独立的;(2)每组观察值是来自正态分布的总体;)每组观察值是来自正态分布的总体;(3)两个独立组的方差相等。)两个

13、独立组的方差相等。18区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 本章目录本章目录注:采用注:采用PROC CHART过程对独立组样本画直方图过程对独立组样本画直方图直方图有两种形态:垂直条形图和水平条形图,下面对例直方图有两种形态:垂直条形图和水平条形图,下面对例3画水画水平条形图,平条形图,SAS程序为:程序为:data bodyfat; input sex $ fatpct ; cards;男男 13.3 女女 22 男男 19 女女 26 男男 20 女女 16 男男 8 女女 12 男男 18 女女 21.7男男 22 女女

14、 23.2 男男 20 女女 21 男男 31 女女 28 男男 21 女女 30 男男 12 女女 23男男 16 男男 12 男男 24;PROC CHART DATA=BODYFAT ; hbar fatpct/group=sex; title “两组独立样本的水平条形图两组独立样本的水平条形图”;RUN;19区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 运行结果为:运行结果为:20区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n例例4 假定初生婴儿(男孩)的体重服从正态分

15、布,随机假定初生婴儿(男孩)的体重服从正态分布,随机抽取抽取12名新生婴儿,测其体重为名新生婴儿,测其体重为3100,2520,3000,3000,3600,3160,3560,3320,2880,2600,3400,2540。试给出新生婴儿体。试给出新生婴儿体重重方差方差的置信区间(置信度为的置信区间(置信度为95% )。)。 本章目录本章目录21区间估计和假设检验区间估计和假设检验 1 正态总体的均值、方差的区间估计正态总体的均值、方差的区间估计 n例例4 SAS程序为程序为data val2; input weight;cards;3100 2520 3000 3000 3600 316

16、0 3560 3320 2880 2600 3400 2540;proc means data=val2; output out=tval1 css=ss n=n;Run;data tval2; set tval1; df=n-1; xlchi=cinv(0.025,df); xuchi=cinv(0.975,df); lchi=ss/xuchi; uchi=ss/xlchi;Run;proc print data=tval2;var lchi uchi;run;本章目录本章目录niixx12)(22区间估计和假设检验区间估计和假设检验1 正态总体的均值、方差的区间估计正态总体的均值、方差的区

17、间估计 输出结果如下:输出结果如下: LCHI UCHI 70687.19 406071.51即方差的置信区间为:即方差的置信区间为:70687.19, 406071.51 本章目录本章目录23区间估计和假设检验区间估计和假设检验1 二项分布总体概率以及概率之差的区间估计二项分布总体概率以及概率之差的区间估计* 一、总体概率的置信区间一、总体概率的置信区间本章目录本章目录 从二项分布从二项分布B(,n)中随机抽取一份样本,若特定事件发生次数中随机抽取一份样本,若特定事件发生次数记为记为X,该事件的样本频率记为,该事件的样本频率记为P=X/n,则,则P因样本而异。因样本而异。小样本时,可根据小样

18、本时,可根据X的观察值查表确定总体概率的观察值查表确定总体概率的的95%或或99%的置信区间。的置信区间。大样本时(大样本时(n30),需利用),需利用P近似地服从正态分布的性质进行近似地服从正态分布的性质进行估计,即估计,即PNp,p(1-p)/n,其中,其中p为样本频率。此时,为样本频率。此时,总体概率总体概率的的(1-)置信区间为:置信区间为:/ )1 (,/ )1 (nppzpnppzp24区间估计和假设检验区间估计和假设检验1 二项分布总体概率以及概率之差的区间估计二项分布总体概率以及概率之差的区间估计* 二、二项分布总体概率之差的置信区间二、二项分布总体概率之差的置信区间本章目录本

19、章目录 设有两个二项分布设有两个二项分布B(1,n1)和和B(2,n2),当,当n1和和n2是大样本时,是大样本时,事件发生的频率事件发生的频率P1和和P2均近似地服从正态分布,两者之差均近似地服从正态分布,两者之差P1-P2也近似地服从正态分布,即也近似地服从正态分布,即其中其中p1和和p2为样本频率的观察值。据此,总体概率之差为样本频率的观察值。据此,总体概率之差1-2的的(1- )置信区间为:置信区间为:/ )1 (/ )1 ()(,/ )1 (/ )1 ()(2221112122211121nppnppzppnppnppzpp/ )1 (/ )1 (,2221112121nppnppN

20、PP25区间估计和假设检验区间估计和假设检验1 二项分布总体概率以及概率之差的区间估计二项分布总体概率以及概率之差的区间估计* 本章目录本章目录 例例5 某医院将病情类似的病人随机分成两组。第一组某医院将病情类似的病人随机分成两组。第一组48人,用人,用A药治疗,药治疗,30人治愈;第二组人治愈;第二组45人,用人,用B药,药,20人治愈。试分人治愈。试分别计算两种药总体治愈概率的别计算两种药总体治愈概率的95%置信区间以及两种药总体置信区间以及两种药总体治愈率之差的治愈率之差的95%置信区间。置信区间。Data ex5;n1=48;x1=30;n2=45;x2=20;p1=x1/n1;p2=

21、x2/n2;s1=sqrt(p1*(1-p1)/n1);s2=sqrt(p2*(1-p2)/n2);s12=sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2);a=probit(0.975);/*标准正态分布分位数标准正态分布分位数X1-a/2*/lp1=p1-a*s1;up1=p1+a*s1;lp2=p2-a*s2;up2=p2+a*s2;lp12=(p1-p2)-a*s12;up12=(p1-p2)+a*s12;proc print data=ex5;run;26区间估计和假设检验区间估计和假设检验1 二项分布总体概率以及概率之差的区间估计二项分布总体概率以及概率之差的区间估计

22、* 本章目录本章目录 例例5 某医院将病情类似的病人随机分成两组。第一组某医院将病情类似的病人随机分成两组。第一组48人,用人,用A药治疗,药治疗,30人治愈;第二组人治愈;第二组45人,用人,用B药,药,20人治愈。试分人治愈。试分别计算两种药总体治愈概率的别计算两种药总体治愈概率的95%置信区间以及两种药总体置信区间以及两种药总体治愈率之差的治愈率之差的95%置信区间。置信区间。故故1的的95%置信区间为置信区间为(0.488,0.762),2的的95%置信置信区间为区间为(0.299,0.589), 1-2的的95%置信区间为置信区间为(-0.019,0.381)。27区间估计和假设检验

23、区间估计和假设检验1 二项分布总体概率以及概率之差的比较二项分布总体概率以及概率之差的比较 本章目录本章目录Data a; do b=1 to 48; /*第一组第一组*/ c=1; if b19 then x=1;else x=0; /*30人治愈为人治愈为X=0,18人未治愈为人未治愈为X=1*/ output; end; do b=1 to 45; /*第二组第二组*/ c=2; if b0H0: Md(d)=0H1: Md(d)50)正正态近似法态近似法若|Z|Za/2,则,则拒绝拒绝H0 若|Z|Za,则,则拒绝拒绝H0若|Z|Za,则,则拒绝拒绝H055区间估计和假设检验区间估计和

24、假设检验 3 3 非参数秩和检验非参数秩和检验 3.1配对(成对)的符号检验配对(成对)的符号检验 n例例9(配对符号检验配对符号检验): 用二乙胺化学法与气相色用二乙胺化学法与气相色谱法测定车间空气中谱法测定车间空气中CS2的含量的含量(mg/m3),其测其测量值见表量值见表,问两法所得结果有无差别(检验水问两法所得结果有无差别(检验水平平0.1)? 两种方法测定车间空气中两种方法测定车间空气中CS2的含量(的含量(mg/m3)样品号样品号 1 2 3 4 5 6 7 8 9 10化学法化学法 50.7 3.3 28.8 46.2 1.2 25.5 2.9 5.4 3.8 1.0色谱法色谱法

25、 60.0 3.3 30.0 43.2 2.2 27.5 4.9 5.0 3.2 4.0本章目录本章目录56区间估计和假设检验区间估计和假设检验 3 3 非参数秩和检验非参数秩和检验 3.1配对(成对)的符号检验配对(成对)的符号检验 n例例9(配对符号检验配对符号检验)data cs2; input x y; diff=x-y;cards;50.7 60.0 3.3 3.3 28.8 30.0 46.2 43.2 1.2 2.2 25.5 27.5 2.9 4.9 5.4 5.0 3.8 3.2 1.0 4.0;proc univariate data=cs2 normal; var dif

26、f; run;本章目录本章目录57区间估计和假设检验区间估计和假设检验 3 3 非参数秩和检验非参数秩和检验 3.1配对(成对)的符号检验配对(成对)的符号检验 n例例9(配对符号检验配对符号检验)n输出结果为:输出结果为: M(Sign) -1.5 Pr=|M| 0.5078W:Normal 0.854817 PrW 0.0638从正态性检验的结果来看,在从正态性检验的结果来看,在0.1显著性水平下拒绝这两显著性水平下拒绝这两种方法所测数据的差值服从正态分布种方法所测数据的差值服从正态分布(0.0638 |Z| = 0.0003,说,说明这两组数据间有差别。明这两组数据间有差别。63区间估计

27、和假设检验区间估计和假设检验 独立组和成对组数据比较的总结独立组和成对组数据比较的总结 1、两组比较的方法、两组比较的方法 本章目录本章目录检验法检验法独立组独立组成对组成对组参数检验参数检验两样本两样本T检验检验成对差值成对差值T检验检验非参数检验非参数检验Wilcoxon秩和检验秩和检验Wilcoxon符号秩检验符号秩检验64区间估计和假设检验区间估计和假设检验 独立组和成对组数据比较的总结独立组和成对组数据比较的总结 2、两组比较的语句、两组比较的语句 检验法检验法独立组独立组成对组成对组参数检参数检验验两样本两样本T检验采用:检验采用:PROC TTEST;CLASS 分组变量名分组变

28、量名;VAR 因变量名因变量名;(见例(见例3程序)程序)成对差值成对差值T检验采用:检验采用:Dif=m-f;Proc univariate; Var dif;或:或:proc means t prt; var dif;(见例(见例8程序)程序)其结果观察其结果观察Pr|T|的概率值的概率值非参数非参数检验检验Wilcoxon秩和检验采用:秩和检验采用:PROC NPAR1WAY WILCOXON;CLASS I;VAR y;(见例(见例10程序)程序)Wilcoxon符号秩检验采用:符号秩检验采用:Dif=m-f;Proc univariate; Var dif;或:或:proc mean

29、s t prt; var dif;(见例(见例9程序)程序)其结果观察其结果观察Pr=|M| 或或Pr|T|的的概率值概率值65区间估计和假设检验区间估计和假设检验 4 4 正态性检验正态性检验 n判断总体的分布是否为正态总体的假设检验称为判断总体的分布是否为正态总体的假设检验称为正态正态性检验性检验。n从上面可以看出,许多统计结论是基于正态总体的,从上面可以看出,许多统计结论是基于正态总体的,因此如何来判断某样本是否来自正态总体就显得非常因此如何来判断某样本是否来自正态总体就显得非常重要。重要。n目前,正态性检验的方法很多,这里主要介绍目前,正态性检验的方法很多,这里主要介绍SAS中中常用的常用的分布拟合优度检验分布拟合优度检验,W检验检验和和偏度峰度检验偏度峰度检验,Q-Q图检验图检验等方法。等方法。本章目录本章目录66区间估计和假设检验区间估计和假设检验 4 4 正态性检验正态性检验 本章目录本章目录67区间估计和假设检验区间估计和假设检验 4 4 正态性检验正态性检验 本章目录本章目录68区间估计和假设检验区间估计和假设检验 4 4 正态性检验正态性检验 本章目录本章目录69区间估计和假设检验区间估计和假设检验 4 4 正态性检验正态性检验 n例例1111已知已知20名学生的各科平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论