统计推断详细论述_第1页
统计推断详细论述_第2页
统计推断详细论述_第3页
统计推断详细论述_第4页
统计推断详细论述_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实验11 统计推断题目1【问题描述】某厂从一台机床生产的滚珠中随机抽取 9 个,测得直径(mm)如下:14.6,14.7,15.1,14.9,14.8,15.0,15.1,15.2,14.8设滚珠直径服从正态分布,试自行给出不同的显著性水平,对直径的均值和标准差作区间估计。【问题求解】利用Matlab的统计工具箱及相关命令可以得到滚珠直径的均值和标准差的区间估计。在Matlab中编写代码如下:%-作业题11_1脚本M文件源程序-clear all;clc;% 输入滚珠直径数据x=14.6 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8;% 设定不同的显著性水平alpha=0.01:0.01:0.50;n=length(alpha);% 求出不同显著性水平下直径均值和标准差的点估计和区间估计for i=1:n mu(:,i) sigma muci(:,i) sigmaci(:,i)=normfit(x,alpha(i);end% 列出直径均值和标准差的点估计和区间估计mu,sigma,muci,sigmaci,【结果及分析】求解结果如下面的表1(选取部分下的数据): 表1:不同的显著性水平下的滚珠直径的均值和标准差的区间估计显著性水平均值区间估计标准差区间估计0.01(14.6843 15.1379)(0.1224 0.4946)0.05(14.7553 15.0670)(0.1370 0.3884)0.10(14.7854 15.0368)(0.1456 0.3469)0.20(14.8167 15.0055)(0.1569 0.3070)0.50(14.8634 14.9589)(0.1794 0.2547)由结果可见,显著性水平与置信区间估计的变化趋势是相反的,显著性水平越大,置信区间的大小越小。这与直观上的理解也是一致的。显著性水平代表的是不可信度(或者说置信水平1-代表的是估计的可信程度)。置信水平越大(即越小),估计的可靠性越高;而置信区间越小,估计的精度越高。因此两个指标的变化是相反的。通常,我们应当在一定的置信水平下选取尽量小的置信区间。另外需要说明,上面的区间估计实在正态分布总体的假定下作出的。本题的模型是生产的滚珠的直径数据,可以认为其总体的概率分布的类型是正态分布。【拓展思考、对比、分析】点估计的计算、验证(用不同方法)和分析可以借助本题研究一下参数估计中的点估计。点估计是在总体分布已知的前提下(对于本题模型而言总体是正态分布),用样本统计量确定总体参数的一个数值。用Matlab来求解时,可以直接利用normfit命令求解,也可以通过点估计的定义或性质编程求解加以验证。(1)直接利用normfit命令:前面列出的代码中已经包含了用normfit命令求解滚珠样本数据的均值点估计和标准差点估计的过程。以=0.05为例,得到的结果为mu=14.9111 sigma=0.2028即滚珠直径数据均值点估计为14.9111,标准差点估计为0.2028(2)利用Matlab统计工具箱求统计量的相关命令进行计算验证:根据课本上所讲的点估计的评价标准,可以证明,不论随机变量X总体分布如何,样本均值和方差都是总体参数和的一致无偏估计,所以总体均值和方差的点估计通常取因此可以利用Matlab统计工具箱求统计量的相关命令(mean和std)进行计算。运行如下代码:mu=mean(x)sigma=std(x)得到的结果为mu=14.9111 sigma=0.2028即滚珠直径数据均值点估计为14.9111,标准差点估计为0.2028(3)利用定义式求解:还可以通过样本均值和方差的定义式进行求解。运行如下代码:n=length(x)xbar=sum(x)/nspower=sum(x-xbar).2)/(n-1)s=sqrt(spower)得到的结果为xbar=14.9111 s=0.2028即滚珠直径数据均值点估计为14.9111,标准差点估计为0.2028综上,用不同方法计算得到的滚珠直径点估计值如下表2:表2:不同方法计算得到的滚珠直径的均值和标准差的点估计均值点估计标准差点估计直接利用normfit命令14.91110.2028利用求统计量相关命令14.91110.2028利用定义式14.91110.2028可见,求得的结果是一致的。利用推导式自编程序求解总体均值和总体方差的区间估计首先推导得到正态总体的前提下,总体均值和总体方差的区间估计的表达式:对于本题而言,总体方差是未知的,只好用样本方差代替,但对标准化后得到的不再服从N(0,1)。但根据上次上一章的分布和t分布的定义,可以证明因而可得到即在置信水平1-下,的置信区间为而的置信区间为根据(5)式和(6)式便可以自编程序分别求解总体均值的区间估计和总体方差的区间估计。以=0.05为例,编写代码如下:%-作业题11_1自编程序求解总体均值和总体标准差的区间估计-clear all;clc;x=14.6 14.7 15.1 14.9 14.8 15.0 15.1 15.2 14.8;alpha=0.05n=length(x);xbar=mean(x);% 按照(5)式求解总体均值的区间估计tt=tinv(1-alpha/2,n-1); % 求出t(n-1)的1-alpha/2分位数s=std(x);mu1=xbar-tt*s/sqrt(n);mu2=xbar+tt*s/sqrt(n);mu=mu1 mu2 % 列出总体均值的区间估计 % 按照(6)式求解总体标准差的区间估计xx1=chi2inv(1-alpha/2,n-1); % 求出chi2(n-1)的1-alpha/2分位数xx2=chi2inv(alpha/2,n-1); % 求出chi2(n-1)的alpha/2分位数s1=s*sqrt(n-1)/(xx1);s2=s*sqrt(n-1)/(xx2);s=s1 s2 % 列出总体标准差的区间估计得到结果为mu=( 14.7553 , 15.0670 ) s=( 0.1370 , 0.3884 )与前面直接用normfit命令得到的结果进行对比如下表3:表3:不同方法计算得到的总体均值和总体标准差的区间估计的结果对比()均值区间估计标准差区间估计直接利用normfit命令(14.7553 15.0670)(0.1370 0.3884)利用推导式自编程序求解(14.7553 15.0670)(0.1370 0.3884)可见,得到的结果是一致的。【本题小结】利用Matlab的统计工具箱及相关命令可以得到滚珠直径的均值和标准差的区间估计。不同的显著性水平下的滚珠直径的均值和标准差的区间估计求得的值见表1。由结果可见,显著性水平与置信区间估计的变化趋势是相反的,显著性水平越大,置信区间的大小越小。这与直观上的理解也是一致的。置信水平越大(即越小),估计的可靠性越高;而置信区间越小,估计的精度越高。作为拓展训练,可以借助本题的模型对点估计作一些分析和研究。用三种计算方法求得了总体均值和总体标准差的点估计。所得结果是一致的。作为对本实验的拓展训练和思考,分析和推导了总体均值和总体方差的区间估计的表达式,并利用该表达式自编程序求得了本题模型的总体均值和标准差的区间估计值。所得结果与直接用normfit命令求得的结果一致。题目22. 据说某地的汽油价格是115美分/gal,为了验证这种说法,一位司机开车随机选择了一些加油站,得到某年1月和2月的数据如下:1月 119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 1182月 118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125(1)分别用两个月的数据验证这种说法的可靠性;(2)分别给出1月和2月汽油价格的置信区间(=0.05);(3)如何给出1月和2月汽油价格差的置信区间(=0.05)。解:(1)模型建立:假设该地1月份汽油价格总体、2月份汽油价格总体都服从正态分布(事实上,下面的程序中进行了总体分布正态性检验,说明了这样假设的合理性)记0=115(美分/gal)设该地1月份汽油价格总体的均值为1,1月份汽油价格总体的均值为2(1,2单位均为美分/gal,下略)。对1月份汽油价格总体做假设检验:H0:1=0,H1:10对2月份汽油价格总体做假设检验:H0:2=0,H1:20取显著性水平=0.05编程如下:clear allx1=119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118; %1月份数据x2=118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125; %2月份数据h01=jbtest(x1) %正态性检验h02=jbtest(x1)h1,sig1,ci1=ttest(x1,115,0.05) %t检验h2,sig2,ci2=ttest(x2,115,0.05)输出结果:h01 =0h02 =0h1 =0,sig1=0.8642,ci1=113.3388 116.9612h2 =1,sig2=1.3241e-006,ci2=119.0129 122.4871h01 =0,h02 =0说明模型建立时设该地1月份汽油价格总体、2月份汽油价格总体都服从正态分布是合理的。h1 =0说明接受假设H0,即该地1月份汽油价格可以说是115(美分/gal)。h1 =1说明拒绝假设H0,即该地2月份汽油价格不是115(美分/gal)。事实上,由置信区间ci2=(119.0129,122.4871),115不在其中,2月份汽油价格高于115(美分/gal)。结论:显著性水平=0.05时,该地1月份汽油价格可以说是115(美分/gal),2月份汽油价格不是115(美分/gal)。(2)取显著性水平=0.05分别对1月份汽油价格总体的均值、2月份汽油价格总体的均值进行区间估计。编程如下:clear allx1=119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118; %1月份数据x2=118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125; %2月份数据mu1 sigma1 muci1 sigmaci1=normfit(x1,0.05)mu2 sigma2 muci2 sigmaci2=normfit(x2,0.05)输出结果:mu1=115.1500,sigma1 =3.8699,muci1 =113.3388 116.9612 ,sigmaci1 =2.9430 5.6523mu2 =120.7500,sigma2 =3.7116,muci2 =119.0129 122.4871,sigmaci2 =2.8227 5.4211结论:显著性水平=0.05时,1月汽油价格的置信区间muci1 =113.3388,116.9612,2月汽油价格的置信区间muci2 =119.0129,122.4871。(3)对题干数据条件有两种理解方式理解一:1月、2月对应数据为同一个加油站的数据。可以将1月、2月对应数据相减(x2-x1),作为总体1月和2月汽油价格差(2月汽油价格减去1月汽油价格)的样本数据。假设总体1月和2月汽油价格差服从正态分布,下面程序中进行了总体分布正态性检验。取显著性水平=0.05编程如下:clear allx1=119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118; %1月份数据x2=118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125; %2月份数据y=x2-x1;hy=jbtest(y) %正态性检验mu sigma muci sigmaci=normfit(y,0.05)输出结果:hy =0mu =5.6000,sigma =5.4715,muci =3.0393,8.1607,sigmaci =4.1610 7.9915hy =0说明假设总体1月和2月汽油价格差服从正态分布是合理的。mu =5.6000,muci =3.0393,8.1607分别为总体1月和2月汽油价格差的均值和置信区间。结论:如果1月、2月对应数据为同一个加油站的数据,显著性水平=0.05时,1月和2月汽油价格差(2月汽油价格减去1月汽油价格)为5.6000(美分/gal),置信区间为muci =3.0393,8.1607。理解二:1月、2月的数据完全随机,即1月、2月的数据之间没有对应关系。此时不能采用1月、2月对应数据的差作为新的数据。要用1月份汽油价格总体、2月份汽油价格总体2个正态分布总体在方差相等但未知下的t检验。取显著性水平=0.05编程如下:clear allx1=119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118; %1月份数据x2=118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 125; %2月份数据h,sig,ci=ttest2(x2,x1,0.05) %两个总体均值输出结果:h =1,sig =3.6952e-005,ci =3.1727 8.0273h =1说明拒绝假设1、2月两个总体均值一样,与0不在置信区间ci =3.1727 ,8.0273中是一致的。结论:如果1月、2月的数据完全随机,显著性水平=0.05时,1月和2月汽油价格差(2月汽油价格减去1月汽油价格)的置信区间为ci =3.1727 ,8.0273。可见,在1月、2月对应数据为同一个加油站的数据和1月、2月的数据完全随机两种情况下,即使显著性水平都取=0.05,1月和2月汽油价格差(2月汽油价格减去1月汽油价格)的置信区间也是不同的。讨论说明:1. 进行参数估计和假设检验时,通常模型建立时都假设了总体服从正态分布。虽然在许多情况下这个假定是合理的,但当要以此为前提进行重要的参数估计或假设检验时,或者人们对它有较大怀疑时,就有必要对这个假设进行检验。本题在程序中都进行了总体分布正态性检验,输出结果都为0,从而确保了模型建立的合理性。当然,本题在进行总体分布正态性检验用的是Jarque-Bere检验(jbtest(x),也可用Lilliefors检验(lilietest(x))。2. 本题第二问其实不必再用normfit做区间估计,因为第一问用ttest已经输出了置信区间。同样,第三问的理解一,也可用ttest求置信区间:y=x2-x1;h,sig,ci=ttest(y,0,0.05)输出h =1, sig =2.0582e-004, ci =3.0393 8.1607求得的置信区间ci =3.0393,8.1607与用normfit是一样的。另外,h =1说明拒绝假设1、2月没有价格差,与0不在置信区间中也是一致的。其实,在求解置信区间方面,normfit与ttest是等效的。3. 比较第一问和第二问,1月份汽油价格可以说是115(美分/gal)对应着115在1月汽油价格的置信区间muci1 =113.3388,116.9612中,而2月份汽油价格不是115(美分/gal),对应着115不在2月汽油价格的置信区间muci2 =119.0129,122.4871中。4. 第一问中,取显著性水平=0.05得到对1月份数据h1 =0,sig1=0.8642,对二月份数据h2 =1,sig2=1.3241e-006。sig(这里指sig1、sig2)给出的接收H0(此时sig)或拒绝H0(此时sig,sig2的关系未变,假设判断结论也都未变。只有当取0.8642时,才有h1=1,h2=1,即对1月份价格、对2月份价格都拒绝H0,但这时显著性水平太大,与假设检验中H0受保护(H0发生的可能性比较大)不符合。显著性水平应该取个较小的值,如0.05,但取得太小,如=mu2h2 sig2 ci2=ttest2(x1,x2,0.05,1)% 检验mu1=mu2h3 sig3 ci3=ttest2(x1,x2,0.05,-1)【结果及分析】求解的结果如下表4:表4:两总体均值假设检验结果h1(拒绝)0(接受)1(拒绝)sig0.03520.98240.0176ci(-0.4784 -0.0194)(-0.4381 Inf)(-Inf -0.0597)可见,在=0.05下拒绝:和:假设检验,接受:。故可以认为机床甲生产的滚珠直径小于机床已生产的滚珠直径。同时,输出参数sig给出了假设下的相应的概率;ci给出了对应的置信区间。【拓展思考、对比、分析】对显著性水平的分析显著性水平对结果可能产生影响。如果取不同的显著性水平,可以看到对应的结果如下:表5:不同显著性水平时两总体均值假设检验结果显著性水平0.010(接受)0(接受)0(接受)0.020(接受)0(接受)1(拒绝)0.051(拒绝)0(接受)1(拒绝)可以看到,显著性水平对结果可能产生影响,且随着显著性水平的增大,拒绝假设的可能性变大。这是由于显著性水平代表了统计推断中原本成立的被拒绝(即“弃真”,也即所谓“第一类错误”)的概率。假设检验中的显著性水平与参数估计中的显著性水平原理是一样的。当很小时,1-就很接近1,那么由样本计算出的数值就相对更容易落在使人接受的那个区域,因而对应的就更有可能被接受(而这时犯“第二类错误”的概率也会增大);而当相对较大时,1-相对来说远离1,这时由样本计算出来的数值落在使人接受的那个区域的概率就会变小,因而对应的被接受的可能性也变小,这时犯“第二类错误”的概率就会变小,但却使得“第一类错误”本来成立,但被错误拒绝的概率的概率增大。表5所显示的结果正反映了上述的分析结果。关于总体分布正态性检验的分析、对比进行假设检验时,通常总是假定总体服从正态分布。在许多情况下这个假定是合理的,但有时也需要对这个假设进行检验。对于本题的实际模型而言,的确是可以认为其总体服从正态分布的。可以利用本题的数据对总体分布正态性进行检验。Matlab主要提供了三种检验方法。其中Jarque-Bera检验适用于大样本;Kolmogorov-Smirnov检验只能做标准正态检验,因而本题不可以直接使用;而Lilliefors检验将Kolmogorov-Smirnov检验改进用于一般的正态性检验。选取Jarque-Bera和Lilliefors两种检验方法对本题两个机床所生产的滚珠直径数据进行总体分布正态性检验。运行如下代码:q1=jbtest(x1)q2=jbtest(x2)q3=lillietest(x1)q4=lillietest(x2)得到的结果为q1=0 , q2=0 , q3=0 , q4=0可见,对于两种检验方法,两个机床所生产的滚珠直径数据都通过了正态性检验。因此,可以认为总体是服从正态分布的。【本题小结】该题模型为两总体的假设检验模型,利用Matlab统计工具箱的相关命令可以求解。求解结果为:=0.05下拒绝:和:假设检验,接受:。故可以认为机床甲生产的滚珠直径小于机床已生产的滚珠直径。通过对显著性水平的实验分析可以看到,显著性水平对结果可能产生影响,且随着显著性水平的增大,拒绝假设的可能性变大。当很小时,对应的更有可能被接受,而这时犯“第二类错误”的概率也会增大;而当相对较大时,样本计算出来的数值落在使人接受的那个区域的概率就会变小,这时犯“第二类错误”的概率就会变小,但却使得第一类错误的概率增大。可以利用本题的数据进行总体分布正态性的检验。对于Jarque-Bera和Lilliefors检验方法,本题两个机床所生产的滚珠直径数据都通过了正态性检验。题目5【问题描述】甲方向乙方成批供货,甲方承诺合格率为90%,双方商定置信概率为95%。现从一批货中抽取50件,43件为合格,问乙方应否接受这批货物?你能为乙方不接受它出谋划策吗?【模型建立】本题为0-1分布总体均值的假设检验模型。由于本题一件产品只有合格品与不合格品之分,故用X=1表示合格品,X=0表示废品,可以说总体X服从0-1分布。若合格率为p,则容易计算X的期望=p,方差。虽然X不服从正态分布,但根据中心极限定理,当样本容量n充分大时,对样本均值有,近似地服从N(0,1),由此可对总体的合格率p作如下的假设检验利用正态总体均值的z检验,取N(0,1)的分位数。设样本的合格品率为,记,满足则假设检验的规则为当时接受;否则拒绝【模型求解:第(1)问】首先编写检验函数M文件(包括双侧和单侧检验,所有输入参数不可忽略):%-作业题11_5检验函数M文件源程序-%输入参数:mu:总体均值,xbar:样本数组均值,n:样本容量,alpha:显著性水平,tail:双侧和单侧检验的标识function h,sig=exf11_5(mu,xbar,n,alpha,tail)z=(xbar-mu)/sqrt(mu*(1-mu)/n);% 检验mu1=mu2if tail=0 u=norminv(1-alpha/2); sig=2*(1-normcdf(abs(z); if abs(z)=u h=0; else h=1; endend% 检验m1=mu2 if tail=1 u=norminv(1-alpha); sig=1-normcdf(z); if z=mu2 if tail=-1 u=norminv(alpha); sig=normcdf(z); if z=u h=0; else h=1; endend然后将题中所给数据代入,运行如下代码:%-作业题11_5第(1)问求解脚本M文件源程序-clear all;clc;% 输入题中数据% 总体均值mu=0.9;% 样本均值xbar=43/50;% 样本容量n=50;% 显著性水平alpha=0.05; % 检验方式tail=-1;% 调用自编假设检验函数求解h sig=exf11_5(mu,xbar,n,alpha,tail)运行结果为h = 0,sig = 0.1729即接受 可以认为这批货物的合格率大于等于90%,故乙方应接受这批货物。【第(2)问求解】若使乙方不接受该批货物,即,使得不被接受,则应改变如下几个量:置信概率;总体均值(合格率);所抽取的样本容量n。下面对这几个量进行独立分析:降低置信概率增大,其它量保持不变,求得使刚好不被接受的的值,运行如下代码:%-作业题11_5第(2)问求解:改变alpha-clear all;clc;mu=0.9;xbar=43/50;n=50;% 使alpha的值逐渐增大alpha=0.05:0.0001:0.50;m=length(alpha);% 求得使H0刚好不被接受的alpha值for i=1:m h sig=exf11_5(mu,xbar,n,alpha(i),-1); if h=1 break; endendalpha(i)运行结果为0.1729。即在其他量保持不变的情况下,若乙方不接受这批货物,则应使得显著性水平增大到0.1729以上,也即使得双方商定的置信概率降低到82.71%以下。增大总体均值(合格率)增大值,其它量保持不变,求得使刚好不被接受的的值,运行如下代码:%-作业题11_5第(2)问求解:改变mu-clear all;clc;xbar=43/50;alpha=0.05;n=50;% 使mu的值逐渐增大mu=0.9:0.0001:1;m=length(mu);% 求得使H0刚好不被接受的mu值for i=1:m h sig=exf11_5(mu(i),xbar,n,alpha,-1); if h=1 break; endendmu(i)运行结果为0.9223。即在其他量保持不变的情况下,若乙方不接受这批货物,则应使得甲的总体合格率为92.23%以上。提高抽检数n(假设样本均值不随n变化)增大所抽取的样本容量,假设样本均值不随n变化,同时其它量保持不变,求得使刚好不被接受的的值,运行如下代码:%-作业题11_5第(2)问求解:改变n-clear all;clc;mu=0.9;xbar=43/50;alpha=0.05;% 使n的值逐渐增大n=0.05:1:10000;m=length(n);% 求得使H0刚好不被接受的alpha值for i=1:m h sig=exf11_5(mu,xbar,n(i),alpha,-1); if h=1 break; endendn(i)运行结果为n=153。即在其他量保持不变的情况下,若乙方不接受这批货物,则应使得所抽取的样本容量大于等于153,即提高抽检数至153或以上(假设样本均值不变)。综上所述,若要使乙方不接受该批货物,则可以通过一下三种方式之一(其余量保持不变):(1) 使得双方商定的置信概率降低到82.71%以下;(2) 甲的总体合格率为92.23%以上;(3) 提高抽检数,使所抽取的样本容量达到153或以上。【拓展思考、分析、对比】各参量对假设检验的结果影响的分析刚刚通过计算得到了要使由被接受到被拒绝所对应的各量的变化。下面从理论上分析一下这些参量对假设检验结果的影响:(1)降低置信概率(也即增大显著性水平):由于显著性水平代表了统计推断中原本成立的被拒绝(即“弃真”,也即所谓“第一类错误”)的概率,因此,当变大时,置信概率1-相对来说更加远离1,这时根据抽检样品计算出来的均值(合格率)落在使人接受的那个区域(这个区域对应于前面所学的参数估计中的均值区间估计)的概率就会变小,因而对应的被接受的可能性也变小,这就使得本来成立,但被错误拒绝的概率的概率增大。因此,当增大到一定程度时,就能使得由被接受变为被拒绝。(2)增大总体均值(合格率):总体均值对假设检验结果的影响从直观上是很容易理解的:当样本均值小于总体均值时,这时候如果总体均值增大(其它量都不变),那么比小的程度就会变大,的可能性就会越小,故就越不容易被接受。(3)提高抽检数n:可以从假设检验的规则上进行分析。n增大后,减小(如果此时其它量不变的话),那么的可能性就会变小,被拒绝的可能性就会增大。这也是从直观上很容易理解的:提高抽检数即增大样本容量n后,样本更能反映该批货的均值,如果此时样本均值不变且小于总体均值,说明该批货的均值(即合格率)小于90%的可能性就变大,也即被拒绝的可能性增大。【本题小结】本题为0-1分布总体均值的假设检验模型。在题中的数据条件下求解结果为:接受 乙方应接受这批货物。要使乙方不接受该批货物,则可以通过一下三种方式之一(其余量保持不变):(1) 使得双方商定的置信概率降低到82.71%以下;(2) 甲的总体合格率为92.23%以上;(3) 提高抽检数,使所抽取的样本容量达到153或以上。可以从直观上、定义或物理意义上、统计量表达式、假设检验的规则上等多方面对各参量对假设检验的结果影响进行分析。定性分析的结果与Matlab计算的结果是一致的。题目77. 为研究胃溃疡的病理医院作了两组人胃液成分的试验,患胃溃疡的病人组与无胃溃疡的对照组各取30人,胃液中溶菌酶含量如下表(溶菌酶是一种能破坏某些细菌的细胞壁的酶)。(1)根据这些数据判断患胃溃疡病人的溶菌酶含量与“正常人”有无显著差别;(2)若下表患胃溃疡病人组的最后5个数据有误,去掉后再做判断。病人0.210.40.30.410.911.31.12.012.416.22.117.618.93.33.820.74.54.824.025.44.940.05.042.25.350.060.07.59.845.0正常人0.25.40.35.70.45.80.77.51.28.71.58.81.59.11.910.32.015.62.416.12.516.52.816.73.620.04.820.74.833.0解:(1)模型建立:假设总体患胃溃疡病人的溶菌酶含量和总体正常人的溶菌酶含量均服从正态分布。设总体患胃溃疡病人的溶菌酶含量的均值、方差分别为1,1,总体正常人的溶菌酶含量的均值、方差分别为2,2。设12=22且未知,则问题转化为做假设检验:H0:1=2,H1:12取显著性水平=0.05编程如下:clear all,clcx1=0.210.4 0.3 0.4 10.9 11.3 1.1 2.0 12.4 16.2 2.1 17.6 18.9 3.3 3.8 20.7 4.54.824.0 25.4 4.9 40.0 5.0 42.25.350.0 60.0 7.5 9.8 45.0; %病人数据x2=0.25.40.35.70.45.80.77.51.28.7 1.58.81.59.11.910.3 2.0 15.6 2.4 16.1 2.5 16.52.816.7 3.6 20.0 4.8 20.7 4.8 33.0; %正常人数据h sig ci=ttest2(x1,x2,0.05) %假设检验mu1=mean(x1)mu2=mean(x2)输出结果:h =1,sig =0.0251,ci =0.9886 14.3114mu1=15.3333,mu2=7.6833h=1说明拒绝H0,即患胃溃疡病人的溶菌酶含量与“正常人”有显著差别,而且由mu1和mu2的值或者置信区间知患胃溃疡病人的溶菌酶含量高于正常人。结论:患胃溃疡病人的溶菌酶含量与“正常人”有显著差别。(2)删除患胃溃疡病人组的最后5个数据.仍取显著性水平=0.05,编程如下:clear all,clcx1=0.210.4 0.3 0.4 10.9 11.3 1.1 2.0 12.4 16.2 2.1 17.6 18.9 3.3 3.8 20.7 4.54.824.0 25.4 4.9 40.0 5.0 42.25.3; %病人数据x2=0.25.40.35.70.45.80.77.51.28.7 1.58.81.59.11.910.3 2.0 15.6 2.4 16.1 2.5 16.52.816.7 3.6 20.0 4.8 20.7 4.8 33.0; %正常人数据 h sig ci=ttest2(x1,x2,0.05) %假设检验mu1=mean(x1)mu2=mean(x2)输出结果:h =0,sig =0.1558,ci =

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论