版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、抽样检验中样本容量的确定林鹤凯、宋明展、杨琨、孔京生摘要:在实验工作中,常遇到如何把握采集样本的容量的问题,本文结合实际,从三个方面论述如何求出一个既满足精度,又相对较小的样本容量。求解的主体思想,为区间估计,即给定区间范围从而求得最佳n值。另外,在假设检验中,本文从生产和检验双方考虑,得到两种不同的容量取值方法,在生产中具有一定意义。根据所做估计,本文用matlab编程进行了仿真实验。经失败实验的统计,当n>30的阶段实验,失败实验的次数小于5次,可以说实验的成功率为95%置信水平在0.05下的实验,从而仿真结果还是真实可信。关键词:参数检验、假设检验、最佳检3会、样本容量、matla
2、b实验验证1、问题简述:在实验工作中常遇到问题是如何把握采集样本的容量,如果容量n太小,估计问题不那么精确,检验问题就不太可靠;容量太大,又会造成人力物力的浪费。在此我们的就是要结合实际求出一个即满足精度又相对较小的样本容量。2、问题求解1:参数估计1、点估计以正态总体为例,有N(a,a2),已知。,有为其样本。a的无偏估计为广,且D(七)=。2/n,若要求D(E)<6,其中,s是已知常2数,则nACT/6,从而使估计可以更精确。2、区间估计以正态总体N(a,仃2)为例有:当。已知有g"(Ea)仃N(0,1)当仃未知有,n1(E-a)/Stna的置信水平为1-a的区间估计分别为
3、:U:./2(二.n)_a二u:/2(二n),t-/2(n-1)(S-n-1)-a-t/2(n-1)(S、n-1)假设检验(以参数检验为主)1、参数检验基本思想:假设总体X:N(a,。),其中仃已知,a未知,显著水平为a(1)提出假设,如:原假设H0:a=a。备选假设Hi:a#a°:1(2)构造统计量,该统计量满足一个已知的分布,如:u=('_a。)/(二/、,7)(3)构造拒绝域,如:u:N(0,1)从而|u|>U322、样本容量n确定的本质:(1)区间估计(2)根据接收域去求n的范围,显然n在满足的范围内越小越好3、原理及方法:(1)双侧检验:1)假设总体N:n(a
4、,cr),其中仃未知,a未知,显著水平为a原假设Ho:a=a。备选假设H1:a,a。可以得置信水平为1o(的区间估计G/2:(。/五),±+"/2付/)iu-;./2u;/2定义=U仪2(。/J£)为估计精度。2若事先给定值,则nMjuot/z7/)在有些问题中,构造的统计量所服从的分布函数与n有关,则我们需要采用试差法来如课本135页的形式,2)假设总体N:n(a,cr),其中仃、a未知,显著水平为a原假设H。=力°备选假设H会美h0aa0h1aa。构造统计mt=Jn1(a0)/S:t(n1),拒绝域tAtJn_1)进而求出其置信水平为1-a的区间估计
5、为EtJn-1):s/Jn1,E+t/n-1):s/Jn1I在给定后,我们可以得到2.22n=1+(s/)tjn-1),其中0=。.。5从t分布临界表中看到,对于显著水平"-。.°5的情形,当n>30时,其临界值tJn-1)2,这个临界值对于n>30各个n值的影响不太大,因此我们可以先采用近似公式n=1+(4s2/a2),若求得的n大大超过30,则与t/n_1)&2不矛盾了。否则采用试差法来确定n,其步骤为:a) 先用n=1+(4s2/i2)计算出nb) 再用上一步算出来的n作为t(n-1)中的n,将t(n-1)代入IOtIot2,22-n=1+(
6、67;/):t/n-1)求出新的n2:22c) 循环b)直至n=1+(s)t/n-1)两边n值相同或差异很小为止(2)单侧检验:假设总体之:N(a,。),其中仃已知,a已知,显著水平为a原假设H0:a=a0备选假设H1:a>a可以将备选假设转化为h1:a=a0+6,其中6为有实际意义的最小差值,也就是说如果a>a。+6,则我们可以直接认为在考虑随机因素的情况下a>a0由拒绝域u=Ya0)/(。/而)AUo(可以推出d/(a/Vn)>Ua2从而可得n>3u36),满足该式且最小的整数n极为最合理的样本容量注:(1)以上所讲的双侧检验的以及单侧检验的d均是由检验方制定
7、的精度(有利于检验方)以此来确定合理的n,这与实际情况是相符的。然而我们也应该看到,如果从利于生产方的角度来说,生产方显然希望n较小,这可以从直观上理解。当然这里的n有一个可以接受的2上限,以u检验为例,从接受域UIWUM2得到n£'Iaj二,即在这个-a0范围内检验是生产商乐于接受的(2)对于两个总体假设检验样本容量的确定参见课本138页,其思想与单参数假设检验样本容量的确定一致(3)对于非参数检验(以皮尔苏检验为例)可以求出1!22"2In笥-Xu(m1)+“(Xu(m-1)+Qvi:p1满足该式且最小的整数n极为最合理的样本容量4、例题某种电子仪器额定电流的总
8、体方差仃2ft200,经校验确定的置信水平0.95的置信区间的长度为20mA,问要检验多少台仪器,才能满足这样的要去?解:取s200,=10,由n=1+(4s2)可得n=9由于n<30,所以要使用试差法2.22查得临界值t0.05(8)=2.31,代入n=1十(s):tjn_1)得n=11.67-2-22又10.05(11)=2.20,代入n=1+(s/d)tJn1)得n=10,94因为10,94与11比较接近,所以不用在“试差”了,即样本容量为11最佳检验(两种错误发生的概率均已知)1、最佳检验的回顾(只考虑两点检验)两类错误:原假设H0;H1观察值T(X1,X2,,Xn)H0的否定域
9、为A0,a为置信水平第一类错误(弃真):PT三A0H0=a第二类错误(取伪):PT皂A0H1=P2、样本容量n确定的本质:(1) 控制两类错误在较小的范围内(2) 建立错误概率与分布函数的等式关系,求解n3、原理及方法(不同问题统一的作法)假设假设检验的参数为0,T(t;0)为满足Z分布的随机变量函数,t为样本的某个统计量,F(x,8)为T(七分布函数,Z二为Z分布的分为点。H0:6=a0,H1:日=a1的两点假设。第一类错误概率:PT(之8)wCoH0=口,及F(ZQ,a0)F(-°o,a0)=1-口(1)第二类错误概率:PT(t;0)Qo|Hi=1-P,及F(Zp,a1)F(-&
10、#176;o,a1)=P(2)解得n.举例:服从N(a,仃)分布,a未知,o已知,不妨设a1>a0,(否则按照书P130的例题8.4.4)。则对于假设H0:a=a0,H1:a=a1。最佳否定域应该为三之A,三服从N(a,仃/J;)分布。这里可知T(E;a0)=,7(E_a0)/cr,满足标准正态分布。令U=而±a。)/。,由第一类错误(1)与第二类错误(2)知PU之uj=a,PUEu=P。仃2之200U>u针故u=f(AaO)/仃,up=板(A一ai)/仃查表得两个分为点,从而解方程组得222n=(ua-ua/(a1-a0)。3、例题2某种电子仪器额定电流的总体方差仃*2
11、00,经校验确定的置信水平0.95的置信区间的长度为20mA问要检验多少台仪器,才能满足这样的要去?222斛:取S=200,4=10,由n=1+(s)tjn-1)可彳导n=9,由于n<30,所以要使用试差法22查得临界值too?)=231,代入n=1+(4s/A)n=10.68得n=11.67222又t0.05(11)=2.20,代入n=1+(S/)t4n1)得n=10.68由自由度10,得10.05(10)=2.23带入n=1+(:益=211.267n-1),得n=10.94因为10.94与10.68比较接近,所以不用在“试差”了,即样本容量为11。3、仿真实验2:给定分布函数,生成足
12、够多数据的随机数,通过观察分析这些随机数的统计量来仿真抽样,从而观察样本容量对抽样结果影响。为了方便操作,该实验使用标准正态分布函数。3.1 问题假设.假设随机变量方差未知,运用t-检验。.根据实际操作,样本容量不会太大,假设在60以内。.t005(n)知2.0,n之30,查表可知,假设n<10的部分,分为点2.4;10<n<30的部分,分为点为2.2;3.2 实验内容:(1),样本容量从5到60,分别生成随机数向量;(2).计算统计量,画出统计量的变化趋势;(3),设置t检验的置信水平为口的置信区间,每种样本容量进行100次实验,统计检验量落入接受域的实验的次数。3.3实验
13、结果(结果具有相似性,所以给出某次实验的结果)3.3.1实验的期望与方差,方差估计式为仃n2Sn-1,是方差的无偏估计。班M与方基一坨皿3.3.2失败统计(每种)3.4结果分析从期望方差图可以看出,统计量在预估值之间震荡,可解释为受随机因素的影响。同样给出此时的频数分布图可以看出,在样本容量不大的情况下,样本分布不接近正态分布,因此产生结果的随机性很明显,统计量没有收敛趋势。比如n取很大的时候才接近正态分布。率为95%置信水平在0.05下的实验,从而仿真结果还是真实可信。4、总结和体会1、我们在做参数估计等实验之前能够预估需要多大的样本容量才能达到实验目的,这对今后不管走上研究道路还是管理道路
14、都很有帮助。2、其实样本容量的确定,是一个十分重要的工作。正如在前文假设检验中所示,如果从生产方的角度考虑问题,自然希望n越小越好,样本容量有一个可接受的上限;而从检验方的角度考虑,n则是越大越好,在满足精度范围就要有一个起码的下限。说的功利一些,这里的n所取值是和一方的利益相关的,选取自然需要谨慎。3、我们在做实验时,是根据具体问题出发的,从而抽象出一个概念或模型,在做出这个模型后,还必须同具体问题进行对照,否则将无法对这个模型的准确性进行判断。这就帮助我们在今后做事时,也要注意同实际情况进行比较。n=11467样本容量在数理统计的多个方面都有体现,是一个与实践情况联系紧密的概念。我们组所研
15、究的假设检验中的样本容量确定,其实是一种提高假设检验“效率”的方式。事实求是的讲,我组所做成的结论是在一定简化基础上得到的,之后还可以有更多的研究。参考文献:1概率论及数理统计(第4版)下册.高等教育出版社:中山大学,2009.2何正风.Matlab概率论与数理统方t分析.机械工业出版社,2012.附录:matlab仿真程序n=60;N=0;ta=2.4;fori=5:ncleardh=0;forj=1:100d=randn(i,1);ksai(i-4)=mean(d);sgma1(i-4)=std(d);ssgma(i-4)=(i)*var(d)/(i-1);sgma2=sqrt(ssgma);t=sqrt(i-1)*ksai(i-4)/sgma1(i-4);ifi>=30ta=2.0;endif30>i|i>10ta=2.2;endif(t>ta|t<-ta)h=h+1;enden
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年CIT认证网络安全专家考试备考题库及答案解析
- 2025年公共关系学硕士备考题库及答案解析
- 商铺物业费代缴协议合同2025年版本
- 软件开发合同协议2025年验收标准
- 汽车租赁服务合同协议2025年
- 模特兼职2025年形象展示合同协议
- 2025年人力资源年度预算编制考试试题及答案
- 大修队修井架合同范本
- 夏令营辅导员合同协议
- 土地耕地出租合同范本
- 2025至2030年中国针式打印机行业市场竞争格局及投资前景展望报告
- GB/T 11239.1-2025光学和光子学手术显微镜第1部分:要求和试验方法
- 学前教育应聘
- 智能家具创投项目计划书
- 2024年河南省襄城县人民医院公开招聘医务工作人员试题带答案详解
- 国家集中带量采购政策培训
- 网页设计与开发(HTML5+CSS3) 课件 项目5 利用盒子模型布局网页
- 美国公立研究型大学学位项目评估的案例分析-朱永东
- 2025至2030年中国玉米淀粉行业市场现状分析及前景战略研判报告
- 船舶碰撞协议书
- 2024-2030全球手术动力刨削系统行业调研及趋势分析报告
评论
0/150
提交评论