《数理统计》假设检验的一般问题_第1页
《数理统计》假设检验的一般问题_第2页
《数理统计》假设检验的一般问题_第3页
《数理统计》假设检验的一般问题_第4页
《数理统计》假设检验的一般问题_第5页
已阅读5页,还剩96页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

?数理统计?假设检验的一般问题3.1假设检验的一般问题假设检验是推断性统计学中的一项重要内容,它是先对研究总体的参数作出某种假设,然后通过样本的观察来决定假设是否成立参数假设样本观察假设检验具体的统计方法3.1.2假设检验根本原理小概率事件在一次试验中几乎不可能发生。假设检验的根本依据—小概率原理:3.1.2假设检验根本原理假设检验的根本思想

前提:成认原假设小概率事件发生大概率事件发生拒绝原假设接受原假设进行一次实验3.1.2假设检验根本原理显著水平与两类错误第一类错误:弃真〔显著水平α〕第二类错误:取伪显著水平与两类错误3.1.2假设检验根本原理对于一定的样本容量n,不能同时做到两类错误的概率都很小。如果减小α错误,就会增大犯β错误的时机;假设减小β错误,也会增大犯α错误的时机。使α、β同时变小的方法就是增大样本容量。一般地说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。但在假设检验中,一般均首先控制犯α错误概率。两类错误关系3.1.3假设检验的步骤一个完整的假设检验过程,通常包括以下四个步骤:提出原假设〔Nullhypothesis〕与备择假设〔Alternativehypothesis〕确定适当的检验统计量,并计算检验统计量的值规定显著性水平α作出统计决策3.2.1正态总体参数假设检验的步骤第一步:建立原假设H0和备择假设H1。原假设应该是希望犯第Ι类错误概率小的假设。常用的假设形式:正态总体参数的假设检验3.2.1正态总体参数假设检验的步骤第二步:选择检验用的统计量。u检验t检验F检验常用统计量3.2.1正态总体参数假设检验的步骤第三步:确定显著水平α的值,查相应的分布表得其临界值以及拒绝域。第四步:进行显著性判别。3.2.1正态总体参数假设检验的步骤3.2.1正态总体参数假设检验的步骤3.2.1正态总体参数假设检验的步骤3.2.2p-值的应用

p-值是一个概率值,它是用于确定是否拒绝H0的另一种方法。如果假定原假设为真,那么p-值是所获得的样本结果至少与实测结果不同的概率值。3.2.2p-值的应用例题:某商品标签上标明其重量至少为3公斤以上,现抽取36瓶该产品组成的一个简单随机样本,得其样本均值公斤,总体标准差为时,在显著性水平α=的情况下检验其商品标签所标内容是否真实?3.2.2p-值的应用求解过程:〔1〕原假设H0:μ≥3,备择假设H1:μ<3〔2〕检验统计量为:代入数据得:3.2.2p-值的应用求解过程〔续〕:〔3〕U=-所对应的p值为0.0038〔4〕<,所以拒绝H0。3.3.1单个总体比率的假设检验如果样本容量n与原总体比率时,用u检验法。3.3总体比率的假设检验3.3.1单个总体比率的假设检验[例3.2]某企业的备件库存标准有所调整。调整前的库存周转率为,今调查库存资料如下表〔〕3.3.1单个总体比率的假设检验求解过程:检验假设:由题意:3.3.1单个总体比率的假设检验求解过程〔续〕:统计量构造与计算查正态分布表结论:调整前后,该企业的库存周转率无显著差异。3.3.2两个总体比率的假设检验

&&比较两个总体比率有无显著差异时,如比较两种机车生产产品的次品率有无显著差异,可取容量n1、n2足够大,使得这样就可采用u检验法。详见下表6-3。3.3.2两个总体比率的假设检验3.4第二类错误概率例题:某种品牌电池标明其使用寿命为120小时,假设总体的标准差σ=12小时,现选取36节电池组成一个样本,显著性水平α=。检验假设:H0:μ≥120H1:μ<120构造统计量3.4第二类错误概率α=,例题〔续〕:假设检验的拒绝规那么:如果U<-,那么拒绝H0上述问题中,拒绝规那么为:3.4第二类错误概率例题〔续〕:时,拒绝H0

当时,接受H0。3.4第二类错误概率例题〔续〕:如果假定电池寿命的均值μ=112小时,当μ=112确实是真却接受了H0:μ≥120时,犯第二类错误的概率有多大呢?3.4第二类错误概率例题〔续〕:图6-2给出了当均值μ=112时,的抽样分布,其上侧阴影局部的面积为的概率。3.4第二类错误概率例题〔续〕:根据图6-2,计算得由标准正态概率分布表可知,当U=时,μ=112时,。3.5对总体均值进行假设检验时样本容量确实定检验假设:H0:μ≥μ0H1:μ<μ0

3.5对总体均值进行假设检验时样本容量确实定图6-3上半局部为当H0为真并且μ=μ0时的抽样分布。3.5对总体均值进行假设检验时样本容量确实定图6-3中下半局部为当H0为假时,总体均值的值,记作μ1。所以:得:3.5对总体均值进行假设检验时样本容量确实定由上面得到的公式可得α、β和样本容量n之间的关系:αβ和n之间关系当三者中有二者时,即可计算得到第三者。对于给定的显著性水平α,增大样本容量将会减少β对于给定的样本容量,减小α会使β增大,相反增大α将会使β减小。3.6非参数的假设检验 前两节的假设检验都是在总体的分布类型〔如正态分布〕下进行的。 但是在许多问题中,总体不一定是属于正态分布,甚至总体的分布未知。 为此,本节介绍统计上常用的不依赖于总体分布及其参数知识的检验——非参数检验〔NonparametricTests〕方法。3.6.1两个总体分布差异的检验 实际问题中,经常要检验两种不同的处理方法效果是否相同。 例如,比较在不同钻机、不同操作人员、不同地质条件下,钻机效率是否相同等等。 诸如此类问题是对两个总体的分布是否相同的检验。下面介绍两种简单易行的方法:“符号检验法〞和“秩和检验法〞。符号检验法〔SignTests〕 设两个总体X1,X2,它们的分布皆未知,以f1(x)和f2(x)分别表示两总体的概率密度。我们要检验f1(x)=f2(x)是否成立。

于是

H0:f1(x)=f2(x),H1:f1(x)≠f2(x)符号检验法〔SignTests〕 为此对两个总体分别独立地抽取m个元素,即得到m对数据: (a1,b1),(a2,b2),…,(am,bm) 如果f1(x)=f2(x)假设成立,那么ai>bi或ai<bi(i=1,2,…,m)应该有相同的概率〔1/2〕。且样本ai>bi与ai<bi的个数差异不应很大。符号检验法〔SignTests〕 令ai>bi的事件为yi,其取值为1,0 于是y=y1+y2+...+ym服从二项分布 根据二项分布计算出了比较ai>bi或ai<bi差异的临界值Sα(n)符号检验法步骤:比较样本数据求出n:n=n++n-在显著水平α下,根据n值查符号检验表得其临界值Sα(n)判别显著性ai>bi记为“+〞,“+〞的个数记为n+ai<bi记为“-〞,“-〞的个数记为n-ai=bi记为“0〞,“0〞的个数记为n0假设S0=min{n+,n-}<Sα(n),那么拒绝H0,接受H1;认为f1(x)与f2(x)有显著差异。假设S0=min{n+,n-}>Sα(n),那么接受H0,认为f1(x)与f2(x)无显著差异。A14.715.015.214.815.514.614.914.815.115.0B14.615.115.414.715.214.714.814.615.215.0符号A14.714.814.715.014.914.915.214.715.415.8B14.614.614.815.314.714.614.814.915.215.5符号秩和检验法

符号检验法的缺点:没有充分利用数据本身提供的信息,而且必须在数据成对时使用。 如果两样本数据不成对,那么可用秩和检验法。秩和检验法秩和检验法的做法: 建立H0和H1;将两组数据依从小到大次序〔秩号〕排列成表,如果有两个以上重复的数,那么取秩号平均数作为其秩。 取样本容量小的一组〔样本容量相同时,取平均数小的一组〕,其数据个数记为n1,那么另一组数据个数记为n2,将样本容量小的一组所对应的秩相加称为该组的秩和〔SumofRanks〕,记为T。秩和检验法 如果两个总体分布无显著差异,那么T值不应太大或太小。所谓太大或太小是比较而言,其比较值就是秩和检验表中的下限T1和上限T2(在给定的显著水平α下, 假设T1<T<T2,那么接受H0:f1(x)=f2(x),认为两总体分布无显著差异。 假设T>T2或T<T1,那么拒绝假设H0而接受H1:f1(x)≠f2(x),认为两个总体分布有显著差异。秩和检验法

秩和检验法的原理和符号检验法类似。 对于两个总体X1,X2,其概率密度为f1(x)和f2(x),从中分别独立抽取样本观测值a1,a2,…,am;b1,b2,…bn。如果f1(x)=f2(x)的假设成立,那么在将两个样本的观测值混合排列的次序中,某个秩数对应的数是ai和bi的概率应是相等的。秩和检验法 [例6.4]某药厂生产杀虫药品,检查两种配方药品杀虫的效果〔死亡百分数〕如下:

问两种配方杀虫效果有无显著差异?甲配方效果样本6765646867646970乙配方效果样本636264646568707169秩和检验法解: 将数据按秩号排列,并将数据少的甲组数据用绿色填充区别乙组数据秩号123456789数据626364646464656567秩号1011121314151617数据6768686969707071秩和检验法 甲组的秩和T=4.5+4.5+7.5+9.5+9.5+11.5+13.5+15.5=76 在α=下查秩和检验表,n1=8,n2=9时,T2=90,54=T1<T=76<T2=90,所以判定甲、乙两种配方的杀虫效果无显著差异。124.54.54.54.57.57.59.59.511.511.513.515.515.517

3.6.2总体分布的假设检验拟合优度检验法正态概率纸列联表的独立性检验

皮而逊定理离散型随机变量分布拟合检验

几点注意组数k是有限的,假设X的取值是无限个时,一定要分组.假设X取值是有限个,那么可将每个取值作为一个组,也可将X的取值作适当的分类.并组的原那么是对任何一组,理论频数不小于5.当理论分布有r个未知参数时,先用极大似然估计作出估计.此时自由度要减去r,变为k-r-1例某消费者协会为了确定市场上消费者对5种啤酒的喜好情况,随机抽取了1000名啤酒爱好者作为样本作如下试验:每个人得到5种品牌啤酒各一瓶,但未说明牌子,这5种啤酒按分别写作A,B,C,D,E字母的5张纸片随机的顺序送给每一个人,下表是根据样本资料整理得到的各种品牌啤酒爱好者的品数分布,试根据这些数据判断消费者对这5种品牌啤酒的爱好有无显著差异?(α=0.05)最喜欢的牌子ABCDE人数21031217085223[例6.5]盒中有5种球,重复抽取200次,〔每次抽1个球〕各种球出现的次数见下表。问盒中5种球的个数是否相等?显著水平。(1)拟合优度检验法

解: H0:“5种球的个数相等〞, H1:“5种球的个数不等〞。 由n=200,m=5,如果H0正确,那么每次抽得第i种球概率pi=1/5种别finpifi-npi(fi-npi)2/npi1234535404338444040404040-503-240.62500.2250.10.4∑20020001.35(1)拟合优度检验法

计算出

查表得: 接受H0,认为盒中5种球的个数相等。(1)拟合优度检验法

0123456789071218172013634问:可以认为X的分布为Poisson分布吗?01234567890.0130.0570.1230.1780.1930.1670.1210.0740.0400.0341.35.712.317.319.316.712.17.44.03.4071218172013634(1)拟合优度检验法:连续型分布的拟合检验

总体分布函数F(x)的类型F0(x)或概率密度 f(x)的类型f0(x)以及总体X的随机样本X1,X2,…,Xn。 H0:F(x)=F0(x)或H0:f(x)=f0(x) H1:F(x)≠F0(x)或H1:f(x)≠f0(x)用检验法进行检验,具体步骤如下: 〔1〕求出F0(x)或f0(x)中未知参数的估计值〔一般用最大似然估计值〕,从而写出F0(x)或f0(x)的具体表达式。 〔2〕按第二章的分组方法,把样本值分成m个区间〔a0,a1〕,(a1,a2),…(ai-1,ai),…,(am-1,am)。(1)拟合优度检验法

〔3〕求出样本观测值在每个区间(ai-1,ai)内的频数fi 〔4〕根据已写出的F0(x)或f0(x),计算出总体X在每个区间(ai-1,ai)中的概率值pi。(1)拟合优度检验法

〔5〕构造统计量

对于大样本,上述统计量近似服从自由度为m-r-1的分布〔r是分布函数概率密度函数中观测值估计的参数个数〕。(1)拟合优度检验法

〔6〕在给定显著水平α下查出分布表中的临界值,,那么拒绝原假设H0。,那么接受原假设H0。(1)拟合优度检验法

[例]在大豆品种Richland田间考察单株粒重的变异是否符合正态分布。考查数据归成次数分布表(如下),组距为5g,该分布的次数n、平均数、标准差均列于表基部。假设H0:观察分布符合理论分布,对HA:观察分布不符合理论分布。计算各组的理论次数:理论次数=理论频率(p)×总观察次数(n)第1组理论次数理论次数余类推,将计算结果列入表中:第2组单株产量次数(O)p理论次数(E)χ2组限(y)组中点0.5~5.537-26.43-2.0650.01954.51.395.5~10.585-21.43-1.6740.02776.30.2710.5~15.5137-16.43-1.2840.052512.02.0815.5~20.51818-11.43-0.8930.086319.80.1620.5~25.52332-6.43-0.5020.121927.90.6025.5~30.52841-1.43-0.1120.147733.81.5330.5~35.533373.570.2790.154535.40.0735.5~40.538258.570.6700.138631.71.4240.5~45.5432213.571.0600.106824.50.2645.5~50.5481918.571.4510.071216.30.4550.5~55.553623.571.8410.04059.31.1755.5~60.558628.572.2320.02014.60.4360.5~65.563333.572.6230.00841.90.6465.5~70.568138.573.0130.00141.00.00n=229=31.93s=12.80ν=14-3=11Χ2=10.47大豆单株粒重观察分布与理论正态分布的适合性测验查附表6,自由度为11时,χ2的概率P在范围内,观察分布与理论分布无显著差异,接受H0,说明大豆单株粒重的分布符合正态分布。Z=〔K-S检验法以下我们介绍具有概率密度的总体分布的柯尔莫哥洛夫检验法,它既可以检验经验分布是否服从某种理论分布,又可以检验两个总体是否为同一总体(斯米尔洛夫检验)编号123456789成绩7777898997989710468编号101112131415161718成绩80117107114103787791102试根据此数据判断HSME成绩是否服从正态分布?解:频数6810.0000.0400.0400.0157730.0550.1380.0830.0847810.2220.1550.0670.1238010.2780.1920.0860.1418920.3330.4150.0820.0299110.4440.4730.0290.0279720.5000.6440.1440.0339810.6110.6710.0600.00410210.6670.7680.1010.04610310.7220.7890.0670.01110410.7780.8100.0320.02310710.8330.8630.0300.02611410.8890.9460.0570.00211710.9440.9660.0220.034(2)正态概率纸 正态概率纸就是一种检验总体是否为正态分布的较直观易行的工具。 正态概率纸是由垂直于横轴,纵轴的假设干条直线构成的格纸。 横轴是按等份刻度,表示观测值x 纵轴表示正态分布累积概率值 纵轴是按非等分刻度,其目的是使服从正态分布的观测值在正态概率纸上的图形呈一条直线。正态概率纸的使用步骤:将样本观测值分组,且求出各组的频率和累积频率在正态概率纸上画出相应的点用直线连接各点每组区间右端点为横坐标,修正累积频率为纵坐标如果这些点根本在一条直线上,那么可以认为样本来自正态总体。中间的点应尽量地靠近直线,两端的点可以稍有些偏离。(2)正态概率纸(2)正态概率纸 [例6.6]某市1987年一次家庭收入调查中,随机地抽取50个家庭调查,其家庭人均月收入如下:〔元/人〕

试在显著水平下,用正态概率纸对该市家庭人均收入的分布进行假设检验。33233535.52632.3412938.5423154.2433426.5273740.13039.52836.543453146.342.852.149494052.73948.135583231.537281934.33859.532.84333504846(2)正态概率纸解: 将分组和累计频率值列入下表

分组频数累计频数15.25-20.2520.25-25.2525.25-30.2530.25-35.2535.25-40.2540.25-45.2545.25-50.2550.25-55.2555.25-60.25118121175321210223340454850修正累计频率1/512/5110/5122/5133/5140/5145/5148/5150/51(2)正态概率纸 以各组右端点值为横坐标,累计频率为纵坐标值。在正态概率纸上描点,如以下图:由图可见,9个点近似在直线上,所以,可以认为总体是正态分布。且,。1x1xi

pi•p1•pi•p•jp•1p•jyjy1XY

联合分布律及边缘分布律假设(X,Y)是离散型,那么上述独立性的定义等价于:那么称X和Y相互独立.对(X,Y)的所有可能取值(xi,yj),有nA1Ai

ni•n1•ni•n•jn•1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论