假设检验与样本数量分析④——单比率检验、双比率检验_第1页
假设检验与样本数量分析④——单比率检验、双比率检验_第2页
假设检验与样本数量分析④——单比率检验、双比率检验_第3页
假设检验与样本数量分析④——单比率检验、双比率检验_第4页
假设检验与样本数量分析④——单比率检验、双比率检验_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、假设检验及功效和样本数量分析,单比率检验 双比率检验,功效和样本数量,Power and Sample Size Analysis,预备知识,总体研究的一类对象的全体组成的集合。 个体总体中的每一个考察的对象。 样本从总体中抽出的一部分个体的集合。 样本数量样本中包含的个体的数量,总体与样本,噢!这么多健身球, 应该全是合格的吧,从中抽出几个,测量一下。看看废品率,我们通过样本来了解总体 由样本信息作为总体信息估计值,统计推断是由样本的信息来推测总体性能的一种方法。 在通过样本获得一批数据后,要对总体的某一参数进行估计和检验,建立检验假设(如双侧检验,单样本,例如,我们想了解一种健身球生产过程

2、的不合格品率p是否为p02%,通过对样本的测量获得一批数据,然后对健身球不合格品率p进行推断,这是单样本检验的问题,H0:p p0 H1: p p0,H0:p 0.02 H1: p 0.02,不合格品率为2,不合格品率不是2,预备知识,总体与样本,2种健身球生产过程的不合格品率应该一样吧,我们通过2个样本来了解2个总体 由样本信息推断2个总体相比是否有差异,统计推断是由2个样本的信息来推测2个总体性能,推断特征相比是否有显著差异,建立检验假设(如双侧检验,双样本,例如,直径为65cm的健身球,新研制出健身球2#生产成本较低,如果生产过程的不合格品率与原来的1#产品一致,则用2#产品替代1#产品

3、。 通过对2个样本的测量获得两部分数据,然后对两种健身球(1#产品和2#产品)的不合格品率进行是否存在差异进行推断(或推断1#产品的不合格品率是否大或小于2#产品的不合格品率),这是双样本比率检验的问题,健身球1,健身球2,样本间的差异是由抽样误差引起的,样本与样本所代表的总体间存在显著差异,不合格品率无差异 不合格品率有差异,H0:p 1p 2 H1: p 1p 2,预备知识,二项分布的概念 二项分布(binominal distribution) 是一种重要的离散型分布。 数据属于只有两个可能结果的独立实验的结果,一个表示希望的“事件”,另一个表示“非事件”(每一观察只具有相互独立的一种结

4、果),如,通过与失败、合格与报废、有效或无效、是或否、0 或 1等。 通常,1代表抽到不合格品,0代表抽到合格品。 总体不合格品比率记作 p,样本不合格品比率记作,其中 n总体中随机抽取样本个数 X出现不合格品数,X =0,1,2,3,n,二项分布,p=0.1,n=5 概率分布图,n=30,n=50,n=100,p=0.1, n=30、50、100 二项分布的概率分布图形,预备知识,质量部门对一批 产品进行了检验,长期以来生产过程的不合格品率10%,检验员检测了5件产品(有放回抽样),求检验到的不合格品数,n = 总体中随机抽取样本个数 X = 出现不合格品数,二项分布的概率,不合格品数是0的

5、概率,0.59049,不合格品数是1的概率,0.32805,同理计算不合格品数为2、3、4、5的概率,0.59049,0.32805,0.0729,0.0081,0.00045,0.00001,n足够大,分布近似正态分布,预备知识,比率检验,比率检验,单比率检验 1 Proportion-test,一个总体,双比率检验 2 Proportion-test,精确检验 超几何分布,两个总体,Z检验 正态近似检验,精确检验 二项分布,Z检验 正态近似检验,总体 服从二项分布,两个总体 服从二项分布,Z检验的适用条件: 样本含量n足够大, 与 均大于5, 此时样本率的分布近似正态分布, 可利用正态分布

6、的原理作Z检验,当两样本含量n1及n2足够大, 及 均大于5 可根据正态分布原理,进行Z检验,Z检验的适用条件,单比率检验,单比率检验,统计量,式中,单比率检验 1 Proportion-test,样本含量n足够大,n :样本数 :样本的比率 p0:比率参考值,Z检验 正态近似检验,样本比率 = xn,其中x是观察到的”成功”数,单比率检验用于根据样本数据对总体比率进行推断,确定临界值,H1:p p0,H1:p p0,H1:pp0,双侧检验,左侧检验,右侧检验,单比率检验,单比率检验,显著性水平 与拒绝域,拒绝零假设,拒绝零假设,不拒绝H0范围,Z1- a/2,Z a/2,拒绝零假设,不拒绝零

7、假设,= 0.05,Z检验 正态近似检验,Z a,= 0.05,临界值,1-=95,Z1- a,不拒绝零假设,拒绝零假设,Z 0.975 =1.96,Z 0.025= -1.96,Z 0.05= -1.645,Z 0.95= 1.645,= 0.05,= 0.05,假设检验的例子(16,我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p02%,估计当前生产过程的不合格品率仍为2%。 随机抽取500个产品,测量得到不合格品数为9,建立检验假设,给定显著水平 = 0.05,1,2,计算统计量,3,双侧检验,H0:p 0.02 H1:p 0.02,n=500 x =

8、9,单比率检验,单比率检验,本例 样本比率提供了总体比率的估计值 样本比率 =xn =95000.018 比率参考值p00.02(2%) 1- p =0.982,-0.3194,接上页,如果| Z | =0.319 Z1- a/2,4,用算得的统计量与相应的临界值作比较,则拒绝原假设;否则无法拒绝原假设,单比率检验,反查正态分布表(右尾概率) Z临界值为: Z 0.025=1.96,Z 0.025=1.96,用算得的统计量与相应的临界值作比较 | Z | = 0.319 Z 0.025=1.96,5,作出不拒绝零假设的统计结论 即:当前生产过程的不合格品率仍为2,计算检验 P- 值,P(Z-0

9、.31 或Z 0.31) = 0.378 2 = 0.756,P = P(Z -0.31 及 Z 0.31) = 0.378 2 = 0.756,P= 0.748 = 0.05 按=0.05的水平无法拒绝零假设H0,查正态分布表查不到| Z | =0.3194,P = P(Z -0.32 及 Z 0.32) = 0.374 2 = 0.748,P(Z -0.32 及 Z 0.32) = 0.374 2 = 0.748, Z | 临界值、未落入拒绝域及P0.05是对应的 见下页图示,接上页,单比率检验,单比率检验,Z检验 正态近似检验,Z =1.96,Z = -1.96,0.025,0.025,

10、不拒绝零假设,拒绝零假设,拒绝零假设,临界值,临界值,双侧检验示意图(显著性水平与拒绝域,H0,1 = 0.95,Z= 0.319,Z= - 0.319,0.3747,Z = - 0.319 Z = 0.319,0.3747,P = 0.7494, Z | 临界值 则未落入拒绝域,此处Z的绝对值=0.319小于临界值1.96 样本观测值落在“不拒绝零假设”范围内, Z | 临界值 则P0.05(直观易见,此处Z的绝对值=0.319小于临界值1.96 假设检验的P值 = 0.7494,直观易见,0.05,0.7494, Z | = 0.319 P = 0.7494,检验功效和样本数量分析,评价检

11、验功效,假设检验的例子16,Z的绝对值=0.319小于临界值Z 0.025=1.96( P值= P = 0.7494 = 0.05 )出了不拒绝零假设的统计结论,当H0 为假时正确否定它的概率 (p = 1,双侧检验,Power = 1 ( 0.02-0.018+1.96 0.0063 ) /0.0059 +( 0.02-0.018-1.96 0.0063 ) /0.0059 = 1 ( 2.4319 )+( -1.7539) = 0.0075 +0.03972 = 0.0472,检验 功效 Power = 0.0472,双侧检验,单比率检验,Power = 1 ( ) + (,参考比率标准误

12、,样本比率标准误,将 P0 =0.02 、 =0.018 、Z /2 = 1.96(右尾概率分位数、当 = 0.05,0.0063,0.0059,及 p= 0.0063、Sp= 0.0059 代入上式,: 标准正态分布的累积分布函数,样本数量,假设检验的例子16中,如果总体比率实际为 0.02 但在样本比率=0.018时,则检测到差异的可能性为 4 .72% 如果我们仍然规定可以检测到的最小差值 =0.002,并希望功效 Power =0.9需要抽取产品样本多少个,将 Z /2 = Z 0.05/2 =1.96 、 Z = Z 0.1 =1.28及 P0 =0.02 、 =0.018 代入上式

13、,双侧检验,容许差值越小,需要样本量越大。(为使差值符合选择,有时需主观规定,检验功效和样本数量分析,双侧检验,单比率检验,接上页,sin-1:反正弦,三角函数采用弧度计算,公式中,48882.71733,需要抽取产品样本48883个,假设检验的例子(17,我们有一个公司生产继电保护装置,所在的主板生产中一次通过率只在97%。 为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。 为确定改进后主板的一次通过率是否97%。随机抽取800个产品,测量得到不合格品数为16,建立检验假设,1,单侧检验(左,H0:p 0.03 H1:p 0.03,希望被证明,单比率检验,n=800 x =16,样

14、本比率 =xn =168000.02 比率参考值p00.03(3,本例用不合格品率计算,可用正态近似检验,给定显著水平 = 0.05,2,计算统计量,3,-1.66,用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p,接上页,如果| Z | =1.66 Z1- a,4,用算得的统计量与相应的临界值作比较,则拒绝原假设;否则无法拒绝原假设,单比率检验,反查正态分布表(右尾概率) Z临界值为:Z = Z 0.05 =1.64,Z 0.05=1.64,用算得的统计量与相应的临界值作比较 | Z | = 1.66 Z 0.05=1.64,5,作出拒绝零假设的统计结论:不合格品率 0.0

15、3 即:改进后主板的一次通过率97,计算检验 P- 值,P(Z -1.66 ) = 0.048,P = P(Z -1.66 ) = 0.048,P= 0. 048 = 0.05 按=0.05的水平拒绝零假设H0,查正态分布表查到| Z | =1.66, Z | 临界值、落入拒绝域及P0.05是对应的 见下页图示,接上页,单比率检验,单比率检验,Z检验 正态近似检验,=0.05,拒绝零假设,不拒绝零假设,左侧检验示意图(显著性水平与拒绝域,H0,1 = 0.95,P = 0.048,Z = - 0.319 Z = 0.319,0.3747,左侧检验 Z = -1.66 Z-1.64 则落入拒绝域

16、,左侧检验 Z = -1.66 Z-1.64 则P= 0.0480.05 (直观易见,直观易见,0.05,0.048,Z= -1.66,P(Z -1.66 ) = 0.048,临界值 Z = -1.64,检验功效和样本数量分析,评价检验功效,假设检验的例子17中,检验功效有多大,当H0 为假时正确否定它的概率 (p = 1,左侧检验,Power = ( 0.03-0.02-1.64 0.00603 ) /0.00495 = 0.022384 =0.5089,检验 功效 Power = 0.5089(50. 89,左侧检验,单比率检验,Power = (,参考比率标准误,样本比率标准误,将 P0

17、 =0.03 、 =0.02 、Z = 1.64(右尾概率分位数、当 = 0.05,0.00603,0.00495,及 p= 0.00603、Sp= 0.00495 代入上式,样本数量,上页的例子中,检验功效 Power = 0.5089(50. 89%),如果我们仍然规定 =0.01差异可以检测到,并希望检测功效 Power =0.9需要抽取产品样本多少个?(Power =1- =0.9 即 = 0.1,将 Z = 1.64 、 Z = Z 0.1 =1.28 及 P0 =0.03 、 =0.02 代入上式,检验功效和样本数量分析,单比率检验,接上页,sin-1:反正弦,三角函数采用弧度计算

18、,公式中,2057.656537,需要抽取产品样本2058个,犯第II类错误 (当H0为伪时我们接受H0)的概率,左侧检验,或右侧检验,单比率检验,式中,单比率检验 1 Proportion-test,单比率检验用于根据样本数据对总体比率进行推断,精确检验 二项分布,不可以做正态近似检验,n = 总体中随机抽取样本个数 x = 出现不合格品数,二项分布概率,大多数教科书都使用正态近似方法,此处,补充阅读 仅为对精确检验进行手动计算的理解,精确检验,补充阅读,假设检验的例子(18,我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需

19、要,对现有培训模式做出优化并缩短培训周期。 为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下,建立检验假设,1,单侧检验(左,H0:p 0.92 H1:p 0.92,单比率检验,样本比率 =xn =48500.96 比率参考值p00.92(92,给定显著水平 = 0.05,2,计算概率值,3,不可以做正态近似检验,事件 = 合格,先计算大于48的单侧概率,根据二项分布,0.06725,0.01547,精确检验,接上页,由于计算小于等于48的单侧累积概率计算量较大,结论:P0.91728 = 0.05显著性水平,不拒绝H0。 即:不能拒绝改进后的培训通过率

20、0.92,4,单侧检验,单比率检验,0.06725,0.01547,计算p值,p值 = P X x | p = po,x=0、1、2、48,我们利用总概率等于1 计算小于等于48的单侧累积概率,1- 0.06725 - 0.01547 =0.91728,见前页计算大于48的(49、50)单侧概率,假设检验的例子(18,我们有一个公司对新员工的培养周期大约为60天左右,通过率(一次上岗,不需补习)一般在92%。为了适应目前公司的发展需要,对现有培训模式做出优化并缩短培训周期。 为确定改进后的培训通过率是否不低于92%。对50培训后的新员工的考核记录不记名整理如下,建立检验假设,1,单侧检验(右,

21、单比率检验,样本比率 =xn =2500.04 比率参考值p00.08(8 ,给定显著水平 = 0.05,2,计算概率值,3,不可以做正态近似检验,事件 = 不及格,先计算小于2的单侧概率,根据二项分布,0.06725,0.01547,例子(18)用不及格率计算,一般会将小数量值定义为p,H0:p 0.08 H1:p0.08,精确检验,接上页,结论:P0.91728 = 0.05显著性水平下不拒绝H0 即:不能拒绝改进后的培训不及格率 0.08,4,单侧检验(右,单比率检验,0.06725,0.01547,计算p值,与前两页(不能拒绝改进后的培训通过率 0.92)意义相同,p值 =P X x

22、| p = po,由于计算大于等于2的单侧累积概率 计算量较大,x=2、3、50,利用总概率等于1,1- 0.01547 -0.06725 =0.91728,见前页计算小于2的(0、1)单侧概率,检验功效和样本数量分析,单比率检验,精确检验,补充阅读,精确检验对于所有样本数量都是准确有效的,双比率检验,双比率检验 2 Proportion-test,Z检验 正态近似检验,两个总体服从二项分布,当两样本含量n1及n2足够大,Z检验的适用条件,可进行Z检验,大于5,大于5,统计量,式中,n1 :样本1个数 n2 :样本2个数,样本公共比率,其中X1和 X2 是样本1和样本2中的”成功”数,d :

23、两总体比率差值,样本1的比率 :样本2的比率,当检验两总体比率差值d=0时,式中,双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断,双比率检验,检验两总体比率差值 d =p1 p2 = 0,假设检验的例子(19,双侧检验,有两台波峰焊设备,1号设备生产的板件中随机抽取1600个产品,得到优等品的件数为320;2号设备生产的板件中随机抽取2000个产品,得到优等品的件数为360。 为确定两台波峰焊设备产出优等品率是否一致,采用双比率检验。 用显著性水平=0.05 进行检验,可用正态近似检验,大于5,大于5,x1n1 =32016000.2,x2n2 =36020000.18

24、,两总体”成功”比率合并估计值,样本1的比率,样本2的比率,0.189,H0:p 1-p2 =0 H1:p 1-p2 0,1,给定显著水平 = 0.05,2,计算统计量,3,建立检验假设,两个总体比率相等,两个总体比率存在差异,1.523,接上页,4,查临界值,反查正态分布表(右尾概率) Z临界值为: Z 0.025=1.96,Z 0.025=1.96,用算得的统计量与相应的临界值作比较 | Z |=1.523 Z 0.025=1.96,5,作出不拒绝零假设的统计结论 两台波峰焊设产出优等品率是一致的,计算检验 P- 值,P = P(Z1.52 ) = 0.067,P = P(Z -1.52

25、及 Z1.52 ) = 0.067 2 = 0.134,P值= 0.134 = 0.05 按=0.05 的水平无法拒绝零假设H0,查正态分布表 | Z | =1.52,双比率检验,双侧检验,/2=0 .025 双侧检验 临界值= 1.96,显著性水平 =0 .05、 /2=0 .025,右尾概率, Z | 临界值与P值0.05是对应的,两台波峰焊设产出优等品率是一致的,双比率检验,假设检验的例子(20,右单侧检验,有两台相同设备,1号设备和2号设备生产相同产品且质量无差异,工程师在2号设备换上新设计的刀具,由于新刀具使用价格较贵的合金材料;希望使用新刀具能使废品率有所下降,预计废品率至少会降低

26、0.5%。 使用原来刀具的1号设备生产的零件中和换上新刀具的2号设备生产的零件中各分别随机抽取3000个;经测量得出:1号设备生产的零件中废品数是75个,2号设备生产的零件中废品数是21个。 检验使用新刀具使废品率至少会降低0.5,可用正态近似检验,大于5,大于5,x1n1 =7530000.025,x2n2 =2130000.007,样本1的比率,样本2的比率,1,给定显著水平 = 0.05,2,计算统计量,3,建立检验假设,想要证明,Z = 4.023,样本 n1 = n2= n =3000,H0:p 1-p2 0.005 H1:p 1-p2 0.005,我们将预期效果(想要证明的假设)作

27、为备择假设H1,因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,拒绝是有说服力的,减少结论错误,两总体比率差值d不为时,接上页,4,查临界值,反查正态分布表(右尾概率) Z临界值为: Z 0.05=1.645,用算得的统计量与相应的临界值作比较 Z = 4.023 Z 0.025=1.645,5,使用原来刀具比换上新刀具生产的零件废品率多0.5%以上 或者说:“使用新刀具使废品率至少会降低0.5,双比率检验,0 .05 单侧检验 临界值= 1.645,显著性水平 =0 .05,Z 0.051=1.64 Z 0.049=1.65,结论:拒绝零假设,右单侧检验,0.05,0.0

28、5,临界值,拒绝 H0,1-=95,H0,Z (=0.05)= 1.645,1.645,Z = 4.023,4.023,计算检验 P- 值,P = P(Z=4.02 ) = 0.00003,查正态分布表 Z = 4.02,P值= 0.00003 = 0.05 按=0.05 的水平拒绝零假设H0,Z 临界值与P0.05是对应的,检验功效和样本数量分析,评价检验功效,计算在假设检验的例子20中的检验功效,先计算“使用原来刀具比换上新刀具生产的零件废品率多”的检验功效,当H0 为假时正确否定它的概率 (p = 1,Power,0.00229,0.00323,双比率检验,样本 n1 = n2 = n

29、= 3000,H1:p 1 p2,右单侧检验,右单侧检验,z= one-sided critical value (upper point of the standard normal distribution,将 、Z = 1.645 及 右面计算值代入上式,Power =1- ( 0.007-0.025+1.645 0.00229 ) 0.00323 =1- -4.40649 =0.99999,检验功效和样本数量分析,评价检验功效,计算在假设检验的例子20中的检验功效,计算“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的检验功效,当H0 为假时正确否定它的概率 (p = 1,P

30、ower,0.00229,0.00323,双比率检验,样本 n1 = n2 = n = 3000,右单侧检验,右单侧检验,z= one-sided critical value (upper point of the standard normal distribution,将 、Z = 1.645 及 右面计算值代入上式,Power =1- ( 0.007+0.05-0.025+1.645 0.00229 ) 0.00323 =1- -2.85864 =0.9977,H1:p 1-p2 0.05,检验功效和样本数量分析,评价检验功效,双侧检验,Power,双比率检验,左单侧检验,Power,

31、z= one-sided critical value (upper point of the standard normal distribution,H1:p 1 p2,H1:p 1 p2,样本 数量 n 是指每个组的,样本数量,将 Z = 1.645 、 Z = Z 0.1 =1.28 及 代入上式,检验功效和样本数量分析,sin-1:反正弦,三角函数采用弧度计算,公式中,2184.713656,需要抽取产品样本数量 n =2185个,单侧检验,左或右侧检验,双比率检验,计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的 检验,使用原来刀具生产

32、的零件废品率,如果使用新刀具生产的零件废品率比原来低0.013时,差异可以检测到,我们规定基线 比率 若希望检测功效 Power =0.9,需要抽取产品样本多少个,样本 数量 n 是指每个组的,样本数量,将 Z = 1.645 、 Z = Z 0.1 =1.28 及 代入上式,检验功效和样本数量分析,sin-1:反正弦,三角函数采用弧度计算,公式中,18414.18704,需要抽取产品样本数量 n = 18415个,单侧检验,左或右侧检验,双比率检验,计算在假设检验的例子20中的检验是“使用原来刀具比换上新刀具生产的零件废品率多0.5%以上”的 检验,使用原来刀具生产的零件废品率,如果使用新刀

33、具生产的零件废品率比原来低0.005(0.5%)时,差异可以检测到,我们规定基线 比率 若希望检测功效 Power =0.9,需要抽取产品样本多少个,样本 数量 n 是指每个组的,双比率检验样本数量的估计公式(2,将 Z = 1.645 、 Z = Z 0.1 =1.28 及 代入上式,1834.194,需要抽取产品样本数量 n = 1835个,32页上计算的样本 数量,n = 2185,用另一个公式计算一下,32页计算,n = 2185,用不同的的估计公式计算的样本 数量会有差异,双比率检验,样本数量,式中,双比率检验 1 Proportion-test,精确检验 Fisher 精确检验,不

34、可以做正态近似检验,大多数教科书都使用正态近似方法,此处,补充阅读仅为对精确检验进行手动计算的理解,精确检验,补充阅读,双比率检验,双比率检验用于根据两个随机样本中的数据对两个总体比率之间的差值进行推断,Fisher 精确检验基于超几何分布,N=批量事件数 M=批量中成功事件数 n= 观测数(不放回抽样) x = 观测出现成功事件数,超几何分布概率,补充阅读,超几何分布,超几何分布(Hypergeometric distribution) 是一种重要的离散概率分布,例如:有N件产品,其中M件为次品,抽检n件时所得次品数X=x的概率,它描述的是由有限个物件中抽出n个物件,成功抽出指定种类的物件的

35、次数(这里是指不放回抽样,如果是有放回抽样,概率分布属于二项分布,一批 产品20件,其中5件为优等品,检验员检测了4件产品(不放回抽样),求检验到优等品的概率分布,超几何分布的概率,优等品数是0的概率,0.28173,同理计算优等品数为1、2、3、4的概率,超几何分布,X=0,1,2,3,4,事件 = 优等品,N=20,M=5,n=4,X=0,1,2,3,4 超几何分布的 概率分布图,双比率检验,补充阅读,Fisher 精确检验,Fisher 精确检验基于超几何分布,Fisher 精确检验中原假设假定两个总体比率是相等的,H0:p 1= p2,假设检验的例子(21,有两台相同注橡设备,生产相同

36、老产品时,1号设备和2号设备生产产品质量无差异,投入新产品,工程师分别在1号、2号设备换上新设计的模具,2号设备新模具B使用可降低材料浪费(流道、飞边等);希望使用新模具B能与使用传统方法设计的新模具A 生产的部件在外观质量(关键质量)上相同。 由于每个部件的生产周期较长,不能收集大量数据,1号设备生产的部件16件,2号设备生产的部件15件,判断标准,优外观质量评分值大于等于90分,双比率检验,Fisher 精确检验,Fisher 精确检验中原假设假定两个总体比率是相等的,H0:p 1= p2,接上页,回顾,假设检验的基本思想是找到一个在原假设成立时的概率分布的检验统计量,再根据统计量的值是否

37、为小概率事件来判定原假设成立是否成立,每个事件(非优)出现的可能性相等,列出事件(非优)的所有取值 求出事件(非优)的每一个取值的概率,总样本量N= n1 + n2= 16 + 15=31 事件(非优)的所有取值M= x1 + x2= 6 + 4=10,Sample size = n1,补充阅读,双比率检验,Fisher 精确检验,接上页,列出事件发生的所有取值,在四格表周边和(即边际分布)计数固定不变的条件下,可得到多种不同组合的四格表。为方便起见,选定行合计与列合计(n1 、n2、M、N-M)均最小所对应的格子为基础。本例以i所在格子为基础,其取值的变动范围从0到对应的最小周边合计数。本例

38、i格可变范围为010,可得到11个四格表,Fisher 精确检验基于超几何分布,0,1,2,4,3,5,7,6,8,9,10,双比率检验,Fisher 精确检验,接上页,注:Fisher 精确检验基于超几何分布,求出事件(非优)的每一个取值的概率,总样本量N= n1 + n2= 16 + 15=31 事件(非优)的值M= x1 + x2= 6 + 4=10 Sample size = n1,四格表周边和(即边际分布)计数固定不变,本例中,i =0,1,2,3,M,我们用更一般的表达式 见下页,双比率检验,Fisher 精确检验,接上页,一般的表达,求出事件发生的每一个取值的概率,a =0,1,

39、2,3,a+c,见41页,11个四格表第一个:(0)号,本例中,0.000068,a 是0的概率,见41页,11个四格表第二个;(1)号,0.001806,a 是1的概率,0,1,双比率检验,Fisher 精确检验,接上页,求出事件发生的每一个取值的概率,同理运用上页公式计算a 数值为 2、3、10的概率并整理成表格如下,概率表,a、b、c、d组合见41页,11个四格表(0)(10)号,双比率检验,Fisher 精确检验,接上页,模具A生产的非优品比率为,设,模具B生产的非优品比率为,1,给定显著水平 = 0.05,2,计算P值,3,建立检验假设,H0:p 1=p2 H1:p 1p2,模具A

40、与B生产的部件在外观质量上相同,模具A 生产的非优品比率比 B 要大,在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值0.1083,上表中两组非优品比率差值,0.375-0.2667=0.1083,所有比上面样本表更极端的情况都应考虑进去,因为这些极端情况都可能发生,右单侧,p值 = F(a) = p6+p7+p8+p9+p10,计算累计概率,0.1083的有a= 6,7,8、9、10,0.246457 +0.117361+0.030469+0.003869+0.000181,0.398337,P值= 0.398337 = 0.05 按=0.05 的水平无法拒绝H0,右

41、单侧检验,P值:在H0成立时,出现目前状况或对原假设更不利状况的概率,双比率检验,Fisher 精确检验,1,给定显著水平 = 0.05,2,计算P值,3,建立检验假设,H0:p 1=p2 H1:p 1p2,模具A 与B生产的部件在外观质量上相同,在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值绝对值0.1083,上表中两组非优品比率差值的绝对值,0.375-0.2667|=0.1083,双侧,p值 = F(a) = 1- p5= 1-0.295749,计算累计概率,差值绝对值0.1083的有10组(发生的取值11种,0.704251,P值 0.05 按=0.05 的水

42、平无法拒绝H0,双侧检验,模具A 与B生产的部件在外观质量不同,上页的右单侧检验例子中,检验P值0.05无法拒绝H0 ;为了增多了解我们再来计算双侧检验P值,双比率检验,Fisher 精确检验,= 0.05,计算P值,在周边(合计数)不变的条件下,表内四个数据还有其它组合使其非优品比率差值0.1083,上表中两组非优品比率差值,0.375-0.2667=0.1083,左单侧,p值 = F(x1) = F(a) = p0+p1+p2+p3+p4+p5+p6,计算累计概率,0.1083的有: 当 a= 0,1,2、3、4、5、6,0.000068 + 0.246457,0.848122,P值= 0

43、.848122 = 0.05 按=0.05 的水平无法拒绝H0,左单侧检验,我们再来计算左单侧检验P值,H0:p 1=p2 H1:p 1p2,即先算出左侧与样本四格表情况及更极端情况的分表的概率累计,双比率检验,Fisher 精确检验,批量事件数N=n1 + n2=31 批量中成功事件数M= x1 + x2=10 观测数= n1=16 观测出现成功事件数x1= 6 (x1=0,1,2,、10,超几何分布的 概率分布图,当前x1= 6的概率0.246457,当前左单侧概率(不包括当前,当前右单侧概率 (不包括当前,双比率检验,补充阅读,Fisher 精确检验,发生的取值i 种(本例11种)中位数

44、记作xM(本例xM=5,回顾假设检验的例子(21,H1:p 1p2,p值 = F(x1) = p0+p1+p2+p3+p4+p5+p6,x1 = 6,x1 = 6,H1:p 1p2,p值 =1- F(x1-1) =1-(p0+p1+p2+p3+p4+p5,p6+p7+p8+p9+p10,H1:p 1p2,情形 1: x1 xM p值 = F(x1) + 1 - F(y - 1,y是小于xM最大整数,当p(y) p(x1,情形2: x1 xM p值 = F(y )+ 1 -F(x1- 1,y是大于xM最小整数,当p(y) p(x1,情形3: x1 = xM p值 = 1,p值 = F(y )+

45、1 -F(x1- 1) = p0+p1+p2+p3+p4+ 1-( p0+p1+p2+p3+p4+p5,本例 x1 = 6 xM=5,F(y,F(x1- 1,1- F(x1- 1,xM,xM,xM,x1 = 6,双比率检验,补充阅读,Fisher 精确检验,假设检验的例子(22,判断标准,某产品断裂强度执行新标准,工程师分别开发了两种材料配方, 为了解两种材料配方生产的产品在断裂强方面是否不同,A材料配方和B材料配方各生产了产品15件,新标准:12MPa,合格:大于等于13MPa,列出事件发生的所有取值,本例以x1 为基础,可变范围为0-7,可得到8个四格表,x1 = 1,8个四格表的组合,双

46、比率检验,补充阅读,Fisher 精确检验,a =0,1,2,7,本例中,0.003161,是0的概率,是1的概率,1,给定显著水平 = 0.05,2,A材料配方比B材料配方产品不合格率低,左单侧检验,H0:p 1=p2 H1:p 1p2,A材料配方和B材料配方生产的产品不合格率相同,p值 = F(x1) = p0+p1,3,计算p值,x1 = 1,0.036877,事件发生的每一个取值的概率,P值= 0.040038 = 0.05 按=0.05 的水平拒绝零假设H0,p值 = F(x1) = p0+p1 =0.003161+0.036877,0.040038,即:A材料配方比B材料配方产品不

47、合格率低,双比率检验,补充阅读,Fisher 精确检验,a =0,1,2,7,本例中,0.003161,是0的概率,1,给定显著水平 = 0.05,2,A材料配方比B材料配方产品不合格率要高,右单侧检验,A材料配方和B材料配方生产的产品不合格率相同,3,计算p值,x1 = 1,事件发生的每一个取值的概率,P值= 0.996839 = 0.05 按=0.05 的水平不拒绝零假设H0,p值 =1- p0 = 1-0.003161,0.996839,H0:p 1=p2 H1:p 1p2,练习右单侧检验,p值 =1- F(x1-1) =1-(p0,双比率检验,补充阅读,Fisher 精确检验,1,给定

48、显著水平 = 0.05,2,双侧检验,A材料配方和B材料配方生产的产品不合格率相同,3,计算p值,x1 = 1,P值= 0.080076 = 0.05 按=0.05 的水平不拒绝零假设H0,0.080076,练习双侧检验,H0:p 1=p2 H1:p 1p2,A材料配方和B材料配方生产的产品不合格率不同,p值 = F(x1) + 1 - F(y 1) = p0+p1+ 1-( p0+p1+p2+p3+p4+p5) = p0+p1+ p6+p7,y是大于xM最小整数,当p(y) p(x1)。 而 p(6) p(x1) 即:y是 6,本例 x1 = 1xM=3. 5,(0.003161+0.036

49、877) 2,双比率检验,Fisher 精确检验,如果两组数相等n1 = n2,则列出的超几何分布的 概率分布表是对称的,可以简化计算,即先算出一侧与样本四格表情况及比其更极端情况的分表的概率,再乘以2便为所求概率。 如果是单侧检验,只求与样本四格表情况相同及比其更极端情况一侧的概率,当前x1= 1的概率,当前左单侧更极端情况的概,左侧更极端情况的概率,当前右单侧更极端情况的概,n1 = n2分布对称,检验功效和样本数量分析,补充阅读,精确检验对于所有样本数量都是准确有效的,双比率检验,Fisher 精确检验,精确检验(直接计算概率法) 单比率检验 二项分布的概率计算法 双比率检验 超几何分布

50、的 概率计算法,样本含量n足够大, 与 均大于5, 可利用正态分布的原理作Z检验,当两样本含量n1及n2足够大, 及 均大于5 可根据正态分布原理,进行Z检验,双比率检验,直接计算概率法还是比较麻烦的,进行Z检验比较方便,书本上一般只是讲解 正态近似方法,单比率检验,双比率检验,使用Minitab统计软件计算 功效和样本数量,比率检验,单比率检验 1 Proportion-test,一个总体,双比率检验 2 Proportion-test,精确检验 超几何分布,两个总体,Z检验 正态近似检验,精确检验 二项分布,Z检验 正态近似检验,总体 服从二项分布,3,菜单操作,使用第9页上的例子,假设检

51、验的例子(16,我们长园集团有个公司的一台注塑机加工某种电缆附件产品,长期以来生产过程的不合格品率p02%,估计当前生产过程的不合格品率仍为2%。 随机抽取500个产品,测量得到不合格品数为9,双侧检验,n=500 x =9,单比率检验,单比率检验,给定显著水平 = 0.05,1,2,H0:p 0.02 H1:p 0.02,用Minitab统计软件计算是否拒绝 H 0,Stat Basic Statistics 1 Proportion,统计 基本统计量 单比率,Test and Confidence Interval for One Proportion Test of p = 0.02 v

52、s p not = 0.02 Sample X N Sample p 95.0 % CI Z-Value P-Value 1 9 500 0.018000 (0.006347, 0.029653) -0.32 0.749,双侧检验,4,5,对话框项操作,接上页,P值 = 0.05 无法拒绝零假设H0,输入观测事件数,输入成功事件数,6,输出结果分析,单击选项,选项对话框项操作,手工计算时 | Z | = 0.319,手工计算时 P值 = 0.7494,单比率检验,选汇总数据,备选假设选择 不等于,输入原假设比率,选正态近似用于假设检验,用Minitab作功效检测,1,菜单操作,点击选项,输入样

53、本数量,2,对话框项操作,功效分析,双侧检验,输入与原假设比率比较的比率,单比率检验,统计 功效和样本数量 单比率,Stat Power and Sample Size 1 Proportion,输入原假设比率,功效分析,双侧检验,4,接上页,3,选项子对话框项操作,备选假设 不等 选择此项执行双尾检验,显著性水平 () 默认值为 0.05,输出结果分析,单比率检验,Power and Sample Size Test for One Proportion Testing proportion = 0.02 (versus not = 0.02) Calculating power for p

54、roportion = 0.018 Alpha = 0.05 Difference = -0.002 Sample Size Power 500 0.05,手工计算时,Power = 0.0472,Power and Sample Size Test for One Proportion Testing proportion = 0.02 (versus not = 0.02) Calculating power for proportion = 0.018 Alpha = 0.05 Difference = -0.002 Sample Size TargetPower ActualPower

55、 49458 0.9000 0.9000,样本数量分析,双侧检验,4,接上页,输出结果分析,单比率检验,手工计算时,需要抽取产品样本48883个,例子16中,在样本比率=0.018时,则检测到差异的可能性为5 %(Power =0.05);如果我们仍然规定可以检测到的最小差值 =0.002,并希望功效 Power =0.9需要抽取产品样本多少个,如前两页,1,菜单操作,规定功效值 估算 样本数量,输入功效值,2,对话框操作,Stat Power and Sample Size 1 Proportion,输入样本的比率,3,选项子对话框项操作,如上页,备择假设选 不等,3,菜单操作,使用第14页

56、上的例子,单比率检验,单比率检验,Stat Basic Statistics 1 Proportion,统计 基本统计量 单比率,假设检验的例子(17,我们有一个公司生产继电保护装置,所在的主板生产中一次通过率只在97%。 为了提高主板的一次通过率,六西格玛项目组对流程进行了改进。 为确定改进后主板的一次通过率是否97%。随机抽取800个产品,测量得到不合格品数为16,单侧检验(左,n=800 x =16,样本比率 =xn =168000.02 比率参考值p00.03(3,本例用不合格品率计算,可用正态近似检验,1,H0:p 0.03 H1:p 0.03,希望被证明,给定显著水平 = 0.05

57、,2,建立检验假设,用Minitab统计软件计算,用通过率计算结果是一样的,不合格率是小数值,一般会将小数值定义为p,Test and Confidence Interval for One Proportion Test of p = 0.03 vs p 0.03 Sample X N Sample p 95.0 % CI Z-Value P-Value 1 16 800 0.020000 (0.010299, 0.029701) -1.66 0.049,4,5,对话框项操作,接上页,输入观测事件数,输入成功事件数,6,输出结果分析,单击选项,选项对话框项操作,手工计算时 | Z | = 1

58、.66,手工计算时 P值 = 0. 048,单比率检验,选汇总数据,备选假设选择 小于,输入原假设比率,选正态近似用于假设检验,P = 0.05 拒绝零假设H0,单侧检验(左,用Minitab作功效检测,1,菜单操作,点击选项,输入样本数量,2,对话框项操作,功效分析,输入与原假设比率比较的比率,单比率检验,统计 功效和样本数量 单比率,Stat Power and Sample Size 1 Proportion,输入原假设比率,单侧检验(左,功效分析,双侧检验,4,接上页,3,选项子对话框项操作,显著性水平 () 默认值为 0.05,输出结果分析,单比率检验,备选假设选择 小于 选择此项执

59、行左单尾检验,Power and Sample Size Test for One Proportion Testing proportion = 0.03 (versus 0.03) Calculating power for proportion = 0.02 Alpha = 0.05 Difference = -0.01 Sample Size Power 800 0.5064,手工计算时, Power = 0.5089,Power and Sample Size Test for One Proportion Testing proportion = 0.03 (versus 0.03) Calculating power for proportion = 0.02 Alpha = 0.05 Difference = -0.01 Sample Size Target Power Actual Power 2117 0.9000 0.9001,样本数量分析,双侧检验,4,接上页,输出结果分析,单比率检验,手工计算时,需要样本2058个,希望功效 Power =0.9需要抽取产品样本多少个,如前两页,1,菜单操作,规定功效值 估算 样本数量,输入功效值,2,对话框操作,Stat Power and Sample Size 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论