假设检验(2013)2_第1页
假设检验(2013)2_第2页
假设检验(2013)2_第3页
假设检验(2013)2_第4页
假设检验(2013)2_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第7章 假设检验(2) 非参数检验 1. 推断一组数据的分布?推断一组数据的分布? 2. 两组数据是否相关,是否独立?两组数据是否相关,是否独立? 3. 两组数据是否有显著差异?两组数据是否有显著差异? 问题的提出: 问题1 某超市为了调查顾客对三种品牌矿泉水的喜好比某超市为了调查顾客对三种品牌矿泉水的喜好比 例,以便为下一次进货提供决策,随机观察了例,以便为下一次进货提供决策,随机观察了150150名名 购买者,并记录下他们所买的品牌,统计数据如下:购买者,并记录下他们所买的品牌,统计数据如下: 问顾客对这三种矿泉水的喜好是否存在显著差异?问顾客对这三种矿泉水的喜好是否存在显著差异? 品牌品

2、牌甲甲乙乙丙丙 人数人数615336 01231 11 :,: 33 HpppH至少一个比例超过 一、某些实际问题 问题2 某超市的库存管理员需要掌握商品的库存规律,某超市的库存管理员需要掌握商品的库存规律, 以便制定某商品的库存计划。为此,库存管理员统计以便制定某商品的库存计划。为此,库存管理员统计 了一年中每周需求量:了一年中每周需求量: 问每周需求量是否服从正态分布?问每周需求量是否服从正态分布? 需求量需求量 (件(件/ /周)周) 10202030304040505060607070808090 90100 周数周数21681712501 2 01 :( ,),:HX NHX 不服从

3、正态分布 问题3 某教育研究部门想研究大学生毕业后参加工作的表现 是否与上学的地区有关,为此调查了毕业一年后工作的大学 生800人。按东南、西南、西北、东北四个地区各200人进行 调查,然后请工作单位对它们的表现给予评价: 01 :,:HH工作表现与地区独立工作表现与地区不独立 工作表现工作表现 不满意不满意满意满意很满意很满意合计合计 地地东北东北2112158200 西北西北1813349200 区区东南东南1014743200 西南西南1813844200 合计合计67539194800 问两种饮料评分是否有显著差异? 问题4 某饮料商用两种不同配方推出了两种新的饮料,现抽 取了10位消

4、费者,让他们分别品尝两种饮料并加以评分,从 不喜欢到喜欢,其分数表示为110,评分结果如下: 012112 :( )( ),:( )( )HF xF xHF xF x 品尝者品尝者12345678 89 91010 A A饮料饮料10108 86 68 87 75 51 13 39 97 7 B B饮料饮料6 65 52 22 24 46 64 45 59 98 8 1 ( )F x 2 ( )F x 归纳问题: 012112 (3):( )( ),:( )( )HF xF xHF xF x 0010 (1):( ),:( )HX F xHXF x不服从分布 01 (2):,:HXYHXY与

5、独立与 不独立 1. 1. 分类数据的卡方检验分类数据的卡方检验 二、卡方拟合检验 收集分类数据的目的是分析在各类中数据的分布。收集分类数据的目的是分析在各类中数据的分布。 123 X ppp 甲乙丙 以问题以问题1 1为例。设矿泉水品牌为为例。设矿泉水品牌为X X, 问题的提出:假设某项指标问题的提出:假设某项指标X X被分成被分成r r类:类: 12 ,., r A AA 0 :,1,2,., ii HAp ir类所占的比例为 2 2 1 ) = r ii i i vnp np ( 皮尔逊提出如下统计量: 22 01 (1)Kr ii Av设 中实际频数为 , 0i Hnp在下,理论频数为

6、, 0ii Hvnp在下,实际频数 与理论频数应相差不大。 2 22 0 1 ) =(1)() r ii i i vnp nH np ( 并且,在下 H0的拒绝域为: 二、卡方拟合检验 2. 2. 分布的卡方拟合检验分布的卡方拟合检验 不妨设不妨设X X为连续,将为连续,将X X的取值区间的取值区间a, ba, b进行进行m m等分,等分,0 1 ,., m a aa 1, ,( ), n XXF x设样本来自总体 0010 :( )( ),:( )( )HF xF xHF xF x 统计区间统计区间a ai i, a, ai+1i+1) )上的样本频数上的样本频数vi , 表示实际频数,又计

7、算表示实际频数,又计算 1 iii pP aXa 0 010 ()( ) H ii F aF a 在下 0i Hnp在下,理论频数为, 2 2 1 ) = m ii i i vnp np ( 构造统计量 2 22 1 ) =(1) m ii i i vnp ml np ( 并且, 0( ) lF x其中, 为分布中未知参数个数。 二、卡方拟合检验 注意:注意: 二、卡方拟合检验 1. 1. 卡方统计量的另一种表达式:卡方统计量的另一种表达式: 2 2 1 = m i i i v n np 2. 2. 卡方拟合检验主要用于大样本场合,要求各类的观测卡方拟合检验主要用于大样本场合,要求各类的观测

8、频数不小于频数不小于5 5,往往需要把一些相邻类合并达到要求。,往往需要把一些相邻类合并达到要求。 3. 3. 区间的划分具有人为性。区间的划分具有人为性。 问题1 问顾客对这三种矿泉水的喜好是否存在差异?问顾客对这三种矿泉水的喜好是否存在差异? 品牌品牌甲甲乙乙丙丙 人数人数vi615336 01231 11 :,: 33 HpppH至少一个比例超过 理论频数理论频数505050 1219196 2 () ii vnp 2 1219196 = 505050 =2.420.183.926.52 2 0.95 =5.991另一方面,(2) 结论:拒绝结论:拒绝H0H0,顾客的喜爱存在差异。,顾客

9、的喜爱存在差异。 例2检查产品质量时,每次抽取检查产品质量时,每次抽取1010个产品检验,共个产品检验,共 抽取抽取100100次。得下表次。得下表: : 次品数次品数012345678910 频数频数35401851100000 01 :(10, ),:(10, )HXBpHXBp不服从 问次品数是否服从二项分布?(问次品数是否服从二项分布?( =0.05=0.05) 10Xp矩估计: 2 4 2 1 =100 i i i v np 2 0.95 =5.991另一方面,(2) 列表计算:列表计算: 首先对参数首先对参数p p进行估计。进行估计。 次品数次品数012=3 频数频数3540187

10、 10 X p 1 11 10 100 n i i px 10 0 1 0.1 1000 i i iv 理论频数理论频数 34.8738.7419.375.74 10 0 0.90.3487p 9 1 10 0.1 0.90.3874p 228 210 0.10.90.1937pC 3012 10.0574pppp 35.1341.316.738.54 2 i i v np 101.7 1001.7 结论:接受结论:接受H0H0,认为次品率服从二项分布,认为次品率服从二项分布B(10B(10,0.1).0.1). 问题2问每周需求量是否服从正态分布?问每周需求量是否服从正态分布? 需求量需求量

11、 (件(件/ /周)周) 10202030304040505060607070808090 90100 周数周数vivi21681712501 2 01 :( ,),:HX NHX 不服从正态分布 首先需要参数估计。首先需要参数估计。 组中值152535455565758595 周数*组中值3025210360935780375095 15218413618111214419611681 30428412166648171452220501681 2 () i xx 2 () ii v xx 9 22 1 1 () 1 ii i sv xx n 9 1 1 ii i xv x n i x n=

12、n=5252 xbar=xbar=54.0384654.03846 ssss= =236.3137236.3137 s=s=15.372515.3725 问题2问每周需求量是否服从正态分布?问每周需求量是否服从正态分布? 需求量需求量 (件(件/ /周)周) 10202030304040505060607070808090 90100 周数周数vivi21681712501 40541054 1040()() 15.415.4 PX 需求量需求量 (件(件/ /周)周) 1040405050606070 70100 周数周数vivi9817126 ( 0.91)( 2.86) 0.179 pi

13、pi0.1790.2160.2546 0.19940.148 npinpi9.4649.46411.2311.2313.2413.2410.3710.377.6967.696 2 5 2 1 =52 i i i v np 2.6638 2 0.95 =7.815另一方面,(5-2) 结论:接受结论:接受H0H0,每周需求量遵从正态分布。,每周需求量遵从正态分布。 1. 1. 列联表列联表 三、独立性检验 节目类型Y 年龄XABC合计 301203050200 3045107515100 45以上103060100 合计140135125400 例例 01 :HXYHXY与 独立,与 不独立 1

14、. 1. 列联表列联表 三、独立性检验 Y XB1Br A1 As n 实际频数表实际频数表 理论频数表理论频数表 Y XB1Br A1 As 1 ? ij p 11 v1r v 1s v sr v 1 v r v 1 v s v 11 np 1r np 1s np sr np 1 np s np 1 np r np 0 ( , )( )( ) XY HF x yFx Fy在下,, ijij pp pi j ijij pp p j i ij v v p nn 统计量及拒绝域统计量及拒绝域 2 2 11 () = sr ijij ij ij vnp np 22 01 (1)(1)Ksr 三、独立

15、性检验 2 2 11 2 () = ij sr ij ijij v v vn n v v n n 2 11 () = ij sr ij ij ij v v v n n v v 22 (1)(1)sr并且, Y XB1Br A1 As n 实际频数表实际频数表 11 v1r v 1s v sr v 1 v r v 1 v s v 特别地,当特别地,当r=2, s=2r=2, s=2时,时, 2 1112 21222 1212 = vv n vv v v v v 22 01 (1)K 三、独立性检验 22 (1)并且, 问题3 某教育研究部门想研究大学生毕业后参加工作的表现 是否与上学的地区有关,

16、为此调查了上一年毕业后参加工作 的大学生800人。按东南、西南、西北、东北四个地区各200 人进行调查,然后请工作单位对它们的表现给予评价: 01 :,:HH工作表现与地区独立工作表现与地区不独立 工作表现工作表现 不满意不满意满意满意很满意很满意合计合计 地地东北东北2112158200 西北西北1813349200 区区东南东南1014743200 西南西南1813844200 合计合计67539194800 2 0.95(4 1)(3 1) 12.59另一方面, 工作表现工作表现 不满意不满意满意满意很满意很满意合计合计 东北东北21(16.75)121(134.75)58(48.5)2

17、00 西北西北18(16.75)133(134.75)49(48.5)200 东南东南10(16.75)147(134.75)43(48.5)200 西南西南18(16.75)138(134.75)44(48.5)200 合计合计67539194800 2 2 11 () = sr ijij ij ij vnp np 222 (21 16.75)(18 16.75)(4448.5) 16.7516.7548.5 9.51 结论:接受H0,认为X与Y独立。 理论频数 例3.3.6 01 :,:HXYHXY与 独立与 不独立 X X Y感冒痊愈感冒痊愈感冒未痊愈感冒未痊愈合计合计 未服药未服药48

18、52100 服药服药5644100 合计合计10496200 2 1112 21222 1212 = vv n vv v v v v 1.282 2 0 3.84K 结论:不拒绝H0,认为X与Y独立。 2 2 200(48 4456 52) = 104 96 100 1. 1.符号检验法(配对)符号检验法(配对) 2. 2. 秩和检验法(非配对)秩和检验法(非配对) 四、两总体分布比较的检验 11 ,( ) n XXF x设 12 ,( ) m YYF xXY,且两总体 与 独立 012112 :( )( ):( )( )HF xF xHF xF x 1. 1.符号检验法(配对)符号检验法(配

19、对) 四、两总体分布比较的检验 ( ,)1,2,. , iiii x yinxy不妨设样本观测值且 1, 1,2,., 0, ii i ii xy zin xy 令 012112 :( )( ):( )( )HF xF xHF xF x ii pP XY记 1, ,(1, ) n ZZBp则 1 , n i i nznnn ( , )nB n p ( ,1)nB np 1. 1.符号检验法(配对)符号检验法(配对) 四、两总体分布比较的检验 012 1 :( )( ) 2 HF xF xp在下,可以证明= ii pP XY 12 ( )( ) x y f x fy dxdy 12 ( )( )

20、 x f x dxfy dy 0 ( )( )() x fx dxfy dyH 在下 ( )( )F x fx dx 1 ( )( ) 2 F x dF x 1. 1.符号检验法(配对)符号检验法(配对) 四、两总体分布比较的检验 2 n EnEn ,n如果选统计量为 =min(,),Snn 如果选统计量 ( ,0.5)nB n 结论( ,0.5)nB n 0012 HKncnc 则拒绝域: 00 HKsc则拒绝域: 注意:该方法要求样本容量注意:该方法要求样本容量n n较大。较大。 例例1 1 某工厂有两个实验室,每天同时从工厂的冷却水某工厂有两个实验室,每天同时从工厂的冷却水 中取样,测量

21、水中的含氯量一次,记录如下:中取样,测量水中的含氯量一次,记录如下: 四、两总体分布比较的检验 问两个化验室测定的结果有无显著差异?问两个化验室测定的结果有无显著差异? 012112 :( )( ):( )( )HF xFxHF xFx 序号序号1234567891011 化验室化验室A(xi)1.031.850.741.821.141.651.921.011.120.91.4 化验室化验室B(yi)11.891.91.811.21.71.941.111.230.971.52 四、两总体分布比较的检验 序号序号1234567891011 化验室化验室A(xi)1.031.850.741.821

22、.141.651.921.011.120.91.4 化验室化验室B(yi)11.891.91.811.21.71.941.111.230.971.52 xi-xi-yiyi0.030.03 -0.04-0.04-1.16-1.16 0.010.01 -0.06-0.06-0.05-0.05-0.02-0.02 -0.1-0.1 -0.11-0.11-0.07-0.07-0.12-0.12 符号符号+ +- - -+ +- - - - - - - - =min(,)2,snn 0.05=1, s 结论:不拒绝结论:不拒绝H0H0,两个化验室测定的结果无显著性差异,两个化验室测定的结果无显著性差异

23、. . 若用若用P P值判断:值判断: 2min 2, 2pP nP n 211 11 1 20.50.0654 n i C 0.05 例例2 2 请请7171人比较人比较A,BA,B两种型号电视机的画面好坏,认为两种型号电视机的画面好坏,认为 A A好的有好的有2323人,认为人,认为B B好的有好的有4545人,拿不定主意的有人,拿不定主意的有 3 3人,问能否认为人,问能否认为B B的画面比的画面比A A好?(好?( =0.1=0.1) P101,23题。 01 :()HBAHBA 优于 68()45,()23Nn BAn BA, min(45,23)23S 0.1(68) 25S 结论

24、:拒绝结论:拒绝H0H0,认为,认为B B的画面比的画面比A A好。好。 2. 2. 秩和检验法(非配对)秩和检验法(非配对) 四、两总体分布比较的检验 012112 :( )( ):( )( )HF xF xHF xF x 秩的概念秩的概念 设设 是来自连续分布是来自连续分布F(x) F(x) 的样本,将它们由小到大的样本,将它们由小到大 排序:排序: 1, , n xx (1)(2)( )n xxx ( )iri xxrx如果,则称有序样本中的序号称为的秩。 例如,样本例如,样本2.36, 7.52, 6.54, 3.14, 4.25, 6.54, 2.36, 7.52, 6.54, 3.

25、14, 4.25, 6.54, 它们的秩分别为:它们的秩分别为:1, 6, 1, 6, 4.5, 2, 34.5, 2, 3。 ( ) 11 , 22 ijrii rr xxxxxr 如果,则的秩为= +。 假设有两组数据:假设有两组数据: 1 1 , ,(10) n m xx yynm (1)XY (2)XY (3)混合交叉情形 将它们混合排序,统计将它们混合排序,统计 在有序样本中的秩在有序样本中的秩 并将它们的秩相加,称为并将它们的秩相加,称为秩和秩和。 1, , n xx 可能出现如下情况:可能出现如下情况: 11 , nm xxyy 11 , mn yyxx X Y (1) (1)

26、2 X n n XR 的秩和 (1) (2) 2 X n n XRmn 的秩和 (1)(1) (3) 22 X n nn n Rmn 0012 XX HKRrRr的拒绝域: 10nm 当 ,时 * (1)/ 2 (1) 12 X Rn nm U nm nm 利用中心极限定理,利用中心极限定理, (0,1)N * 001/2 |HKuu 的拒绝域: 例例2 2 对某种羊绒可利用先进的工艺处理其含脂率。为对某种羊绒可利用先进的工艺处理其含脂率。为 比较处理前后的效果,测得如下数据:比较处理前后的效果,测得如下数据: 四、两总体分布比较的检验 序号序号123456 处理前处理前(xi)0.20.240.660.420.120.25 处理后处理后(yi)0.130.070.210.080.19 试问处理前后的含脂率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论