非参数统计十道题_第1页
非参数统计十道题_第2页
非参数统计十道题_第3页
非参数统计十道题_第4页
非参数统计十道题_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数统计 -十道题09 统计学王若曦32009121114 一、wilcoxon 符号秩检验下面是 10 个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,数据已经按升序排列:4.12 5.81 7.63 9.74 10.39 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8 升, 试用上述数据检验这种看法。数据来源:非参数统计(第二版) 吴喜之手算:建立假设组:01h :m=8h :m8编号纯酒精数x d=x-8 |d| |d| 的秩d的符号1 4.12 -3.88 3.88 5 - 2 5.81 -2.19 2.19 3

2、- 3 7.63 -0.37 0.37 1 - 4 9.74 1.74 1.74 2 + 5 10.39 2.39 2.39 4 + 6 11.92 3.92 3.92 6 + 7 12.32 4.32 4.32 7 + 8 12.89 4.89 4.89 8 + 9 13.54 5.54 5.54 9 + 10 14.45 6.45 6.45 10 + t2467891046t53 19n=10查表得 p=0.032=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于 8 升。spss:操作: analyze nonparametric tests 2-related sam

3、ple test ranksn mean rank sum of ranks c - x negative ranks 7a6.57 46.00 positive ranks 3b3.00 9.00 ties 0ctotal 10 a. c x c. c = x test statisticsbc - x z -1.886aasymp. sig. (2-tailed) .059 exact sig. (2-tailed) .064 exact sig. (1-tailed) .032 point probability .008 a. based on positive ranks. b. w

4、ilcoxon signed ranks test 由输出结果可知,单侧精确显著性概率p=0.032 x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45) wilcox.test(x-8,alt=greater) wilcoxon signed rank test data: x - 8 v = 46, p-value = 0.03223 alternative hypothesis: true location is greater than 0 由输出结果可知,p=0.03223=0.05,因此拒绝原假设,即认为欧洲各国人

5、均年消费酒量的中位数多于8 升。与以上结果一致。二、mann-whitney-wilcoxon检验下表为 8 个亚洲国家和8 个欧美国家2005 年的人均国民收入数据。检验亚洲国家和欧美国家的人均国民收入是否有显著差异(=0.05) 。亚洲国家人均国民收入(美元)欧美国家人均国民收入(美元)中国1740 美国43740 日本38980 加拿大32600 印度尼西亚1280 德国34580 马来西亚4960 英国37600 泰国2750 法国34810 新加坡27490 意大利30010 韩国15830 墨西哥7310 印度720 巴西3460 数据来源:统计学(第三版) 贾俊平手算:设亚洲国家

6、为x,欧美国家为y建立假设组:0 xy1xyh :m =mh :mm数值秩组别数值秩组别720 1 x 27490 9 x 1280 2 x 30010 10 y 1740 3 x 32600 11 y 2750 4 x 34580 12 y 3460 5 y 34810 13 y 4960 6 x 37600 14 y 7310 7 y 38980 15 x 15830 8 x 43740 16 y xyxt12346891548t571011 1213141688nmn16mn8utm(m1)/ 212,查表得, tx=48 的右尾概率的2 倍为 0.019*2=0.038 =0.05,因

7、此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。spss:操作: data sort cases analyze nonparametric tests 2-independent samples ranks分组n mean rank sum of ranks 收入亚洲国家8 6.00 48.00 欧美国家8 11.00 88.00 total 16 test statisticsb收入mann-whitney u 12.000 wilcoxon w 48.000 z -2.100 asymp. sig. (2-tailed) .036 exact sig. 2*(1-tail

8、ed sig.) .038aexact sig. (2-tailed) .038 exact sig. (1-tailed) .019 point probability .005 a. not corrected for ties. b. grouping variable: 分组由输出结果可知,精确双尾概率p=0.038 x y wilcox.test(x,y,exact=f,cor=f) wilcoxon rank sum test data: x and y w = 12, p-value = 0.03569 alternative hypothesis: true location

9、shift is not equal to 0 由输出结果可知,p=0.03569 =0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。三、两样本的kolmogorov-smirnov检验下面是 13 个非洲地区和13 个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。非洲欧洲5.38 6.67 4.38 16.21 9.33 11.93 3.66 9.85 3.72 10.43 1.66 13.54 0.23 2.4 0.08 12.89 2.36 9.3 1.71 11.92 2.01 5.74 0.9 14.45 1.

10、54 1.99 数据来源:非参数统计(第二版) 吴喜之手算:建立假设组:012112h :f(x)=f (x)h :f(x)f (x)x1f2f1f2f1s x2sxd0.08 1 0 1 0 0.076923 0 0.076923 0.23 1 0 2 0 0.153846 0 0.153846 0.9 1 0 3 0 0.230769 0 0.230769 1.54 1 0 4 0 0.307692 0 0.307692 1.66 1 0 5 0 0.384615 0 0.384615 1.71 1 0 6 0 0.461538 0 0.461538 1.99 0 1 6 1 0.4615

11、38 0.076923 0.384615 2.01 1 0 7 1 0.538462 0.076923 0.461538 2.36 1 0 8 1 0.615385 0.076923 0.538462 2.4 0 1 8 2 0.615385 0.153846 0.461538 3.66 1 0 9 2 0.692308 0.153846 0.538462 3.72 1 0 10 2 0.769231 0.153846 0.615385 4.38 1 0 11 2 0.846154 0.153846 0.692308 5.38 1 0 12 2 0.923077 0.153846 0.7692

12、31 5.74 0 1 12 3 0.923077 0.230769 0.692308 6.67 0 1 12 4 0.923077 0.307692 0.615385 9.3 0 1 12 5 0.923077 0.384615 0.538462 9.33 1 0 13 5 1 0.384615 0.615385 9.85 0 1 13 6 1 0.461538 0.538462 10.43 0 1 13 7 1 0.538462 0.461538 11.92 0 1 13 8 1 0.615385 0.384615 11.93 0 1 13 9 1 0.692308 0.307692 12

13、.89 0 1 13 10 1 0.769231 0.230769 13.54 0 1 13 11 1 0.846154 0.153846 14.45 0 1 13 12 1 0.923077 0.076923 16.21 0 1 13 13 1 1 0 d=maxd =0 769231mnd=130() .,查表得, 当 mnd=130 时, 双侧检验的概率p0.01,所以 p=0.05,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。spss:操作: analyze nonparametric tests 2-independent samples frequencies

14、分组n 消费量非洲地区13 欧洲地区13 frequencies分组n 消费量非洲地区13 欧洲地区13 total 26 test statisticsa消费量most extreme differences absolute .769 positive .769 negative .000 kolmogorov-smirnov z 1.961 asymp. sig. (2-tailed) .001 exact sig. (2-tailed) .000 point probability .000 a. grouping variable: 分组由输出结果可知,双侧精确显著性概率p=0.05

15、,因此拒绝原假设,即认为这两个地区的酒精人均年消费量分布有显著差异。与手算结果一致。四、cochran q 检验下面是某村村民对四个候选人(a,b,c,d)的赞同与否的调查( “1”代表同意,“ 0”代表不同意) ;最后一列为行总和,最后一行为列总和,全部“1”的总和为42。试分析4位候选人在村民眼中有没有区别(=0.05) 。20 个村民对a、b、c、d 四个候选人的评价n a 0 1 1 0 0 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 16 b 1 1 0 0 0 1 1 1 1 1 0 1 1 0 1 1 0 0 0 0 11 c 0 1 1 1 1 0 0 0 0

16、1 0 0 0 1 1 0 1 0 1 0 9 d 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1 1 0 0 0 6 l 1 3 2 1 2 3 2 2 3 3 1 2 2 3 3 3 2 1 2 1 42 数据来源:非参数统计(第二版) 吴喜之手算:建立假设组:01h 4h 4:位候选人在村民眼中没有差异:位候选人在村民眼中有差异kk22jj22222j=1j=1nn2222iii=1i=1k-1kx -x(41)4(161196 )42 q=9.35294(42)(518 27 3 )ky -ydf413()()查表得20.057.82q9.3529,因此在5%的显著性水

17、平上拒绝原假设,即认为4位候选人在村民眼中有显著差异。spss:操作: analyze nonparametric tests k related samples frequenciesvalue 0 1 a 4 16 b 9 11 c 11 9 d 14 6 test statisticsn 20 cochrans q 9.353adf 3 asymp. sig. .025 exact sig. .025 point probability .006 a. 0 is treated as a success. 由输出结果可知,q=9.353,精确的显著性概率p=0.025 x=read.ta

18、ble(f:/cochranq.txt) n=apply(x,2,sum) n=sum(n) l=apply(x,1,sum) k=dim(x)2 q=(k*(k-1)*sum(n-mean(n)2)/(k*n-sum(l2) q 1 9.352941 pvalue=pchisq(q,k-1,low=f) pvalue 1 0.02494840 由输出结果可知,q=9.352941, p=0.02494840 =0.05,因此拒绝原假设,即认为4位候选人在村民眼中有显著差异。与以上结果一致。五、friedman 检验一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。三种方式为: 在商店内

19、等待, 在门口销售和当面表演炒制茶叶。对一组商店在一段时间的调查结果列再下表中(单位为购买者人数) 。试问三种不同的销售方式是否有显著差异(=0.05) 。销售方式购买率( % )商店内等待20 25 29 18 17 22 18 20 门口销售26 23 15 30 26 32 28 27 表演炒制53 47 48 43 52 57 49 56 数据来源:非参数统计(第二版) 吴喜之手算:建立假设组:01hh:三种销售方式无差异:三种销售方式有差异三种方式购买率等级销售方式购买率合计商店内等待1 2 2 1 1 1 1 1 10 门口销售2 1 1 2 2 2 2 2 14 表演炒制3 3

20、3 3 3 3 3 3 24 k22222rjj=11212r3n(k1)(101424 )3 8(31)13nk(k1)83(31)df312查表得220.05r5.9913,因此在 5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。spss:操作: analyze nonparametric tests k related samples ranksmean rank 商店内等待1.25 门口销售1.75 表演炒制3.00 test statisticsan 8 chi-square 13.000 df 2 asymp. sig. .002 exact sig. .000 poi

21、nt probability .000 a. friedman test 由输出结果可知,22r0.05135.99,精确的显著性概率p d=read.table(f:/friedman.txt) friedman.test(as.matrix(d) friedman rank sum test data: as.matrix(d) friedman chi-squared = 13, df = 2, p-value = 0.001503 由输出结果可知,213, p=0.001503=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。六、k 个样本的卡方检验在一个有三个

22、主要百货商场的商贸中心,调查者问479 个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。年龄段商场 1 商场 2 商场 3 总和50 41 38 10 89 总和215 194 70 479 数据来源:非参数统计王星手算:建立假设组:01hh:人们去三个商场的概率相同:人们去三个商场的概率不同分组1f2f3fif1e2e3e2111(f -e ) /e2222(f -e ) /e2333(f -e ) /e50 41 38 10 89 39.948 36.046 13.006 0.028 0.106 0.695 合计215 194 70 479 215.

23、000 194.000 70.000 0.685 2.274 15.691 2rkijiji=1j=1ijf -eq=0.685+2.274+15.691=18.651edf=(k-1)(r-1)=4查表得20.05=9.49,因为 q=18.65120.05=9.49,因此拒绝原假设,即认为人们去三个商场的概率不同。spss:操作: data weight cases analyze descriptive statistics crosstabs chi-square testsvalue df asymp. sig. (2-sided) exact sig. (2-sided) exac

24、t sig. (1-sided) point probability pearson chi-square 18.651a4 .001 .blikelihood ratio 18.691 4 .001 .001 fishers exact test 18.314 .001 linear-by-linear association 5.110c1 .024 .026 .013 .003 n of valid cases 479 a. 0 cells (.0%) have expected count less than 5. the minimum expected count is 13.01

25、. b. cannot be computed because there is insufficient memory. c. the standardized statistic is -2.260. 由输出结果可知,卡方统计量为18.651,精确双尾检验概率p=0.0120.05=5.99,因此拒绝原假设,即三个总体的考核成绩分布不同。spss:操作: analyze nonparametric tests k independent samples ranks分组n mean rank 成绩大学 a 7 13.57 大学 b 6 4.50 大学 c 7 12.57 total 20 t

26、est statisticsa,b成绩chi-square 8.984 df 2 asymp. sig. .011 exact sig. .006 point probability .000 a. kruskal wallis test b. grouping variable: 分组由输出结果可知,kw 统计量为8.984,精确概率为0.006,远远小于显著性水平0.05,因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。八、列联表卡方检验一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500 件进行检验,得样本数据如下表所示,要求检验地区与原料质量

27、之间有无依赖关系。一级二级三级合计地区 1 52 64 24 140 地区 2 60 59 52 171 地区 3 50 65 74 189 合计162 188 150 500 数据来源:百度文库统计学教程ppt 手算:建立假设组:01hh:地区与原料质量无关:地区与原料质量相关地区等级ijfije2ijijij(f -e ) /e1 1 52 45.36 0.97 1 2 64 52.64 2.45 1 3 24 42 7.71 2 1 60 55.4 0.38 2 2 59 64.3 0.44 2 3 52 51.3 0.01 3 1 50 61.24 2.06 3 2 65 71.06

28、0.52 3 3 74 56.7 5.28 合计19.82 2rcijiji=1j=1ij(f -e )q=19.82edf=(r-1)(c-1)=4查表得,20.05=9.49,由于q=19.8220.05=9.49,因此拒绝原假设,即认为地区与原料质量相关。spss:操作: data weight cases analyze descriptive statistics crosstabs 地区* 等级 crosstabulation等级total 一级二级三级地区地区 1 count 52 64 24 140 expected count 45.4 52.6 42.0 140.0 地区

29、2 count 60 59 52 171 expected count 55.4 64.3 51.3 171.0 地区 3 count 50 65 74 189 expected count 61.2 71.1 56.7 189.0 total count 162 188 150 500 expected count 162.0 188.0 150.0 500.0 chi-square testsvalue df asymp. sig. (2-sided) exact sig. (2-sided) exact sig. (1-sided) point probability pearson c

30、hi-square 19.822a4 .001 .blikelihood ratio 20.732 4 .000 .000 fishers exact test 20.510 .000 linear-by-linear association 13.963c1 .000 .000 .000 .000 n of valid cases 500 a. 0 cells (.0%) have expected count less than 5. the minimum expected count is 42.00. b. cannot be computed because there is in

31、sufficient memory. c. the standardized statistic is 3.737. 由输出结果可知,检验统计量为19.822,精确双尾显著性概率p 远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。九、kendall 秩相关某研究所对10 对双胞胎儿童的智力进行调查,结果如下表:儿童智力测试得分双胞胎编号先出生儿童( x)后出生儿童( y) 1 9 7.8 2 16.6 19.3 3 16.2 20.1 4 11.3 7.1 5 16.2 13 6 7.1 4.8 7 7.8 8.9 8 4 7.4 9 11.2 10 10

32、 1.3 1.5 数据来源:非参数统计:方法与应用易丹辉董寒青手算:儿童智力测试得分评秩x y x的秩y的秩d 1.3 1.5 1 1 0 0 4 7.4 2 4 -2 4 7.1 4.8 3 2 1 1 7.8 8.9 5 6 -1 1 9 7.8 5 5 0 0 11.2 10 6 7 -1 1 11.3 7.1 7 3 4 16 16.2 20.1 8.5 10 -1.5 2.25 16.2 13 8.5 8 0.5 0.25 16.6 19.3 10 9 1 1 u96744330137v02021 101 0072(u-v)2(37-7)kendallt=0.6667n(n-1)10

33、 10-1(37-7)t=0.6742(1/2)10(10-1)-(1/2)2(2-1) (1/2)10(10-1)秩相关系数()由于同分,所以对 t 的显著性进行检验,建立假设组:0+hh:不相关:正相关查表得, n=10,t=0.6667 或 t=0.6742 相应的概率在0.0002 至 0.0005 之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。spss:操作: analyze correlate bivariate correlations先出生儿童后出生儿童kendalls tau_b 先出生儿童correlation coefficie

34、nt 1.000 .674*sig. (2-tailed) . .007 n 10 10 后出生儿童correlation coefficient .674*1.000 sig. (2-tailed) .007 . n 10 10 *. correlation is significant at the 0.01 level (2-tailed). 由输出结果可知,t=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与手算结果一致。r 语言: x=c(9.0,16.6,16.2,

35、11.3,16.2,7.1,7.8,4.0,11.2,1.3) y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5) cor.test(x,y,method=kendall) kendalls rank correlation tau data: x and y z = 2.6941, p-value = 0.007058 alternative hypothesis: true tau is not equal to 0 sample estimates: tau 0.6741999 警告信息:in cor.test.default(x, y, method = kendall) : 无法给连结计算精確p 值由输出结果可知,t=0.674199

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论