


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、非参数统计-十道题09统计学王若曦32009121114数据已经按升序排列:、Wilcoxon符号秩检验F面是10个欧洲城镇每人每年平均消费的酒类相当于纯酒精数,4.125.817.639.7410.3911.9212.3212.8913.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,试用上述数据检验这种看法。数据来源:非参数统计(第二版)吴喜之 手算:建立假设组:H0:M=8H1:M>8编号纯酒精数xD=x-8|D|D|的秩D的符号14.12-3.883.885-25.81-2.192.193-37.63-0.370.371-49.741.741.742+5
2、10.392.392.394+611.923.923.926+712.324.324.327+812.894.894.898+913.545.545.549+1014.456.456.4510+T 246789 10 46T 5 3 19n=10查表得P=0.032<=0.05 ,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。SPSS:操作: An alyzeNon parametric T ests2-Related Sample TestRanksNMean RankSum of Ranksc - xNegative Ranks7a6.5746.00Positive
3、Ranks3b3.009.00Ties0cTotal10a. c < xb. c > x c. c = xTest Statistics bc - xZ-1.886 aAsymp. Sig. (2-tailed).059Exact Sig. (2-tailed).064Exact Sig. (1-tailed).032Point Probability.008a. Based on positive ranks.b. Wilcoxon Signed Ranks Test由输出结果可知,单侧精确显著性概率P=0.032<=0.05,因此拒绝原假设,即认为欧洲各国人均年消费酒量的
4、中位数多于8升。与手算结果相同。R语言:> x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)> wilcox.test(x-8,alt="greater")Wilcox on sig ned rank testdata:x - 8V = 46, p-value = 0.03223alter native hypothesis: true locati on is greater tha n 0Mann-Whit ney-Wilcoxon检验由输出结果可知,P=0.03223<=0.05
5、,因此拒绝原假设,即认为欧洲各国人均年消费酒量的中位数多于8升。与以上结果一致。F表为8个亚洲国家和8个欧美国家2005年的人均国民收入数据。 检验亚洲国家和欧美国家的人均国民收入是否有显著差异(=0.05 )。亚洲国家人均国民收入(美元)欧美国家人均国民收入(美元)中国1740美国43740日本38980加拿大32600印度尼西亚1280德国34580马来西亚4960英国37600泰国2750法国34810新加坡27490意大利30010韩国15830墨西哥7310印度720巴西3460数据来源:统计学(第三版)贾俊平手算: 设亚洲国家为X,欧美国家为 Y建立假设组:H1:MxH°
6、:Mx=Myy数值秩组别数值秩组别7201X274909X12802X3001010Y17403X3260011Y27504X3458012Y34605Y3481013Y49606X3760014Y73107Y3898015X158308X4374016YTx123 4 6 8 91548Ty5710 1112131416 88Nmn16, mn8,UTx m(m 1)/212查表得,Tx=48的右尾概率的2 倍为 0.019*2=0.038<=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。SPSS:操作:DataSort CasesAn alyzeNon
7、parametric T ests2-1 ndepe ndent SamplesRanks分组NMean RankSum of Ranks收入亚洲国家86.0048.00欧美国家811.0088.00Total16Test Statistics b收入Mann-Whitney U12.000Wilcoxon W48.000Z-2.100Asymp. Sig. (2-tailed).036Exact Sig. 2*(1-tailed Sig.).038 aExact Sig. (2-tailed).038Exact Sig. (1-tailed).019Point Probability.005
8、a. Not corrected for ties.b. Grouping Variable:分组由输出结果可知,精确双尾概率P=0.038<=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与手算结果一致。R语言:> x<-c(1740,38980,1280,4960,2750,27490,15830,720)> y<-c(43740,32600,34580,37600,34810,30010,7310,3460)> wilcox.test(x,y,exact=F,cor=F)Wilcox on rank sum testdat
9、a: x and yW = 12, p-value = 0.03569alter native hypothesis: true locati on shift is not equal to 0由输出结果可知,P=0.03569<=0.05,因此拒绝原假设,即认为亚洲国家和欧美国家的人均国民收入有显著差异。与以上结果一致。、两样本的 Kolmogorov-Smirnov 检验F面是13个非洲地区和13个欧洲地区的人均酒精年消费量,试分析这两个地区的酒精人均年消费量是否分布相同。非洲欧洲5.386.674.3816.219.3311.933.669.853.7210.431.6613.5
10、40.232.40.0812.892.369.31.7111.922.015.740.914.451.541.99数据来源:非参数统计(第二版)吴喜之手算:建立假设组:H°:Fi(x)=F2(x)Hi:R(x) F2(x)Xf1f2f1f23 XS2 xD0.0810100.07692300.0769230.2310200.15384600.1538460.910300.23076900.2307691.5410400.30769200.3076921.6610500.38461500.3846151.7110600.46153800.4615381.9901610.4615380.
11、0769230.3846152.0110710.5384620.0769230.4615382.3610810.6153850.0769230.5384622.401820.6153850.1538460.4615383.6610920.6923080.1538460.5384623.72101020.7692310.1538460.6153854.38101120.8461540.1538460.6923085.38101220.9230770.1538460.7692315.74011230.9230770.2307690.6923086.67011240.9230770.3076920.
12、6153859.3011250.9230770.3846150.5384629.331013510.3846150.6153859.850113610.4615380.53846210.430113710.5384620.46153811.920113810.6153850.38461511.930113910.6923080.30769212.8901131010.7692310.23076913.5401131110.8461540.15384614.4501131210.9230770.07692316.21011313110D=max ( D )=0.769231, mnD=130查表
13、得,当 mnD=130 时,双侧检验的概率 P<0.01,所以P< =0.05,因此拒绝原 假设,即认为这两个地区的酒精人均年消费量分布有显著差异。SPSS:操作:An alyzeNon parametric T ests2-1 ndepe ndent SamplesFrequencies分组N消费量非洲地区13欧洲地区13Total26Test Statistics a由输出结果可知,双侧精确显著性概率P=0.05,因此拒绝原假设,即认为这两消费量Most Extreme DifferencesAbsolute.769Positive.769Negative.000Kolmogo
14、rov-Smirnov Z1.961Asymp. Sig. (2-tailed).001Exact Sig. (2-tailed).000Point Probability.000a. Grouping Variable:分组个地区的酒精人均年消费量分布有显著差异。与手算结果一致。四、Cochran Q 检验F面是某村村民对四个候选人( A, B, C, D)的赞同与否的调查(“1 ”代表同意,“ 0代表不同意);最后一列为行总和,最后一行为列总和,全部“1 ”的总和为42。试分析4位候选人在村民眼中有没有区别(=0.05 )。20个村民对A、B、C、D四个候选人的评价NA0110011111
15、111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L1321232233122333212142数据来源:非参数统计(第二版)吴喜之手算:建立假设组:H 0:4位候选人在村民眼中没有差异H, :4位候选人在村民眼中有差异kk=(41)4(1621129262) 422= 2 2 24(42)(5 18 27 3 )9.3529(k-1) k x2- (Xj)2j=1j=1nn2k yi- yii=1i=1df 4 132查表得0.057.82 Q 9.3529,因此在5%的显著性水平上拒
16、绝原假设,即认为4位候选人在村民眼中有显著差异。SPSS:操作:An alyzeNon parametric TestsK Related SamplesFrequenciesValue01A416B911C119D146Test StatisticsN20Cochran's Q9.353 adf3Asymp. Sig.025Exact Sig.025Point Probability.006a. 0 is treated as a success.=0.05,因此拒绝原假由输出结果可知,Q=9.353,精确的显著性概率 P=0.025<设,即认为4位候选人在村民眼中有显著差异。
17、与手算结果一致。R语言:> x=read.table("f:/Cochra nQ.txt")> n=apply(x,2,sum)> N=su m(n)> L=apply(x,1,sum) > k=dim(x)2> Q=(k*(k-1)*sum( n-mea n(n )A2)/(k*N-sum(LA2)> Q 1 9.352941 > pvalue=pchisq(Q,k-1,low=F) > pvalue 1 0.02494840=0.05,因此拒绝原假设,即由输出结果可知,Q=9.352941, P=0.02494840
18、<认为4位候选人在村民眼中有显著差异。与以上结果一致。五、Friedman 检验一项关于销售茶叶的研究报告说明销售方式可能和售出率有关。 三种方式为:在商店内 等待,在门口销售和当面表演炒制茶叶。 对一组商店在一段时间的调查结果列再下表中 (单 位为购买者人数)。试问三种不同的销售方式是否有显著差异( =0.05 )。销售方式购买率(%)商店内等待2025291817221820门口销售2623153026322827表演炒制5347484352574956数据来源:非参数统计(第二版)吴喜之手算:建立假设组:H0:三种销售方式无差异已:三种销售方式有差异df_1_2kn k(k3 11
19、)2j=i查表得20.052Rj 3n (k5.9912 2 2 21)(101424 )3 8(3 1) 138 3(3 1)13,因此在5%的显著性水平上拒绝原假设,即认为三种销三种方式购买率等级销售方式购买率合计商店内等待1221111110门口销售2112222214表演炒制3333333324售方式有显著差异。SPSS:操作: An alyzeNon parametric T estsK Related SamplesRanksMean Rank商店内等待1.25门口销售1.75表演炒制3.00Test Statistics aN8Chi-Square13.000df2Asymp.
20、Sig.002Exact Sig.000Point Probability.000a. Friedman Test22由输出结果可知,r 130.055.99,精确的显著性概率 P<0.001 ,因此在5%的显著性水平上拒绝原假设,即认为三种销售方式有显著差异。与手算结果一致。R语言:> d=read.table("f:/Friedma n. txt")> friedma n. test(as.matrix(d)Friedma n rank sum testdata:as.matrix(d)Friedman chi-squared = 13, df = 2
21、, p-value = 0.0015032由输出结果可知,13, P=0.001503<=0.05,因此拒绝原假设,即认为三种销售方式有显著差异。与以上结果一致。六、K个样本的卡方检验在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下表,检验人们去这三个商场的概率是否一样。年龄段商场1商场2商场3总和<3083704519830 50918615192>5041381089总和21519470479数据来源:非参数统计 王星手算:建立假设组:H0:人们去三个商场的概率相同H1:人们去三个商场的概率不同分组f1f2f3fie1e2
22、e32(f1-ej ®2(f 2-e2 )尼22(f3-e3 )尼3<3083704519888.87380.19228.9350.3881.2958.91930 5091861519286.18077.76228.0580.2700.8736.077>504138108939.94836.04613.0060.0280.1060.695合计21519470479215.000194.00070.0000.6852.27415.6912r k fj-ejQ=j=0.685+2.274+15.69 仁 18.651i=1 j=1ejdf=(k-1)(r-1)=42 2查表得
23、0.05 =9.49,因为Q=18.651>0.05=9.49,因此拒绝原假设,即认为人们去三个商场的概率不同。SPSS:操作:DataWeight CasesAn alyzeDescriptive StatisticsCrosstabsChi-Square TestsAsymp. Sig.Exact Sig.Exact Sig.PointValuedf(2-sided)(2-sided)(1-sided)ProbabilityPearson Chi-Square18.651 a4.001bkelihood Ratio18.6914.001.001Fisher's Exact T
24、est18.314.001near-by-Linear Association5.110 c1.024.026.013.003N of Valid Cases479a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 13.01.b. Cannot be computed because there is insufficient memory.c. The standardized statistic is -2.260.由输出结果可知,卡方统计量为18.651 ,精确双尾检验概率 P=
25、0.01<=0.05,因此拒绝原假设,即认为人们去三个商场的概率不同。与手算结果一致。七、Kruskal-Wallis 检验某制造商雇用了来自三个本地大学的雇员作为管理人员。最近,公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本。制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。雇员大学A大学B大学C12560502702070360306048515805954090690357078075数据来源:百度文库SAS讲义手算:建立假设组:H。:三个总体的考核成绩分布相同H1:三个总体的考核成绩分布不同各雇员的成绩等级雇员大学
26、A大学B大学C13972122123949417115.5520618.5618.5512715.514秩和952788KW统计量H12Rj 3(N+1)=N(N+1) j=i nj20(21)712(95)2(27(88)267因为出现同分的情况,应对 H 进行校正,校3(20 1) 8.9163正系数0.9925u3u (33 3 33 3 23 2 23 2)C 12=1厂N(N +1)20(20 +1)校正后的统计量 H 8.9163/0.99258.9839df=k 122 2查表得,在0.05的显著性水平上,0.05 =5.99 ,由于H=8.9839>0.05 =5.99
27、,因此拒绝原假设,即三个总体的考核成绩分布不同。SPSS:操作:An alyzeNon parametric T estsK In depe ndent SamplesRanks分组NMean Rank成绩大学A713.57大学B64.50大学C712.57Total20Test Statistics a,b成绩Chi-Square8.984df2Asymp. Sig.011Exact Sig.006Point Probability.000a. Kruskal Wallis Testb. Grouping Variable:分组由输出结果可知,KW统计量为8.984,精确概率为0.006,远
28、远小于显著性水平 0.05, 因此拒绝原假设,即三个总体的考核成绩分布不同。与手算结果一致。八、列联表卡方检验一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,得样本数据如下表所示,要求检验地区与原料质量之间有无依赖关系。一级二级三级合计地区1526424140地区2605952171地区3506574189合计162188150500数据来源:百度文库统计学教程PPT手算:建立假设组:H0:地区与原料质量无关Hi:地区与原料质量相关地区等级fjej2(fj -ej) /ej115245.360.97126452.642.451324427.7121
29、6055.40.38225964.30.44235251.30.01315061.242.06326571.060.52337456.75.28合计19.82rQ=i=1cj=1(f ij -ej )2=19.82eijdf=(r-1)(c-1)=42查表得,0.05 =9.49 ,由于 Q=19.82>20.05=9.49 ,因此拒绝原假设,即认为地区与原料质量相关。SPSS:操作:DataWeight CasesAn alyzeDescriptive StatisticsCrosstabs地区 * 等级 Crosstabulation等级Total一级二级三级地区地区1Count52
30、6424140Expected Count45.452.642.0140.0地区2Count605952171Expected Count55.464.351.3171.0地区3Count506574189Expected Count61.271.156.7189.0TotalCount162188150500Expected Count162.0188.0150.0500.0Chi-Square TestsValuedfAsymp. Sig.(2-sided)Exact Sig. (2-sided)Exact Sig.(1-sided)PointProbabilityPearson Chi-
31、Square19.822 a4.001bkelihood Ratio20.7324.000.000Fisher's Exact Test20.510.000near-by-LinearAssociation13.963 c1.000.000.000.000N of Valid Cases500a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 42.00.b. Cannot be computed because there is insufficient memory.c. T
32、he standardized statistic is 3.737.由输出结果可知,检验统计量为19.822,精确双尾显著性概率P远远小于显著性水平0.05,因此拒绝原假设,即认为地区与原料质量相关。与手算结果一致。九、Kendall秩相关某研究所对10对双胞胎儿童的智力进行调查,结果如下表:儿童智力测试得分双胞胎编号先出生儿童(X)后出生儿童(丫)197.8216.619.3316.220.1411.37.1516.21367.14.877.88.9847.4911.210101.31.5数据来源:非参数统计:方法与应用 易丹辉 董寒青手算:儿童智力测试得分评秩XYX的秩Y的秩D1.31.
33、5110047.424-247.14.832117.88.956-1197.8550011.21067-1111.37.17341616.220.18.510-1.52.2516.2138.580.50.2516.619.310911U 967443301 37V 0202110100 7Kendall秩相关系数 T= 2(U V) = 2(37 7) =0.6667n(n-1)10(10-1)由于同分,所以 T= (37-7) j =0.6742J(1/2)10(10-1)-(1/2)2(2-1)J(1/2)10(10-1)对T的显著性进行检验,建立假设组:H。:不相关H + :正相关查表得
34、,n=10 , T=0.6667 或T=0.6742 相应的概率在 0.0002 至0.0005 之间,远远小于显著性水平0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。SPSS:操作: An alyzeCorrelateBivariateCorrelations先岀生儿童后岀生儿童Kendall's tau_b先岀生儿童Correlation Coefficient1.000*.674Sig. (2-tailed).007N1010后岀生儿童Correlation Coefficient*.6741.000Sig. (2-tailed).007N1010*. Cor
35、relation is significant at the 0.01 level (2-tailed).由输出结果可知,T=0.674,双侧检验的显著性概率为0.007,则单侧的显著性概率为0.0035,远远小于显著性水平 0.05,因此拒绝原假设,即认为双胞胎儿童的智力之间存在着正相关。与手算结果一致。R语言:> x=c(9.0,16.6,16.2,11.3,1627.1,7.8,4.0,11.2,1.3)> y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)> cor.test(x,y,method="ke ndall")Ken dall's rank correlatio n taudata: x and yz = 2.6941, p-value = 0.007058alter native hypothesis: true tau is not equal to 0 sample estimates:tau0.6741999警告信息:无法给连结计算精確 p值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多尺度仿生结构材料的性能调控研究-洞察阐释
- 非营利组织员工信息技术应用心得体会
- 小学二年级下册音乐教学策略计划
- 大型活动安全管理措施及应急预案
- 艺术家驻校项目实施计划
- 高考生物二轮复习(全国版) 第1篇 专题突破 专题10 考点3 生物组织中的有效成分的提取
- 书信我的愿望350字7篇范文
- 基于商业CORS的滑坡监测载波完好性算法研究
- 基于用户画像的M银行个人信贷风险管理研究
- 某油田注水全工段结垢规律及防垢措施研究
- 《思想政治教育方法论》考研(第3版)郑永廷配套考试题库及答案【含名校真题、典型题】
- 肩袖损伤的治疗与护理
- 【MOOC】创业基础-浙江科技学院 中国大学慕课MOOC答案
- 物理-2025年中考终极押题猜想(广州专用)(原卷版)
- 江苏省苏州市(2024年-2025年小学五年级语文)统编版期末考试(下学期)试卷及答案
- 二次元行业的发展环境分析
- 2024年中国玻璃钢缠绕管道市场调查研究报告
- 工厂转让协议书的
- 2024年移动网格经理(认证考试)备考试题库大全-上单选、多选题汇
- 胸外科护理常规(全本) 胸外科疾病护理常规
- 医学课件内科胸腔镜术
评论
0/150
提交评论