非参数统计 符号检验_第1页
非参数统计 符号检验_第2页
非参数统计 符号检验_第3页
非参数统计 符号检验_第4页
非参数统计 符号检验_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第三章第三章 非参数统计非参数统计单一样本的推断问题单一样本的推断问题单一样本位置的点估计、置信区间估计和假设检验是参数统计推断的基本内容,其中t统计量和t检验作为正态分布总体期望均值的推断工具是我们熟知的。如果数据不服从正态分布,或有明显的偏态表现,应用t统计量和t检验推断,就未必能发挥较好的效果。主要内容主要内容符号检验符号秩检验分布检验Wilcoxon符号秩检验Kolmogorov-Smirnov正态性检验游程检验单样本推断问题符号检验Liliefor正态性检验拟合优度检验Cox-Staut趋势检验2中心位置推断分位数检验第一节 符号检验和分位数推断基本概念 符号检验是非参数统计中最古

2、老的检验方法之一,最早可追溯到1701年一项有关伦敦出生的男婴性别比例是否超过1/2的研究。 这种检验被称为符号检验的理由是:它所关心的信息只与两类观测值有关,用符号“+”“-”区分,符号检验就是通过符号的个数来进行统计推断。例3.1 假设某地16座预出售的楼盘均价,单位(百元/平方米)如下: 36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35 该地平均楼盘价格是否与媒体公布的3700元/平方米的说法相符?01H :37H :37 其中 为总体的均值解一: 用t检验法用T统计量结论: 不能拒绝H0。X37TS/nR的的t检验程序和输出结果检验程序和输

3、出结果build.pricemean(build.price)1 36.5var(build.price)1 200.5333length(build.price)116t.test(build.price-37)one-sample t-Testdata: build.price-37t= -0.1412,df=15,p-value=0.8896alternative hypothesis: true mean is not equal to 095 percent confidence interval-8.045853 7.045853sample estimates:mean of x

4、-0.5总结总结T检验推断过程 假定分布结构 确定假设 检验统计量在零假设下的抽样分布 由抽样分布计算拒绝域或计算p值与显著性比较 做出决策 如果数据分布呈现明显的非正态性,如果数据分布呈现明显的非正态性,t t检验可能会由于运检验可能会由于运用错误的假设,导致不成功的推断。用错误的假设,导致不成功的推断。数据描述数据描述符号检验推断过程假设总体 , 是总体的中位数,对于假设检验问题: 是待检验的中位数取值 F(x)0e01e0H :MMH :MM0M 定义: ,则 在零假设情况下 ,在显著性水平为 的拒绝域为其中k是满足上式最大的k值。 ni0i 1SI(xM )ni0i 1SI(xM )s

5、snK mins ,s Kb(n,0.5)binom2P(Kk |n ,p0.5) eM解二: 用符号检验法在显著性水平0.05下,拒绝H0。符号检验与t检验得到了相反的结论,到底选择哪一种结果呢?结论:符号检验在总体分布未知的情况下优于结论:符号检验在总体分布未知的情况下优于t 检验!检验!16ki 0161k3,2PKk |n16,p0.520.0213i2binom.test (sum(build.price37),length(build.price),0.5)Exact binomial testdata: sum(build.price37) and length(build.pr

6、ice)number of successes =3,number of trials=16,p-value=0.02127alternatice hypothesis :true probability of success is not equal to 0.595 percent confidence interval: 0.04047373 0.45645655sample estimates:probability of success 0.18750e01e0H :MMH :MMbinomP(Sk|n,p0.5)k是满足式子的最大值 0e01e0H :MMH :MMbinomP(S

7、k | n ,p0.5) 单边符号检验问题大样本结论大样本结论当n较大时 :当n不够大的时候可用修正公式进行调整。双边: ,p-值左侧: ,p-值右侧: ,p-值 nnS N(,)24Sn 2ZN(0,1),nn 40e01e0H :MMH :MMN(0,1)2P(Zz)0e01e0H :MMH :MMN (0,1)P(Zz)0e01e0H :MMH :MMN(0,1)P(Zz)Sn 2CZN(0,1),nn 4不够大时01H :P(A)P(B)H :P(A)P(B)S22,S18,SS40例3.2 设某化妆品厂商有A和B两个品牌,为了解顾客对A品牌和B品牌在使用上的差异,将A品牌和B品牌同时

8、交给45个顾客使用,一个月后得到如下数据: 喜欢A品牌的客户人数:22人 喜欢B品牌的客户人数:18人 不能区分的人数: 5人解:假设检验问题:由给定的数据知:运用大样本的性质,结论:不能拒绝原假设。0.0540122Kn 2C22Z0.791Z1.9640 4n 4-Z0.05=-1.96 ,Z0.05=1.96, Z=0.791不在拒绝域。符号检验在配对样本比较中的应用符号检验在配对样本比较中的应用 配对样本(x1,y1), (x2,y2) , (xn,yn) 将 记为“+”, 记为“-” , 记为“0”,记P+ 为“+”比例, P- 为“-”比例, 那么假设检验问题: 可以用符号检验。i

9、ixyiixyiixyH0:P+=P- H1:P+=P-例3.4 如右表是某种商品在12家超市促销活动前后的销售额对比表,用符号检验分析促销活动的效果如何?连 促销前 促销后锁 销售额 销售额 符号店1 42 40 + 2 57 60 - 3 38 38 0 4 49 47 + 5 63 65 - 6 36 39 - 7 48 49 - 8 58 50 + 9 47 47 0 10 51 52 - 11 83 72 + 12 27 33 - 结论:不能拒绝原假设。-Z0.05=-1.96 ,Z0.05=1.96, Z=-0.9487不在拒绝域。 根据同样原理,可以将中位数符号检验推广为任意分位

10、点的符号检验。例3.1. 假设某地16座预出售的楼盘均价,单位(百元/平方米) 36,32,31,25,28,36,40,32,41,26,35,35,32,87,33,35 0100.7510.75H :37H :37H :M40H :M40 36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35 - - - - - - 0 - + - - - - + - -S+=2, S-=13, Pbinom(15, 0.75)minS+,S-binom.test(sum(x40),length(x)-1,0.75)Exact binomial testdata: sum(x 40) out of length(x)-1 number of successes = 2, n = 15, p-value = 9.23e-07alternative hypothesis: p is not equal to 0.75 R编程计算:95 percent conf

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论