非参数统计 单一样本的推断问题_第1页
非参数统计 单一样本的推断问题_第2页
非参数统计 单一样本的推断问题_第3页
非参数统计 单一样本的推断问题_第4页
非参数统计 单一样本的推断问题_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

胡雪梅,QQ:182048520E-mail:huxuem,第三章,数学与统计学院,单一样本的推断问题,主要内容,第一节符号检验和分位数推断,假设总体,是总体的中位数,对于假设检验问题:是待检验的中位数取值,定义:,则在零假设情况下,在显著性水平为的拒绝域为其中k是满足上式最大的k值。,例3.1.假设某地16座预出售的楼盘均价,单位(百元/平方米)如下表所示:36323125283640324126353532873335,解一:用t检验法,用T统计量,结论:不能拒绝H0。,解二:用符号检验法,在显著性水平0.05下,拒绝H0。符号检验与t检验得到了相反的结论,到底选择哪一种结果呢?,结论:符号检验在总体分布未知的情况下优于t检验!,补充:R中的t检验法的用法,t-test(x)X1,X2,XnN(a,2),H0:a=a0,H1:aa0,补充:R中的t检验法的用法,例如,某食品厂用自动装罐机装罐头食品,每罐质量为500g,现从每天生产的罐头中随机抽测9罐,其质量分别为:510,505,498,503,492,502,497,506,495(单位:g)欲检验H0:a=500,H1:a500,t.test(x-500)data:x-500t=0.46,df=8,p-value=0.6578alternativehypothesis:meanisnotequalto095percentconfidenceinterval:-3.5674715.345249sampleestimates:meanofx0.8888889,2)配对t检验法X1,X2,XnN(a1,12),Y1,Y2,YnN(a2,22),H0:a1=a2,H1:a140),length(x)-1,0.75)Exactbinomialtestdata:sum(x40)outoflength(x)-1numberofsuccesses=2,n=15,p-value=9.23e-07alternativehypothesis:pisnotequalto0.75,R编程计算:,95percentconfidenceinterval:0.016575910.40460270sampleestimates:probabilityofsuccess0.1333333,Cox-Staut趋势存在性检验,检验原理:设数据序列:,双边假设检验问题:令:取数对,为正的数目,为负的数目,当正号或者负号太多的时候,认为数据存在趋势。在零假设情况下Di服从二项分布。从而转化为符号检验问题。,X1,X2,Xn,例3.6某地区32年来的降雨量如下表问(1):该地区前10年来降雨量是否有变化?(2):该地区32年来降雨量是否有变化?,年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210,=5,结论:不能拒绝零假设。,xybinom.test(sum(xy),length(x-y),0.5)Exactbinomialtestdata:sum(xy)outoflength(x-y)numberofsuccesses=2,n=16,p-value=0.004181alternativehypothesis:pisnotequalto0.5结论:拒绝H0,认为降雨量有明显变化.,rainyearanova(lm(rain(year)AnalysisofVarianceTableResponse:rainTermsaddedsequentially(firsttolast)DfSumofSqMeanSqFValuePr(F)year1535.36535.36371.5792280.2185691Residuals3010170.11339.0035接受H0,认为降雨量线性趋势并不显著.,随机游程检验,游程的概念一个总体,如按性别区分的人群,按产品是否有毛病区分的总体等等,随机从中抽取一个样本,样本也可以分为两类;类型I和类型E。若凡属类型I的给以符号A,类型E的给以符号B,则当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就是说,游程是在一个两种类型的符号的有序排列中,相同符号连续出现的段。,例如,将某售票处排队等候购票的人按性别区分,男以A表示,女以B表示。按到来的时间先后观察序列为:AABABB。在这个序列中,AA为一个游程,连续出现两个A;B是一个游程,A也是一个游程,BB也是一个游程。于是,在这个序列中,A的游程有2个,B的游程也有2个,序列共有4个游程。每一个游程所包含的符号的个数,称为游程的长度。如上面的序列中,有一个长度为2的A游程、一个长度为2的B游程,长度为1的A游程、B游程也有1个。,游程:01111为两个游程游程长度:一个游程中数据的个数一个序列里游程个数记为R.例3.7序列1100001110110000111100R=8,游程长度分别为2,4,3,1,2,4,4,2极端情况:000001111111R=20101010101010R=2min(n0,n1)+1所以,2R2min(n0,n1)+1极端情况都说明数据不具有随机性。R服从什么分布呢?,检验原理和计算方法,设是由0或者1组成的序列,假设检验问题:,R为游程个数,假设有个0,个1,这时R取任何一个值的概率都是,R的条件分布,建立了抽样分布之后,在零假设成立时,可以计算或者的值,进行检验。,X1,X2,Xn,小样本的例子(p69例3.8),H0:样本中的观测是随机产生的.Ha:样本中的观测是随机产生的=.05n1=18n2=8R=12由于7R=1217,不能拒绝H0,RunsTest:大样本的例子,经验表明:如果n1或n220,R的抽样分布近似为正态,RunsTest:大样本例子(p70例3.10),H0:样本中的观测是随机产生的.Ha:样本中的观测是随机产生的=.05n1=40n2=10如果-1.96Z1.96,不能拒绝H0否则拒绝H0.1123456789011NNNFNNNNNNNFNNFFNNNNNNFNNNNFNNNNN1213FFFFNNNNNNNNNNNNR=13,RunsTest:大样本例子,-1.96Z=-1.811.96,不能拒绝H0,/web/packages/tseries/index.html,library(tseries)run1=c(1,1,1,0,rep(1,7),0,1,1,0,0,rep(1,6),+0,rep(1,4),0,rep(1,5),rep(0,4),rep(1,13)ff=as.factor(run1)runs.test(ff)RunsTestdata:ffStandardNormal=-1.8074,p-value=0.0707alternativehypothesis:two.sided,Wilcoxon符号秩检验,基本概念及性质对称分布的中心一定是中位数,在对称分布情况下,中位数不唯一,研究对称中心比中位数更有意义。,例:下面的数据中,O是对称中心吗?,称连续分布F(x)关于对称,如果,称是分布的对称中心。,Wilcoxon符号秩检验既考虑了Xi-M0的符号,又考虑其大小。,Wilcoxon符号秩检验原理以及性质,如果数据关于0点对称,那么对称中心两侧的数据疏密程度应该一样,取正值数据在绝对值样本中的秩和与取负值在绝对值样本中的秩和相近。,用表示在绝对值样本中的秩,Wilcoxon符号秩统计量定义为:,正等级的总和即正秩次总和,负等级的总和即负秩次总和,Wilcoxon符号秩检验原理以及性质,例3.11如果样本值:9,13,-7,10,-18,4,计算符号秩统计量。,Wilcoxon符号秩检验步骤:,3.令表示和对应的的秩和,令表示和对应的的秩和。,2.找出的秩,打结时取平均秩。,1.计算,4.双边检验,取,当W很小时拒绝零假设;对,取;对,取。,5.根据W的值查Wilcoxon符号秩检验分布表。对n很大的时候,可以采用正态近似。,Wilcoxon符号秩统计量分布,在小样本情况下可以计算Wilcoxon符号秩统计量的精确分布。在大样本情况下可以使用正态近似:,计算出Z值以后,查正态分布表对应的p-值,如果p-值很小,则拒绝零假设。,在小样本情况下,用连续性修正公式:,例3.12,为了解垃圾邮件对大型公司决策层工作发影响程度,某网站收集了19家大型公司的CEO邮箱里每天收到的垃圾邮件数,得到如下数据:(单位:封)310350370377389400415425440295325296250340298365375360385问收到垃圾邮件的数量的中心位置是否超出320封?,使用Wilcoxon符号秩检验法计算如下:,例3.12,结论:不拒绝原假设。,例3.12,用R的内置函数计算格式:wilcox.test(x,y,alternative=two.sided,mu=0,paired=F,exact=T,correct=T)alternativetwo.sided“orgreaterorlessmuX分布的中心位置paired是否是配对exact使用W+的精确分布correct使用正态近似,xywilcox.test(x,y)ExactWilcoxonrank-sumtestdata:xandyrank-sumstatisticW=135,n=10,m=10,p-value=0.0232alternativehypothesis:muisnotequalto0wilcox.test(x,y,alternative=greater)ExactWilcoxonrank-sumtestdata:xandyrank-sumstatisticW=135,n=10,m=10,p-value=0.0116alternativehypothesis:muisgreaterthan0,例3.12,ssnwilcox.test(x-320)Wilcoxo

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论