《分布类型的检验》PPT课件_第1页
《分布类型的检验》PPT课件_第2页
《分布类型的检验》PPT课件_第3页
《分布类型的检验》PPT课件_第4页
《分布类型的检验》PPT课件_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三部分常用假设检验方法,第10章分布类型的检验,10.1假设检验的基本思想10.2正态分布检验10.3二项分布检验10.4游程检验10.5本章小结,第11章连续变量的统计推断(一)t检验,11.1t检验基础11.2样本均数与总体均数的比较11.3成组设计两样本均数的比较11.4配对设计样本均数的比较11.5本章小结,10.1假设检验的基本思想,10.1.1问题的提出10.1.2假设检验的基本思想10.1.3假设检验的两类错误10.1.4假设检验中的其他问题,10.1.1问题的提出,在总体的分布函数完全未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服正态分布的假设;对正态总体提出均值等于a0的假设等等。假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝。,10.1.1问题的提出,假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。,10.1.2假设检验的基本思想,如何利用样本值对一个具体的假设进行检验?通常借助于直观分析和理论分析相结合的做法,其基本原理就是人们在实际问题中经常采用的所谓小概率反证法思想。小概率思想是指小概率事件(P5;这意味着,至少样本均值应该大于5;,10.1.2假设检验的基本思想,至于是否显著,依检验结果而定。检验结果显著(significant)意味着有理由拒绝零假设。因此,假设检验也被称为显著性检验(significanttest)。,10.1.2假设检验的基本思想,有了两个假设,就要根据数据来对它们进行判断。数据的代表是作为其函数的统计量;它在检验中被称为检验统计量(teststatistic)。根据零假设(不是备选假设!),可得到该检验统计量的分布;再看这个统计量的数据实现值(realization)属不属于小概率事件。,10.1.2假设检验的基本思想,也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;如果的确是小概率事件,那么就有可能拒绝零假设,或者说“该检验显著。”否则说“没有足够证据拒绝零假设”,或者“该检验不显著。”,10.1.2假设检验的基本思想,在零假设下,检验统计量取其实现值及(沿着备选假设的方向)更加极端值的概率称为p-值(p-value)。如果得到很小的p-值,就意味着在零假设下小概率事件发生了。如果小概率事件发生,是相信零假设,还是相信数据呢?当然多半是相信数据,拒绝零假设。,10.1.2假设检验的基本思想,但小概率并不能说明不会发生,仅仅发生的概率很小罢了。拒绝正确零假设的错误常被称为第一类错误(typeIerror)。在备选假设正确时反而说零假设正确的错误,称为第二类错误(typeIIerror)。,10.1.2假设检验的基本思想,零假设和备选假设哪一个正确,是确定性的,没有概率可言。而可能犯错误的是人。涉及假设检验的犯错误的概率就是犯第一类错误的概率和犯第二类错误的概率。负责任的态度是无论做出什么决策,都应该给出该决策可能犯错误的概率。,10.1.2假设检验的基本思想,到底p-值是多小时才能够拒绝零假设呢?也就是说,需要有什么是小概率的标准。这要看具体应用的需要。但在一般的统计书和软件中,使用最多的标准是在零假设下(或零假设正确时)根据样本所得的数据来拒绝零假设的概率应小于0.05,当然也可能是0.01,0.005,0.001等等。,10.1.2假设检验的基本思想,这种事先规定的概率称为显著性水平(significantlevel),用字母alpha来表示。alpha并不一定越小越好,因为这很可能导致不容易拒绝零假设,使得犯第二类错误的概率增大。,10.1.2假设检验的基本思想,当p-值小于或等于alpha时,就拒绝零假设。所以,alpha是所允许的犯第一类错误概率的最大值。当p-值小于或等于alpha时,拒绝原假设H0,就说这个检验是显著的。无论统计学家用多大的alpha作为显著性水平都不能脱离实际问题的背景。统计显著不一定等价于实际显著。反过来也一样。,10.1.2假设检验的基本思想,实际上,多数计算机软件仅仅给出p-值,这有很多方便之处。比如alpha=0.05,而假定所得到的p-值等于0.001。这时如果采用p-值作为新的显著性水平,即新的alpha=0.001,于是就可以说,在显著性水平为0.001时,拒绝零假设。,10.1.2假设检验的基本思想,这样,拒绝零假设时犯错误的概率实际只是千分之一而不是旧的alpha所表明的百分之五。在这个意义上,p-值又称为观测的显著性水平(observedsignificantlevel)。在统计软件输出p-值的位置,有的用“p-value”,有的用significant的缩写“Sig”就是这个道理。,10.1.2假设检验的基本思想,归纳起来,假设检验的一般步骤为:1.写出零假设和备选假设;2.确定检验统计量;3.确定显著性水平;4.根据数据计算检验统计量的实现值;5.根据这个实现值计算p-值;,10.1.2假设检验的基本思想,6.进行判断:如果p-值小于或等于alpha,就拒绝零假设,这时犯(第一类)错误的概率最多为alpha;如果p-值大于alpha,就不拒绝零假设,因为证据不足。,10.1.4假设检验中的其他问题,(1)做假设检验之前,应注意资料本身是否有可比性。(2)当差别有统计学意义时应注意这样的差别在实际应用中有无意义。(3)根据资料类型和特点选用正确的假设检验方法。(4)根据专业及经验确定是选用单侧检验还是双侧检验。,10.1.4假设检验中的其他问题,(5)当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。,10.1.4假设检验中的其他问题,(6)判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。(7)报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。,10.2正态分布检验,10.2.1K-S检验的原理10.2.2分析实例,10.2.1K-S检验的原理,单样本的Kolmogorov-Smirnov检验(K-S检验,柯尔莫哥诺夫-斯米尔诺夫检验)是用来检验一个数据的观测累积分布是否是已知的理论分布。设总体XF(x),F(x)是未知的,F0(x)是一个给定的分布函数,欲检验H0:F(x)=F0(x),10.2.1K-S检验的原理,由于当n较大时,理论上有经验分布函数Fn(x)是F(x)的良好近似。构造KolmogorovSmirnov统计量,来反映F(x)和F0(x)之间的差异,若D较小,表明二者间没有显著差异,否则有显著差异。,10.2.1K-S检验的原理,KolmogorovSmirnov证明了统计量D的极限分布为Q()分布,计算出,记为Z值,并根据极限分布计算出相应的显著性概率,若Sig.小于给点的显著性水平alpha,则拒绝H0,否则,接受H0.,10.2.2分析实例,例12.1请判断SPSS自带数据集anxity.sav中score的分布是否服从正态分布。操作如下:AnalyzeNonparametictest1-sampleK-STestvariablelist框:选入scoreTestdistribution复选框组:选中normal复选框单击OK钮系统给出的统计分析结果,具体如下:,数据文件,操作过程,由于p=Sig.=0.6520.05,故接受原假设,认为score服从正态分布。,注意,K-S检验可以检验正态分布,均匀分布,泊松分布,指数分布。,10.3二项分布检验,10.3.1二项分布检验的原理10.3.2分析实例,10.3.1二项分布检验的原理,当一个变量只取0,1值时,称为二分值变量。当一个问题只有两种可能结果时,称为二分值问题。二分值问题的一种结果称为“成功”,另一种称为“失败”。二项分布检验(BinomialTest)就是对二分值问题的成功概率进行检验。,10.3.1二项分布检验的原理,设S+表示对二分值问题进行n次试验中成功的次数。例如用同样的方法掷一枚硬币100次,出现正面44次,出现反面56次,问该硬币是否均匀?该例中S+=44,S-=56,检验假设为:H0:p=p0=0.5当H0为真时,S+服从参数为P0的二项分布。,10.3.1二项分布检验的原理,计算S+的值,并根据二项分布计算相应的显著性概率Sig.,若Sig.小于给定的显著性水平alpha,则拒绝H0,否则接受拒绝H0。因为是基于二项分布的概率进行判断,所以此种检验法称为二项分布检验法。当试验总次数n较大时,S+近似服从正态分布。所以往往根据正态分布计算Sig.的近似值。,10.3.2分析实例,例10.6根据以往经验,新生儿染色体异常率一般为1%,现某医院观察了当地共400名新生儿,只发现一例染色体异常。数据见binominal.sav,该地新生儿染色体异常率是否低于一般?,10.3.2分析实例,原假设:H0:p=0.01,异常率并无不同备择假设:H1:pBinomialTestVariable:染色体异常率illTestProportion:0.01,10.3.2分析实例,Sig=.090(按正态分布近似计算)0.05,不能拒绝原假设,尚不能认为异常率低于一般。,10.4游程检验,10.4.1游程检验的原理10.4.2分析实例,10.4.1游程检验的原理,游程检验(Runstest)与二项分布检验都是对二分值问题进行检验,但它不是对“成功”概率进行检验,而是检验多个二分值问题之间是否相互独立?原假设H0:多个二分值问题之间独立游程检验是基于游程数的多少来检验,那么什么是游程呢?,10.4.1游程检验的原理,游程就是0,1序列中0或者1的连续段,即0或1的每个连续段称为一个游程。设天气预报记录20天是否下雨的情况,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨对以后天气是否下雨有无影响?易知该记录总游程数U=11。,10.4.1游程检验的原理,如果原假设H0成立,则0,1序列交替均匀,从而总游程数U较大,否则U较小。所以,我们可以通过总游程数U的大小来判断H0是否成立。选择U为检验统计量,当样本数n较大时,U近似服从正态分布。根据相应分布计算p值,然后做出判断。,10.4.2分析实例,设天气预报记录20天是否下雨的情况,得到以下序列(1表示下雨,0表示不下雨)00110111000100100010,研究者想知道某一天下雨或不下雨对以后天气是否下雨有无影响?建立数据文件见右图所示,10.4.2分析实例,AnalyzeNonparametricTestsRunsTestVariable:下雨否CutPoint:Custom:1注意:有时在一些数据表中所检验的变量不是二分值变量,如教材例10.7,此时需要给定一个分割点(CutPoint),把它转化为二分值变量。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论