已阅读5页,还剩82页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章假设检验,宋沈超,假设检验在统计方法中的地位,参数估计和假设检验,参数估计和假设检验是统计推断的两个组成部分,都是利用样本对总体进行某种推断,但推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法。假设检验讨论的是用样本信息去检验对总体参数的某种假设是否成立的程序和方法。,教学内容,第一节假设检验基本思想第二节假设检验基本步骤第三节I型错误与II型错误第四节单侧检验与双侧检验第五节假设检验需要注意的问题第六节假设检验与区间估计的联系,教学目标,掌握:假设检验的基本思想和基本步骤,掌握并理解I型错误与II型错误、检验效能的概念熟悉:假设检验需要注意的问题,单侧检验与双侧检验的概念和正确选择;理解假设检验与区间估计的联系。,第一节假设检验基本思想,一、假设检验问题的提出例1已知一个暗箱中有100个白色与黑色球,不知各有多少个。现有人猜测其中有95个白色球,是否能相信他的猜测呢?,他相当于提出假设:p=P(A)=0.05,A=任取一球是黑球.,可有两种解释:,现随机从中抽出一个球,发现是黑球,怎样解释这一事实?,1)他的猜测是正确的,恰抽得黑球是随机性所致;,2)他的猜测错了.,应接受哪一种呢?,根据小概率事件原理,事件A(黑球)的发生不能不使人们怀疑他的猜测,更倾向于认为箱中白球个数不是95个.,例2某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L)见表7-1。问新药与常规药的疗效有无差别?表7-1两种药物治疗婴幼儿贫血结果治疗药物血红蛋白增加量(g/L)新药组24362514263423201519常规药组14182015222421252723,由于事先对两种药品疗效(总体)情况一无所知,目前所关心的问题是如何根据两组样本患者治疗后血红蛋白增加量推断两种药品的疗效有无差异。可假设两组患者(总体)治疗后血红蛋白平均增加量无差异,即假设然后,利用两组样本患者治疗后血红蛋白平均增加量来检验这一假设是否正确。,例3:根据1989年的统计资料,某地女性新生儿的平均体重为3190克。1990年从该地女性新生儿中随机抽取30人,测得其平均体重为3210克。从样本数据看,1990年女新生儿体重比1989年略高。究竟是否存在显著差异?差异产生的两种可能(假设):随机误差导致的差异:生活水平提高使孕妇营养状况改善导致新生儿体重实质性增加:利用样本信息检验假设能否成立的过程称为假设检验。,上述案例的共同特点是:样本统计量与总体参数之间,或不同组样本统计量之间出现差异,这就提出了需要解决的问题:差异产生的原因(假设)?由两种误差导致:由随机误差导致样本来自同一总体,非本质差异不是随机误差导致样本来自另一总体,本质差异用样本信息检验(推断)上述假设哪个正确?,统计假设,假设检验,如何正确区分这两种误差,是解决问题的关键。,假设检验就是处理这一类问题的一种科学方法它所根据的原理是小概率原理。,二、小概率原理,假设检验所依据的基本原理是小概率原理。什么是小概率?概率是01之间的一个数,因此小概率就是接近0的一个数,一般指概率在0.05以下的事件。著名的英国统计家RonaldFisher把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率。Fisher没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,什么是小概率原理?,小概率原理发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。检验中使用的小概率由研究者在检验前事先确定。,小概率原理举例:,某工厂质检部门规定该厂产品次品率不超过4方能出厂。今从1000件产品中抽出10件,经检验有4件次品,问这批产品是否能出厂?如果假设这批产品的次品率P4,则可计算事件“抽10件产品有4件次品”的出现概率为:可见,概率是相当小的,1万次实验中可能出现4次,然而概率如此小的事件,在一次实验中居然发生了,这是不合理的,而不合理的根源在于假设这批产品次品率P4,因而认为假设次品率P4是不能成立的,故按质检部门的规定,这批产品不能出厂。,又例某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?如果从事铅作业不会影响工人的血红蛋白含量,则说明样本均数130.83g/L与总体均数140g/L的差异是由抽样误差引起的,即=0=140g/L,铅作业男性工人的平均血红蛋白含量与正常成年男性的相等。,据此,可提出原假设:H0:=0=140g/L若原假设成立,事件应该是一个小概率事件(发生的概率为)。现在|2.138|t0.05/2,35=2.030P,不拒绝H0,更不能认为H0肯定成立。由此可见,假设检验的结论是具有概率性的,无论拒绝H0或不拒绝H0,都有可能发生错误,即第一类错误或第二类错误,5.统计“有意义”与医学“有意义”统计“有意义”对应统计结论,医学“有意义”对应专业结论。统计结论有意义,专业结论无意义,最终结论没有意义,样本含量过大或设计存在问题。统计结论无意义,专业结论有意义,检查设计是否合理、样本含量是否足够。,第六节假设检验与区间估计的联系,参数估计与假设检验都是统计推断的重要内容。参数估计是根据样本统计量估计总体参数的真值;假设检验是根据样本统计量来检验对总体参数的检验假设是否成立。,一、区间估计与假设检验的主要区别1.区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;2.区间估计立足于大概率,通常以较大的把握程度(置信水平)1-去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。,二、区间估计与假设检验的联系,1.区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。2.对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。因此,利用置信区间可以进行假设检验。,练习,1、两样本比较时,分别取以下检验水准,哪一个的第二类错误最小A.=0.05B.=0.01C.=0.10D.=0.20E.=0.022、在假设检验中,P值和的关系为A.P值越大,值就越大B.P值越大,值就越小C.P值和值均可由研究者事先设定D.P值和值都不可以由研究者事先设定E.P值的大小与值的大小无关,3、假设检验中的第二类错误是指A.拒绝了实际上成立的H0B.不拒绝实际上成立的H0C.拒绝了实际上成立的H1D.不拒绝实际上不成立的H0E.拒绝时所犯的错误4、统计推断的内容是A用样本指标推断总体指标B检验统计上的“假设”CA、B均不是DA、B均是,是非题,1进行两均数差别的假设检验时,当P0.05时,则拒绝H0;当P0.05时,则接受H0,认为两总体均数无差别。,答案:错误。当P0.05,拒绝H0时,我们是依据这一小概率来下结论的。而当P0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准,接受H1的统计证据不足,或尚不能认为两总体均数有差别。,2通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。,答案:错误。根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较为稳妥。单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。,3只要增加样本含量到足够大,就可以避免I和II型错误。,答案:错误。因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I和II类错误的可能性越小。,4、若两样本均数比较的假设检验结果P值远远小于0.01,则说明差异非常大。,错。P值的大小只能说明差异是否有统计学意义,同样的差异,例数越多,P值越小。,5、对同一参数的估计,99%可信区间比90%可信区间好。,错。可信区间的优劣要通过两点衡量:区间的可信度;区间的宽度。因此不能笼统的通过区间可信度的大小来评价优劣。,简答题,1简述可信区间在假设检验问题中的作用。,可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。故将二者结合起来,才是对假设检验问题的完整分析。,2、简述假设检验中P的含义,指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。,3、假设检验时,当P0.05,则拒绝H0,理论依据是什么?,答:P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。当P0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于,也就是说,有了概率保证。,,,,,4、假设检验中与P的区别何在?,答:以t检验为例,与P都可用t分布尾部面积大小表示,所不同的是:值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。P值是由实际样本获得的,是指在H0成立的前提下,出现
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论