




已阅读5页,还剩54页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
医学统计学,假设检验 Hypothesis Test,第五章 假设检验,Question,总体是100例正常成年男子的红细胞数(1012/L,以下省略),从中随机抽取样本a1 和样本 a2 ;总体B是另外100例正常成年男子的红细胞数,从中随机抽取样本b ;三个样本的含量均为10例,有关数值如下:,Question,在已知A和B总体参数时,a1-a2,a1-b1,Question,假如事先不知道A和B是不是同一个总体,a1-b1,?,一、假设检验的意义,红细胞数(1012/L)。 甲: n = 10, = 5.442,测自高原地区正常成年男子; 乙: n = 10, = 5.135,测自平原地区正常成年男子。 现在问题是:从以上结果能否认为高原地区正常成年男子的红细胞数高于平原地区?,假设检验的意义,a1-a2,a1-b1,假设检验的意义,假设检验的基本意义就是分辨两个样本是否分别属于两个或多个不同的总体,并对总体作出适当的结论。 两个样本的概念也可以扩展为两个以上的样本。 分辨一个样本是否属于某特定总体 。,二、假设检验的基本思想,例为研究某山区成年男子的脉搏均数是否不同于一般成年男子的脉搏均数。某医生在一山区随机抽查了25名健康成年男子,求得其均数为74.2次/分,标准差为6.5次/分。根据大量调查,已知健康成年男子脉搏均数为72次/分,能否据此认为该山区成年男子的脉搏均数不同于一般成年男子的脉搏均数?,假设检验的基本思想,0,0,问题本质:是否0 假设=0,反证法,假设检验的基本思想,提出一个假设:同一总体,差别由抽样误差造成 如果假设成立,求出由于抽样误差得到现有样本的可能性 可能性很小(小概率事件),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。 有可能得到手头的结果,故根据现有的样本无法拒绝事先的假设(没理由),假设检验的基本思想,以确立的假设总体为依据,求出从假设总体中获得手头样本(含与总体参数偏离更大的样本)之概率,通过对此概率的界定来作出结论。,假设,抽样误差的可能性,可能性很小,可能性较大,拒绝原假设,不拒绝原假设,三、假设检验的一般步骤,例正常人脉搏72次/分。从某病患者中随机抽取81人,其样本均数74.8次/分,标准差8.7次/分。那么该病是否会影响脉搏?,假设检验的一般步骤,从资料提供的信息来看,样本均数74.8与总体均数72并不相等,其原因可有以下两个方面: 样本对应的总体均数等于72,差别仅仅是由于抽样误差所致; 除抽样误差外,病人与正常人存在本质上的差异,即该病会影响血压。 两种情况只有一个是正确的,且二者必居其一,需要我们作出推断。,假设检验的一般步骤,步骤1:建立假设 在假设的前提下有规律可寻 零假设(null hypothesis),记为H0,表示目前的差异是由于抽样误差引起的。 备择假设(alternative hypothesis),记为H1,表示目前的差异是由于本质上的差别引起的,常见的H0和H1假设形式,H0:1 2 H1:1 2 H0:1 = 2 = 3 H1:1、2、3之间全不相等或不全相等 H0: 0 H1: 0,假设检验的一般步骤,H0:72,病人与正常人的平均脉搏相等; H1:72,病人与正常人的平均脉搏不等。 H0假设比较单纯、明确,且在该假设的前提下有规律可寻。而H1假设包含的情况比较复杂。假设检验是针对H0的。,假设检验的一般步骤,步骤2:确立检验水准(小概率标准) 用于确定当检验统计量在什么范围内拒绝H0 。即此时样本统计量与参数的差别不是仅仅由抽样误差所能解释的。 检验水准有单双侧之分。选择要有专业背景。 检验水准大小的选择要慎重。,单双侧检验假设的变化,单双侧检验假设的变化,单双侧检验注意点,双侧检验拒绝H0,单侧检验一定拒绝H0 单侧检验不拒绝H0 ,双侧检验一定不拒绝H0 探讨性的研究多采用双侧检验,证实性的研究多采用单侧检验。,Guilty or Innocent?,对于谋杀案的嫌疑人,要细心地寻找蛛丝马迹,需要尺度比较严,因为让凶手逍遥法外是极度危险的; 对于一般的小偷小摸,尺度就比较松; 在假设检验时,如果错误地不拒绝零假设的后果很严重,就需要严格尺度,即选择一个较大的;否则要选择稍小的; 一般选择=0.05。,假设检验的一般步骤,步骤3:计算检验统计量并求P值 即计算样本与所假设总体的偏离 ; 根据分析目的、设计类型,选用适当的检验方法,计算相应的统计量; 根据检验统计量的分布求P值。 P值就是指在H0所规定的总体中随机抽样,获得大于等于(或小于等于)现有样本统计量的概率。,假设检验的一般步骤,例题中,H0假设前提下,样本均数与总体均数0 间的差别可以用统计量t来表示:,假设检验的一般步骤,统计量t:在标准误的尺度下,样本均数与总体均数0的偏离。 根据抽样误差理论,在H0的假设前提下,统计量t服从自由度为n-1的t分布。 t值在0的附近的可能性大,远离0的可能性小。 而若t值落在检验水准所对应的界值之外, 则认为从H0所规定的总体中得到现有的样本是小概率事件。则拒绝H0。,假设检验的一般步骤,本例中已知 n=81, =74.8(次/分),s=8.7(次/分),0=72(次/分),则检验统计量t:,假设检验的一般步骤,求与统计量t值对应的概率 ; 即在H0成立的前提下,获得现有这么大的t值以及更大 t 值 (| t | 2.90)的可能性; 查自由度为80的t界值表 P=P(| t | 1.99)=0.05 P=P(| t | 2.90)0.05,步骤4:界定P值并作结论 根据小概率原理作出推断(与检验水准比较); 若P( 0.05),根据抽样分布规律,在H0成立的前提下出现现有差别或更大差别的可能性P小于等于0.05,是小概率事件,根据小概率原理,是不可能发生的。然而不可能发生的事件在一次独立试验中居然发生了,即现有样本信息不支持H0。因此,拒绝H0, 接受H1。,若P ,说明在H0成立的前提下出现现有差别或更大差别的可能性P不是小概率事件,因此,没有理由拒绝H0。可见,抉择的标准为: 当P 时,拒绝H0,接受H1,差异有统计学意义; 当P 时,不拒绝H0,差异无统计学意义。,本例P0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为该病患者的脉搏次数高于正常人。即该病会影响脉搏。,假设检验独特的思维,假设检验独特的思维:先根据研究目的建立一个假设,再分析样本提供的信息是否支持这种假设,从而作出推断结论。,四、假设检验的正确应用,1、实施假设检验的前提,确认指标或数据分布的意义。 金标准、等级划分标准 确认样本的随机化。,2、正确理解P值,P值的涵义:在H0所规定的总体中随机抽样,获得大于等于(或小于等于)现有样本统计量的概率。 拒绝H0时: P值小,风险小,误差小; P值大,风险大,误差大。,3、Significant 的本义,传统表述: “拒绝H0,接受H1”习惯上称为“显著”,英文“significant” ; “不拒绝H0”称为“不显著”,英文“non-significant”。 Significant的本义:“有意义的”、“非偶然的”,错误理解,把“显著”理解为差别很大,甚至理解为在医学实践中有重要的价值; 把“不显著”理解为差别不大或一定相等。 建议:用“有、无统计学意义”来取代“显著与不显著” P ,拒绝H0,接受H1,差异有统计学意义; P ,不拒绝H0,差异尚无统计学意义。,4、 水准在结论中的意义,按不超过多大的误差为条件而作结论: = 0.05,得P , 按误差不超过5的条件拒绝H0接受H1; = 0.01,得P ,按误差不超过1的条件拒绝H0接受H1 ; 采用更小的 水准,当P值小于此水准时,说明所作结论的误差更小,所冒的风险更小。,常见错误结论用语,当 = 0.05,P ,认为H1有“显著差异” ; 当 = 0.01,P ,认为H1有“非常显著差异” ; 当 = 0.001,P ,认为H1有“极显著差异” ; 导致 水准的大小与结论具体内容紧密联系 导致“P值越小,差异越大”的错误观念,五、假设检验的相关问题,一、结论的概率性,H0条件下出现等于大于(或等于小于)现有统计量的概率虽小,但实际上是有可能出现的,所以在下结论的时候,虽然拒绝H0 ,但不能认为H0肯定不成立;相反,不拒绝H0 ,也不能认为H0肯定成立。 假设检验的结论建立在小概率原理的基础之上,结论本身具有一定的概率性,无论拒绝H0或不拒绝H0 ,都有可能发生错误,都冒了一定概率的风险。,二、两类错误,当H0是真实的,拒绝H0是错误的,不拒绝H0则是正确的。 当H0是不真实的,拒绝H0是正确的,不拒绝H0则是错误的。 存在二种正确推断和二种错误推断。,两类错误,为区别这两种错误,统计学上规定: 型错误 (Type I Error) 拒绝了实际上是成立的H0“弃真” 型错误(Type II Error) 不拒绝实际上是不成立的H0“存伪”,两类错误,如果把H0视作阴性事件,而把H1视作阳性事件,则二种错误的意义如下: 型错误拒绝真实的H0 假阳性 型错误拒绝真实的H1 假阴性,两类错误,健康人与肝病病人的肝大指数分布 (所拟合的两个正态曲线各按100%面积绘制),6.1 7.0 8.4,1、型错误,当样本来自于健康人,相当于H0成立,由于抽样的偶然性,得到较大的检验统计量,于是按检验水准拒绝H0 ,接受H1,认为该样本来自于肝病病人,此推断显然是错误的。 犯型错误的概率常用表示。一般假设检验取检验水准 =0.05,理论上平均每100次抽样就有5次发生这样的错误。,2、型错误,相反,当样本来自肝病病人,即H0实际上不成立,由于抽样的偶然性,得到较小的检验统计量,因此按检验水准不拒绝H0,认为该样本来自于健康人,此推断当然也是错误的。 型错误发生的概率用表示,通常当n固定时,越小,越大;反之,越大,越小。,两类错误,在实际工作中,可根据研究要求适当控制和。 若重点在于减少,一般取=0.01; 若重点在于减小,一般取=0.05; 若要同时减小和的唯一方法就是增加样本含量。,两类错误,当P 而拒绝H0接受H1,要注意第一类错误出现; 当P 而不拒绝H0,要注意第二类错误的出现。 第二类错误率 表示失去对真实H1作出肯定结论的概率, 1 就是对真实的H1作出肯定结论的概率,常被用来表达某假设检验方法的检验的功效。,两类错误,1-称为检验效能(power of a test) 统计学意义为:若两总体确实存在差别,按水准能发现其差别的能力。 例如1-=0.9的理论含义是若两总体确实有差别,平均每100次抽样有90次能得出有差别的结论。 检验效能越大,按检验水准拒绝H0,推断两总体均数确实有差别的把握就越大,所以检验效能又称把握度。,两类错误,拒绝H0,接受H1 不拒绝H0 H0真实 型错误( ) 推断正确 (1) H0不真实 推断正确 (1) 型错误(),三、单双侧检验的实际问题,1、如何选用单、双侧检验 若要分出甲、乙两种方法的优劣,包含了甲优于乙或者乙优于甲两种可能的结果,应选用双侧检验。 若甲是从乙改进而得,已知改进可能有效,也可能无效,但不可能改进后反不如前,应选用单侧检验。 当遇情况比较复杂时,还是应选用双侧检验为好。,2、单、双侧检验的利弊 相同资料用相同方法分别进行单、双侧检验时,则双侧检验所得的P值一般大于单侧检验的P值。对于t检验,则双侧检验所得P值是单侧检验所得P值的2倍。 如出现以下结果,双侧检验与单侧检验的结论将相反( = 0.05 ): 设P(2)= 0.08,P(2) ,不拒绝H0 ; 则P(1)= 0.04,P(1) ,拒绝H0,接受H1 。,3、切勿混淆单、双侧检验与单、双尾面积 检验统计量分布的单、双尾面积是指P值在某特定分布的密度函数图形中的位置:属单向尾部面积;或属双向尾部面积之和。 单侧检验与单尾面积,双侧检验与双尾面积均无必然联系,不得混淆。 t检验、u检验、秩和检验、四格表确切概率检验、等级相关检验等方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《2025年劳动合同解除协议范本》
- 2025年武汉劳动合同模板
- 2025年劳动合同制度与社会保障制度的融合与发展
- 搬运安全知识培训课件
- 精准选人用人新途径:村干部招聘面试题解读
- 工业互联网面试题库:各行业面试必 备
- 艺术学校面试经验分享:洛阳艺校面试题及应对策略
- 绿色能源领域求职者必 备:煤化工行业招聘面试题及答案解析
- 高级商务面试题库指南
- 高级生物信息学分析岗位面试题
- 2023-2029年中国城市隧道养护管理行业市场发展现状及投资战略咨询报告
- 2025年上半年黔东南州凯里市事业单位招考及易考易错模拟试题(共500题)试卷后附参考答案
- 2024年国家安全法深度解读
- 工业自动化生产作业指导书
- 心脏康复戒烟处方
- MARSI-医用黏胶相关皮肤损伤(资料)
- 全国职业院校技能大赛中职(大数据应用与服务赛项)考试题及答案
- 实验室检验结果及报告管理制度
- 人教英语PEP版小学五年级英语上册单元练习试卷一
- 《竞争优势:透视企业护城河》笔记
- 国网35条严重违章及其释义解读课件
评论
0/150
提交评论