第六讲-卫生统计学--假设检验基础_第1页
第六讲-卫生统计学--假设检验基础_第2页
第六讲-卫生统计学--假设检验基础_第3页
第六讲-卫生统计学--假设检验基础_第4页
第六讲-卫生统计学--假设检验基础_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章假设检验基础,第一节假设检验的概念与原理,一、假设检验的思维逻辑某商家宣称他的一大批鸡蛋“坏(变质)蛋率为1%”。对这批鸡蛋的质量做出判断(即“坏蛋率为1%”还是“坏蛋率高于1%”)。在“坏蛋率为1%”的前提下,5个鸡蛋样品中出现一个“坏蛋”的机会是很小的,“小概率事件在一次随机试验中不(大)可能发生”的。本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。,二、假设检验的特点,1、需要全局的范围,即从总体上对问题作出判断;2、不可能或者不允许对研究总体的每一个个体均进行观察。做法:从总体中抽取大小合适的样本,然后应用假设检验理论与方法,依据样本提供的有限信息对总体做出推断。,三、假设检验的基本思想,假设检验是对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能是来自这个总体。,例题:根据大量调查,已知健康成年男子的脉搏均数为72次分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次分,标准差为6.5次分。能否认为该山区的成年男子的脉搏均数不同于一般成年男子的脉搏均数?,本例一般成年男子的脉搏均数可视为一个总体均数,山区男子的脉搏均数为样本均数。故已知:0=72,=74.2,s=6.5,n=30。对一个样本均数与一个已知的或假设的总体均数0作比较,它们之间的差别可能有两种原因造成:1、由于抽样误差所致,山区男子脉搏的总体均数与一般成年男子的脉搏数总体均数相同,现在所得样本均数74.2次/分与总体均数72次/分之差仅仅是由于抽样误差造成的。2、由于环境条件的影响,两个均数间有本质差异,即山区男子脉搏总体均数与一般男子的脉搏总体均数不同。,例题分析:,四、假设检验的基本步骤,1建立假设:,假设有两个:,(1)无效假设(nullhypothesis)符号为H0,即样本均数所代表的总体均数与假设的总体均数0相等,即=0。,(2)备择假设(alternativehypothesis)符号为H1,它是在拒绝H0的情况而被接受的假设,即样本均数所代表的总体均数与0不相等,记为H1:0。或0或0(或,则按所取的水准不拒绝H0。,图6-1假设检验示意图,第二节t检验,一、一组样本资料的t检验检验假设H0:=0,H1:0(单侧检验0或0.05,所以在0.05水准上,不拒绝H0,尚不能认为该山区成年男子的脉搏均数高于一般成年男子。注:单侧t0.05,291.699,本例最好用单侧检验。,可信区间方法解答:,山区成年男子脉搏均数的95%可信区间为:=71.876.6,0=72次/分,在可信区间范围内,故不能认为山区成年男子脉搏总体均数与一般成年男子不同。反之,若可信区间范围不包含0,则认为山区成年男子脉搏均数与一般成年男子脉搏均数不同。,例7-1:已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?,1、选择检验方法,建立检验假设并确定检验水准H0:=0=14.1(月),总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同;H1:014.1(月),该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平。检验水准(sizeofatest):=0.052.计算统计量,t检验的统计量:,3、确定P值P值的意义是:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。=n-1=36-1=35,查t界值表,得单侧t0.05,35=1.690,t0.05。,4、判断结果对“H0是否真实”作出判断。如果P值小于或等于检验水准,意味着在H0成立的前提下发生了小概率事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀疑H0的真实性,从而做出拒绝(reject)H0的决策。因为H0与H1是对立的,既然拒绝H0,就只能接受H1。如果P值大于,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。,由于P0.05,意味着如果该县儿童前囟门闭合的平均月龄为14.1月,观察到囟门闭合月龄均值为14.3月的样本(以及均值更大的样本)的可能性还是比较大的(概率大于0.05),没有理由对H0提出怀疑,于是做出不拒绝H0的推断结论。无论做出哪一种推断结论(接受或是拒绝H0),都面临着发生判断错误的风险。这就是假设检验的两类错误。,二、配对设计资料的t检验,实施的形式主要有:(1)将受试对象配成特征(主要非处理因素)相近的对子,同对的两个受试对象随机分别接受不同处理;(2)同一样品分成两份,随机分别接受不同处理(或测量)。(3)同一批受试对象实验前后的比较。,例7-2:应用克矽平治疗矽肺患者10人,治疗前后血红蛋白的含量(g%)如下表第(2)、(3)栏,问该药是否会引起血红蛋白含量的变化?,d,d2,1建立假设,确定检验水准:H0:d0H1:d00.052计算t值:,3确定P值:n11019,查t界值表t0.05(9)2.262,因为t0.054判断结果:因P0.05,故按0.05水准,不拒绝H0,故无理由认为该药会引起血红蛋白含量的变化。,例7-3用两种方法测定12份血清样品中Mg2+含量(mmol/l)的结果见表6-2。试问两种方法测定结果有无差异?,表6-2两种方法测定血清Mg2+(mmol/l)的结果,1、建立假设H0:d=0,H1:d0=0.05n=12,d=-0.04,d2=0.026,2、计算统计量,3、确定P值自由度=n-1=12-1=11,查附表2(t临界值表),双侧t0.05,11=2.201,t0.05。4、判断结果在=0.05水准上,因P0.05,不拒绝H0。所以尚不能认为两法测定结果不同(尚不能认为两法测定结果差异有统计学意义)。,三、两组独立样本资料的假设检验,将受试对象随机分配成两个处理组,每一组随机接受一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。在实际工作中按完全随机设计的两样本比较来对待。(一)两个小样本均数比较的t检验应用条件:两样本是相互独立的随机样本;两样本来自正态总体;两处理组总体方差相等,即方差齐性或齐同。,例7-4某妇产医院的研究者欲探索孕妇在孕期补充钙制剂对血清骨钙素(ng/ml)的影响,选取孕妇的年龄、基础骨钙素水平接近,孕周在2628周的30名孕妇,随机分成两组,每组15人。试验组孕妇补充选定的某种钙制剂,对照组孕妇采用传统膳食。产后4050天内测定两组孕妇血清骨钙素的改变值(产后骨钙素与产前骨钙素的差值)结果如下:试验组:10.28.910.19.2-0.810.66.511.29.38.010.79.512.714.411.9对照组:5.06.7-1.44.07.1-0.62.84.33.75.84.66.04.15.14.7问孕期补钙和传统膳食的产妇骨钙素的改变值的总体均数有无差异?,1、建立假设H0:1=2H1:12=0.052、计算统计量t值这里n1=15,S1=3.425,n2=15,S2=2.374。,3、确定P值自由度=n1+n2-2=15+15-2=28查t临界值表,t0.05,28=2.048,tt0.05,11,故P0.05。4、判断结果因PF0.05(7,11),故Pt0.05,14,故P2.58,故P2.58,故P0.05,按=0.05水准,尚不能拒绝H0。尚不能认为2005年该市无菌发脓发生率未达到要求。,(二)两组独立样本资料的Z检验,当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z检验对其总体均数进行推断。两样本观测单位数相等时,检验统计量为:两样本观测单位数不等时,检验统计量为:,例7-11某市对不同性别成年人(18岁以上)意外伤害死亡情况有无差别的研究中,随机抽取了该市2002年男女疾病监测数据各10万人,因意外伤害死亡的人数男女分别为51人和23人。试问2002年不同性别每10万人口意外伤害死亡平均人数是否相等?1、建立假设H0:1=2,H1:12=0.052、计算统计量,3、确定P值按=查附表2(t临界值表),知Z0.01=2.58,因ZZ0.01,所以P0.01。4、判断结果因PZ0.05,所以P0.05。4、判断结果因P0.05,在=0.05的水平上拒绝H0,接受H1,可以认为工艺改革前后粉尘浓度不同。,第四节假设检验与区间估计的关系,1、置信区间具有假设检验的主要功能(1)双侧检验例7-2资料:显然,H0:不在此区间之内。这与按照=0.05水准拒绝H0的推断结论是等价的。,(2)单侧检验结合例7-1的资料,对东北某县农村儿童前囟门闭合月龄总体均数的95%单侧置信区间的下限为:可以看到,H0:被包含在区间(12.869,)之内,所以不能拒绝H0。这与假设检验的结论也等价的。,2、置信区间可提供假设检验没有提供的信息置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义。在图6-2中,置信区间(1)(3)均不包含原假设H0,意味着相应的差异具有统计学意义。(1)还提示差异具有实际意义;(2)提示可能具有实际意义;(3)提示实际意义不大。图中的(4)与(5)均无统计学意义,但(4)提示样本量不足。(5)属于可以接受原假设的情况。,3、假设检验提供,而置信区间不提供的信息,第五节假设检验的功效,一、假设检验的两类错误第类错误:拒绝原本正确的H0,导致推断结论错误。第类错误:不能拒绝原本错误的H0,则导致了另一种推断错误。,二、假设检验应注意的问题,1资料必须合乎随机化抽样原则,使样本具有代表性和均衡可比性。2选用的假设检验方法应符合其应用条件。资料性质不同、设计类型不同以及样本例数的多少,所选用的检验方法也不同。3正确选择单侧检验与双侧检验。假设检验有单侧检验和双侧检验之分。需根据研究目的和专业知识选择适当的方法。,4进行假设检验时,对差异有无显著性或有无统计意义的判断不能绝对化。5正确理解P值与差别有无统计学意义6正确理解假设检验和可信区间的关系假设检验和区间估计之间既存在密切的关系,又有区别。假设检验用以推断两总体均数是否相同,而可信区间则用于推断总体均数在哪个范围。,假设检验的功效1-称为假设检验的功效(powerofatest)。其意义是,当所研究的总体与H0确有差别时,按检验水平能够发现它(拒绝H0)的概率。如果1-=0.90,则意味着当H0不成立时,理论上在每100次抽样中,在的检验水准上平均有90次能拒绝H0。一般情况下对同一检验水准,功效大的检验方法更可取。,一组样本资料t检验的功效:,例6-14计算例6-1检验的功效1-。假定根据现有知识可以取=5月,=0.5月,。,由标准正态分布表查这个数值所对应的上侧尾部面积,得到=0.8531,于是,1-=0.1469。说明例6-1的检验功效太小,即发现=0.5个月的差别的机会只有1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论