医学统计学:假设检验的基本思想和步骤_第1页
医学统计学:假设检验的基本思想和步骤_第2页
医学统计学:假设检验的基本思想和步骤_第3页
医学统计学:假设检验的基本思想和步骤_第4页
医学统计学:假设检验的基本思想和步骤_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验一、假设检验的基本思想

例7.2某医生研究一种新的治疗充血性心力衰竭的方法,对50位心功能在2~3级之间的成年男性患者进行4周的治疗,考察其疗效。评价疗效的一个指标是锻炼持续时间的增加量(min)。以前常规的治疗方法能使患者的锻炼持续时间平均增加3min。该医生通过50位接受新方法治疗的患者的数据算得锻炼持续时间平均增加4min,标准差为1.5min。该新疗法使患者锻炼持续时间的平均增加量是否多于常规疗法的3min?(u≠?)=3min常规方法:新方法:n=50=4min

S=1.5minu=?问题:

样本均数与已知总体均数不等,可能

①由于抽样误差所致(u

=

两总体均数相等)

②由于两种治疗方案导致差异(u≠)=3minun=50=4min

S=1.5min如何确定具体的原因,需通过分析样本数据,从两种假设中作抉择。一种假设是“新疗法使患者锻炼持续时间的平均增加量等于常规疗法的3min”,称之为零假设(nullhypothesis),也称无效假设或无差异假设,记为H0

,表示目前的差异是由抽样误差引起的;另一种假设是“新疗法使患者锻炼持续时间的平均增加量不等于常规疗法的3min”,称之为备择假设(alternativehypothesis)或对立假设,记为H1

,表示两者的疗效存在本质不同。假设新疗法和常规疗法的疗效相同,那么由于偶然性得到样本均数等于及大于4min的可能性有多大?如果能算出这个可能性(即概率值)的大小,就可以下结论了。同样如果某事件发生的可能性≤

5%,就认为是小概率事件,在一次试验中几乎不会发生。

如果算出的概率P值≤5%,就可以拒绝H0,认为与的差别是不是偶然性造成的,新疗法和常规疗法在延长锻炼持续时间上存在差异。

如果算出的概率P值>5%,就不能拒绝H0,认为与的差别是偶然性造成的,新疗法和常规疗法在延长锻炼持续时间上不存在差异。

确定P值的大小是假设检验的关键。

假设成立,则可将用公式P值指零假设成立的条件下,出现等于及大于(或等于及小于)现有样本统计量的概率。

查t界值表,自由度v近似取50,可得到P

<0.001

。说明在零假设成立的前提下,出现样本均数等于及大于4min可能性很小(P

<0.001)。这是一个小概率事件,我们认为在一次试验中几乎不会发生,但现在发生了,只有怀疑原假设不成立。

假设检验的目的是推断样本统计量之差是由于总体参数存在差异造成的,抑或由于抽样误差造成的。

假设检验的基本思想是在总体参数相等这一假设成立的前提下,计算出现等于及大于(或等于及小于)现有样本统计量的可能性(P值)。如果P值很小,小于等于事先规定的一个界值(例如5%),结论就是拒绝假设“总体参数相等”,认为总体参数之间存在差异。如果P值大于事先规定的界值,就不能拒绝这个假设,尚不能认为总体参数之间存在差异。二、假设检验的基本步骤1、建立检验假设,确立检验水准。

①检验假设(hypothesisundertest/tobetested)

无效假设(nullhypothesis):②备择假设(alternativehypothesis)

对立假设:*检验假设是针对总体而非样本;

*H0和H1是相互联系、对立的假设,两者缺一不可

*H0为无效假设,其假定通常是:某两个(或多个)总体参数相等,或某两个总体参数之差等于0

*H1的内容反映了检验的单双侧。若H1假设为

0或

<

0,则为单侧检验(one-sidedtest)。若H1为

0,则为双侧检验(two-sidedtest)。单双侧检验应根据专业知识事先确定。③检验水准(sizeofatest),又称

水准:过去称显著性水准(significancelevel)。是预先规定的概率值,它确定了小概率事件的标准。

为I型错误的概率大小。实际工作中常取

=0.05。注意:H0和

H1

的确定,以及单、双侧的选择,都应结合研究设计,在未获得样本结果之前决定。2、选择检验方法、计算检验统计量

根据分析目的、资料类型、设计类型、样本大小、方法的适用条件等选择相应的检验方法并计算检验统计量。所有检验统计量都是在假设H0

成立的条件下计算出来的,它是用于决定是否拒绝H0

的统计量,其统计分布在统计推断中至关重要。3、确定P值和作出推断结论

根据算出的检验统计量如t、Z值,查相应的界值表,即可得到概率P。

P是指从H0规定的总体作随机抽样,抽得等于及大于现有样本获得的检验统计量值的概率。推断结论应包括统计结论与专业结论两部分:

P≤α

,按α

水准,拒绝H0,接受H1,有统计学意义(统计结论),可认为……不同或不等(专业结论)

P>α

,按α

水准,不拒绝H0,无统计学意义,尚不能认为……不同或不等。统计结论只说明有统计学意义或无统计学意义,而不能说明专业上的差异大小。应注意统计学意义与专业意义的区别。

当P≤α,结论为按所规定α检验水准,拒绝H0

,接受H1

。因为现有样本信息不支持H0

成立,故拒绝H0。显然,拒绝H0,不能认为H0肯定不成立。Ⅰ型错误。相反,如P>α,即样本信息支持H0成立,故不拒绝H0

。同样,不拒绝H0

,也不能认为H0肯定成立。Ⅱ错误。假设检验必须对所检验的假设作出明确判断。从“拒绝”或“不拒绝”中选择一个较为合理的决定,因此,假设检验结论具有概率性。不论拒绝或不拒绝H0,都可能犯错误:Ⅰ型或Ⅱ型错误。三、Ⅰ型错误与Ⅱ型错误。I型错误

拒绝了实际上正确的H0,这类“弃真”的错误称为I型错误,其概率大小为

。如规定

=0.05,当拒绝H0时,则理论上100次检验中平均有5次发生这样的错误。

II型错误

不拒绝实际上不成立的H0,这类“存伪”的错误称为II型错误,其概率大小用

表示,其大小未知t

(界值)H0H1αβ图7.1两型错误示意图(以单侧t检验为例)

假设检验的结论拒绝不拒绝(“接受”)正确I型错误(α

)推断正确(1-α

)不正确推断正确(1-β

)II型错误(β

)真实情况I型错误和II型错误

1

称为检验效能(powerofatest)。其意义是当两总体参数确实存在差异即H1:

0成立,使用假设检验方法能够发现差异(即拒绝H0)的能力。

如1

=0.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。

拒绝H0,只可能犯I型错误,不可能犯II型错误;不拒绝H0,只可能犯II型错误,不可能犯I型错误。

愈小,

愈大;反之

愈大,

愈小。若要同时减小I型错误

以及II型错误

,则只有增加样本含量n。

五、假设检验的注意事项严密的研究设计这是假设检验的前提。包括随机抽样和组间的可比性等。

2.数据应该满足假设检验方法的前提条件

应根据分析目的、资料类型、设计方案、资料的分布、样本含量的大小以及方法的适用条件等选择适宜的统计检验方法。3.正确理解假设检验中概率P的含义

P值是指在成立的前提下,出现现有样本统计量以及更极端情况的概率。P值越小说明当前样本的证据越倾向于拒绝H0,当P值小于等于事先规定的检验水准时,就拒绝H0。

P值的大小不仅与总体参数间的差别有关,而且与抽样误差等有关。不能认为P值越小,总体参数间的差别越大。P值越小,说明实际观测到的差异与之间不一致的程度就越大,越有理由拒绝。假设检验只做出拒绝或不拒绝的定性结论,但不能给出总体参数间差别大小的结论。4.结论不能绝对化

报告结果时应注意措辞,应列出检验水准、检验统计量值,P值的确切范围、统计结论和专业结论。5.正确理解“显著性”、“统计学意义”与“专业意义”

1)差别具有“显著性”指差别具有“统计学意义”;

2)具有“统计学意义”不一定具有“专业意义”

六、假设检验与区间估计的联系

假设检验用于推断总体参数是否不相等。两者既有区别,又有联系。

就同一份资料,如例7.3,若假设检验的结果是,拒绝H0,接受H1,则其(1-

)的置信区间必定不包括所规定的总体参数,反之亦然。置信区间能够给出总体参数的可能范围,而假设检验能够给出一个确切的概率P值。图7.2置信区间提供的信息

置信区间与假设检验的作用是相辅的,若两者结合起来,可以提供更为全面的统计推断信息。因此学术期刊建议论文在报告假设检验结论的同时,应该报告相应的区间估计的结果。

t检验

假设检验一般以检验统计量命名,如t检验应用时应了解各种检验方法的应用条件和检验统计量的计算方法。然后按假设检验的一般步骤来处理实际问题。

t检验的应用条件:①样本取自正态总体;②σ未知且n较小–单样本t检验;③两小样本均数比较时,两样本的总体方差相等;若两总体方差不齐可用t’检验;④两大样本均数比较时,可用Z检验。

1、样本均数与总体均数比较的t检验

样本均数与已知总体均数(理论值、标准值或经过大量观察所得的稳定值)比较,其目的是推断样本所代表的未知总体均数u与已知总体均数有无差别。若n较大,则,可按算得的t值用v=∞查t界值表(t即为Z)得P值。v=n-1

例8.1

(1)建立检验假设,确定检验水准

H0:

=3.36,该地农村新生儿体重与该地新生儿平均体重相同

H1:

3.36,该地农村新生儿体重与该地新生儿平均体重不同

=0.05(2)计算统计量

已知n=40,=3.27kg,S=0.44kg,=3.36kg。按式(8.1)=n–1=40–1=39(3)确定P值,作出统计推断

查附表3,t界值表,t=-1.294的绝对值,得0.2<P<0.4,按=0.05检验水准,不拒绝H0,差异无统计学意义,尚不能认为该地农村新生儿体重与该地新生儿平均体重相同。2、配对设计均数比较的t

检验(配对t

检验)配对设计:①配对的两个受试对象分别接受两种处理②同一样品用两种方法或仪器检测的结果③同一受试对象两个部位的检测结果配对t

检验目的是推断两种处理或方法的结果有无差别

首先求出各对差值,再求出差值的均数。若两种处理效应相同,差值的总体均数应为0,因此配对设计的均数比较可看成是差值的样本均数与总体均数0的比较。见例8.2该资料为配对设计,所以可以用配对t检验作统

计推断,具体步骤如下:(1)建立检验假设,确定检验水准H0:两种方法检验结果相同,即

d=0

H1:两种方法检验结果不同,即

d

0

=0.05(2)计算统计量

差值的标准差为

=3.250按公式

=n–1=12–1=11(3)确定P值,作出统计推断

查附表2,t界值表,得P<0.001,按

=0.05水准拒绝H0,差异有统计学意义,可以认为两种方法检查的结果不同。3、两样本均数比较的t检验

为两样本均数差值的标准误

在两总体方差相等的条件下,可将两方差合并,求合并方差(pooledvariance)例8.3组别例数均数标准差银屑病患者12182.427.7正常人12149.719.5表8.2银屑病组与正常对照组的血清IL-6(pg/ml)(1)建立假设检验,确定检验水准

H0:

1=

2,银屑病患者与正常人血清IL-6均数相等,

H1:

1

2,银屑病患者与正常人血清IL-6均数不相等,

=0.05(2)计算统计量

今n1=12,=182.4pg/mL,S1=27.7pg/mL,n2=12,=149.7pg/mL,S2=19.5pg/mL按式(8.4)得=n1+n2–2=12+12–2=22

(3)确定P值,作出统计推断

查附表3,t界值表,得0.002<P<0.005,按

=0.05水准拒绝H0,接受H1,差异有统计学意义,故可认为银屑病患者与正常人血清IL-6均数不同,银屑病患者的血清IL-6较高。

当两样本均大于50,即使总体分布偏离正态,其样本均数仍近似正态分布,可用Z检验。本资料是成组设计的两样本均数比较,可用t检验,

由于两样本含量皆较大,也可用Z检验以简化算。

(1)建立假设检验,确定检验水准H0:该市高碘区与非高碘区儿童智力均数相等,即

1=2

H1:该市高碘区与非高碘区儿童智力均数不等,即

1

2=0.05(2)计算统计量

今=73.07,

S1=10.75,n1=100=80.30,S2=11.83,n2=105(3)确定P值,作出统计推断

查附表2,t界值表(

=

时),得P<0.001,按

=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为该农村高碘区与非高碘区儿童智力均数不等,高碘区较低。两样本几何均数比较的t检验见教材例8.4t检验的应用条件:①样本取自正态总体;②σ未知且n较小–单样本t检验;③两小样本均数比较时,两样本的总体方差相等;若两总体方差不齐可用t’检验;④两大样本均数比较时,可用Z检验。

正态性检验图示法

方格坐标纸图正态概率纸图

P-P图(Proportion-proportionplots)统计检验方法W检验(S.S.ShapiroandM.B.Wilk)D检验(D’Agostino)方差齐性检验

根据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论