医学统计学(假设检验)课件_第1页
医学统计学(假设检验)课件_第2页
医学统计学(假设检验)课件_第3页
医学统计学(假设检验)课件_第4页
医学统计学(假设检验)课件_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学(假设检验)医学统计学(假设检验)医学统计学(假设检验)教学目的与要求掌握:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解:置信区间与假设检验的关系医学统计学(假设检验)医学统计学(假设检验)医学统计学(假设1教学目的与要求

掌握:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解:置信区间与假设检验的关系教学目的与要求掌握:2教学内容提要

重点讲解:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验Z检验假设检验应注意的问题介绍:置信区间与假设检验的关系教学内容提要重点讲解:3假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样本信息判断原假设是否合理,从而决定是否拒绝或接受原假设。参数检验(parametrictest):若总体分布类型已知,需要对总体的未知参数进行假设检验。非参数检验:若总体分布类型未知,需要对未知分布函数的总体的分布类型或其中的某些未知参数进行假设检验。假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样4假设检验(hypothesistest)的基本思想

亦称显著性检验(significancetest)是先对总体的特征(如总体的参数或分布、位置)提出某种假设,如假设总体均数(或总体率)为一定值、总体均数(或总体率)相等、总体服从某种分布、两总体分布位置相同等等,然后根据随机样本提供的信息,运用“小概率原理”推断假设是否成立。

“概率很小(接近于零)的事件在一次抽样中不太可能出现,故可以认为小概率事件在一次随机抽样中是不会发生的”。

假设检验(hypothesistest)的基本思想5“小概率原理”例如在2000粒中药丸中只有一粒是虫蛀过的,现从中随机取一粒,则取得“虫蛀过的药丸”的概率是1/2000,这个概率是很小的,因此也可以将这一事件看作在一次抽样中是不会发生的。若从中随机抽取一粒,恰好是虫蛀过的,这种情况发生了,我们自然可以认为“假设”有问题,即虫蛀率p不是1/2000,从而否定了假设。否定假设的依据就是小概率事件原理。由此我们得到一个推理方法:如果在某假设(记为H0)成立的条件下,事件A是一个小概率事件,现在只进行一次试验,事件A就发生了,我们就认为原来的假设(H0)是不成立的。“小概率原理”例如在2000粒中药丸中只有一粒是虫蛀过的,现6例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,现随机抽查了20名肝阳上亢成年男性病人,其平均脉搏为84次/分,标准差为6.4次/分。问肝阳上亢男病人的平均脉搏数是否较正常人快?以上两个均数不等有两种可能:第一,由于抽样误差所致;第二,由于肝阳上亢的影响。例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,7例如已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,问此类脾虚男病人的脉搏快于健康成年男子的脉搏?

抽样误差?脾虚?例如已知正常成年男子脉搏平均为72次/分,现随8假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果第一节假设检验原理某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。假设检验:第一节假设检验原理某事发生了:91、假设检验的原因由于总体不同或因个体差异的存在,在研究中进行随机抽样获得的样本均数,x1、x2、x3、x4…,不同。样本均数不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性(差别无统计学意义)(2)分别所代表的总体均数不同。差别有显著性(差别有统计学意义)2、假设检验的目的

判断是由于何种原因造成的不同,以做出决策。

1、假设检验的原因由于总体不同或因个10

反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论(小概率)

:如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。3、假设检验的原理反证法:当一件事情的发生只有两种可能A和B,为了肯定其114、假设检验的步骤▲建立假设(反证法),确定显著性水平()▲计算统计量:u,t,2▲确定概率P值▲做出推论4、假设检验的步骤▲建立假设(反证法),确定显著性水平(12【例5-1】已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,推断此类脾虚男病人的脉搏是否不同于健康成年男子的脉搏。

【例5-1】已知正常成年男子脉搏平均为72次/分,现13(1)建立假设,选定检验水准:假设两种:一种是检验假设,假设差异完全由抽样误差造成,常称无效假设,用H0表示。另一种是和H0相对立的备择假设,用H1表示。假设检验是针对H0进行的。

确定双侧或单侧检验:

H0:此类脾虚病对脉搏数无影响,H0:μ=72次/分H1:脾虚病人的脉搏数不同于正常人,H1:μ≠72次/分选定检验水准:

α=0.05

α是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率。

(1)建立假设,选定检验水准:确定双侧或单侧检验:H0:此14医学统计学(假设检验)课件15双侧与单侧检验界值比较

双侧与单侧检验界值比较16(2)选定适当的检验方法,计算检验统计量值

t检验Z检验设计类型资料的类型和分布统计推断的目的n的大小如完全随机设计实验中,已知样本均数与总体均数比较,n又不大,可用t检验,计算统计量t值。(2)选定适当的检验方法,计算检验统计量值t检验17(3)计算P值P值:是在H0成立时,取得大于或等于现有检验统计量值的概率。

(3)计算P值P值:是在H0成立时,取得大于或等于现有检18(3)计算概率值(P)

将计算得到的Z值或t值与查表得到Z或t,ν,比较,得到P值的大小。根据u分布和t分布我们知道,如果|Z|>Z或|t|>t

,则P<

;如果|Z|<Z或|t|<t

,则P>

。(3)计算概率值(P)19当P≤α时,统计学结论为按所取α检验水准拒绝H0,接受H1,称“差异有显著性”(“差异有统计学意义”)。

当P>α时,没有理由怀疑H0的真实性,统计学结论为按所取α检验水准不拒绝H0,称“差异无显著性”(“差异无统计学意义”)。

(4)作出推断结论当P≤α时,统计学结论为按所取α检验水准拒绝H0,接20医学统计学(假设检验)课件21α与P异同相同:

α与P都是用检验统计量分布的尾部面积大小表示。不同:α是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率,是检验水准。P值是由实际样本决定的,是指从由H0所规定的总体中随机抽样,获得大于及等于(或小于)现有样本检验统计量值的概率。

α与P异同相同:225、两类错误(I型错误与Ⅱ型错误

)统计推断可能出现的4种结果

拒绝H0,接受H1不拒绝H0H0为真

H0为假I型错误(α)推断正确(1-α)推断正确(1-β)Ⅱ型错误(β)(假阳性错误)(假阴性错误)

(检验效能、把握度)

(可信度)无效假设(H0

)备择假设(H1)5、两类错误(I型错误与Ⅱ型错误)统计推断可能出现23两类错误(Ⅰ型错误与Ⅱ型错误):Ⅰ型错误:H0原本是正确的拒绝H0

弃真假阳性错误误诊用α表示

Ⅱ型错误:H0原本是错误的不拒绝H0

存伪假阴性错误漏诊用β表示

两类错误(Ⅰ型错误与Ⅱ型错误):24两均数的假设检验样本均数与总体均数的比较

成对资料均数的t检验

成组资料两样本均数的比较

方差不齐时两小样本均数的比较

两均数的假设检验样本均数与总体均数的比较25第二节单样本正态资料的假设检验

不满足

不满足

满足

满足

σ已知

正态性

非参数检验

变量替换

结论

不满足

大样本

u检验

t检验

满足

z思路一、正态总体均数的假设检验

第二节单样本正态资料的假设检验不满足不满足满足26方法方法271、大样本【例5-2】一般女性平均身高160.1cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80cm。请问某大学18岁女大学生身高是否与一般女性不同。1、大样本28▲目的:比较样本均数所代表的未知总体均数与已知总体均数有无差别▲计算公式:z

统计量=

▲适用条件:(1)

已知一个总体均数;(2)可得到一个样本均数;(3)可得到该样本标准误;(4)样本量不小于100。▲目的:比较样本均数所代表的未知总体均数▲适用条29假设检验:▲建立假设,确定显著性水平():检验假设:某校女大学生身高均数与一般女子身高均数相同,H0:μ=μ0;

备择假设:某校女大学生身高均数与一般女子身高均数不同,H1:μ≠μ0

=0.05假设检验:30▲做出推论:Z=9.58>

1.96,p

<0.05

=

,小概率事件发生了,原H0假设不成立;拒绝H0,接受H1,

可认为:某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。▲计算统计量:Z

统计量:

Z=▲确定概率值:

|Z|=9.58Z

=1.96|Z|>

Z

p<

=0.05;▲做出推论:▲计算统计量:Z统计量:Z312、小样本【例5-3】已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果均数为65.63次/分,标准差为7.2次/分。2、小样本32▲目的:比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。▲计算公式:

t统计量:t=

自由度:=n-1▲适用条件:(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准误;(3)样本量小于100;(4)样本来自正态或近似正态总体。▲适用条件:33假设检验:▲建立假设,确定显著性水平():

检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等;H0:μ=μ0;

备择假设

:常参加体育锻炼的中学男生的心率与一般中学生不同;H1:μ≠μ0

=0.05假设检验:34▲计算统计量:

t==4.65▲确定概率值:

n=16,自由度=n–1=15,t0.05(15)=2.131t>t0.05(15),p<0.05▲做出推论:

p

<0.05

<

,小概率事件发生了,原假设不成立;拒绝H0,接受H1,可认为:常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。▲计算统计量:35二、正态总体方差的假设检验

正态总体方差2的检验,如表5-3所示:二、正态总体方差的假设检验正态总体方差2的检验,如表5-36【例5-4】

某药含碳量服从正态分布,生产时允许方差在0.0482(mg2)内。现任取5件,测得含碳量(mg)为:1.32、1.55、1.36、1.40、1.44,根据=0.05判断该药生产是否稳定。

H0:=0.0482,H1:>0.0482。=0.05n=5,=1.414,S=0.0882,df=n-1=4,查统计用表6得单侧概率P<0.01。以=0.01水准的单侧检验拒绝H0,接受H1。检验有统计学意义,可认为该药生产不稳定。【例5-4】某药含碳量服从正态分布,生产时允许方差在0.37第三节两样本正态资料的假设检验

1.配对样本资料(或称为相关资料)的假设检验2.两组独立样本(成组)资料的方差齐性检验3.两组独立样本比较的t检验第三节两样本正态资料的假设检验1.配对样本资料(38一、配对样本资料的t检验什么是配对设计资料?

将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。有哪几种形式?一、配对样本资料的t检验什么是配对设计资料?39配对比较主要有四种情况:同一对象处理前后的数据同一对象两个部位的数据同一对象分别接受两种不同处理的数据两个同质的对象分别接受两种处理后的数据配对比较主要有四种情况:同一对象处理前后的数据40

1.目的:通过对两组配对资料的比较,判断不同的处理效果是否有差别,或某种治疗方法是否起作用。2.

基本原理:假设两种处理方法的效果相同,μ1=μ2,即μ1-μ2=0。计算出两组资料各对的差值d,这时,检验两个总体均值是否相等,转化为检验差值d的总体均值是否为零,即检验假设H0:μd=0。

3.公式:t==

自由度:ν

=对子数-1

4.适用条件:配对资料,对子差值满足正态性

1.目的:通过对两组配对资料的比较,判断不同的处理效果是否41【例5-5】为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。病人序号透析前透析后

131.618.2

220.7

7.3

336.426.5

433.123.7

529.522.6

620.710.7

750.325.1

831.220.9

936.623.71028.116.5d13.413.49.99.46.910.025.210.312.911.6【例5-5】为考察一种新型透析疗法的效果,随机抽取了10名42①H0:μd=0H1:μd

>0(单侧检验)确定显著性水平

=0.05②计算统计量:t=7.826③

确定概率:ν=10-1=9。查表t

0.05(9)=1.833

t=7.826>t0.05(9)

p<0.05④

判断结果:因为p<0.05,故拒绝检验假设H0,10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。①H0:μd=0H1:μd43【例5-6】为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,将每对中的两只小白鼠随机分到实验组和对照组中,两组都接种肿瘤,实验组在接种肿瘤三天后注射30%的三棱莪术液0.5mL,对照组则注射蒸馏水0.5mL。结果见表5-4。比较两组瘤体大小是否相同。

【例5-6】为研究三棱莪术液的抑瘤效果,将20只小白鼠配成144医学统计学(假设检验)课件45单侧检验单侧检验46二、成组资料两样本均数的比较方差齐性?成组t检验非参数检验不满足正态性?变量变换满足满足不满足变量变换t′检验结论思路小样本:大样本:先进行F检验,再作Z检验二、成组资料两样本均数的比较方差齐性?成组t检验非参数检验不471、成组资料的方差齐性检验成组t检验的前提条件是两总体方差齐。两总体方差相等称为方差齐性,两总体方差不等称为方差不齐。检验两组资料的方差是否齐性,以决定采用适宜的检验统计量。方差齐性检验假设:查F界值表(附表8)确定P大小,作推论1、成组资料的方差齐性检验成组t检验的前提条件是两总体方差齐48【例5-9】

研究功能性子宫出血症实热组与虚寒组的免疫功能,测定淋巴细胞转化值如表5-5所示。设两组的淋巴细胞转化值都服从正态分布,判断两组的总体方差是否不等。

【例5-9】研究功能性子宫出血症实热组与虚寒组的免疫功能49医学统计学(假设检验)课件502、成组资料的t检验2、成组资料的t检验51【例5-11】

干燥芜菁叶含钙量服从正态分布,用两种方法各10次测定含钙量(g/100g),测定值均数分别为=2.2150(g/100g)、=2.2651(g/100g),标准差分别为S1=0.1284(g/100g)、S2=0.0611(g/100g)。第1种方法测定的含钙量是否低于第2种方法?【例5-11】干燥芜菁叶含钙量服从正态分布,用两种方法各52医学统计学(假设检验)课件53【例5-12】

某地检查正常成年人的血液红细胞数,样本容量、均数、标准差分别为:男子组156名、465.13万/mm3、54.80万/mm3,女子组74名、422.16万/mm3、49.20万/mm3。若该地正常成年男女血液红细胞数均服从正态分布,判断其红细胞平均数是否与性别有关。【例5-12】某地检查正常成年人的血液红细胞数,样本容量、54医学统计学(假设检验)课件55第四节二项分布与Poisson分布资料的Z检验一、二项分布资料的Z检验

1.单组资料的Z检验2.成组资料的Z检验第四节二项分布与Poisson分布资料的Z检验一、二561.单组资料的Z检验如果二项分布的π或(1-π)均不太小,则当n足够大时,二项分布接近正态分布,故二项分布资料的样本率与总体率比较可用z检验:

Z=(X–nπ0)/

(5-6)式中X为阳性频数;π0为已知总体率;n为样本含量。若不用绝对数表示,改用率表示时,将上式的分子、分母同时除以n:

Z=(p–π0)/

(5-7)n不大时,用连续性校正式:

Z=(|p-π0|-0.5/n)/

(5-8)1.单组资料的Z检验57【例5-13】根据以往经验,一般胃溃疡病患者有20%发生胃出血症状。现观察65岁以上胃溃疡病人304例,有96例发生胃出血症状。推断老年胃溃疡患者是否比较容易出血。H0:π=20%,即老年患者胃出血率与一般患者相同;H1:π>20%。样本出血率=96/304=31.58%,按公式(5-7)Z=(0.3158-0.20)/=5.0471Z>单侧界值Z0.01=2.33,P<0.01。按α=0.01水准拒绝H0,接受H1,可认为老年胃溃疡病患者较一般患者容易发生胃出血。【例5-13】根据以往经验,一般胃溃疡病患者有20%发生胃582.成组资料的Z检验n1与n2均大于50时,两样本率p1=X1/n1,p2=X2/n2比较Z=(p1-p2)/

(5-11)两样本率的合并标准误为=(5-10)合并样本率pc的计算公式为:pc=(5-9)若两个样本率均有p与(1-p)大于1%,且np与n(1-p)均大于5,则两样本率的比较亦可用Z检验。2.成组资料的Z检验n1与n2均大于50时,两样本率p1=X59【例5-14】用某中草药治疗慢性支气管炎患者,其中吸烟组治疗86人,显效35人,不吸烟组治疗107人,显效82人,推断吸烟与不吸烟组显效率是否相同。H0:π1=π2;H1:π1≠π2。α=0.05p1=X1/n1=35/86=0.4070,p2=X2/n2=82/107=0.7664pc=0.6062,=0.0717Z=(0.4070-0.7664)/0.0717=-5.0119因∣Z|>2.58,P<0.01,按α=0.05水准拒绝H0,接受H1。可认为用该中药治疗慢性气管炎不吸烟组的显效率高于吸烟组。【例5-14】用某中草药治疗慢性支气管炎患者,其中吸烟组治疗60二、Poisson分布资料的Z检验

单组资料的Z检验成组资料的Z检验二、Poisson分布资料的Z检验单组资料的Z检验611.单组资料的Z检验当Poisson分布的均数λ≥20时,Poisson分布近似正态分布,样本阳性频数X与已知总体平均数λ0比较可用正态近似Z检验,检验统计量为Z=(X–λ0)/(5-12)【例5-15】

一般认为全国食管癌死亡率为28/10万,某省1990年死亡回顾调查10万人,食管癌死亡人数22人,该地食管癌死亡率水平是否与全国相同?1.单组资料的Z检验当Poisson分布的均数λ≥20时,P622.成组资料的Z检验当两总体均数的估计值均大于20时,可用正态近似作两样本均数比较的Z检验。根据两样本的观察单位数是否相等,分为两种情况计算:⑴当两样本n1=n2时,Z值计算公式为Z=(ΣX1-ΣX2)/(5-13)⑵当两样本n1≠n2时,由样本均数计算Z值Z=(1-2)/(5-14)2.成组资料的Z检验当两总体均数的估计值均大于20时,可用正63例题【例5-15】

用艾叶苍术烟雾对室内空气进行消毒,在室内设6个地点,每点消毒前后各放置一平皿(时间及空间相同)。培养葡萄球菌个数消毒前分别为22,27,23,29,20,23;消毒后分别为12,8,15,19,10,12。比较消毒前后效果有无差别?【例5-17】某制药车间在改革工艺前,测取3次,每升空气中分别有38、29、36颗粉尘。改进工艺后,测取2次,分别有25、18颗粉尘。推断工艺改革前后粉尘数有无差别?例题【例5-15】用艾叶苍术烟雾对室内空气进行消毒641、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对正确的:当p<,拒绝H0,接受H1,按接受H1下结论,可能犯错误;(2)当p>,不能拒绝H0,不能接受H1,按不能接受H1下结论,也可能犯错误;第五节假设检验应注意的问题1、正确理解假设检验的结论(概率性)第五节假设检验应注意65(1)当拒绝H0时,可能犯错误,可能拒绝了实际上成立的H0,称为І

类错误(“弃真”的错误),其概率大小用α

表示。

(2)当不能拒绝H0时,也可能犯错误,没有拒绝实际上不成立的H0,这类称为II类错误(”存伪”的错误),其概率大小用β

表示,β值一般不能确切的知道。2、第I类错误和第II类错误假设检验的结果有两种:(1)当拒绝H0时,可能犯错误,可能拒绝了实际上成立66

II类错误的概率β

值的两个规律:1.当样本量一定时,α

愈小,则

β

愈大,反之…;2.当α

一定时,样本量增加,β

减少.

673.统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同。(不仅区别于均数差异的大小,还区别于均数变异的大小)4、其它注意事项选择假设检验方法要注意符合其应用条件;当不能拒绝H0时,即差异无显著性时,应考虑的因素:可能是样本例数不够;

单侧检验与双侧检验的问题3.统计学中的差异显著或不显著,和日常生活中所说的差异大小68第六节

置信区间与假设检验的关系

一、置信区间兼具参数估计和假设检验双重功效,在α水准上两者的结论一致。

双侧检验时:如例5-8,5-10,置信区间结论与t检验结果一致。第六节置信区间与假设检验的关系一、置信区间兼具参数估计69单侧检验时:(1)若关心的是μ>μ0?μ的上侧95%置信区间为:

>-t0.05,df

s/如例4-3,H0:μ=μ0

(μ0=72次/分);

H1:μ>μ0

。α=0.05。-t0.05(df)×s/=75-1.729×6.4/=72.52μ的上侧95%置信区间为μ>72.52,现μ0=72次/分不在此区间范围内,故按α=0.05水准拒绝H0,接受H1,结论与前述t检验结果一致。(2)若关心的是μ<

μ0?μ的下侧95%置信区间为:

<

+t0.05(df)

s/单侧检验时:(1)若关心的是μ>μ0?μ的上侧95%置信区间70二、置信区间比假设检验有可提供更多信息之处

二、置信区间比假设检验有可提供更多信息之处71三、置信区间不能完全取代假设检验

置信区间用作假设检验只能在规定的α水准上揭示差异有无统计学意义。

假设检验可得到的P值,可以精确地说明结论的概率保证,可以估计假阴性率β。最好同时给出假设检验的检验统计量值、P值和置信区间三、置信区间不能完全取代假设检验置信区间用作假设检验只72谢谢谢谢73医学统计学(假设检验)医学统计学(假设检验)医学统计学(假设检验)教学目的与要求掌握:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解:置信区间与假设检验的关系医学统计学(假设检验)医学统计学(假设检验)医学统计学(假设74教学目的与要求

掌握:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验二项分布与Poisson分布资料的Z检验假设检验应注意的问题了解:置信区间与假设检验的关系教学目的与要求掌握:75教学内容提要

重点讲解:假设检验原理单样本正态资料的假设检验两样本正态资料的假设检验Z检验假设检验应注意的问题介绍:置信区间与假设检验的关系教学内容提要重点讲解:76假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样本信息判断原假设是否合理,从而决定是否拒绝或接受原假设。参数检验(parametrictest):若总体分布类型已知,需要对总体的未知参数进行假设检验。非参数检验:若总体分布类型未知,需要对未知分布函数的总体的分布类型或其中的某些未知参数进行假设检验。假设检验的基本任务:事先对总体分布或总体参数作出假设,利用样77假设检验(hypothesistest)的基本思想

亦称显著性检验(significancetest)是先对总体的特征(如总体的参数或分布、位置)提出某种假设,如假设总体均数(或总体率)为一定值、总体均数(或总体率)相等、总体服从某种分布、两总体分布位置相同等等,然后根据随机样本提供的信息,运用“小概率原理”推断假设是否成立。

“概率很小(接近于零)的事件在一次抽样中不太可能出现,故可以认为小概率事件在一次随机抽样中是不会发生的”。

假设检验(hypothesistest)的基本思想78“小概率原理”例如在2000粒中药丸中只有一粒是虫蛀过的,现从中随机取一粒,则取得“虫蛀过的药丸”的概率是1/2000,这个概率是很小的,因此也可以将这一事件看作在一次抽样中是不会发生的。若从中随机抽取一粒,恰好是虫蛀过的,这种情况发生了,我们自然可以认为“假设”有问题,即虫蛀率p不是1/2000,从而否定了假设。否定假设的依据就是小概率事件原理。由此我们得到一个推理方法:如果在某假设(记为H0)成立的条件下,事件A是一个小概率事件,现在只进行一次试验,事件A就发生了,我们就认为原来的假设(H0)是不成立的。“小概率原理”例如在2000粒中药丸中只有一粒是虫蛀过的,现79例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,现随机抽查了20名肝阳上亢成年男性病人,其平均脉搏为84次/分,标准差为6.4次/分。问肝阳上亢男病人的平均脉搏数是否较正常人快?以上两个均数不等有两种可能:第一,由于抽样误差所致;第二,由于肝阳上亢的影响。例如,根据大量调查,已知正常成年男性平均脉搏数为72次/分,80例如已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,问此类脾虚男病人的脉搏快于健康成年男子的脉搏?

抽样误差?脾虚?例如已知正常成年男子脉搏平均为72次/分,现随81假设检验:1、原因2、目的3、原理4、过程(步骤)5、结果第一节假设检验原理某事发生了:是由于碰巧?还是由于必然的原因?统计学家运用显著性检验来处理这类问题。假设检验:第一节假设检验原理某事发生了:821、假设检验的原因由于总体不同或因个体差异的存在,在研究中进行随机抽样获得的样本均数,x1、x2、x3、x4…,不同。样本均数不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性(差别无统计学意义)(2)分别所代表的总体均数不同。差别有显著性(差别有统计学意义)2、假设检验的目的

判断是由于何种原因造成的不同,以做出决策。

1、假设检验的原因由于总体不同或因个83

反证法:当一件事情的发生只有两种可能A和B,为了肯定其中的一种情况A,但又不能直接证实A,这时否定另一种可能B,则间接的肯定了A。概率论(小概率)

:如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是“不会发生的”。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的。3、假设检验的原理反证法:当一件事情的发生只有两种可能A和B,为了肯定其844、假设检验的步骤▲建立假设(反证法),确定显著性水平()▲计算统计量:u,t,2▲确定概率P值▲做出推论4、假设检验的步骤▲建立假设(反证法),确定显著性水平(85【例5-1】已知正常成年男子脉搏平均为72次/分,现随机检查20名慢性胃炎所致脾虚男病人,其脉搏均数为75次/分,标准差为6.4次/分,推断此类脾虚男病人的脉搏是否不同于健康成年男子的脉搏。

【例5-1】已知正常成年男子脉搏平均为72次/分,现86(1)建立假设,选定检验水准:假设两种:一种是检验假设,假设差异完全由抽样误差造成,常称无效假设,用H0表示。另一种是和H0相对立的备择假设,用H1表示。假设检验是针对H0进行的。

确定双侧或单侧检验:

H0:此类脾虚病对脉搏数无影响,H0:μ=72次/分H1:脾虚病人的脉搏数不同于正常人,H1:μ≠72次/分选定检验水准:

α=0.05

α是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率。

(1)建立假设,选定检验水准:确定双侧或单侧检验:H0:此87医学统计学(假设检验)课件88双侧与单侧检验界值比较

双侧与单侧检验界值比较89(2)选定适当的检验方法,计算检验统计量值

t检验Z检验设计类型资料的类型和分布统计推断的目的n的大小如完全随机设计实验中,已知样本均数与总体均数比较,n又不大,可用t检验,计算统计量t值。(2)选定适当的检验方法,计算检验统计量值t检验90(3)计算P值P值:是在H0成立时,取得大于或等于现有检验统计量值的概率。

(3)计算P值P值:是在H0成立时,取得大于或等于现有检91(3)计算概率值(P)

将计算得到的Z值或t值与查表得到Z或t,ν,比较,得到P值的大小。根据u分布和t分布我们知道,如果|Z|>Z或|t|>t

,则P<

;如果|Z|<Z或|t|<t

,则P>

。(3)计算概率值(P)92当P≤α时,统计学结论为按所取α检验水准拒绝H0,接受H1,称“差异有显著性”(“差异有统计学意义”)。

当P>α时,没有理由怀疑H0的真实性,统计学结论为按所取α检验水准不拒绝H0,称“差异无显著性”(“差异无统计学意义”)。

(4)作出推断结论当P≤α时,统计学结论为按所取α检验水准拒绝H0,接93医学统计学(假设检验)课件94α与P异同相同:

α与P都是用检验统计量分布的尾部面积大小表示。不同:α是在统计推断时,预先设定的一个小概率值,是当H0为真时,允许错误地拒绝H0的概率,是检验水准。P值是由实际样本决定的,是指从由H0所规定的总体中随机抽样,获得大于及等于(或小于)现有样本检验统计量值的概率。

α与P异同相同:955、两类错误(I型错误与Ⅱ型错误

)统计推断可能出现的4种结果

拒绝H0,接受H1不拒绝H0H0为真

H0为假I型错误(α)推断正确(1-α)推断正确(1-β)Ⅱ型错误(β)(假阳性错误)(假阴性错误)

(检验效能、把握度)

(可信度)无效假设(H0

)备择假设(H1)5、两类错误(I型错误与Ⅱ型错误)统计推断可能出现96两类错误(Ⅰ型错误与Ⅱ型错误):Ⅰ型错误:H0原本是正确的拒绝H0

弃真假阳性错误误诊用α表示

Ⅱ型错误:H0原本是错误的不拒绝H0

存伪假阴性错误漏诊用β表示

两类错误(Ⅰ型错误与Ⅱ型错误):97两均数的假设检验样本均数与总体均数的比较

成对资料均数的t检验

成组资料两样本均数的比较

方差不齐时两小样本均数的比较

两均数的假设检验样本均数与总体均数的比较98第二节单样本正态资料的假设检验

不满足

不满足

满足

满足

σ已知

正态性

非参数检验

变量替换

结论

不满足

大样本

u检验

t检验

满足

z思路一、正态总体均数的假设检验

第二节单样本正态资料的假设检验不满足不满足满足99方法方法1001、大样本【例5-2】一般女性平均身高160.1cm。某大学随机抽取100名女大学生,测量其身高,身高的均数是163.74cm,标准差是3.80cm。请问某大学18岁女大学生身高是否与一般女性不同。1、大样本101▲目的:比较样本均数所代表的未知总体均数与已知总体均数有无差别▲计算公式:z

统计量=

▲适用条件:(1)

已知一个总体均数;(2)可得到一个样本均数;(3)可得到该样本标准误;(4)样本量不小于100。▲目的:比较样本均数所代表的未知总体均数▲适用条102假设检验:▲建立假设,确定显著性水平():检验假设:某校女大学生身高均数与一般女子身高均数相同,H0:μ=μ0;

备择假设:某校女大学生身高均数与一般女子身高均数不同,H1:μ≠μ0

=0.05假设检验:103▲做出推论:Z=9.58>

1.96,p

<0.05

=

,小概率事件发生了,原H0假设不成立;拒绝H0,接受H1,

可认为:某校女大学生身高均数与一般女子身高均数不同;某校女大学生身高均数与一般女子身高均数差别有显著性。▲计算统计量:Z

统计量:

Z=▲确定概率值:

|Z|=9.58Z

=1.96|Z|>

Z

p<

=0.05;▲做出推论:▲计算统计量:Z统计量:Z1042、小样本【例5-3】已知中学一般男生的心率平均为74次/分钟。为了研究常参加体育锻炼的中学生心脏功能是否与一般的中学生相同,在某地区中学生中随机抽取常年参加体育锻炼的男生16名,测量他们的心率,结果均数为65.63次/分,标准差为7.2次/分。2、小样本105▲目的:比较一个小样本均数所代表的未知总体均数与已知的总体均数有无差别。▲计算公式:

t统计量:t=

自由度:=n-1▲适用条件:(1)已知一个总体均数;(2)可得到一个样本均数及该样本标准误;(3)样本量小于100;(4)样本来自正态或近似正态总体。▲适用条件:106假设检验:▲建立假设,确定显著性水平():

检验假设:常参加体育锻炼的中学男生的心率与一般中学生相等;H0:μ=μ0;

备择假设

:常参加体育锻炼的中学男生的心率与一般中学生不同;H1:μ≠μ0

=0.05假设检验:107▲计算统计量:

t==4.65▲确定概率值:

n=16,自由度=n–1=15,t0.05(15)=2.131t>t0.05(15),p<0.05▲做出推论:

p

<0.05

<

,小概率事件发生了,原假设不成立;拒绝H0,接受H1,可认为:常参加体育锻炼的中学男生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。▲计算统计量:108二、正态总体方差的假设检验

正态总体方差2的检验,如表5-3所示:二、正态总体方差的假设检验正态总体方差2的检验,如表5-109【例5-4】

某药含碳量服从正态分布,生产时允许方差在0.0482(mg2)内。现任取5件,测得含碳量(mg)为:1.32、1.55、1.36、1.40、1.44,根据=0.05判断该药生产是否稳定。

H0:=0.0482,H1:>0.0482。=0.05n=5,=1.414,S=0.0882,df=n-1=4,查统计用表6得单侧概率P<0.01。以=0.01水准的单侧检验拒绝H0,接受H1。检验有统计学意义,可认为该药生产不稳定。【例5-4】某药含碳量服从正态分布,生产时允许方差在0.110第三节两样本正态资料的假设检验

1.配对样本资料(或称为相关资料)的假设检验2.两组独立样本(成组)资料的方差齐性检验3.两组独立样本比较的t检验第三节两样本正态资料的假设检验1.配对样本资料(111一、配对样本资料的t检验什么是配对设计资料?

将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。有哪几种形式?一、配对样本资料的t检验什么是配对设计资料?112配对比较主要有四种情况:同一对象处理前后的数据同一对象两个部位的数据同一对象分别接受两种不同处理的数据两个同质的对象分别接受两种处理后的数据配对比较主要有四种情况:同一对象处理前后的数据113

1.目的:通过对两组配对资料的比较,判断不同的处理效果是否有差别,或某种治疗方法是否起作用。2.

基本原理:假设两种处理方法的效果相同,μ1=μ2,即μ1-μ2=0。计算出两组资料各对的差值d,这时,检验两个总体均值是否相等,转化为检验差值d的总体均值是否为零,即检验假设H0:μd=0。

3.公式:t==

自由度:ν

=对子数-1

4.适用条件:配对资料,对子差值满足正态性

1.目的:通过对两组配对资料的比较,判断不同的处理效果是否114【例5-5】为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。病人序号透析前透析后

131.618.2

220.7

7.3

336.426.5

433.123.7

529.522.6

620.710.7

750.325.1

831.220.9

936.623.71028.116.5d13.413.49.99.46.910.025.210.312.911.6【例5-5】为考察一种新型透析疗法的效果,随机抽取了10名115①H0:μd=0H1:μd

>0(单侧检验)确定显著性水平

=0.05②计算统计量:t=7.826③

确定概率:ν=10-1=9。查表t

0.05(9)=1.833

t=7.826>t0.05(9)

p<0.05④

判断结果:因为p<0.05,故拒绝检验假设H0,10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。①H0:μd=0H1:μd116【例5-6】为研究三棱莪术液的抑瘤效果,将20只小白鼠配成10对,将每对中的两只小白鼠随机分到实验组和对照组中,两组都接种肿瘤,实验组在接种肿瘤三天后注射30%的三棱莪术液0.5mL,对照组则注射蒸馏水0.5mL。结果见表5-4。比较两组瘤体大小是否相同。

【例5-6】为研究三棱莪术液的抑瘤效果,将20只小白鼠配成1117医学统计学(假设检验)课件118单侧检验单侧检验119二、成组资料两样本均数的比较方差齐性?成组t检验非参数检验不满足正态性?变量变换满足满足不满足变量变换t′检验结论思路小样本:大样本:先进行F检验,再作Z检验二、成组资料两样本均数的比较方差齐性?成组t检验非参数检验不1201、成组资料的方差齐性检验成组t检验的前提条件是两总体方差齐。两总体方差相等称为方差齐性,两总体方差不等称为方差不齐。检验两组资料的方差是否齐性,以决定采用适宜的检验统计量。方差齐性检验假设:查F界值表(附表8)确定P大小,作推论1、成组资料的方差齐性检验成组t检验的前提条件是两总体方差齐121【例5-9】

研究功能性子宫出血症实热组与虚寒组的免疫功能,测定淋巴细胞转化值如表5-5所示。设两组的淋巴细胞转化值都服从正态分布,判断两组的总体方差是否不等。

【例5-9】研究功能性子宫出血症实热组与虚寒组的免疫功能122医学统计学(假设检验)课件1232、成组资料的t检验2、成组资料的t检验124【例5-11】

干燥芜菁叶含钙量服从正态分布,用两种方法各10次测定含钙量(g/100g),测定值均数分别为=2.2150(g/100g)、=2.2651(g/100g),标准差分别为S1=0.1284(g/100g)、S2=0.0611(g/100g)。第1种方法测定的含钙量是否低于第2种方法?【例5-11】干燥芜菁叶含钙量服从正态分布,用两种方法各125医学统计学(假设检验)课件126【例5-12】

某地检查正常成年人的血液红细胞数,样本容量、均数、标准差分别为:男子组156名、465.13万/mm3、54.80万/mm3,女子组74名、422.16万/mm3、49.20万/mm3。若该地正常成年男女血液红细胞数均服从正态分布,判断其红细胞平均数是否与性别有关。【例5-12】某地检查正常成年人的血液红细胞数,样本容量、127医学统计学(假设检验)课件128第四节二项分布与Poisson分布资料的Z检验一、二项分布资料的Z检验

1.单组资料的Z检验2.成组资料的Z检验第四节二项分布与Poisson分布资料的Z检验一、二1291.单组资料的Z检验如果二项分布的π或(1-π)均不太小,则当n足够大时,二项分布接近正态分布,故二项分布资料的样本率与总体率比较可用z检验:

Z=(X–nπ0)/

(5-6)式中X为阳性频数;π0为已知总体率;n为样本含量。若不用绝对数表示,改用率表示时,将上式的分子、分母同时除以n:

Z=(p–π0)/

(5-7)n不大时,用连续性校正式:

Z=(|p-π0|-0.5/n)/

(5-8)1.单组资料的Z检验130【例5-13】根据以往经验,一般胃溃疡病患者有20%发生胃出血症状。现观察65岁以上胃溃疡病人304例,有96例发生胃出血症状。推断老年胃溃疡患者是否比较容易出血。H0:π=20%,即老年患者胃出血率与一般患者相同;H1:π>20%。样本出血率=96/304=31.58%,按公式(5-7)Z=(0.3158-0.20)/=5.0471Z>单侧界值Z0.01=2.33,P<0.01。按α=0.01水准拒绝H0,接受H1,可认为老年胃溃疡病患者较一般患者容易发生胃出血。【例5-13】根据以往经验,一般胃溃疡病患者有20%发生胃1312.成组资料的Z检验n1与n2均大于50时,两样本率p1=X1/n1,p2=X2/n2比较Z=(p1-p2)/

(5-11)两样本率的合并标准误为=(5-10)合并样本率pc的计算公式为:pc=(5-9)若两个样本率均有p与(1-p)大于1%,且np与n(1-p)均大于5,则两样本率的比较亦可用Z检验。2.成组资料的Z检验n1与n2均大于50时,两样本率p1=X132【例5-14】用某中草药治疗慢性支气管炎患者,其中吸烟组治疗86人,显效35人,不吸烟组治疗107人,显效82人,推断吸烟与不吸烟组显效率是否相同。H0:π1=π2;H1:π1≠π2。α=0.05p1=X1/n1=35/86=0.4070,p2=X2/n2=82/107=0.7664pc=0.6062,=0.0717Z=(0.4070-0.7664)/0.0717=-5.0119因∣Z|>2.58,P<0.01,按α=0.05水准拒绝H0,接受H1。可认为用该中药治疗慢性气管炎不吸烟组的显效率高于吸烟组。【例5-14】用某中草药治疗慢

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论