刘欣《医学统计学方法》12临床统计-4讲课件_第1页
刘欣《医学统计学方法》12临床统计-4讲课件_第2页
刘欣《医学统计学方法》12临床统计-4讲课件_第3页
刘欣《医学统计学方法》12临床统计-4讲课件_第4页
刘欣《医学统计学方法》12临床统计-4讲课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学主讲人刘欣流行病与卫生统计学教研室吉林大学公共卫生学院1整理课件ppt

四、假设检验的基本思想和步骤吉林大学公共卫生学院2整理课件ppt假设检验的基本步骤如下:1、建立检验假设和确定检验水准检验假设有两种:①检验假设(hypothesisundertest)又称零/原假设(null

hypothesis)。用H0表示。假定通常为:某两个(或多个)总体参数相等,或某两个总体参数之差等于0,或某资料服从某一特定分布(正态分布、Poisson分布)等。本例则为:H0:μ山=μ0

。吉林大学公共卫生学院3整理课件ppt单双侧的选择在检验之前由专业知识确定。②备择假设(alternative

hypothesis)又称对立假设。用H1表示。H1与H0对立。H1的内容可反映出检验的单双侧。本例为:H1:μ山>μ0

即为单侧检验(one-sidedtest)或单尾检验(one-tailedtest)。若H1:μ山≠μ0则为双侧检验(two-sidedtest)或双尾检验(two-tailedtest)。③检验水准(sizeofatest)是假设检验作判断结论的标准,是预先确定的概率值,常常取小概率事件标准。用α表示。也为I型错误

吉林大学公共卫生学院4整理课件ppt的概率大小(详后)。实际工作中,α常取0.05。2、选定检验方法和计算检验统计量应根据变量或资料的类型、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。

检验统计量(teststatistic)是在H0假设的条件下由统计学家推导出的可由样本指标计算出来用于推断结论的数值。检验方法常用检验统计量的名称命名。如t检验中的t统计量、u检验中的u统计量、χ2检验中的χ2统计量等。吉林大学公共卫生学院5整理课件ppt3、确定P值和作出推断结论

P值的统计学含义是指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量的概率。通俗地讲,P值就代表了H0成立与否的概率。将P值与检验水准α进行比较得出推断结论。推断结论应包含统计结论和专业结论两部分。若P≤α,则按α检验水准拒绝H0,有统计学意义(统计结论),可认为……不同或不等(专业结论)。吉林大学公共卫生学院6整理课件ppt

第四节t检验和u检验

t检验(t-test,亦称Student’st-test)的应用条件:当样本例数n较小,样本来自正态总体,总体标准差未知,在做两个样本均数比较时还要求两样本的总体方差相等,即方差齐性(homogeneity)。

u检验(u-test)的应用条件:主要适用于两样本含量n较大(均大于50)的情况。吉林大学公共卫生学院7整理课件ppt一、样本均数与总体均数的比较

单样本t检验用于一组定量资料的样本均数代表未知的总体均数μ和已知的总体均数μ0

(一般为理论值、标准值或经大量观察所得的稳定值)进行比较。其检验统计量的计算公式为:吉林大学公共卫生学院8整理课件ppt

根据大量调查,已知正常成年男子脉搏均数为72次/分。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?

在本例中,山区成年男子脉搏均数用μ山表示,一般成年男子脉搏均数用μ0表示。μ0=72次/分一般总体μ山=?山区总体n=25吉林大学公共卫生学院9整理课件ppt

若P>α,则按α检验水准尚不拒绝H0,无统计学意义,还不能认为……不同或不等。下面通过例10.17具体介绍假设检验的过程:H0:μ山=μ0H1:μ山>μ0单侧,α=0.05吉林大学公共卫生学院10整理课件ppt

ν=24,查单侧tα,ν=t0.05,24=1.711,今求得

t=1.833>1.711,P<0.05,按α=0.05水准拒绝

H0,有统计学意义。可认为该山区成年男子脉搏数高于一般成年男子脉搏数。

上述例题属于单样本t检验,其假设检验的推断结果是依据t分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图(见附图)表达上述例题假设检验的过程。吉林大学公共卫生学院11整理课件ppt

例5.1

以往通过大规模调查已知某地新生儿出生体重为3.30kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?吉林大学公共卫生学院12整理课件ppt

配对t检验用于配对设计的定量资料的样本均数比较。配对设计主要有两种:二、配对设计资料的比较配对设计同源配对异源配对同种处理前后两种不同处理

用于推断两种处理或处理前后的结果有无差别。利用两种处理或处理前后的差值d的样本均数所代表的未知总体均数μd

与已知的总体均数吉林大学公共卫生学院13整理课件pptμ0=0的比较。其检验统计量的计算公式为:

某护师随机抽取10名健康女大学生,在午饭后休息1小时,测试口腔温度,体温表分别在口腔中放置4分钟和7分钟,测试结果见表10-9。试比较两种放置时间测试结果是否相同?

本试验属于同源配对中两种不同的处理的比较。吉林大学公共卫生学院14整理课件ppt吉林大学公共卫生学院15整理课件pptH0:μd=μ0=0H1:μd

≠μ0≠0α=0.05吉林大学公共卫生学院16整理课件ppt

ν=n-1=10-1=9,查双侧tα,ν=t0.05,9=2.262,今求得t=5.45>2.262,P<0.05,按α=0.05水准拒绝H0,有统计学意义。可认为测试时间长短对测试结果有影响,7分钟测试结果高于4分钟。

多数假设检验查的是双侧

t0.001,9=4.781,得到P<0.001。实际上在α=0.05水准下,二者所得结论完全一样。吉林大学公共卫生学院17整理课件ppt

两独立样本t检验亦称成组t检验。用于完全随机设计的定量资料的两样本均数的比较,目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本,然后比较两组的总体指标。

三、两独立样本均数的比较吉林大学公共卫生学院18整理课件ppt1、两个大样本均数的比较吉林大学公共卫生学院19整理课件ppt2、两个小样本均数的比较吉林大学公共卫生学院20整理课件ppt

四、假设检验应注意的问题1、资料必须合乎随机化抽样原则2、选用的假设检验方法应符合其应用条件3、实际差别大小与统计意义的区别4、进行假设检验时,对差异有无统计学意义的判断不能绝对化5、假设检验的单侧检验和双侧检验的选择吉林大学公共卫生学院21整理课件ppt假设检验中两类错误一、Ⅰ型错误

Ⅰ型错误(typeⅠerror)是指拒绝了实际上成立的H0,即“弃真”的错误。Ⅰ型错误的概率用α表示。二、Ⅱ型错误

Ⅱ型错误(typeⅡerror)是指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用表示。

α愈小,愈大;α愈大,愈小。吉林大学公共卫生学院22整理课件ppt第十一章分类变量资料的统计分析吉林大学公共卫生学院23整理课件ppt

常用相对数有:率、构成比和相对比。一、常用相对数㈠率率(rate)又称频率指标。说明某现象发生的频度或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:

第一节分类变量资料的统计描述吉林大学公共卫生学院24整理课件ppt

表11-1中患病率的大小体现了不同地区脊柱侧凸患病强度的大小。㈡构成比构成比(proportion)又称构成指标。说明某事物内部某组成部分占其全部的比重或分布。计算公式为:

表11-1中阳性数构成比的大小体现了不同地区脊柱侧凸患病的例数在总例数中所占的比重大小。吉林大学公共卫生学院25整理课件ppt㈢相对比相对比(relativeratio)亦称比(ratio),又称对比指标。说明两个有关指标比对的水平,常用倍数或百分数表示。计算公式为:两个对比指标可以是绝对数、相对数或平均数等。如某地的男女性别比即为绝对数之比;两地区的某病死亡率之比即为相对数之比;两地区7岁男童的平均身高之比即为平均数之比。吉林大学公共卫生学院26整理课件ppt吉林大学公共卫生学院27整理课件ppt二、应用相对数时的注意事项(二)正确区分构成比和率(一)计算率或构成比时分母不宜过小(三)正确计算平均率(四)注意资料的可比性(五)样本率或样本构成比进行比较时要做假设检验吉林大学公共卫生学院28整理课件ppt

第二节分类变量资料的统计推断吉林大学公共卫生学院29整理课件ppt从某个二项分类总体中随机抽取含量一定的样本,样本率服从二项分布,即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。

式中π为总体阳性率,n为样本含量,X为阳性数。

一、二项分布吉林大学公共卫生学院30整理课件ppt对于抽样研究,率和均数一样,也存在抽样误差,即伴随在抽样过程中的样本率与总体率之间的差异。同样,率的抽样误差的大小也用率的标准误来表示,其公式为:

式中σP为样本率的总体标准误,π为总体率,n

为样本含量。二、率的抽样误差与标准误吉林大学公共卫生学院31整理课件ppt实际工作中,总体率π常常未知,常用样本率p代替

式中SP为样本率的样本标准误,π为总体率,n为样本含量。

例某研究者抽样调查了某地区三联疫苗接种者500人,接种后35名出现皮疹,发生率为7%,试计算率的标准误。吉林大学公共卫生学院32整理课件ppt三、总体率的置信区间估计总体率的估计

1点估计:2区间估计:

1)正态近似法:当样本含量n足够大,样本率p或1-p均不太小时(如np和n(1-p)均大于5),总体率()95%的可信区间:p±1.96Sp2)查表法:当n较小,如n

特别是p接近于0或1吉林大学公共卫生学院33整理课件ppt例

为了解某药的疗效,对100名患者治疗的结果进行调查,结果为80人有效,有效率为80%样本率的抽样误差为:该药物有效率的95%可信区间为:吉林大学公共卫生学院34整理课件ppt四、两个率比较的u检验(一)样本率与总体率的比较式中p为样本率,为总体率,为样本率的总体标准误吉林大学公共卫生学院35整理课件ppt四、两个率比较的u检验(二)两个样本率的比较吉林大学公共卫生学院36整理课件ppt

第三节

检验吉林大学公共卫生学院37整理课件ppt一、χ2检验的基本思想

当两个样本率进行比较时,可以将两个率转化成四个绝对数,即每组中的实际发生数和未发生数,此四数构成了两行、两列的四格表(four-foldtable)。形式见表11-7。通过下面例8.1(两个样本治愈率比较)介绍χ2检验的基本思想。吉林大学公共卫生学院38整理课件ppt吉林大学公共卫生学院39整理课件pptn2=110

例1

某研究者为探讨A、B两种治疗方法对某种疾病的疗效,收集的资料见表11-8。问两种治疗方法的疗效是否有统计学差异。A疗法B疗法π1π2n1=100p1=11.0%p2=28.2%π1=π2π1≠π2?吉林大学公共卫生学院40整理课件pptH0:π1

=π2H1:π1

≠π2

α=0.05可将H0看作π1

=π2=两样本合并的治愈率pc=20.0%,若A疗法按此合并治愈率将得到下述治愈数:

此数称为理论频数(theoreticalfrequency),简称理论数,用T表示。其计算公式为:吉林大学公共卫生学院41整理课件ppt

式中Trc为第r行第c列的理论数,nr为Trc所在行合计,

nc为Trc所在列合计。同理,B疗法按此合并治愈率将得到下述治愈数:

A疗法按上述理论数计算公式将得到下述治愈数:吉林大学公共卫生学院42整理课件ppt

表中的原始绝对数称为实际频数(actualfrequency),简称实际数,用A表示。

A、B疗法若按合并治愈率得到未治愈数分别为:

从上可以看出,两样本率的差别就等价于实际数A与理论数T的差别。在H0下,英国统计学家PearsonK构造了下述检验统计量:吉林大学公共卫生学院43整理课件ppt此值称Pearsonχ2值。此值是以理论数T为基数的实际数A与理论数T的相对误差,它反映了实际数A与理论数T的吻合程度(差别的程度)。若H0成立,则实际数A与理论数T的差别不会很大,出现大的χ2值的概率P是很小的,若P≤α检验水准,就说明H0成立是一个小概率事件,因而拒绝H0;若P>α,则尚不能拒绝H0。吉林大学公共卫生学院44整理课件ppt

Pearsonχ2值近似服从χ2分布。

χ2分布(chi-squaredistribution)是一个连续型分布。χ2分布与自由度ν有关。统计学家制作了χ2分布曲线下面积分布表--χ2界值表。χ2界值用χ2α(ν)表示,χ20.05(1)=3.84,表示在自由度ν=1的

χ2分布曲线下大于等于3.84的面积是0.05[即P(x≥3.84)=0.05]。直观含义参见附图。

Pearsonχ2值的自由度与格子数有关,其计算公式为:ν=(行数-1)(列数-1)吉林大学公共卫生学院45整理课件ppt附图自由度为1的

χ2分布曲线下面积为0.05的界值吉林大学公共卫生学院46整理课件ppt例1χ2检验的完整步骤如下:H0:π1

=π2H1:π1

≠π2

α=0.05

ν=(行数-1)(列数-1)=(2-1)(2-1)=1,查χ2界值表,χ20.05(1)=3.84。今求得χ2=9.66>3.84,则P<0.05,按α=0.05水准拒绝H0,差异有统计学意义。可认为B种疗法的疗效高于A种疗法。吉林大学公共卫生学院47整理课件ppt二、四格表χ2检验

将四格表中四个绝对数(a,b,c,d)代入基本公式化简后得四格表专用公式:

吉林大学公共卫生学院48整理课件ppt

与四格表基本公式的结果相同。实际常用四格表专用公式求χ2值,因为此式不必求理论数即可求χ2值。用四格表专用公式求例1χ2值如下:吉林大学公共卫生学院49整理课件ppt四格表χ2检验的连续性校正由于χ2分布是一个连续型分布,而四格表中的资料为离散型数据,由此得到的χ2检验统计量的抽样分布也是离散型分布。为改善χ2统计量分布的连续性,需要对χ2值作连续性校正。连续性校正的四格表基本公式为:连续性校正的四格表专用公式为:吉林大学公共卫生学院50整理课件ppt连续性校正主要针对四格表资料,尤其当理论数较小时。四格表χ2检验的条件为:①当n≥40且每一格的T≥5,不用校正。②当n≥40且有一格的1≤T<5,需校正。③当n<40或有一格的T<1,不能用χ2检验,需用Fisher精确概率法(Fisherexacttest)。吉林大学公共卫生学院51整理课件ppt判断四格表资料是否符合四格表χ2检验的某条件的简便方法为:首先判断n是否≥40,若是(n≥40),接着求四格表中行合计数与列合计数均最小的那一格的理论数T,若T≥5,则用χ2检验;若1≤T<5,则用校正χ2检验;若T<1,则用Fisher精确概率法。若否(n<40),则直接用Fisher精确概率法。

例8.2

某医师用甲、乙两种药物治疗小儿单纯性消化不良症状,结果见下表11-9。试问甲、乙两种药物的疗效是否有统计学差异。吉林大学公共卫生学院52整理课件ppt

本例若按理论数计算公式求出所有理论数(见括号内数),发现有两个格子的理论数小于5,且总例数大于40,需用校正χ2检验。n=71>40吉林大学公共卫生学院53整理课件pptH0:π1

=π2H1:π1

≠π2

α=0.05或者吉林大学公共卫生学院54整理课件ppt

ν=1,查χ2界值表,χ20.05(1)=3.84。今求得χ2=

2.75<3.84,则P>0.05,按α=0.05水准尚不能拒绝H0,差异无统计学意义。认为甲乙两种药物的疗效相同。

本例若不进行连续性校正,χ2值为:

则χ2=4.07>3.84,则P<0.05,按α=0.05水准拒绝H0,差异有统计学意义。与上述结论相反,不校正导致了假阳性错误。吉林大学公共卫生学院55整理课件ppt练习某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,如表8-3。试问两个年级的患病率有无差异?表8-3两个年级学生近视眼患病率比较.

年级近视非近视合计.

四年级2(4.67)26(23.33)28

五年级5(2.33)9(11.69)14.

合计73542.吉林大学公共卫生学院56整理课件ppt三、配对设计分类变量资料的χ2检验

对于配对设计的分类资料,可把数据整理成如下表11-10的形式,此表常称配对四格表。吉林大学公共卫生学院57整理课件ppt从配对四格表中可以看出,a是甲、乙两法均是阳性的频数,d是甲、乙两法均是阴性的频数,b是甲法阳性、乙法阴性的频数,c是甲法阴性、乙法阳性的频数。若比较甲、乙两法有无差别,只需推断b

和c分别代表的总体的B

和C是否相等即可,其检验统计量的计算公式为:吉林大学公共卫生学院58整理课件ppt此检验又称McNemar检验。适用条件为b+c≥40,当b+c<40时,应作连续性校正,见下式。自由度为1。

某研究者用甲、乙两种试剂检验132份HBsAg阳性血清,结果见下表11-11。试问甲、乙两种试剂检验结果有无差别。吉林大学公共卫生学院59整理课件ppt

本例为分类资料配对设计的四格表,故可用配对四格表χ2检验,又已知b

+c=31+10=41>40,勿需校正。吉林大学公共卫生学院60整理课件pptH0:B

=CH1:B

≠Cα=0.05

ν=1,查χ2界值表,χ20.05(1)=3.84。今求得χ2=

10.76>3.84,则P<0.05,按α=0.05水准拒绝H0,差别有统计学意义。认为甲乙两种

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论