




已阅读5页,还剩62页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
吉林大学公共卫生学院,1,医 学 统 计 学,主讲人 刘欣,流行病与卫生统计学教研室,吉林大学公共卫生学院,2,四、假设检验的基本思想和步骤,吉林大学公共卫生学院,3,假设检验的基本步骤如下:,1、建立检验假设和确定检验水准,检验假设有两种:, 检验假设(hypothesis under test)又称零/原 假设(null hypothesis)。用H0表示。假定通常 为:某两个(或多个)总体参数相等,或某 两个总体参数之差等于0,或某资料服从某一 特定分布(正态分布、Poisson分布)等。本 例则为:H0: 山0 。,吉林大学公共卫生学院,4,单双侧的选择在检验之前由专业知识确定。, 备择假设(alternative hypothesis)又称对立 假设。用H1表示。H1与H0对立。H1的内容可 反映出检验的单双侧。本例为:H1: 山0 即为单侧检验(one-sided test)或单尾检验(one- tailed test)。若H1: 山0 则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。, 检验水准(size of a test)是假设检验作判断 结论的标准,是预先确定的概率值,常常取 小概率事件标准。用表示。也为I型错误,吉林大学公共卫生学院,5,的概率大小(详后)。实际工作中,常取0.05。,2、选定检验方法和计算检验统计量,应根据变量或资料的类型、分析的目的、设 计的方案、检验方法的适用条件等选择检验方法。 检验统计量(test statistic)是在H0假设的条件 下由统计学家推导出的可由样本指标计算出来用 于推断结论的数值。 检验方法常用检验统计量的名称命名。如t检 验中的t统计量、 u检验中的u统计量、 2检验中 的2统计量等。,吉林大学公共卫生学院,6,3、确定P值和作出推断结论,P值的统计学含义是指从H0规定的总体随机 抽得等于及大于(或等于及小于)现有样本获得 的检验统计量的概率。 通俗地讲,P值就代表了H0成立与否的概率。 将P值与检验水准进行比较得出推断结论。 推断结论应包含统计结论和专业结论两部分。 若P ,则按检验水准拒绝H0,有统计学意义(统计结论),可认为不同或不等(专业结论)。,吉林大学公共卫生学院,7,第四节 t 检验和u 检验,t 检验(t-test,亦称Students t-test)的应用条件:当样本例数n较小,样本来自正态总体,总体标准差未知,在做两个样本均数比较时还要求两样本的总体方差相等,即方差齐性(homogeneity)。,u 检验(u-test)的应用条件:主要适用于两样本含量n较大(均大于50)的情况。,吉林大学公共卫生学院,8,一、样本均数与总体均数的比较,单样本t 检验 用于一组定量资料的样本均数代表未知的总体均数和已知的总体均数0 (一般为理论值、标准值或经大量观察所得的稳定值)进行比较。其检验统计量的计算公式为:,吉林大学公共卫生学院,9,例 根据大量调查,已知正常成年男子脉搏均数为72次/分。某医生在一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?,在本例中,山区成年男子脉搏均数用山表示,一般成年男子脉搏均数用0表示。,0=72次/分,一般总体,山= ?,山区总体,n=25,吉林大学公共卫生学院,10,若P ,则按检验水准尚不拒绝H0,无 统计学意义,还不能认为不同或不等。,下面通过例10.17具体介绍假设检验的过程:,H0: 山0,H1: 山0,单侧,= 0.05,吉林大学公共卫生学院,11,=24,查单侧t,= t0.05,24=1.711,今求得 t =1.8331.711, P0.05,按=0.05水准拒绝 H0,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。,上述例题属于单样本t检验,其假设检验 的推断结果是依据t分布的原理作出的。为了理解 其推断过程的原理,通过直观的示意图(见附图)表达上述例题假设检验的过程。,吉林大学公共卫生学院,12,例5.1 以往通过大规模调查已知某地新生儿出生体重为3.30kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?,吉林大学公共卫生学院,13,配对t 检验 用于配对设计的定量资料的样本均数比较。配对设计主要有两种:,二、配对设计资料的比较,配对设计,同源配对,异源配对,同种处理前后,两种不同处理,用于推断两种处理或处理前后的结果有无差 别。利用两种处理或处理前后的差值d的样本均数 所代表的未知总体均数d 与已知的总体均数,吉林大学公共卫生学院,14,0=0的比较。其检验统计量的计算公式为:,例 某护师随机抽取10名健康女大学生,在午饭后休息1小时,测试口腔温度,体温表分别在口腔中放置4分钟和7分钟,测试结果见表10-9。试比较两种放置时间测试结果是否相同?,本试验属于同源配对中两种不同的处理的比较。,吉林大学公共卫生学院,15,吉林大学公共卫生学院,16,H0: d0=0,H1: d 0 0,= 0.05,吉林大学公共卫生学院,17,=n-1=10-1=9,查双侧t,= t0.05,9=2.262, 今求得 t =5.452.262 ,P0.05,按=0.05水准 拒绝H0,有统计学意义。可认为测试时间长短对 测试结果有影响,7分钟测试结果高于4分钟。,多数假设检验查的是双侧 t0.001,9=4.781, 得到P0.001。实际上在=0.05水准下,二者所 得结论完全一样。,吉林大学公共卫生学院,18,两独立样本t 检验 亦称成组t 检验。用于完全随机设计的定量资料的两样本均数的比较,目的是推断两样本均数各自所代表的总体均数1和2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本,然后比较两组的总体指标。,三、两独立样本均数的比较,吉林大学公共卫生学院,19,1、两个大样本均数的比较,吉林大学公共卫生学院,20,2、两个小样本均数的比较,吉林大学公共卫生学院,21,四、假设检验应注意的问题,1、资料必须合乎随机化抽样原则 2、选用的假设检验方法应符合其应用条件 3、实际差别大小与统计意义的区别 4、进行假设检验时,对差异有无统计学意义的 判断不能绝对化 5、假设检验的单侧检验和双侧检验的选择,吉林大学公共卫生学院,22,假设检验中两类错误,一、型错误 型错误(type error)是指拒绝了实际上成立的H0,即“弃真”的错误。型错误的概率用表示。 二、型错误 型错误(type error)是指接受了实际上不成立的H0,即“存伪”的错误。型错误的概率用 表示。 愈小, 愈大; 愈大, 愈小。,吉林大学公共卫生学院,23,第十一章分类变量资料的统计分析,吉林大学公共卫生学院,24,常用相对数有:率、构成比和相对比。,一、常用相对数, 率,率(rate)又称频率指标。说明某现象发生的 频度或强度。常以百分率(%)、千分率()、万 分率(1/万)、十万分率(1/10万)等表示。计算公式 为:,第一节 分类变量资料的统计描述,吉林大学公共卫生学院,25,表11-1中患病率的大小体现了不同地区脊柱侧凸患病强度的大小。, 构成比,构成比(proportion)又称构成指标。说明某事物内部某组成部分占其全部的比重或分布。计 算公式为:,表11-1中阳性数构成比的大小体现了不同地区 脊柱侧凸患病的例数在总例数中所占的比重大小。,吉林大学公共卫生学院,26, 相对比,相对比(relative ratio)亦称比(ratio),又称对比指标。说明两个有关指标比对的水平,常用倍数或百分数表示。计算公式为:,两个对比指标可以是绝对数、相对数或平均数等。如某地的男女性别比即为绝对数之比;两地区 的某病死亡率之比即为相对数之比;两地区7岁男童的平均身高之比即为平均数之比。,吉林大学公共卫生学院,27,吉林大学公共卫生学院,28,二、应用相对数时的注意事项,(二)正确区分构成比和率,(一)计算率或构成比时分母不宜过小,(三)正确计算平均率,(四)注意资料的可比性,(五)样本率或样本构成比进行比较时要做 假设检验,吉林大学公共卫生学院,29,第二节 分类变量资料的统计推断,吉林大学公共卫生学院,30,从某个二项分类总体中随机抽取含量一定的样本,样本率服从二项分布,即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。,式中为总体阳性率,n为样本含量,X为阳性数。,一、二项分布,吉林大学公共卫生学院,31,对于抽样研究,率和均数一样,也存在抽样误差,即伴随在抽样过程中的样本率与总体率之间的差异。同样,率的抽样误差的大小也用率的标准误来表示,其公式为:,式中P 为样本率的总体标准误,为总体率,n 为样本含量。,二、率的抽样误差与标准误,吉林大学公共卫生学院,32,实际工作中,总体率常常未知,常用样本率p代替,式中SP 为样本率的样本标准误,为总体率,n为 样本含量。,例 某研究者抽样调查了某地区三联疫苗接种者500人,接种后35名出现皮疹,发生率为7%,试计算率的标准误。,吉林大学公共卫生学院,33,三、总体率的置信区间估计,总体率的估计 1 点估计: 2 区间估计: 1)正态近似法:当样本含量n足够大,样本率p或1-p均 不太小时(如np和n(1-p)均大于5), 总体率()95%的可信区间:p1.96Sp 2)查表法:当n较小,如n 特别是p接近于0或1,吉林大学公共卫生学院,34,例 为了解某药的疗效,对100名患者治疗的结果进行调查,结果为80人有效,有效率为80%,样本率的抽样误差为:,该药物有效率的95%可信区间为:,吉林大学公共卫生学院,35,四、两个率比较的u检验,(一)样本率与总体率的比较,式中p为样本率,,为总体率, 为样本率的总体标准误,吉林大学公共卫生学院,36,四、两个率比较的u检验,(二)两个样本率的比较,吉林大学公共卫生学院,37,第三节 检验,吉林大学公共卫生学院,38,一、2检验的基本思想,当两个样本率进行比较时,可以将两个率转化成四个绝对数,即每组中的实际发生数和未发生数,此四数构成了两行、两列的四格表(four- fold table)。形式见表11-7。 通过下面例8.1(两个样本治愈率比较)介绍2检验的基本思想。,吉林大学公共卫生学院,39,吉林大学公共卫生学院,40,n2=110,例1 某研究者为探讨A、B两种治疗方法对某种疾病的疗效,收集的资料见表11-8。问两种治疗方法的疗效是否有统计学差异。,A疗法,B疗法,1,2,n1=100,p1=11.0%,p2=28.2%,1=2,12,?,吉林大学公共卫生学院,41,H0: 1 2,H1: 1 2,= 0.05,可将H0看作1 2 两样本合并的治愈率pc=20.0%,若A疗法按此合并治愈率将得到下述治愈数:,此数称为理论频数(theoretical frequency),简称理论数,用T表示。其计算公式为:,吉林大学公共卫生学院,42,式中Trc 为第r行第c列的理论数,nr为Trc所在行合计, nc为Trc所在列合计。,同理,B疗法按此合并治愈率将得到下述治愈数:,A疗法按上述理论数计算公式将得到下述治愈数:,吉林大学公共卫生学院,43,表中的原始绝对数称为实际频数(actual frequency),简称实际数,用A表示。,A、B疗法若按合并治愈率得到未治愈数分别为:,从上可以看出,两样本率的差别就等价于实际数A与理论数T的差别。在H0下,英国统计学家Pearson K构造了下述检验统计量:,吉林大学公共卫生学院,44,此值称Pearson 2值。此值是以理论数T为基数的实际数A与理论数T的相对误差,它反映了实际数A与理论数T的吻合程度(差别的程度)。若H0成立,则实际数A与理论数T的差别不会很大,出现大的2值的概率P是很小的,若P检验水准,就说明H0成立是一个小概率事件,因而拒绝H0;若P,则尚不能拒绝H0。,吉林大学公共卫生学院,45,Pearson 2值近似服从2分布。,2分布(chi-square distribution)是一个连续型分布。2分布与自由度有关。统计学家制作了2分布曲线下面积分布表-2界值表。2界值用2()表示,20.05(1)=3.84,表示在自由度=1的 2分布曲线下大于等于3.84的面积是0.05即P(x3.84)=0.05。直观含义参见附图。,Pearson 2值的自由度与格子数有关,其计算公式为:,=(行数1)(列数1),吉林大学公共卫生学院,46,附图 自由度为1的 2分布曲线下面积为0.05的界值,吉林大学公共卫生学院,47,例1 2检验的完整步骤如下:,H0: 1 2,H1: 1 2,= 0.05,=(行数1)(列数1)=(2-1)(2-1)=1,查2界值表,20.05(1)=3.84。今求得2=9.663.84,则P0.05,按=0.05水准拒绝H0,差异有统计学意义。可认为B种疗法的疗效高于A种疗法。,吉林大学公共卫生学院,48,二、 四格表2检验,将四格表中四个绝对数(a,b,c,d)代入基本公式化简后得四格表专用公式:,吉林大学公共卫生学院,49,与四格表基本公式的结果相同。实际常用四格表专用公式求2值,因为此式不必求理论数即可求2值。,用四格表专用公式求例1 2值如下:,吉林大学公共卫生学院,50,四格表2检验的连续性校正,由于2分布是一个连续型分布,而四格表中的资料为离散型数据,由此得到的2检验统计量的抽样分布也是离散型分布。为改善2统计量分布的连续性,需要对2值作连续性校正。,连续性校正的四格表基本公式为:,连续性校正的四格表专用公式为:,吉林大学公共卫生学院,51,连续性校正主要针对四格表资料,尤其当理论数较小时。四格表2检验的条件为:, 当n40且每一格的T5,不用校正。, 当n40且有一格的1T5,需校正。, 当n40或有一格的T1,不能用2检验, 需用Fisher精确概率法(Fisher exact test)。,吉林大学公共卫生学院,52,判断四格表资料是否符合四格表2检验的某条件的简便方法为:,首先判断n是否40,若是(n40),接着求四格表中行合计数与列合计数均最小的那一格的理论数T,若T5,则用2检验;若1T5,则用校正2检验;若T1,则用Fisher精确概率法。若否(n40),则直接用Fisher精确概率法。,例8.2 某医师用甲、乙两种药物治疗小儿单纯性消化不良症状,结果见下表11-9。试问甲、乙两种药物的疗效是否有统计学差异。,吉林大学公共卫生学院,53,本例若按理论数计算公式求出所有理论数(见括号内数),发现有两个格子的理论数小于5,且总例数大于40,需用校正2检验。,n=7140,吉林大学公共卫生学院,54,H0: 1 2,H1: 1 2,= 0.05,或者,吉林大学公共卫生学院,55,=1,查2界值表,20.05(1)=3.84。今求得2= 2.753.84,则P0.05,按=0.05水准尚不能拒绝H0,差异无统计学意义。认为甲乙两种药物的疗效相同。,本例若不进行连续性校正,2值为:,则2=4.073.84,则P0.05,按=0.05水准拒绝H0,差异有统计学意义。与上述结论相反,不校正导致了假阳性错误。,吉林大学公共卫生学院,56,练习 某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,如表8-3。试问两个年级的患病率有无差异? 表8-3 两个年级学生近视眼患病率比较 . 年 级 近 视 非近视 合 计 . 四年级 2(4.67) 26(23.33) 28 五年级 5(2.33) 9(11.69) 14 . 合 计 7 35 42 .,吉林大学公共卫生学院,57,三、配对设计分类变量资料的2检验,对于配对设计的分类资料,可把数据整理成如下表11-10的形式,此表常称配对四格表。,吉林大学公共卫生学院,58,从配对四格表中可以看出,a 是甲、乙两法均是阳性的频数,d 是甲、乙两法均是阴性的频数, b 是甲法阳性、乙法阴性的频数,c 是甲法阴性、乙法阳性的频数。,若比较甲、乙两法有无差别,只需推断b 和c 分别代表的总体的B 和C是否相等即可,其检验统计量的计算公式为:,吉林大学公共卫生学院,59,此检验又称McNemar检验。,适用条件为b +c40,当b +c40时,应作连续性校正,见下式。,自由度为1。,例 某研究者用甲、乙两种试剂检验132份HBsAg阳性血清,结果见下表11-11。试问甲、乙两种试剂检验结果有无差别。,吉林大学公共卫生学院,60,本例为分类资料配对设计的四格表,故可用配对四格表2检验,又已知b +c=31+10=4140,勿需校正。,吉林大学公共卫生学院,61,H0: B C,H1: B C,= 0.05,=1,查2界值表,20.05(1)=3.84。今求得2= 10.763.84,则P0.05,按=0.05水准拒绝H0,差别有统计学意义。认为甲乙两种试剂的HB
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财务管理中的轮岗实习收获及试题及答案
- 2025年氧化工艺考试题库
- 中国威乐循环泵行业市场前景预测及投资价值评估分析报告
- 2025年北汽福田公司诸城有限公司校园招聘模拟试题及完整答案一套
- 2025年金融服务项目投资分析及可行性报告
- 南京定制家具项目商业计划书
- 中国棕榈果提取物行业市场前景预测及投资价值评估分析报告
- 中国白银行业产业链全景、市场规模及投资前景研究报告(2025版)
- 消防法法宣试题及答案
- 中国橡胶类制品行业市场前景预测及投资价值评估分析报告
- GB/T 11361-2008同步带传动梯形齿带轮
- GB 5009.121-2016食品安全国家标准食品中脱氢乙酸的测定
- 《电业安全工作规程》
- 处置室工作制度(6篇)
- 二次配线工艺标准守则
- 骨髓穿刺术评分表
- 海底捞火锅店各岗位职责
- 发证机关所在地区代码表
- 车辆安全设施设备定期检查台账
- Q∕GDW 10799.7-2020 国家电网有限公司电力安全工作规程 第7部分:调相机部分
- 田中靖久颈椎病症状量表20分法
评论
0/150
提交评论