




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第七章第七章 2 检检 验验1检验的基本思想和用途检验的基本思想和用途掌握内容:掌握内容:4行行 列表资料检验及应用时应注意的问题列表资料检验及应用时应注意的问题2成组设计四格表资料检验的计算及应用条件成组设计四格表资料检验的计算及应用条件3配对设计四格表资料检验配对设计四格表资料检验1四格表资料的四格表资料的Fisher精确概率法的基本思想精确概率法的基本思想与检验步骤与检验步骤5频数分布拟合优度的检验频数分布拟合优度的检验了解内容了解内容2 2 检验是一种用途很广的假设检验方检验是一种用途很广的假设检验方法。本章只介绍它在分类变量资料中的应用,法。本章只介绍它在分类变量资料中的应用,即推
2、断两个及多个总体率或总体构成比之间即推断两个及多个总体率或总体构成比之间有无差别,两种属性或两个变量之间有无关有无差别,两种属性或两个变量之间有无关联,以及频数分布的拟合优度检验等。联,以及频数分布的拟合优度检验等。3第一节第一节 四格表资料的四格表资料的 2 检验检验一、检验的基本思想一、检验的基本思想以两样本率比较的以两样本率比较的 检验为例,介绍检验为例,介绍检验的基本思想。检验的基本思想。 22分布是一种连续型分布分布是一种连续型分布 ,它的形状依赖于自,它的形状依赖于自由度的大小,当自由度由度的大小,当自由度2时,曲线呈时,曲线呈L型;型;随着的增加,曲线逐渐趋于对称;当自由度随着的
3、增加,曲线逐渐趋于对称;当自由度时时, 分布趋向正态分布。分布具有可加性。分布趋向正态分布。分布具有可加性。224 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11 A12n1(固定值固定值)2 A21 A22n2(固定值固定值)合计合计 m1 m2n(T11)(T21)(T12)(T22)5 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 a bn1(固定值固定值)2 c dn2(固定值固定值)合计合计 m1 m2n(T11)(T2
4、1)(T12)(T22)要想知道处理组要想知道处理组1,2之间差别是否有统计学意义,之间差别是否有统计学意义,常用检验统计量来作假设检验。常用检验统计量来作假设检验。26TTA22)(其基本公式为:其基本公式为:(7.1)由公式由公式(7.1)可以看出:值反映了实际频数与可以看出:值反映了实际频数与理论频数的吻合程度,其中反映了某个格子理论频数的吻合程度,其中反映了某个格子实际频数与理论频数的吻合程度。若检验假设成实际频数与理论频数的吻合程度。若检验假设成立,实际频数与理论频数的差值会小,则立,实际频数与理论频数的差值会小,则 值也值也会小;反之,若检验假设不成立,实际频数与理会小;反之,若检
5、验假设不成立,实际频数与理论频数的差值会大,则论频数的差值会大,则 值也会大。值也会大。 TTA2)(20H20H27值的大小还取决于个数的多少(严值的大小还取决于个数的多少(严格地说是自由度的大小)。由于各皆是格地说是自由度的大小)。由于各皆是正值,故自由度愈大,值也会愈大;所以只正值,故自由度愈大,值也会愈大;所以只有考虑了自由度的影响,值才能正确地反映有考虑了自由度的影响,值才能正确地反映实际频数和理论频数的吻合程度。检验时,实际频数和理论频数的吻合程度。检验时,要根据自由度查界值表。当要根据自由度查界值表。当 时,时,拒绝,接受拒绝,接受 ;当时,尚没有;当时,尚没有理由拒绝。理由拒绝
6、。 而自由度而自由度 。2TTA2)(TTA2)(22AT22,P0H1H2,2P0H218 : ,两总体率不等,两总体率不等 : ,两总体率相等,两总体率相等 二、检验的检验步骤二、检验的检验步骤 21建立检验假设建立检验假设0H211H2105. 0 2计算检验统计量计算检验统计量 (1)当总例数大于)当总例数大于40且所有格子的理论数大且所有格子的理论数大于于5时:用检验的基本公式或四格表资料检验时:用检验的基本公式或四格表资料检验的专用公式;的专用公式; TTA22)(基本公式基本公式9专用公式专用公式 )()()()(22dbcadcbanbcad(2)当总例数)当总例数 且只有一个
7、格子的且只有一个格子的 时:用四格表资料检验的校正公式;或改用四时:用四格表资料检验的校正公式;或改用四格表资料的格表资料的Fisher确切概率法。确切概率法。40n51T2校正公式校正公式 TTAc22)5 . 0()()()()(222b+da+cc+da+bn|ad-bc|-=nc校正公式校正公式 10(3)当,或)当,或 时,不能用检验,时,不能用检验,改用四格表资料的改用四格表资料的Fisher确切概率法。确切概率法。40n1T3作出统计结论作出统计结论以以=1查界值表,若,按查界值表,若,按检验水准拒绝,接受,可认为两总体率不检验水准拒绝,接受,可认为两总体率不同;若同;若 ,按检
8、验水准,按检验水准 不拒绝,不拒绝,尚不能认为两总体率不同。尚不能认为两总体率不同。205. 0P05. 00H1H05. 0P05. 00H211两样本率比较的资料,既可用两样本率比较的资料,既可用 检验检验也可用也可用 检验来推断两总体率是否有差别,检验来推断两总体率是否有差别,且在不校正的条件下两种检验方法是等价的,且在不校正的条件下两种检验方法是等价的,对同一份资料有。对同一份资料有。u22u212例为了解铅中毒病人是否有尿棕色素增加现例为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人
9、与对照定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?人群的尿棕色素阳性率差别有无统计学意义?表两组人群尿棕色素阳性率比较表两组人群尿棕色素阳性率比较组别组别阳性数阳性数阴性数阴性数合计合计阳性率阳性率(%)铅中毒病人铅中毒病人2973680.56对照组对照组9283724.32合计合计38357352.05(18.74)(19.26)(17.74)(17.26)1312.2374.17)74.1728(26.19)26.199(26.17)26.177(74.18)74.1829(22222用专用公式:用专用公式:12.233538373673) 972829
10、()()()()(222dbcadcbanbcad下结论:下结论:以以=1查界值表,按检查界值表,按检验水准拒绝,接受,可认为两总体率不同;验水准拒绝,接受,可认为两总体率不同;205. 0P0H1H05. 014例例2某矿石粉厂生产一种矿石粉时,在数天内即有部分某矿石粉厂生产一种矿石粉时,在数天内即有部分工人患有职业性皮肤炎。后随机抽取工人患有职业性皮肤炎。后随机抽取15名工人穿新防护名工人穿新防护服,其余仍穿原用的防护服,一个月后检查两组工人的服,其余仍穿原用的防护服,一个月后检查两组工人的皮肤炎患病情况,资料见下表,问两组的患病率差别有皮肤炎患病情况,资料见下表,问两组的患病率差别有无统
11、计学意义?无统计学意义?表穿新旧防护服工人的皮肤炎患病比较表穿新旧防护服工人的皮肤炎患病比较防护服种类防护服种类皮肤炎症皮肤炎症合计合计阳性数阳性数阴性数阴性数新新1(3.84)14(11.16)15旧旧10(7.16) 18(20.84)28合计合计11324315本例本例n40,因有一格子的理论数,因有一格子的理论数5,因而要,因而要用校正用校正 检验。检验。2H0:两组工人皮肤炎总体患病率相等,即两组工人皮肤炎总体患病率相等,即H1:两组工人皮肤炎总体患病率不等,即两组工人皮肤炎总体患病率不等,即212105. 0校正校正 值为:值为:294.284.20)5 .0|84.2018(|1
12、6.7)5 .0|16.710(|16.11)5 .0|16.1114(|84.3)5 .0|84.31(|2222216以以=1查界值表,按查界值表,按 检检验水准不拒绝验水准不拒绝 ,接受,接受 ,尚不能认为穿不同,尚不能认为穿不同防护服的两组工人的皮肤炎患病率的差别有统防护服的两组工人的皮肤炎患病率的差别有统计学意义;计学意义;205. 0P0H1H05. 0注意:本例若不作连续性校正,则,注意:本例若不作连续性校正,则,得得33. 4205. 0P,可见两者是有区别的。,可见两者是有区别的。17第二节第二节 配对四格表资料的配对四格表资料的 2检验检验 属于配对设计的两组频数分布的属于
13、配对设计的两组频数分布的 2检验。检验。这类问题的原始数据可以表示为表这类问题的原始数据可以表示为表7-2所示的所示的四格表形式。表四格表形式。表7-2和表和表7-1的区别仅在设计的区别仅在设计上,前面是两个独立样本,行合计是事先固上,前面是两个独立样本,行合计是事先固定的;而这里的定的;而这里的“两份样本两份样本” 互不独立,样互不独立,样本量都是本量都是n,是固定的,而行合计与列合计,是固定的,而行合计与列合计却是事先不确定的。却是事先不确定的。 18变量变量1变量变量2合计合计阳性阳性阴性阴性阳性阳性阴性阴性合计合计(固定值)(固定值)ab1ncd2n1m2mn表表7-2 两个变量阳性率
14、比较的一般形式和符号两个变量阳性率比较的一般形式和符号 变量变量1的阳性率的阳性率 变量变量2的阳性率的阳性率 nn1nbanm1nca 19变量变量1 1的阳性率变量的阳性率变量2 2的阳性率的阳性率 nbancancb可见,两个变量阳性率的比较只和、有关,可见,两个变量阳性率的比较只和、有关,而与、无关。而与、无关。 bcad:,即两种方法的总体检测结果相同:,即两种方法的总体检测结果相同 0HCB :,即两种方法的总体检测结果不相同:,即两种方法的总体检测结果不相同 1HCB 05. 020若若H0 成立,变量成立,变量1与变量与变量2所示的结果不一致的所示的结果不一致的两个格子理论频数
15、都应该是。由两个格子理论频数都应该是。由 2 检验检验基本思想得基本思想得 :2/ )(cb2222222cbcbccbcbb 化简后得到,化简后得到, 2 统计量的计算公式为统计量的计算公式为:cbcb 22)( 21若若, 需对上述公式校正需对上述公式校正, 校正公式为:校正公式为: 40 cbcbcb22) 1|(|22例某研究室用甲乙两种血清方法检查鼻咽癌例某研究室用甲乙两种血清方法检查鼻咽癌患者血清患者血清93份,结果如下表,问两法的检出率份,结果如下表,问两法的检出率有无差别?有无差别?表两种血清学检查结果比较表两种血清学检查结果比较甲法甲法乙法乙法合计合计45226762026合
16、计合计51429323:,即两种方法的总体检测结果相同:,即两种方法的总体检测结果相同 0HCB :,即两种方法的总体检测结果不相同:,即两种方法的总体检测结果不相同 1HCB 05. 01. 建立假设检验,确定检验水准。建立假设检验,确定检验水准。2. 计算统计量计算统计量由于由于 ,需作连续性校正,计,需作连续性校正,计算卡方值:算卡方值:4028 cb04. 8622) 1|622(|22243. 作出统计推断作出统计推断25行行列表资料的检验,用于多个样本列表资料的检验,用于多个样本率的比较、两个或多个构成比的比较、以率的比较、两个或多个构成比的比较、以及双向无序分类资料的关联性检验。
17、其基及双向无序分类资料的关联性检验。其基本数据有以下本数据有以下3种情况:种情况:第三节行第三节行列表的列表的2检验检验26多个样本率比较时,有多个样本率比较时,有R行行2列,称为表;列,称为表;两个样本的构成比比较时,有两个样本的构成比比较时,有2行行C列,称为列,称为表;表;多个样本的构成比比较,以及双向无序分类资料多个样本的构成比比较,以及双向无序分类资料关联性检验时,有关联性检验时,有R行行C列,称为表。列,称为表。以上以上3种情况可统称为行种情况可统称为行列表资料。列表资料。 第三节行第三节行列表的列表的2检验检验2RC2CR27, (行数行数-1)(列数列数-1) 行行列表资料的检
18、验仍可用列表资料的检验仍可用Pearson公式,公式,但用下列专用公式,计算简单,但用下列专用公式,计算简单, 22) 1(22CRnnAn1. 多个率的比较多个率的比较例例2. 多个构成比的比较多个构成比的比较例例283. 行行列表资料检验的注意事项列表资料检验的注意事项 2(一)一般认为,行(一)一般认为,行列表中的理论频数列表中的理论频数不应小于不应小于1,或的格子数不宜超过格子,或的格子数不宜超过格子总数的总数的 。若出现上述情况,可通过以下方。若出现上述情况,可通过以下方法解决:法解决:最好是增加样本含量,使理论频最好是增加样本含量,使理论频数增大;数增大;根据专业知识,考虑能否删去
19、理根据专业知识,考虑能否删去理论频数太小的行或列,能否将理论频数太小论频数太小的行或列,能否将理论频数太小的行或列与性质相近的邻行或邻列合并;的行或列与性质相近的邻行或邻列合并;改用双向无序表的改用双向无序表的Fisher确切概率法(可用确切概率法(可用SAS软件实现)。软件实现)。51T5/129(二二)多个样本率比较,若所得统计推断为多个样本率比较,若所得统计推断为拒绝拒绝H0,接受,接受H1时,只能认为各总体率之时,只能认为各总体率之间总的来说有差别,但不能说明任两个总间总的来说有差别,但不能说明任两个总体率之间皆有差别。要进一步推断哪两总体率之间皆有差别。要进一步推断哪两总体率之间有差别,需进一步做多个样本率体率之间有差别,需进一步做多个样本率的多重比较。的多重比较。304.行行列表的分割列表的分割在行行列表的中,若拒绝无效假设列表的中,若拒绝无效假设H0只能做出总的结论,但还不知道哪两只能做出总的结论,但还不知道哪两个率之间有差别。若想知道哪两个率之间个率之间有差别。若想知道哪两个率之间有差别,还要进行两两比较,本节介绍两有差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 名师指导2025年软件设计师试题及答案
- 2025年网络管理员考试逐步解析试题
- 供应链优化与风险控制的关系试题及答案
- 行政管理专业复习试题及答案
- 行政法律制度的变革试题与答案
- 购销灯具协议书
- 解除保险协议书
- 设备租令协议书
- 从单位偷走协议书
- 非婚财产协议书
- 车辆超速考试试题及答案
- 成人患者营养不良诊断与应用指南(2025版)解读课件
- 2025年一级注册建筑师历年真题答案
- 十五五时期经济社会发展座谈会十五五如何谋篇布局
- 初中电与磁试题及答案
- 浙江开放大学2025年《行政复议法》形考作业1答案
- 国家开放大学《西方经济学(本)》章节测试参考答案
- 湖南省炎德英才名校联合体2025届高考考前仿真联考二英语+答案
- 重庆地理会考试卷题及答案
- 福建省三明市2025年普通高中高三毕业班五月质量检测地理试卷及答案(三明四检)
- 2024年四川省天全县事业单位公开招聘医疗卫生岗笔试题带答案
评论
0/150
提交评论