卫生学的课件资料_第1页
卫生学的课件资料_第2页
卫生学的课件资料_第3页
卫生学的课件资料_第4页
卫生学的课件资料_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生学的课件资料第1页/共77页2第十章分类变量资料的统计分析

(1)

第一节分类变量资料的统计描述第二节分类变量资料的统计推断第三节χ2检验第2页/共77页3nomenclaturerate率Overallrate总体率composition成分Rawnumber原始数,实际数constituentratio构成比proportion比例Cruderate粗率Standardizedrate标准化率Adjustedrate调整率ratio比,比值Directstandardization直接标准化indirectstandardization间接标准化Standardizedmortalityratio标准化死亡率比第3页/共77页4第一节分类变量资料的统计描述一、常用相对数:相对数是两个有关联的数值之比。常用指标:(一)率(频率,率).(二)构成比(三)相对比在调查或实验研究中,通过对分类变量资料进行清点而得到的数据,称为实际数。实际数是研究客观事物本质的基本信息,但不便于相互分析和比较,也不便于从中寻找事物间的联系。因此,往往根据研究目的计算相应的相对数指标,以便对资料进行统计学描述和深入的分析。第4页/共77页5(一)率(rate):某现象实际发生数与该现象可能发生的总数之比。用来说明某现象发生的频率或强度。常以百分率、千分率、万分率或十万分率表示。原则上使计算结果至少保留1位整数。K为比例基数,通常取值为100%,1000‰,万/万,十万/十万,等。第5页/共77页6例1.某研究组调查了城镇25岁以上居民高血压的患病情况资料。在北方城镇检查了8450人,其中976人被确诊为高血压,在南方城镇检查了10806人,其中1052人被确诊为高血压。试计算南方和北方城镇的高血压患病率。北方城镇25岁以上者高血压患病率为

(976/8450)×100%=11.55%南方城镇25岁以上者高血压患病率为

(1052/10806)×100%=9.74%例2.某城市2003年的平均人口数为100,000人,同年内死亡1250人。该城市2003年的年死亡率为:

1250/100,000=12.5‰第6页/共77页7频率(relativefrequency):是一段时间时间的累计值,强度(density):是单位时间的指标,是有时间单位的.是强度或速率(rate)性质的指标.以年为时间的观察单位.该城市2003年的年死亡率(12.5‰):高血压患病率(北方城镇11.55%,南方城镇9.74%):是频率性指标.因为高血压患病人是长期累计的结果.第7页/共77页8(二)构成比

(constituentratio,proportion):

事物内部某一部分的观察单位数与事物内部各部分的观察单位数总和之比,以百分数表示。说明事物内部各部分所占的比重。计算公式:例某大学2000年有1200名学生获得学位。其中24人获博士学位,356人获硕士学位,820人获学士学位。试计算各种学位获得者人数的构成比。博士构成比=24/1200×100%=2%

硕士构成比=356/1200×100%≈29.67%

学士构成比=820/1200×100%≈68.33%三者之和为:2%+29.67%+68.33%=1.0

特点:分子是分母的一部分,包含在分母中。无单位。第8页/共77页9构成比的特点(1)各部分构成比之和等于1。若因四舍五入造成构成比之和不等于1,则应进行适当的调整,使其等于1。(2)当事物内部某一部分的构成比发生变化时,其它各部分的构成比也会相应地发生变化。该大学有240人获博士学位,356人获硕士学位,820人获学士学位。总人数为1416。获得各种学位人数的构成比:博士构成比=240/1416×100%=16.95%(2%)

硕士构成比=356/1416×100%≈25.14%(29.67%)

学士构成比=820/1200×100%≈57.91%(68.33%)一项的比例上升,引起其他比例的下降。反之亦然。第9页/共77页10(三)相对比(ratio):即比值,是两个有关指标之比,说明一个指标是另一个指标的几倍或百分之几。计算公式:或甲、乙两指标的性质可以相同也可以不同。例如,反映一个国家人口结构的男女性别比、反映医院工作效率的门诊人次数与床位数之比、反映人口密度的人口数与土地面积之比等。(10-3)例10-2门诊每次看病花费的时间大医院平均81.9分钟。社区服务站平均18.6分钟。平均每次看病花费的时间大医院与社区服务站之比为:

81.9分钟/18.6分钟=4.40(倍)第10页/共77页11三种相对数(率、构成比、比值)之间的关系:例10-1某研究者于2000年对某校的初中生进行了近视患病情况的调查,结果见表10-1。表10-12000年某校初中不同年级学生近视患病情况年限检查人数患病人数患病率%构成比%患病率比一年级4426715.1632.061.0二年级4286815.8932.531.05三年级4057418.2735.411.21合计127520916.39100.00第11页/共77页12统计指标名称分子分母比例基数结核病年发病率一年内新发病例数年平均人口数‰结核病患病率发现病例数受检人口总数%年出生率一年内出生数年平均人口数‰治愈率治愈人数治疗总人数%x年生存率活过x年病人数治疗病人总数%吸烟率吸烟人数调查总人数%吸烟者患肺癌相对危险度吸烟者肺癌患病率不吸烟者肺癌患病率1.0意外死亡占总死亡的比例意外死亡人数总死亡人数%外科病人占住院总病人数的比例外科病人数住院病人总数%类型率(近似)频率率(近似)频率频率频率比值构成比构成比第12页/共77页13二、应用相对数时的注意事项

(一)计算相对数时,观察单位数应足够多

(二)分析时构成比和率不能混淆

(三)几个率的平均率不一定等于其算术平均值

(四)相对数的相互比较应注意可比性

(五)两个总率(平均率)比较时要注意内部构成

(六)样本率或构成比的比较应作假设检验

第13页/共77页14(一)计算相对数时,观察单位数应足够多例如,某医师探讨某种中药配方对肺癌的治疗效果,共治疗2例肺癌,且全部治愈,计算的治愈率为100%。但以后其他医师用此配方治疗许多肺癌病人,无一例治愈。由此可见,观察单位数太少时计算结果不稳定,即样本太小缺乏代表性。不能反映事物的客观规律,甚至有时造成错觉。观察单位数少时最好用绝对数表示,如果必须用率表示,要同时列出率的可信区间。在动物实验中可以计算率。这是因为实验设计周密、实验对象精选、实验条件控制严格。例如毒理学实验,每组仅10只动物,却可计算反应率。第14页/共77页15(二)分析时构成比和率不能混淆分析时常见的错误:以构成比代替率来说明问题。◆构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。例如,某地某年40岁以下、40~59岁和60岁以上三个年龄组的人口中肿瘤死亡人数占全死亡原因的构成比分别为21.9%、24.4%和9.4%。上述数据为构成比,它并不说明40~59岁组肿瘤发生情况最严重。只说明40~59岁组中因患肿瘤而死亡人数在全部死亡人数中所占的比例比其它两个组要大。◆频率指标才能说明某事物发生频率的高低。三个年龄组的肿瘤发生率分别为12.35/十万、149.14/十万和341.5/十万,60岁以上的肿瘤发生率最高。第15页/共77页16求几个率的平均率,应该将几个率的分子和分母分别合计,然后求合计的率,即为平均率。(三)几个率的平均率不一定等于其算术平均值

表10-12000年某校初中不同年级学生近视患病情况年限检查人数患病人数患病率%构成比%患病率比一年级4426715.1632.061.0二年级4286815.8932.531.05三年级4057418.2735.411.21合计127520916.39100.00该校初中学生近视患病率平均为209/1275=16.35%。不能计算为(15.16%+15.89+18.27)/3=16.44%.第16页/共77页17(1)研究对象是否同质,研究方法、观察时间、种族、地区、客观环境和条件是否一致。(2)其它影响因素在各组的内部构成是否相同。在比较两组的死亡率时,要考虑两组的性别、年龄构成是否可比;在比较两组的治愈率时,要考虑两组的年龄、性别、病情、病程的构成是否相同。如果各组的内部构成不同,则可以比较按性别、年龄分组的率,或者对率进行标准化(第三节)以后再作比较。(3)同一地区不同时期资料的对比,应注意客观条件有无变化。例如,不同时期的发病率资料对比,应注意不同时期疾病登记报告制度完善程度、就诊率、诊断水平的变化。(四)

相对数的相互比较应注意可比性

第17页/共77页18(五)两个总率(平均率)比较时要注意内部构成年龄(岁)甲校乙校检查人数病人数患病率(%)检查人数病人数患病率(%)35~236166.78478336.9045~375277.20379287.3955~384389.902352410.2165~804025914.681572415.29合计139714010.0212491098.73表甲乙两校35岁及以上知识分子的高血压患病率(%)第18页/共77页19如前所述,样本均数有抽样误差。同样道理,样本率或样本构成比也有抽样误差。因此,在进行样本率之间的比较,或样本构成比之间的比较时,也需要作假设检验。以判断两个(或多个)样本所代表的总体率之间,或两个(或多个)样本所代表的总体构成比之间的差异是否有统计学意义。(1)u检验(2)卡方检验:χ2-test(Chi-squaretest)(六)

不同的样本率或构成比之间比较时应作假设检验

第19页/共77页20标准化法(standardization):是采用统一的标准对内部构成不同的各组频率进行调整的方法。用于多组总体率(平均率)之间的比较。当对两组(或两组以上的)频率指标进行对比时,应注意各组对象的内部构成是否存在差别以致影响结果的正确性。若存在内部构成上的差别,并且差别足以影响结果的正确性,则在比较各组总率前,需用标准化法对总率进行调整。采用统一的标准进行调整以后所得到的率,称为标准化率,简称为标化率(standardizedrate),亦称调整率(adjustedrate)。三、率的标准化法第20页/共77页21表10-3甲乙两地儿童传染病的发病率(‰)年龄(岁)甲地乙地人口数人口构成发病数发病率人口数人口构成发病数发病率1~2542.1219316124.311014.2592117115.385~4285.204516839.211905.4870168.4010~1214029.67271208.55992.256844.03合计208561.00060428.9639111.00013735.03例10-3甲乙两地儿童传染病的发病率按年龄组发病率比较:甲地>乙地按总(平均)发病率比较:甲地<乙地标准化的方法和步骤:1.方法的选择:①直接法②间接法2.

标准的选择:3.标准化率的计算.第21页/共77页22(一)方法的选择计算标准化率的常用方法有直接法和间接法。◆直接法:用标准年龄组人口数或标准年龄组人口数比例进行标准化.使用条件是已知被观察人群中各年龄组的发病率(或患病率、死亡率等)资料。例如表10-3的资料是已知各年龄组的发病率,因此可选用直接法。◆间接法:用标准年龄组发病率进行标准化.若实际资料缺乏各年龄组的发病率资料,仅有各年龄组的观察单位数和总发病率,则选择间接法。第22页/共77页23(二)标准的选择:选择标准的一般原则:1.选一个具有代表性的、内部构成相对稳定的较大人群作为标准。2.将要比较的两组资料内部各相应小组的观察单位数相加,作为共同的标准。3.从比较的两组中任选一组的内部构成作为标准。(三)标准化率的计算步骤:第23页/共77页24直接法计算标准化率式中:P’为标化率,Ni为第i组标准人口数,N为标准组总人口数,Ni/N为第i组标准人口构成比例。例10-3表10-3的资料已包括各年龄组的发病率,故选择直接法计算标准化率,用甲、乙两地各年龄组人口数的合计数作为共同的标准,采用(10-4)式计算标准化率,计算过程见表10-4。第24页/共77页25年龄标准组甲地(j=1)乙地(j=2)(岁)人口数原发病率(‰)预期发病数原发病率(‰)预期发病数iNiPi1Ni×

Pi1Pi2Ni×

Pi2⑴⑵⑶⑷=⑵⑶⑸⑹=⑵⑸1~3556124.31422115.384105~619039.212438.405210~12150218.551284.0361合计2476728.9679335.03523表10-4按公式10.4直接法计算甲乙两地儿童传染病标准化发病率甲地标准化发病率:P=(793/24767)×1000‰=32.02‰乙地标准化发病率:P=(523/24767)×1000‰=21.12‰从标化率可见,甲地标发病率高于乙地,与各年龄组分别对比的结论一致,解决了未标化前出现的矛盾。第25页/共77页26表10-5直接法计算甲乙两校高血压标化患病率(‰)

年龄标准组人口构成比甲地(j=1)乙地(j=2)原发病率预期发病率原发病率预期发病率(岁)Ni/NPi1(Ni/N)×

Pi1Pi2(Ni/N)×

Pi2⑴⑵⑶⑷=⑵⑶⑸⑹=⑵⑸1~0.1436124.3117.85115.3816.575~0.249939.219.808.402.1010~120.60658.555.194.032.44合计1.000028.9632.8435.0321.11用标准人口构成比计算标准化发病率甲地标准化发病率:P=32.84‰

与32.02‰只有舍入误差乙地标准化发病率:P=21.11

‰与21.12‰只有舍入误差第26页/共77页27P’:标准化发病率P:标准组总发病率,Pi:标准组内部第I组的发病率r:实际总发病人数Σ(Ni×Pi):根据标准组发病率推算出的预期总发病人数间接法计算标化率:实际总发病人数与预期总发病人数之比,称标准化发病比或标准化死亡比(standardmortalityratio,SMR)SMR>1,表示标准化人群死亡率高于标准组,SMR<1,表示标准化人群死亡率低于标准组。第27页/共77页28选择全国年龄组肺癌死亡率作为标准,计算标准化死亡率年龄组35~45~55~65~75~合计肺癌死亡数观察人年数吸烟组497054263328117106246137137216432不吸烟189370104762600432754014532396247210例10-4某地研究吸烟与肺癌的关系,得到下列资料:表10-6两组肺癌死亡率(1/10万)的标准化(间接法)年龄组(岁)标准组肺癌死亡率吸烟组(j=1)不吸烟组(j=2)观察人年数预期死亡数观察人年数预期死亡数iPiNi1Ni1×PiNi2Ni2×Pi⑴⑵⑶⑷=⑵⑶⑸⑹=⑵⑸35~7.04497053.5018937013.3345~25.704263310.9610476226.9255~108.252811730.446004365.0065~263.941062428.042754072.6975~451.87613727.731453265.67合计34.60137216100.67396247243.61第28页/共77页29续表10-6两组肺癌死亡率(1/10万)的标准化(间接法)年龄组(岁)标准组肺癌死亡率吸烟组(j=1),(r1=432)不吸烟组(j=2),(r2=210)观察人年数预期死亡数观察人年数预期死亡数iPiNi1Ni1×PiNi2Ni2×Pi合计34.60137216100.67396247243.61①计算标准化死亡比:计算公式:吸烟组:SMR=432/100.67=4.2912.

不吸烟组:SMR=210/243.61=0.8620.②计算标准化死亡率:计算公式:P’=P×SMR

吸烟组:P’=34.60×4.2912=148.48/10万。不吸烟组:P’=34.60×0.8620=29.83/10万。结果显示:吸烟组的肺癌标准化死亡率高于不吸烟组。第29页/共77页30

关于标化率的注意事项标化率的大小受选择的方法、标准的影响,同一资料用不同的方法和标准计算的标化率虽然不同,但比较的结论一致。标化率反映相对水平,仅用于比较。原率反映实际水平。报告统计结果时最好报告原率、标化所用的标准和标化率。如果比较的两个率是抽样研究资料,应作假设检验。第30页/共77页31

本章内容归纳1.分类变量数据的统计描述:相对数指标:率、构成比和相对比(1)率:反映某现象发生的频率和强度(2)构成比:说明事物中某部分的比重(3)相对比:表明甲事物的大小是乙事物的多少倍或几分之几。2.对两个总率(平均率)作比较时,若影响率高低的某因素内部构成不同,需要对总体率进行标准化,用标化率比较。率的标准化包括两个方面:根据资料特点选择标准化方法。直接法和间接法;(2)对标准的选择:三种选择。但标化率只用于比较,并不代表真实水平。第31页/共77页32Theend第32页/共77页33练习题(Inpages383-386)(一)选择题:1,2,4(二)思考题:1,2,3(三)应用题:1,2第33页/共77页34卫生学第6版StatisticalMethodsinMedicine第三篇医学统计学方法第34页/共77页35第十章分类变量资料的统计分析(2)第一节分类变量资料的统计描述第二节分类变量资料的统计推断第三节χ2检验第35页/共77页36NomenclatureDichotomousrandomvariable二分类随机变量Polychotomousrandomvariable多分类随机变量Binomialdistribution二项分布Polynomialdistribution多项分布Enumerateddata,counts计数资料,点数samplingerrorofrate率的抽样误差standarderrorofrate率的标准误Confidenceintervalofrate率的可信区间Contingencytable列联表Chi-Squaretest卡方检验Normalapproximation正态近似Fourfoldtable四格表Marginaltotals边际合计数第36页/共77页37提要◆样本的率(或构成比)也有抽样误差。估计率的抽样误差的大小需用率的标准误。通过估计抽样误差的大小可以推断总体率(或构成比)。◆总体率的推断包括点估计和区间估计。区间估计需要计算总体率的可信区间。◆样本率与总体率的比较、两个样本率的比较的u检验法。◆两个或多个率(或构成比)比较的卡方检验法。◆配对资料的两个率之差的比较的卡方检验法。第37页/共77页38第二节分类变量资料的统计推断一、率的抽样误差与标准误二、总体率的可信区间估计三、样本率与总体率比较、两个率比较的u检验法第38页/共77页39一、率的抽样误差和标准误

(samplingerrorandstandarderrorofrate)

从同一个总体中随机抽出观察例数相等的多个样本,样本率与总体率之间、各样本率之间也有差异,这种差异称为率的抽样误差。率的抽样误差大小用率的标准误σp表示。若总体阳性率未知,则可用样本率p代替,上式即变为:sp:为率的标准误的估计值p:为样本阳性率1~p:为样本阴性率n:为样本含量σp:率的标准误的理论值:总体阳性率1~:总体阴性率n:样本含量第39页/共77页40例10~5有人对以下问题作了研究:经常(平均每天至少1次)在街头小餐点就餐的人是否乙肝病毒感染率较高。在某地随机抽取200人,检查乙肝病毒感染情况。结果发现乙肝表面抗原阳性7人。乙肝表面抗原携带率为:携带率:(7/200)=0.035或3.50%,携带率的标准误为:或1.30%乙肝表面抗原阴性率为:(193/200)=0.965或96.5%阴性率的标准误为:或1.30%第40页/共77页41二、总体率的可信区间估计

(estimationofconfidenceintervalofrate)

由于抽样误差不可避免,因此对于总体率也需根据样本率进行推算,以估计总体率所在的范围。样本率的理论分布与阳性率p的大小及样本含量n的大小有关,推算方法又与样本率的理论分布有关,因此需要根据n和p的大小选择推算方法。正态近似法:2.查表法第41页/共77页421.正态近似法:当样本含量n足够大,且样本阳性率p和阴性率1~p均不太小时[例如np和n(1~p)均大于5],此时,样本率的分布近似于正态分布,因此可根据正态分布原理估计总体率可信区间,即由下列公式估计:

p±uα/2×sp(10~8)当α/2=0.05时,u0.05/2=1.96,总体率的95%IC:p1.96sp

当α/2=0.01时,u0.01/2=2.58,

总体率的99%IC:p2.58sp乙型肝炎表面抗原携带率:3.50%,标准误:1.30%

总体率的95%可信区间为3.50%±1.96×1.30%(0.95%,6.05%)第42页/共77页432.查表法:当n较小,如n50,特别是p接近于0或1时,按二项分布的原理来估计总体率的可信区间。因其计算相当复杂,统计学家已编制出总体率可信区间估计用表,并附在统计学专著的附表中。读者可根据样本含量n和阳性数x,查阅该表。总体率的95%可信区间估计公式为:第43页/共77页44百分率的95%可信区间(L%~U%)(n为观察例数,X为阳性数)Xn=10Xn=20Xn=3000~3100~1700~1210~4510~2510~1723~5621~3221~2237~6533~3832~27412~7446~4444~31519~8159~4956~35612~5468~39715~59710~42819~64812~46923~69915~491027~731017~531120~561223~591326~631428~661531~69第44页/共77页45三、样本率与总体率的比较及两个样本率比较的u检验

在样本含量n足够大、且样本的阳性率p和阴性率1~p均不接近于零的前提下,样本率的分布近似于正态分布。因此,可用u检验(以标准正态分布为基础)作假设检验。

1.

样本率与总体率的比较

2.两个样本率的比较第45页/共77页461.样本率与总体率的比较式中:P:

为样本率,:为总体率,p:为根据总体率计算的标准误。u:值服从标准正态分布,故可根据临界值uα作出统计结论。样本平均值与总体平均值比较的假设检验公式:第46页/共77页47例10-6一般情况下脑梗塞患者经4周治疗后的生活能力改善率为30%.某研究者试用新方法治疗了98例脑梗塞病人,经4周治疗后的生活能力改善率为50%。问该新方法与一般方法相比较,其生活能力改善率是否有统计学差异?总体率:0

=0.30,1~0

=0.70,样本:含量n=98,p=0.50,E(p)=π.检查条件是否满足u检验的要求:n×p及n×(1-p)均大于5.0。

n×p=98×0.30=29.5>5.0,

n×(1-p)=98×0.70=68.6>5.0,故采用u检验法.第47页/共77页48假设检验步骤:1.建立检验假设和确定检验水准:H0:π=π0,H1:π≠π0,α/2=0.052.选择检验方法,计算检验统计量.样本率与总体率比较的u检验法,计算统计量u值3.确定P值,判断结果.∵u>u0.05,∴P<0.05,统计结论:在α=0.05水准上拒绝H0。两者的疗效差异有统计学意义。专业结论:新法优于旧法.第48页/共77页49第49页/共77页502.两个样本率的比较p1和p2分别为两个样本率pc为两个样本率的合并样本率X1和X2分别为两个样本的阳性例数第50页/共77页51例10-7某研究者为了解乙肝携带率的城乡差别,调查了城市居民522人,乙肝携带者24人,携带率为24/522=4.60%。调查了农村居民478人,乙肝携带者33人,携带率为33/478=6.90%。试分析乙肝感染率有无城乡差别?城市:n1=522x1=24p1=24/522=0.046=4.60%农村:n2=478x2=33p2=33/478=0.069=6.90%第51页/共77页52

城市:n1=522x1=24p1=24/522=4.60%,E(p1)=μ1

农村:n2=478x2=33p2=33/478=6.90%,E(p2)=μ2

检验步骤为:1.建立检验假设和确定检验水准:H0:π1=π2,H1:π1≠π2,α/2=0.052.选择检验方法,计算检验统计量:检查u检验的条件:

城市:522×0.046=24.0,522×0.954=500

农村:478×0.069=33,478×0.931=148,都大于5.0选用两个样本率比较的u检验法,计算统计量u值第52页/共77页533.确定P值和判断结果

u0.05/2=1.96,u=1.567<1.96,P>0.05,按=0.05的水准不拒绝H0,两个率之间的差别无统计学意义。不能认为乙肝感染率具有无城乡差别。第53页/共77页54三、行列表资料的卡方检验

第三节卡方检验

卡方检验(chi~squaretest,2-test)是用途非常广泛的一种假设检验方法。本节中仅介绍用于两个或两个以上的率(或构成比)的比较和配对资料比较的方法。二、配对计数资料的卡方检验一、卡方检验的基本思想和四格表资料的卡方检验第54页/共77页55一、卡方检验的基本思想和四格表资料的卡方检验例10-8某医生用甲、乙两种药治疗急性下呼吸道感染,甲药治疗74例,有效68例。乙药治疗63例,有效52例。结果见下表。问两种药物的有效率是否相同?两种药治疗急性下呼吸道感染的有效率统计处理治疗例数有效例数有效率(%)甲药746891.89乙药635260.34两种药物的实际有效例数和无效例数(contingencytable)处理有效例数无效例数合计甲药68674乙药521163第55页/共77页561.卡方检验的基本思想:

比较四个格子中的实际数与在无效假设条件下的期望数。两者差别大时,卡方值大。两者间差别小时,卡方值小。

卡方检验统计量卡方值的基本计算公式为:

A—实际频数(actualfrequency,rawnumber)T

—理论频数(theoreticalfrequency,expectednumber)各组在无效假设条件下的期望数=平均率×观察例数第56页/共77页57平均有效率=nc=1/n=120/137=0.8759

甲药的期望有效人数T11=nr=1×(nc=1/n)=0.875974=64.82

乙药的期望有效人数T21=nr=2×(nc=1/n)=0.875963=55.18平均无效率=nc=2/n=17/137=0.1241

甲药的期望无效人数T12=nr=1×(nc=2/n)=0.124174=9.18

乙药的期望无效人数T22=nr=2×(nc=2/n)=0.124163=7.82期望值Trc的计算公式:符号规定:两种药物的实际有效例数和无效例数处理(行)(row)列(column)有效例数(c=1)无效例数(c=2)合计(nr)甲药(r=1)68674(nr=1)乙药(r=2)521163(nr=2)合计(nc)120(nc=1)17(nc=2)137(n)第57页/共77页58理论频数的计算公式为:Trc为第r行第c列的理论数,nr为第r行的合计数(第r组的观察例数),nc为第c列的合计数(第c类的合计例数),n为两样本合计的总例数。两种药物的实际有效例数和无效例数处理(行)(row)列(column)有效例数(c=1)无效例数(c=2)合计(nr)甲药(r=1)68(64.82)6(9.18)74(nr=1)乙药(r=2)52(55.18)11(7.82)63(nr=2)合计(nc)120(nc=1)17(nc=2)137(n)第58页/共77页59计算卡方值:将实际频数和理论频数代入式10-12,得到2值。2值的大小反映了实际数与理论数的差异,若无效假设H0成立,则理论数和实际数相差不应该太大,较大的2值出现的概率较小。根据资料计算的2值越大,就越有理由拒绝无效假设。2值的大小与格子数也有关。即格子数越多,则自由度()越大,2值也越大。根据自由度和检验水准查表10-112界值表。判断标准:2值≥20.05():按=0.05检验水准拒绝H0。

2值<20.05():按=0.05检验水准不拒绝H0。第59页/共77页602值、P值和统计结论2值P值统计结论220.05()0.05不拒绝H0,差异无统计学意义220.05()0.05拒绝H0,接受H1,差异有统计学意义3.8425.99第60页/共77页612.卡方检验的步骤以例10-8为例说明如下。(1)建立检验假设,确定检验水准:

H0:1=2,H1:

12,=0.05(2)选择检验方法,计算检验统计量:利用公式10-12(3)确定P值和判断结果:

①自由度:=(组数R-1)(分类数C-1)=(2-1)(2-1)=1,②根据自由度查2界值表(表10-11),20.05(1)=3.84,本例,2=2.7343.84,P0.05,不拒绝无效假设H0。甲、乙两种药物治疗急性下呼吸道感染的疗效相同。第61页/共77页623.四格表资料专用公式a、b、c、d分别为四格表中的四个实际频数,n为总例数。符号规定:两种药物的实际有效例数和无效例数处理有效例数无效例数合计甲药68(a)6(b)74(a+b)乙药52(c)11(d)63(c+d)合计120(a+c)17(b+d)137(n)第62页/共77页632界值表中的2值是按公式求出的。K.Pearson(1899)证明,在H0成立的条件下,大样本时,检验统计量近似地服从于统计量为的分布。理论上,“大样本”是指样本量无穷大;在实践中,“大样本”通常是指理论频数(T)不太小。统计学中采用的经验准则是,所有的T都不能小于5,若T小于5或样本量较小时,需对统计量进行校正。根据具体情况作出不同的处理。4.四格表资料卡方检验的校正公式

第63页/共77页64四格表资料卡方检验的校正公式为:

1)T≥5,且n≥40时,不用校正公式计算2值;2)1≤T5,且n40时,需计算校正的2值。校正2值的公式:3)当T1或n40时,需用确切概率法(Fisher’sexactprobabilitytest)。第64页/共77页65二、配对计数资料的卡方检验

(2testforpair-designeddata)在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险因素。若观察的结果只有阴性、阳性两种可能,成对资料只有四种可能情况:

(a)甲+乙+

(b)甲+乙-

(c)甲-乙+

(d)甲-乙-。将四种情况的对子数填入四格表。用公式10-17或公式10-18进行假设检验。第65页/共77页66例10-10用两种不同的方法对53例肺癌患者进行诊断,结果见表10-9,试比较两种检验结果有无差别。表10-9两种方法检测肺癌的结果比较甲法乙法合计++25(a)2(b)2711(c)15(d)26合计361753第66页/共77页67检验步骤:1.

提出检验假设,确定检验水准:

H0:1=2,H1:12,

=0.052.

确定检验方法,计算检验统计量。用校正配对2检验。3.

确定概率P值,判断结果:查2界值表得20.05(1)=3.84,2>20.05(1),P<0.05,拒绝H0。两种方法检测结果不同。表10-9两种方法检测肺癌的结果比较甲法乙法合计++25(a)2(b)2711(c)15(d)26合计361753配对四格表资料的自由度为=1第67页/共77页68三、行×列表资料的卡方检验

(2

testforRCtable)行列表资料指有两个以上相互比较的组,每组的分类数也有两个或以上,如比较三个治疗组的疗效,观察结果为有效、无效和死亡,构成33列联表。行列表资料的2检验对两个以上的率(或构成比)差异进行比较。(一)公式和检验步骤:(1)基本公式:(2)简化公式第68页/共77页69行×列表资料的卡方检验的检验步骤例10-11某研究者欲比较甲、乙两城市空气质量状况,在甲、乙两城市各测定了300个采样点。结果如表10-10,试比较甲、乙两城市空气质量有无差别?表10~10甲、乙两城市各300个采样点的空气质量分级城市空气质量分级合计优良轻度污染中度污染重度污染甲城市193672875300乙城市1549428186300合计347161562511600第69页/共77页70检验步骤:1.建立检验假设,确定检验水准:

H0:甲、乙两城市空气质量相等,

H1:甲、乙两城市空气质量不等。=0.052.选择检验方法,计算检验统计量:R×C表2检验3.确定概率P值和判断结果:=(2-1)(5-1)=4,查2值表,20.05(4)=9.49<13.84,∵220.01(4),∴P0.05,拒绝无效假设H0,接受备选假设H1,甲、乙两城市空气质量不相等.甲市优于乙市。第70页/共77页71表10~10甲、乙两城市各300个采样点的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论