第十六章分类变量的统计分析_第1页
第十六章分类变量的统计分析_第2页
第十六章分类变量的统计分析_第3页
第十六章分类变量的统计分析_第4页
第十六章分类变量的统计分析_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 第十六章第十六章 分类变量的统计分析分类变量的统计分析 主讲:黄志碧 第一节第一节 常用的相对数常用的相对数 对分类变量进行统计描述常采用对分类变量进行统计描述常采用相对数相对数。 收集到的分类资料,首先表现为收集到的分类资料,首先表现为绝对数绝对数。绝对数说明事物发生的实际水平,是进行统绝对数说明事物发生的实际水平,是进行统计分析的基础,但不便于事物进行深入地分计分析的基础,但不便于事物进行深入地分析比较。析比较。 肿瘤科:住院人数肿瘤科:住院人数 100 人,死亡人,死亡20人。人。外科:住院人数外科:住院人数 400 人,死亡人,死亡25人。人。外科死亡危险性比肿瘤科更大?外科死亡危险

2、性比肿瘤科更大?例16-1:肿瘤科:病人数:肿瘤科:病人数:100人人 病死人数:病死人数:20 人人 病死率:病死率:20.0%(20/10)。)。外科:病人数:外科:病人数:400人人 病死人数:病死人数:25 人人 病死率:病死率:6.25%(25/400) 。肿瘤科病死危险性比外科更大!肿瘤科病死危险性比外科更大!相对数:相对数:是两个有联系指标之比,说明事物是两个有联系指标之比,说明事物发生的相对水平,便于对分类资料进行分析发生的相对水平,便于对分类资料进行分析和比较。和比较。 常用相对数:常用相对数:率、构成比、相对比率、构成比、相对比率(率(Rate)又称频率指标,是指在一定又称

3、频率指标,是指在一定时间内发生某现象的观察单位数与可能时间内发生某现象的观察单位数与可能发生该现象的总观察单位数之比。它说发生该现象的总观察单位数之比。它说明某现象发生的频率或强度。明某现象发生的频率或强度。 一、率一、率 K为比例基数,可以是百分率(为比例基数,可以是百分率(%)、千分率)、千分率()、万分率()、万分率(1/万)或十万分率(万)或十万分率(1/10万),万),可根据习惯或使计算出的率保持一、二位整数。可根据习惯或使计算出的率保持一、二位整数。K 单位总数单位总数可能发生该现象的观察可能发生该现象的观察数数发生某现象的观察单位发生某现象的观察单位率率 人口出生率、死亡率、自然

4、增长率、婴人口出生率、死亡率、自然增长率、婴儿死亡率等采用千分率;儿死亡率等采用千分率; 肿瘤的死亡率采用十万分率。肿瘤的死亡率采用十万分率。 习惯用法:习惯用法: 计算率时,注意分母和时间。只有可计算率时,注意分母和时间。只有可能发生某事件的观察单位才能做分母。时能发生某事件的观察单位才能做分母。时间一般以年为间期,也有月、周等。间一般以年为间期,也有月、周等。注意注意例如:例如:麻疹发病率麻疹发病率 = 1000 某年新发麻疹病例数某年新发麻疹病例数同年麻疹易感儿总数同年麻疹易感儿总数不应该是儿童总数不应该是儿童总数肿瘤科:病人数:肿瘤科:病人数:100人人 病死人数:病死人数:20 人人

5、 病死率:病死率:20.0%(20/10)。)。外科:病人数:外科:病人数:400人人 病死人数:病死人数:25 人人 病死率:病死率:6.25%(25/400) 。肿瘤科病死危险性比外科更大!肿瘤科病死危险性比外科更大!构成比(构成比(Proportion)又称构成指标又称构成指标,说明说明一事物内部各个组成部分所占的比重或分一事物内部各个组成部分所占的比重或分布,常以百分数表示,又称百分比。布,常以百分数表示,又称百分比。 %100 观察单位总数观察单位总数同一事物各组成部分的同一事物各组成部分的位数位数某一组成部分的观察单某一组成部分的观察单构成比构成比二、构成比二、构成比构成比两个特点

6、:构成比两个特点:1)一组构成比之和等于或)一组构成比之和等于或(有助于区分率和构成比);(有助于区分率和构成比);2)某部分构成增加或减少,则其它部分)某部分构成增加或减少,则其它部分构成就相应减少或增加。构成就相应减少或增加。 某医院某医院2010年与年与2012年各科病床情况年各科病床情况 科别科别 2010年年 2012年年 病床数病床数 构成比构成比 病床数病床数 构成比构成比 内科内科 200 50.0 300 60.0 外科外科 100 25.0 100 20.0 儿科儿科 100 25.0 100 20.0 合计合计 400 100.0 500 100.0 三、三、 相对比(相

7、对比(Ratio)相对比是相对比是A、B两个有关指标之比,说明两个有关指标之比,说明A是是B的多少倍或百分之几。的多少倍或百分之几。 A与与B的性质可以相同,也可以不同。可以的性质可以相同,也可以不同。可以是绝对数也可以是相对数或平均数。是绝对数也可以是相对数或平均数。 %)100(BA比比CVCV、性比例、医护比、医技比、师生比、人口密、性比例、医护比、医技比、师生比、人口密度(人数度(人数/ /平方公里)、体重指数、平方公里)、体重指数、 婴儿性比例:婴儿性比例: 242/230242/230100=105.2100=105.2 例例16-3 16-3 甲乙两地肺癌死亡率分别为:甲乙两地肺

8、癌死亡率分别为: 23.1/1023.1/10万、万、12.33/1012.33/10万,则两地肺癌死亡率万,则两地肺癌死亡率的相对比为的相对比为23.1/12.33=1.8723.1/12.33=1.87, 即甲地肺癌死亡率是乙地的即甲地肺癌死亡率是乙地的1.87倍,倍,RR=1.87。第二节第二节 应用相对数的注意事项应用相对数的注意事项 1、计算相对数的分母不宜过小、计算相对数的分母不宜过小 分母过小则计算所得的相对数不稳分母过小则计算所得的相对数不稳定,不可靠,误解。定,不可靠,误解。 注意:临床资料计算率至少有注意:临床资料计算率至少有30例例2、构成比不能代替率(分析时不能以比代、

9、构成比不能代替率(分析时不能以比代率率 ) 在实际应用中经常出现以构成比代替率进行在实际应用中经常出现以构成比代替率进行分析的错误。分析的错误。有下表资料有下表资料年龄(岁)年龄(岁)0 102030405060 70 合计合计沙眼人数沙眼人数 47 198 330 198 128 80 38 8 1027 % 4.6 19.3 32.1 19.3 12.4 3.7 7.8 0.8 100.0 某文章作者根据上述资料认为,沙某文章作者根据上述资料认为,沙眼在眼在20组的患病率最高,以后随年龄组的患病率最高,以后随年龄增大而减少。增大而减少。犯了以比代率犯了以比代率的错误的错误3、正确计算合计率

10、、正确计算合计率 对观察单位数不对观察单位数不等的几个率,不能直接相加求平均率等的几个率,不能直接相加求平均率 正确的方法:正确的方法:总的发生数除以总的总的发生数除以总的观察单位数。观察单位数。 某医院各科的病死率某医院各科的病死率 科别科别 患者数患者数 死亡数死亡数 病死率(病死率(%) 外外 科科 1500 180 12.0 内内 科科 500 20 4.0 传染科传染科 400 24 6.0 合计合计 2400 224 7.3 (12.0+4.0+6.0)/3100%=7.3% 平均率平均率=224/2400100%=9.3% 决定率(或构成比)的因素很多,除所研决定率(或构成比)的

11、因素很多,除所研究的因素外,尚有许多重要的影响因素;两个或究的因素外,尚有许多重要的影响因素;两个或两个以上的率(构成比)相比较时,其他重要的两个以上的率(构成比)相比较时,其他重要的影响因素要相同或相近(即所谓的具有可比性),影响因素要相同或相近(即所谓的具有可比性),否则就不能直接对率进行比较。一般的,两个地否则就不能直接对率进行比较。一般的,两个地方的出生率、死亡率、发病率,不同级别医院某方的出生率、死亡率、发病率,不同级别医院某病的治愈率等不能直接比较。病的治愈率等不能直接比较。 4、注意资料的可比性、注意资料的可比性 率(或构成比)的比较是否具有可比性,率(或构成比)的比较是否具有可

12、比性,通常注意以下两个方面:通常注意以下两个方面: (1)观察对象同质,研究方法相同,观察)观察对象同质,研究方法相同,观察时间相等,以及研究对象所处的地区、民族、时间相等,以及研究对象所处的地区、民族、职业、生活条件和习惯要一致;职业、生活条件和习惯要一致; (2)影响率的其它因素在各对比组的内部)影响率的其它因素在各对比组的内部构成是否相同。构成是否相同。 两医院乳腺癌手术后的两医院乳腺癌手术后的5年生存率(年生存率(%)腋下淋巴腋下淋巴 省医院省医院 市医院市医院结转移结转移 病例数病例数 构成构成 生存数生存数 生存率生存率 病例数病例数 构成构成 生存数生存数 生存率生存率 无无 4

13、5 6.0 35 77.77 300 78.3 215 71.67 有有 710 94.0 450 63.38 83 21.7 42 50.60 合计合计 755 100.0 485 64.24 383 100.0 257 67.10 不能直接比较两院总的生存率(应标化后再比)不能直接比较两院总的生存率(应标化后再比)甲乙两院乳腺癌病人有无淋巴结转移构成比较甲乙两院乳腺癌病人有无淋巴结转移构成比较 医院医院 有转移有转移 无转移无转移甲医院甲医院 710/755=0.940 45/755=0.060乙医院乙医院 83/383=0.2167 300/383=0.7833 5 5、率或构成比的比较

14、要做假设检验。、率或构成比的比较要做假设检验。即两组或多组样本率的比较,要作假设即两组或多组样本率的比较,要作假设检验再下结论。检验再下结论。 第三节第三节 率的标准化法率的标准化法 甲乙两医院乳腺癌手术后的甲乙两医院乳腺癌手术后的5年生存率(年生存率(%) 甲医院甲医院 乙医院乙医院 病例数病例数 生存数生存数 生存率生存率 病例数病例数 生存数生存数 生存率生存率 755 485 64.24 383 257 67.10 不直接比较两院的不直接比较两院的5年生存率,没有可比年生存率,没有可比性。性。 两医院乳腺癌手术后的两医院乳腺癌手术后的5年生存率(年生存率(%)腋下淋巴腋下淋巴 省医院省

15、医院 市医院市医院结转移结转移 病例数病例数 构成构成 生存数生存数 生存率生存率 病例数病例数 构成构成 生存数生存数 生存率生存率 无无 45 6.0 35 77.77 300 78.3 215 71.67 有有 710 94.0 450 63.38 83 21.7 42 50.60 合计合计 755 100.0 485 64.24 383 100.0 257 67.10 不能直接比较两院总的生存率,应标化后再比不能直接比较两院总的生存率,应标化后再比一、标准化法的意义和基本思想一、标准化法的意义和基本思想率的标准化:率的标准化:是指在比较两个或多个总率时,采是指在比较两个或多个总率时,采

16、用一个共同的内部构成标准,将两个或多个样本用一个共同的内部构成标准,将两个或多个样本不同的内部不同的内部 构成调整为相同的内部构成,以消除构成调整为相同的内部构成,以消除因内部构成不同对总率产生的影响,使算得的标因内部构成不同对总率产生的影响,使算得的标准化率具有可比性。采用标准化方法计算得到的准化率具有可比性。采用标准化方法计算得到的率简称率简称标化率标化率,又,又调整率调整率。 基本思想:基本思想:采用统一的标准内部构成采用统一的标准内部构成(年龄、性别),在相同的内部构成条件(年龄、性别),在相同的内部构成条件下,计算预期的发生率(死亡率);下,计算预期的发生率(死亡率); 目的:目的:

17、消除因内部构成不同对总率产消除因内部构成不同对总率产生的影响,使标化率具有可比性。生的影响,使标化率具有可比性。 二、标化率的计算二、标化率的计算 标化率的计算,常用的有标化率的计算,常用的有直接法直接法和和间接法间接法。 (一)直接法计算标化率(一)直接法计算标化率 iiiipNNpNpNp)()4 .16( 当已知被标化组内部各小组的率时(即当已知被标化组内部各小组的率时(即pi), 采用直接法。采用直接法。为标准组的人口数为标准组的人口数 P代表标准化率,代表标准化率,Ni为标准组各个年为标准组各个年龄人口数,龄人口数,N为标准组总人口数;为标准组总人口数;pi为被标为被标化组各年龄组的

18、发生率。化组各年龄组的发生率。 Ni pi为预期发为预期发生数;生数;Ni/N为标准组年龄构成。注意:不为标准组年龄构成。注意:不能用能用Np 求出预期发生数。求出预期发生数。1、选择直接法或间接法2、选择标准3、计算标化率直接法计算标准化率标准人口选择方法:直接法计算标准化率标准人口选择方法:(1)择有代表性的、较稳定的、数量较大的)择有代表性的、较稳定的、数量较大的人群,如全世界的、全国的、全省的、本地人群,如全世界的、全国的、全省的、本地区的历年人口数;区的历年人口数;(2)选择相互比较的人群合并做标准;)选择相互比较的人群合并做标准;(3)选择相互比较的人群某一组做标准。)选择相互比较

19、的人群某一组做标准。 相互比较时,标准要相同。例如,国际相互比较时,标准要相同。例如,国际间的比较要采用世界通用的标准。间的比较要采用世界通用的标准。已知内部各分率,可用直接法已知内部各分率,可用直接法 甲乙两医院乳腺癌手术后的甲乙两医院乳腺癌手术后的5年生存率(年生存率(%) 腋下淋巴腋下淋巴 甲医院甲医院 乙医院乙医院 结转移结转移 病例数病例数 生存数生存数 生存率生存率 病例数病例数 生存数生存数 生存率生存率 无无 45 35 77.77 300 215 71.67 有有 710 450 63.38 83 42 50.60 合计合计 755 485 64.24 383 257 67.

20、10 两组合并为标准两组合并为标准 甲乙两医院乳腺癌手术后的甲乙两医院乳腺癌手术后的5年生存率(年生存率(%) 淋巴淋巴 甲医院甲医院 乙医院乙医院 结转移结转移 标准人数标准人数 原生存率原生存率 预期生存数预期生存数 原生存率原生存率 预期生存数预期生存数 无无 345 77.77 268.3 71.67 247.26 有有 793 63.38 502.6 50.60 401.3 合计合计 1138 64.24 770.9 67.10 648.6甲医院标化率甲医院标化率= 100%预期生存总数预期生存总数标准病人总数标准病人总数= 100%770.91138=67.74%乙医院标化率乙医院

21、标化率= 100% =56.99% 1138648.6甲院标化治愈率甲院标化治愈率= 1000 预期治愈人数预期治愈人数 标准人数标准人数= 100%41305000=82.6%乙院标化治愈率乙院标化治愈率= 100% =80.0% 50004000 (二二)、间接法、间接法 若已知每家医院总的治愈人数及各科的病若已知每家医院总的治愈人数及各科的病人数,但不知道各科的治愈率,则采用间接人数,但不知道各科的治愈率,则采用间接法计算标准化率。法计算标准化率。 间接法计算标化率方法间接法计算标化率方法 P为标准组总死亡率(发生率),为标准组总死亡率(发生率),Pi为标准组各为标准组各科的治愈率,科的

22、治愈率,r为实际治愈人数。为实际治愈人数。 若若Pi为死亡率时,为死亡率时,r/niPi为被标化组实际死亡数为被标化组实际死亡数与预期死亡数之比,称为标准化死亡比,用与预期死亡数之比,称为标准化死亡比,用SMR表示。表示。 SMRPPnrPpii 若若SMR1,说明被标化组人群死亡率高于标说明被标化组人群死亡率高于标准组;若准组;若SMR1, 说明被标化组人群死亡率低于说明被标化组人群死亡率低于标准组。间接法标化率仅用于标准组。间接法标化率仅用于,两个间接法标准化率不能直接比较(没,两个间接法标准化率不能直接比较(没对年龄进行调整)。对年龄进行调整)。 1.04 87.5%=91.0%P 甲甲

23、甲医院实际治愈人数:甲医院实际治愈人数:1920例;例;1920/1845=1.04乙医院实际治愈人数:乙医院实际治愈人数:2140例例; 2140/2155=0.9930.993 87.5%=86.63%P 乙乙三、应用标准化率注意事项三、应用标准化率注意事项1、应用直接法计算标准化率时,由于所选、应用直接法计算标准化率时,由于所选定的标准人口不同,算得的标准化率也不定的标准人口不同,算得的标准化率也不同,因此,比较几个标准化率时,应采用同,因此,比较几个标准化率时,应采用同一标准人口;同一标准人口;2、当各年龄组的率出现明显交叉时,宜直、当各年龄组的率出现明显交叉时,宜直接比较各年龄组的发

24、生率,而不宜用标准接比较各年龄组的发生率,而不宜用标准化法化法 甲乙两厂某工种某病患病率甲乙两厂某工种某病患病率 工龄工龄 甲甲 厂厂 乙乙 厂厂 (年)工人数(年)工人数 患者数患者数 患病率(患病率(%)工人数)工人数 患者数患者数 患病率(患病率(%) 3 400 12 3.0 100 1 1.0 3 100 10 10.0 400 72 18.0 合计合计 500 22 4.4 500 73 14.6 u0.01=2.58,P0.01.因为因为PX2 X20. 5,1, 0.5 P0.25 4、推断结论、推断结论 0.5P0.25,按按0.05,不拒绝,不拒绝H0,差异无统,差异无统计

25、学意义,尚不能认为计学意义,尚不能认为AB两种药物的有效率不同两种药物的有效率不同。)()()()(22dbcadcbanbcadx 式中式中 :a、b、c、d为四个实际数,其中为四个实际数,其中 a、c 为阳性数,为阳性数,b、d 为阴性数,为阴性数,n 为总例数。为总例数。 为省去计算理论数的麻烦,可用以下公为省去计算理论数的麻烦,可用以下公式计算。式计算。)()()()(22dbcadcbanbcadx 09. 12634303090)15111519(2 (2) 用专用公式计算用专用公式计算 a=19、b=11、c=15 、d=15 、n=60(三)四格表资料(三)四格表资料X2检验的

26、校正检验的校正 1、四格表资料检验条件:、四格表资料检验条件: (1) 当当n40且所有且所有T5,用普通用普通X2检验,检验,(2)当)当n40,但,但1T5时时, 用校正的用校正的X2检验;检验;(3)当)当n40 或或 T1时,用四格表确切概率法。时,用四格表确切概率法。(4)若)若P ,或有实际数为,或有实际数为0,改用四格表确,改用四格表确切概率法(直接计算概率法);切概率法(直接计算概率法); 2、校正公式:、校正公式: (1) 基本公式:基本公式: (2) 专用公式:专用公式: TTAx22)5 . 0|(|)()()()2/|(|22dbcadcbannbcadx 表表16-8

27、 两种疗法对脑胶质瘤疗效的比较两种疗法对脑胶质瘤疗效的比较 疗法疗法 脑功能损伤脑功能损伤 无脑功能损伤无脑功能损伤 合计合计 损伤率损伤率(%) 手术手术 22 (18.88) 6 (9.12) 28 78.57 放疗放疗 7 (10.12) 8 (4.88) 15 46.67 合计合计 29 43 67.44例例16-10 两种方法治疗脑胶质瘤疗效比较。两种方法治疗脑胶质瘤疗效比较。 两种药物治疗胃溃疡的结果两种药物治疗胃溃疡的结果 药药 物物 阳性数阳性数 阴性数阴性数 合计合计 治愈率治愈率(%) 甲甲 22 8 (4.71) 73.33 乙乙 37 3 (6.29) 40 92.50

28、 合计合计 59 70 85.711、建立假设、建立假设 0:12 1:12 0.05 2、计算、计算X2值值因因T22=4.88, 5, 故需要使用校正公式故需要使用校正公式 用专用公式:用专用公式: a=22、 b=6 、 c=7 、 d=8 、n=43 dbcadcbannbcadx22)2/(19. 31429152843)2/4367822(2 3、查、查2表确定表确定P值值 V1 , 20.05,1=3.84 ,23.190.05 4、推断结论、推断结论 P0.05 ,按,按0.05水准,接受水准,接受H0,尚不能认,尚不能认为两种疗法的脑功能损伤率有差别。为两种疗法的脑功能损伤率

29、有差别。 (如不校正,如不校正,2 =4.528, 20.05,1 =3.84 ,P0.05,结论相反。,结论相反。此时采用四格表直接计算概率法。此时采用四格表直接计算概率法。)三、三、配对四格表资料的配对四格表资料的X2检验检验 1、同一个样品,用两种方法处理的结果、同一个样品,用两种方法处理的结果 或同一个病例用两种方法诊断或检查的结果或同一个病例用两种方法诊断或检查的结果 2、同一个病例治疗前后疗效比较;、同一个病例治疗前后疗效比较; 3、配对的两个对象分别接受不同处理的结果。、配对的两个对象分别接受不同处理的结果。 表表16-9 配对四格表形式配对四格表形式甲法甲法 乙乙 法法 合计合

30、计 (a) (b) a+b (c) (d) c+d合计合计 a+c b+d a+b+c+d 配对计数资料经整理后,得出四个数据:配对计数资料经整理后,得出四个数据: a a:甲乙两者均为阳性;:甲乙两者均为阳性;b b:甲阳性而乙阴性;:甲阳性而乙阴性; c c:甲阴性而乙阳性;:甲阴性而乙阳性; d d:甲乙两者均为阴性。:甲乙两者均为阴性。例例16-11 16-11 有有5050份痰液标本,每份标本分别接种份痰液标本,每份标本分别接种在甲、乙两种培养基中,观察结核杆菌生长的情在甲、乙两种培养基中,观察结核杆菌生长的情况,结果见下表,试比较两种培养基的培养效果。况,结果见下表,试比较两种培养基的培养效果。X2= , v=1 若若b+c40:X2= , v=1 cbcb 2)(cbcb 2)1(H0:两总体阳性率相等,即两总体阳性率相等,即B=C;H1:两总体阳性率不等,即两总体阳性率不等,即BC;=0.05 V=1 ,查,查 界值表得:界值表得: 2x222(1)(1231)4.27,1123bcxvbc2220.05,10.05,13.84,4.27,0.05xxxPP X20.005,2=10.60 P0.005 4、推断结论、推断结论 P0.05,按,按=0.05

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论