分类变量资料的统计分析_第1页
分类变量资料的统计分析_第2页
分类变量资料的统计分析_第3页
分类变量资料的统计分析_第4页
分类变量资料的统计分析_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、10/21/20211第四章第四章 分类变量资料的统计分析分类变量资料的统计分析统计推断统计描述统计分析210/21/2021第一节第一节 分类变量资料的统计描述分类变量资料的统计描述一、一、常用的相对数指标常用的相对数指标(一)(一)构成比构成比(proportion) 构成比即一事物内部各组成部分所占的比重构成比即一事物内部各组成部分所占的比重或分布。常用百分数表示。又称构成指标。或分布。常用百分数表示。又称构成指标。观察单位数同一事物各组成部分的位数某一组成部分的观察单构成比100 例例4.1(p51) 4.1(p51) 手术治疗某支气管扩张患者,术后手术治疗某支气管扩张患者,术后体温升

2、至体温升至3838,胸腔积液,手术前后检查白细胞记数,胸腔积液,手术前后检查白细胞记数和分类见表和分类见表4-14-1。 %66.71%10058004156术前白细胞总数术前中性白细胞计数术前中性白细胞构成比术前中性白细胞构成比是术前中性白细胞构成比是71.66。410/21/2021构成比的特点:构成比的特点:各组成部分的构成比之和为各组成部分的构成比之和为100 或或1。事物内部某一部分的构成比发生变化,其它事物内部某一部分的构成比发生变化,其它 部分的构成比也相应地发生变化。部分的构成比也相应地发生变化。510/21/2021(二)(二)率率(rate) 又称频率指标,说明某现象发生的

3、频率或强度。又称频率指标,说明某现象发生的频率或强度。即某现象发生的观察单位数与可能发生某现象的观即某现象发生的观察单位数与可能发生某现象的观察单位总数之比。可以百分率、千分率、万分率、察单位总数之比。可以百分率、千分率、万分率、十万分率等表示。十万分率等表示。表示比例基数单位总数可能发生某现象的观察单位数实际发生某现象的观察率kk 例例4.2(p52) 4.2(p52) 在药物的不良反应监测中,调查在药物的不良反应监测中,调查了药物的皮肤过敏反应,结果见表了药物的皮肤过敏反应,结果见表4-24-2。%52. 3%10090832使用人全血病人数人全血过敏人数人全血过敏反应率人全血过敏反应率是

4、人全血过敏反应率是3.52%。()710/21/2021(三)(三)比比(ratio) 也称相对比(也称相对比(ralative ratio),指两个有联),指两个有联系指标之比。系指标之比。)(或乙指标计数甲指标计数比%100810/21/2021 例例4.3(p52) 某地某地2005年城区肺癌死亡率为年城区肺癌死亡率为21.39/10万,郊区肺癌死亡率为万,郊区肺癌死亡率为13.99/10万,试万,试用相对比来反映用相对比来反映2005该地城区与郊区的肺癌死亡该地城区与郊区的肺癌死亡率情况。率情况。53. 199.1339.21郊区肺癌死亡率城区肺癌死亡率比 该地城区肺癌死亡率与郊区肺癌

5、死亡率之比是该地城区肺癌死亡率与郊区肺癌死亡率之比是1.53。例:例:4(四)动态数列(四)动态数列(dynamic series) 是按时间顺序排列起来的一系列统计指标(包是按时间顺序排列起来的一系列统计指标(包括绝对数、相对数或平均数),用以说明事物在时括绝对数、相对数或平均数),用以说明事物在时间上的变化和发展趋势。间上的变化和发展趋势。 1、绝对增长量、绝对增长量 累计绝对增长量累计绝对增长量 逐年绝对增长量逐年绝对增长量 2 2、发展速度和增长速度、发展速度和增长速度 定基比发展速度定基比发展速度 环比发展速度环比发展速度 定基比增长速度定基比增长速度 环比增长速度环比增长速度111

6、0/21/2021k同时期平均人口数某时期内某病新病例数发病率常用相对数指标常用相对数指标:k同时期平均人口数病例数观察期间患某病的新旧患病率k受检人数感染某病原体人数感染率k同年平均人口数某年死亡总人数死亡率k同年平均人口数某年因某病死亡人数疾病别死亡率某病死亡率)(k数同年同年龄组平均人口某年某年龄组死亡人数年龄别死亡率某年龄组死亡率)(总死亡人数因某类死因死亡人数某死因构成比100同时期某病患病人数数观察期间因某病死亡人某病病死率100接受治疗病人数治愈病人数治愈率100接受治疗病人数治疗有效病人数有效率100期初存活的人数年存活的病人数随访满年生存率100nn1510/21/2021二

7、、应用相对数时应二、应用相对数时应注意注意的问题的问题1、计算相对数的分母不宜过小、计算相对数的分母不宜过小2、分析时不能以构成比代替率、分析时不能以构成比代替率3、正确计算平均率、正确计算平均率 对观察单位数不等的几个率,不能直接相加求对观察单位数不等的几个率,不能直接相加求其平均率,必须先分别进行分子和分母的相加,再其平均率,必须先分别进行分子和分母的相加,再计算平均率。计算平均率。k可能发生数合计数实际发生数合计数或称平均率总率)(1610/21/20214、相对数比较时应注意资料的可比性、相对数比较时应注意资料的可比性 通常需注意三点:通常需注意三点: (1)研究对象是否同质)研究对象

8、是否同质 (2)其它影响因素在各组的内部构成是否相同)其它影响因素在各组的内部构成是否相同 (3)同一地区不同时期资料的对比应注意客观)同一地区不同时期资料的对比应注意客观 条件有无变化条件有无变化5、样本率或构成比的比较应做假设检验、样本率或构成比的比较应做假设检验1710/21/2021三、率的标准化法三、率的标准化法 例例4.4( p54) 某省疾病控制中心欲进行甲、某省疾病控制中心欲进行甲、乙两地某病总死亡率的比较,收集资料见表乙两地某病总死亡率的比较,收集资料见表4-5。1810/21/2021( (一)标准化法的意义和基本思想一)标准化法的意义和基本思想v意义意义:比较两个(或两个

9、以上)总体率时,如比较两个(或两个以上)总体率时,如果两个总体的内部构成有所差别,就不能直接果两个总体的内部构成有所差别,就不能直接拿两个总体率来做比较和下结论。拿两个总体率来做比较和下结论。1910/21/2021v基本思想基本思想:在:在两个或多个率(或构成比)进行比两个或多个率(或构成比)进行比较时,为了消除内部构成不同的影响,采用统一较时,为了消除内部构成不同的影响,采用统一的的“标准人口构成标准人口构成”,分别计算标准化率后再做,分别计算标准化率后再做对比的方法。对比的方法。这种消除内部构成差别,使总的率这种消除内部构成差别,使总的率能够直接进行比较的方法就叫做能够直接进行比较的方法

10、就叫做标准化法标准化法。 采用统一标准调整后的率为标准化率,简称为采用统一标准调整后的率为标准化率,简称为标化率标化率(standardized rate)或调整率)或调整率(adjusted rate)常用)常用 表示。表示。p2010/21/2021 (二)标准化率的计算(二)标准化率的计算1、选择标准人口、选择标准人口v选一个具有代表性的、内部构成相对稳定的较大选一个具有代表性的、内部构成相对稳定的较大人群作为标准人群作为标准v将所比较的两组资料内部各相应小组的观察单位将所比较的两组资料内部各相应小组的观察单位数相加,作为共同的标准数相加,作为共同的标准v从所比较的两组中任选一组的内部构

11、成作为标准从所比较的两组中任选一组的内部构成作为标准 本例选用两组合计人口做标准。本例选用两组合计人口做标准。2、计算预期发生数、计算预期发生数 预期发生数预期发生数=标准人口数标准人口数原发生率原发生率表表4-6 甲、乙两地用甲、乙两地用“标准人口数标准人口数”计算标准化死亡率(计算标准化死亡率(1/10万)万)年龄组年龄组(1)03040506070合计合计标准人口数标准人口数(2)34827165342405021583981512582481419405317453甲地甲地原死亡率原死亡率(3)0.004.9036.16148.35319.68323.4743.12预期死亡数预期死亡数

12、(4) 0 261825918264592084乙地乙地原死亡率原死亡率(5)0.008.6449.90179.91324.43329.0139.46预期死亡数预期死亡数(6) 0 4625171783846723192210/21/20213、计算标准化率、计算标准化率k标准人口总数预期发生总数标准化率甲地标准化死亡率甲地标准化死亡率=2084/5317453=39.19/10=2084/5317453=39.19/10万万乙地标准化死亡率乙地标准化死亡率=2319/5317453=43.51/10=2319/5317453=43.51/10万万 乙地标准化率高于甲地。乙地标准化率高于甲地。

13、表表4-7 标准人口构成比计算标准化死亡率(标准人口构成比计算标准化死亡率(1/10万)万) 年龄组年龄组(1)03040506070合计合计标准人口标准人口构成比构成比(2)0.6550 0.1005 0.0944 0.0749 0.0486 0.0267 1.0000 甲地甲地原死亡率原死亡率(3)0.004.9036.16148.35319.68323.4743.12分配死亡率分配死亡率(4)=(2)(3)0.0000 0.4925 3.4135 11.1114 15.5364 8.6366 39.1904乙地乙地原死亡率原死亡率(5)0.008.6449.90179.91324.433

14、29.0139.46分配死亡率分配死亡率(6)= (2)(5)0.0000 0.8683 4.7106 13.4753 15.7673 8.7846 43.60612710/21/2021(三)标准化时应(三)标准化时应注意的问题注意的问题v内部构成不同的资料比较总率时需标准化,或进行内部构成不同的资料比较总率时需标准化,或进行多元统计分析。否则需分别比较各分组的率,也可得多元统计分析。否则需分别比较各分组的率,也可得出正确结论。出正确结论。v标准化后的率并不表示率的实际水平,只能表示相标准化后的率并不表示率的实际水平,只能表示相互比较资料间的相对水平。互比较资料间的相对水平。选定的标准不同,

15、算得的选定的标准不同,算得的标准化率也不同。故只能对统一标准的标化率进行比标准化率也不同。故只能对统一标准的标化率进行比较。较。v 两样本标准化率是样本值,存在抽样误差,若想两样本标准化率是样本值,存在抽样误差,若想判断其总体率是否相同,还应作假设检验。判断其总体率是否相同,还应作假设检验。2810/21/2021第二节第二节 分类变量资料的统计推断分类变量资料的统计推断一、率的抽样误差和总体率的区间估计一、率的抽样误差和总体率的区间估计(一)率的抽样误差和标准误(一)率的抽样误差和标准误为样本例数为样本率的估计值为为样本例数为总体率为率的标准误npsnppnnppppps)1 ()1 (29

16、10/21/2021 例例4.64.6(p56p56) 某地随机抽取某地随机抽取500500名儿童,乙名儿童,乙肝感染率为肝感染率为4.50%4.50%,求乙肝感染率的标准误。,求乙肝感染率的标准误。%93. 000927. 0500)045. 01 (045. 0)1 (nppsp该地该地500500名儿童乙肝感染率的标准误为名儿童乙肝感染率的标准误为0.93%0.93%。3010/21/2021(二)总体率的可信区间(二)总体率的可信区间 估计总体率可用点估计和区间估计进行。这估计总体率可用点估计和区间估计进行。这里仅介绍区间估计。里仅介绍区间估计。1、查表法、查表法时用查表法。或,且当5

17、)1 (50pnnpn2 2、正态近似法、正态近似法),(时用正态近似法。或,且当ppsupsuppnnpn5)1 (503110/21/2021。可信区间为该地儿童乙肝感染率),即(),(可信区间。率计算某地儿童乙肝感染例%32. 6%68. 2%95%32. 6%68. 2%93. 096. 1%50. 4%93. 096. 1%50. 496. 105. 0%956 . 405. 0u改错改错3210/21/2021二、率二、率的的u u检验检验 当当 n n5050,且,且npnp和和n(1-p)5n(1-p)5时,即服从正态分时,即服从正态分布时,样本率与总体率、两样本率之间进行比较

18、可采布时,样本率与总体率、两样本率之间进行比较可采用用u u检验。检验。(一)样本率与总体率的比较(一)样本率与总体率的比较为样本含量为总体率为样本率npnpu0000/ )1 (3310/21/2021 例例4.74.7(p57p57) 根据以往经验,一般胃溃疡根据以往经验,一般胃溃疡患者中有患者中有20%发生胃出血症状。某医院观察发生胃出血症状。某医院观察65岁以上溃疡病患者岁以上溃疡病患者152例,有例,有31.6%的患者出的患者出现胃出血症状。问老年人溃疡病患者是否容易发现胃出血症状。问老年人溃疡病患者是否容易发生胃出血?生胃出血? 3410/21/202105. 0)65(1)65(

19、000不等出血率与一般溃疡患者岁以上溃疡病患者的胃:相等出血率与一般溃疡患者岁以上溃疡病患者的胃:hh出血。溃疡病患者容易发生胃老年溃疡病患者比一般岁以上,可以认为,接受水准,拒绝按6505. 005. 096. 158. 358. 3032. 0200. 0316. 0/ )1 (10000hhpnpu3510/21/2021(二)样本率与样本率的比较(二)样本率与样本率的比较检验等效。检验与此检验。时可用或,且当22121212121)/1/1)(1 (5)1 (5021unnxxpnnppppsppuucpincpinpincccpp3610/21/2021 检验(检验(chi-squa

20、re test或称卡方检验)是用或称卡方检验)是用途非常广泛的一种假设检验方法。本节仅介绍途非常广泛的一种假设检验方法。本节仅介绍用用于于两个或两个以上的率(或构成比)的差异比较两个或两个以上的率(或构成比)的差异比较和配对四格表资料和配对四格表资料差异差异比较的方法。比较的方法。 三、三、 检验检验223710/21/2021 例例4.9(p58) 4.9(p58) 某医师为了观察两种药物治疗慢性某医师为了观察两种药物治疗慢性支气管炎的疗效,将病人随机分为两组,结果见表支气管炎的疗效,将病人随机分为两组,结果见表4-4-8 8,试对两组疗效进行比较(比较差异)。,试对两组疗效进行比较(比较差

21、异)。表表4-8 4-8 两种药物治疗慢性支气管炎的效果两种药物治疗慢性支气管炎的效果组别组别甲组甲组乙组乙组合计合计有效有效54(50.75)54(50.75)44(47.25)44(47.25)9898无效无效62(65.25)62(65.25)64(60.75)64(60.75)126126合计合计116116108108224224有效率有效率(%)(%)87.1087.1068.7568.7577.7877.78(一)四格表资料的卡方检验(一)四格表资料的卡方检验 基本数据是四个数据的表格称为基本数据是四个数据的表格称为四格表四格表(fourfold (fourfold table)

22、table),其相应的资料就称为四格表资料。,其相应的资料就称为四格表资料。 a a、b b、c c、d d分别为四格表中的四个实际频数分别为四格表中的四个实际频数 n n为总例数为总例数3910/21/20211、卡方检验的基本思想、卡方检验的基本思想列的合计为第行的合计为第列格子对应的理论频数行、第为第为基本格子列数为基本格子行数为理论频数为实际频数cnrncrtnnntcrtacrttacrrccrrc) 1)(1(2)(24010/21/2021tta2)(2 值的大小反映了实际数与理论数的相差情况,值的大小反映了实际数与理论数的相差情况,若零假设若零假设 成立,则理论数和实际数应相差

23、不大,成立,则理论数和实际数应相差不大,较大的较大的 值出现的概率较小。故根据资料计算的值出现的概率较小。故根据资料计算的 值越大,就越有理由推翻零假设值越大,就越有理由推翻零假设 。 20h220h4110/21/2021210同,慢性支气管炎的疗效相:甲、乙两种药物治疗h211同,慢性支气管炎的疗效不:甲、乙两种药物治疗h05. 0(1 1)建立假设,确定检验水准)建立假设,确定检验水准75.602241261082225.47224981082125.6575.501162241261161275.502249811611tttt(2 2)计算卡方值)计算卡方值767. 075.60)7

24、5.6064(25.47)25.4744(25.65)25.6562(75.50)75.5054(22222(3 3)确定)确定p p值,做出结论值,做出结论1) 12)(12() 1)(1(列数行数)卡方界值表(查附表122p505. 02) 1 (05. 02p效不同。治疗慢性支气管炎的疗,尚不能认为两种药物水准,不拒绝按005. 0h84. 32) 1 (05. 04310/21/2021值越小。大,值越一定时,)中,当界值表(在值也越大。越大,自由度。格子数越多,则值的大小与格子数有关pp212222205. 02)(05. 0205. 02)(05. 02pp若若nnnttndbca

25、dcbanbcad列合计最小行合计最小最小且应用条件:专用公式540)()()()(22tta2)(2基本公式2 2、四格表专用公式法、四格表专用公式法 四格表专用公式只需计算最小理论值,而下面四格表专用公式只需计算最小理论值,而下面的基本公式必需计算出四个理论值。的基本公式必需计算出四个理论值。3 3、四格表卡方值的校正、四格表卡方值的校正1540)()()()2(22tndbcadcbannbcad且应用条件:校正公式tta2) 5 . 0(2校正公式 例例4.104.10(p59p59) 某医院观察了某医院观察了2828例肝硬化患者例肝硬化患者和和1414例再生障碍性贫血患者的血清中抗血

26、小板抗体的例再生障碍性贫血患者的血清中抗血小板抗体的阳性情况,结果见表阳性情况,结果见表4-104-10。问两类患者血清中抗血小。问两类患者血清中抗血小板抗体阳性率有无差异。板抗体阳性率有无差异。4810/21/2021(1 1)建立假设,确定检验水准)建立假设,确定检验水准)小板抗体阳性率无差异(两类患者血清中抗血:210h)小板抗体阳性率有差异(两类患者血清中抗血:211h05. 0(2 2)计算卡方值)计算卡方值选用校正公式33. 242714214042tn621. 335714284224252692)()()()2(222)(dbcadcbannbcad(3 3)确定)确定p p值

27、,做出结论值,做出结论1) 12)(12() 1)(1(列数行数84. 32) 1 (05. 0122p5)卡方界值表(查附表05. 02) 1 (05. 02p性率有差异。血清中抗血小板抗体阳,尚不能认为两类患者水准,不拒绝按005. 0h5010/21/20211401540)()()()2(540)()()()(2222tntndbcadcbannbcadtndbcadcbanbcad或应用条件:确切概率法且应用条件:且应用条件:四格表资料差异(及关联)分析方法四格表资料差异(及关联)分析方法5110/21/2021(二)(二)配对资料配对资料的的 检验检验2 配对设计即所比较资料除研究

28、因素外,其它的影配对设计即所比较资料除研究因素外,其它的影响因素都尽可能相同的设计。响因素都尽可能相同的设计。配对设计的资料包括配对设计的资料包括: (1)同一批样品用两种不同的处理方法)同一批样品用两种不同的处理方法 (2)观察对象根据配对条件配成对子,同)观察对象根据配对条件配成对子,同一一对对子内不同的个体分别接受不同的处理子内不同的个体分别接受不同的处理 (3)在病因和危险因素的研究中,将病人和对照)在病因和危险因素的研究中,将病人和对照按配对条件配成对子,研究是否存在某种病因或危险按配对条件配成对子,研究是否存在某种病因或危险因素。因素。 配对资料若观察的结果只有阳性、阴性两种配对资

29、料若观察的结果只有阳性、阴性两种可能,清点这类资料只有四种情况可能,清点这类资料只有四种情况: (a): (a)甲甲+ +乙乙+ +, (b)(b)甲甲+ +乙乙- -,(c)(c)甲甲- -乙乙+ +,(,(d d)甲)甲- -乙乙- -。将(。将(a a)、)、(b)(b)、(c)(c)、(d)(d)四种情况的对子数填入表格,即得到四种情况的对子数填入表格,即得到如下配对四格表。如下配对四格表。 甲法甲法+ +乙法乙法+ +(甲(甲+ +乙乙+ +)(甲(甲- -乙乙+ +)(甲(甲+ +乙乙- -)(甲(甲- -乙乙- -)abcd5310/21/202140) 1(40)(2222cb

30、cbcbcbcbcb适用条件:适用条件:1) 12)(12() 1)(1(列数行数 例例4.11(p60) 4.11(p60) 为比较两种检验方法(中和法和为比较两种检验方法(中和法和血凝法)检测关节痛病人的抗血凝法)检测关节痛病人的抗“o”o”结果,观察结果,观察115115例例关节痛患者,结果见表关节痛患者,结果见表4-114-11,问两种检验结果有无差,问两种检验结果有无差别?别? 5510/21/202105. 010cbhcbh有差别,即:两种检查方法的效果无差别,即:两种检查方法的效果(2)(2)计算计算 值值2(1)(1)建立假设,确定水准建立假设,确定水准22418cb682.

31、 74182) 1418(2) 1(2cbcb5610/21/2021(3 3)确定)确定p p值值1) 12)(12() 1)(1(列数行数05. 02) 1 (05. 0682. 72p(4 4)判断结果)判断结果血凝法。中和法阳性检出率高于”结果上有差异,痛患者的抗“法和血凝法在检测关节,可以认为中和,接受水准,拒绝按o1005. 0hh补充补充5710/21/2021三、行三、行列表的列表的 检验检验221、多个样本率(或构成比)比较、多个样本率(或构成比)比较 基本数据的行数或列数大于基本数据的行数或列数大于2时,通称为行时,通称为行列列表,简记为表,简记为r c表。行表。行列表资料

32、的列表资料的 检验可检验可用用于于两个以上的率(或构成比)差异的比较。两个以上的率(或构成比)差异的比较。 ) 12(2crnnan5/1155的格子数少于或适用条件tt5810/21/2021 例例4.12(p60) 4.12(p60) 某医院研究急性白血病与某医院研究急性白血病与慢性白血病患者的血型构成情况有无不同,资慢性白血病患者的血型构成情况有无不同,资料见表料见表4-124-12,问两组差别有无统计学意义。,问两组差别有无统计学意义。(1)(1)建立假设,确定水准建立假设,确定水准05. 010构成比有差别:两组白血病患者血型构成比无差别:两组白血病患者血型hh(2)(2)计算计算 值值287. 82672310324tnnnt最小列最小行最小816. 1) 1231032786103231661032259210324023164216861642556616424192164252(26726010/21/2021(3)(3)确定确定p p值值3) 14)(12() 1)(1(列数行数81. 72) 3 (05. 02)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论