




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第十章第十章 分类变量资料的统计分析分类变量资料的统计分析1 分类变量资料的统计描述2分类变量资料分类变量资料: :按某种属性分类,清点各按某种属性分类,清点各 类的个数。类的个数。绝对数:绝对数:是各类结果的合计频数,反应总是各类结果的合计频数,反应总 量和规模。如某地的人口数、量和规模。如某地的人口数、 发病人数、死亡人数等。发病人数、死亡人数等。相对数:相对数:是两个有联系的指标之比,是分是两个有联系的指标之比,是分 类变量常用的描述性统计指标。类变量常用的描述性统计指标。概 述3一、常用相对数一、常用相对数相相对对数数率率(rate)构成比构成比(proportion)相对比相对比(
2、ratio)4定定 义:义:计算公式:计算公式:率率= =某段时间内发生某现象的观察单位数某段时间内发生某现象的观察单位数该段时间可能发生该现象的观察单位数该段时间可能发生该现象的观察单位数 k频率指标,表示某现象发生的频率或强度。频率指标,表示某现象发生的频率或强度。率率 (rate)5 例(补充)某研究组调查了城镇例(补充)某研究组调查了城镇25岁以上男性岁以上男性居民的吸烟情况,北方城镇调查了居民的吸烟情况,北方城镇调查了1450人,其人,其中中976人经常吸烟,南方城镇调查了人经常吸烟,南方城镇调查了1806人,有人,有1052人经常吸烟,分别计算吸烟率。人经常吸烟,分别计算吸烟率。北
3、方为:北方为:南方为:南方为:%31.67%1001450976%25.58%10018061052率率 (rate)6定定 义:义:计算公式:计算公式:构成指标,表示某一事物内部各构成指标,表示某一事物内部各组成部分所占的比重或分布,常组成部分所占的比重或分布,常以百分数表示。以百分数表示。构成比构成比 (proportion)100单位数总和事物内部各部分的观察察单位数事物内部某一部分的观构成比7表表10-1 200110-1 2001年某地中小学学生年某地中小学学生hbsaghbsag 检出率及构成比检出率及构成比构成比构成比 (proportion)8定定 义:义:计算公式:计算公式:
4、相对比相对比= =甲指标甲指标乙指标乙指标(或(或100%100%)对比指标,表示两个有联系的指标对比指标,表示两个有联系的指标之比,常以倍数或百分数表示。之比,常以倍数或百分数表示。( (必须有专业意义必须有专业意义) )相相 对对 比比(ratio)9 例例10-2 某地某地2003-2005年不同性别新生儿数见下年不同性别新生儿数见下表,试计算该地不同性别新生儿性别比。表,试计算该地不同性别新生儿性别比。相相 对对 比比(ratio)表表10-2 某地某地2003-2005年新生儿性别比年新生儿性别比二二 、应用相对数时的注意事项、应用相对数时的注意事项1.计算相对数的分母一般不宜过小;
5、计算相对数的分母一般不宜过小;2.分析时不能以构成比代替率;分析时不能以构成比代替率;3.观察单位数不等的几个率,不能直接相加求其平均率;观察单位数不等的几个率,不能直接相加求其平均率;4.在比较相对数时应注意可比性;在比较相对数时应注意可比性;5.对样本率(或构成比对样本率(或构成比)的比较应随机抽样,并做假设的比较应随机抽样,并做假设检验。检验。11 某地通报某地通报2007年年12月法定报告传染病疫月法定报告传染病疫情:共有情:共有9人人死于传染病,其中,死于狂死于传染病,其中,死于狂犬病者占犬病者占22.22%,死于肺结核者占,死于肺结核者占33.33%,死于病毒性肝炎者占,死于病毒性
6、肝炎者占33.33%,死于流行性出血热者占死于流行性出血热者占11.11%。【问题问题】(1)通报的各种传染病的死亡情况是什么指标?)通报的各种传染病的死亡情况是什么指标?(2)这种表示是否合适?)这种表示是否合适?实例分析(补充)该医生认为,该医生认为,1岁儿童的麻疹发病率高于其它各年龄组,年龄越大岁儿童的麻疹发病率高于其它各年龄组,年龄越大, 麻疹麻疹发病率越低。该结论正确吗?发病率越低。该结论正确吗? 实例分析(补充)表表 某医院某年收治的某医院某年收治的19071907例麻疹儿童的年龄分布例麻疹儿童的年龄分布13表表10-1 2001年某地中小学学生年某地中小学学生hbsag 检出率及
7、构成比检出率及构成比实例分析hbsag平均检出率平均检出率=(111/3338) 100%=3.33%141.观察对象同质:观察对象同质: 如研究两种毒物的致畸率比较时,不能一如研究两种毒物的致畸率比较时,不能一组用小鼠,一组用大鼠;组用小鼠,一组用大鼠;2.研究方法相同,观察时间一致:研究方法相同,观察时间一致: 如比较两地某种疾病的患病率,对患病与如比较两地某种疾病的患病率,对患病与否的诊断一致,两组的调查应同期进行。否的诊断一致,两组的调查应同期进行。3.其他对观察结果有影响的因素在所比较的其他对观察结果有影响的因素在所比较的两个群体中构成是否相同。两个群体中构成是否相同。资料的可比性资
8、料的可比性15三、率的标准化(一)率的标准化的意义与基本思想(一)率的标准化的意义与基本思想 两组率进行比较时,如果影响两组资料比较结果两组率进行比较时,如果影响两组资料比较结果的其他因素(年龄、性别)构成不同,并足以影响结的其他因素(年龄、性别)构成不同,并足以影响结论时,则不能直接比较两组的总率。论时,则不能直接比较两组的总率。可以按此影响因可以按此影响因素的构成分组比较素的构成分组比较(分性别、年龄组比)(分性别、年龄组比)或对构成进或对构成进行标准化行标准化(计算标准化率)。(计算标准化率)。 率的标准化的基本思想是将两组资料的构成统一率的标准化的基本思想是将两组资料的构成统一按某个标
9、准进行校正,以消除内部构成不同对总率按某个标准进行校正,以消除内部构成不同对总率的影响。的影响。16 把原率资料按影响因素的标准构成调整后算得的率,把原率资料按影响因素的标准构成调整后算得的率,称为称为标准化率标准化率(standerdized rate)亦称为调整率。亦称为调整率。(二)(二) 标准化率的计算标准化率的计算 计算标准化率的步骤:计算标准化率的步骤:1.方法选择:直接法和间接法方法选择:直接法和间接法2.标准选择:标准选择: 选取包含比较各组的大范围人口构成;选取包含比较各组的大范围人口构成; 两组合并的人口构成;两组合并的人口构成; 其中任一组的人口构成。其中任一组的人口构成
10、。3.标化率的计算标化率的计算三、率的标准化171.直接法:直接法:当已知所比较资料各组的实际率当已知所比较资料各组的实际率pi ,用标准用标准人口数或标准人口构成对率进行标化。人口数或标准人口构成对率进行标化。iin ppn(1)已知标准组年龄别人口数时已知标准组年龄别人口数时 (2)已知标准组年龄别人口构成比时已知标准组年龄别人口构成比时 iipnnp)(三、率的标准化三、率的标准化 例例10-3 根据表根据表10-3的资料,计算甲、的资料,计算甲、乙两社区的高血压标准化患病率。乙两社区的高血压标准化患病率。表表10-3 某市甲、乙两社区某市甲、乙两社区20岁以上居民高血压患病率岁以上居民
11、高血压患病率(%)比较比较表表10-4 甲、乙两社区甲、乙两社区20岁以上居民高血压标准化患病率(直接法)岁以上居民高血压标准化患病率(直接法)甲标化患病率:甲标化患病率:1969100%30.47%6463p 甲乙标化患病率:乙标化患病率:2085100%32.26%6463p 乙202.间接法:间接法:iipnrpp标准化率标准化率 已知事件发生总数及年龄别人口数,但不知各已知事件发生总数及年龄别人口数,但不知各年龄组的实际率。年龄组的实际率。r为被标化组的实际发生数,为被标化组的实际发生数,ni为被标化组的年为被标化组的年龄别人口数,龄别人口数,p为标准组的总率,为标准组的总率,pi为标
12、准组第为标准组第i年龄组的率,年龄组的率,r/ni pi为为标准化比标准化比 。三、率的标准化21准化死亡比准化死亡比smr(standard mortality ratio)iirsmrn p实际死亡人数预期死亡人数当当smr 1,被标化组的死亡率高于标准组的死亡率;,被标化组的死亡率高于标准组的死亡率;当当smr 1,被标化组的死亡率低于标准组的死亡率,被标化组的死亡率低于标准组的死亡率22例例10-4 观察某地吸烟者与不吸烟者肺癌观察某地吸烟者与不吸烟者肺癌死亡情况,观察期内吸烟者中有死亡情况,观察期内吸烟者中有431人人死与肺癌,死与肺癌, 不吸烟者中有不吸烟者中有210人死与肺人死与
13、肺癌,吸烟者与不吸烟者各年龄组观察人癌,吸烟者与不吸烟者各年龄组观察人数如下表,试计算吸烟者与不吸烟者的数如下表,试计算吸烟者与不吸烟者的标化死亡率。标化死亡率。23表表10-6 两组肺癌死亡率(两组肺癌死亡率(1/10万)的标化(间接法万)的标化(间接法)24(4)两样本标准化率是样本值,存在抽样误差,若)两样本标准化率是样本值,存在抽样误差,若欲得出标化组和被标化组的总率是否相等的结欲得出标化组和被标化组的总率是否相等的结论,还应作假设检验。论,还应作假设检验。 3. 标准化法使用注意事项标准化法使用注意事项(1)标准化法采用统一标准人口年龄构成。)标准化法采用统一标准人口年龄构成。(2)
14、由于选用的标准不同,所计算的标准化率也不相同。由于选用的标准不同,所计算的标准化率也不相同。(3)如果比较组的各年龄别发生率或死亡率存在交叉)如果比较组的各年龄别发生率或死亡率存在交叉时,则不宜进行标化,应分年龄段进行比较。时,则不宜进行标化,应分年龄段进行比较。三、率的标准化25小 结1.常用的三个相对数的定义常用的三个相对数的定义2.应用相对数时的注意事项应用相对数时的注意事项3.率的标准化的应用条件及计算率的标准化的应用条件及计算262 分类变量资料的统计推断分类变量资料的统计推断李红美李红美 讲师讲师苏州大学医学部苏州大学医学部 放射医学与公共卫生学院放射医学与公共卫生学院 流行病与卫
15、生统计教研室流行病与卫生统计教研室 e-mail: 第十章第十章 分类变量资料的统计分析分类变量资料的统计分析27一、率的抽样分布 从某个二项分类总体中随机抽取一定含量的样从某个二项分类总体中随机抽取一定含量的样本,其样本阳性数及阳性率的分布服从二项分本,其样本阳性数及阳性率的分布服从二项分布,即阳性数或阳性率的分布概率等于二项式布,即阳性数或阳性率的分布概率等于二项式展开后的各项。展开后的各项。若总体阳性率为若总体阳性率为 ,样本含量为,样本含量为n,阳性数为阳性数为x,则样本中出现则样本中出现x个阳性事件的概率为:个阳性事件的概率为:xnxnxnxnxp)1 ()!( !)(28率的抽样分
16、布具有以下特征:率的抽样分布具有以下特征:1.为离散型分布;为离散型分布;2.当当 =0.5,呈对称分布;,呈对称分布;3.当当n不断增大时,二项式分布逐渐逼近正不断增大时,二项式分布逐渐逼近正态分布。态分布。一、率的抽样分布29n=5 =0.33000.050.10.150.20.250.3123456789n=10 =0.33100.050.10.150.20.2512345678910 11 12 13 14 15 16 17 18 19 20n=20 =0.332二、率的抽样误差和标准误二、率的抽样误差和标准误在抽样研究中,由抽样引起的样本率和总体率在抽样研究中,由抽样引起的样本率和总
17、体率及各样本率之间的差异称为率的抽样误差及各样本率之间的差异称为率的抽样误差(sampling error of rate)。率的抽样误差用率的。率的抽样误差用率的标准误表示标准误表示,其计算公式为其计算公式为:(1)pn(1)pppsn33n例例10-6 为了解某地结核菌素试验阳性情为了解某地结核菌素试验阳性情况,某医疗机构在该地人群中随机检测况,某医疗机构在该地人群中随机检测了了1773人,结核菌素试验阳性有人,结核菌素试验阳性有682人,人,阳性率为阳性率为38.47%,试计算其标准误。,试计算其标准误。0.3847(1 0.3847)0.01161773ps34三、总体率的置信区间估计
18、三、总体率的置信区间估计 与总体均数的估计一样,总体率的估与总体均数的估计一样,总体率的估计也包括点值估计和区间估计。率的计也包括点值估计和区间估计。率的区间估计是一定置信度下,估计总体区间估计是一定置信度下,估计总体率所在范围。有两种常用方法:正态率所在范围。有两种常用方法:正态近似法和查表法。近似法和查表法。 35(一)正态近似法 当当n足够大时足够大时,样本率样本率p或或1-p均不太小时,按正态均不太小时,按正态分布的理论来估计分布的理论来估计总体总体率的置信率的置信区间区间(ci)。计算公式:计算公式:/2ppus例例10-6中该地人群中结核菌素试验阳性阳性率的中该地人群中结核菌素试验
19、阳性阳性率的95%和和99%的置信区间:的置信区间:38.47% 1.96 1.16%36.20% 40.74%95% ci:38.47%2.58 1.16%35.84% 41.46%99% ci:36例例 题(补充)题(补充) 某医院对某医院对39名前列腺患者实施开放名前列腺患者实施开放手术治疗,术后有合并症者手术治疗,术后有合并症者2人,试估计该手术合人,试估计该手术合并症发生概率的并症发生概率的95%置信区间。置信区间。(二)查表法(二)查表法当当n 较小时,如较小时,如n 50,按照二项分布的,按照二项分布的原理估计率的置信区间。原理估计率的置信区间。查表得到总体率查表得到总体率95%
20、ci:1%17%。37四、两样本率比较的四、两样本率比较的u检验检验(一)样本率与总体率的比较(一)样本率与总体率的比较n较大,较大, 和和1 均不太小,均不太小,n 和和n(1 )均大于均大于5,近似正态分布近似正态分布,用用u检验。检验。nppup)1 (38n例例10-7 一般情况下,直肠癌围手术期并一般情况下,直肠癌围手术期并发症发生率为发症发生率为30%,现某医院手术治疗,现某医院手术治疗了了385例直肠癌患者,围手术期出现并例直肠癌患者,围手术期出现并发症有发症有100例,并发症发生率为例,并发症发生率为26%,问该院直肠癌患者围手术期并发症发生问该院直肠癌患者围手术期并发症发生率
21、与一般情况比较有无差异。率与一般情况比较有无差异。 39基本步骤基本步骤1.建立检验假设建立检验假设h0: = 0h1: 0 =0.052.计算计算u值值3.确定确定p值,判断结果值,判断结果713. 1385) 3 . 01 ( 3 . 026. 03 . 0u本例本例u=1.7130.05,按,按 =0.05的水准不拒绝的水准不拒绝h0,差异无统计学意义。,差异无统计学意义。40四、两样本率比较的四、两样本率比较的u检验检验(二)两样本率的比较(二)两样本率的比较条件:条件:n1p1、n1(1-p1) 、n2p2、n2(1-p2)均大于均大于5 公式:公式:)11)(1 (21212121nnppppsppuccpp2121nnxxpc41 例例10-8 为了解某地小学生蛔虫感染率的城乡为了解某地
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 切实可行的行政法学备考攻略
- 2025-2030年中国普通魔方行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国时差治疗行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030年中国数码切割机行业市场发展分析及前景趋势与投资管理研究报告
- 2025-2030年中国摩托车行业市场深度调研及发展策略研究报告
- 2025-2030年中国挥发性缓蚀剂(VCI)包装材料行业市场现状供需分析及投资评估规划分析研究报告
- 经济法考试的知识点概述试题及答案
- 深入解析行政法学试题及答案的意义
- 大学语文考试策略要点分析与试题
- 自驾旅游安全协议书
- Alltech 2000型蒸发光散射检测器解决HPLC检测难题
- 休学家长安全承诺书
- JJF 1343-2022 标准物质的定值及均匀性、稳定性评估
- 水文学习题和答案解析
- 高效课堂新授课评价量化表
- 信和SDS2MS使用说明书
- 维修手册震旦218现场
- 画法几何与阴影透视复习题(DOC)
- 螺旋密封的设计及在流体机械中的应用
- 青岛市失业人员登记表
- 《中国好声音》全国校园海选招商方案(冠名)
评论
0/150
提交评论