分类变量资料的统计分析.ppt_第1页
分类变量资料的统计分析.ppt_第2页
分类变量资料的统计分析.ppt_第3页
分类变量资料的统计分析.ppt_第4页
分类变量资料的统计分析.ppt_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生学 第7版 第十章分类变量资料的统计分析 1 分类变量资料的统计分析 第十章 卫生学 第7版 第十章分类变量资料的统计分析 2 主要内容 分类变量资料的统计描述 分类变量资料的统计推断 卡方检验 卫生学 第7版 第十章分类变量资料的统计分析 3 什么是分类变量资料 用什么指标进行描述 甲 乙两地发生麻疹流行 甲地患儿100人 乙地患儿50人 何地较为严重 若甲地易感儿童667人 而乙地易感儿童250人 甲地麻疹发病率为100 667 100 15 乙地麻疹发病率为50 250 100 20 第一节分类变量资料的统计描述 用相对数能较好地反映分类变量资料的特征 卫生学 第7版 第十章分类变量资料的统计分析 4 第一节分类变量资料的统计描述 常用相对数应用相对数时的注意事项率的标准化法 卫生学 第7版 第十章分类变量资料的统计分析 5 相对数 相对数 是两个有关联的数值或指标之比 常用的相对数有 率构成比相对比 卫生学 第7版 第十章分类变量资料的统计分析 6 率 rate 率 是指在一定观察时间内 某现象实际发生数与可能发生该现象的总数之比 用以说明某现象发生的频率或强度 K为比例基数 如100 1000 等 比例基数的选择主要依习惯而定或使计算结果能保留1 2位整数 卫生学 第7版 第十章分类变量资料的统计分析 7 构成比 constituentratio 构成比 是指事物内部某一部分的观察单位数与事物内部各组成部分的观察单位数总和之比 用以说明事物内部各部分所占的比重或分布 常用百分数表示 故又称百分比 卫生学 第7版 第十章分类变量资料的统计分析 8 各部分构成比之和为100 此消彼长 构成比的两个特点 卫生学 第7版 第十章分类变量资料的统计分析 9 例10 12001年对某地中小学学生进行HbsAg检查 结果见表10 1 试计算各级学生HbsAg检出率及阳性者构成比 率和构成比不是同一指标 在应用时应注意加以区分 卫生学 第7版 第十章分类变量资料的统计分析 10 相对比 相对比 指两个有关指标之比 说明两个指标的比例关系 两个指标可以是绝对数 相对数 平均数 可以是性质相同或性质不同 但两个指标互不包含 卫生学 第7版 第十章分类变量资料的统计分析 11 例10 2某地2003 2005年不同性别新生儿数见表10 2 试计算该地不同年份新生儿性别比 卫生学 第7版 第十章分类变量资料的统计分析 12 应用相对数的注意事项 计算相对数时分母不宜过小正确区分构成比和率 不能以构成比代替率正确计算平均率对率和构成比进行比较时 应注意资料的可比性率的标准化样本率或构成比进行比较时要作假设检验 卫生学 第7版 第十章分类变量资料的统计分析 13 率的标准化 卫生学 第7版 第十章分类变量资料的统计分析 14 在进行两个内部构成不同的总率比较时 采用统一的标准进行校正 然后计算校正后的标准化率 再进行比较的方法称为率的标准化法 率的标准化法 卫生学 第7版 第十章分类变量资料的统计分析 15 计算标准化率时 首先要选定一个比较的 标准 如 对年龄构成进行标化时 可选用全国 全省等大范围人口构成资料作标准 也可将比较组的合并人口或以其中任一组的人口构成作标准 原则上 选定的标准人口应有代表性 较稳定 容易获得 便于比较 根据获得的资料和选定的标准不同 标准化法可分为直接法和间接法 卫生学 第7版 第十章分类变量资料的统计分析 16 直接法 适用情况 已知被标化组各年龄组的实际率Pi 用标准人口数或标准人口构成进行计算 其中为第i组标准人口数 为标准组总人数 为第i组的实际率 为第组标准人口构成 卫生学 第7版 第十章分类变量资料的统计分析 17 甲社区标准化后的患病率 乙社区标准化后的患病率 卫生学 第7版 第十章分类变量资料的统计分析 18 如根据选定的标准人口构成做标准 卫生学 第7版 第十章分类变量资料的统计分析 19 间接法 适用情况 已知被标化组的死亡总数及年龄别人口数 但不知道各年龄组的实际死亡率 标准化死亡比 卫生学 第7版 第十章分类变量资料的统计分析 20 标准化死亡比 被标化组实际死亡数与预期死亡数之比 称为标准化死亡比 standardmortalityratio 简称为SMR 若SMR 1 表示被标化人群的死亡率高于标准组 反之 若SMR 1 表示被标化人群的死亡率低于标准组 卫生学 第7版 第十章分类变量资料的统计分析 21 例10 4某地观察了吸烟者与不吸烟者各年龄组人数如表10 6 同时观察期内吸烟者中有432人死于肺癌 不吸烟者中有210人死于肺癌 试计算吸烟者与不吸烟者的标准化死亡率 卫生学 第7版 第十章分类变量资料的统计分析 22 吸烟者的肺癌标准化死亡比 非吸烟者的肺癌标准化死亡比 卫生学 第7版 第十章分类变量资料的统计分析 23 吸烟者的肺癌标准化死亡率 非吸烟者的肺癌标准化死亡率 卫生学 第7版 第十章分类变量资料的统计分析 24 率的标准化应注意的问题 1 当各比较组内部构成 如年龄 性别等 不同时 应对率进行标准化后 再作比较 2 标准化率只表明各标化组率的相对水平 而不代表其实际水平 3 两总率各分组对应的率有明显交叉时 则不能用标准化率进行比较 4 如为抽样研究资料 两样本标准化率的比较也应作假设检验 卫生学 第7版 第十章分类变量资料的统计分析 25 第二节分类变量资料的统计推断 率的抽样分布率的抽样误差与标准误总体率的区间估计率比较的u检验 卫生学 第7版 第十章分类变量资料的统计分析 26 率的抽样分布 从某个二项分类总体中随机抽取含量一定的样本 其样本率的分布概率是有规律的 这种规律为服从二项分布 binomialdistribution 即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项 若总体阳性率为 样本含量为n 阳性数为X 则样本中出现X个阳性事件的概率可由下式求得 卫生学 第7版 第十章分类变量资料的统计分析 27 已知 0 5 n 10 0 3 n 5 0 3 n 10 0 3 n 15 试根据式 10 6 求各阳性数事件的概率并作概率分布图 图10 1率的抽样分布图 卫生学 第7版 第十章分类变量资料的统计分析 28 率的抽样分布特征 1 为离散型分布 2 当 1 时 呈对称分布 3 当n增大时 逐渐逼近正态分布 一般认为 当n 和n 1 5时 可近似看作正态分布 卫生学 第7版 第十章分类变量资料的统计分析 29 率的抽样误差和标准误 由于抽样所引起的样本率和总体率或各样本率之间存在着差异 这种差异称为率的抽样误差 用率的标准误表示 卫生学 第7版 第十章分类变量资料的统计分析 30 例10 6为了解某地人群结核菌素试验阳性率情况 某医疗机构在该地人群中随机检测了1773人 结核菌素试验阳性有682人 阳性率为38 47 试计算其标准误 卫生学 第7版 第十章分类变量资料的统计分析 31 总体率的区间估计 总体率的估计 点估计区间估计正态近似法查表法 卫生学 第7版 第十章分类变量资料的统计分析 32 正态近似法 当样本含量n足够大 样本率p或1 p均不太小时 如np和n 1 p 均大于5 样本率的分布近似正态分布 u 是标准正态分布双侧临界值 在估计总体率的95 置信区间时 其值为1 96 99 置信区间时 其值为2 58 卫生学 第7版 第十章分类变量资料的统计分析 33 95 的置信区间 38 47 1 96 1 16 36 20 40 74 99 的置信区间 38 47 2 58 1 16 35 48 41 46 例10 6中该地人群中结核菌素试验阳性率95 和99 的置信区间为 卫生学 第7版 第十章分类变量资料的统计分析 34 查表法 当n较小 如n 50 特别是p接近于0或1时 按二项分布原理估计总体率的可信区间 因其计算比较复杂 统计学家已经编制了总体率可信区间估计用表 可根据样本含量n和阳性数x查阅统计学专著中的附表 卫生学 第7版 第十章分类变量资料的统计分析 35 u检验 当样本含量n足够大 样本率p或1 p均不太小时 如np和n 1 p 均大于5 样本率的分布近似正态分布 样本率和总体率之间 两个样本率之间的比较可用u检验 utest 卫生学 第7版 第十章分类变量资料的统计分析 36 样本率与总体率的比较 卫生学 第7版 第十章分类变量资料的统计分析 37 例10 7一般情况下 直肠癌围术期并发症发生率为30 现某医院手术治疗了385例直肠癌患者 围术期出现并发症有100例 并发症发生率为26 问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异 本例 样本率为26 np和n 1 p 均大于5 可采用u检验 卫生学 第7版 第十章分类变量资料的统计分析 38 建立检验假设H0 0 H1 0 0 05 2 计算u值 3 确定P值 判断结果 本题u 1 713 1 96 P 0 05 按 0 05的水准不拒绝H0 差异没有统计学意义 故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同 卫生学 第7版 第十章分类变量资料的统计分析 39 两个样本率的比较 卫生学 第7版 第十章分类变量资料的统计分析 40 例10 8为了解某地小学生蛔虫感染率的城乡差异 抽样调查了该地小学生22792人 其中城镇小学生8207人 粪检蛔虫卵阳性数为701人 蛔虫感染率为8 54 乡村小学生14585人 粪检蛔虫卵阳性数为2167人 蛔虫感染率为14 86 试比较该地小学生蛔虫感染率城乡差异有无统计学意义 建立检验假设H0 1 2 H1 1 2 0 05 2 计算u值 卫生学 第7版 第十章分类变量资料的统计分析 41 确定P值和判断结果本题 13 739 2 58 P 0 01 按 0 05的水准拒绝H0 接受H1 差异有统计学意义 3 确定P值 判断结果 卫生学 第7版 第十章分类变量资料的统计分析 42 第三节 2检验 基本思想四格表资料的卡方检验配对设计分类变量资料的卡方检验行 列表资料的卡方检验 卫生学 第7版 第十章分类变量资料的统计分析 43 2检验 Chi squaretest 是现代统计学的创始人之一 英国统计学家K Pearson于1900年提出的一种具有广泛用途的假设检验方法 常用于分类变量资料的统计推断 卫生学 第7版 第十章分类变量资料的统计分析 44 基本思想 例10 9某医生欲比较用甲 乙两种药物治疗动脉硬化的疗效 甲药治疗71例 有效52例 乙药治疗42例 有效39例 结果见表10 7 问两种药物的有效率是否有差别 表10 7甲 乙两种药物治疗动脉硬化的疗效比较 卫生学 第7版 第十章分类变量资料的统计分析 45 卡方检验的基本公式 A 实际频数T 理论频数 由上式可以看出 x2值反映的是在检验假设H0前提下实际频数与理论频数的吻合程度 卫生学 第7版 第十章分类变量资料的统计分析 46 2检验的自由度 指可以自由取值的基本格子数自由度一定时 其 2值的概率分布也就确定 根据自由度 和检验水准 查表10 13可得 2界值 若 2值 20 05 则可按 0 05的检验水准拒绝H0 若 2值 20 05 则还不能拒绝H0 卫生学 第7版 第十章分类变量资料的统计分析 47 四格表资料的卡方检验 四格表资料 卫生学 第7版 第十章分类变量资料的统计分析 48 H0 两药有效率相同 即 1 2H1 两药有效率不同 即 1 2 0 05 1 建立检验假设 确定检验水准 例10 9甲 乙两种药物治疗动脉硬化的疗效比较 卫生学 第7版 第十章分类变量资料的统计分析 49 20 025 1 5 02 20 01 1 6 63 本例5 02 2 6 48 6 63 所以 0 025 P 0 01 按 0 05水准 拒绝H0 接受H1 故认为甲 乙两药的疗效不同 乙药疗效要好于甲药 2 计算检验统计量和自由度 3 确定P值 做出推论 n 40 Tmin 5 卫生学 第7版 第十章分类变量资料的统计分析 50 四格表专用公式 本例 卫生学 第7版 第十章分类变量资料的统计分析 51 校正公式 四格表资料 2检验的校正分布是一种连续性分布 而分类变量资料属离散性分布 由此得到的统计量也是不连续的 为改善 2统计量分布的连续性 英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0 5以作校正 卫生学 第7版 第十章分类变量资料的统计分析 52 例10 10某医生研究比较A B两种药物对急性细菌性肺炎的疗效 有关资料见表10 8 问两种药物的疗效差别有无统计学意义 表10 8A B两药治疗急性细菌性肺炎的疗效比较 卫生学 第7版 第十章分类变量资料的统计分析 53 H0 1 2H1 1 2 0 05T22 22 8 64 2 75 5按 1 查 2值表 20 05 1 3 84 2 4 79 3 84 P 0 05 按 0 05水准 拒绝H0 接受H1 认为两药的疗效差别有统计学意义 A药疗效要好于B药 卫生学 第7版 第十章分类变量资料的统计分析 54 在实际工作中 对于四格表资料 通常规定 1 T 5 且N 40时 直接计算值 不用校正 2 1 T 5 且N 40时 用连续性校正检验 3 T 1或N 40 不能用卡方检验 用直接计算概率的方法 卫生学 第7版 第十章分类变量资料的统计分析 55 配对设计分类变量资料的 2检验 卫生学 第7版 第十章分类变量资料的统计分析 56 配对卡方检验又称McNemar检验 卫生学 第7版 第十章分类变量资料的统计分析 57 例10 11用两种血清学方法对100例肝癌患者进行检测 有关检测结果见表10 9 问两种血清学方法检测结果有无差别 表10 9两种血清学方法对肝癌检测的结果比较 卫生学 第7版 第十章分类变量资料的统计分析 58 H0 两种方法检出率相同 即B CH1 两种方法检出率不同 即B C 0 05 查表得 P 0 025 按 0 05水准 拒绝H0 接受H1 差别有统计学意义 可以认为两种方法的检出率不同 甲法较高 1 2 3 卫生学 第7版 第十章分类变量资料的统计分析 59 注意事项 由于该检验只考虑了不一致的情况 b与c 而未考虑样本含量n及一致结果 a与d 因此 当n很大而且两法一致率较高 即a与d数值较大 b与c的数值相对较小时 即使检验结果有统计学意义 但实际意义并不大 卫生学 第7版 第十章分类变量资料的统计分析 60 行 列表资料的卡方检验 行 列表卡方检验的通式 R 1 C 1 卫生学 第7版 第十章分类变量资料的统计分析 61 例10 12某研究者欲比较甲 乙 丙3家医院住院病人院内感染情况 随机抽查同一时期各医院住院病人院内感染情况结果见表10 10 试比较三家医院院内感染率有无差别 表10 10甲 乙 丙三家医院住院病人院内感染率比较 卫生学 第7版 第十章分类变量资料的统计分析 62 H0 三家医院院内感染率相同H1 三家医院院内感染率不同或不全相同 0 05 1 2 3 3 1 2 1 2 查 2值表 20 01 2 9 21 2 20 01 2 P 0 01 按 0 05的检验水准 拒绝H0 接受H1 故可认为甲 乙 丙三家医院院内感染率总的来讲有差别 卫生学 第7版 第十章分类变量资料的统计分析 63 例10 13某研究者欲了解白内障发病是否与ABO血型有关 收集有关资料见表10 11 问白内障组与对照组ABO血型分布有无差别 卫生学 第7版 第十章分类变量资料的统计分析 64 H0 白内障组与对照组ABO血型分布相同H1 白内障组与对照组ABO血型分布不同或不全相同 0 05 查表得 20 05 3 7 81 20 05 按 0 05的检验水准 不拒绝检验假设 尚不能认为白内障组与对照组ABO血型分布不同 1 2 3 2 1 4 1 3 卫生学 第7版 第十章分类变量资料的统计分析 65 理论数不宜太小 不能有1 5以上格子的理论频数小于5或者有一个格子的理论频数小于1 处理方法如假设检验的结果是拒绝无效假设 只能认为各总体率或构成比之间总的来说有差别 若要进一步了解哪两者之间有差别 可用卡方分割法 或者调整检验水准 对于单向有序行列表 在比较各处理组的效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论