分类变量的统计描述 率的标准误(经典).ppt_第1页
分类变量的统计描述 率的标准误(经典).ppt_第2页
分类变量的统计描述 率的标准误(经典).ppt_第3页
分类变量的统计描述 率的标准误(经典).ppt_第4页
分类变量的统计描述 率的标准误(经典).ppt_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 15 2020 1 第四讲分类变量的统计描述 周虹公共卫生学院妇女与儿童青少年卫生学系 1 15 2020 2 基本内容 主要内容 一 分类变量概述二 分类变量的统计描述相对数应用相对数的注意事项动态数列率的标准化三 分类变量的统计推断率的标准误和可信区间 2检验 分类变量定义通过确定每个观察单位的某项特征的性质或类别得到的数据 请大家举出研究中熟悉的分类变量的例子 特点变量值是定性的没有度量衡单位 第一节 分类变量概述 类型无序分类变量 二项分类变量 多项分类变量有序分类变量统计分析中的处理赋值数据转换SPSS程序 TransformRecodeIntodifferentvariables 1 男性 2 女性 出生体重 数值变量 低出生体重 正常出生体重 巨大儿 练习SPSS中变量转换操作 出生体重 率 sav数据库 将出生体重从数值变量变成分类变量 低出生体重 正常出生体重 巨大儿 1 15 2020 7 第二节分类变量的统计描述 一 常用相对数二 应用相对数的注意事项三 动态数列四 率的标准化 1 15 2020 8 为什么引入相对数 2008年甲县心脑血管疾病死亡人数253人 乙县为132人 能否说甲县心脑血管疾病的威胁比乙县严重 1 15 2020 9 2 在某遗传病的研究中 研究人员发现该病患者中 有90 是第一个孩子 由此可见该病的遗传与出生顺序有关 更容易遗传给第一个孩子 这个结论是否正确 为什么 1 15 2020 10 绝对数 实际观察得到的数据 反映真实情况 相对数 两个有联系的指标 数值 之比 用于比较 1 15 2020 11 相对数的种类 1 率2 构成比3 相对比重要区别 分子 分母 一 常用相对数 1 15 2020 12 1 率 概念 是指某种现象在一定条件下 实际发生的观察单位数与可能发生该现象的总观察单位数之比 用以说明某种现象发生的频率大小或强度 计算公式 如何选K 使算得的率至少保留1 2位整数 习惯 IMR MMR 10万注意 不受其它指标的影响 各率相互独立 求和不一定为1 如是则属巧合 1 15 2020 13 常用的频率 类频率指标 1 15 2020 14 1 15 2020 15 1 15 2020 16 例 某地2007年四种常见心血管病死亡率 1 15 2020 17 2 构成比 概念 也叫构成指标 是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比 用以说明某一事物内部各组成部分所占的比重或分布 计算公式 注意 各组成部分的构成比之和为100 某一部分比重增大 则其它部分相应减少 制图 一般用圆图 饼图 或百分条图 1 15 2020 18 例 某市某病患者的地区构成 1 15 2020 19 2002年全国各地城市农村计划生育手术构成 城市 农村 27 46 12 13 2 1 15 2020 20 练习 率及构成比的差别 已婚妇女不同情况下放环失败比较 1 15 2020 22 3 相对比 概念 是指两个有关联的指标之比 是对比的最简单形式 计算公式 A B 或 100 表示A是B的若干倍或百分之几 例如 BMI 性别比 CV等 注意 1 A B可以是性质相同的 也可以是性质不同的2 A B可以是绝对数 也可以是相对数或平均数 部分国家人口性别比 中国历年报告的出生性别比 1996 2005 127 2006年全国生殖健康调查 1 15 2020 25 例1 在某遗传病的研究中 研究人员发现该病患者中 有90 是第一个孩子 由此可见该病的遗传与出生顺序有关 更容易遗传给第一个孩子 这个结论是否正确 为什么 以 构成 比代替率的错误 实例分析 1 15 2020 26 例2 某项目县为提高医疗卫生的服务水平 对卫生人员进行培训 但是 经过3年培训 与培训前相比 该县孕产妇的死亡率却上升 如何解释 培训前 2001年 2000名孕产妇死亡2人 100 10万培训后 2004年 2010名孕产妇死亡3人 149 10万 计算率时分母不能太小 1 15 2020 27 例3 在对肺癌病人的死亡情况进行分析时发现 北医三院肺癌病人的死亡率为65 密云县医院为25 请问哪家医院的治疗水平高 两个资料要有可比性 1 15 2020 28 例4 某市2007年各区流感的发病率请问 全市流感的发病率 总率的计算不能是各分率的直接相加 1 15 2020 29 二 应用相对数时的注意事项 分析时不能以 构成 比代 替 率计算相对数时分母不能太小资料的可比性 两个率要在相同的条件下进行 标准化问题 总率 平均率 的计算 不能直接相加求和样本相对数的比较应做假设检验 样本相对数存在抽样误差 应进行差别的显著性检验 按照一定的时间顺序 将一系列描述某事物的统计指标依次排列起来 以便观察和比较该事物在时间上的变化和发展趋势 这些统计指标可以是绝对数 相对数或平均数等 动态数列分析是建立在相对比基础上的 采用定基比和环比两种方式 常用的分析指标有 绝对增长量 发展速度与增长速度 平均发展速度和平均增长速度 三 动态数列 某大学1992 2002年本科专业招生动态变化 绝对增长量说明事物在一定时期增长的绝对值 累计增长量 报告年的指标与某一固定年 基期水平 指标之差 逐年增长量 报告年的指标与前一年指标之差 发展速度与增长速度定基发展速度 报告期指标的水平相当于基期水平的百分比或倍数 定基增长速度 相对于基期水平 报告期指标净增加的百分比或倍数 34 环比发展速度 报告期指标的水平相当于上一期水平的百分比或倍数 环比增长速度 报告期指标比上一期水平净增加的百分比或倍数 描述时一定要说清楚比较的基数 以区分定基还是环比速度 平均发展速度和平均增长速度平均发展速度 某事物在一个较长时期内逐年平均发展变化的速度 是环比速度的几何平均数 平均增长速度 某事物在一个较长时期内逐年平均增长的速度 平均增长速度 平均发展速度 1 率及构成比计算的SPSS程序 相对比计算的SPSS程序 AnalyzeDescriptiveStatisticsFrequencies选分析变量入Variable s 框OK TransformComputeTargetVariable 新变量名 NumericExpression 计算方式 OK SPSS练习 出生体重 率的计算数据库 某年儿童体检指标中 男孩占体检儿童的比例 体检儿童的母亲职业分布情况 体检儿童中 低出生体重的发生率是多少 出生体重低于2500克为低出生体重 体检儿童中 出生BMI是多少 1 15 2020 38 四 率的标准化 standardization 条件 内部构成影响总率 要比较的两组的内部构成不相同 比较两组的总率 方法 直接法 适用于已知两组的内部构成 间接法 略 步骤 选定标准构成在比较的资料中任选一组资料的内部构成作为标准构成 两组资料各部分之和组成的构成作为标准构成 选择有代表性的 较固定的 数量较大的人群 2 计算预期发生数3 求标准化率 1 15 2020 40 例 甲乙两厂同工种工人某病的患病率见下表 某领导因发现乙厂的总患病率高于甲厂而认为乙厂的患病情况严重 并批评了乙厂 但是乙厂不服气 请你帮助解释说明真实情况 1 15 2020 41 甲乙两厂同工种工人某病的患病率 1 15 2020 42 直接法计算甲乙两厂的标准化患病率 甲厂标准化患病率 105 1000 10 5 乙厂标准化患病率 60 1000 6 0 可见 乙厂的患病率低于甲厂 与分工龄组比较的结论一致 消除了工龄构成不同的影响 1 15 2020 43 注意事项 1 标化率不能反映实际水平 只能用于比较 2 选用标准不同 标化率会改变 但比较结果只有一个 不能改变 3 比较两样本的标化率 也要进行假设检验 1 15 2020 44 基本内容 1 15 2020 45 第三节分类变量的统计推断 一 率的标准误和可信区间二 2检验 一 成组设计四格表资料的 2检验 二 配对设计四格表资料的 2检验 三 行x列表x2检验 四 趋势x2检验 1 15 2020 46 一 率的标准误和可信区间 样本率p 总体率 抽样误差产生的原因 概念 1 率的标准误 1 15 2020 47 x 率的标准误 P1P2P3 Pi p 0 5时 不同n值对应的二项分布 0 3时 不同n值对应的二项分布 在医学领域中 有一些随机事件是只具有两种互斥结果的离散型随机事件 称为二项分类变量二项分布的图形现状取决于n和 的取值 随n增大 图形逐渐对称分布 1 15 2020 49 率的标准误计算公式 与样本量的关系 成反比 1 15 2020 50 例 某市为了解已婚育龄妇女子宫颈糜烂的患病情况 进行了抽样调查 随机抽取2000人 患者80例 试求此患病率的标准误 51 点估计 不考虑抽样误差的大小 将样本率直接作为总体率的估计值 区间估计 2 总体率的区间估计 52 总体率的可信区间小样本 n 50 时 可直接查 百分率的可信区间表 即可得到总体率的1 可信区间 样本量不太小 总体率既不太小 也不太大 比如np与n 1 p 均大于5时 样本率p的抽样分布近似正态分布 此时总体率的可信区间为 例 某社区共有12000人 现抽查了800人 发现200人患有蛔虫病 如要作集体驱虫治疗 至少应准备多少份药物 95 要知道准备多少药物 就要知道该人群中蛔虫病的患病率 点估计 要估计至少要准备多少药物 就要估计得到该患病率的可信区间 至少 就是要保证病人都能得到药物 所以要按最高患病率来准备 样本率p 200 800 0 25 25 因此样本率的标准误为该人群中蛔虫感染率的95 可信区间为即人群中蛔虫感染率在22 28 之间 因此至少要准备12000 28 3360份药物 1 15 2020 55 例 某医生想观察一种新药对流感的预防效果 进行了如下的研究 问此药是否有效 两个样本率不同 P1 14 P2 25 总体 样本 资料性质 绝对数 相对数 1 15 2020 56 x 率的标准误 P1P2P3 Pi p 1 15 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论