《医学预防医学》PPT课件.ppt_第1页
《医学预防医学》PPT课件.ppt_第2页
《医学预防医学》PPT课件.ppt_第3页
《医学预防医学》PPT课件.ppt_第4页
《医学预防医学》PPT课件.ppt_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

综合复习 北京大学公共卫生学院 流行病与卫生统计学系 82801619 康晓平 2009.11.24 复习2009 康晓平 复习2009 康晓平 “学习” 统计的步骤: 统计方法 计量资料 计数资料 统计描述 统计推断 统计描述 统计推断 统计指标 假设检验 统计指标 假设检验 - 平均数 - t 检验 - 频率指标 - 卡方检验 - 变异指标 - 方差分析 - 构成指标 - 秩和检验 - 指标的应用 - 秩和检验 -指标的应用 -相关分析 -线性回归 注意事项 - 可比性(分层、标化) - 适用条件 - 结果解释 复习2009 康晓平 “应用” 统计的步骤: 样本数据 (数值变量、分类变量) 确定分组变量、结局变量 两组或 多组数据对比分析 两变量关联性分析 t 检验 线性相关回归 F 检验 秩和 2检验 2检验 论文 复习2009 康晓平 三种常用平均数 平均数 适用资料 计算方法 算术均数 变量值呈对称分布, 直接法 (未分组资料) 尤其正态分布 加权法 (分组资料) 几何均数 等比级资料, 直接法 (未分组资料) 对数正态分布 加权法 (分组资料) 中位数 呈偏态分布,分布不清楚, 直接法(未分组资料) 分布一端(或两端) 位次居中的数值 无确定值 频数表法(分组资料) 复习2009 康晓平 指标标计计算公式适用条件 极差R最大值值-最小值值任何分布 四分位数间间距 Q Q=P75-P25偏态态分布,末端无确定 值值 方差2、s2 对对称分布,尤其正态态分布 标标准差、s对对称分布,尤其正态态分布 变变异系数CV 量纲纲不同的资资料均数 相差悬悬殊的资资料 常用描述离散趋势的指标 复习2009 康晓平 正态分布及正态曲线下面积的分布规律 1. 标准正态分布: 当正态分布和已知时, 2. 估计观察值所在范围(95%参考值范围) 若和未知, 复习2009 康晓平 标准差与标准误的区别 比较内容 标准差 标准误 意义 表示个体观察值间的变异 表示样本均数间的变异 程度,说明观察值x围绕样本 程度, 说明样本均数x 均数x分散程 度的指标 围绕总体均数 的分散 程度,或者样本率p与 总体率分散程度的指标 计算方法 直接法 均数的标准误 加权法 率的标准误 复习2009 康晓平 应用 * 表示一组观察值之间的 * 表示抽样误差的大小, 变异程度说明均数的 说明样本均数或样本 代表性 率的可靠 * 计算变异系数 * 估计总体参数的95%或99% * 计算均数的标准误 的置信区间 * 当原始数据的分布近似 大样本资料: 正态分布时, 结合 估计95%或99%的观察值 小样本资料: 所在范围 * 总体参数的假设检验 (例如,均数的t检验和z 检 验; 率的z 检验) 复习2009 康晓平 均数的假设检验 假设检验的基本概念 所比较的两个样本均数x1 x2 两种可能性: 两样本均数来自两个相同的总体 两样本均数来自两个不同的总体 复习2009 康晓平 假设检验的一般步骤 1建立假设,确定检验水准 无效假设H0, 1 = 2, (x1 x2) 备择假设H1 1 2, = 0.05 2选定检验方法和计算统计量 3确定概率P值,作出推断结论 t t0.05,v , P 0.05,差别无统计学意义。 t t0.05,v ,P 0.05,差别有统计学意义。 t t0.01,v ,P 0.01,差别有统计学意义。 复习2009 康晓平 均数的t检验 t检验 设计类型 计算方法 样本均数与总 有一个随机样本均数和 体均数比较 一个标准值(经验值) 配对资料或同一 配对设计,计算一组样 批对象试验前 本数据差值的均数 后比较的t检验 两个样本均数比较 成组设计,有两个随机 样本均数 复习2009 康晓平 假设检验的注意事项 1. 样本可比性 2. 选用的假设检验方法应符合其应用条件 3. 正确理解差别有无显著性的统计意义 4. 均数的区间估计与假设检验 5. 正确理解假设检验过程中样本均数与总体均数 间的关系 6. 单,双侧检验的选择 7. 两类错误与检验功效 复习2009 康晓平 假设检验的结论可能发生的两类错误 客观实际观实际 假设检验设检验 的结论结论 拒绝绝H0不拒绝绝H0 H0成立型错误错误 ()推断正确(1-) H0不成立,H1成立推断正确(1-)型错误错误 () 当 P 0.05时,可能发生 错误 检验功效 = 1- 复习2009 康晓平 方差分析 方差分析的基本思想 - 多个样本均数的比较用方差分析 (analysis of variance,简称为ANOVA), - 其目的是检验多个总体均数是否相等。 SS总=SS组间+SS组内 总=组间+组内 复习2009 康晓平 完全随机设计方差分析的计算公式 变变异来源 SSMSF 总变总变 异 N - 1 组间变组间变 异 a - 1SS组间 组间 / 组间 组间 MS组间 组间 / MS组 组 内 组组内变变异SS总 总 SS组组 间间 N - aSS组 组内/ 组组内 复习2009 康晓平 随机区组设计方差分析的计算公式 变变异来源 SS MS F 总总SS总 总 N - 1 处处理组组 间间 SS处 处理 a-1SS处 处理/ 处处理 MS处 处理/ MS误误差 区组间组间SS区组 组 n - 1SS区组 组/ 区组组 MS区组 组/ MS误误差 误误差SS总 总SS处处理 组组 SS区组 组 (a-1)(n-1)SS误 误差/ 误误差 复习2009 康晓平 协方差分析(analysis of covariance, ANCOVA) 基本思想 将那些数值变量(x)对 y 的影响看作协变量, 建立应变量y随协变量x变化的线性回归关系 ,并利用这种回归关系把x值化为相等后再进 行各组y的修正均数间比较的假设检验。 应用条件 独立性、正态性、等方差、x与y存在线性关 系,且回归线平行。 复习2009 康晓平 均数间的两两比较 均数间任意两组比较 - SNK法 - Bonferroni法 - Tukey法 一个对照组与其它组的比较 - Dunnett-t检验 复习2009 康晓平 常用相对数 1. 比率 (proportion) 频率指标 构成指标 2. 速率(rate) 死亡率 发病率 3. 比(ratio) 定基比 环基比 复习2009 康晓平 应用相对数应注意的问题 计算相对数的分母一般不宜过小 分析时不能误将构成比代替率 正确计算总率 进行率或构成比的比较时应注意资料的可比性 - 率的标准化 对样本率(或构成比)的比较应遵循随机化抽样原则并 作假设检验 复习2009 康晓平 标准化法 1. 标准化法的基本思想 2. 标准化率的计算 3. 应用标准化法的注意事项 动态数列 发展速度 变化速度 平均发展速度和平均变化速度 复习2009 康晓平 健康统计指标 1. 人口学特征, 6个指标 2. 生育指标, 4 + 4 个指标 3. 死亡统计指标 , 8个指标 4. 疾病统计指标, 三类指标 (P.177-188) 复习2009 康晓平 二项分布及其应用 1. 二项分布的概念 概率函数 二项分布的均数和标准差 2. 二项分布的应用 率的标准误 总体率的区间估计 假设检验 (1) 样本与总体率比较的直接概率法 (2) 两个样本率比较的z检验 复习2009 康晓平 poisson分布及其应用 1. poisson分布的概念 概率函数 poisson分布的性质 (5个) 2. poisson分布的应用 总体均数的区间估计 假设检验 (1) 样本与总体率比较的直接概率法 (2) 两个样本计数(均数)比较的z检验 复习2009 康晓平 2 检验 (1) 检验两个样本率或两个构成比之间差别的显著性; (2) 检验多个率或多个构成比之间差别的显著性; (3) 检验两种属性或特征之间是否有关系。 (4) 配对设计的两个样本率的比较 成组设计四格表2 检验 的条件及公式 RC列联联表2 检验 的注意事项 配对设计四格表2 检验 的条件及公式 复习2009 康晓平 秩和检验 (非参数检验) 总体分布类型: 非正态分布资料 用于检验的数据: 由原始记录转化的“秩次” 用于检验的指标: 求秩和 总体参数: 无 检验资料的类型: 配对比较的符号秩和检验 两样本成组比较的秩和检验 多个样本比较的秩和检验 等级资料比较的秩和检验 检验假设: 假设总体分布是否不同 复习2009 康晓平 直线相关与回归 相关分析:定量的描述及分析两变量间的相互关系, 即研究变量与变量之间有无直线关系及 确定关系的密切程度。 回归分析:定量的描述及分析两变量间的依存关系, 并用回归方程的形式将两变量间的依存 关系表达出来。 复习2009 康晓平 相关系数及相关系数的假设检验 回归系数、回归方程及回归系数的假设检验 线性回归的应用 P.171 复习2009 康晓平 应用直线相关与回归的注意事项 1. 相关 , 4条 (P165) 2. 回归, 4条 (P176) 3. 秩相关 复习2009 康晓平 4. 相关关系的显著性程度和密切程度 是有区别的。相关关系的显著性程 度越高(例如,P 0.01比 P 0.05 的显著性程度高),表明样本相关 系数来自相关系数为零的总体的 可能性越小。 而相关的密切程度高低,是指样本 相关系数r值的大小。 复习2009 康晓平 5直线相关与回归的区别和联系。 区别:直线相关分析要求两变量是随机 测量得到, 且服从正态分布 直线回归分析的自变量可随机 也可人为取值 联系:(1)用同一资料计算的r和b, 它们的正负号是一致的。 (2)对同一资料,r和b的假设 检验结果(t值)总是一样的。 (3) R2可用于解释两变量的关系 复习2009 康晓平 应按资料性质和分析目的选用适合的统计图形 图图形资资料性质质分析目的 普通线图线图连续连续 性资资料用线线段的升降表达事物的动态动态 ( 差值值)变变化 半对对数线图线图连续连续 性资资料用线线段的升降表达事物的发发展速度 直条图图相互独立资资料用直条长长短表达数值值大小 直方图图连续连续 性变变量的频频数 表资资料 用矩形面积积表达各组组段的频频数( 或频频率) 圆图圆图 及百分条 图图 构成比资资料用圆圆的扇形面积积或直条各段的长长 度表达内部构成比 散点图图双变变量资资料用点的密集度和趋势趋势 表达两变变量 间间相关关系 复习2009 康晓平 实验设计 三要素 四原则 样本含量估计的4个条件 设计方法 - 完全随机设计 - 随机区组设计 - 析因设计 复习2009 康晓平 调查设计 调查设计与实验设计的主要区别 调查研究的种类 调查研究的一般步骤 调查设计的一般内容 常用的几种抽样方法 - 概率抽样 - 非概率抽样 复习2009 康晓平 寿命表及其应用 一、寿命表的种类 现时寿命表与定群寿命表 完全寿命表与简略寿命表 复习2009 康晓平 二、寿命表指标的含义及联系 nmx : 年龄别死亡率 nqx :年龄别死亡概率(age specific probability of death) lx :尚存人数(number of survivors) Ndx :死亡人数(number of dying) nLx : 生存人年数(person-year of survival) Tx : 生存总人年数(total person-year of survival) ex: 预期寿命或期望寿命(life expectancy) 复习2009 康晓平 三、 寿命表指标的应用 4个寿命表指标 平均寿命与平均死亡年龄两个指标加以区别 复习2009 康晓平 去死因寿命表 基本思想: 如果去除了某种或某类死因,则原死于该死因 的人不死于该死因了,那么寿命就会延长; 去除的死因对生命威胁越大, 则预期寿命就会 延长越多。 去死因寿命表方法的优点: 复习2009 康晓平 生存分析(survival analysis) (1) 就是将事件的结果和出现这一结果所 经历的时间结合起来分析的一种统计分析方法 ,它不仅可以从事件结局的好坏,如疾病的痊 愈(成功)和死亡(失败),而且可以从事件 的持续时间进行分析比较,如某病经治疗后存 活的时间长短进行分析比较。 (2)能同时分析有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论