卫生统计学两变量关联性分析ppt课件.pptx_第1页
卫生统计学两变量关联性分析ppt课件.pptx_第2页
卫生统计学两变量关联性分析ppt课件.pptx_第3页
卫生统计学两变量关联性分析ppt课件.pptx_第4页
卫生统计学两变量关联性分析ppt课件.pptx_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

两变量关联性分析在大量的医学研究中我们需要对两个随机变量之间的关系进行量化研究 一是确定两个变量间是否有联系及联系强度大小 二是定量地确定它们之间的相互依存关系 如研究某年龄儿童的身高与体重的关系 血压与年龄 体温与脉搏 疗效与药物剂量等的关系 1 第一节直线相关一 直线相关的概念及其统计描述例1某医师测量了15名正常成年人的体重 kg 与CT双肾体积 ml 大小 数据如表1所示 据此回答两变量是否有关联 其方向与密切程度如何 2 表115名正常成年人的体重与双肾体积的测量值 3 1 散点图15个人的一对对测得值可看成 x y 的样本取值 据此在直角坐标系中标出对应的点来 这样的图形称为散点图 4 图115名正常成年人体重和双肾体积的散点图 5 由于x y两个变量都是随机变量 它们间的关系不可能像函数关系那样 能以一个变量的数值精确地确定出另一个变量的数值 我们称这类变量之间的关系为非确定性关系 两个随机变量x y之间大致呈直线趋势的关系称为直线相关 又称简单相关 直线相关的性质可由散点图直观说明 散点图的作用能使我们直观地看出两变量间有无关系 正相关 负相关 非直线相关和零相关 6 0 r 1 7 1 r 0 8 r 1 9 r 1 10 r 0 11 r 0 12 二 相关系数的意义及计算直线相关系数又称Pearson积矩相关系数 是用以定量描述两个变量间直线关系密切程度和相关方向的统计指标 13 在实际工作中 我们常常只能获得样本的信息或有关数据 据此我们只能计算样本相关系数 记为 式中 lxx为x的离均差平方和 lyy为y的离均差平方和 lxy为x与y的离均差乘积和 14 15 相关系数的特点 1 直线相关系数r是一个没有单位的数值 且 1 r 1 2 r 0为正相关 r 0为负相关 r 0为零相关 3 r的绝对值越接近1 说明相关性越好或密切程度越高 r的绝对值越接近0 说明相关性越差或密切程度越低 16 例2计算上述例1中体重与双肾体积之间的样本相关系数 本例计算过程如下表 17 18 说明双肾体积随体重增加而增大 两变量呈正相关 19 三 相关系数的统计推断我们在实际工作中 常常只能得到样本相关系数r 因此需要对总体相关系数 是否等于零进行假设检验 H0 0H1 0假设检验的假设前提为x和y均服从正态分布 20 两种常用的检验方法 一 直接查r界值表根据自由度v n 2 查r界值表 用r绝对值与界值进行比较 统计量越大 概率P越小 统计量越小 概率P越大 21 二 采用t检验 实际应用中使用得比较普遍 22 例3在例2算得r 0 875后 试检验相关是否有统计学意义 建立假设H0 0H1 0 确定检验水准 0 05 方法1 由自由度v 15 2 13 查附表13r界值表 得p 0 001 23 方法二 确定概率P值v n 2 15 2 13 tr 6 517 查t界值表 得p 0 001 下结论因为p 0 001 按 0 05水准 拒绝H0 接受H1 差异有统计学意义 即双肾体积与体重之间存在直线相关关系 24 假设检验是回答两变量间的相关关系是否具有统计学意义 p值越小并不表示相关性越强 回答相关的强弱需要计算总体相关系数的 置信区间 由于一般情况下 0时 的分布并不对称 故先对r按 1 式作z变换 由于变换后的z近似地服从于均数为 标准差为的正态分布 故z的 1 置信区间按下式计算 25 将 2 式的上 下限代入下列 3 式 即得到总体相关系数 的 1 置信区间 26 例3 续 在例2算得r 0 875后 试估计总体相关系数 的95 置信区间 将r 0 875代入 1 式 得将z 1 3540 和代入 2 式得z的95 置信区间为 0 7882 1 9198 将z的上 下限分别代入 3 式 得 27 的下限 的上限 故体重与双肾体积总体相关系数的95 置信区间为 0 6574 0 9579 28 四 线性相关应用中应注意的问题1 样本的相关系数接近零并不意味着两变量间一定无相关性 通常应先绘出样本值的散点图 利用散点图可直观地判断两变量之间是否具有线性联系 2 一个变量的数值人为选定时不应作相关 相关分析要求两变量均为随机变量 29 3 出现异常值时慎用相关 4 相关未必真有内在联系5 分层资料盲目合并易出假象 30 第二节秩相关一 秩相关的概念及其统计描述Pearson积矩相关的假设检验要求x和y均服从正态分布 对不服从正态分布的资料 或是总体分布未知的资料或者原始数据用等级表示的资料 需采用秩相关来描述两变量的相关性 秩相关是利用两变量的秩次大小作直线相关分析 对原变量的分布不作要求 属非参数统计方法 其中最常用的统计量是Spearman秩相关系数rs 又称等级相关系数 31 例4某研究者对15例30 50岁成年男子的舒张压 mmHg 与夜间最低血氧含量分级进行研究 结果见表2 试分析两者的关联性 32 表215例成年男子的舒张压与夜间最低血氧含量分级值 33 将两变量x y成对的观察值分别从小到大排序编秩 以pi表示xi的秩次 qi表示yi的秩次 观察值相同的取平均秩次 将pi qi直接替换xi与yi 对秩次计算得的相关系数称为Spearman秩相关系数 用统计量rs表示 34 秩相关为正 表明两变量间有正相关关系 35 二 秩相关系数的统计推断类似于积矩相关系数 秩相关系数的检验假设为 H0 s 0H1 s 0当n 50时 查附表14rs界值表 n 50时 可采用t检验 36 例5对例4的秩相关系数作假设检验 1 建立假设H0 s 0 即舒张压与夜间最低血氧含量分级有无关关系H1 s 0 即舒张压与夜间最低血氧含量分级有相关关系 2 确定检验水准 0 05 3 计算统计rs值 37 4 确定P值本例n 15 50 查等级相关系数戒指表 得P 0 001 5 下结论因为P 0 001 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 可以认为舒张压与夜间最低血氧含量分级之间存在相关关系 且为正相关 38 第三节分类变量的关联性分析对定性变量之间的联系通常用的方法是根据两个定性变量交叉分类计数所得的频数资料 列联表 作关联分析 即关于两种属性独立性的卡方检验 39 一 交叉分类2 2表的关联分析例6为研究青少年在校情况与对艾滋病知晓情况之间的关系 某研究者在某地共调查了384名青少年 并对每名青少年按是否在校和对艾滋病是否知晓两种属性交叉分类 如表3所示 试问青少年在校情况与对艾滋病知晓情况之间是否存在关联性 表3某地青少年是否在校与对艾滋病是否知晓交叉表 40 该例是关于样本含量为384的一份随机样本的受试对象两种属性 变量 的关联性的研究 和分析两定量变量间的相关性类似 表3是关于两个变量的一份随机样本 要检验的是是否在校与对艾滋病是否知晓两个变量之间的关联性 交叉分类资料独立性检验与比较两独立样本频率的假设检验所用的卡方公式 理论频数计算公式和自由度的计算公式完全相同 但是 必须注意 这两类问题的研究目的 设计方案 数据结构以及对结果的解释都是不同的 41 现对例6的数据作两属性的关联性分析 1 建立假设H0 青少年是否在校与对艾滋病是否知晓之间互相独立H1 青少年是否在校与对艾滋病是否知晓之间互相关联 2 确定检验水准 0 05 3 计算统计量值 42 4 确定P值 2 1 2 1 1 查卡方界值表 得P 0 01 5 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 说明青少年是否在校与对艾滋病是否知晓之间互相关联存在关联性 43 关于两个分类变量之间的关联程度 可采用系数 CramerV系数和Pearson列联系数来度量 44 这三个系数值越接近于0 说明两个分类变量之间几乎没有关系 越接近于1 说明关系越密切 系数只适用于四格表 对于多行多列资料 只能用CramerV系数与列联系数 列联系数的最大值为 如四格表资料的列联系数最大值为 为了获得0 1尺度的列联系数 可将获得的列联系数除以列联系数最大值 相对而言 CramerV系数已为0 1尺度 因此该系数更适用 本例两变量的关联程度为 45 二 2 2配对资料的关联性分析例7有132份食品标本 把每份标本一分为二 分别用甲 乙两种检验方法作沙门菌检验 检验结果如表4 问两种检验方法的结果是否存在关联 46 表4两种检测方法的结果比较前面我们用McNemar检验解决了两种培养基的阳性率是否相等的问题 但如要了解两种培养基结果之间是否有关联 则需作两种属性的关联性分析 47 1 建立假设H0 两种检验方法的结果之间互相独立H1 两种检验方法的结果之间互相关联 2 确定检验水准 0 05 3 计算统计量值 48 4 确定P值 2 1 2 1 1 查卡方界值表 得P 0 05 5 下结论因为P 0 05 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 可以认为甲 乙两种检验方法的结果之间互相关联 进一步计算关联程度 49 三 R C表分类资料的关联性分析例8为研究自我效能感与领导行为类型是否有关 某研究者抽样调查了来自某省各三甲医院的238名护士长 并对每个个体按自我效能感和领导行为类型两种属性交叉分类 如表5所示 试分析两变量的关联性 表5自我效能感和领导行为交叉分类表 50 1 建立假设H0 自我效能感与领导行为类型间无关联H1 自我效能感与领导行为类型间有关联 2 确定检验水准 0 05 3 计算统计量卡方值 51 4 确定P值 4 1 2 1 3 查卡方界值表 得P 0 01 5 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 说明自我效能感与领导行为类型间有关联 其关联强度 52 例9某省随机抽查了1043位居民的ABO血型与MN血型 资料如表6 问两种血型之间有无关联性 表6某地1043位居民的血型 53 1 建立假设H0 两种血型系统互相独立H1 两种血型系统互相关联 2 确定检验水准 0 05 3 计算统计量卡方值 54 4 确定P值 4 1 3 1 6 查卡方界值表 得P 0 01 5 下结论因为P 0 01 按 0 05的水准 拒绝H0 接受H1 差异有统计学意义 说明两种血型之间有关联 55 其关联强度 56 四 两个有序分类变量的关联性分析当两个变量均为有序分类变量 如果采用Spearman秩相关会产生大量秩次相等的平均秩次 从而低估两变量间的关联系数 如果采用独立性卡方检验 也不正确 因为R C表资料的卡方检验与分类变量的顺序无关 当有序分类变量R C表资料的分类顺序固定不变时 无论将任何两行 或两列 频数互换 所得的卡方值不变 其结论相同 两有序分类变量的关联性分析宜采用Goodman

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论