医学统计学Ch08秩和检验.ppt_第1页
医学统计学Ch08秩和检验.ppt_第2页
医学统计学Ch08秩和检验.ppt_第3页
医学统计学Ch08秩和检验.ppt_第4页
医学统计学Ch08秩和检验.ppt_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

medicalstatistics医学统计学 秩和检验ranksumtest基于秩次的非参数统计学方法non parametricstatisticsmethods 主要内容 秩和检验的应用范围 掌握 秩次与秩和 掌握 成组设计两样本比较的秩和检验 掌握 成组设计多样本比较的秩和检验 熟悉 配对设计样本比较的秩和检验 掌握 随机区组设计样本比较的秩和检验 了解 秩和检验的正确应用 掌握 参数统计学和非参数统计学 了解 已经学过的假设检验方法 数值变量资料在满足正态性 方差齐性时 对均数进行比较 采用t检验或方差分析 无序分类资料 dichotomous polynomous 率或构成比的比较采用卡方检验 未解决的 数值变量资料在严重不满足正态性 极度偏态 数据不规则 对平均水平进行比较 数值变量资料在方差相差悬殊 无法利用变量变换达到方差齐性时 对平均水平进行比较 等级资料的分析 欲充分利用次序信息 比较组间等级差异 医学研究中的等级资料 疗效 痊愈 显效 有效 无效 恶化化验结果 体格发育 下等 中下 中等 中上 上等心功能分级 i ii iii文化程度 小学 中学 大学 研究生营养水平 差 一般 好 等级资料的特点 既非呈连续分布的定量资料 也非仅按性质归属于独立的若干类的定性资料 比 定量 粗 而比一般的 定性 细 等级间既非等距 亦不能被度量 秩次与秩和 秩次 rank 秩统计量 rankstatistics 是指全部观察值按某种顺序排列的位序 秩和 ranksum 同组秩次之和 编秩 a组 123457秩次124 54 54 58 5ta 25b组 689101112秩次4 58 58 58 511 511 5tb 53 ta tb n n 1 2 78 秩次 在一定程度上反映了等级的高低 秩和 在一定程度上反映了等级的分布位置 对等级的分析 转化为对秩次的分析 秩和检验就是通过秩次的排列求出秩和 进行假设检验 成组设计两样本比较的秩和检验 某实验室检测了两组各6人的尿蛋白 结果如下 问所得两组结果有无差异 a组 124 54 54 58 5b组 4 58 58 58 511 511 5ta 25 tb 53 成组设计两样本比较的秩和检验 基本思想 wilcoxon成组秩和检验 如果h0成立 即两组分布位置相同 a组的实际秩和应接近理论秩和n1 n 1 2 b组的实际秩和应接近理论秩和n2 n 1 2或相差不大 如果相差较大 超出了预定的界值 则可认为h0不成立 为什么 若两组没有差异 最理论的情形是所有观察值一样 即秩次均为 n 1 2 检验假设h0 a b两组分布相同 h1 a b两组分布不同 相互偏离 0 05 a组b组和实际秩和255378理论秩和n1 n 1 2n2 n 1 2n n 1 2393978差值 14140抽样误差 如果h0成立 则理论秩和与实际秩和之差纯粹由抽样误差造成 两样本秩和检验t界值 该范围表明 在当前水准下 只要实际秩和位于范围内 都可以认为实际秩和和理论秩和的偏离属于抽样误差n1 6n2 n1 0双侧单侧28 500 100 0526 520 050 02524 540 020 0123 550 010 005 间距22263032 6 12 1 2 39 理论值 检验结果 如果h0成立 则按0 05水准 a组秩和之界值为26 52 现a组的实际秩和为25 在界值之外 故拒绝h0 接受h1 认为两组的分布位置不同 秩和检验的结论判断 a组的实际秩和在界值之外 小于或等于下界 大于或等于上界 则拒绝h0 接受h1 a组的实际秩和在界值之内 大于下界且小于上界 则不拒绝h0 两组等级资料间的秩和检验 用复方猪胆胶囊治疗老年性慢性支气管炎患者403例 疗效见表 问该药对此两型支气管炎疗效是否相同 建立检验假设 h0 两型老慢支疗效分布相同 h1 两型老慢支疗效分布不同 0 05 编秩 求秩和 确定检验统计量t若两样本例数不等 以例数较少者为n1 检验统计量t t1 40682 5 确定p值 作出推断结论 正态近似法 n1 n2 n1超出表的范围时 n1 10或n2 n1 10时相同秩次多时校正 p 0 01 按 0 05水准 拒绝h0 接受h1 差异有统计学意义 可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息型与单纯型的疗效有差别 构成比的比较与平均秩次的比较 groupagroupb控制1000显效0100有效0100无效1000构成比比较 不同平均秩比较 相同 成组设计多样本比较的秩和检验 kruskal wallis法先对所有数据编秩 计算h统计量 查h界值表 或用近似 2检验 界定p值 作出结论 成组设计多样本比较的秩和检验 h0 各组总体的等级分布相同 h1 各组总体的等级分布不同或不全相同 0 05 h的校正与 2近似 当有相同秩次时 h需校正 当n较大时 h近似服从 k 1的 2分布 故可按 2分布获得概率p 作出统计推断 某医院用三种复方小叶枇杷治疗老年性慢性支气管炎 试比较其疗效有无差异 检验假设h0 三药疗效总体分布相同 h1 三药疗效总体分布不同或不全相同 0 05 编秩先计算各等级合计人数 再确定秩次范围 计算平均秩次 因每组例数远远超过5 故按 k 1 3 1 2查 2界值表 得 20 005 2 10 60 hc 20 005 2 p 0 005 按 0 05水准拒绝h0 接受h1 认为三药疗效有差别 统计量h的意义 1 设有k个对比组各组样本含量 ni秩和 ri平均秩和 总样本含量 n n1 n2 nk总秩和为 n n 1 2总秩次之平均为 n 1 2 统计量h的意义 2 设无相同等级 则秩次的总离均差平方和为 秩次的组间离均差平方和为 h值 等级资料的多组比较是两组比较的扩展 相当于单因素方差分析的秩和检验 属于秩变换检验 将原始观察值编秩后 再进行统计 多组间的两两比较 如果多组等级比较拒绝h0 认为组间存在差异 则可进行两两比较 t检验法 自由度为v n k h为kruskal wallis中的h统计量 h或hc 建立检验假设h0 三个处理组中任两个总体分布均相同 h1 至少有两个总体分布不同 0 05 计算各组平均秩次令老复方组为第1组 复方i为第2组 复方ii为第3组 确定p值 作出推断结论按 522 3查t界值表 得p值 按 0 05水准 拒绝h0 接受h1 三种方剂疗效总体分布不全相同 差别主要存在于老复方小叶枇杷与复方i组之间 其余组间差别无统计学意义 配对设计样本比较的秩和检验 wilcoxon符号秩和检验计算等级之差值 对差值进行编秩 查t界值表 或用近似u检验 计算p值 界定p值 作出结论 wilcoxon符号秩和检验 h0 差值的总体中位数为0 h1 差值的总体中位数不为0 0 05 当n 50时 查界值表当n 50时 用u近似 用配对设计观察两种方法治疗扁平足效果记录如下 问那种方法好 配对资料的编秩 按差值绝对值大小从小到大编秩 若差值为0 不参与编秩 若差值绝对值相等 则取平均秩 按差值的正负号在秩次上冠以符号 累积正秩次和负秩次 得到正秩和和负秩和 正负秩和的绝对值秩和应等于n n 1 2 h0 差值的总体中位数为0 h1 差值的总体中位数不为0 0 05 编秩 求秩和 确定检验统计量t t 61 5 t 4 5 确定p值和推断结论 符号秩和检验的基本思想 总秩和为t n n 1 2如h0成立 则正负各半 t 与t 均接近n n 1 4 如果相差太大 超出了事先规定的界值 则h0不成立 符号秩和检验t界值表 n 11双侧单侧13 530 100 0510 560 050 0257 590 020 015 610 010 005 间距40465256 11 11 1 4 33 理论值 本例中双侧0 05的界值为10 56 0 01的界值为5 61 正 负秩和均在范围之外 故p 0 01 拒绝h0 差别有统计学意义 说明两种方法疗效总体分布不同 正态近似法 n 50时 配伍设计样本比较的秩和检验 friedman法分别对每一配伍组中的观察值进行编秩 计算friedmanm统计量 查m界值表或自由度为k 1的卡方界值表 计算p值 界定p值 作出结论 五位评委分别评定了4种葡萄酒的等级 一至四级 结果如表8 5 问对四种酒的评判是否一致 四种酒的等级有无差别 评委有无偏爱于哪一种葡萄酒 设一级为最优 二级其次 依次类推 检验假设h0 对四种葡萄酒评判结果的总体分布相同 h1 评判结果的总体分布不同或不全相同 0 05 编秩并求秩和先在每一配伍组内将数据从小到大编秩 见括弧内数字 如有相同数据 取平均秩次 再按处理组求各组秩和ri i 1 2 k 按式 8 8 计算检验统计量m值 确定p值 作出推断性结论根据配伍组数b与处理组数k查附表13 得到p值范围 本例b 5 k 4 查表得 m0 05 7 80 m0 01 9 96 0 05 m m0 01 0 01 p 0 05 下结论 按 0 05水准拒绝h0 接受h1 差异有统计学意义 即可认为四种酒的等级有差别 若b或k超出附表13的范围时 m近似服从 k 1的 2分布 故可按 2分布界值 获得概率p 作出统计推断 如有相同秩次 且m按近似 2分布进行统计推断时 需采用校正公式 秩和检验的正确应用 适用范围 主要对等级资料进行分析 理论上来讲 可以适用于任意分布 distributionfree 的资料 在用于定量资料时 需注意使用条件 t检验与h检验的关系h检验t检验n 2f检验t检验 秩和检验用于定量资料 计量资料中 极度偏态资料 或个别数值偏离过大各组离散度相差悬殊资料中含有不确定值大于5年 0 0011 1024以上兼有等级和定量性质的资料 用二种食物配方饲养大白鼠 观察心肌坏死面积 分析二组间的差异 a组 n 29 mean 3 61 0 0 0 0 0 0 0 0 0 0 0 2 0 3 0 4 0 4 0 6 1 1 6 2 2 2 6 3 3 4 3 5 1 5 4 5 5 6 1 6 2 9 7 13 8 36b组 n 28 mean 1 06 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 2 0 20 3 0 4 0 4 0 9 0 9 1 3 1 7 2 8 7 4 13 正确选择分析方法 例一 特点 0特别多 无论用什么变换均不可能改变分布的偏性 0与其它数的区别是质的区别 分析一 两组心肌坏死率比较 按四格表作 2检验 无心肌坏死有心肌坏死合计心肌坏死率 甲组10192965 5乙组15132846 4p 0 24 分析二 二组平均心肌坏死面积的比较 二组平均心肌坏死面积的t检验 t 1 7755 p 0 0814 分析三 按等级资料处理 两组秩和检验 n秩和理论秩和a组29968841b组28685812合计5716531653u 2 119 p 0 0341 正确选择分析方法 例二 两组完全随机设计计量资料的比较 分析方法一两组秩和检验 两组秩和检验 n秩和理论秩和a组1083 5105 0b组10126 5105 0合计20210 0210 0u 1 63 p 0 1040 分析方法二两组t检验 是否可以用两组资料的t检验 服从正态性的要求 p分别为0 4359和0 4408 服从方差齐性的要求 p 0 7217 利用两个样本均数的t检验 分组n均数标准误标准差a组104 840 882 79b组107 971 003 15差值 3 131 33自由度18t 2 36p 0 0301 成组设计两样本比较 如资料满足t检验的条件 应该用t检验进行分析 此时 如果对这类资料用wilcoxon秩和检验 实际上是将观察单位的具体数值舍弃不用 只保留了秩次的信息 使检验功效降低 尤其样本含量较小时 降低更加明显 如资料不满足t检验的条件 而用了t检验 同样降低了检验效能 参数检验和非参数检验 以往所用的统计学方法 都假设样本来自于某个分布 并对该分布的参数进行统计推断 称为参数检验 parametricmethods t检验 f检验要求正态性 独立性 相关与回归分析 在假设正确时 参数统计学方法效率高 因为可以直接利用分布的有关规律去进行推断 当样本含量不够 incomplete 分布形式未明 现有参数方法无法解决时 需要对样本来自的总体进行尽量少的假设 称为非参数统计学方法 non parametricmethods 非参数统计学方法分类 基于二项分布的方法 忽略原始分布的情形 基于permutation的方法 wilcoxon成组秩和检验 配对秩和检验 kwallis检验等等 利用秩次的组合来得到抽样分布 据此得到获得现有样本及更大样本的概率 基于bootstrap的方法对样本进行再抽样 得到抽样分布 目前很fashion 基于平滑 smoothing 的方法 基于二项分布的方法 检验总体中位数是否为某常数例 40个样品测量值为72 1 72 8 79 7等等 欲检验其中位数是否大于75 若将样本按是否大于75分类 其实就是检验个体取值大于75的总体率是否大于0 5 注意 单侧检验 基于permutation的秩和检验 如果组间没有差异 秩次应当是随机散布 每组是从这些秩次中的一个随机抽样 那么在总样本含量为7 a组为2时 从总样本中随机选出2个 一共可以个子数据集 每一个子数据集对应于一个秩和 每个出现的频率约是0 05 其中最极端的两个 一个是1 2 另一个是6 7 且这两个秩和只会出现一次 故双侧0 10的界值为3 13 同样 我们也可以在所有子数据集中找到与现有样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论