




已阅读5页,还剩65页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2020 3 26 1 62 郑大公卫统计教研室平智广 第十章基于秩次的非参数检验 2020 3 26 2 62 参数统计 parametricstatistics 是以样本来自某已知分布总体 如正态分布 t分布 F分布等 为假设基础 对总体参数 如总体均数 总体方差等 进行估计或检验的方法 2020 3 26 3 62 在实践中常遇到以下一些资料 如需比较患者和正常人的血铁蛋白 血铅值 不同药物的溶解时间 实验鼠发癌后的生存日数 护理效果评分等 这类资料 资料的总体分布类型未知 或某些变量可能无法精确测量 疼痛程度无 轻度 中度 重度疾病治疗结果控制 显效 有效 无效 2020 3 26 4 62 非参数统计 nonparametricstatistics 是一种不依赖于总体分布类型 不考虑被研究对象为何种分布以及分布是否已知的统计推断方法 此类方法通常不涉及研究对象的参数 这时统计推断是比较分布而不是参数 2020 3 26 5 62 非参数统计的基本思想 一组数据的最基本信息是次序 将数值按大小次序排队 每个数值在整个数据中所占的位置和次序 称为秩 rank 在一定的假设下 这些秩及其统计量的分布是可以求出来的 且与原来的总体分布无关 可进行所需要的统计推断 2020 3 26 6 62 非参数统计方法的优缺点 优点 适用范围广 对变量的类型和分布无特殊要求 对数据要求不严 对某些指标不便准确测定 只能以严重程度 优劣等级 先后次序等作记录的资料也可应用 对样本量无严格要求 缺点 对于符合参数检验的资料如果用非参数检验 由于没有充分利用资料提供的信息 故检验效能低于参数检验 若要使检验效能相同 往往需要更大的样本含量 2020 3 26 7 62 应用范围 对于计量资料 不满足正态和方差齐性条件的小样本资料 分布不明的小样本资料 一端或两端是不确定数值 如 或 某一数值 的资料 对于等级资料 若选行 列表资料的c2检验 只能推断构成比差别 而选秩转换的非参数检验 可推断等级强度差别 2020 3 26 8 62 Wilcoxon于1945年提出的符号秩和检验 Wilcoxonsingned ranktest 亦称符号秩检验 可用以推断总体中位数是否等于某已知数值 也可推断配对样本差值的总体中位数是否为0 第一节单样本和配对设计资料的符号秩和检验 2020 3 26 9 62 一 单样本资料的符号秩和检验 Wilcoxon符号秩和检验常用于不满足t检验条件的单样本定量资料的比较 其目的是推断样本中位数与已知总体中位数是否相等 例1 已知某地正常人尿铅含量的中位数为2 50mmol L 今在该地随机抽取16名工人 测得尿铅含量 问该厂工人的尿铅含量是否高于当地正常人 2020 3 26 10 62 表116名工人与当地正常人到尿铅含量 mol L 测定结果 2020 3 26 11 62 尿铅含量的直方图 2020 3 26 12 62 1 建立检验假设 确定检验水准H0 差值的总体中位数等于0 即该厂工人的尿铅含量与正常人相同H1 差值的总体中位数大于0 即该厂工人的尿铅含量高于正常人a 0 05 2020 3 26 13 62 2 计算检验统计量T值 1 求差值 2 编秩差值为0 差值的绝对值相同 3 分别求正 负秩和 4 确定检验统计量 任意取T 或T 2020 3 26 14 62 表216名工人与当地正常人到尿铅含量 mol L 测定结果 2020 3 26 15 62 编秩 将差值按绝对值大小从小到大编秩 并按差值的正负给秩次加上正负号 若差值的绝对值相等 则取其平均秩次 如差值的绝对值为1 88的有3个 它们的位次是11 12 13 取平均秩次为 11 12 13 3 12 编秩时如遇差值为0 则舍去不计 2020 3 26 16 62 3 确定P值 并做出推断结论 1 查表法5 n 50 判断原则 内大外小本例 n 16 T 28或T 108 查用T界值表 得0 01 P 0 025 按a 0 05检验水准 拒绝H0 接受H1 可认为该厂工人尿铅含量高于当地正常人 2020 3 26 17 62 2 正态近似法 n 50时 超出附表9范围 可用正态近似法作u检验 2020 3 26 18 62 若多次出现相持现象 如超过25 求得的Z值偏小 应计算校正的统计量值Zc 式中tj为第j j 1 2 个相同秩次的个数 如有2个差值的绝对值为2 5 则t1 2 有3个差值均为5 则t2 3 于是 23 2 33 3 2020 3 26 19 62 二 配对设计资料的符号秩和检验 目的是推断配对样本差值的总体中位数是否与0有差别 即两个总体中位数是否有差别 例2 对11份工业污水测定氟离子浓度 mg L 每份水样同时采用电极法及分光光度法测定 结果见表 问就总体而言 这两种方法的测定结果有无差别 表3两法测定11份工业污水中氟离子浓度结果 2020 3 26 21 62 本例配对样本差值经正态性检验 推断得总体不服从正态分布 现用Wilcoxon符号秩检验 建立检验假设 确定检验水准H0 差值的总体中位数等于0H1 差值的总体中位数不等于0a 0 052 求检验统计量T值 1 求差值 2 编秩 3 求秩和 4 确定统计量 2020 3 26 22 62 3 确定P值 作出推断查表法5 n 50 查T界值表 附表9 任取正秩和或负秩和为T 本例为T 11 5或T 43 5 P 0 10 按照a 0 05水准不拒绝H0 尚不能认为两法测定结果有差别 2020 3 26 23 62 第二节两组独立样本比较的秩和检验 理论上零假设H0为两总体分布相同 即两样本来自同一总体 其对立假设H1为两总体分布不同 秩和检验对两总体分布形状的差别不敏感 对位置相同 形状不同但类似的两总体分布 推断不出两总体分布形状是否有差别 故H1不能为两总体分布不同 而是两总体分布位置不同 简化为两总体的中位数相等 2020 3 26 24 62 一 定量变量两组独立样本的秩和检验 例3 用两种药物杀灭钉螺 每批用200 300只钉螺 用药后清点钉螺的死亡数 并计算死亡率 问两种药物杀灭钉螺的效果有无差别 2020 3 26 25 62 表4两种药物杀灭钉螺死亡率 的比较 2020 3 26 26 62 建立检验假设 确定检验水准H0 两种药物杀灭钉螺死亡率的总体中位数相等H1 两种药物杀灭钉螺死亡率的总体中位数不相等a 0 05 2020 3 26 27 62 2 计算检验统计量T值 1 编秩把两样本数据混合从小到大编秩 同组 不同组 2 求各组秩和以样本例数小者为n1 其秩和为T1 3 确定检验统计量T值 若n1 n2 则T T1 若两样本例数相等 可任取一样本的秩和本例n1 n2 可取T T1 71 5或T T2 33 5 2020 3 26 28 62 表4两种药物杀灭钉螺死亡率 的比较 2020 3 26 29 62 3 确定P值 作出推断 1 查表法查T界值表 成组设计用 n1 7 n2 n1 0 T 71 5或T 33 50 01 P 0 02按照a 0 05水准 拒绝H0 可以认为两种药物杀灭钉螺的效果有差别 2020 3 26 30 62 2 正态近似法n1 10或n2 n1 10 2020 3 26 31 62 二 有序分类变量两组独立样本的秩和检验 例4 某医科大学营养教研室为了解居民体内核黄素营养状况 于某年夏冬两个季节收集成年居民口服5mg核黄素后4小时的负荷尿 测定体内核黄素含量 试比较该地居民夏冬两个季节体内核黄素含量有无差别 表5某地居民夏冬两个季节体内核黄素营养状况比较 2020 3 26 32 62 建立检验假设 确定检验水准H0 夏冬两个季节居民体内核黄素含量的总体中位数相等H1 夏冬两个季节居民体内核黄素含量的总体中位数不相等a 0 052 计算检验统计量T值 1 编秩 先确定各等级的合计 秩范围和平均秩 2 求各组秩和 3 确定检验统计量T值T1 16 5 10 48 5 14 74 5 16 2036T2 16 5 22 48 5 18 74 5 4 1534T T1 2036 2020 3 26 33 62 3 确定P值 作出推断本例n1 40 超出T界值表可查范围 用正态近似法 两独立样本的非参检验 Mann WhitneyU检验 SPSS 和Wilcoxon秩和检验是等价的 2020 3 26 34 62 第三节多组独立样本比较的秩和检验 一 定量变量多组独立样本的秩和检验二 有序变量多组独立样本的秩和检验三 多个独立样本间的多重比较Kruskal WallisH检验 一 定量变量多组独立样本的秩和检验 例5 某医院用3种不同方法治疗15例胰腺癌患者 每种方法各治疗5例 治疗后生存月数见表 问这3种方法对胰腺癌患者的疗效有无差别 表63种方法治疗胰腺癌患者的生存月数比较 2020 3 26 36 62 建立检验假设 确定检验水准H0 3种方法治疗后患者生存月数的中位数相等H1 3种方法治疗后患者生存月数的中位数不全相等a 0 052 计算检验统计量H值 1 编秩三组统一编秩 相同数据同一组 可顺次编秩 在不同组 求平均秩次 2 求各组秩和 2020 3 26 37 62 3 确定检验统计量H值 若相持较多 如超过25 应计算校正值 2020 3 26 38 62 3 确定P值 做出推断 1 当组数k 3 ni 5 可查附表11中的界值 H的临界值等于5 78 P 0 05 拒绝H0 接受H1 故可认为3种方法治疗后胰腺癌患者的生存月数有差别 2 当不满足条件 1 时 近似地服从自由度为k 1的c2分布 可查附表8的c2界值表得到P值 Kruskal WallisH检验的基本思想类似于单因素方差分析 相当于将秩次看做原始数据进行比较 2020 3 26 39 62 二 有序变量多组独立样本的秩和检验 例6 某医院用3种方法治疗慢性喉炎 结果见表7 问这3种方法的疗效是否有差别 表73种方法治疗慢性喉炎的疗效比较 2020 3 26 40 62 1 建立检验假设 确定检验水准H0 3种方法疗效的总体分布位置相同H1 3种方法疗效的总体分布位置不全相同a 0 052 计算检验统计量H值 1 编秩 先计算各等级的合计 再确定秩次范围及平均秩次 2 求各组秩和如本例 2020 3 26 41 62 表73种方法治疗慢性喉炎的疗效比较 2020 3 26 42 62 3 计算检验统计量H由于相持较多 故需校正 2020 3 26 43 62 3 确定P值并做出推断结论k 3 各组例数均大于5 近似服从n k 1 2的 2分布 查 2界值表 得P 0 05 按a 0 05检验水准 拒绝H0 接受H1 可以认为3种方法治疗慢性喉炎的效果有差别 2020 3 26 44 62 三 多个独立样本间的多重比较 2020 3 26 45 62 此外还有Nemenyi法检验计算的是D或c2值 2020 3 26 46 62 补充 一 随机区组设计的秩和检验 一 M检验FriedmanM检验 用于推断随机区组设计的多个相关样本所来自的多个总体分布是否有差别 检验假设和备择假设和多个独立样本比较的Kruskal Wallis检验相同 2020 3 26 47 62 例7 8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激 他们的反应率 资料见表8 问4种频率声音刺激的反应率是否有差别 表8受试对象对4种不同频率声音刺激的反应率 2020 3 26 48 62 本例n 8 g 4 为百分率资料 不符合正态分布 为随机区组设计 故用FriedmanM检验 1 建立检验假设 确定检验水准H0 4种频率声音刺激的反应率总体分布位置相同H1 4种频率声音刺激的反应率总体分布位置不全相同a 0 052 计算检验统计量M值 1 编秩 2020 3 26 49 62 表8受试对象对4种不同频率声音刺激的反应率 2020 3 26 50 62 求检验统计量M值 将每个区组的数据由小到大分别编秩 遇数据相等者取平均秩 计算各样本的秩和Ri 平均秩和为 按下式求M值 2020 3 26 51 62 确定P值 作出推断结论 当n 15和g 15时 查M界值表 附表12 本例n 8和g 4 查附表12得 按a 0 05水准拒绝 接受H1 可认为4种频率声音刺激的反应率有差别 2020 3 26 52 62 二 c2近似法若n 15或g 15时 超出附表12的范围 可用c2近似法 按下式计算c2值 2020 3 26 53 62 当各区组间相同的秩次较多时 须进行校正 式中t为各区组内第j个具有相同秩次的个数 n为配伍组数 g为处理组数 由于C 1 故校正的c2对应的P值减小 在下列情况下校正的意义较大 相同数据的个数在各配伍组中所占比重较大时 所得P值在检验水准附近时 2020 3 26 54 62 三 F近似法 当区组个数较多时 还可近似用秩转换的F检验1 对每个区组数据由小到大分别编秩次 相同数据取平均秩次 得到每个数据的秩次Tng2 计算各处理组的秩和Tg 3 计算所有秩次的平方和AA T2ij 或者A ng g 1 2g 1 64 计算各处理组秩次平方和的均值B B T2 ij5 计算F值 6 确定P值 以n1 g 1 n2 g 1 n 1 查方差分析用F界值表 2020 3 26 55 62 二 随机区组多个样本两两比较的检验 一 M检验后的两两比较当经过多个相关样本比较的FriedmanM检验拒绝H0 接受H1 认为多个总体分布位置不全相同时 若要进一步推断是哪两两总体分布位置不同 可用q检验 2020 3 26 56 62 二 F检验后的两两比较 计算处理组秩和Ti 计算各对比组秩和的差值绝对值 TA TB 计算在a检验水准下的界值Ca 确定概率P值 若 TA TB Ca 则P a TA TB a 2020 3 26 57 62 小结 非参数检验在假设检验中不对参数作明确的推断 也不涉及样本取自何种分布的总体 它的适用范围较广 当资料适用参数检验方法时 用非参常会损失部分信息 降低检验效能 秩和检验是通过对数据依小到大排列秩次 求秩和来进行假设检验的方法 可用于两独立样本比较 配对资料比较 多个独立样本比较 随机配伍组比较等 2020 3 26 58 62 正确应用秩和检验方法秩和检验既能分析定量变量资料 又能分析有序变量或等级变量资料 实际中要注意其应用条件 对于定量变量资料 如果符合参数检验方法的前提条件 要用参数统计方法 在不符合参数统计方法条件时 用秩和检验 对有序变量或等级变量资料 如果是疗效检验 用秩和检验 不用c2检验 已知总体分布类型 对未知参数进行统计推断 依赖于特定分布类型 比较的是参数 参数检验 parametrictest 非参数检验 nonparametrictest 对总体的分布类型不作严格要求 不受分布类型的影响 比较的是总体分布位置 优点 方法简便 易学易用 易于推广使用 应用范围广 可用于参数检验难以处理的资料 如等级资料 或含数值 50mg 等 缺点 方法比较粗糙 对于符合参数检验条件者 采用非参数检验会损失部分信息 其检验效能较低 样本含量较大时 两者结论常相同 2020 3 26 60 62 Summary Wilcoxon符号秩检验 单样本资料 配对设计两样本比较 T Z值 Wilcoxon秩和检验 两组独立样本比较 T Z值 Kruskal Wallis秩和检验 完全随机设计的多组样本比较 H c2值 多个独立样本间的两两比较 t检验 c2值 Friedman秩和检验 随机区组设计资料的多样本比较 M c2值 2020 3 26 61 62 不同研究设计和数据类型的数据分析方法选择 2020 3 26 62 62 了解 不同设计类型的秩和检验和相应t检验的功效有何不同 熟悉 非参数统计的概念 不同设计类型的秩和检验方法 掌握 不同设计类型的秩和检验的实施方法及其应用条件 教学要求 2020 3 26 63 62 练习 2020 3 26 64 62 单项选择 1 以下检验方法除外 其余均属非参
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年小学教师资格考试《综合素质》教育评价策略与应用试题及答案
- 2025年地理信息技术在初中地理学业水平考试中的应用模拟试题及答案详解
- 集体鱼塘承包合同范本
- 美容消费股东入股协议书
- 生活超市承包合同范本
- 餐饮技术品牌入股协议书
- 设备设计安装合同范本
- 隔离酒店改造意向协议书
- 集体土地转让合同范本
- 财务顾问项目合同范本
- 诊所药品自查报告
- 2024年保安员证考试题库及答案(共240题)
- 智能化工程投标书
- 恒牙临床解剖-上颌中切牙(牙体解剖学课件)
- 【招投标管理探究的国内外文献综述2600字】
- (新版)军队文职人员招聘(军需保管员)强化练习复习题库(含答案)
- 传感器技术-武汉大学
- 岩石破碎型泥水平衡顶管施工工法
- 新概念英语第1册第2册单词带音标
- 健康养老照护课程设计
- 西藏拉萨市10校2025届高考冲刺押题(最后一卷)历史试卷含解析
评论
0/150
提交评论