7.1 Kruskal-Wallis单因素方差分析.ppt_第1页
7.1 Kruskal-Wallis单因素方差分析.ppt_第2页
7.1 Kruskal-Wallis单因素方差分析.ppt_第3页
7.1 Kruskal-Wallis单因素方差分析.ppt_第4页
7.1 Kruskal-Wallis单因素方差分析.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章多组数据的位置推断 多样本的问题是统计中最常见的一类问题 主要涉及如何检验几种不同的方法 决策或试验条件 称为处理 所产生的结果是否一样等问题 首先 这些样本是否独立 在独立样本下 利用Kruskal Wallis 库鲁斯卡尔 沃利斯 检验和Jonckheere Terpstra 约恩克海尔 特普斯特拉 检验来处理两种 有序与否 备择假设情况 在各样本不独立的时 如果是完全区组设计 引进Friedman 弗里德曼 检验对应 有序与否 备择假设情况 当数据为二元时 考虑Corchran 科克伦 检验 当遇到平衡的不完全区组设计时 介绍Durbin 德宾 检验 在参数检验中 我们常常对三个或三个以上的总体的均值进行相等性检验 使用的方法是方差分析 在非参数中也会遇到同样地问题 检验多个总体的分布是否相同 更严格的说 当几个总体的分布条件相同的条件下 讨论其位置参数是否相等 方差分析过程需要假定条件 F检验才有效 可有时候所采集的数据常常不能满足这些条件 像多样本比较时一样 我们不妨尝试将数据转化为秩统计量 因为秩统计量的分布与总体分布无关 可以摆脱总体分布的束缚 完全随机设计采用完全随机化的方法将同质的受试对象分配到各处理组 然后观察各组的实验效应 影响因素只有一个 分析这种数据的方法即单因素方差分析 1 实验材料 动物 植物 土地 为同质 2 各处理 比如饲料配方 要随机安排实验材料 在实际中 除了处理外 往往还有别的因素起作用 比如在关于肥料 处理 效能的农业试验中 不同条件对应的土壤就构成了另一个因素 而土壤条件不是我们所关心的 我们只关心不同肥料的影响如何 假设对A B C D四种处理血液凝固的方法设计比较试验 每种处理方法重复观测5次 换句话说 应该随机将20为正常人分为5组 每组4人 由于每个人的体质不同 血液自然凝固时间的差异可能比较大 如果恰好自然凝血时间较短的人的血液都分给了较差的处理方法 而凝血时间较长的血液都分给了较好的处理方法 最后可能得不出哪一种处理方法更有效 定义 类似于上述的例子 在凝血试验中 不同条件的人构成了另一个影响结果的因素 我们称之为区组 完全随机区组设计影响因素有两个 处理和区组 分析这种处理的方法称为两因素方差分析 1 试验材料为异质 试验者根据需要将其分为几组 几个性质相近的试验单位称一区组 如一个人的血液分成4组 此人即同一区组 不同人为不同区组 使得区组内试验个体之间的差异相对较小 而区组间的差异相对较大 2 每一个区组内的试验个体按照随机安排全部参加试验的各种处理 3 每个区组内的试验数等于处理数 四种凝血时间测量表 区组 处理 以上介绍的完全随机区组设计要求每一个处理都出现在每一个区组中 但是实际问题中不一定能够保证每一个区组都能有对应的样本出现 此时有了不完全区组设计 当处理组较大时 同一区组的所有样本数又不容许太大 在同一区组中不能包含所有的处理 只能安排部分处理 这类区组设计称为不完全区组设计 均衡的不完全区组设计最常用的就是均衡不完全区组设计 BIB 即每个区组安排相等处理数的不完全区组设计 设均衡的不完全区组设计为1 每个处理在同一区组中最多出现一次 2 区组样本量为t t为每个区组设计的样本量 t小于处理个数k 3 每个处理出现在相同多的r个区组中 4 每两个处理相遇的区组次数一样 次 即或当 则为完全区组设计 不同城市保险公司绩效的BIB设计 城市 区组 保险公司 处理 k b r t 7 1Kruskal Wallis检验 数据的分布连续 除位置参数外分布相似 1 Kruskal Wallis检验的基本原理 Kruskal Wallis检验是1952年由Kruskal和Wallis二人提出来的 它是一个将两样本的W M W检验推广到三个或更多组检验的方法 基本原理 与处理两样本位置检验的W M W检验方法相似 将多个样本混合起来求秩 如果遇到打结的情况 采取平均秩 然后再按样本组求秩和 将k组数据混合 并从小到大 列出等级 如果原假设为假 某个总体的位置参数太大 则其观测值也倾向于取较大的值 则该总体的观测值的秩和也会偏大 完全随机设计数据形态 完全随机设计数据的秩 假设检验问题为 k个总体的位置相同 即 k个总体的位置不同 即使得 对于每一个样本观测值的秩求和得到第j组样本的平均秩为观测值得秩从小到大排列依次为1 2 n 则所有数据混合后的秩和为 的分布 假定有n个研究对象和k种处理方法 把n个研究对象分配给第j种处理 分配后的秩为在给定后 所有可能的分法为个 这是多项分布的系数 在零假设下 所有可能的分法都是等可能的 因此有 定理 在零假设下 有因而 在下 应该与非常接近 如果某些与相差很远 则可以考虑拒绝零假设 离差平方和 混合后数据的各秩的平方和为因此混合后各秩的总平方和为 其总方差估值 总均方 为 因此各样本处理间平方和为 无结点时Kruskal Wallis检验统计量 在零假设下 因此 当时 拒绝零假设 接受假设 表示处理间有差异 由备择假设的形式及其H的统计意义 当H非常大时应该拒绝零假设 因此检验的p秩的定义为 当零假设被拒绝时 表示各处理间有差异 因此要进一步比较究竟是哪两组样本之间有差异 Dunn于1964年提议可以用以下检验公式继续检验两两样本之间的差异 其中 与分别为第i和第j个处理的平均秩 SE为两平均秩差的标准误差 其计算公式如下 特别地 当时 可以简化为若 则表示第i和第j种处理间有显著差异 反之 则表示差异不显著 其中 为显著性水平 Z为标准正态分布的分位数值 有结点时Kruskal Wallis检验统计量 其中 为第j个结的长度 g为结的个数 当时 拒绝零假设 接受假设 表示处理间有差异 这时Dunn用于检验任意两组样本之间的差异公式调整为若 则表示第i与第j个处理间有显著性差异 反之则表示差异不明显 式中为显著性水平 引前面的例子进行说明 n 14 k 3 查表得由差值公式得在给定显著性水平下 拒绝零假设 认为三种减肥效果有所不同 例2 为了研究4种不同药物对儿童咳嗽的治疗效果 将25个体质相似的病人随机分为4组 各组人数分别为8人 4人 7人和6人 各自采用A B C D4种药物进行治疗 假定其他条件均保持相同 5天后测得每个病人每天的咳嗽次数如下表所示 单位 次数 试比较这4种药物的治疗效果是否相同 4种药物治疗效果比较表 解 假设检验问题为 4个总体的位置相同 即 4个总体的位置不同 即使得 统计分析 由H统计量的公式得在给定显著性水平下 因此拒绝零假设 认为4种药物疗效不相等 由于4种药物疗效不同 那么就利用Dunn方法进行两两之间的比较 成对数据共有由Dunn给出的SE计算公式得到以下比较表 由上表四种疗效比较结果可知仅B与C有显著性差别 其他疗效之间都不存在显著性差异 这也说明主要的差异在B与C 这与直观比

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论