K个相关样本的非参数检验_第1页
K个相关样本的非参数检验_第2页
K个相关样本的非参数检验_第3页
K个相关样本的非参数检验_第4页
K个相关样本的非参数检验_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、- -第五章 K个相关样本的非参数检验§5.1 几个概念在参数检验中,我们常常对三个或三个以上的总体的均值进展相等性检验,使用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否一样。更严密的说,当几个总体的分布一样的条件下,讨论其位置参数是否相等。方差分析过程需要假定条件,F检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。秩方法在方差分析中的应用。1、 处理样本;2、 区组因素在K个不同的条件下,对n个受试者进展试验。得以下数据: 区组处理12

2、k12n§5.2 Kruskal Wallis检验在比较两个以上的总体时广泛使用的Kruckal-Wallis检验,就是对两个以上的秩样本进展比较的非参数方法,实质上它是两样本比较时的Wilcoxon方法在多于两个样本时的推广。在该测验中,首先计算全体样本中的秩,遇到数据出现相等,即存在“结的情况时,采用“平均秩手段让它们分享它们理应所得的秩和,再对数据(秩)进展方差分析,但构造的统计量并不是组间平均平方和除以组内平均平方和,而是KW=组间平方和/总平方和的平均数,KW表示Kruskal-Wallis统计量。KW统计量的观察值是我们判定各组之间是否存在差异的有力依据,因为我们需要检验

3、的原假设是各组之间不存在差异,或者说各组样本来自的总体具有一样的中心(均值或中位数)。Kruskal-Wallis统计量的计算步骤为:将k 组数据混合,并从小到大排列,列出等级,如有一样数据那么取平均等级,如果原假设为不真,某个总体的位置参数太大,那么其观测值也倾向于取较大的值,那么该总体的观测值的秩和也会偏大,因而导致偏大,其中。SN的含义是:在原假设为真的条件下,只要k大于3, KW很快地依分布趋于自由度为(k-1)的分布。例:从我国上市公司中分别随机抽取了工业、商业、建筑业、交通运输业等四个行业,其在1999年的总资产报酬率如下:12345678910工业9.58.68.86.77.36

4、.87.77.78.69.7商业8.18.27.67.78.07.57.38.28.58.4建筑业8.68.89.28.89.89.79.29.710.29.7交通运输9.07.98.27.68.77.88.87.68.98.7问四个行业资产报酬率是否有显著性差异.要检验这四个组数据的差异性,也可以利用方差分析,但方差分析需要假定观测值服从正态分布。所以用Kruckal-Wallis检验。首先将四个组的数据混合,然后按升序排列,的下表:工业9.58.68.86.77.36.87.77.78.69.7序342227.513.5210102236.5商业8.18.27.67.78.07.57.38

5、.28.58.45172019建筑业8.68.89.28.89.89.79.29.710.29.7序2227.532.527.53936.532.536.54036.5交通运输9.07.98.27.68.77.88.87.68.98.7序311317724.51227.573034.5§5.2 Friedman检验Friedman检验也称Friedman检验,是1937年Friedman提出的检验方法。它是检验K个总体的分布中心是否有差异。Friedman提出的检验方法是独立地在每一个区组内各自对数据进展排秩。例如美国通用、福特与克莱斯勒汽车公司5种不同车型

6、的某年产品油耗情况如表所列,数据分析关心的问题之一是三个公司汽车耗油有无差异,3个汽车公司5种不同车型某年产品油耗情况公司超小型小型中型大型运动型通用20.321.218.218.618.5福特18.618.525.624.719.3克莱斯勒19.320.724.019.821.4K=4,n=5例 三种不同的教学方法的效果是否有显著性差异。将18个学生分别用电视教学,课堂讲授和课堂讨论进展教学,然后考试,按成绩上下排序如下: 教学方法区组学生处理电视教学课堂讲授课堂讨论113221233231456789101112131415161718合计如果三种教学方法对学生的学习效果没用差异,那么每个

7、处理的排序是随机的。否那么每个处理的排序会有倾向。一、 根本方法k种条件不存在差异; k种条件不存在差异;1、将每个处理的不同区组的观察值排序。(1) 第个区组处理关于各处理所取秩的总和;倘假设k种条件不存在差异,那么无论从哪一个区组去观察,每一种处理所得到的数据在该区组内可能地排秩为1至k中的任何一个数。因此,假设原假设为真的话,对每一,应与相距不远,或者其秩平均Ri=Ri/n应与k+1/2相距不远。仿照方差分析的讲法,由处理产生的“秩变异平方和当原假设为真,应该比较小。反之,假设该平方和较大的话,那么为拒绝原假设提供有力证据。2、统计量这个平方和终究怎样算大怎样又算小,统计学的常规处理手法

8、之一还是将它与另外的z平方和或平均平方和来比较,Friedman检验统计量就是将这个平方和除以秩的整体平均平方和,得3、结论当原假设为真时,Q服从自由度为k1的分布。注1:随机区组试验设计资料,也可直接计算值作检验。值计算步骤如下:将每一区组的数据按大小排列,有一样数据时以平均等级计算,其秩次为Rij,再计算各个处理的等级和,并计算所有等级的平方和:及和各个处理秩和平方和的均值:其统计量F为:其自由度v1=k-1,v2=(b-1)(k-1)。注2:Friedman检验只能提示人们假设干总体的中心可能不全相等,而不能指出哪些总体有着一样的中心,哪些总体存在着位置方面的差异,于是我们必须进展多重比

9、较。在两两比较时,首先计算各组平均数之间的差值dij=|RiRj|。然后根据dij计算统计量tij。t的自由度df=(b1)(k1),根据t值,可计算得其显著水平p值。例如 美国通用、福特与克莱斯勒汽车公司5种不同车型的某年产品油耗情况如表所列:3个汽车公司5种不同车型某年产品油耗情况公司超小型小型中型大型运动型通用20.321.218.218.618.5福特25.624.719.319.320.7克莱斯勒24.023.120.619.821.4数据分析关心的问题之一是三个公司汽车耗油有无差异,如果这些数据满足方差分析中所需要的条件,我们可以直接进展方差分析进展统计检验。假设在这些条件根本无法

10、验证与确保的情况下,那么应使用非参数的Friedman检验方法。§5.3 Cochran检验社会经济中的有些数据经常以序数面目出现,尤其是政治方面的民意调查或者市场调查中顾客的信息反响,需要被调查者在某个问题中圈定等级,答复“是或“否,不管怎样,只要使获得的数据(即使是属性的)能以两种方式归类就可以。本节所介绍的非参数方法对研究人员或管理人员都有参考意义。本小段只考虑完全区组设计的一个极重要的特殊情况观察值仅取两个值之一。例如,“是与“否,“+与“-,“成功与“失败等等。通常以1表示成功,0表示失败,于是每一个区组由k个0或1构成。我们以Lj表示第j个区组内成功的次数(1的个数)而以

11、BI表示第I种处理中成功的次数(1的个数),假设想检验各种处理的反响是否有差异,用类似于Friedman检验这样的方法将这些0、1数据转换为秩统计量的话,相当于几乎每个区组内排秩时都存在着“结, Cochran为此引进如下统计量:【例】 消费者对饮料的爱好是否存在差异。某商店为决定经营饮料的品种、数量,对消费者进展了一次调查。随机抽取18个消费者,请他们对四种饮料:热牛奶、酸奶、果汁和可口可乐的喜好进展评价,凡喜好的记作0。消费者热牛奶酸奶果汁可口可乐110012001030011411005101060100700018010090110101110110010120010131001141100151100160100171001180001例 三种不同的教学方法的效果是否有显著性差异三种不同的教学方法:电视教学、课堂讲授、课堂讨论,对学生掌握知识的效果是否有所不同。为了进展检验,抽取了局部同学分为18个组,每组三个匹配的同学。三名同学备随机地置于3种条件下

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论