第4章-多样本的非参数检验只是分享课件_第1页
第4章-多样本的非参数检验只是分享课件_第2页
第4章-多样本的非参数检验只是分享课件_第3页
第4章-多样本的非参数检验只是分享课件_第4页
第4章-多样本的非参数检验只是分享课件_第5页
已阅读5页,还剩129页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章-多样本的非参数检验第4章-多样本的非参数检验如果k(>2)个样本是按某种或者某些条件匹配的,那么k个样本称为相关的,否则为独立的。K个相关和独立样本的差别与两个相关和独立样本之间的差别类似。多样本的问题是统计中最常见的一类问题。主要涉及如何检验n种不同方法、决策或试验条件(称为处理)所产生的结果是否一样等问题,可以使用Kruskal-Wallis秩和检验、卡方检验、正态记分检验、Jonkheere-Terpstra检验、CochranQ检验、Friedman检验等非参数检验方法。本章仅介绍其中的最常用、重要的检验方法。如果k(>2)个样本是按某种或者某些条件匹配的,那么k个样本复习:方差分析的基本思想组间方差组内方差如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。F=复习:方差分析的基本思想组间方差组内方差如果因素A的不同水平组间方差和组内方差组间离差平方和组内离差平方和组间方差组内方差受因素A和随机

因素的影响只受随机

因素的影响组间方差和组内方差组间离差平方和组内离差平方和组间方差组内方多样本的非参数检验方法Kruskal-Wallis检验(K个独立样本)多样本的检验(K个独立样本)Friedman检验(K个相关样本)CochranQ检验(K个相关样本)多样本的非参数检验方法Kruskal-Wallis检验(K个4.1Kruskal-Wallis检验Kruskal-Wallis检验译为克拉夏尔-瓦里斯检验,简称克氏检验。它是1952年由Kruskal和Wallis两人提出的,是两个独立样本Mann-Whitney-Wilcoxon检验的一种推广。4.1Kruskal-Wallis检验Kruskal-Wa4.1.1基本思路与检验步骤今要研究k个总体的分布是否相同,需要的数据是k个独立的随机样本,其大小为样本独立地分别从各自的总体中抽取,总体分别具有连续的累积概率分布。数据的测量层次至少在定序尺度上。

K-W检验前提是假定总体连续,除位置参数不同外,分布相似。4.1.1基本思路与检验步骤今要研究k个总体的分布是否相同完全随机化设计数据形态总体1总体2…总体k重复R11R21…Rn11R12R22…Rn22…...…R1kR2k…Rnkk完全随机化设计数据的秩总体1总体2…总体k重复x11x21…xn11x12x22…xn22…...…x1kx2k…xnkk完全随机化设计数据形态总体1总体2…总体kR11R12…R1为检验零假设,我们需要构造一个检验统计量。方法是将所有数据按从小到大的顺序合并成一个单一的样本,其大小。将每一个观察值给出一个等级即评秩,秩为整数,从1到N。对于N个观察值来说,平均等级是为检验零假设,我们需要构造一个检验统计量。方法对于含有个观察值的第j个样本来说,等级总和的期望值是,若以Rj表示第j个样本的实际等级总和,则就表示k个样本中第j个样本等级总和与其均值的偏差。如果H0为真,所有样本数据混合排列成一个单一的随机样本,等级即秩次应该在k个样本之间均匀地分布,各组中Rj的平均值差别不大,即各样本实际的等级总和即秩次和Rj与期望等级总和之间的偏差应很小。对于含有个观察值的第j个样本来说,等级总和的期望值是Kruskal-Wallis检验定义的统计量就是建立在实际等级总和Rj与期望等级总和的偏差的基础之上的。它定义为H,计算公式为:Kruskal-Wallis检验定义的统计量就是建立在实际等严格地讲,其中严格地讲,严格地讲,其中严格地讲,H的一般计算公式H的简易计算公式H的一般计算公式H的简易计算公式在小样本的情况下,已知(n1,n2,n3)和显著性水平,Kruskal-Wallis检验统计量H的临界值可通过查表得到。在大样本情况下,H服从。参照方差分析的F统计量服从F(k-1,N-k).

在小样本的情况下,已知(n1,n2,n3)和显著性水平,检验步骤:(1)建立假设

如果偏重于考察位置参数,则所建立的假设是:注意:备择假设对于k>2时不存在单侧备择的配对,因为对于来说,有k!=k*(k-1)*…*3*2*1种不同的有序排列,不便于进行检验。检验步骤:检验步骤:(1)建立假设

如果偏重于考察位置参数,则所建立的假设是:注意:备择假设对于k>2时不存在单侧备择的配对,因为对于来说,有k!=k*(k-1)*…*3*2*1种不同的有序排列,不便于进行检验。检验步骤:(2)计算检验统计量H(3)作出决策。当数据支持H0,不能拒绝H0;当数据不支持H0,拒绝H0。Refernces:Kruskal,W.H.andWallis,W.A.(1952).Useofranksinone-criterionvarianceanalysis.J.Amer.Statist.Assoc.,47,583-621.(2)计算检验统计量H4.1.2应用例为检验4种训练方式的有效性是否存在显著差异,将报名的30名运动员随机地分为4组(运动员的条件基本相同),分别接受不同的培训。训练一段时间后,按规定的要求进行测试,测试成绩如下表所示:4.1.2应用例训练方式A训练方式B训练方式C训练方式D607562767398867252688274648761857866705969796358657184778089试问4种训练方式的有效性是否存在显著差异(a=0.05)?训练方式A训练方式B训练方式C训练方式D60726163试问解:(1)建立假设(2)计算检验统计量

(3)作出决策,数据在5%的显著性水平上不能拒绝H0,表明4种训练方式的有效性没有什么显著差异。解:(1)建立假设存在打结数据,用H可以修正为:这里,为结统计量,g为结的个数。数据结的处理存在打结数据,用H可以修正为:数据结的处理4.1.3练习

在一项健康试验中,有3种生活方式,它们的减肥效果如下表:生活方式123一个月后减少的重量(单位:500g)3.73.73.03.92.77.35.25.35.76.59.04.97.18.7试问在5%的显著性水平下,能否从这些调查数据中得出三种生活方式的减肥效果相同?4.1.3练习在一项健康试验中,有3种生活方式,它们的减4.2检验两个独立样本的检验可以直接推广到k个独立样本,用来检验k个样本之间差异的显著性。4.2检验两个独立样本的检验可以直接推广4.2.1基本思路与检验步骤k个独立样本检验与两个独立样本的基本方法类似。这里不再详述。

检验步骤:(1)提出假设4.2.1基本思路与检验步骤k个独立样本检(2)计算检验统计量

(3)作出决策当时,数据在a水平上拒绝H0;当时,数据在a水平上不能拒绝H0。(2)计算检验统计量多样本卡方检验的两点注意Q统计量只是理论上的卡方值的一个估计,在有些情况下这种估计差异较大。1.总的观察次数很小的情况,例如在n=k=2时,小于20。2.大多数期望的观测次数小于5。多样本卡方检验的两点注意Q统计量只是理论上的卡方值的一个估计4.2.2应用例某课题组欲了解“收听体育广播兴趣不同的人,参加体育活动的情况是否也不相同”。他们在全国抽选了12个省的2162人,按收听体育广播的兴趣程度分为:很不喜欢、不喜欢、无所谓、喜欢、非常喜欢五类,各类人员参加体育活动情况如下表所示:4.2.2应用例各类人员参加体育活动情况的人数很不喜欢不喜欢无所谓喜欢非常喜欢合计不参加偶尔参加经常参加天天参加153439615151464421840511939020411310857932581102489269302合计2514010867151962162试问:能否认为在0.05的显著性水平下,收听体育广播兴趣不同不影响参加体育活动?各类人员参加体育活动情况的人数很不喜欢不喜欢无所谓喜欢非解:(1)提出假设H0:收听体育广播兴趣不同不影响参加体育活动H1:收听体育广播兴趣不同参加体育活动情况也不同(2)计算检验统计量:

解:(1)提出假设(3)作出决策因为所以数据在5%的水平下拒绝H0,表明收听体育广播兴趣不同的人,参加体育活动的情况也不同。(3)作出决策例2表中数据是由968个成人个案构成,根据他们的政党派别以及他们在1980年总体选举中的投票状况。类别党派认同坚定民主党派民主党派独立民主党派独立派独立共和党派共和党派坚定共和党派总和1980年总体候选人里根2166325485131103492卡特16812049191375381安德森71528121415495总和19620110985112153112968数据来源:密歇根大学政治学研究中心政治学校际研究联合会(ICPSR)。例2表中数据是由968个成人个案构成,根据他们的政党派别以解:首先根据公式计算期望次数如下:类别党派认同坚定民主党派民主党派独立民主党派独立派独立共和党派共和党派坚定共和党派总和1980年总体候选人里根2199.6266102.163255.405443.208556.9313177.7610356.93492卡特16877.1412079.114942.901933.461344.08760.22544.08381安德森719.241519.732810.7128.341410.991515.01410.9995总和19620110985112153112968解:首先根据公式计算期望次数如下:类别党派认同坚定民主党派民计算统计量:统计量的临界值结论:拒绝投票偏好与党派无关的零假设。计算统计量:4.2.3练习车间用4台机床加工同种零件。现随机抽取580件零件,测得零件尺寸数据如下:过大合格过小合计1234132012559132144115818243080170180150合计5045080580尺寸件数机床号试问机床加工的零件尺寸有无差异(a=0.05)?4.2.3练习车间用4台机床加工同种零件。现随机抽取5804.3Friedman检验前面的Kruskal-Wallis检验都是针对完全随机试验数据的分析方法.当各处理样本重复数据存在区组之间的差异时,必须考虑区组对结果的影响.对于随机区组的数据,可以采用两因素的方差分析方法,但方差分析要求实验误差是正态分布的,当数据不符合方差分析的正态前提时,方差分析方法不再适用。

Friedman于1937年提出了秩方差分析法。此法对试验误差没有正态分布的要求,仅仅依赖于每个区组内所观察的秩次,因此又称弗利德曼的检验或弗利德曼双向评秩方差分析(two-wayanalysisofvariancebyranks),后来又被Kendall和Smith发展到多元度量的协同系数相关问题上。4.3Friedman检验前面的Kruskal-Walli

Friedman检验是对k个样本是否来自同一总体的检验。k个样本是匹配的,可以由k个条件下同一组受试者构成,也可以将受试者分为n组,每组均有k个匹配的受试者,随机地将k个受试者置于k个条件下。在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似。每一个样本代表了一个处理。在实际中,除了处理之外,往往还有别的因素起作用。比如在关于肥料(处理)效能的农业试验中,不同条件的土壤就构成了另一个因素,称为区组。如果随机地把所有处理分配到所有所有的区组中,使得总的变化可以分解为(1)处理造成的不同;(2)区组内的变化;(3)区组之间的变化。当区组存在时,代表处理的样本的独立性就不再成立了。为进行与前面类似的检验,就需要应用不同的检验统计量。其构造方法和思路与完全区组试验正态总体条件下的检验统计量类似,只不过是用秩来代替观察值。Friedman检验是对k个样本是否来自同一总体的检验。k区组设计的情形在没有区组影响的单因子实验设计的分析中,各样本的观测值是相互独立的。每一个样本代表了一种因素,习惯上称为“处理(Treatment)”。然而,在实践中,往往还有其他因素。这种因素习惯上称为“区组(Block)”。如果完全随机地把所有处理都分配到所有区组中,这就是随机化完全区组设计(RandomizedCompleteBlockDesign)。区组设计的情形在没有区组影响的单因子实验设计的随机化完全区组设计

区组处理12…n1x11x12…x1n2x21x22…x2nkXk1Xk2…Xkn随机化完全区组设计12…n1x11x12…x1n2x21x2不完全区组设计区组处理12341342836236304534048604445459在实践中,并不一定能把每一个处理分配到每一个区组中,这样就产生了不完全区组设计。其中最易处理的是平衡的不完全区组设计(BalancedIncompleteBlockDesign,BIBD)。BIBD通常有五个参数:处理k,区组n,每一区组的处理数r,每一处理的区组数t,每两个处理在一个区组中的相遇次数x。BIBD(4,4,3,3,2)实例如右图。不完全区组设计区组123413428362363045340

4.3.1基本思路与检验步骤Friedman检验就是用来检验各个样本所得的结果在整体上是否存在显著差异。为对假设作出判定,所分析的数据应是定序尺度测量。获得的数据排出一个n行k列的表,行代表不同的受试者或匹配的受试小组,列代表各种条件,即有n个区组和k个处理。4.3.1基本思路与检验步骤Friedman检验就是用来完全随机区组数据分析表()1处23理……k和12区.

..组.b............…………....……....和……N完全随机区组数据分析表()处理1随机化完全区组设计的秩次()

区组处理12…n秩和Ri.1R11R12…R1n2R21R22…R2nkRk1Rk2…Rkn秩和R.jk(k+1)/2k(k+1)/2k(k+1)/2k(k+1)/2nk(k+1)/2随机化完全区组设计的秩次()12…n秩和Ri.1R1由于是定序尺度测量的数据,因此可以对每一行的观测结果分别评秩。如果Ho为真,则每一列中秩的分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等。第4章-多样本的非参数检验只是分享课件接下来的做法与Kruskal-Wallis检验相同,计算组间平方和(SSB)。接下来的做法与Kruskal-Wallis检验相同,计算组间

Friedman检验定义的统计量为:之所以将SSB乘以系数1/MST,是为了使得到统计量渐进服从。数据打结时,要对上述检验统计量做修正。Friedman检验定义的统计量为:有结情形秩取平均值,此时需要对Q统计量进行修正:修正后统计量的数学期望等于k-1,仍然服从分布。有结情形秩取平均值,此时需要对Q统计量进行修正:检验步骤:(1)提出假设

Ho:k个样本间无显著差异

H1:k个样本间有显著差异(2)计算检验统计量(3)作出决策当时,在a水平上拒绝Ho;当时,不能拒绝Ho。检验步骤:4.3.2应用某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素质。为检验这四个部分的技术训练是否确实有效,随机抽选了14名新学员,分别接受四个部分的训练。每个训练结束后,均进行该部分的测试,成绩以10分为最高。检测结果如下表所示:4.3.2应用某田径队对新入队的学员要进行四个部分的技术ABCD123456789101112131410246357610853463510344101059455569310106637724108848467556667910技术训练等级学员编号试问在5%的显著性水平下四个部分技术训练的有效性有无显著差异?ABCD110368技术训练等级学员编号试问在5%的显著性水解:(1)建立假设

Ho:四个部分技术训练的有效性无显著差异H1:四个部分技术训练的有效性有显著差异解:(1)建立假设(2)计算检验统计量学员编号技术训练A技术训练B技术训练C技术训练D123456789101112131441231233433112134121441423412414432132124332323412214434合计33333638(2)计算检验统计量学员编号技术训练A技术训练B技术训练C技(3)作出决策,所以不能拒绝Ho,表明四个技术训练的有效性没有显著差异。第4章-多样本的非参数检验只是分享课件4.3.3练习根据下列资料,检验三种培训方案的有效性有无显著差异(a=0.05)?4.3.3练习学生组方案A方案B方案C123456789101112131415161718112321122211111111323213231133232.5222231132313322322.5333学生组方案A方案B方案C11324.4CochranQ检验有时,观察值是以“是”或“否”,“同意”或“不同意”等二元数据形式出现的。如果用Friedman检验将会出现很多打结现象,Cochran检验解决了数据打结现象.此方法是Cochran于1950年提出的。

CochranQ检验译为科库兰检验,它是用以检验相关的k个样本的频数或比例之间有无显著性差异的方法。4.4CochranQ检验有时,观察值是以“是”或“否4.4.1基本思路与检验步骤有k个相关样本,每个样本有n个观测结果,建议k个样本间是否有显著差异。为对假设作出判定,所分析的数据测量层次为定类尺度即可。获得的数据可排成一个n行k列的表。如果H0为真,将测量结果分为“成功”和“失败”,“成功”与“失败”应随机地分布在表中的各行各列。Cochran认为,在零假设下,每个处理有同等的概率得到“成功”。在其定义的Cochran检验统计量中正是反映了这种思想。4.4.1基本思路与检验步骤有k个相关样本,每个样本有n个4.4.1基本思路与检验步骤1处23理……k和12区.

..组.n............…………....……....和……N4.4.1基本思路与检验步骤处理1…CochranQ检验定义的统计量为:式中,是第j列(处理)的总数,是第i行(区组)的总数。近似是指固定k,n趋于无穷大的情形。该检验量实际上是说明按样本数(k)计算的总次数与按观察对象或样品数(n)计算的总次数的符合程度。CochranQ检验定义的统计量为:检验步骤:(1)建立假设

H0:k个样本间无显著差异

H1:k个样本间有显著差异由于三个及三个以上样本间差异的方向不便判定,因而通常只建立双侧备择进行检验。(2)计算检验统计量Q(3)作出决策当时,拒绝H0

;当时,不能拒绝H0

。检验步骤:4.4.2应用例某商场为决定经营饮料的品种、数量,对消费者的爱好进行了一次调查。随机抽取18个消费者,请他们对四种饮料(热牛奶、酸奶、果汁、可口可乐)的喜好作出评价。1代表喜好,0代表不喜好。调查结果如下表所示。试问:在5%的显著性水平下消费者对饮料的爱好是否存在差异?4.4.2应用例某商场为决定经营饮料的品种、数量,对消消费者热牛奶酸奶果汁可口可乐123456789101112131415161718100110000100111010000101011100011100011010001111000000101000100000100011消费者热牛奶酸奶果汁可口可乐11001解:(1)建立假设H0:消费者对四种饮料爱好无差异H1:消费者对四种饮料爱好有差异(2)计算检验统计量Q:表示按样本数计算的消费者喜欢的总次数;

:表示按观察对象(消费者)计算的对各种饮料喜欢的总次数。解:(1)建立假设(3)作出决策,不能拒绝Ho,可以在5%的显著性水平下认为消费者对四种饮料的爱好没有显著差异。(3)作出决策4.4.3练习教务管理部门想知道电视教学、课堂讲授、课堂讨论这三种教学方法的效果是否有显著差异。为此,抽选部分学生分为18组,每组3名匹配的学生,他们的有关情况类似。各组中3名学生被随机地指定接受某种教学方法。实施不同教学方法后进行测验,成绩合格为有效,记为1;成绩不合格为无效,记为0,结果如下表所示。试问:三种教学方法的效果是否有显著差异(a=0.05)?4.4.3练习教务管理部门想知道电视教学、课堂讲授、课堂学生组电视教学课堂讲授课堂讨论123456789101112131415161718000010001000000100011001110011111101010011101011111111学生组电视教学课堂讲授课堂讨论1000此课件下载可自行编辑修改,仅供参考!

感谢您的支持,我们努力做得更好!谢谢此课件下载可自行编辑修改,仅供参考!

感谢您的支持,我们努力第4章-多样本的非参数检验第4章-多样本的非参数检验如果k(>2)个样本是按某种或者某些条件匹配的,那么k个样本称为相关的,否则为独立的。K个相关和独立样本的差别与两个相关和独立样本之间的差别类似。多样本的问题是统计中最常见的一类问题。主要涉及如何检验n种不同方法、决策或试验条件(称为处理)所产生的结果是否一样等问题,可以使用Kruskal-Wallis秩和检验、卡方检验、正态记分检验、Jonkheere-Terpstra检验、CochranQ检验、Friedman检验等非参数检验方法。本章仅介绍其中的最常用、重要的检验方法。如果k(>2)个样本是按某种或者某些条件匹配的,那么k个样本复习:方差分析的基本思想组间方差组内方差如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个方差的比值会接近1如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。F=复习:方差分析的基本思想组间方差组内方差如果因素A的不同水平组间方差和组内方差组间离差平方和组内离差平方和组间方差组内方差受因素A和随机

因素的影响只受随机

因素的影响组间方差和组内方差组间离差平方和组内离差平方和组间方差组内方多样本的非参数检验方法Kruskal-Wallis检验(K个独立样本)多样本的检验(K个独立样本)Friedman检验(K个相关样本)CochranQ检验(K个相关样本)多样本的非参数检验方法Kruskal-Wallis检验(K个4.1Kruskal-Wallis检验Kruskal-Wallis检验译为克拉夏尔-瓦里斯检验,简称克氏检验。它是1952年由Kruskal和Wallis两人提出的,是两个独立样本Mann-Whitney-Wilcoxon检验的一种推广。4.1Kruskal-Wallis检验Kruskal-Wa4.1.1基本思路与检验步骤今要研究k个总体的分布是否相同,需要的数据是k个独立的随机样本,其大小为样本独立地分别从各自的总体中抽取,总体分别具有连续的累积概率分布。数据的测量层次至少在定序尺度上。

K-W检验前提是假定总体连续,除位置参数不同外,分布相似。4.1.1基本思路与检验步骤今要研究k个总体的分布是否相同完全随机化设计数据形态总体1总体2…总体k重复R11R21…Rn11R12R22…Rn22…...…R1kR2k…Rnkk完全随机化设计数据的秩总体1总体2…总体k重复x11x21…xn11x12x22…xn22…...…x1kx2k…xnkk完全随机化设计数据形态总体1总体2…总体kR11R12…R1为检验零假设,我们需要构造一个检验统计量。方法是将所有数据按从小到大的顺序合并成一个单一的样本,其大小。将每一个观察值给出一个等级即评秩,秩为整数,从1到N。对于N个观察值来说,平均等级是为检验零假设,我们需要构造一个检验统计量。方法对于含有个观察值的第j个样本来说,等级总和的期望值是,若以Rj表示第j个样本的实际等级总和,则就表示k个样本中第j个样本等级总和与其均值的偏差。如果H0为真,所有样本数据混合排列成一个单一的随机样本,等级即秩次应该在k个样本之间均匀地分布,各组中Rj的平均值差别不大,即各样本实际的等级总和即秩次和Rj与期望等级总和之间的偏差应很小。对于含有个观察值的第j个样本来说,等级总和的期望值是Kruskal-Wallis检验定义的统计量就是建立在实际等级总和Rj与期望等级总和的偏差的基础之上的。它定义为H,计算公式为:Kruskal-Wallis检验定义的统计量就是建立在实际等严格地讲,其中严格地讲,严格地讲,其中严格地讲,H的一般计算公式H的简易计算公式H的一般计算公式H的简易计算公式在小样本的情况下,已知(n1,n2,n3)和显著性水平,Kruskal-Wallis检验统计量H的临界值可通过查表得到。在大样本情况下,H服从。参照方差分析的F统计量服从F(k-1,N-k).

在小样本的情况下,已知(n1,n2,n3)和显著性水平,检验步骤:(1)建立假设

如果偏重于考察位置参数,则所建立的假设是:注意:备择假设对于k>2时不存在单侧备择的配对,因为对于来说,有k!=k*(k-1)*…*3*2*1种不同的有序排列,不便于进行检验。检验步骤:检验步骤:(1)建立假设

如果偏重于考察位置参数,则所建立的假设是:注意:备择假设对于k>2时不存在单侧备择的配对,因为对于来说,有k!=k*(k-1)*…*3*2*1种不同的有序排列,不便于进行检验。检验步骤:(2)计算检验统计量H(3)作出决策。当数据支持H0,不能拒绝H0;当数据不支持H0,拒绝H0。Refernces:Kruskal,W.H.andWallis,W.A.(1952).Useofranksinone-criterionvarianceanalysis.J.Amer.Statist.Assoc.,47,583-621.(2)计算检验统计量H4.1.2应用例为检验4种训练方式的有效性是否存在显著差异,将报名的30名运动员随机地分为4组(运动员的条件基本相同),分别接受不同的培训。训练一段时间后,按规定的要求进行测试,测试成绩如下表所示:4.1.2应用例训练方式A训练方式B训练方式C训练方式D607562767398867252688274648761857866705969796358657184778089试问4种训练方式的有效性是否存在显著差异(a=0.05)?训练方式A训练方式B训练方式C训练方式D60726163试问解:(1)建立假设(2)计算检验统计量

(3)作出决策,数据在5%的显著性水平上不能拒绝H0,表明4种训练方式的有效性没有什么显著差异。解:(1)建立假设存在打结数据,用H可以修正为:这里,为结统计量,g为结的个数。数据结的处理存在打结数据,用H可以修正为:数据结的处理4.1.3练习

在一项健康试验中,有3种生活方式,它们的减肥效果如下表:生活方式123一个月后减少的重量(单位:500g)3.73.73.03.92.77.35.25.35.76.59.04.97.18.7试问在5%的显著性水平下,能否从这些调查数据中得出三种生活方式的减肥效果相同?4.1.3练习在一项健康试验中,有3种生活方式,它们的减4.2检验两个独立样本的检验可以直接推广到k个独立样本,用来检验k个样本之间差异的显著性。4.2检验两个独立样本的检验可以直接推广4.2.1基本思路与检验步骤k个独立样本检验与两个独立样本的基本方法类似。这里不再详述。

检验步骤:(1)提出假设4.2.1基本思路与检验步骤k个独立样本检(2)计算检验统计量

(3)作出决策当时,数据在a水平上拒绝H0;当时,数据在a水平上不能拒绝H0。(2)计算检验统计量多样本卡方检验的两点注意Q统计量只是理论上的卡方值的一个估计,在有些情况下这种估计差异较大。1.总的观察次数很小的情况,例如在n=k=2时,小于20。2.大多数期望的观测次数小于5。多样本卡方检验的两点注意Q统计量只是理论上的卡方值的一个估计4.2.2应用例某课题组欲了解“收听体育广播兴趣不同的人,参加体育活动的情况是否也不相同”。他们在全国抽选了12个省的2162人,按收听体育广播的兴趣程度分为:很不喜欢、不喜欢、无所谓、喜欢、非常喜欢五类,各类人员参加体育活动情况如下表所示:4.2.2应用例各类人员参加体育活动情况的人数很不喜欢不喜欢无所谓喜欢非常喜欢合计不参加偶尔参加经常参加天天参加153439615151464421840511939020411310857932581102489269302合计2514010867151962162试问:能否认为在0.05的显著性水平下,收听体育广播兴趣不同不影响参加体育活动?各类人员参加体育活动情况的人数很不喜欢不喜欢无所谓喜欢非解:(1)提出假设H0:收听体育广播兴趣不同不影响参加体育活动H1:收听体育广播兴趣不同参加体育活动情况也不同(2)计算检验统计量:

解:(1)提出假设(3)作出决策因为所以数据在5%的水平下拒绝H0,表明收听体育广播兴趣不同的人,参加体育活动的情况也不同。(3)作出决策例2表中数据是由968个成人个案构成,根据他们的政党派别以及他们在1980年总体选举中的投票状况。类别党派认同坚定民主党派民主党派独立民主党派独立派独立共和党派共和党派坚定共和党派总和1980年总体候选人里根2166325485131103492卡特16812049191375381安德森71528121415495总和19620110985112153112968数据来源:密歇根大学政治学研究中心政治学校际研究联合会(ICPSR)。例2表中数据是由968个成人个案构成,根据他们的政党派别以解:首先根据公式计算期望次数如下:类别党派认同坚定民主党派民主党派独立民主党派独立派独立共和党派共和党派坚定共和党派总和1980年总体候选人里根2199.6266102.163255.405443.208556.9313177.7610356.93492卡特16877.1412079.114942.901933.461344.08760.22544.08381安德森719.241519.732810.7128.341410.991515.01410.9995总和19620110985112153112968解:首先根据公式计算期望次数如下:类别党派认同坚定民主党派民计算统计量:统计量的临界值结论:拒绝投票偏好与党派无关的零假设。计算统计量:4.2.3练习车间用4台机床加工同种零件。现随机抽取580件零件,测得零件尺寸数据如下:过大合格过小合计1234132012559132144115818243080170180150合计5045080580尺寸件数机床号试问机床加工的零件尺寸有无差异(a=0.05)?4.2.3练习车间用4台机床加工同种零件。现随机抽取5804.3Friedman检验前面的Kruskal-Wallis检验都是针对完全随机试验数据的分析方法.当各处理样本重复数据存在区组之间的差异时,必须考虑区组对结果的影响.对于随机区组的数据,可以采用两因素的方差分析方法,但方差分析要求实验误差是正态分布的,当数据不符合方差分析的正态前提时,方差分析方法不再适用。

Friedman于1937年提出了秩方差分析法。此法对试验误差没有正态分布的要求,仅仅依赖于每个区组内所观察的秩次,因此又称弗利德曼的检验或弗利德曼双向评秩方差分析(two-wayanalysisofvariancebyranks),后来又被Kendall和Smith发展到多元度量的协同系数相关问题上。4.3Friedman检验前面的Kruskal-Walli

Friedman检验是对k个样本是否来自同一总体的检验。k个样本是匹配的,可以由k个条件下同一组受试者构成,也可以将受试者分为n组,每组均有k个匹配的受试者,随机地将k个受试者置于k个条件下。在不同受试者匹配的样本中,应尽量使不同受试者的有关因素匹配即相似。每一个样本代表了一个处理。在实际中,除了处理之外,往往还有别的因素起作用。比如在关于肥料(处理)效能的农业试验中,不同条件的土壤就构成了另一个因素,称为区组。如果随机地把所有处理分配到所有所有的区组中,使得总的变化可以分解为(1)处理造成的不同;(2)区组内的变化;(3)区组之间的变化。当区组存在时,代表处理的样本的独立性就不再成立了。为进行与前面类似的检验,就需要应用不同的检验统计量。其构造方法和思路与完全区组试验正态总体条件下的检验统计量类似,只不过是用秩来代替观察值。Friedman检验是对k个样本是否来自同一总体的检验。k区组设计的情形在没有区组影响的单因子实验设计的分析中,各样本的观测值是相互独立的。每一个样本代表了一种因素,习惯上称为“处理(Treatment)”。然而,在实践中,往往还有其他因素。这种因素习惯上称为“区组(Block)”。如果完全随机地把所有处理都分配到所有区组中,这就是随机化完全区组设计(RandomizedCompleteBlockDesign)。区组设计的情形在没有区组影响的单因子实验设计的随机化完全区组设计

区组处理12…n1x11x12…x1n2x21x22…x2nkXk1Xk2…Xkn随机化完全区组设计12…n1x11x12…x1n2x21x2不完全区组设计区组处理12341342836236304534048604445459在实践中,并不一定能把每一个处理分配到每一个区组中,这样就产生了不完全区组设计。其中最易处理的是平衡的不完全区组设计(BalancedIncompleteBlockDesign,BIBD)。BIBD通常有五个参数:处理k,区组n,每一区组的处理数r,每一处理的区组数t,每两个处理在一个区组中的相遇次数x。BIBD(4,4,3,3,2)实例如右图。不完全区组设计区组123413428362363045340

4.3.1基本思路与检验步骤Friedman检验就是用来检验各个样本所得的结果在整体上是否存在显著差异。为对假设作出判定,所分析的数据应是定序尺度测量。获得的数据排出一个n行k列的表,行代表不同的受试者或匹配的受试小组,列代表各种条件,即有n个区组和k个处理。4.3.1基本思路与检验步骤Friedman检验就是用来完全随机区组数据分析表()1处23理……k和12区.

..组.b............…………....……....和……N完全随机区组数据分析表()处理1随机化完全区组设计的秩次()

区组处理12…n秩和Ri.1R11R12…R1n2R21R22…R2nkRk1Rk2…Rkn秩和R.jk(k+1)/2k(k+1)/2k(k+1)/2k(k+1)/2nk(k+1)/2随机化完全区组设计的秩次()12…n秩和Ri.1R1由于是定序尺度测量的数据,因此可以对每一行的观测结果分别评秩。如果Ho为真,则每一列中秩的分布应该是随机的,即各个秩出现在所有列中的频数应几乎相等。第4章-多样本的非参数检验只是分享课件接下来的做法与Kruskal-Wallis检验相同,计算组间平方和(SSB)。接下来的做法与Kruskal-Wallis检验相同,计算组间

Friedman检验定义的统计量为:之所以将SSB乘以系数1/MST,是为了使得到统计量渐进服从。数据打结时,要对上述检验统计量做修正。Friedman检验定义的统计量为:有结情形秩取平均值,此时需要对Q统计量进行修正:修正后统计量的数学期望等于k-1,仍然服从分布。有结情形秩取平均值,此时需要对Q统计量进行修正:检验步骤:(1)提出假设

Ho:k个样本间无显著差异

H1:k个样本间有显著差异(2)计算检验统计量(3)作出决策当时,在a水平上拒绝Ho;当时,不能拒绝Ho。检验步骤:4.3.2应用某田径队对新入队的学员要进行四个部分的技术训练,以提高学员的身体素质。为检验这四个部分的技术训练是否确实有效,随机抽选了14名新学员,分别接受四个部分的训练。每个训练结束后,均进行该部分的测试,成绩以10分为最高。检测结果如下表所示:4.3.2应用某田径队对新入队的学员要进行四个部分的技术ABCD123456789101112131410246357610853463510344101059455569310106637724108848467556667910技术训练等级学员编号试问在5%的显著性水平下四个部分技术训练的有效性有无显著差异?ABCD110368技术训练等级学员编号试问在5%的显著性水解:(1)建立假设

Ho:四个部分技术训练的有效性无显著差异H1:四个部分技术训练的有效性有显著差异解:(1)建立假设(2)计算检验统计量学员编号技术训练A技术训练B技术训练C技术训练D123456789101112131441231233433112134121441423412414432132124332323412214434合计33333638(2)计算检验统计量学员编号技术训练A技术训练B技术训练C技(3)作出决策,所以不能拒绝Ho,表明四个技术训练的有效性没有显著差异。第4章-多样本的非参数检验只是分享课件4.3.3练习根据下列资料,检验三种培训方案的有效性有无显著差异(a=0.05)?4.3.3练习学生组方案A方案B方案C123456789101112131415161718112321122211111111323213231133232.5222231132313322322.53

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论