第十六章 非限制性假定统计分析_第1页
第十六章 非限制性假定统计分析_第2页
第十六章 非限制性假定统计分析_第3页
第十六章 非限制性假定统计分析_第4页
第十六章 非限制性假定统计分析_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十六章 非限制性假定统计分析【教学基本要求】通过教学,使学生明确各种非参数统计技术的分析运用。【教学重点与难点】本章要求重点掌握2-检验、符号检验、等级检验、多样本检验等方法的分析运用。2-检验、多样本检验是本章的难点。第一节 基本理论迄今为止,我们讨论的各种统计推断方法有2个共同的特点:(1)它们都与总体参数有关;(2)它们的正确性依赖于一组严格的假定。近年来,统计学中发展了一些不需对总体分布作限制性假定的有用技术。这些方法称为非参数检验或自由分布检验或称无分布检验。这类方法,由于不涉及总体参数或不依赖于对总体分布的限制性假定,因而被称为非参数统计方法。一、非参数统计的适用范围非参数统计最

2、常用于具备下述特征的情况:1.待分析数据不满足参数检验所要求的假定,因而无法应用参数检验。例如,我们曾遇到过的非正态总体小样本,在t-检验法也不适用时,作为替代方法,就可以采用非参数检验。 2.仅由一些等级构成的数据,不能应用参数检验。例如,消费者可能被问及对几种不同商标的饮料的喜欢程度,虽然,他们不能对每种商标都指定一个数字来表示他们对该商标的喜欢程度,却能将几种商标按喜欢的顺序分成等级。这种情形也宜采用非参数检验。 3.所提的问题中并不包含参数,也不能用参数检验。例如,我们想判断一个样本是否为随机样本,采用非参数检验法就是适当的。 4.当我们需要迅速得出结果时,也可以不用参数统计方法而用非

3、参数统计方法来达到目的。一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来既快且易。有些非参数统计方法的计算,就算对统计学知识不熟练的人,也能在收集数据时及时予以完成。 二、非参数统计的优缺点非参数统计与传统的参数统计相比,有以下优点:1.非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛; 2.多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间; 3.大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识; 4.大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用

4、; 5.当推论多达3个以上时,非参数统计方法尤具优越性。但非参数统计方法也有以下缺点:1.由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第类错误的概率要大些。 2.对于大样本,如不采用适当的近似,计算可能变得十分复杂。第二节 (卡方)-检验在非参数统计中,应用最广泛的方法之一是利用-分布进行独立性、一致性和吻合性的检验。一、(分布的数学性质)统计量我们在第八、第九等章的有关部分为了构造总体方差的置信区间,曾介绍过-分布

5、。数学上可将这一分布表示为: , (16.1)其中 , 称为自由度。所有彼此独立,且均服从平均值为,标准差为的正态分布。和的下标表示每个观察值可能取自不同的总体。当我们从同一总体抽取所有观察值时,和的下标就可以取消。这一分布的平均值和方差分别为和2。分布本身通常用希腊字母来表示。-分布是一种抽样分布。当我们对正态随机变量X随机地重复地抽取个数值,将每一个值变换成标准正态变量,并对这个新的变量分别取平方再求和之后,便得到一个服从-分布的变量,即有: (16.2)如果我们将的各种不同数值连同相应的相对出现的频数列出,就得到的抽样分布,这就是自由度为的-分布。图8.1给出了若干不同自由度的-分布。在

6、实践中,经常要对一些观察值出现的实际频数与理论频数进行比较,以了解实际发生的结果与理论之间是否一致。设观察频数为,理论频数为,则可定义统计量: (16.3)二、的独立性检验在研究问题时,经常会遇到要求2个变量之间是否有联系的问题。其检验方法是将研究的对象按2个变量分别进行分类,编制一张交错分类的表,通常叫做列联表。我们以一个具体的实例来研究。例16.1 在对某城市家庭社会经济特性的调查中,一个市场研究公司想确定电话拥有数与汽车拥有数是否独立。这个公司从一个由住有该城市的10000户家庭组成的简单随机样本中获得了这种占有状况的信息,列于表16.1。表16.1 按电话拥有量和汽车拥有量分组的列联表

7、汽车拥有量 (辆)合 计012电话拥有 量(台)01000900100200011500260050046002以上50025004003400合 计30006000100010000要求:依上列数据检验电话拥有量与汽车拥有量是否有联系。检验有2个步骤:(1)根据独立性的假设计算期望频数;(2)将观测频数与期望频数进行比较。本题中待检验的2个假设可表述为:电话拥有量与汽车拥有量是独立的电话拥有量与汽车拥有量之间不独立计算统计量:在计算之前,首先要算出每一格的理论值,利用(16.3)式,有: 余类推,计算结果列示于表16.2。表16.2 电话拥有量和汽车拥有量之间关系问题的期望频数汽车拥有量(辆

8、)合 计012电话拥有 量(台)06001200200200011380276046046002以上102020403403400合 计30006000100010000由此有: 若规定显著性水平,本例自由度,查附表C得。,因此,否定,即2个变量之间不是独立的。在利用检验时,应注意:(1)要求试验的频数比较多;(2)每一格中期望的理论频数不能太小。虽然,在统计学界没有统一结论,但美国统计学家科克兰提出的一条原则值得借鉴,即要求,且理论值小于5的格不能超过20%。在必要时,可将邻近的格加以合并(在不影响分类原则的条件下)。当2个变量的分类都分成2类时,就形成22列联表。如表16.3,便是一个22

9、列联表,其中a、b、c、d分别表示观察频数。表16.3 22列联表12合 计1aba+b2cdc+d合 计a+cb+dn这时的值可依简便公式(16.4)式计算: (16.4)这个公式所给出的数值结果与(16.3)式相同。例16.2 属于同一公司的2家工厂所生产的165件有缺陷的产品构成一个样本,按照工艺不佳或原材料质量低劣这2个准则对这些有缺陷的产品进行分类,有关数据列示于表16.4。要求:以0.05的显著性水平检验关于产生缺陷的原因与生产这些产品的工厂无关的零假设。表16.4 产品产生缺陷的原因与生产工厂的有关资料工 厂合 计AB产生缺陷的原因工艺不佳217293材料质量低劣462672合

10、计6798165解:该例的假设可陈述为: 产品产生缺陷与生产工厂之间没有联系 产品产生缺陷与生产工厂之间有联系计算统计量: 依(16.4)式,可以算出: 由,自由度,查附表C得。,因此,否定,即产品产生缺陷与生产工厂之间有联系。由于-分布是一个连续变量,而在22列联表中用的是离散型变量,因此,美国统计学家耶茨于1934年提出了一个具有适用价值的修正公式: (16.5)按例16.2,我们有: 。三、的一致性检验在用参数统计方法检验两个比例是否相等时,曾介绍到用正态分布的近似方法来检验。现在,我们也可将从每一个总体中抽取的样本分成两类,把结果写成22列联表,然后,用的一致性检验。从表面上看来,列联

11、表的形式及计算值的公式与独立性的检验是相同的,但是,其抽样方法和对期望频数的计算规则是不同的。(1)在独立性检验时,是从研究的总体中抽取一个容量为的样本,然后,根据样本的观察值进行双向分类;一致性检验则是从比较的总体中分别抽取独立的随机样本,然后,把抽到的单位划分成两类中的一个类别。(2)对理论频数的计算,在独立性检验时,假设按两个单独概率的乘积,而在一致性检验时,假定比较的几个总体中具有某种特征的单位数的比例相同,当假设成立时,各类的期望频数应该根据样本的总数的比例来计算。例16.3 某厂生产一种新型自行车,希望了解消费者喜欢这种型号的人数比例,分别从青年人和40岁以上的人中各抽100人进行

12、调查。调查结果显示,青年人中有80人表示喜欢,40岁以上的人中有70人表示喜欢。要求:以0.05的显著性水平检验这两组人喜欢这种新型车的比例是否一致。解: 该例的假设可陈述为: 青年人与40岁以上的人喜爱的比例是一致的 喜爱的比例是不一致的 将调查结果写成22列联表16.5。表16.5 22列联表 单位:人喜爱不喜爱2合 计青年人802010040岁以上7030100合 计15050200计算统计量:依(16.4)式,有: 由,自由度,查附表C得。,因此,不否定,即不能说两组消费者对新型车的爱好有显著差别。利用进行一致性检验还可以推广到几个总体的比例是否一致,分类也可推广到两类以上,若是个总体

13、,每个总体分成类,就形成列联表。例16.4 市场研究人员进行一项研究,其内容为检查某大城市地区4家主要百货商店的顾客的特征。他们从每家商店的主要顾客中各选取一个独立随机样本。4个样本中顾客的年龄分布及有关数据列示于表16.6。要求:以0.05的显著性水平检验这几个被抽总体就顾客的年龄而言是否一致。解: 该例假设可陈述如下: 4家商店的顾客年龄是一致的 4家商店的顾客年龄是不一致的表16.6 某大城市4家主要百货商店顾客的年龄特征调查表 单位:人商 店合 计ABCD年 龄分 组258040905026025-356060804024035-453050457520045以上30503585200

14、合 计200200250250900首先计算各格的理论值: 余类推,计算结果列示于表16.7。表16.7 某大城市4家主要百货商店顾客年龄的理论频数商 店合 计ABCD年 龄分 组2557.7857,7872.2272.2226025-3553.3353.3366.6766.6724035-4544.4444.4455.5655.5620045以上44.4444.4455.5655.56200合 计200200250250900计算统计量:依(16.3)式,有:由,自由度,查附表C得。,因此,否定,即4家商店的顾客年龄不一致。四、的吻合性检验在实际工作中,有时需要对变量是否遵从某一理论分布进行

15、检验, -分布用于这一方面的检验称为吻合性检验,或称拟合优度检验。这类检验要求所抽取的样本是随机样本,变量的计量水准至少是列名的。若被检验的总体其真实的分布函数为,但它是未知的,只能从这一分布中抽取一个随机样本,要求通过对这一样本的检验来认识这一总体的分布是否与规定的理论分布相一致。因此,其假设可陈述为: 检验统计量的计算方法与前面相同,其理论频数,其中为按理论分布计算的概率。例16.5 一个汽车制造商想检验顾客对5种新式样汽车的喜好程度。用简单随机抽样方式抽选了500位顾客,喜欢各种式样汽车的顾客数如表16.8。表16.8 喜欢5种新式汽车的顾客数据资料汽 车 式 样ABCDE合 计喜欢该式

16、样的顾客人数(人)2251852301871731008试用检验来确定是否应否定零假设“这个概率分布是均匀分布”解: 假设的陈述: 这个概率分布是均匀分布 这个概率分布不服从均匀分布计算统计量:因每类型是一样的,其理论频数为所以,有: 由,自由度,查附表C得。,因此,应否定,即这个概率分布不服从均匀分布。由,自由度,查附表C得。,因此,不能否定,即这个概率分布有可能服从均匀分布。例16.6 一家钟表厂把检验钟表的精确度作为质量控制计划的一部分。该厂将700只手表校准后让其走24小时,然后,对这些表进行检查,并记下每一只表走快或走慢的秒数列示于表16.9。试确定,这些表是否提供了充分证据,说明观

17、察值并非来自正态总体。设。表16.9 700只表时间误差的频数资料24小时内走快或走慢的秒数表 的 数 目(只)01038102051203062304074405083506091607081708072809061901005210011035合 计700解: 假设的陈述: 样本数据来自正态分布总体 样本数据并非来自正态分布总体由(16.3)式,确定的计算过程及结果列于表16.10。表16.10 例16.6中的理论频数计算表变量值频数各组限处正态曲线下的面积理论频数0-1038-0.052636.82102051-1.620.051235.84203062-1.260.082958.033

18、04074-0.890.111477.98405083-0.530.134494.08506091-0.170.142899.966070810.190.133593.457080720.550.112478.688090610.920.078554.9590100521.280.049834.86100110351.640.050535.35合 计700-1.000700.00于是,有: 由,自由度,查附表C得。,因此,应否定,即可得出样本数据并非来自正态分布总体的结论。例16.7 一家旅游区旅馆的管理人员研究在为期90天的时间内预定和注销房间的格局,他将所观察到的注销结果列于表16.11。

19、这些数据是否同“每日注销的房间数服从泊松分布”这一假设相容。设。解: 泊松参数并未给出,利用表16.11的数据估计: 表16.11 旅游区旅馆注销房间的数据注销房间数观察到这一注销数的天数091172253154115762728290合 计90利用的估计值2.6,再假定一个泊松分布,计算检验所需的有关数据列示于表16.12。我们可以得出在0.05显著性水平下不能否定“数据来自泊松分布”的零假设。表16.12 例16.6中的理论频数计算表注销房间数天数泊松分布预期频数090.0746.661170.19317.372250.25122.593150.21819.624110.14112.695

20、70.0746.66620.0322.88720.0121.08820.0040.36900.0010.09合 计901.000- 例16.8 一个市场分析员进行关于食品店的顾客对待某种存款方式的态度的研究。这项研究包括对100家超级市场各抽选25名经常性顾客作随机样本,并对其中每一个人进行访问以确定此人是否喜欢除这种存款方式以外的别的存款方式。调查结果列示于表16.13。设显著性水平为0.05。表16.13 例16.8的抽样结果喜欢另外一种存款方式的顾客数商店数(个)04152831041451561271681096100合 计100解: 假设的陈述:设分析员假定表16.14 例16.8中

21、的观察频数、相对预期频数和预期频数喜欢另外某种存款方式的顾客数商店数二项分布预期频数040.00380.38150.02362.36280.07087.083100.135813.584140.186718.675150.196019.606120.163316.337160.110911.098100.06236.23960.02952.951000.01731.73合 计1001.0000100.00 在这些容量为25的样本中,喜欢另外某种存款方式的顾客数服从二项分布在这些容量为25的样本中,喜欢另外某种存款方式的顾客数不服从二项分布由于二项分布的参数没有指定,以样本数据估计: 利用的估计

22、值0.20,再假定一个二项分布, 计算检验所需的有关数据列示于表16.14。我们可以在0.05显著性水平下否定“数据来自二项分布总体”的零假设。第三节 正负符号检验我们知道,参数假设检验大都建立在一定假定基础上,当这些假定得不到满足时,就要用不需要严格假定的方法。正负符号检验是一种比较简单的方法。正负符号检验既可用于单一样本、也可用于两个样本的比较检验;既可用于独立样本的检验,也可用于两个有联系的样本的检验。现在分别加以讨论。一、单一样本中位数的符号检验反映一个总体分布位置的参数主要有平均数和中位数。平均数反映的是分布重心的位置,而中位数该数上下出现的概率均为处。当分布对称时,二者一致,分布不

23、对称时,二者就有差别。在很多场合,需要对中位数的位置进行检验,可采用正负符号检验。例16.9 某钢厂生产的钢材,在正常情况下,中位数的长度为10米。现随机地从生产线上抽取10根,测得长度(单位:米)如下:9.8 10.1 9.7 9.9 10 10 9.8 9.7 9.8 9.9试问:生产过程中对长度的控制是否需要适当调整。表16.15 中位数符号检验计算表长度符号9.8-0.2-10.10.1+9.7-0.3-9.9-0.1-1001009.8-0.2-9.7-0.3-9.8-0.2-9.9-0.1-解: 该例要解决的问题是:在生产过程中钢材的程度在中位数10米上下各占一半的情形下,就不需要

24、调整生产过程。否则,多数过长或多数过短均需要调整。因而,假设可陈述为: 进行正负符号检验时,可以将样本中每根的长度减去中位数,大者为正号(+),小者为负号(-),计算结果如表16.15。从表16.15可以看出:10个样本单位中,除有两个与中位数相同外,余下的8个为1正7负。如果进一步用精确的测量仪器进行测量,则与中位数相同的2个单位也可以区分为正号或负号。现假定为1个正号1个负号。这样,10个样本单位中就有2正8负。如果总体的中位数为10,那么,理论上出现正号和负号应该各占一半。现在,我们的问题是:出现2个或2个以下正号的概率是多少?我们用二项分布来计算: 由于是一个双尾检验,因此,也应包括负

25、号在2个或2个以下的概率,因此,。这就是说,当中位数为10时,出现上述结果的概率为0.1094,当时,不能否定。决策人员可以据此,结合其他因素作出是否需要调整生产过程的决策。在大样本情况下,用二项分布计算概率比较复杂,也可以用正态近似计算: , (16.6)其中:代表正号的数目,表示在条件下正号或负号的平均数目(理论数目),0.5称作校正项,分母为,样本容量为时的标准差。当时否定。假如上例样本容量为36的大样本,各样本单元观察值与中位数之离差为正号有10个,此时,我们可以计算得到: 取绝对值为,否定。 数值,同样否定。二、两独立样本的符号检验假设和为抽自两个总体的独立样本,X和Y的计量水准至少

26、是顺序的,研究的变量为连续变量,要求检验这两个总体的中位数是否相同。假设可陈述为: 两个总体中位数相同 两个总体中位数不同检验的方法是将两个样本按照统一顺序排列,找出中位数。从直观看,如果为真,则在样本和中,超过中位数或低于中位数的数目应该接近相等,亦即正、负符号各占一半左右。因此,可以把两个样本分别按照超过中位数的数目和低于中位数的数目整理成列联表的形式,应用检验或正态近似检验。例16.10 设有两独立样本的观察值如下:样本1: 10 10 10 12 15 17 17 19 20 22 25 26样本2: 6 7 8 8 12 16 19 19 22试检验这两个总体的中位数是否相同。解:

27、先将两组样本的观察值按统一顺序排列,找出其中位数为16,然后,将每个观察值和它比较,大于中位数用正号表示,小于中位数用负号表示,于是得到:样本1: - - - - - + + + + + + +样本2: - - - - - + + + +上述资料可以写成表16.16的22列联表形式。表16.16 例16.10中的22列联表形式+-合 计样本17512样本2459合 计111021 依(16.4)式,可以算出: 若,自由度,查附表C得。,因此,不能否定,即不能说两个总体中位数有显著差别。三、两个有联系样本的符号检验关于两个有联系的样本的数据有各种各样的情形,最常见的是对样本中同一个单位经过某种处

28、理前后的比较。例如,同一样本的工人在实行奖金制度前后产量的比较;同一样本的下蛋鸡在使用某种饲料前后下蛋数量的比较等等。另一种情形是对成对的单位,其中一个给以某种处理,另外一个给以另一种处理或不加处理。在进行这种比较时,配对的单位应尽可能一致。例如,在研究某种药物的效果时,配对试验的人必须在年龄、性别、体质等方面尽可能一致,不至于有其他因素影响试验的结果。在两个有关样本分析中,所研究的变量是这些成对样本两个观察值之差。如果差别比较大,说明这种处理具有效应,反之,则没有效应。 两个有关样本的符号检验是要求有对成对样本观察值 , 这对观察值是独立的* 此处独立之意义是指:(1)各之间相互独立,各之间

29、相互独立;(2)各之间不独立。,观察值的计量水准在每对之间至少是顺序的,即可以比较其大小。研究的变量一般是连续的。其假设可陈述为: 两个变量之差这一总体中位数为0 两个变量之差这一总体中位数不为0这是双尾检验,也可为单尾检验。在双尾检验中,如果为真,则的正负号数目应该比较接近,当正负号的数目差达到一定界限时,就否定。因此,上述假设也可陈述为: 两个有关样本的符号检验也是二项式检验的特殊情况。例16.11某城市为克服噪音污染,在全市展开了宣传活动。现从全市抽取18个路口测试了宣传前后的噪音(单位:分贝)记录如下:宣传前557468807769577263宣传后416461707560535961

30、宣传前528566714883785167宣传后487965704781695062试以0.01的显著性水平说明经过宣传之后,城市的噪音已下降了5分贝。解: 计算观察值之差为: 14,10,7,10,2,9,4,13,2,4,6,1,1,1,2,9,1,5。分别减去5可得到,。根据二项式检验,要使的否定区概率小于0.01,则要求在13个以上,现在只有8个正号,因此,不能否定,即不能得出噪音已下降了5分贝的结论。第四节 两样本的等级检验第三节正负符号检验只是利用样本观察值之间的大小,用符号来表示,没有充分利用数据所提供的信息,从而损失了部分统计功效。建立在等级基础上的非参数统计方法弥补了这方面的

31、不足。一、威尔科克森配对符号秩检验正负符号检验和威尔科克森配对符号秩检验,都可看作是就成对观察值而进行的参数方式的t-检验的代用品,非参数检验具有无需对总体分布作假定的优点,而就成对观察值作的参数方式的t-检验,必须假定有关的差别总体服从正态分布。例16.12 随机地抽取10名学生的记分册中某门课程期中和期末考试分数如表16.17第(2)和第(3)栏数据。试在0.05显著性水平下作威尔科克森符号秩检验。表16.17 威尔科克森配对等级计算表* 表16.17的说明: 在威氏检验中,要用绝对值,把它们放在一起,按从1至n的顺序排列秩次,差别最小者,其秩次为1。 以原值的符号(+或-)给这些秩加上相

32、应符号。 若排秩时出现秩次相同,采用平均秩次。 若值为0,就去掉该项。学 生期中考试成绩期末考试成绩成绩之差标 出 符 号 的 秩的秩秩(+)秩(-)17572-33328794+76.56.537292+209946567+22259386-76.56.568585075958-11187379+65596469+544107182+1188合 计-34.510.5解: 计算步骤如下:第1步:列出和的观察值; 第2步:计算; 第3步:把等级恢复原正负符号。计算过程见表16.17。由表16.17,秩和分别按正差和负差计算,用秩(+)和秩(-)表示,以此为基础,形成零假设秩(+)=秩(-),即总

33、体分布相同。更具体地说,该假设表明该总体中的正差和负差是在均值0的两端对称分布的。两个秩和中较小者,我们称为威尔科克森T-统计量。该检验统计量:T=秩(-)=10.5。查威尔科克森T值的临界值表(附表I),当n=10-1=9, 时,双尾检验的临界值。由于,因此不能否定,即两次成绩没有显著差别。在大样本情形下,T是近似正态分布的,其均值和方差分别为: (16.7) (16.8)因此,我们可以计算: (16.9)二、曼-惠特尼U检验(秩和检验)这种方法通常用于两独立样本的比较。秩和检验可以看作是对两均值之差的参数检验方式的t-检验或相应的大样本正态检验的代用品。由于秩和检验明确地考虑了每一个样本中

34、各测定值所排的秩,它比符号检验法使用了更多的信息。例16.13 某工厂欲测定在装配线上男工和女工的机械技能有无差别。随机地抽取了15组,每一个人都给以机械技能测试并给以评分,结果如表16.18。表16.18 男女工人机械技能测试分数男女男女507071875176738853777492568078935781899663829098648395996586-试以0.05显著性水平检验男工和女工的机械技能是否相同。解: 假设的陈述: 男女性别之间的机械技能没有差别 男女性别之间的机械技能存在差别在秩和检验中,首先是合并两个样本,按秩的顺序排列每个人的得分,如表16.19。然后,按任一样本观察值

35、的秩和进行这一检验。表16.19 男女工人的机械技能测试分类陈列秩得 分性 别秩得 分性 别秩得 分性 别150男1173男2187女251男1274男2288女353男1376女2389男456男1477女2490男557男1578男2592女663男1680女2693女764男1781女2795男865男1882女2896女970女1983女2998女1071男2086女3099女我们引入下列符号: 一号样本观察值的项数 二号样本观察值的项数 一号样本中各项秩和 二号样本中各项秩和以男性工人的数据作为第1号样本,找到是1,2,3,4,5,6,7,8,10,11,12,15,23,24与27

36、各秩和,即158。相应地, 307。为进行这一检验,需要计算一个新的统计量U。其计算如(16.10)式: (16.10)根据,这是一个双尾检验。因此, 当时,双尾检验,可查附表 得。因,不能否定,即在装配线上的男工和女工在机械技能方面没有显著差别。在大样本情形下,U的抽样分布也接近正态分布,其均值和方差分别为: (16.11) (16.12)因此,我们可以计算: (16.13)第五节 多个样本的检验 一、克鲁斯卡-沃利斯检验我们曾在第十章介绍过方差分析,是通过个样本来检验这些总体的平均数是否相等。但是,方差分析要求总体是正态分布的,而且要假定各个总体方差相等。若这些条件不满足,其结论就会受到影

37、响。而克鲁斯卡-沃利斯单因素方差分析这种非参数检验法,不依赖于上述严格的假定,它建立在等级基础上,如果只考虑两个样本,则可发现是上一节曼-惠特尼U秩和检验法的推广。克鲁斯卡-沃利斯检验所用的统计量,是把个独立的简单随机样本的观察值放在一起,排列秩次后算出的。其假设可陈述为: 个总体是同分布的 个总体的分布并不完全相同例16.14 把某行业的公司分为大、中、小3类,并从这些公司的财务经理中个抽取一个简单随机样本。请他们对上半年国家的利率调动政策的效果进行评价,最后加成总分进行比较,评分结果如表16.20。试在0.05显著性水平下检验3种评分是否一致。解: 陈述假设如下: 3种总评分一致表16.2

38、0 例16.14中按公司大小分组的评分和秩大 型 公 司中 型 公 司小 型 公 司评 分秩评 分秩评 分秩78126868214952077116558516841550187176139319751062470790187286028013-739 3种总评分不完全一致克鲁斯卡-沃利斯检验统计量为: (16.14)其中: 第j个样本中的观察值个数; 个样本观察值的总个数; 第j个样本的秩和。的分布近似于自由度的-分布。因此,可以利用-分布进行检验。依表16.20的有关数据及(16.14)式,计算得到: 若显著性水平,则。因此,否定,即3种总评分不完全一致。我们可以得出结论:根据公司规模分组

39、,由财务经理组成的3个样本中评定的分数有显著差别。由表16.20可以发现,与中小公司经理相比,大公司的经理评定的分数较高。二、弗利德曼检验这种方法适用于个有关样本。但是,确定秩的方法与克鲁斯卡-沃利斯检验方法不同。弗利德曼检验是抽取个样本单位,每个单位给予种不同的处理形成个观察值。对每一个样本单位中的不同处理的观察值给以等级,即每个样本单位由小到大有个等级(秩)。如果所有的处理具有同样的效果,那么,每一列中的秩应该是随机分布的,若不是随机的,就是说明各种处理有差别。弗利德曼检验的统计量是建立在各列秩和的基础上,按(16.15)式计算。 (16.15)其中: 第j个样本的秩和; 的自由度,采用检

40、验。例16.15 假设有一个新的训练计划分成4个单元,每个单元采用一不同方法,参加这一训练的有14个随机抽选的工人,在每个单元结束时,对这14人进行考试并给予成绩。有关数据列示于表16.21。试在0.05显著性水平下检验这4种方法总的效果之间有无显著差别。解: 假设可陈述如下: 这4种方法总的效果之间并没有差别 这4种方法总的效果之间存在差别这里是4个有关的样本,因为,这是同样14个人的考试成果,成绩可以按顺序加以排列,因此,适合用弗利德曼检验。在用这种方法时先要对每一个工人的成绩的4种考试成绩进行顺序排列,以确定各样本单位的秩,结果如表16.21。然后,计算检验统计量:表16.21 14名工

41、人的考试分数和秩样本方 法1方 法2方 法3方 法4分 数秩分 数秩分 数秩分 数秩120(4)6(1)9(2)15(3)25(1)12(3)19(4)10(2)311(2)21(4)8(1)16(3)421(3)18(2)30(4)15(1)58(1)12(2)20(4)16(3)69(2)7(1)10(3)12(4)721(4)20(3)16(2)10(1)818(3)27(4)9(1)12(2)930(4)16(1)22(3)21(2)1022(3)27(4)19(2)18(1)1110(3)8(2)4(1)12(4)126(1)12(3)7(2)14(4)1310(1)12(2)21(

42、4)20(3)1414(2)11(1)23(3)27(4) 在显著性水平时,有。因此,不能否定,即4种方法总的效果没有显著差别。第六节 其它非参数统计方法 一、关于联系的非参数统计量关于研究两组变量之间相互关系的密切程度这一问题,我们曾在第十一章中介绍过相关系数。但是,相关系数反映的是两组变量之间线性相关的程度,若两组变量之间存在非线性的联系,相关系数就受到限制;另外,相关系数要求变量必须是用数字来计量的,而实际资料有时又缺乏数字计量,因而需要用非参数方法。1.斯皮尔曼秩相关系数斯皮尔曼秩相关系数反映的是两组变量之间联系的密切程度,它和相关系数一样,取值在-1到+1之间,所不同的是建立在等级(秩)的基础上计算的。我们用表示秩相关系数,采用(16.16)式计算。 (16.16)例16.16 某工厂对工人的业务进行了一次考试,欲研究考试成绩与每月产量之间的关系。若随机地抽取一个简单随机样本,有关数据列示于表16.22。表16.22 6个工人的考试成绩、产量及相应的秩工 人考试成绩产 量秩成 绩产 量1505006602605105503705304404805803305905902206951000110从表中数字可以看出,工人的考试成绩越高,则产量也越高,二者之间的联系程度是一致的。但是,相关系数并不算太高,这是由于它们之

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论