第16章 非参数检验1.ppt_第1页
第16章 非参数检验1.ppt_第2页
第16章 非参数检验1.ppt_第3页
第16章 非参数检验1.ppt_第4页
第16章 非参数检验1.ppt_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第16章 非参数检验,前面学过的参数估计和假设检验都是以总体分布已知或对分布作一定假设为前提的,我们称这类统计推断为参数统计。 但在许多实际问题中,我们不知道总体分布的情况,即使对总体的分布进行了假设,但很可能这类假设与真实情况不符。因此参数统计在一些情况下不再适用。,非参数统计: 对总体分布的形式不必做任何限制性假定,不以估计总体参数为目的的推断统计。 这种统计主要用于对某种判断或假设进行检验,故亦称非参数检验。 应当指出,这里所谓的“非参数”,只是指在检验的过程中,未对检验统计量服从的分布及参数做出限制,并不意味着在检验中“不涉及参数”或“不对参数进行检验”。,非参数方法适用的数据测量尺度

2、,数据的集中测量尺度: 1. 名义尺度(定类):表示个体属性或类别,可以用数值表示,也可用非数值表示 2. 序数尺度(定序):对观测值排序或排秩,有顺序之分。 3. 区间尺度(定距):数据具有顺序特性,且用于衡量数据间的差异,必须是数值型。 4. 比例尺度(定比):数据具有区间特性,且数据的比例关系有意义,必须是数值型。,非参数检验可用的场合: 1.名义尺度、序数尺度(以上两类数据的方差、均值和标准差计算都没有意义) 2.在无法对总体概率分布做出假定时,用于区间尺度和比例尺度。,非参数检验的优点: 1. 检验条件比较宽松,适应性强。 2. 检验的方法比较灵活,用途更广泛。 3. 检验计算相对简

3、单,易于理解。 非参数检验的缺点: 1. 检验功效较低。 2. 信息损耗较多。 结论:参数检验与非参数检验是针对不同情况提出的两种统计方法,它们各有优缺点,可互为补充。,符号检验,1.定义 忽略具体量的差异,仅用差异的正负号来做判断的一种检验方法。适用于对无法以数字计量的情况进行比较。 2.检验步骤 (1)确定配对样本,分别计算差异正与负的数目,无差异记做0,并将它从样本中删除,相应减少样本容量n。,(2)建立假设:H0:P=0.5;Ha:P0.5 (3)观察样本容量: 若n20,做二项分布处理;若n20,做近似正态分布处理。 (4)设定显著性水平,查表确定临界值,进行判断和比较。,3. 符号

4、检验的小样本情形 例:某软饮料公司想了解消费者对目前市场上的两种饮料(Citrus valley和Tropical Orange)的偏好情况,以确定消费者对其中一种是否偏爱。 以p表示消费者总体中偏爱Citrus Valley的比率,以符号来记录消费者个体的偏好。用“+”来表示偏爱Citrus Valley,用“-”来表示偏爱Tropical Orange。,我们检验的假设设定分别为: H0: p=0.5;Ha:p0.5 若原假设为真,则”+”的个数(记为 )应服从p=0.5的二项分布。 若令显著性水平定为0.05,拒绝域为? 回忆二项分布的概率函数。,因为 因此,当显著水平设定为5%时,拒绝

5、域为 9。,我们列出样本消费者对这两种饮料的偏好记录:,以p表示消费者总体中偏爱Citrus Valley的比率, 的个数为2,恰好落入了之前分析的拒绝域中,因此拒绝H0的假设。即消费者对两种品牌的偏爱存在差异。消费者更偏爱的品牌是Tropical Orange.,4. 大样本情形(n20) 例:60名消费者被随机选出对A、B两种牌子的洗发水打分,规定分数从5到1,分数越高说明评价越好。 收集的数据如下:,我们将配对的样本得分之差做符号记录,汇总的结果:“+”表示A品牌的分数高于B品牌的分数,“-”则相反,若两品牌的得分一致,我们给0值。“”的个数为15个,“”的个数为35个,“0”为10个。

6、 通过这样的整理以后,问两张洗发水受欢迎程度是否不同?,令p表示为得到“”号的概率, 表示为号个数 检验的假设设定为:H0:p=0.5;Ha:p0.5 统计量的选择:在大样本下,若H0为真,加号个数 服从正态分布,均值为u=0.5n,标准差为,因此,在H0为真的情况下,选择Z统计量, 服从标准正态分布。 此时的Z统计量同样可以由下式表示: 为样本中正号出现 的频率(此时需先删除0差 异样本点的影响),拒绝规则: 如果|z|Z(a/2),拒绝H0。 在本例中, 计算的统计量 或,在显著水平5%下,由于|z|=2.831.96 拒绝H0。认为两个牌子受欢迎程度不同,B品牌洗发水更受消费者青睐。 注

7、意例题中的n取值:n=50,而不是60,假设某地区居民在经济改革前的经济状况记作变量X,改革后的经济状况记作变量Y。第j户居民改革前后的经济状况分别 和 。二者之间的变化记作 。 请注意,现在我们不关心具体数值,只关心它的符号。,如果改革没有引起居民经济情况的变化,那么居民经济情况的前后差异就完全是由于各种随机因素的影响形成的(假定其它重要的影响因素都已控制不变),于是正差值的个数与负差值的个数会大体相等。把0差值舍去后,相当于对总体(正差值与负差值组成的总体)作二项试验,每次试验出现正号的概率是 p =0.5。 相反,如果改革引起了居民经济情况的明显好转,则正差值的个数会比负差值的个数多。对

8、正差值与负差值组成的总体作二项试验,每次试验出现正号的概率是p 0.5。,检验所针对的原假设是:H0:改革没有引起居民经济情况的变化(总体X改革前的经济状况与总体Y改革后的经济状况没有差别),或 H0: p =0.5。 建立原假设为真前提下的下列检验统计量:,表示为配对样本d为正的频率。,关于中位数的假设检验 (运用符号检验对单总体位置特征的实例) 中位数是将总体分成均等两部分的一个分位数,其中50%位于中位数以上,另外50%位于中位数以下。 我们可以利用符号检定来对总体的中位数进行假设检验。,例:在62所新住宅组成的样本中,34所住宅的价格高于13万美元,26所住宅的价格低于13万美元,2所

9、住宅的价格恰好为13美元。要求检验新住宅价格的中位数是否为13万美元? 如何利用符号进行检验? 当样本数据大于所假设的中位数时,我们用正号标注,反之用负号标注,若样本数据恰等于中位数时,我们用0标注,并将其从样本中删除。,关于中位数的假设检验有如下设定: H0: Median=13;Ha:Median13 大样本下,H0为真的前提下,样本数据大于中位数的个数 近似服从均值为0.5n,方差为0.25n的正态分布。 即选择统计量Z,根据统计量的抽样分布特点,推知当|z|Z(a/2)时,拒绝H0,否则,不能拒绝H0。 在显著水平5%下,由于1.031.96,因此我们不能拒绝H0。即不能否定新建住宅价

10、格的中位数为13万美元的论断。 注意:样本容量n=60,而不是62,小结: 符号检验可用于单总体某个位置特征的检验(中位数检验);也可用于两总体位置分布特征是否相同的检验。 但符号检验的缺点在于:仅利用差异方向或符号的正负做检验,而忽略了对差异多少的量的信息,因此对资料的利用不够充分。,Wilcoxon检验,该检验是不做正态分布假定的利用匹配样本检验两总体间差异的方法。 该检验利用的信息:除了匹配样本间的差异符号(方向),同时考虑了差异数值的大小。,同一个样本分别对两类方法进行试验,同时产生基于总体1和基于总体2的观察点。,适用性:1.数据类型为区间尺度数据。 2. 假设成对观测值的差异总体服

11、从正态分布。 检验步骤: (1)计算带正、负号的差数d (2)将d的绝对值按大小排序并编出等级(顺序号),相邻的等值以其为序的平均数为等级,0差异被剔除。 (3)将差数原来的符号赋予每个等级,确定等级个数。 (4)将所有带符号的等级相加,求秩和并用T表示其值,原假设为T=0。 (5)计算统计量 (6)根据显著水平确定临界值,进行比较和判断。,注意到统计量Z的特点: 在H0为真,即H0:两总体(期中成绩与期末成绩)相同的前提下,且n至少为10时,T(秩和)的抽样分布近似服从均值为0,方差为n(n+1)(2n+1)/6的正态分布。,例:考察学生某课程的期中与期末考试成绩是否有明显差异?,剔除无差异

12、样本点,检验过程: H0:期中与期末考试成绩无差异; Ha:期中与期末考试成绩有差异 计算统计量Z:当H0为真时,Z服从标准正态分布 计算得:,由拒绝原则, 在显著水平5%下,临界值为1.96. 因为1.421.96,故不能拒绝H0 不能否定两次考试成绩无差异的假设。,例:某制造企业正在尝试确定两种生产方法在任务完成时间上的差异。选择11名工人组成样本,每个工人均利用每一种方法完成生产任务。得到的配对样本如下表所示。我们考虑用Wilcoxon检验对两总体间的差异进行检验。,由最后一列符号秩求和得到,T44 H0:两种方法的任务完成时间相同 Ha:两种方法的完成时间有异 计算统计量 由拒绝规则知

13、,Z统计量大于临界值1.96,故拒绝H0的假设,认为两种方法的完成时间确实存在差异,第一种方法更耗时。,曼-惠特尼-威尔科可森MWW检验,适用范围:1.用于检验两个独立样本,是否来自具有相同位置特征的总体。(相同位置特征:具有相同的分布形状) 2. 数据要求至少必须为序数尺度 区别于之前的参数检验,MWW检验对两总体是否为正态分布不要求。 3. MWW检验的是两总体是否相同,而非总体均值是否相同。,设从两个总体中分别抽取容量为n1和n2的独立随机样本。把样本容量较小的总体叫做总体1,如果两样本容量相等,就任意把其中的一个叫做总体1。即,n1n2。设 1和 2分别是总体1和总体2的中位数。 将两

14、个样本混合起来,共有n= n1+ n2个观察值。把它们按递增顺序排列起来,依次赋以1,2,n的秩次。如果混合样本中有若干个相同的数值,则将它们所在位置的秩简单算术平均,用所得的均值作为这些数值的秩。,用W表示来自总体1的n1个观察值在混合样本序中秩次之和。 W的最小可能值是1+2+ n1= n1(n1+1)/2; 最大可能值是(n2+1)+(n2+2)+(n2+ n1)= n1n2+n1(n1+1)/2。 如果总体1的分布位于总体2的右边( 1 2 ),W将接近它的最大可能值;如果总体1的分布位于总体2的左边(1 2 ),W将接近它的最小可能值;如果二总体分布位置相同(1= 2 ) ,W将等于

15、中间值,即,(最大可能值+最小可能值)/2。 秩和检验或MWW检验的原假设是:H0: 1= 2 。,1.小样本情形(若两个样本的样本容量小于或等于10,那么就认为是小样本情形) 例:某高中的学生分别来自A初中和B初中,要比较两种生源的学习潜力是否有差异,抽取来自A初中的4名高中生和来自B初中的5名高中生组成随机样本,他们在班级中的名次如下表所示:,检验的步骤: 1.将两样本数据混合排序,最低值的秩为1,最高值的秩为9. 2.分别计算来自两个总体样本的秩和。 3. 根据MWW检验的表查得TL,并根据公式计算得到TU的值。 TU=n1(n1+n2+1)-TL 4.当秩和T严格小于TL或大于TU时,

16、才可拒绝原假设H0:两总体相同的假定。,由于有两个总体样本,因此选择秩和进行检验的时候要注意,两个统计量T都可以选择,只是具体查表时的参数会依据不同的检验秩和T而改变。,先假设使用A初中的秩和,计算得到T=11。若该校生源确实是更为优秀,则T可以取的最小值应为(1+2+3+4=10),若T越接近10,则说明A初中生源确实更为优秀。 若该校生源确实较为不好,那么T可以取的最大值应为(6+7+8+9=30),即T越接近30,说明A初中的生源状况确实较差。,同理对B初中的秩和T,也有类似的推断过程,可以了解到T的取值范围。 回到我们的假设设定:H0:两总体相同;Ha:两总体不同 若H0为真,两总体中

17、位数相同,则A初中的秩和应接近平均值即(10+30)/2=20 B初中的秩和T应接近平均值(1535)/2=25,现查表得到对应T的临界值TL和TU 当考察A初中学生的秩和进行检验时,n1=4,n2=5,5%的显著水平下,查表得到TL=12,由公式计算得到TU=28,即当TTU时,拒绝H0的假设。即认为两初中生源在学习潜力方面是不同的。 问?若考察B初中学生的秩和进行检验时,是否会得到相同的检验结果?,2. 大样本情形(两个样本容量大于10或等于10时) 与小样本不同的是,我们可以采用近似正态分布作为T秩和的抽样分布。 检验步骤与小样本一致:先混合排序,然后赋予各观察点秩值,然后求各总体样本的

18、秩和。,唯一的不同在于: 大样本下,T秩和的抽样分布,在H0为真的情况下(H0:两总体相同), 近似服从均值为 标准差为 的正态分布,相应的:检验的规则为, 统计量 若|z|Z(a/2),拒绝H0,否则,不能拒绝H0,例:美国第三国民银行的两个分行的账户余额如下表所示:问是否由以上数据可以判断两分行的账户余额总体相同?,两个或更多下相同数据,用平均秩赋值,计算各总体样本的秩和 A分行的秩和T=169.5;B分行的秩和T=83.5 H0:两分行的账户余额总体相同; Ha:两分行的账户余额总体不同 使用来自A分行的样本秩和T=169.5 若H0成立,则T的抽样分布在样本容量大于或等于10时近似正态

19、。,由题意计算得到: 统计量 由于|z|1.96,故拒绝H0。认为两银行账户余额同体不同。,克鲁斯卡尔-沃利斯Kruskal-Wallis检验,适用范围:考察多个总体是否相同的情形 适用数据:用于序数、区间或者比例尺度的数据。 当正态分布假设以及方差相等的检验未能满足时,K-W检验可以作为一种替代统计检验方法用于检验三个或三个以上总体是否相同。,方差分析的前提,例:某公司从3所大学聘用管理人员。最近该公司人事部评出雇员年度表现得分,以确定从三所大学招聘来的管理人员的表现是否有差异?,检验步骤: (1)将三样本数据混合排序,最低值等级为1,最高值等级为20. (2)求每个总体样本的等级和 (3)

20、计算相关统计量W K总体个数,ni为样本i的个数,Ri为样本i的秩和。可证明,在原假设即各个总体相同的前提下,W近似服从自由度为k-1的卡方分布。,按照以上规定进行混合排序后得到的结果如下:,K-W检验: H0: 来自三所大学的管理人员表现相同 Ha:至少两所大学的管理人员表现有差异 由样本计算得到W统计量,在H0为真的前提下,W近似服从自由度为(3-1)的卡方分布,由拒绝原则,当W 时,拒绝H0。 在显著水平5%下,卡方分布的临界值为5.9915 由于8.925.9915,因此拒绝H0,因此认为来自不同大学的管理人员,其业绩表现是明显不同的。其中B大学的管理人员表现水平最差,因此有理由减少从

21、B大学招聘员工的数额。,秩相关,之前讨论过的两变量间相关系数的前提是:两随机变量的联合分布是二维正态分布。当随机变量的分布不能满足正态性要求时,或者所要研究的变量不是数量型变量时,通常的相关分析方法不宜使用,这里考虑只能得到顺序数据的两个变量间关系的度量 1. 斯皮尔曼秩相关系数 为变量1的第i项的等级(秩); 为变量2的第i项的等级(秩)。 对X,Y两变量先分别排序,再在此基础上计算相关系数。 斯皮尔曼秩相关系数与应用于序数数据或排序数据的Pearson相关系数是相同的。,样本等级相关系数的取值范围是-1rs1。 当rs =1时,说明样本等级资料完全正相关; 当rs = -1时,说明样本等级资料完全负相关;当rs =0时,说明样本等级资料不相关; 当0 rs 1时, rs越接近1,正相关程度越高; 当-1 rs 0时, rs越接近-1,负相关程度越高。,例:某公司想知道雇佣时预期较好的推销员是否真有较好的销售记录。调查者复查了10名销售人员的原始面试结果,按成功潜力排级;随后,又对他们头两年的销售业绩进行第二次排级。 相应数据及两次排级结果见下表:,计算秩相关系数 这说明潜力与实际表现存在正相关,即一个变量的等级上升,另一个变量的等级也上升。 若秩相关系数为负,说明一个变量的等级上升,而另一个变量的等级会下降。,秩相关系数的显著性检验:我们利用样本的秩相关抽样结果 来估计总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论