第13章+非参数检验.ppt_第1页
第13章+非参数检验.ppt_第2页
第13章+非参数检验.ppt_第3页
第13章+非参数检验.ppt_第4页
第13章+非参数检验.ppt_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、作者 贾俊平,统 计 学(第三版),2008,2008年8月,对正确问题的近似答案,胜过对错的问题的精确答案。 John W.Tukey,统计名言,第 13 章 非参数检验,13.1 单样本的检验 13.2 两个及两个以上样本的检验 13.3 秩相关及其检验,2008年8月,学习目标,非参数检验及其用途 单样本的非参数检验方法 两个及以上样本的非参数检验方法 秩相关及其检验方法 用SPSS进行非参数检验 非参数检验与参数检验的比较,2008年8月,不同商圈的报纸发行量是否有差异?,华夏时报自称是中国第一份商圈社区报,精准覆盖北京636座写字楼(公寓)70000实名精英读者的精神咖啡 2005年

2、8月29日的华夏时报公布了该报最新的发行量数据,并声明是“最新发行数据诚信公告”,2008年8月,不同商圈的报纸发行量是否有差异?,要检验不同商圈的发行量是否有显著差异,可以采用方差分析方法。但该方法假定每个商圈在不同发行点的发行量应服从正态分布,且方差相等 实际上,这些假定很难得到满足。比如,对上述数据所做的正态分布检验表明,亚奥商圈的发行量就不满足正态分布(P=0.0180.05),没有证据表明不同商圈的报纸发行量之间存在显著差异,13.1 单样本的检验 13.1.1 总体分布类型的检验 13.1.2 中位数的符号检验 13.1.3 Wilcoxon符号秩检验,第 13 章 非参数检验,1

3、3.1.1 总体分布类型的检验,13.1 单样本的检验,2008年8月,二项分布检验(binomial test)是通过考察二分类变量的每个类别中观察值的频数与特定二项分布下的期望频数之间是否存在显著差异,来判断抽取样本所依赖的总体是否服从特定概率为P的二项分布 二项分布检验的原假设是:抽取样本所依赖的总体与特定的二项分布无显著差异 根据二项分布知识,一个服从二项分布的随机变量,在n次试验中,出现“成功”的次数的概率为 若“成功”的次数的概率小于给定的显著性水平,则拒绝原假设,表明抽取样本所依赖的总体与特定概率为p的二项分布有显著差异(样本数据不是来自某个特定概率为p的二项分布),总体分布类型

4、的检验(二项分布检验),2008年8月,【例13.1】根据以往的生产数据,某种产品的合格率为90%。现从中随机抽取25个进行检测,合格品为20个。检验该批产品的合格率是否为90%?(产品合格率XB(n,0.9) SPSS的数据格式 表中的“1”表示合格品;“0”表示不合格品,总体分布类型的检验(二项分布检验),2008年8月,第1步:指定“频数”变量:点击【Data】【Weight- Cases】,将“频数”选入【Frequency Variable】 【OK】 第2步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第3步:将待检验的变量选

5、入【Test Variable List】(本例为“合格品”) 第4步:在【Test Proportion】中输入检验的概率 (本例为0.9),点击【OK】,用SPSS进行二项分布检验,总体分布类型的检验(SPSS binomial test),2008年8月,【例13.1】SPSS的输出结果 表中的合格品的观察比例为0.8,检验比例为0.9。精确单尾概率为0.098,它表示如果该批产品的合格率为0.9,那么25个产品中合格品数量小于等于20个的概率为0.098。P0.05,不拒绝原假设,没有证据表明该批产品的合格率不是0.9,总体分布类型的检验(SPSS binomial test),200

6、8年8月,单样本的K-S检验(Kolmogorov-Smirnov检验)是用来检验抽取样本所依赖的总体是否服从某一理论分布 其方法是将某一变量的累积分布函数与特定的分布进行比较。设总体的累积分布函数为F(x),已知的理论分布函数为F0(x) ,则检验的原假设和备择假设为 H0: F(x)=F0(x) ; H1: F(x)F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的理论分布无显著差异 SPSS提供的理论分布有正态分布、Poisson分布、均匀分布、指数分布等,总体分布类型的检验(K-S检验),2008年8月,【例13.2】沿用第7章的例7.7。对某汽车配件提供商提供的10个样本进行

7、检测,得到其长度数据如下(单位:cm) 检验该供货商生产的配件长度是否服从正态分布?(=0.05),总体分布类型的检验(K-S检验),2008年8月,第1步:选择【Analyze】【Nonparametric Test】【1-Sample K-S】进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“配件长度”) 第3步:点击【Exact】,并在对话框中选择 【Exact】,点击【OK】,用SPSS进行KS检验,总体分布类型的检验(SPSS K-S检验),2008年8月,【例13.2】SPSS的输出结果 精确双尾概率为0.6020.05,不拒绝原假设。没有证

8、据表明该供货商提供的汽车配件长度不服从正态分布,总体分布类型的检验(SPSS K-S检验),13.1.2 中位数的符号检验,13.1 单样本的检验,2008年8月,检验总体中位数是否等于某个假定的值 设一个随机样本有n个数据,总体中位数的实际值为M,假设的总体中位数值为M0。当样本中的数据大于假设的中位数时,用“+”号表示,小于假设的中位数时,用“-”表示;对于恰好等于假设的中位数的数据予以剔出 若关心实际的M与假设的M0是否有差别,应建立假设 H0: M=M0 ; H1: MM0 计算检验统计量S+和S-。S+表示每个样本数据与M0与差值符号为正的个数;S-表示每个样本数据与M0差值符号为负

9、的个数 计算P值并作出决策。若P,拒绝原假设,中位数的符号检验 (sign test),2008年8月,【例13.3】某企业生产一种零件,规定其长度的中位数为15厘米,现从某天生产的一批零件中随机抽取16只,测得其长度(单位:cm)如下 检验该企业生产零件的中位数与15cm是否有显著差异?(=0.05),中位数的符号检验 (sign test),2008年8月,第1步:选择【Analyze】【Nonparametric Tests-Binomial】选项进入主对话框 第2步:将待检验的变量选入【Test Variable List】(本例为“零件长度”) 第3步:点击【Define Dicho

10、tomy】,中在【Cut point】框中输入总体中位数的假设值15, 在【Test Proportion】框内输入二项分布的参 数0.5,点击【OK】,用SPSS进行符号检验,中位数的符号检验 (SPSS sign test),2008年8月,【例13.3】SPSS的输出结果 零件长度小于等于中位数的有10个,大于中位数的只有6个。而参数为(16,0.5)的二项分布变量大于等于15的概率为0.227。精确双尾概率为P=0.4540.05,不拒绝原假设。没有证据表明该企业生产零件的实际中位数与15cm有显著差异 (使用SPSS中的【Nonparametric Tests-2 Related S

11、amples】选项也可以作上述检验),中位数的符号检验 (SPSS sign test),13.1.3 Wilcoxon符号秩检验,13.1 单样本的检验,2008年8月,秩就是一组数据按照从小到大的顺序排列之后,每一个观测值所在的位置 用一般符号R来表示,假定一组数据 ,按照从小到大的顺序排列, 在所有观测值中排第 位,那么 的秩即为 也是一个统计量,它测度的是数据观测值的相对大小,大多数非参数检验方法正是利用秩的这一性质来排除总体分布未知的障碍的。当然,也有一些非参数方法并不涉及秩的性质,秩的概念(rank),2008年8月,很多情况下,数据中会出现相同的观测值,那么对它们进行排序后,这些

12、相同观测值的排名显然是并列的,也就是说它们的秩是相等的,这种情况被称为数据中的“结” 对于结的处理,通常是以它们排序后所处位置的平均值作为它们共同的秩 当一个数据中结比较多时,某些非参数检验中原假设下检验统计量的分布就会受到影响,从而需要对统计量进行修正(一般情况下,软件会自动作出修正),结的处理(ties),2008年8月,检验总体参数(如中位数)是否等于某个假定的值。它是对符号检验的一种改进,弥补了符号检验的不足,要比单纯的符号检验更准确一些(对应的参数检验单样本均值检验) 检验步骤 计算各样本观察值与假定的中位数的差值,并取绝对值 将差值的绝对值排序,并找出它们的秩 计算检验统计量和P值

13、,并作出决策,Wilcoxon符号秩检验(Wilcoxon signed ranks test),2008年8月,第1步:选择【Analyze】【Nonparametric Tests-2 Related Samples 】主对话框 第2步:将两个变量同时选入【Test Pair(s) List】,(“零件长度”和“假设中位数”) 第3步:在【Test Type】下选择【Wilcoxon】, 点击【Exact】并选择【Exact】,返回主 对话框,点击【OK】,用SPSS进行Wilcoxon符号秩检验,Wilcoxon符号秩检验(SPSS Wilcoxon test),2008年8月,【例13

14、.4】SPSS的输出结果 精确的双尾概率为0.126,不拒绝原假设。没有证据表明零件的实际中位数与15cm有显著差异,Wilcoxon符号秩检验(SPSS Wilcoxon test),13.2 两个及两个以上样本的检验 13.2.1 两个配对样本的Wilcoxon符号秩检验 13.2.2 两个独立样本的Mann-Whitney检验 13.2.3 k个独立样本的Kruskal-Wallis检验,第 13 章 非参数检验,13.2.1 两个配对样本的Wilcoxon符号秩检验,13.2 两个及两个以上样本的检验,2008年8月,检验两个总体的分布是否相同,或者说两个总体的中位数是否相同 对应的参

15、数方法两个配对样本的t检验 提出的假设为 H0: Md=0 ;H1: Md0 (Md表示差值的中位数) 检验步骤 计算各数据对的差值di,并取绝对值,排序后求出秩 计算检验统计W或z 根据P值作出决策,两个配对样本Wilcoxon符号秩检验,2008年8月,检验统计量 小样本情况下,统计量 服从Wilcoxon符号秩分布 大样本情况下,统计量 近似服从正态分布,两个配对样本Wilcoxon符号秩检验,2008年8月,【例13.5】一家制造企业准备采用一种新的方法生产产品,为确定新方法与旧方法生产的产品数量是否相同,随机抽取10个工人,每个工人分别使用新旧两种方法生产产品。10个工人采用两种生产

16、的产品数量如下。检验新旧两种方法所生产的产品数量是否有显著差异? (=0.05),两个配对样本Wilcoxon符号秩检验,2008年8月,第1步:选择【Analyze】【Nonparametric Tests-2 Related Samples 】主对话框 第2步:将两个变量同时选入【Test Pair(s) List】,(“旧方法”和“新方法”) 第3步:在【Test Type】下选择【Wilcoxon】, 点击【Exact】并选择【Exact】,返回主 对话框,点击【OK】,用SPSS进行Wilcoxon符号秩检验,两配对样本Wilcoxon符号秩检验(SPSS Wilcoxon test

17、),2008年8月,【例13.5】SPSS的输出结果 统计量为-2.296,精确的双尾P=0.0210.05, 拒绝H0,两种方法生产的产品数量有显著差异,两配对样本Wilcoxon符号秩检验(SPSS Wilcoxon test),13.2.2 两个独立样本的Mann-Whitney检验,13.2 两个及两个以上样本的检验,2008年8月,也称为Mann-Whitney U检验(Mann-Whitney U test),或称为Wilcoxon秩和检验 用于确定两个总体间是否存在差异的一种非参数检验方法(对应的参数方法两个独立样本的t检验或z检验) Mann-Whitney检验不需要诸如总体服

18、从正态分布且方差相同等之类的假设,但要求是两个独立随机样本的数据至少是顺序数据 与Wilcoxon符号秩检验不同,它不是基于相关样本,而是使用两个独立样本,两个独立样本Mann-Whitney检验,2008年8月,设X、Y是两个连续的总体,其累积分布函数为Fx和Fy,从两个总体中分别抽取两个独立样本:(x1,x2,xm)和(y1,y2,yn) 若要检验两个总体是否相同,提出如下假设 H0 :两个总体相同,H1 :两个总体不相同 或等价于 H0:Mx=My ;H1:MxMy,两个独立样本Mann-Whitney检验,2008年8月,检验步骤 把两组数据混合在一起,得到m+nN个数据,并找出N个数

19、据的秩 分别对样本(x1,x2,xm)和(y1,y2,yn)的秩求出平均秩,得到两个平均秩 和 ,并对平均秩的差距进行比较:若二者相差甚远,意味着一组样本的秩普遍偏小,另一组样本的秩普遍偏大,此时原假设有可能不成立 计算样本(x1,x2,xm)中每个秩大于样本(y1,y2,yn)的每个秩的个数 ,以及样本(y1,y2,yn)中每个秩大于样本(x1,x2,xm)中每个秩的个数,两个独立样本Mann-Whitney检验,2008年8月,检验步骤 计算Wilcoxon统计量W和Mann-Whitney统计量U 分别求出两个样本的秩的和,Wx和Wy。若mn,统计量W=Wy ;若m=n,统计量为第一个变

20、量值所在样本组的W值 Mann-Whitney统计量定义为 小样本情况下,统计量服从Mann-Whitney分布,大样本情况下,近似服从正态分布,检验统计量为 根据P值作出决策,两个独立样本Mann-Whitney检验,(k为W对应样本组的样本数据个数),2008年8月,【例13.6】8亚洲国家和8个欧美国家2005年的人均国民收入数据如下。检验亚洲国家和欧美国家的人均国民收入是否有显著差别 ? (=0.05),两个独立样本Mann-Whitney检验,2008年8月,第1步:选择【Analyze】【Nonparametric Tests-2 Independent Samples】主对话框

21、第2步:将待检验变量选入【Test Variable List】, (本例为“人均国民收入”);将分类变量选入的 【Grouping Variable】框内(本例为“国家”), 点击进入【Define Groups】分别输入类别代 码“1”和“2”,返回主对话框 第3步:在【Test Type】下选择【Mann-Whitney U】,点击【Exact】并选择【Exact】,返回 主对话框,点击【OK】,用SPSS进行Mann-Whitney检验,两个独立样本(SPSS Mann-Whitney test),2008年8月,【例13.6】SPSS的输出结果 统计量为-2.100,精确的双尾0.0

22、38,拒绝H0,亚洲国家和欧美国家的人均国民收入有显著差别,两个独立样本(SPSS Mann-Whitney test),13.2.3 k个独立样本的Kruskal-Wallis检验,13.2 两个及两个以上样本的检验,2008年8月,用于检验多个总体是否相同(对应的参数方法方差分析) Kruskal-Wallis检验不需要总体服从正态分布且方差相等这些假设 该检验可用于顺序数据,也可用于数值型数据 要检验k个总体是否相同,提出如下假设 H0 :所有总体都相同,H1 :并非所有总体都相同 或等价于 H0:M1=M2 =Mk H1:M1,M2 ,Mk 不全相同,k个独立样本 Kruskal-Wa

23、llis检验,2008年8月,检验步骤 将所有样本的观察值混合在一起,找出每个观察值在N个数据中的秩 计算检验统计量 当每个样本的容量均大于等于5时,检验的统计量H的抽样分布近似自由度为k-1的2分布。若P,则拒绝H0,表明k个总体是不全相同的,k个独立样本 Kruskal-Wallis检验,2008年8月,k个独立样本 Kruskal-Wallis检验,【例13.7】为比较3所大学的英语教学质量,分别从大学A抽取7名学生、大学B抽取6名学生、大学C抽取8名学生,采用同一份试题进行考试,得到考试分数的数据如表。试评价3所大学的英语教学质量是否有显著差异? (=0.05),2008年8月,第1步

24、:选择【Analyze】【Nonparametric Tests-k Independent Samples】主对话框 第2步:将待检验的变量选入【Test Variable List】, (本例为“考试成绩”),将分类变量选入 【Grouping Variable】框内(本例为“大学”), 点击进入【Define Groups】,将代码最小值 1输入【Minimum】,最大值3输入 【Maximum】,返回主对话框 第3步:在【Test Type】下选择【Kruskal-Wallis】, 点击【OK】,用SPSS进行Kruskal-Wallis检验,k个独立样本 (SPSS Kruskal-

25、Wallis),2008年8月,【例13.7】SPSS的输出结果 渐进的双尾P值为0.778,不拒绝H0,没有证据表明3所大学的英语考试成绩之间存在显著差异,k个独立样本 (SPSS Kruskal-Wallis),13.3 秩相关及其检验 13.3.1 Spearman秩相关及其检验 13.3.2 Kendall秩相关及其检验,第 13 章 非参数检验,13.3.1 Spearman秩相关及其检验,13.3 秩相关及其检检验,2008年8月,对两个顺序变量之间相关程度的一种度量 Spearman秩相关系数也称等级相关系数,记为rs,计算公式为,Spearman秩相关检验,rs的取值范围为-1,1 rs=1,两种排序之间完全相关;若-1rs0,两种排序之间为负相关;若0rs1,两种排序之间为正相关;若rs=0,两种排序之间不相关 rs越趋于1,相关程度越高;越趋于0,相关程度越低,2008年8月,Spearman秩相关检验,【例13.8】在一项关于职业声望和可信赖程度的调查中,列举了12种职业,要求被调查者分别按声望高低和值得信赖程度进行排序,调查数据如表计算两种排序之间的Spearman秩相关系数,并进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论