CH6无母数检定_第1页
CH6无母数检定_第2页
CH6无母数检定_第3页
CH6无母数检定_第4页
CH6无母数检定_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、无母数检定无母数检定内容大纲 6.1认识无母数检定 6.2次序(等级)数据 6.3名义资料 6.4进阶探讨LogLinear(对数线性)6.1认识无母数检定 所谓母数是指母体的参(parameter),例如母体的平均数、变异数等。 因为有母数,所以我们可以利用样本的平均数来推定母体平均数所在范围。 无母数是指没有母体的参数,既然母体没有参数,就不可能用样本来推估。 次序尺度、名义尺度的资料就属于无母数。母数法(parametric methods)V.S.无母数法(nonparametric methods) 区间数据的平均数检定(第四章比较平均数)所使用的统计技术都属于母数法(paramet

2、ric methods)。 在使用母数统计法时,对于所要研究的母体都有一些比较严格的规定。例如在检定二个独立样本的平均数有无显著性的差异,而使用 t 检定法时,我们必须先假定二个样本都来自具有相同变异数的常态母体。 母体统计分析时,所用的数据都是以区间尺度或比率尺度这些高阶的测量尺度。 相形之下,无母数法(nonparametric methods)对于母体所做的假定较少,而且我们可以用次序尺度、名义尺度这些低阶的测量尺度的资料 无母数检定(Nonparametric Tests)随着独立样本、相关样本以及次序数据、名义数据的不同,可分为若干个测试类型(test type),如下表所示。所谓k

3、个样本是指分类群组的群组数目在2个以上(在SPSS中称为若干个)在SPSS程序中,独立样本要先交代分群变量(grouping variable),并界定群组(define groups)。6.2次序(等级)数据 在针对次序数据进行无母数检定方面,可用的适当技术,如下表: 有时候我们想要了解,样本中的一组次序是否与理论上或假说上的次序排列(theoretical or hypothetical rank ordering)有所不同。 在这种情形之下,使用Kolmogorov-Smirnov检定是相当适当的。此检定是检视一组观察的次序(样本值)是否合乎我们所建立的虚无假说(也就是,次数是否合乎某种

4、分配)。这个某种分配包括了常态分配、二项式分配、Poisson分配、Exponential分配。 大海饮料公司想要了解顾客在购买饮料时,对于价格重要性上的次序排列是否随机的,或者是否具有某种共同的偏好。 在大海饮料公司的例子中,对于价格重要性这个变量的数据经搜集之后加以建档。在档案中重要性这个变量的1表示极不重要,5表示极重要。我们所建立的虚无假说是:次数呈常态分配。 开启档案(文件名:.Chap06Kolmogorov-Smirnov.sav)。数据文件中的变量重要性是次序尺度数据。 在SPSS中,选择Analyze、Nonparametric Tests、1-Sample K-S(分析无母

5、数检定单一样本K-S检定),在所产生的One-Sample Kolmogorov-Smirnov Test窗口中,将重要性选入Test Variable List(欲检定的变量列表)下的方格中,我们设定的情形如图6-1所示。图6-1One-Sample Kolmogorov-Smirnov Test窗口中的设定单一样本Kolmogorov-Smirnov检定表如下表所示。显著性0.0000.05,未达显著水平,故不弃却虚无假说,因此认为:消费者对于太氏饮料所排定的次序与对容氏饮料所排定的次序并无不同(并无显著差异)。 在SPSS中,开启档案(文件名:.Chap06Kruskal-Wallis.

6、sav),文件中的品牌变数的1、2、3分别代表无品牌、太氏饮料、容氏饮料这三种品牌。 按Analyze、Nonparametric Tests、K Independent Samples(分析无母数检定K个独立样本),在所产生的Tests for Several Independent Samples窗口中,我们将变量次序选入Test Variable List(欲检定的变量列表)下的方格中,将变数品牌选入Grouping Variable下的方格中,情形如图6-4所示。图6-4Tests for Several Independent Samples窗口设定 在Tests for Sever

7、al Independent Samples窗口中,按Define Range,在Several Independent Samples:Define Range窗口中,我们在Minimum右边的方格中填入1,在Maximum右边的方格中填入3,表示Range for Grouping Variable(变量分组的范围)是1到3,如图6-5所示。图6-5在Several Independent Samples: Define Range窗口的设定 在所产生的输出结果检定统计量中,显著性0.1570.05,未达显著水平,故应 不弃却虚无假说,并认为:三种品牌的次序评等并无显著差异。研究者有时有必

8、要对二相关样本的次序差异性做评估。夫妻之间、采购代理商与使用者之间、广告活动的事前及事后(这些情况都会用到相关样本),对于某一品牌、包装颜色、样式的偏好的次序差异这些都是研究人员有兴趣了解的问题。 适合对于二个相关样本的次序进行差异性检定的方法有: 符号检定(sign test)。 Wilcoxon配对符号等级检定(Wilcoxon matched paired signed-ranks test) Wilcoxon配对符号等级检定可以说是以次序数据来进行检定。 以下的例子是用大样本(n25)来说明如何进行Wilcoxon配对符号等级检定。 大海饮料公司邀请40位消费来做太氏饮料及容氏饮料测试

9、。每个消费者测试二次(分别测试太氏饮料及容氏饮料)。每次给予1(特糟)到10(特好)的次序评等。管理当局想要了解:太氏饮料及容氏饮料对于消费者所认知的口味偏好有何影响。因此,虚无假说是:太氏饮料及容氏饮料在消费者所认知的口味偏好(次序评等)上并无显著差异。 开启档案(文件名:.Chap06Wilcoxon.sav),文件中的变量太氏饮料及容氏饮料所输入的值分别代表次序评点。 在SPSS中,选择Analyze、Nonparametric Tests、2 Related Samples(分析无母数检定二个相关样本),在所产生的Two-RelatedSample Tests窗口中,我们将太氏饮料与容

10、氏饮料选入Test-Pair(s) List(欲检定之配对变量的列表)下的方格中,如图6-6所示。图6-6Two-Related-Samples Tests窗口报表解读 所产生的检定统计量表中显示,显著性=0.3800.05,未达显著水平,故不弃却(接受)虚无假说。管理当局可认为:太氏饮料及容氏饮料在消费者所认知的口味偏好(次序评等)上并无显著差异。 在上述的例子中,如果我们以一组样本(15人)针对每一个受试者对三种品牌做测试,则用Kruskal-Wallis检定就不恰当了。这时候,我们要用Friedman二因子等级变异数分析 (Friedman two-way analysis of var

11、iance by ranks)、Kendalls W或者Cochrans Q。 换句话说,在k个(二个以上)相关样本中,数据是次序尺度的场合,我们要用Friedman二因子等级变异数分析及相依技术。 以前例而言,我们所选的15位餐厅经理,每一位都要分别对无品牌、太氏饮 料、容氏饮料做次序评等。虚无假说是:三种品牌的次序评等并无显著差异。 在SPSS中,开启档案(文件名:.Chap06Friedman.sav),文件中的资料分别是无品牌、太氏饮料、容氏饮料的次序评等。 选择Analyze、Nonparametric Tests、K Related Samples(分析无母数检定K个相关样本),在

12、所产生的Tests for Several Related Samples窗口中,我们将无品牌、太氏饮料、容氏饮料这三个变数选入Test Variables(欲检定的变数)下的方格中,如图6-7所示。在此窗口内,也可以看到k个相关样本的次序差异检定的其他统计技术。图6-7Tests for Several Related Samples窗口设定 在输出的检定统计量表中,显著性0.8040.05,未达显著水平,故不弃却虚无假说,而认为:无品牌、太氏饮料、容氏饮料的次序评等并无显著差异。6.3名义资料 在针对名义数据进行无母数检定方面,可用的适当技术,如 我们通常必须决定二个样本群在某一分类上的分

13、配情形是否有显著性的差异,或者说,其差异并不是完全由随机抽样误差而来。例如,购买者与非购买者在北部、中部、南部这三类地区的分布上是否有显著性差异?二个独立样本的类别分配 检定的目的在于进行两变量之间的独立性检定(test of independence),又称卡方检定(检定)。2例如,地区别与所得别是否独立?年龄与教育程度是否独立?须注意,这些变量必须是类别数据(categorical data)。 大海饮料公司想要了解:男性与女性消费者在使用程度上(轻度使用、中度使用、重度使用)上有无显著差异? 我们所建立的虚无假说是:男性与女性消费者在使用程度上(轻度使用、中度使用、重度使用)上无显著差异

14、 在SPSS中,开启档案(文件名:.Chap06Chi Square.sav),在档案中,性别变量的1代表男性,2代表女性;使用类别变量的1、2、3分别代表轻度使用、中度使用、重度使用。 按Analyze、Nonparametric Tests、Chi Square(分析无母数检定卡方分配),在所产生的Chi-Square Test(卡方检定)窗口中,将变量选入Test Variable List(检定变量列表)下的方格中,如图6-8所示。图6-8Chi-Square Test窗口的设定 在所产生的检定统计量表中,显著性=0.7100.05,未达显著水平,固不弃却(接受)虚无假说,而认为:男性

15、与女性消费者在使用程度上(轻度使用、中度使用、重度使用)上无显著差异。 在二个独立样本的类别分配检定中,我们也可使用交叉分析(第七章7.7节) 交叉分析可以提供比较深入的分析,例如方向性量数、对称性量数。白领、蓝领及管理群在重度使用、中度使用、轻度使用及非使用这四个消费类别中有无不同?采购代理商、作业人员、工厂经理在对大海饮料的态度类别(分为喜欢、无意见、不喜欢)上有无不同?像这样的问题涉及到类别数据(名义数据)及k个独立样本的检定问题,最适当的统计方法是:k个独立样本的检定。 大海饮料公司想要了解:采购代理商、作业人员、工厂经理消费者在使用程度上(轻度使用、中度使用、重度使用)上有无显著差异

16、?我们所建立的虚无假说是:采购代理商、作业人员、工厂经理消费者在使用程度上(轻度使用、中度使用、重度使用)上无显著差异。Chi-Square Test窗口 在SPSS中,开启档案(文件名:.Chap06Chi Square k.sav),在档案中,人员变量的1代表采购代理商,2代表作业人员,3代表工厂经理;使用类别变量的1、2、3分别代表轻度使用、中度使用、重度使用。 按Analyze、Nonparametric Tests、Chi Square(分析无母数检定卡方分配),在所产生的Chi-Square Test窗口中,将变量选入Test Variable List(欲检定的变量列表)下的方格

17、中,如图6-9所示。图6-9Chi-Square Test窗口的设定 在所产生的检定统计量表中,显著性=0.1290.05,未达显著水平,固不弃却(接受)虚无假说,而认为:采购代理商、作业人员、工厂经理消费者在使用程度上(轻度使用、中度使用、重度使用)上无显著差异。 有时候我们有兴趣了解在一个事件之后的类别改变。例如大海饮料公司的广告经理想要了解在受试者在看过某一个他(她)自己选择的广告影片(当然某种广告影片介绍某种产品)之后,会选择哪一种品牌的产品。这种情形是属于二个相关样本的类别分配检定的问题,以McNemar检定最为恰当。 管理当局想要了解:广告的效果会影响受试者选择太氏饮料吗?虚无假说

18、是:广告的效果不会影响受试者选择太氏饮料 开启档案(文件名:.Chap06McNemar.sav),变数CF(commercial film的起头字)中的1代表选择(及观看)太氏饮料广告影片,2表示选择其他广告影片;变量选择的1代表选择太氏饮料,2代表选择其他品牌的饮料。 在SPSS中,选择Analyze、Nonparametric Tests、2 Related Samples(分析无母数检定两个相关样本),在所产生的Two-Related-Samples Tests(两个相关样本检定)窗口,将CF-选择选入右边Test Pair(s) List(欲检定的配对变量的列表)中,在Test Ty

19、pe(检定类型)中点选McNemar,我们设定的情形如图6-10所示。图6-10Two-Related-Samples Tests窗口设定 在输出的检定统计量表中,显著性=1.0000.05,未达显著水平,故不弃却虚无假说,而认为广告的效果不会影响受试者选择太氏饮料。 来自同一家庭的父亲、母亲、长子(或长女)在重度、中度、轻度这三种电视观赏类别上有无不同?属于同一公司的采购代理商、作业人员、工厂经理在对大海饮料的态度类别(分为喜欢、无意见、不喜欢)上有无不同? 随着我们对于男性饮用、女性饮用、男女皆适用这三类标签(批注)的不同,同一个人是否会不隶属于同一类别?解决像这样的问题,最适当的统计方法

20、就是Cochrans Q检定。 大海饮料公司邀请20位消费者对无品牌、太氏饮料、容氏饮料进行口味测试,每个人在测试三种品牌的口味之后,可以选择六组包装的该产品或者$120。此研究的虚无假说是:品牌类别对选择(选择产品或金钱)无显著差异(影响)。 开启档案(文件名:.Chap06Cochran Q.sav),档中无品牌、太氏饮料、容氏饮料中的1代表选择该产品,2代表选择$120。 在SPSS中,按Analyze、Nonparametric Tests、K Related Samples(分析无母数检定K个相关样本),在所产生的Tests for Several Related Samples窗口

21、中的Test Type(检定类型)选Cochrans Q,我们设定的情形如图6-11所示。图6-11Tests for Several Related Samples窗口设定6.4进阶探讨LogLinear (对数线性) 在6.3节曾说明使用卡方检定(检定)进行二个独立样本的类别分配检定,其所处理的是两个变量。如果变量的数目多于两个,应如何处理?此时就要利用到SPSS的LogLinear(对数线性)。 SPSS的LogLinear具有三个程序:General(一般化)Logit(Logit分析)Model Selection(模式选择)。以下分别就这三个程序加以说明。 某研究者想要发现家庭大小

22、、年所得与拥有车辆数的关系 开启档案(文件名:.Chap06Logit.sav)。数据文件中,家庭大小类别分为两类:4人、5人,分别以1、2表示。年所得类别分为两类:100.1万,分别以1、2表示。拥有车辆类别分为两类:2辆,分别以1、2表示。 按Analyze、LogLinear、General(分析对数线性一般化),就会产生General LogLinear Analysis窗口,在此窗口中,将左边的变量选入右边的Factor(s)(因素)下的方盒内,如图6-12所示。图6-12General LogLinear Analysis窗口设定 在General LogLinear Analys

23、is窗口按Model,就会产生General Log Linear Analysis: Model窗口,在此窗口中,按Custom(自定义),在Build Term(s)下的下拉式清单中,选Main effects (主要效果),并将左边的变量选入右边的Terms in Model下的方盒中,如图6-13所示。图6-13General LogLinear Analysis: Model窗口设定 在General LogLinear Analysis窗口按Options,就会产生General LogLinear Analysis: Options窗口,在此窗口中,点选在Display(显示)下

24、的Estimates(估计值),如图6-14所示。其他已经打勾的都是SPSS内定的图6-13General LogLinear Analysis: OpTIONS窗口设定报表解读1. 在模式中只选主要效果 所谓主要效果是指同一个变量的类别之间的显著性。在输出的参数估计值表中,年所得类别的显著性=0.424,未达显著水平,表示低于100万、高于 100.1万的受试者并没有显著性的关系。家庭大小类别的显著性=0.000,达到显著水平,表示家庭人数低于4人、高于5人的受试者具有显著性的关系。拥有汽车类 别的显著性=0.000,达到显著水平,拥有1辆车以下、拥有2辆车以上的受试者具有显著性的关系。2.

25、 在模式中选择主要效果 加上交互作用如果在模式中选择交互作用,则我们可以看出家庭大小类别、年所得类别与拥有车数类别之间的关系。在参数估计值表中,依据估计值,我们可建立以下的方程式:拥有车数类别与家庭大小类别的显著性=0.000,达到显著水平。拥有车数类别与年所得类别的显著性=0.001,达到显著水平。表示家庭大小、年所得都与拥有车辆数具有显著性的关系存在;易言之,家庭大小、年所得都是预测拥有车辆数的有效指标。从Z值来看,家庭大小、年所得的Z值分别是5.38、3.28,都是正值,因此当家庭人数增加时或者当年所得增加时,拥有车数就会增加。如果对Z值加以比较,家庭人数比年所得更具有预测力。 某研究者

26、想要发现家庭大小、年所得与拥有车辆数的关系,进而了解家庭大小、年所得是否可预测拥有车辆数。 开启档案(文件名:.Chap06Logit.sav)。数据文件中,家庭大小类别分为两类:5人,分别以1、2表示。年所得类别分为两类:100.1万,分别以1、2表示。拥有车辆类别分为两类:2辆,分别以1、2表示。 按Analyze、LogLinear、Logit(分析对数线性Logit分析),就会产生Logit LogLinear Analysis窗口,在此窗口中,将拥有车数类别变量选入右边的Dependent(依变量)下的方盒内,将家庭大小类别、年所得类别变量选入右边的Factor(s)(因素)下的方盒

27、内,如图6-15所示。图6-15Logit LogLinear Analysis窗口设定 在Logit LogLinear Analysis窗口按Model,就会产生Logit LogLinear Analysis: Model窗口,在此窗口中,按Custom(自定义),在Build Term(s)下的下拉式清单中,选Main effects(主要效果),并将左边的变量选入右边的Terms in Model下的方盒中,如图6-16所示。图6-16Logit LogLinear Analysis: Model窗口设定 在Logit LogLinear Analysis窗口按Options,就会产生Logit LogLinear Analysis: Options窗口,在此窗口中,点选在Display(显示)下的Estimates (估计值),如图6-17所示。图6-17Logit LogLinear Analysis: Options窗口设定报表解读

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论