第8章群体间的差异比较卡方检验ppt课件_第1页
第8章群体间的差异比较卡方检验ppt课件_第2页
第8章群体间的差异比较卡方检验ppt课件_第3页
第8章群体间的差异比较卡方检验ppt课件_第4页
第8章群体间的差异比较卡方检验ppt课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

群体间的差异比较卡方检验,第8章,内容提要,8.1卡方检验原理,卡方检验,变量,连续变量,分类变量,有序分类变量,无序分类变量,秩和检验,卡方检验,T检验、方差分析,卡方检验原理,原假设H0:每一个卡通片被选择为喜欢的可能性是相同的。即假定所研究的总体服从均匀分布,因此每一个卡通片被选择的概率都应该是1/6。如果为真,300名儿童挑选每种卡通片的可能性应该是相等的,则选择每种卡通片的期望频次应该是:fe=n构造卡方统计量:,例:许多儿童都喜欢看卡通片,有的人认为只要是卡通片儿童都爱看,而不管其类型;另一些人认为儿童对不同类型的卡通片有不同的偏好。为此,他们提供了6种类型的卡通片,让300名经常看电视的儿童观看,然后说出喜欢看哪一个,得到如下表所示的数据。,卡方检验原理,(二)非参数检验,卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相互关联或相互独立。卡方检验的原假设H0是:观测频数与期望频数没有差别。卡方检验的基本思想是:首先假设H0成立,基于此前提计算出2值,它表示观测值与理论值之间的偏离程度。根据2分布,2统计量,以及自由度可以确定在假设H0成立的情况下获得当前统计量及更极端情况的概率P。判断:如果P值很小,说明观测值与理论值偏离程度太大,应当拒绝原假设,表示比较的类别之间有显著差异;否则就不能拒绝原假设,不能认为样本所代表的实际情况与理论假设有差别。,8.2拟合问题样本率与已知总体率的比较,拟合问题样本率与已知总体率的比较,对于连续变量,我们可以使用单样本的t检验考察样本所在总体的均值与已知值是否存在显著差异,即样本均值与已知值的差异。对于分类变量,则可以使用卡方检验比较样本比率与已知值的差异。什么是拟合问题?假设一个总体中,某个变量的可能取值有n个水平;某一已知样本中,该变量的取值也是这n个水平。现在需要从样本的分类数据出发,来判断总体各取值水平出现的概率是否与已知概率相符,即该样本是否的确来自已知的总体分布。即单样本率与总体率的比较,被称之为拟合问题。,拟合问题样本率与已知总体率的比较,原假设H0:摇奖机工作正常,则每个号码出现的概率为1/10。注意:原始数据在分析时,首先进行加权!AnalyzeNonparametricTestsChi-Square,例1:有奖有息储蓄摇奖的办法一般采取刻有数码09的编号球投入摇奖机,然后按一定规则,把摇出的数码组合成兑奖号码。南京市自开办有奖有息储蓄以来,13期中奖号码中各数码出现的频次见“数据摇奖.sav”。试判断摇奖机工作是否正常?,拟合问题样本率与已知总体率的比较,所有类别比例相等,自定义类别比例,拟合问题样本率与已知总体率的比较,残差值,卡方值,P值小于5%,可以拒绝原假设。认为摇奖机工作不正常。,拟合问题样本率与已知总体率的比较,原假设H0:顾客今年的颜色偏好与去年无显著差异。AnalyzeNonparametricTestsChi-Square,例2:美国某小汽车经营商根据去年销售的小汽车颜色的百分率,认为今年顾客选择各种颜色的数目仍将不变,即20%的人选择黄色,30%选择红色,10%选择绿色,10%选择蓝色,30%选择白色。他随机抽取了150名顾客,询问他们所喜好的颜色。结果见color.sav。问是否应拒绝该经营商的假设?,拟合问题样本率与已知总体率的比较,依次输入期望的类别比例。,拟合问题样本率与已知总体率的比较,P值小于5%,可以拒绝原假设。顾客今年的颜色偏好与去年相比存在显著差异。,8.3独立性检验两个(多个)变量的相关问题,独立性检验两个(多个)变量的相关问题,卡方检验可以非常容易地推广到两样本或多样本比较的问题,即应用卡方检验总体中两个特性有无相关性,这种检验也叫独立性检验。,例:在电视收视率调查中,得到性别与收视习惯的列联表如下。试建立数据文件并分析性别与收视习惯的相关联系。,独立性检验两个(多个)变量的相关问题,AnalyzeDescriptiveStatisticsCrosstabs,进行卡方检验,独立性检验两个(多个)变量的相关问题,AnalyzeDescriptiveStatisticsCrosstabs,观测频数,期望频数,输出残差,标准化残差,独立性检验两个(多个)变量的相关问题,双侧近似概率,Pearson卡方统计量,双侧精确概率,对数似然比计算的卡方,Fishers确切概率法,线性相关的卡方值,检验行列变量是否线性相关,多用于定序变量,8.4卡方检验的局限性及补救办法,由于卡方检验简单直观,而且交互分析表又能提供非常丰富的信息,因此在各种调查统计中这种交互分析(列联表加卡方检验)的应用十分广泛。在实际应用中,不但定类变量采用此方法,对定序甚至定距变量也粗略地划分成几类后做成列联表。这可以从某种意义上简化数据,但这种交互分析也存在其局限性。,卡方检验的局限性及补救办法,卡方检验的局限性:卡方值随分类的不同而改变。如对教育程度、收入水平的分类,因此分类时最好有理论或实践依据,或者统计依据(中位数、四分位数等)样本量不能太小,也不宜过大。样本量太小,采用卡方分布为依据的检验便不再成立。一般要求n40。但样本量过大,有时得到的结果便会失去意义。卡方值受样本量影响很大:样本量越大,越容易得到拒绝原假设H0的结果。,卡方检验的局限性及补救办法,卡方检验的局限性:列联表中期望频数小于5的个数不能太多。通常建议所有的期望频数都不小于5,最多也不能超过20%。如对35的列联表,共15个格,则期望频数小于5的格数不能超过3个。如果超过了20%,则需要对卡方值加以修正。对于连续型变量(定距、定比变量),卡方检验无法揭露其数量性质。卡方检验的一般原则:只要有数量型的变量出现,就应该采用可以提示其数量性质的统计工具(如t检验、方差分析、秩和检验等)来分析。卡方检验更适用于定类变量。,卡方检验的局限性及补救办法,统计指标的选择:当样本量n40,且所有单元格的期望频数fe5时,用普通的Pearson卡方检验;当样本量n40,且只有20%以下的单元格的期望频数1fe5时,用校正的卡方检验:如对数似然比(LikelihoodRatio)计算的卡方,或用于22格表的连续性校正的卡方(ContinuityCorrection);当样本量n40,或有20%以上的单元格期望频数fe5,或有单元格期望频数fe1时,采用确切概率法(FishersExactTest).,卡方检验的局限性及补救办法,本章练习,1、数据36选7.sav是体彩36选7连续45期中奖号码出现频次的统计,试分析中奖号码的出现概率是否随机。2、在周六晚节目单修订后,分别作了收视率的调查。在节目修改前,收视率记录为ABC29%,CBS28%,NBC25%,ITV18%。节目修改后,300个家庭所组成的样本产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论