卡方检验及其应用_第1页
卡方检验及其应用_第2页
卡方检验及其应用_第3页
卡方检验及其应用_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、卡方检验及其应用一、卡方检验概述:卡方检验主要应用于计数数据的分析,对于总体的分布不作任何假设,因此它属于非参 数检验法中的一种.它由统计学家皮尔逊推导.理论证实,实际观察次数f.与理论次数fe, 又称期望次数之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:/ = Z写红、产这是卡方检验的原始公式,其中当fe越大,近似效果越好.显然fo与仁相差越大,卡方 值就越大;fo与C相差越小,卡方值就越小;因此它能够用来表示£,与相差的程度.根据这 个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之 间是否存在显著差异.一 般用卡方检验方法进行统

2、计检验时,要求样本容量不宜太小,理论次数25,否那么需要 进行校正.如果个别单元格的理论次数小于5,处理方法有以下四种:1、单元格合并法:2、 增加样本数;3、去除样本法;4、使用校正公式.当某一期里次数小于5时,应该利用校正公式计算卡方值.公式为:J e二、卡方检验的统计原理: 卡方检验所检测的是样本观察次数或百分比与理论或总体次数或百分比的 差异性. 理论或总体的分布状况,可用统计的期望值理论值来表达. 卡方的统计原理,是取观察值与期望值相比拟.卡方值越大,代表统计量与理论值的 差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论.三、卡方检验的主要应用:1、独立性检验第1页共5页

3、独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变 最之间的关联性和依存性问题.如果两变量无关联即相互独立,说明对于其中一个变最而言, 另一变量多项分类次数上的变化是在无差范用之内;如果两变量右关联即不独立,说明二者 之间有交互作用存在.独立性检验一般采用列联表的形式记录观察数据,列联表是由两个以上的变量进行交 叉分类的频数分布表,是用于提供根本调查结果的最常用形式,可以清楚地表示定类变量之间 是否相互关联.又可具体分为:(1)四格表的独立性检验:又称为2*2列联表的卡方检验.四格表资料的独立性检验用于 进行两个率或两个构成比的比拟.是列联表的一种最简单的形式.a)专

4、用公式:假设四格表资料四个格子的频数分别为a, b, c,d,那么四格表资料卡方检验的卡方值F* (ad-bc) -2/(a+b) (c+d) (a+c) (b+d),自由度 v二(行数1) * (列数T)b)应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5.当样本含量大于40但理 论频数有小于5的情况时卡方值需要校正,即公式?=工些二止22,当样本含量 fe小于40时只能用确切概率法计算概率.(2)、行李列表资料的独立性检验:乂称为R*C列联表的卡方检验.行文列表资料的独立性 检验用于多个率或多个构成比的比拟.a)专用公式:r 行 c 列表资料卡方检验的卡方值!>* (

5、An/nini+Ai2/nin2+.+Are/nrnc) 1b)应用条件:要求每个格子中的理论频数T均大于5或1T5的格子数不超过总格子数的1/5.当 有T<1或1(T5的格子较多时,可采用并行并列、删行删列、增大样本含量的方法使其符 令行*列表资料卡方检验的应用条件.多个率的两两比拟可采用行*列表分割的方法.第2页共5页f .f独立性检验的理论频数的计算公式为:=上;A公式中,小i表示横行各组实际频数的总和:fyi表示纵列各组实际频数的总和;N表示样本容量的总和;例1:为了解男女在公共场所禁烟上的态度,随机调查100名男性和80名女性.男性中有58 人赞成禁烟,42人不赞成:而女性中那

6、么有61人赞成,19人不赞成.那么,男女在公 共场所禁烟的问题所持态度不同?赞成不赞成行总和男性foil =58fb12=42RI = 100女性fo21 =62fb22 =18R2 = 80列总和Cl = 120C2=60T=180解:1提出零假设H.:男女对公共场所禁烟的态度没有差异.2确定自由度为2-1 21 =1,选择显著水平.=0.05o3求解男女对在公共场舍抽烟的态度的期望值,这里采用所在行列的合计值的乘积除 以总计值来计算每一个期望值如在卜表中:66.7:120*100/180.胧成不货成行总和男性foil-58fbl2 72RI = 100Fell -66.7Fel2 -33.

7、3女性fo21 -62fo22 -18R2 = 80Fe21-53o3Fe22 -26 7列总和Cl = 120C2=60T=180(58-66.7)2 (42-33.3J2 (62-53.3(18-26.7)27 = > > 111= /.O1V ,66.733.353326.7/ =行数列数=1Z;.o51 = 3.84/2 > ZoO5l 拒绝零假设,即男女对公共场所禁烟的态度有显著差异.例2:某机构欲了解现在性别与收入是否有关,他们随机抽样500人,询问为此的看法,结 果分为“有关、无关、不好说,三种答案,调杳结果如下表:第3页共5页性别有关无关不知道合计男12060

8、50260女10011060240合计220170110500解:(1)零假设Ho:性别与收入无关.(2)确定自由度为(3-1)(21) =2,选择显著水平.=0.05.(3)利用卡方统计量计算公式计算统计量:/ = 21.467 > /(2) = 5.991J r故拒绝零假设,即认为性别与收入有关.2、拟合性检验8卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是 否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数那么是根据理论或经 验得到的期望次数.这一类检验称为拟合性检验.其自由度通常为分类数减去1.理论次数通 常根据某种经验或理论.例3:随机

9、抽取60名高一学生,问他们文理要不要分科,答复赞成的39人,反对的21人,问 对分科的意见是否有显著的差异.解:(1)提出零假设H.:学生们对文理分科的意见没有差异:(2)分析:如果没有显著的差异,那么赞成与反对的各占一半,因此是一个无差假设 的检验,于是理论次数为60/270,代入公式:/吓巧科二胃1 +汽普二54福4所以拒绝原假设,认为对于文理分科,学生们的态度是有显著的差异的.例4:某大学二年级的公共体育课是球类课,根据自己的爱好,学生只需在篮球、足球和排 球三种课程中选择一种.据以往的统计,选择这三种课程的学生人数是相等的.今年开 课前对90名学生进行抽样调置,选择篮球的有39人,选择

10、足球的28人,选择排球的 23人,那么,今年学生对三种课程选择的人数比例与以往是否不同?第4页共5页篮球足球排球观察次数(fb)392823期望次数(fe)303030解:提出零假设H.:选择三种课程的学生比例与以往没有差异;L-力2 _ 39 - 302 28 - 3023 - 302 _1 十I H.Hv30df = 2K.52 = 5.993030Z2 < Zoo52所以接受零假设,即选择三种课程的学牛比例与以往相同.四、两种检验的异同:从外表上看,拟合性检验和独立性检验不管在列状表的形式匕还是在计算卡方的公式 上都是相同的,所以经常被笼统地称为卡方检验.但是两者还是存在差异的.首先,两种检验抽取样本的方法不同.如果抽样是在各类别中分别进行,依照各类别分 别计算其比例,属于拟合优度检验.如果抽样时并未事先分类,抽样后根据研究内容,把人 选单位按两类变量进行分类,形成列联表,那么是独

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论