




全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卡方检验及其应用一、卡方检验概述:卡方检验主要应用于计数数据的分析,对于总体的分布不作任何假设,因此它属于非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:这是卡方检验的原始公式,其中当fe越大,近似效果越好。显然fo与fe相差越大,卡方值就越大;fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。一般用卡方检验方法进行统计检验时,要求样本容量不宜太小,理论次数5,否则需要进行校正。如果个别单元格的理论次数小于5,处理方法有以下四种:1、单元格合并法;2、增加样本数;3、去除样本法;4、使用校正公式。当某一期望次数小于5时,应该利用校正公式计算卡方值。公式为:二、卡方检验的统计原理: 卡方检验所检测的是样本观察次数或百分比与理论或总体次数或百分比的差异性。 理论或总体的分布状况,可用统计的期望值(理论值)来体现。 卡方的统计原理,是取观察值与期望值相比较。卡方值越大,代表统计量与理论值的差异越大,一旦卡方值大于某一个临界值,即可获得显著的统计结论。三、卡方检验的主要应用:1、独立性检验独立性检验主要用于两个或两个以上因素多项分类的计数资料分析,也就是研究两类变量之间的关联性和依存性问题。如果两变量无关联即相互独立,说明对于其中一个变量而言,另一变量多项分类次数上的变化是在无差范围之内;如果两变量有关联即不独立,说明二者之间有交互作用存在。独立性检验一般采用列联表的形式记录观察数据, 列联表是由两个以上的变量进行交叉分类的频数分布表,是用于提供基本调查结果的最常用形式,可以清楚地表示定类变量之间是否相互关联。又可具体分为:(1)四格表的独立性检验:又称为2*2列联表的卡方检验。四格表资料的独立性检验用于进行两个率或两个构成比的比较,是列联表的一种最简单的形式。a) 专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n*(ad-bc)2/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)*(列数-1)b) 应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,即公式,当样本含量小于40时只能用确切概率法计算概率。(2)、行*列表资料的独立性检验:又称为R*C列联表的卡方检验。行*列表资料的独立性检验用于多个率或多个构成比的比较。a) 专用公式:r行c列表资料卡方检验的卡方值=n*(A11/n1n1+A12/n1n2+.+Arc/nrnc)-1b) 应用条件:要求每个格子中的理论频数T均大于5或1T5的格子数不超过总格子数的1/5。当有T1或1T5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行*列表资料卡方检验的应用条件。多个率的两两比较可采用行*列表分割的办法。独立性检验的理论频数的计算公式为: 公式中,fxi表示横行各组实际频数的总和; fyi表示纵列各组实际频数的总和; N表示样本容量的总和;例1:为了解男女在公共场所禁烟上的态度,随机调查100名男性和80名女性。男性中有58人赞成禁烟,42人不赞成;而女性中则有61人赞成,19人不赞成。那么,男女在公共场所禁烟的问题所持态度不同?赞成不赞成行总和男性fo11 =58fo12 =42R1100女性fo21 =62fo22 =18R280列总和C1120C260T180解:(1)提出零假设Ho:男女对公共场所禁烟的态度没有差异。(2)确定自由度为(2-1)(2-1)=1,选择显著水平=0.05。(3)求解男女对在公共场合抽烟的态度的期望值,这里采用所在行列的合计值的乘积除以总计值来计算每一个期望值(如在下表中:66.7=120*100/180)。赞成不赞成行总和男性fo11 =58fo12 =42R1100Fe11 =66.7Fe12 =33.3女性fo21 =62fo22 =18R280Fe21 =53.3Fe22 =26.7列总和C1120C260T180拒绝零假设,即男女对公共场所禁烟的态度有显著差异。例2:某机构欲了解现在性别与收入是否有关,他们随机抽样500人,询问对此的看法,结果分为“有关、无关、不好说,三种答案,调查结果如下表:性别有关无关不知道合计男1206050260女10011060240合计220170110500解:(1)零假设Ho:性别与收入无关。(2)确定自由度为(3-1)(2-1)=2,选择显著水平=0.05。 (3)利用卡方统计量计算公式计算统计量: 故拒绝零假设,即认为性别与收入有关。2、拟合性检验:卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。其自由度通常为分类数减去1,理论次数通常根据某种经验或理论。例3:随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。解:(1)提出零假设Ho:学生们对文理分科的意见没有差异;(2)分析:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次数为60/2=30,代入公式:所以拒绝原假设,认为对于文理分科,学生们的态度是有显著的差异的。例4:某大学二年级的公共体育课是球类课,根据自己的爱好,学生只需在篮球、足球和排球三种课程中选择一种。据以往的统计,选择这三种课程的学生人数是相等的。今年开课前对90名学生进行抽样调查,选择篮球的有39人,选择足球的28人,选择排球的23人,那么,今年学生对三种课程选择的人数比例与以往是否不同?篮球足球排球观察次数(fo)392823期望次数(fe)303030解: 提出零假设Ho:选择三种课程的学生比例与以往没有差异; 所以接受零假设,即选择三种课程的学生比例与以往相同。四、两种检验的异同:从表面上看,拟合性检验和独立性检验不论在列联表的形式上,还是在计算卡方的公式上都是相同的,所以经常被笼统地称为卡方检验。但是两者还是存在差异的。首先,两种检验抽取样本的方法不同。如果抽样是在各类别中分别进行,依照各类别分别计算其比例,属于拟合优度检验。如果抽样时并未事先分类,抽样后根据研究内容,把入选单位按两类变量进行分类,形成列联表,则是独立性检验。其次,两
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 30312-2025浸胶纱线、线绳和帘线热收缩试验方法
- 汉字的形体演变探析
- 社区活动开幕词范本
- 财务科技对传统银行的影响研究
- 金融科技在普惠金融中的应用探讨
- 成功源于勤奋演讲稿
- DB52T 453.6-2004 地产中药材有害生物无害化治理技术规程 玄参
- 军事理论-综合版知到智慧树见面课答案
- 水龙吟苏轼课件
- Ubuntu Linux 22.04系统管理与服务器配置 课件 项目3 软件包管理
- 缺血性心肌病病人护理查房
- 《社保新政策解》课件
- 《基于UG的汽车机加件工时计算及系统开发》
- 房产代理转让合同范例
- GB/T 7247.1-2024激光产品的安全第1部分:设备分类和要求
- 2023银行首届夏日音乐会系列(天籁之音乐动一夏主题)活动策划方案-106正式版
- 校服供货服务方案
- 呼吸机断电的应急演练
- 玉兰花的栽培与管理方法
- 早期子宫内膜癌患者保留生育功能治疗专家共识
- (完整)中医症候积分量表
评论
0/150
提交评论