



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。卡方检验法的基本原理和步骤编辑卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趋于符合,若两个值完全相等时,卡方值就为0,表明理论值完全符合。注意:卡方检验针对分类变量。(1)提出原假设:H0:总体X的分布函数为F(x).如果总体分布为离散型,则假设具体为H0:总体X的分布律为PX=xi=pi, i=1,2,.(2)将总体X的取值范围分成k个互不相交的小区间A1,A2,A3,Ak,如可取A1=(a0,a1,A2=(a1,a2,.,Ak=(ak-1,ak),其中a0可取-,ak可取+,区间的划分视具体情况而定,但要使每个小区间所含的样本值个数不小于5,而区间个数k不要太大也不要太小。(3)把落入第i个小区间的Ai的样本值的个数记作fi,成为组频数(真实值),所有组频数之和f1+f2+.+fk等于样本容量n。(4)当H0为真时,根据所假设的总体理论分布,可算出总体X的值落入第i 个小区间Ai的概率pi,于是,npi就是落入第i个小区间Ai的样本值的理论频数(理论值)。(5)当H0为真时,n次试验中样本值落入第i个小区间Ai的频率fi/n与概率pi应很接近,当H0不真时,则fi/n与pi相差很大。基于这种思想,皮尔逊引进如下检验统计量,在0假设成立的情况下服从自由度为k-1的卡方分布。独立样本四格表的检验方法(自由度为1)编辑假设有两个分类变量X和Y,它们的值域分别为x1, x2和y1, y2,其样本频数列联表为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出统计变量K2的值(即K的平方)K2的值越大,说明“X与Y有关系”成立的可能性越小。当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度:P(K2k)0.500.400.250.150.10k0.4550.7081.3232.0722.706P(K2k)0.050.0250.0100.0050.001k3.8415.0246.6357.87910.828例如,当“X与Y有关系”的K2变量的值为6.109,根据表格,因为5.0246.10910.828显著不相关,作此推论犯错的概率p0.999,即99.9%。注:独立四格表的拟合度公式可以写成n(ad-bc)2/(a+b)(c+d)(a+c)(b+d)总结:独立四格表资料检验1四格表资料的卡方检验用于进行两个率或两个构成比的比较。1. 专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)2/(a+b)(c+d)(a+c)(b+d),(或者使用拟合度公式)自由度v=(行数-1)(列数-1)=12. 应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=理论频数5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。行列表资料检验(自由度df=(C-1)(R-1))编辑行列表资料的卡方检验用于多个率或多个构成比的比较。1. 专用公式:r行c列表资料卡方检验的卡方值=n(A11/n1n1+A12/n1n2+.+Arc/nrnc)-12. 应用条件:要求每个格子中的理论频数T均大于5或1T5的格子数不超过总格子数的1/5。当有T1或1T5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。列联表资料检验同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。1. R*C 列联表的卡方检验:R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行列表资料的卡方检验相同。2. 2*2列联表的卡方检验:2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=n(ad-bc)2/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。用代码实现卡方检验编辑在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?处理发癌数未发癌数合计发癌率%甲组52197173.24乙组3934292.86合计912211380.5352 1939 3这是表中最基本的数据,因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。卡方检验要求:最好是大样本数据。一般每个个案最好出现一次,四分之一的个案至少出现五次。如果数据不符合要求,就要应用校正卡方。利用统计学软件分析结果如下:data kafang;input row column number ;cards;1 1 521 2 192 1 392 2 3;run;proc freq;tables row*column/chisq;weight number;run;统计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第一节 生物群落的基本单位-种群说课稿-2025-2026学年高中生物苏教版必修3稳态与环境-苏教版
- (2024年秋季版)七年级历史下册 第6单元 宋元时期 第10课《元朝的统一》说课稿2 川教版
- Unit 7 Culture and Cultural Diversity说课稿-2025-2026学年高中英语冀教版必修二-冀教版2004
- Unit 5 Water is life Speaking 说课稿 -2024-2025学年沪教版(2024)初中英语七年级下册
- 2025老年人照料服务合同
- 《2025试用期内解除劳动合同的赔偿问题》
- 2025青少年暑假工细读劳动合同
- 2025年:合同撤销与解除的法律界限解析
- 2025设备租赁合同争议答辩状
- 2025合同法务服务合同书范本
- 新版学校班主任工作手册模板
- 香港中文大学博士英文复试模板
- 国家公祭日成品课件
- 新项目方法能力验证报告(固定污染源废气氯化氢的测定硝酸银容量法)
- DL-T+2081-2020电力储能用超级电容器试验规程
- ISO9001设计变更管理程序
- 八年级下册英语补全对话及答案
- 青少年运动员运动损伤的预防和处理
- 大便失禁课件
- (正式版)QBT 8003-2024 化妆品用原料 水杨酸
- 高中数学竞赛平面几何中几个重要定理
评论
0/150
提交评论