第九章 列联分析_第1页
第九章 列联分析_第2页
第九章 列联分析_第3页
第九章 列联分析_第4页
第九章 列联分析_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第九章列联分析第1页,共25页,2023年,2月20日,星期三重点掌握的内容列联分析卡方检验思路F系数、列联系数、V系数SPSS的列联分析卡方检验第2页,共25页,2023年,2月20日,星期三第一节

列联分析的卡方检验第3页,共25页,2023年,2月20日,星期三列联分析分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。对这类问题的处理称为独立性检验(TestofIndependence)通过交叉列联表和c2检验进行列联分析。第4页,共25页,2023年,2月20日,星期三列联分析的思路一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表所示。检验各个地区和原料质量之间是否存在依赖关系?第5页,共25页,2023年,2月20日,星期三H0:地区和原料等级之间是独立的(不存在依赖关系)

H1:地区和原料等级之间不独立(存在依赖关系)第一步:提出假设假定交叉列联表中行变量和列变量相互独立第6页,共25页,2023年,2月20日,星期三第二步:计算检验统计量行变量列变量观察频数记作fijoRTiCTjn第7页,共25页,2023年,2月20日,星期三交叉列联表的边缘分布

列变量边缘分布一级二级三级行变量甲地区

140/500乙地区

171/500丙地区

189/500

边缘分布162/500

188/500

150/500

CTj/nRTi/n第8页,共25页,2023年,2月20日,星期三若原假设H0是正确的令:A=样本来自甲地区B=样本属于一级原料单元格的期望频率?P(第一单元格)=P(AB)=P(A)P(B)=140/500×162/500=0.09072某单元格ij的期望频率RTi/n×CTj/n某单元格ij的期望频数记作fijeRTi/n×CTj/n×n第9页,共25页,2023年,2月20日,星期三第三步:计算卡方统计量r为列联表的行数C为列联表的列数当行变量与列变量相互独立时,每个单元格的观察频数与期望频数相差较小。c2也较小。但单元格的观察频数与期望频数相差较大,c2也较大。表明行变量与列变量有关系。c2大到何种程度才算较大第10页,共25页,2023年,2月20日,星期三第四步:假设检验c2服从自由度为(行数-1)×(列数-1)的卡方分布c2~c2((r-1)(c-1))如果c2>c2a((r-1)(c-1))或者P<a拒绝原假设,行变量与列变量有关联

第11页,共25页,2023年,2月20日,星期三卡方统计量的自由度

列变量合计C1C2C3行变量R1

自由自由

限定RT1R2

自由自由

限定RT2R3

限定限定

限定RT3合计CT1CT2CT3

3×3列联表卡方统计量自由度为(3-1)×(3-1)第12页,共25页,2023年,2月20日,星期三交叉列联表卡方检验说明列联表不应有期望频数小于1的单元格,或不应有大量期望频数小于5的单元格;列联表中有20%以上的单元格中的期望频数小于5,不宜使用卡方检验;(此时卡方统计量会偏大,易于拒绝原假设,可采用似然率卡方统计量T修正)第13页,共25页,2023年,2月20日,星期三第二节

列联分析的相关程度测量第14页,共25页,2023年,2月20日,星期三列联分析中测度关联的系数f系数,适用于2×2列联表列联系数,Cramer’sV系数,适用于大于2×2的列联表第15页,共25页,2023年,2月20日,星期三F相关系数描述2×2列联表数据相关程度 表明变量X与Y完全相关表明变量X,Y之间相互独立F系数越接近于1,表明变量X与Y越相关,F系数越接近于0,表明变量X与Y越不相关第16页,共25页,2023年,2月20日,星期三2×2列联表注:a,b,c,d均为条件频数。当变量X,Y相互独立,不存在相关关系时,频数间应有下面的关系ad=bc差值ad-bc的大小可以反映变量之间相关程度的强弱。第17页,共25页,2023年,2月20日,星期三在2*2列联表中,每个单元频数的期望值

第18页,共25页,2023年,2月20日,星期三列联系数

(CoefficientofContingency)又称列联相关系数,简称C系数,主要用于大于2×2的列联表;当列联表中的两个变量相互独立时,系数C=0,但不可能大于1。C系数可能的最大值依赖于列联表的行数和列数,且随着R和C的增大而增大。行列数相同的列联表才可以比较列联系数大小第19页,共25页,2023年,2月20日,星期三Cramer’sV系数简称V系数,主要用于大于2×2的列联表;当两个变量相互独立时,V=0;当两个变量完全相关时,V=1。如果列联表中有一维为2,即min[(R-1),(C-1)]=1,则V值就等于f值。第20页,共25页,2023年,2月20日,星期三第三节

SPSS完成列联表的卡方检验第21页,共25页,2023年,2月20日,星期三汇总数据按照“原料数”加权输出观察频数输出期望频数卡方统计量列联系数f系数,V系数第22页,共25页,2023年,2月20日,星期三第23页,共25页,2023年,2月20日,星期三Pearson卡方统计量:19.822似然比卡方统计量:20.732大于c0.052(4)=9.488卡方统计量的sig值为0.001,小于a=0.05,拒绝原假设,认为原料等级和地区有关联。第24

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论