



免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
交叉列联表分析 -用于分析属性数据 1. 属性变量与属性数据分析从变量的测量水平来看分为两类:连续变量和属性(Categorical)变量,属性变量又可分为有序的(Ordinal)和无序的变量。对属性数据进行分析,将达到以下几方面的目的: 1) 产生汇总分类数据列联表;2) 检验属性变量间的独立性(无关联性); 3) 计算属性变量间的关联性统计量;4) 对高维数据进行分层分析和建模。在实际中,我们经常遇到判断两个或多个属性变量之间是否独立的问题,如:吸烟与患肺癌是否有关?色盲与性别是否有关?上网时间与学习成绩是否有关等等解决这类问题常用到建立列联表,利用统计量作显著性检验来完成2列联表(Contingency Table)列联表是由两个以上的属性变量进行交叉分类的频数分布表。设二维随机变量(,),可能取得值为,可能取得值为现从总体中抽取容量为n的样本,其中事件(=)发生的频率为(i = 1,2, ,r,j=1,2, ,s,)记=,=,则有n = ,将这些数据排列成如下的表: YX n这是一张rs列联表3属性变量的关联性分析对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想知道形成列联表的行和列变量间是否有某种关联性,即一个变量取不同数值时,另一个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。属性变量关联性检验的假设为H0:变量之间无关联性; H1:变量之间有关联性由于变量之间无关联性说明变量互相独立,所以原假设和备择假设可以写为:H0:变量之间独立; H1:变量之间不独立检验H0:与独立记P (=,=) = ,i =1,2,r,,j = 1,2,s,P (=) =, i =1,2,r,P (=) = ,j = 1,2,s由离散性随机变量相互独立的定义,则原假设等价于H0:= ,i =1,2,r ,,j = 1,2,s若已知,我们可以建立皮尔逊统计量= 由皮尔逊定理知,的极限分布为但这里未知,因此用它的极大似然估计代替,这时检验统计量为=在H0成立的条件下,= ,即等价于用和的极大似然估计和的积去代替可以求得= , i =1,2,r , = , j = 1,2,s,则 = i =1,2,r,,j = 1,2,s, 从而得到统计量= 在H0成立的条件下,当n时,的极限分布为 = 对给定的显著性水平,当 ,则拒绝H0,否则接受H0 特别,当r = s = 2 时,得到22列联表,常被称为四格表,是应用最广的一种列联表这时检验统计量为= 它的极限分布为(1) 对于二维随机变量(,)是连续取值的情况,我们可采用如下方法将其离散化 将的取值范围(-,+)分成r个互不相交的区间,将的取值范围(-,+)分成s个互不相交的区间,于是整个平面分成了rs个互不相交的小矩形; 求出样本落入小矩形中的频数i =1,2,r,,j = 1,2,s ; 建立统计量=,在H0成立时且n充分大时,的极限分布为,拒绝域的确定同离散型的情况3属性变量的关联度计算检验的结果只能说明变量之间是否独立,如果不独立,并不能由的值说明它们之间关系的强弱,这可以由系数来说明系数=其中 当r=s=2即22列联表时-11,其它01,|越接近1,它们之间关联性越强,反之越弱。主要用于22列联表例1(教材p116例4.4)为了了解吸烟与患慢性气管炎的关系,对339名50岁以上的人作了调查,具体数据如下表: if患病 if吸烟患病未患病合计吸烟43162205不吸烟13121134合计56283339利用交叉列连表分析,研究吸烟习惯与患慢性气管炎的关系。解 检验 H0:吸烟与患慢性气管炎无关已给数据构成一个四格表, n=339 ,=43, =162,=13,=121,=205,=13,=134 ,=121,则=7.469若给定=0.05,查表得(1)= 3.841 7.469,所以拒绝 H0,即认为吸烟习惯与患慢性气管炎有关但系数=0.148较小,表示相关性不是太大利用SPSS软件完成练习1 数据文件“电信用户.sav”中记录了某电信运营商经营的各种情况,比如服务类型、设备租用、无线使用等。选择其中4个变量:custcat(顾客服务)、ed(顾客受教育程度)、income(家庭收入)、ininc(电信消费),考察顾客与服务经营的情况(1) 对变量custcat和ed进行频数分析;(2) 分别考察ed对incom
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全施工规范课件
- 官方的购房合同2篇
- 农业碳汇项目碳排放权交易市场潜力与2025年政策建议报告
- 农业碳汇项目碳排放权交易市场交易主体行为与市场发展研究
- 理想信念主题课件
- 电气工程专项方案(3篇)
- 农业温室项目2025年投资策略与风险防范研究报告
- 广西启点工程咨询服务有限公司45t-h循环流化床锅炉技改项目变更(非辐射类)环境影响报告表
- 房屋屋面改造工程方案(3篇)
- 农业气象服务在设施农业中的应用效果评价报告
- 主动脉夹层手术室
- 【MOOC】人格与精神障碍-学做自己的心理医生-暨南大学 中国大学慕课MOOC答案
- 《点亮小灯泡》公开课课件
- 基于PLC的恒压供水控制系统的设计-毕业论文
- 《射频通信全链路系统设计》 课件 第3、4章 射频收发机架构、射频通信接收机设计
- 2024-2025学年四川省成都市嘉祥外国语高级中学高一(上)段考数学试卷(10月份)(含答案)
- 机电一体化职业技能大赛试题及答案
- 2025中国新厨电白皮书
- 2024新苏教版一年级数学册第三单元第1课《图形的初步认识》课件
- 国际贸易实务(第三版)课件 项目八 落实信用证
- 和安风电场电气设备定检及预防性试验技术规范
评论
0/150
提交评论