版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章
类别资料分析—卡方考验CategoricalDataAnalysis:Chi-SquareTest1第九章类别变项分析:卡方考验第1页课程目标理解类别资料特性理解残差分析原理理解卡方考验原理理解多种类别变项关联系数理解多种次序变项关联系数熟习类别变项多种SPSS统计应用2第九章类别变项分析:卡方考验第2页类别资料分析类别资料产生原发性类别资料:当被测定变项本质是名义性属性,例如性别资料操弄性类别资料:以人为操作伎俩所获致分类性资料,例如试验操弄分类成果虚拟化类别资料:由其他类型资料型态转换成类别形式资料,例如由连续变项转换来类别变项类别资料基本型态次数与百分比类别资料展现次数分派表与列联表类别资料分析卡方检定与其他关联性分析法第一节3第九章类别变项分析:卡方考验第3页类别变项考验类型适合度考验某一种变项是否与某个理论分派或母群分派相符合考验内容仅包括一种变项,是一种单因子考验独立性考验同步检测两个类别变项﹙X与Y﹚之间关系时,其目标在于检测从样本得到两个变项观测值,是否具有特殊关联。若检定不一样人口母群体,在某一种变项反应是否具有显著差异。称为同质性考验。多重列联表分析探讨三个或以上类别变项之间是否具有关联(非独立)或无关(独立)第一节4第九章类别变项分析:卡方考验第4页列联表列联表为两个单一类别变项次数分派表整合展现直行(column)变项以X表达,横列(row)以Y表达假如X变项具有k个水平,Y变项具有l个水平,称为k×l列联表边际分派﹙marginaldistribution﹚列联表侧缘数据(右侧及下方次数分派),反应两个变项次数分派情况,也就是两个独立次数分派表细格次数边际次数所包夹区域称为细格﹙cells﹚,反应两个变项互动关系两个类别变项是否具有关联性,就是在检查各细格当中次数变化情形第一节5第九章类别变项分析:卡方考验第5页残差分析(residualanalysis)残差分析各细格盼望次数与观测次数差值分析盼望值(以表达)是各细格所相对应两个边际人数百分比(Pi.与P.j)乘积乘以总人数在特定边际次数条件下,两个变项无关联时,细格次数在随机情况下最也许值,或称为最大约似(maximumlikelihood)盼望值
第二节6第九章类别变项分析:卡方考验第6页残差(residual)残差各细格实际观测人数减去盼望人数,又称为Δ(delta)值残差越大,各细格分布越不如盼望般出现,两个变项有某种关联,残差越小,表达各细格分布越接近盼望,两变项无关联正残差值表该细格观测次数高于两个变项无关时盼望值负残差值表该细格观测次数低于两个变项无关时盼望值
第二节7第九章类别变项分析:卡方考验第7页标准化残差(standardizedresidual)标准化残差残差为未标准化统计量数。将残差除以标准误,得到标准化残差将标准化残差平方后加总,即得Pearson
2,也就是我们常用卡方值Δ’分布呈标准化常态分派N(0,1),可利用常态化Z分派进行统计决策调整后标准化残差(adjustedstandardizedresidual)标准化残差会伴随边际盼望值大小变动而产生波动若将标准化残差以各边际比率进行调整,得到调整后标准化残差,能够排除各边际次数不相等所造成比较问题
第二节8第九章类别变项分析:卡方考验第8页卡方考验卡方考验将样本统计量转换成卡方值,配合卡方分派所进行统考验原理是以细格次数来进行交叉比较,俗称交叉分析χ2值大小,代表统计量与理论值差异程度,一旦χ2值大于显著水平临界值,即表具有统计意义残差分析是卡方考验显著后事后考验程序卡方考验显著之后,再以残差分析来检查各细格情况第二节9第九章类别变项分析:卡方考验第9页卡方分派令X为一常态化随机变量,以N(μ,σ2)表达从此一随机变量中任意抽取一种样本,将X值转换成标准分数(Z分数),再将Z分数取平方,此时,Z2被定义自由度为1卡方随机变量卡方变量由于是Z分数平方,因此展现正偏态分派,而非对称分派。卡方变量介于0到1机率,等于Z分数介于±1时机率(68.26%)。
第二节10第九章类别变项分析:卡方考验第10页小样本卡方检查小样本问题当样本很小时,以上述卡方公式所导出数值仅是一种卡方近似值,而非真正卡方分派下数值。小样本应使用校正值,例如耶兹校正(Yate’scorrectionforcontinuity)或费雪正确机率考验(Fisher’sexactprobabilitytest)前后测资料,应使用麦内玛考验(McNemartest)第二节11第九章类别变项分析:卡方考验第11页关联系数Phi(
)系数反应两个二分类别变项(例如类别为男女、是否类别变项)关联性系数
系数与卡方值之间具有可转换数学关系
系数系修正了样本数对于卡方值影响,开根号之后,
系数即等同于Pearson’sr,数值介于-1至1第三节12第九章类别变项分析:卡方考验第12页关联系数列联系数(coefficientofcontigency)当两个类别变项有任何一种超出两个水平,卡方值也许会大于样本数,造成
系数大于1情况列联系数能够加以修正Cramer’sV系数(Cramer’sVcoefficient)列联系数公式所求出系数虽然数值不会大于1,不过亦难接近1,尤其是当样本数越大时,列联系数会减小,可用CramerV系数来修正此一问题第三节13第九章类别变项分析:卡方考验第13页削减误差导出系数削减误差比(proportionedreductioninerror;PRE)指以某一种类别变项去预测另一种类别变项时,能够减少误差所占百分比E1表达以未知X时预测Y时所产生误差,即盼望误差(预测不准细格盼望值)E2表达以已知X时预测Y时所产生误差(预测不准细格次数)削减误差比应用PRE指数是一种介于0与1一种统计量PRE值越大,可削减误差百分比越大,两个变项关联性越强PRE百分比越小,两个变项关联性越低强调两个变项间非对称关系检查适用于当两个类别变项有明确独变项与依变项区分之时第三节14第九章类别变项分析:卡方考验第14页Lambda(λ)系数Goodman与Kruskal(1954)所提出一种以削减误差比来计算两类别变项关联性关联系数利用类别变项中众数组(mode)来作为削减误差计算基准对称λ(symmetrical):指X与Y两个变项关系是对等,无法区分何者为依变项,何者为独变项非对称λy.x(asymmetrical):指X与Y两个变项可指定独变项与依变项第三节15第九章类别变项分析:卡方考验第15页Tau(τy)系数Goodman与Kruskal所创以PRE为基础关联系数原理与非对称形式λy.x类似,系比较直行边际百分比和横列边际百分比进行预测误差机率,但Tau系数计算考虑了所有次数,因此敏感度较Lambda系数为高小写f表达细格次数,大写F为边际次数第三节16第九章类别变项分析:卡方考验第16页次序变项关联分析:Gamma系数Goodman&Kruskalt提出将依次序排列资料,进行各细格配对比较遇到同样等第资料则不予计算。非同分资料(untiedpairs)同序配对(concordantpairs):指两个变项上等第变动展现相同方向,以Ns表达异序配对(disconcordantpairs):指某配对观测值在X与Y变项等第变动展现相反方向,以Nd表达Gamma系数计算不包括边际次数计算,因此又称为免边际(margin-free)系数当样本数越大时(大于50),Gamma系数抽样分派展现常态化,能够配合统计考验来检查Gamma系数统计意义当同分情况比重太高时,Gamma系数无法反应这些细格资料而造成敏感度减少,宜采取其他系数(如Tau-b系数)第四节17第九章类别变项分析:卡方考验第17页Tau-b与Tau-c系数Kendall所提出,原理类似于Gamma系数一种对称性关联系数Tau-b系数将独变项上同分但依变项不一样分次序配对,以及独变项上不一样分但依变项同分次序配对纳入考量(但不处理二者同步同分配对观测值),使得关联系数计算更能反应细格内数据变化当列联表展现正方形时(两个变项组数或数值数目相等),τb系数数值会介于正负1之间。当数值越接近0,表达两变项关联性越低。列联表不是展现正方形时(两个变项组数或数值数目不相等),宜使用τc系数m表达组别数(等第数目)较少变项组别数(等第数目)第四节18第九章类别变项分析:卡方考验第18页Somers’sdyx类似于Gamma系数一种基于PRE概念次序变项非对称性量数可用于描述某一种变项对于另一种变项预测或解释情形dyx量数在分母增加了一项对于被预测变项(依变项)等第相同细格次数,扩大了被预测变项数据反应能力第四节19第九章类别变项分析:卡方考验第19页Kappa量数Cohen(1960)提出适用于具有相等次序数值两个次序变项关联性分析(也就是行与列数值数目相同),交叉表展现正方形Kappa系数所反应是两个次序变项等级是否相同,也就是当第一种次序变项为1时,在另一种变项次序是否也为1假如相同
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年公务员考试《常识》考前冲刺练习题附参考答案详解(综合卷)
- 2024-2025学年中级软考过关检测试卷及答案详解(名师系列)
- 公司制度文档管理模板
- 江苏省宿迁市2022年三年级下册《数学》期末试卷与参考答案
- 2024-2025学年冶金工业技能鉴定模考模拟试题及参考答案详解(精练)
- 教育信息化建设与课程开发指南
- 2024-2025学年临床执业医师综合提升测试卷带答案详解(突破训练)
- 2024-2025学年度一级建造师考前冲刺练习带答案详解(轻巧夺冠)
- 稀有植物资源可持续利用承诺书范文9篇
- 合作项目进度汇报的联系函(5篇)
- 档案立卷归档培训
- 工程力学期末考试b试题及答案
- 南宁市防洪工程软土地基处理:方法、实践与优化策略
- 鱼道运行管理办法
- 福建省高中英语口语考试题目及答案文档
- 2025年315消费者权益保护知识竞赛多选题库附答案(74题)
- 处方书写及管理办法
- 公司消防车安全管理制度
- 2025年高考数学试卷(全国Ⅰ卷)(解析卷)
- 大学雄安校区第一组团项目水土保持方案报告书
- 牛津树-自然拼读-等级2-level 2 -U2-Lesson2
评论
0/150
提交评论