无序分类资料的统计分析_第1页
无序分类资料的统计分析_第2页
无序分类资料的统计分析_第3页
无序分类资料的统计分析_第4页
无序分类资料的统计分析_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

无序分类资料的统计分析内容四格表和卡方检验原理1成组设计两样本率比较的卡方检验2确切概率法3行列表4卡方检验入门例子拟合优度检验V有时并不知道样本所代表的总体呈何分布V拟合优度检验GOODNESSOFFITTESTV对总体分布进行推断V不针对参数,而是针对分布的类型V推断单样本的K组频数的分布与某一理论分布是否相同的一种假设检验方法假设检验VH0该山区人群和这个地区人群的血型分布是一致的VH1该山区人群和这个地区人群的血型分布不一致VPEARSONS卡方检验VA实际頻数(ACTUALFREQUENCY)VT理论頻数(THEORETICALFREQUENCY)221KIIPIIATTCHISQUAREDDISTRIBUTION四格表表62使用含氟牙膏与一般牙膏儿童的龋患率牙膏类型患龋齿人数未患龋齿人数调查人数龋患率()含氟牙膏707667130123332003500一般牙膏4538335561671004500合计1151853003833更一般地,可将上述表格记为表63的一般形式,称之为四格表FOURFOLDTABLE。因为表中A、B、C和D四个格子的数据是基本的,其余数据均可从这四个数据派生出来。概述V卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它基本的无效假设是不包括配对资料H0行分类变量与列分类变量无关联H1行分类变量与列分类变量有关联005统计量,其中AI是样本资料的计数,TI是在H0为真的情况下的理论数期望值。221KIIPIIATT卡方检验在H0为真时,实际观察数与理论数之差AITI应该比较接近0。所以在H0为真时,检验统计量服从自由度为K1的卡方分布。即,拒绝H0。上述卡方检验由此派生了不同应用背景的各种问题的检验,特别最常用的是两个样本率的检验等。22,PV221KIIPIIATT方法原理V理论频数基于H0成立,两样本所在总体无差别的前提下计算出各单元格的理论频数来牙膏类型患龋齿人数未患龋齿人数调查人数龋患率()含氟牙膏707667130123332003500一般牙膏4538335561671004500合计1151853003833NNNTCRRC方法原理V残差设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差被称为残差。残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度。方法原理另一方面,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。这就是我们所说的卡方统计量,在1900年由英国统计学家PEARSON首次提出,其公式为22211KKIIIIIIIIAEANPENP方法原理从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0;观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。当然,卡方值的大小也和自由度有关。方法原理V卡方分布显然,卡方值的大小不仅与A、E之差有关,还与单元格数(自由度)有关024681000010203操作步骤1建立检验假设和确定检验水准H0使用含氟牙膏和一般牙膏儿童龋患率相等H1使用含氟牙膏和一般牙膏儿童龋患率不等20053计算检验统计量2值822676167615533383338453312333123130677667767022222操作步骤4确定P值和作出推断结论查附表8,2界值表,得P005。按005水准,不拒绝H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。对于四格表,卡方的计算公式又可进行简化,以方便手工计算卡方检验假设的等价性V两组儿童的龋齿率相同两组发生率的比较V使用不同的牙膏并不会影响龋齿的发生(两个分类变量间无关联)两变量的相关分析19校正公式2205ATT22/2ADBCNNABCDACBD四格表资料2检验的校正2分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的统计量也是不连续的。为改善2统计量分布的连续性,英国统计学家YATESFISHER建议将实际频数和理论频数之差的绝对值减去05以作校正。20在实际工作中,对于四格表资料,通常规定(1)T5,且N40时,直接计算2值,不用校正;(2)1T384,P2001(2),P005,按005的检验水准,不拒绝检验假设,尚不能认为白内障组与对照组ABO血型分布不同。(1)(2)(3)253122CRNNAN2141345不同资料类型的2检验的计算方法资料类型公式应用条件备注不校正N40,且所有的T5时独立的两组二分类资料校正N40,若有1T5时如果N40,或有T1时,用精确概率法不校正BC40配对的两组二分类资料校正BC40配对设计有专用的公式RC列联表资料不能有1/5以上的格子中的理论频数小于5,或者不能有一个格子的理论频数小于1。处理方法1增大N2合并3删除4精确概率法几点遗留问题V是否应当进行两两比较这又是一个打嘴仗的问题,虽然有人提出用卡方分割等方法来检验,但同样也有学者对这种做法嗤之以鼻实际上,随着统计学的发展,这个问题已被超越,可以使用对分类数据的建模方法,如LOGISTIC模型等对此问题加以解答几点遗留问题V如果是有序资料该怎么处理传统的卡方检验是无法对次序信息加以利用的单向有序秩和检验双向有序实际上考察的是两变量间的关联性(相关性),可以使用专门的关联性指标分析目前对卡方检验还有一些扩展方法,如CMH卡方,可以处理此类问题几点遗留问题V行列表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论