第六章 卡方检验_第1页
第六章 卡方检验_第2页
第六章 卡方检验_第3页
第六章 卡方检验_第4页
第六章 卡方检验_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章卡方检验第一页,共十九页,2022年,8月28日卡方检验:利用卡方分布进行的检验。多用于离散型数量性状总体的抽样资料的检验适合性检验:利用样本结果实测频数与理论频数(按概率分配的频数)的差别量服从一定的卡方分布,来统计推断样本所在总体的概论分布是否与假定的概率分布模型相吻合。独立性检验:利用两种随机现象同时发生时的样本结果实测频数与理论频数(按假设两种随机现象相互独立且同时发生时的结果概率进行分配的频数)的差别量服从一定的卡方分布来统计推断,两种随机现象是否相互独立。独立性检验又称列联表卡方检验。第二页,共十九页,2022年,8月28日连续型随机变量,或结果数量较多的离散型随机变量结果数量较少的离散型随机变量随机抽样随机抽样将抽样的观测数据按人为分组归类并统计各组观测值的频数将抽样的观测数据按自然结果归类并统计各结果观测值的频数确定各分组的概率并计算各组按概率进行分配时的观测值频数确定各自然结果的概率并计算各结果按概率进行分配时的观测值频数利用公式构造一个抽样结果的统计量,一个描述抽样结果中实测频数与理论频数(概率频数)差别大小的统计量。这样一个统计量恰巧服从卡方分布。适合性检验第三页,共十九页,2022年,8月28日举例(分布类型的适合性检验【课本例13.10】

现有200头母猪所产仔猪1月龄窝重(kg)的分组资料如下表,试检验该仔猪1月龄窝重是否服从正态分布。试判断该小麦的株高表现是否遵从正态分布。组别<88~16~24~32~40~48~56~组中值12202836445260组频数046910131726组别64~72~80~88~96~104~112~>120组中值68768492100108116组频数352821168430第四页,共十九页,2022年,8月28日解:H0:x~N(μσ)HA:x不服从正太分布由于总体μ、σ未知,故由样本去估计(采用点估计):首先算出各组的理论频率:式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。本例中:k=9再算出各组的理论频数:E(fi)=Npi

=100×pi第五页,共十九页,2022年,8月28日本例中的自由度df=k-1-p=12-1-2=9,查x2值表可知,

x2<x20.05(9)=16.91,P>0.05,差异不显著。因P<0.50说明拟合的程度不是太高。只有小于50%的置信水平,认为仔猪1月龄窝重服从正态分布这一假设。组频数046910131726理论频数1.0161.7043.726.9212.0618.1223.1827.70x21.9680.62520.35191.44671.64760.1043组频数352821168430理论频数28.4024.9620.4814.048.984.882.881.55x21.58380.37030.01320.27360.10690.3393第六页,共十九页,2022年,8月28日【例】有100棵某品种小麦株高的样本分组资料如下表表,并且已经算得试判断该小麦的株高表现是否遵从正态分布。正态分布是连续分布,没有自然的类别,为了利用卡方检验,可先用第2章介绍的方法将数据进行分组,然后以每组作为一个类别,再用卡方检验进行正态分布的适合性检验。解:H0:x~N(μσ)HA:x~N(μσ)由于总体μ、σ未知,故由样本去估计(采用点估计):组中值838689929598101104107组分点值84.587.590.593.596.599.5102.5105.5组频数36122023191052理论频数2.385.6412.419.7222.6818.8811.374.951.98偏差量0.620.36-0.40.290.320.12-1.370.050.02第七页,共十九页,2022年,8月28日解:首先算出各组的理论频率:式中:xi+1、xi表示第i组的上下限(i=1,2,…,k)。本例中:k=9。再算出各组的理论频数:E(fi)=Npi=100×pi

本例中各组的已计算出并列于表6-2中。继而便可算出x2统计量值:本例中的自由度df=k-1-p=9-1-2=6,查x2

值表可知,x2<x20.05=3.455

,亦即

P>0.75。说明拟合的程度还是很高的。有75%的置信水平认为杨麦1号的株高遵从正态分布。第八页,共十九页,2022年,8月28日通常用于对离散型数量资料的检验将两种随机现象分列于列联表中随机抽样将样本所有观测值统计归类于列联表各相应组合中利用公式构造一个抽样结果的统计量,一个描述抽样结果中实测频数与理论频数(概率频数)差别大小的统计量。这样一个统计量恰巧服从卡方分布。独立性检验在假设两种随机现象相互独立的情况下,确定各组合的概率,并计算各组合按概率进行分配时的观测值频数第九页,共十九页,2022年,8月28日【例】考察不同灌溉方式对水稻叶子衰老是否有影响。几种灌溉方式下的叶态表现调查结果先将水稻分为3组,第一组用采用深水灌溉,第二组采用浅水灌溉,第三组采用湿润灌溉,然后统计每种灌溉方式下,水稻三种叶子(绿叶、黄叶、枯叶)出现的频数。

叶态频数灌溉方式绿叶黄叶枯叶总数深水146141.5778.83810.596161浅水183179.39911.1881213.426204湿润152160.04149.981611.978182总数4813036547第十页,共十九页,2022年,8月28日这时需要分析灌溉方式与叶态表现是否相关,若两者彼此相关,表明叶态表现因灌溉方式不同而异,即三种灌溉方式对叶态表现的影响不相同;若两者相互独立,表明三种灌溉方式对叶态表现的影响相同。这种根据频数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。独立性检验实际上是基于频数资料对因子间相关性的研究。根据概率乘法法则,若事件A和事件A是独立的,或者说它们之间无关联,这时事件A和事件B同时出现的概率等于它们分别出现时概率的乘积。第十一页,共十九页,2022年,8月28日反过来,若事件A和事件B同时出现的概率等于它们分别出现时概率的乘积,那么事件A和事件B是独立的,两者无关联;若事件A和事件B同时出现的概率不等于它们分别出现时概率的乘积,则这两个事件是有关联的。

本例中,设灌溉方式与与叶态表现无关联,则深水灌溉与绿叶同时出现的理论频率应为三种灌溉方式中深水灌溉的频率与三种叶态中绿叶的频率的乘积,第十二页,共十九页,2022年,8月28日其理论数T1由理论频率乘以总数得出,同样可以计算出另外的8种情况的理论频数。由此推出理论频数的计算公式:第十三页,共十九页,2022年,8月28日如拟合优度检验那样计算x2值。若x2<x2α,则观测数与理论数是一致的,灌溉方式与叶态表现间无关联的假设可以成立。若x2>x2α,则观测数与理论数不一致,说明灌溉方式与叶态表现间是有关联的,不同的灌溉方式影响着水稻叶子的衰老。

第十四页,共十九页,2022年,8月28日确定自由度,3×3列联表的自由度是(r-1)(c-1)或者写为(行-1)(列-1)

。因为每一行的各理论数受该行总数的约束,所以总的自由度只有(行-1)(列-1)

。本例中:结果推断:统计量值没有超过临界值,即没有落入否定域,于是我们不能否定叶态表现与灌溉方式无相关的假设,即我们应该接受:灌溉方式对水稻叶子的衰老并没有明显影响。第十五页,共十九页,2022年,8月28日卡方检验中的特化公式(自由度=1)独

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论