第七章 卡方检验_第1页
第七章 卡方检验_第2页
第七章 卡方检验_第3页
第七章 卡方检验_第4页
第七章 卡方检验_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卡方检验的原理与方法;适合性检验;独立性检验;同质性检验第七章卡方检验----离散型资料连续型资料资料离散型资料小样本大样本进行U检验的条件是什么?

二、χ2检验与连续型资料假设检验的区别一、χ2检验的定义三、χ2检验的用途概述χ2检验(Chi-squaretest)

对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。一、χ2检验的定义二、χ2检验与连续型资料假设检验的区别对总体参数或几个总体参数之差不是对总体参数的检验,而是对总体分布的假设检验正态分布总体分布是未知的连续型资料离散型资料检验对象总体数据资料连续型资料假设检验χ2检验三、χ2检验的用途适合性检验独立性检验同质性检验适合性检验(吻合度检验)

是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。独立性检验在连续型资料的假设检验中,对一个样本方差的同质性检验,也需进行χ2检验。同质性检验第一节:χ2检验的原理与方法χ2检验的基本原理χ2检验统计量的基本形式χ2值的特点χ2检验的基本步骤χ2检验的注意事项

χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。原理理论值观测值ⅠⅡⅢχ2检验统计量的基本形式χ2=∑(Oi-Ei)2

EiO--实际观察的频数(observationalfrequency)E--无效假设下的期望频数(expectationfrequency)抽样误差?实质性变化?玉米花粉粒碘反应观察值与理论值碘反应观察值(O)理论值(E)蓝色非蓝色3437

34823459.5

3459.5

合计6919

6919

要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。碘反应观察值(O)理论值(E)O-E蓝色非蓝色3437

34823459.5

3459.5

-22.5

+22.5

合计6919

6919

玉米花粉粒碘反应观察值与理论值由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算:∑(O-E)2O--实际观察的频数E--无效假设下的期望频数玉米花粉粒碘反应观察值与理论值碘反应观察次数(O)理论次数(E)O-E(O-E)2蓝色34373459.5-22.5506.25非蓝色34823459.5+22.5506.25总数6919691901012.5

值越大,观测值与理论值相差也就越大,反之越小。

为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2的比重,最后将各组求和,这个总和就是χ2。χ2=∑(Oi-Ei)2

Eiχ2=∑(Oi-Ei)2

Ei

χ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。玉米花粉粒碘反应观察值与理论值碘反应观察次数(O)理论次数(E)O-E(O-E)2/E蓝色34373459.5-22.50.1463非蓝色34823459.5+22.50.1463总数6919691900.2926χ2值的特点可加性非负值随O和E而变化χ2=∑(Oi-Ei)2

Eiχ2值与概率P成反比,χ2值越小,P值越大,说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致;χ2越大,P值越小,说明两者之差越大,样本分布与假设理论分布越不一致。观测值与理论值的差异由抽样误差引起,即观测值=理论值。同时给出相就的备择假设HA:观测值与理论值的差值不等于0,即观测值≠理论值一般确定为0.05或0.011.提出无效假设H0Χ2检验的基本步骤2.确定显著水平α3.计算样本的χ2值4.进行统计推断χ2

<χ2αP>αχ2

>χ2αP<αH0HAH0HA建议SPSS等统计软件!1、任何一组的理论次数Ei都必须大于5,如果Ei≤5,则需要合并理论组或增大样本容量以满足Ei>52、在自由度=1时,需进行连续性矫正,其矫正的χ2c为:χ2=∑(Oi-Ei-

0.5

)2

Eiχ2检验的注意事项原因由于检验的对象——次数资料是间断性的,而χ2分布是连续型的,检验计算所得的χ2值只是近似地服从χ2分布,所以应用连续型的χ2分布的概率检验间断性资料所得的χ2值就有一定的偏差。由次数资料算得的χ2均有偏大的趋势,即概率偏低。当df=1,尤其是小样本时,必须作连续性矫正。χ2c

=∑(Oi-Ei-

0.5

)2

Ei比较观测数与理论数是否符合的假设检验(compatibilitytest),也称吻合性检验或拟合优度检验(goodnessoffittest).。适合性检验定义第二节:适合性检验用途1判定样本实际分布与理论分布是否相等泊松分布

适合性检验的df由于受理论值的总和等于观测值总和这一条件的约束,故df=n-1正态分布

二项分布

什么类型事件的分布通常服从于泊松分布?

(1)

H0:本资料服从泊松分布;HA:本资料不服从泊松分布300个单位容积内的细菌计数结果如下表,问此资料是否服从泊松分布?单位容积内细菌数X观察频数O概率理论频数E0260.08291024.90.051510.20644661.91.922840.25702577.10.623700.21333164.00.564420.13279839.80.125150.06613419.81.16690.0274458.20.01730.0139114.2合计300(n)1.0000003004.44(2)取显著水平α=0.05(3)计算统计数χ2

:(4)查χ2值表,当df=7-2=5时,χ20.05=11.07。现实得χ2=4.44<χ20.05,故接受H0,拒绝HA,即认为本资料服从泊松分布。例:有一鲤鱼遗传试验,以红色和青灰色杂交,其F2代获得不同分离尾数,问观测值是否符合孟德尔3:1遗传定律.体色青灰色红色总数F2观测尾数1503991602用它来检验实验结果是否符合各种规律.用途2自由组合定律孟德尔分离规律本例为判断典型的两组数据的适应性检验(1)H0:鲤鱼体色分离符合3:1,HA:不符.(2)确定显著水平α=0.05(3)计算χ2:由于理论资料k=2,df=2-1=1,需要进行连续性矫正.假设H0正确时,青灰色E1和红色E2理论数:

E1=1602×3/4=1201.5

E2=1602×1/4=400.5将数据代入公式得:(4)查χ2值表,当df=1时,.故应应否定H0,接受HA.即认为鲤鱼体色F2分离不符合3:1比率.SPSS的适合性检验输入数据在Variableview中的label中输入由于上例给出的是频数值,因此要先用WeightCases对话框指定频数变量第三节:独立性检验独立性检验的定义2×2列联表的独立性检验2×c列联表的独立性检验r×c列联表的独立性检验独立性检验(independencetest)又叫列联表(contigencytable)χ2检验,它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。(一)2×2列联表的独立性检验设A,B是一个随机试验中的两个事件,其中A可能出现r1、r2个结果,B可能出现c1、c2个结果,两因子相互作用形成4格数,分别以O11、O12、O21、O22表示,下表是2×2列联表的一般形式列(j)行(i)c1c2总和r1r2O11O21O12O22R1=O11+O12R2=O21+O22总和C1=O11+O21C2=O12+O22T2×2列联表的一般形式Row行;Column列检验步骤1.提出无效假设H0:事件A和事件B无关,同时给出HA:事件A和事件B有关联关系;2.给出显著水平α3.依据H0,可以推算出理论数,计算χ2值4.确定自由度,df=(r-1)(c-1),进行推断。H0HAH0HAχ2

>χ2αP<αP>αχ2

<χ2α给药方式有效无效总数有效率口服注射5864403198(R1)95(R2)59.2%67.4%总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表1.H0:给药方式与给药效果相互独立。HA:给药方式与给药效果有关联。2.给出显著水平α=0.053.根据H0,运用概率乘法法则:事件A与事件B同时出现的概率为:P(AB)=P(A)P(B)口服与有效同时出现的理论频率=口服频率×有效频率,即P(AB)=P(A)P(B)=98/193×122/193理论频数Ei=理论频率×总数=(98/193×122/193)×193=(98×122)/193=61.95即Eij=Ri×Cj/T=行总数×列总数/总数E11=R1×C1/T=61.95E12=R1×C2/T=36.05E21=R2×C1/T=60.05E22=R2×C2/T=34.95给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)给药方式与给药效果的2×2列联表计算χ2值:由于df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的χ2值需进行连续性矫正:给药方式有效无效总数口服注射58(61.95)64(60.05)40(36.05)31(34.95)98(R1)95(R2)总数122(C1)71(C2)193(T)4.查χ2表,当df=1时,χ20.05=3.841,而χ2c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论