卡方检验-PPT幻灯片_第1页
卡方检验-PPT幻灯片_第2页
卡方检验-PPT幻灯片_第3页
卡方检验-PPT幻灯片_第4页
卡方检验-PPT幻灯片_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

前面介绍的各种假设检验方法,都基于连续型随机变量的理论分布所建立起来的模型作为依据,适用于取信息于连续型随机变量的样本资料,若用于非连续型变量的数据分析时会受到一些约束或限制。本章介绍的c2检验,则可以用于非连续型变量(即可数性资料)的分析。使用c2统计量进行的检验主要有拟合优度检验(也称适合性检验)和独立性检验两大类型。第一节拟合优度检验(适合性检验)所谓拟合优度,就是指观察到的样本表现与某种理论模型吻合的程度。拟合优度检验就是对观察的样本表现与所选某种理论模型的拟合程度作推断判决。比如眼下有观察资料,需判明它是来自遵从何种分布的总体,我们可以根据已有的经验对它作是“来自某种总体”的假定(假设),即

H0:F(x)=F0(x)式中,F0(x)表示已知的某种分布,如正态分布、二项分布、c2分布等。值得注意的是在这里建立统计假设不同于以前所作的假设检验,前面作假设检验时总是选择欲否定的内容作成立的假定;而在这里我们通常是选择最有可能接近的类型作成立的假设。在刚才假设成立的情况下,(x1,x2,…,xn)便是来自分布函数为F0(x)总体的一个样本。样本容量足够大时,样本分布Fn(x)[经验分布函数]与总体分布F0(x)应该非常接近,或者说应该有相当的吻合程度。但由于抽样误差,总不可能完全吻合。剩下的问题是:如何度量它们之间的吻合程度及如何判断它们之间的不吻合部分纯然是由于抽样误差所造成的。对以给定的显著水平a和样本df,由c2分布的右侧临界值表可以查得满足于时的ca。若实测统计量值没有落入右侧否定域,我们便可以接受原来的假设,即认为不吻合部分是由于抽样误差造成的。若实测统计量值落进了右侧否定域,则不能接受原假设,需要选择其他更合适的分布模型。在实际应用中,更多喜欢由c2分布右侧临界值表中查出“≤实测c2值”的表中同一自由度下的c2数值,由它对上的P值来作为拟合优度的指标。最后还要注意,若假设中F0(x)含有未知数,并且这参数需要由样本来估计时,则自由度还应减去未知数的个数,即df=n-k。下面通过具体例子来进一步说明。例6.1有100株杨麦1号小麦株高的样本分组资料如表6-1,并且已经算得样本x=94.8,样本S=5.2。试判断该小麦的株高表现是否遵从正态分布。表6-1100株杨麦1号的分组资料组中值838689929598101104107组频率f36122023191052理论频率2.3815.63712.4019.7222.6818.8811.374.9521.981偏差量0.6190.363-0.400.2850.3160.118-1.370.0480.019解由于总体m、s未知,故由样本去估计(采用点估计):m=x=95.60s=S=5.274首先算出各组的理论频率:式中:xi+1、xi表示第i组的上、下限(i=1,2,…,k),在上面的例子中:k=9。再算出各组的理论频数:E(fi)=npi上例中各组的E(fi)已计算出并列于表6-1中。继而便可算出实测的c2统计量值:此例子中的自由度df=9-3=6,查c2分布右侧临界值值(百分位点值)表可知,实测统计量c2值(2.747)小于3.455,亦即P>0.75,说明拟合的程度还是很高的,可以有75%的置信水平认为杨麦1号的株高遵从正态分布。遗传学里关于孟德尔分离比的拟合度检验,是遗传分析中经常使用的检验内容,也是拟合优度测度中较简单的情形,下面以例子说明。例6.2设有双性杂种AaBb自交后产生出32个子代,其中“AB”型20只,“Ab”型5只,“aB”型6只,“ab”型1只。问观察到的样本表现是否符合孟德尔两对独立基因的F2分离比。

解理论上,孟德尔两对独立基因的F2分离比应为9:3:3:1,即在32个子裔的F2群体中“AB”型应为18只,“Ab”型及“aB”型各应为6只,“ab”型2只。这样,度量实测频数与理论频数偏差程度的c2统计量值的计算便为本例子中的自由度df=4-1=3,查c2分布右侧临界值(百分位点值)表可知,实测统计量值c2<1.005,即P>0.80。也就是说,由样本观察到的表现欲孟德尔两对独立基因的F2分离模型是相吻合的(偏差只是偶尔性引起的抽样误差)。第二节独立性检验考察两种分类(分组)方法是否相互独立,即讨论按B方法分类所形成的各个子集中的元素是否仍随机地分布于按A方法分类所分成的各个子集之中。若是,当然两种分类方法相互独立;若不是,则两种分类方法并非独立,二是相互有关联了。如果两种分类方法是相互独立的,则从理论上说,落入第ij个子集的元素个数应占即应占有个数但由于随机误差,落入各单元的元素个数不一定刚好就是那么多个,即还允许有个随机波动的范围。当然随机波动的幅度一般不会太大,若太大了就很难接受这是“随机波动”的解释,也即是说,太大了我们只好认为两种分类方法彼此间并非相互独立,而是相互间有关联了。度量、判断允许波动的幅度,我们还使用c2统计量:式中:aij为应落入第ij单元的元素个数,即理论频数,其计算式为按上面式子计算实测统计量值,需先求算出落入各单元的理论频数,程序或做法上稍为麻烦些。若将计算式子作整理,则可成为:这样就可以直接利用原始数据进行计算,也就方便多了。下面我们看一个具体例子。例6.3为了考察不同灌溉方式下水稻叶子衰老的情况,天津稻作研究所某年在泊洼农场试验深水、浅水及湿润灌溉情况下水稻叶子的表现。试验得到的结果资料如表6-2所示。试分析叶态表现是否与灌溉方式显著相关。表6-2几种灌溉方式下的叶态表现调查结果绿叶黄叶枯叶Ti.深水浅水湿润146781839121521416161204182T.j4813036547

解对这个问题,我们可先作叶态表现欲灌溉方式各自独立而无相关的假设。在这个假定下,我们可以按“无效假设”计算实测统计量值。在按原公式计算时,必须预先求出各单元的理论频数。本例中,各单元的理论频数经计算已列在表6-3中相应部分的括号内。表6-3按原公式计算时有关数据表ⅠⅡⅢTi.Ⅰ146(141.47)7(8.83)8(10.695)161Ⅱ183(179.39)9(11.188)12(13.426)204Ⅲ152(160.041)14(9.98)16(11.978)182T.j4813036547接着计算实测统计量值:而若直接采用原数据计算时则为:在本例子中:df=(3-1)(3-1)=4,取a

=0.05,查c2分布表可得:实测统计量值没有超过临界值,即没有落入否定域,于是我们不能否定叶态表现与灌溉方式无相关的假定,即我们还是应接受:灌溉方式对水稻叶子的衰老并没有明显影响。从上面采用两种方法计算的结果我们可以看到:两种计算方法得到的结果是完全一样的。特别地,其中某一种分类方法只作二态分组,直接利用原数据的计算公式还可以变换成:例6.4调查水稻在不同种植密度下纹枯病的发病情况,河北正定丰家庄某年的试验结果资料如表6-4(标准资料是每密度调查299株所得到的数据)。试据此结果分析种植密度与纹枯病发生的相关性。表6-4水稻种植密度与纹枯病发病关系的调查结果种植密度15×106×95.5×6Ti.病株健株264154174159146121479T.j200200200600解按上面计算公式计算测试统计量值:例子中,自由度df=(2-1)(3-1)=2,取a=0.05,查c2分布表可得,实测统计量值显然落入否定域,故拒绝“无相关”的原假设,而认为种植密度对纹枯病的发生影响是显著的。如果我们再查c2分布表时同时也将a

=0.01的临界值一并查出,比较推断时就更方便了,,所以本例的推断结论实际可为“影响极显著”。第三节c2检验中的特化公式不论是拟合优度检验还是独立性检验,都有时会碰到自由度等于1的情况。在适合性检验和独立性检验中,通常我们碰到的资料多是计数资料。由于c2分布是连续性的,而计数资料时间断的。由间断性资料计算得到的c2值有偏大的趋势,尤其在自由度为1时,这种偏势很明显,因此需要对其作连续性矫正。矫正的做法具体体现在计算公式上时,对于适合性检验与独立性检验表现有所不同,故分别作介绍。一、适合性检验在适合性检验中矫正的计算公式为对于自由度等于1的情况,即只有2项观察值时,这两项的理论值间的关系都可以化成为r:1的形式。因此将公式变换成直接利用原数据计算的形式便是:计算式中x1为第1项观测到的频数,x2为第2项观测到的频数,n为观测的总频数。例如遗传学中的二型分离比:如是等等。由于比较简单,具体例子略去。

二、独立性检验在自由度为1的独立性检验中个,实际是据2×2列联表进行计算,其矫正的计算公式为将其变换成直接利用原数据进行计算的形式便是:例6.5考察小麦种子经灭菌与否发生黑穗病的关系。经试验观察得到如表6-5结果。表6-5小麦种子灭菌与否跟发生黑穗病的关系观察结果黑穗病无黑穗病Ti.种子灭菌种子未灭菌265018420075384T.j210250460试据试验结果按原试验目的作分析推断。

解按上面矫正公式计算试验中的实测统计量值:由df=1,查c2分布表上侧临界值表得:实测统计量值大于0.05显著水平的临界值(落入否定域),故可拒受“无相关”的假设,即还是认为种子灭菌处理和未经灭菌处理对小麦黑穗病的发生与否有显著影响。本章小结

本章介绍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论