下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 卡平方( )测验,第一节 卡平方( )的定义和分布 第二节 在方差同质性测验中的应用 第三节 适合性测验 第四节 独立性测验 第五节 的可加性和联合分析,教学要求:掌握卡平方测验方法在方差的同质性测验、适合性测验和独立性测验中的应用。,问题一:大豆F2群体植株62株红花,18株白花,请问是否符合3:1分离规律?,问题二:某村近5年来出生112名男孩,88名女孩,请问该村近5年出生的男女比例是否失调?,问题三:处于某排污企业上游的A村健康人口793人,患各种癌症的病人17人;处于下游的B村健康人口352人,癌症病人48人,请问癌症发病率是否与企业排污有关?,第一节 卡平方( )的定义和分
2、布,uiN(0,1),多个相互独立的正态离差平方值的总和。,1、连续性数据的2定义:,N(yi, ),yi不一定来自同一个正态总体,即 及 可以是不同正态分布的参数。若通常所研究的对象属同一个总体,则 , ,从而,(72),2、次数资料(计数资料)的2定义,其中:Oi观察次数 Ei理论次数 k观察值类型数(或状态数),次数资料,Pearson(1900)推出,值是多项 ui2 或 (OE)2/E 之和,具有可加性。,PP.367,与u、t、F统计数的比较:,按定义 ,当只有1个正态离差时 ,,当s的自由度无限增大时 ,,此时 的 v =1。,,当 的自由度无限增大时 ,,v 为s12的自由度。
3、, c2分布曲线与横坐标轴所围成的面积等于1,即,P(0 c2 + )= f(c2)d(c2)=1,+ 0,c2分布的累积函数F( c2)为 F( c2)= P( c2 c )= f(c2)d(c2),2 i,c2分布的特性有:, c2分布的取值范围为0,+)。,c2分布的形状决定于自由度df。,值是多项 ui2 或 (OE)2/E 之和, 具有可加性。,二、 2 测验的应用,方差同质性测验 适合性测验、资料正态性测验 独立性检验,第二节 在方差同质性测验中的应用,统计假设测验的基本步骤为: pp.77,1.对样本所属总体提出假设,包括无效假设H0 和备择假设HA。,2.确定显著水平 。,3.
4、在 H0为正确假定下, 依统计数的抽样分布,计算实际差数的概率。,4.统计推断,将算得的概率与相比较,根据小概率事件实际不可能性原理作出是否否定H0的推断。,或: 实得统计量与临界统计量比较,H0: = 0; HA: 0 2. =0.05 实得U值为2.10 推断:,H0:,HA:, =0.05 实得t值为3.05,(样本总自由度为15) 推断:,1. 2. 3. 4,H0:12 22, H1:12 22, 2.=0.05 3. 实得F值为3.51 4. 推断:,在作两尾测验有 ,对 。其显著大于和小于C的值是 和 ,此时,H0在 显著水平上被否定。,一、一个样本方差与给定总体方差比较的假设测
5、验,可用来测验单个样本方差s2所代表的总体方差和给定的总体方差值C是否有显著差异,简称为一个样本与给定总体方差的比较。,否定区在左、右两尾。,例7.1 硫酸铵施于水田表层试验,得4个小区的稻谷产量为517、492、514、522(kg),计得样本方差为175.6(kg)2。现要测验H0: 对HA: ,采用显著水平 =0.05。,据 可算得:,查附表6,在 v =n1=3时, /2和(1 /2)水平的 临界值为: , 。现 ,大于 ,在0.229.35范围外,符合H0的概率小于0.05,H0被否定。,结论:这一样本并非从 的总体中所抽取的。,【例7.1】(P131),f(c2),c2,c2 (1
6、-/2) ,df =0.22,/2,H0:2=20, HA:220,否定区在左或右尾。,c2 /2 ,df =9.35,/2,若测验该样本总体方差是否小于某给定总体方差C,则作一尾测验,即H0: C对HA: C , 如果算得的 ,则否定H0,否则接受H0。 如果测验其是否大于C,则H0: C对HA: C,若算得的 ,则否定H0。,H0:220, HA:220,否定区在左尾。,H0:220, HA:220,否定区在右尾。,-右尾测验。,-左尾测验。,例7.2 试审查例7.1试验结果的总体方差是否真大于某一定值,如50(kg)2?,这里试验的表面结果方差175.6(kg)2大于50(kg)2,要问
7、其总体方差是否真正大,抑或并不大,甚至小于50(kg)2,测验假设H0: 50对HA: 50。 取5%为显著水平。 查附表6,这一测验的 临界值为 ,,而计算的 ,,因10.540.35,所以H0应被接受,即总体方差并不小于50(kg)2。,c2测验的具体步骤为:, 提出无效假设与备择假设, 确定显著水平 确定a=0.05或0.01等。, 计算c2值 由样本资料和理论假设计算 c2值;根据自由度,由附表6查出ca,df 。,2, 推断,若22.df,则p,故接受H0; 22.df ,则p,故否定H0,,根据 ,可应用 分布由样本s2 给出一个总体 置信区间, 在此区间内包括有总体 的概率为(
8、), 即,(75),从而有:,(76A),已知 ,故(76A)又可记为:,(76B),-L2,L1 -,例7.3 求例7.1资料总体 的95%置信限。,因为 , , ,且已知 s2 =175.6,故对总体方差 的95%置信限的下限L1和上限L2为:,于是95%的置信限为:,注: 这一置信限并不对称,即从L1到s2的距离不等于s2到L2的距离。,利用置信限也可做显著性测验,例7.1中给定总体的 ,在56.32394.5范围外,故亦推断两者非同一总体。标准差的置信限可进而算出为:,即,本例因 较小,故方差置信限的区间甚大。,一般n30时,单个样本方差用 分布来测验和推断置信区间;n30时, 分布近
9、似对称, 近似服从N(0,1)分布,因此,用u测验并进行区间估计。,一个样本方差与给定总体方差比较的假设测验,二、几个样本方差的同质性测验,假定有3个或3个以上样本,每一样本均可估得一方差, 则由 可测验各样本方差是否来自相同方差总体的假设,这称为方差的同质性测验( test for homogeneity among variances ),可写为H0: (k为样本数) 对HA: 不全相等。这一测验方法由Bartlett氏(1937)提出,故又称为Bartlett测验( Bartlett test ),是一种近似的 测验。,假如有k个独立的方差估计值:, ,各具 个自由度,那么合并的方差 为
10、:,(77),由此,Bartlett 值为:,(78),(79),上式的 ,ni为样本容量,而C为矫正数:,(710),如采用常用对数,则(79)可写为,(711),上述(78)如不用C进行矫正,亦近似地作 分布,具有 ; 若所得 值不显著,则不必再作矫正,应接受H0; 若 值与 接近,应作矫正。 如果算得的 值 ,便否定H0,表明这些样本所属总体方差不是同质的。,例7.4 假定有3个样本方差s12=4.2, s22=6.0, s32=3.1,各具有自由度 , , ,试测验其是否同质。,假设H0: 对HA:3个方差不全相等(这里的HA不能用不等号表示,因为如H0被否定,只能推论3者不相等而并不
11、能确定属于 、 、 等情况的哪一种)。 然后,在表7.1进行同质性测验的计算:,表7.1 3个方差同质性测验的计算,由表7.1可得:,查附表6,当时 , 0.744的概率在0.500.75之间,符合H0的概率不小,因此说明本例的3个方差估计值是同质性的。,实际应用上本例可不需再作C矫正,因为 =27.9496027.14452=0.80508明显很小,直观已可判断不会显著。,第三节 适合性测验,一、适合性 测验的方法 二、各种遗传分离比例的适合性测验 三、次数分布的适合性测验,根据c2分布的概率值来判断实际次数与预期理论次数是否符合的假设测验,称为适合性测验(goodness of fit t
12、est)。,一、适合性 测验的方法,表7.2 玉米花粉粒碘反应观察次数与理论次数,此处要推论是否符合11分离,只要看观察次数与理论次数是否一致,故可用 测验,可分为四个步骤:,(1)设立无效假设,即假设观察次数与理论次数的差异由抽样误差所引起,即H0:花粉粒碘反应比例为11与HA:花粉粒碘反应比例不成11。,(2)确定显著水平 =0.05。,(3)在无效假设为正确的假定下,计算超过观察 值的概率,这可由 计得 值后,按自由度查附表6得到。试验观察的 值愈大,观察次数与理论次数之间相差程度也愈大,两者相符的概率就愈小。,(4)依所得概率值的大小,接受或否定无效假设 在实际应用时,往往并不需要计算
13、具体的概率值。 若实得 时,则H0发生的概率小于等于 ,属小概率事件,H0便被否定; 若实得 时,则H0被接受。,例如表7.2资料, 查附表6,当 时 =3.84 ,实得 =0.2926小于 ,所以接受H0。即认为观察次数和理论次数相符,接受该玉米F1代花粉粒碘反应比率为11的假设。,然而按 的定义 分布是连续性的,而次数资料则是间断性的。由间断性资料算得的 值有偏大的趋势(尤其在 时),需作连续性矫正。其方法是:在度量观察次数相对于理论次数的偏差时,将各偏差的绝对值都减1/2,即|OE|1/2。矫正后的 用 表示,即,(712),如表7.2资料的 值为:,=0.2798仍然小于 =3.84,
14、结论与前相同。,这是因样本较大,故 与 值的相差不大。,一般 的样本,尤其是小样本,在计算 值时必须作连续性矫正,否则所得 值偏大,容易达到显著水平。对 2的样本,都可以不作连续性矫正。,当 30时, 分布已近于对称,而 的分布是正态的,具平均数 和标准差1。 因而,当 30时可采用正态离差u测验代替 测验 ,即,如u1.64,即表示实得 值有显著性。,例7.5 大豆花色一对等位基因的遗传研究,在F2获得表7.3所列分离株数。问这一资料的实际观察比例是否符合于31的理论比值。,v =1,二、各种遗传分离比例的适合性测验,分离比例一类的适合性测验计算 时,也可以不经过计算理论次数,而直接得出,(
15、713),其中,A和a分别为显性组和隐性组的实际观察次数;n=A+a,即总次数。本例资料代入(713)有:,与(712)算得的 值相同。,对于仅划分为两组(如显性与隐性)的资料,如测验其与某种理论比率的适合性,则其 值皆可用类似(713)的简式求出。这些简式列于表7.4。,表7.4 测验两组资料与某种理论比率符合度的 值公式,例7.6 两对等位基因遗传试验,如基因为独立分配,则F2代的四种表现型在理论上应有9331的比率。有一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交,其F2代得表7.5结果。试检查实际结果是否符合9331的理论比率。,表7.5 F2代表型的观察次数和根据9331算
16、出的理论次数,首先,按9331的理论比率算得各种表现型的理论次数E, 如稃尖有色非糯稻 E=743(9/16)=417.94, 稃尖有色糯稻 E=743(3/16)=139.31,。 H0:稃尖和糯性性状在F2的分离符合9331; HA:不符合9331。 显著水平: =0.05。 然后计算 值,因本例共有k=4组,故 =k-1=3。查附表6, ,现实得 ,所以否定H0,接受HA,即该水稻稃尖和糯性性状在F2的实际结果不符合9331的理论比率。,这一情况表明,该两对等位基因并非独立遗传,而可能为连锁遗传。,测验实际结果与9331理论比率的适合性,也可不经过计算理论次数而直接用以下简式,(714)
17、,上式中的a1、a2、a3、a4分别为9331比率中各项表现型的实际观察次数,n为总次数。,如本例,可由(714)算得:,前面的 =92.696,与此 =92.706略有差异,系前者有较大计算误差之故。,实际资料多于两组的 值通式则为:,(715),上式的mi为各项理论比率,ai为其对应的观察次数。,如本例,亦可由(715)算得,与此一致。,CHIDIST计算特定2分布的单尾概率值 CHIINV计算一定单尾概率值时的2临界值 CHITEST计算独立性检验的2值,EXCEL粘帖函数,三、次数分布的适合性测验,适合性测验还经常用来测验试验数据的次数分布是否和某种理论分布(如二项分布、正态分布等)相
18、符,以推断实际的次数分布究竟属于哪一种分布类型。,例7.7 在大豆品种Richland田间考察单株粒重的变异是否符合正态分布。考查数据归成次数分布表列于表7.6,组距为5g,该分布的次数n、平均数 、标准差s 均列于表基部。,表7.6 大豆单株粒重观察分布与理论正态分布的适合性测验 (摘自Steel and Torrie,1980)(单位:g),测验的假设为H0:观察分布符合理论分布,HA:观察分布不符合理论分布。 按理论分布计算出各组的理论次数(E),此例中正态分布下的理论次数可先计算出各组限的正态离差及其理论频率(P),乘以总观察次数(n)便得到各组的理论次数。 例如第1组,第2组 P(5
19、.5y10.5)=P(2.065u1.674) =0.04710.0195=0.0276,相应的理论次数E,第一组为0.0195229=4.5; 第二组为0.0276229=6.3;,其他各组按同法计算后均列入表7.6。,自由度 =1412=11,因扣去组数的自由度1个,估计2个参数 和 的自由度2个。 查附表6, 为11时 =10.47的概率P在0.250.50范围内,观察分布与理论分布无显著差异,因而接受H0,说明大豆单株粒重的分布符合正态分布。,用于进行次数分布的适合性测验时有一定的近似性,为使这类测验更确切,一般应注意以下几点:,(1)总观察次数n应较大,一般不少于50。 (2)分组数
20、最好在5组以上。 (3)每组理论次数不宜太少,至少为5,尤其首尾各组。若组理论次数少于5,最好将相邻组的次数合并为一组。但Cochran认为头尾二组最小理论次数在0.5或1时也可不合并。,例7.7中尾端三组理论次数均较少,若将后三组合并,则,P(55.5y70.5)=P(1.841u3.013) =0.9887-0.9671=0.0316,该组理论次数为 0.0316229=7.27, (OE)2/E=(107.27)2/7.27=1.025 =123=9,查附表6, 为9时 =10.425的概率P在0.250.50范围内,结论同前。,第四节 独立性测验,应用 进行独立性测验的无效假设是: H
21、0:两个变数相互独立,对HA:两个变数彼此相关。,计算过程: (1)将所得次数资料按两个变数作两向分组,排列成相依表; (2)根据两个变数相互独立的假设,算出每一组格的理论次数; (3)由 算得 值。,这个 的自由度随两个变数各自的分组数而不同,设横行分r组,纵行分c组,则 =(r1)(c1)。 当观察的 时,便接受H0,即两个变数相互独立;当观察的 时,便否定H0,接受HA,即两个变数相关。,独立性测验方法的各种类型 一、22表的独立性测验 二、2C表的独立性测验 三、rc表的独立性测验,22相依表是指横行和纵行皆分为两组的资料。在作独立性测验时,其 =(21)(21)=1,故计算 值时需作
22、连续性矫正。,一、22表的独立性测验,例7.8 调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散黑穗病的穗数,得相依表7.7,试分析种子灭菌与否和散黑穗病穗多少是否有关。,表7.7 防治小麦散黑穗病的观察结果,假设H0:两变数相互独立,即种子灭菌与否和散黑穗病病穗多少无关;HA:两变数彼此相关。 显著水平 =0.05。 根据两变数相互独立的假定,算得各组格的理论次数。 如种子灭菌项的发病穗数O1=26,其理论次数E1=(21076)/460=34.7,即该组格的横行总和乘以纵行总和再除以观察总次数(下同);同样可算得 O2=50 的 E2=(25076)/460=41.3; O3=184的
23、E3=(210384)/460=175.3; O4=200的 E4=(250384)/460=208.7。 以上各个E值填于表7.7括号内。,以上各个E值代入 有,这里 =(21)(21)=1,查附表6, ,现实得 ,故P0.05,应否定H0。即种子灭菌与否和散黑穗病发病高低有相关,种子灭菌对防治小麦散黑穗病有一定效果。,22表的独立性测验也可不经过计算理论次数而直接得到 值。22表的一般化形式如表7.8。,按表中的符号,表7.8 22表的一般化形式,(716),如本例各观察次数代入(716)可得:,与前面结果相同。,二、2C表的独立性测验,2C表是指横行分为两组,纵行分为C3组的相依表资料。
24、 在作独立性测验时,其 =(21)(c1)=c1。由于c3,故不需作连续性矫正。,例7.9 进行大豆等位酶Aph的电泳分析,193份野生大豆、223份栽培大豆等位基因型的次数列于表7.9,试分析大豆Aph等位酶的等位基因型频率是否因物种而不同。,表7.9 野生大豆和栽培大豆Aph等位酶的等位基因型次数分布,H0:等位基因型频率与物种无关;HA:两者有关,不同物种等位基因型频率不同。 显著水平 =0.05。 根据H0算得各观察次数的相应理论次数: 如观察次数29的E=(19351)/416=23.66, 观察次数22的E=(22351)/416=27.34,; 将其填于表7.9的括号内。,再代入
25、 可得:,此处 =(21)(31)=2。查附表6, ,现 ,P0.05,应否定H0,接受HA。即不同物种Aph等位基因型频率有显著相关,或者说不同物种的Aph等位基因型频率有显著差别。,2C表独立性测验的值,也可直接由下式得到。,2C表的一般化形式如表7.10。,(717),( i=1,2,3,c ),表7.10 2C表的一般化形式,三、rc表的独立性测验,若横行分r 组,纵行分c 组,且r3,c3,则为rc相依表。 对rc表作独立性测验时,其 =(r1)(c1),计求 值不需要连续性矫正。,例7.10 表7.11为不同灌溉方式下水稻叶片衰老情况的调查资料。试测验稻叶衰老情况是否与灌溉方式有关
26、。,表7.11 水稻在不同灌溉方式下叶片的衰老情况,H0:稻叶衰老情况与灌溉方式无关;HA:稻叶衰老情况与灌溉方式有关。 取 =0.05。 根据H0的假定,计算各组格观察次数的相应理论次数:如与146相应的E=(481160)/547=140.69, 与183相应的E=(481205)/547=180.26, 所得结果填于表7.11括号内。,根据 可得,本例 =(31)(31)=4,查附表6, ,现 ,P0.05,故应接受H0,即不同灌溉方式对水稻叶片的衰老情况没有显著影响。,rc表的一般化形式如表7.12。,表7.12 rc表的一般化形式,由表7.12直接计算值的公式:,(718),( i=
27、1,2,r;j=1,2,3,c ),将表7.11资料,代入(718)有,第五节 的可加性和联合分析,例7.11 表7.13给出三个大豆组合F3家系世代对豆秆黑潜蝇抗性家系与感性家系的分离数据,每一家系由1个F2单株衍生,抗性家系中包括有全抗家系及抗感分离的家系。经对三个组合分别的 测验,均符合3抗1感理论分离比例。现要求进一步检测三组合综合起来是否符合31分离比例,三组合间是否一致符合31分离比例,或三组合是否具同质性。,表7.13 三个大豆组合F3家系世代对豆秆黑潜蝇抗性的分离数据(理论分离比为3抗1感),H0:三组合综合起来符合3抗1感分离比例,HA:综合群体不符合31分离比例; H0:三组合的分离比表现同质,一致为31,HA:三组合分离比例不同质。,要测验上列假设,必须计算出相应的 值。表7.13中列出有多种 值。,(1)各组合分别的 及 已用于测验各组合与理论分离比例31的相符性。这里不仅列出 值用于各测验;同时列出 值,因为 不具可加性,只有 值具有可加性。,(2)三个组合综合为一群体时的 值,或称为 =3.06,亦具1个自由度。这一值可用以测验第一个无效假设,根据其概率为0.050.10,可推论三合一的群体总的分离比例亦符合31。 (3)三组合各 的总
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026重庆建峰工业集团有限公司招聘6人备考题库及答案详解参考
- 2026江苏师范大学招聘体育教师4人备考题库及答案详解(基础+提升)
- 2026四川成都市锦江区莲新社区卫生服务中心招聘备考题库及答案详解(名师系列)
- 2026安徽宿州市第四人民医院劳务派遣人员招聘12人备考题库及答案详解(网校专用)
- 2026电子工业出版社有限公司招聘应届高校毕业生12人备考题库(北京)附答案详解(突破训练)
- 2026河南中医药大学第三附属医院硕士研究生招聘31人备考题库(第2号)附答案详解(综合卷)
- 2026浙江浙商融资租赁有限公司招聘1人备考题库及一套答案详解
- 2026四川宜宾高县硕润建设开发有限公司招聘2人备考题库含答案详解(夺分金卷)
- 《一元一次方程应用》教学设计
- 电子产品设计与开发手册
- 2025年四川农信(农商行)社会招聘试题及答案解析
- 2026年水利水电二级建造师继续教育通关试题库含完整答案详解【夺冠】
- 2026福州首邑产业投资集团有限公司第一次招聘19人笔试参考题库及答案解析
- 河北石家庄市2026届高三二模语文试题及参考答案
- 电梯事故隐患内部报告奖励制度
- 2026年黑龙江省《保密知识竞赛必刷100题》考试题库完整参考答案详解
- 2026届山东省济南市高三二模英语试题(含答案和音频)
- 20226云南昭通市检验检测院招聘检验检测辅助岗位专业技术人员6人建设考试参考题库及答案解析
- 2026首届AI世界杯:场景的胜利白皮书-
- 住院医师岗位轮转制度
- 2026年江苏南京市中小学教师招聘考试试题解析及答案
评论
0/150
提交评论