南农生统课本示稿第6章卡平方测验课件_第1页
南农生统课本示稿第6章卡平方测验课件_第2页
南农生统课本示稿第6章卡平方测验课件_第3页
南农生统课本示稿第6章卡平方测验课件_第4页
南农生统课本示稿第6章卡平方测验课件_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试验设计与统计分析第四章 理论分布和抽样分布本课程使用盖钧镒主编的试验统计方法一书作为课本。全程为38学时,占2学分。 第二章 试验设计与实施第三章 次数分布和平均数、变异数第五章 统计假设测验第八章 参数估计方法第六章 方差分析第七章 卡方测验第九章 直线回归和相关第一章 科学实验及其误差控制第十章 多元回归和相关第十四章 不完全区组设计和统计分析第十二章 单因素试验的统计分析第十三章 多因素试验结果的统计分析第十五章 抽样调查第十一章 曲线回归第七章 卡方测验第二节 样本方差同质性测验第一节 卡平方分布的定义和分布第三节 适合性测验第四节 独立性测验第五节 卡方的可加性和联合分析第一节 卡

2、平方分布的定义和分布 第四章介绍各种概率分布时,我们已经初步介绍过卡平方分布 的定义。现在先回忆一下当 时的介绍。第五节 几种常用的分布(回忆) 2分布(卡平方分布) 若随机变量2的概率密度函数为: 则称随机变量2服从自由度为n的2分布。 2分布曲线的特性: 20,图象都在第一象限; 不对称的单尾型曲线,随着自由度增加变得稍对称, 但顶峰变矮; df3时,曲线与横轴间面积为1;df 3时,曲线与 纵横两轴间面积为1。例:随机变量2服从df =3的2分布,它在区间(0, 20.05)的概率为95%,即在此区间以外的概率为5%,查表求20.05的值。p.367附表6列出了若干常用概率下()的2分布

3、表值。df =1df =3df =5f( 2) 2第一节 卡平方分布的定义和分布 课本p.131中的(7.1)式指出, 2的定义是互相独立的 多个正态差平方值的总和。即 因此,如果有k个随机变量yi (其中i=1,2,k), 并且各个 ,则它们的标准离差为 。 这时,就会有随机变量 服从自由度 df = k 的卡平方(2)分布。 如果所有yi都来自同一(平均数为,方差2为的)总体, 就有:第一节 卡平方分布的定义和分布 实践中,常常是未知的,因此用样本平均数 来代 替它计算,于是 2就变成为 如果所有yi都来自同一(平均数为,方差2为的)总体, 就有: 但是,这时的自由度变成为df=k-1。

4、2进一步变成第一节 卡平方分布的定义和分布 实践中,常常是未知的,因此用样本平均数 来代 替它计算,于是 2就变成为 但是,这时的自由度变成为df=k-1。 2进一步变成 对于属性资料,K.Pearson推导出一个统计量: 其中Oi为第i组的观察数,Ei为第i组的理论数,自由度 df 则由分组数 k 和它们之间的独立程度来决定。 本章中大多数统计假设测验都采用这些公式。尤其下面这条公式 应该牢牢记住。 注意:所有测验方法都是专门应用于计数资料的。不要将这些方法用来处理连续型随机变数资料!第二节 样本方差同质性测验 统计测验的基本方法和一般步骤 :2.利用试验数据计算一个统计量的值。再根据该样本

5、统 计量的抽样分布,计算出当H0为正确时出现这样一个 值的概率。对不同资料进行测验时,由于统计量及其 的分布不同,计算统计量和概率的公式有所不同。3.当此概率小于预先设定的水平,就根据“小概率事件 实际上不可能发生”原理拒绝H0,接受HA。该水平称 为显著水准(记为)。常用的为5%或1%。1.针对研究的问题提出一对统计假设。其中: * 认为试验的处理没有效应的假设称为无效假设 (H0 - null hypothesis); * 当H0不能被接受时所采纳的假设称为备择假设 (HA - alternative hypothesis)。第二节 样本方差同质性测验 一个样本方差与已知总体方差的统计测验

6、 若从一个总体抽取一个大小为n的样本,算得样本方差 为s2,想了解此总体方差 2是否与已知方差02间有显 著的差异。 两个样本方差是否来自同一总体方差的统计测验 多个样本方差是否来自同一总体方差的统计测验 若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。 若总共有k个样本,第i个样本的样本方差si2来自总体方 差i2。想了解这k个总体方差之间是否有显著差异。第二节 样本方差同质性测验2.利用试验数据计算一个统计量的值。3.根据“小概率事件实际上不可能发生”原理作判断。1.针对研究的问题提出一对统计假设。 两尾测验时 H0: 2 = 0

7、2 vs HA: 2 02 (大端)一尾测验时 H0: 2 02 vs HA: 2 02 (小端)一尾测验时 H0: 2 02 vs HA: 2 02 两尾测验时, 2 2/2或 2 21-/2有(1-)概率推翻H0; (大端)一尾测验时, 2 2 ,则有(1-)概率推翻H0; (小端)一尾测验时, 2 21- ,则有(1-)概率推翻H0。 计算统计量: 一个样本方差与已知总体方差的统计测验用df=n1查2分布表。 p.131 例7.1、例7.2。利用两尾测验的接受区域可以求得未知总体方差 2的置信区间: p.132例7.3。第二节 样本方差同质性测验2.利用试验数据计算一个统计量的值。3.根

8、据“小概率事件实际上不可能发生”原理作判断。1.针对研究的问题提出一对统计假设。 两尾测验时 H0: 12 = 22 vs HA: 12 22 (大端)一尾测验时 H0: 12 22 vs HA: 12 22 两尾测验时,F F/2或 F F1-/2有(1-)概率推翻H0; (大端)一尾测验时, F F ,则有(1-)概率推翻H0; 计算统计量:用df 1= n11, df 2= n21查 F 分布表。 两个样本方差是否来自同一总体方差的统计测验 若大小为n1的样本方差s12来自总体方差12,大小为n2的 样本方差 s22 来自总体方差 22,想了解这两个总体方差 12 之间是否有显著差异。p

9、.361的附表5的数值是专为(大端)一尾测验使用的。p.102例6.2。 H0: 12 22 vs HA: 12 22 F = 1.621/0.135=12.01, df 1=10-1=9, df 2=5-1=4 因为F = 12.01F0.05 = 6.00,拒绝H0,判断12 22 。两尾测验怎么办?用附表5只能用=0.1或=0.02做。p.102例6.2做两尾测验时, H0:1222 vs HA:1222 F = 1.621/0.135=12.01, df 1=10-1=9, df 2=5-1=4,因为F = 12.01F0.1/2 =F0.05 = 6.00,拒绝H0,判断12 22

10、。 按附表5的设计 F不会小于F0.9。第二节 样本方差同质性测验 计算统计量: 多个样本方差是否来自同一总体方差的统计测验 若总共有k个样本,第i个样本的样本方差si2来自总体方 差i2。想了解这k个总体方差之间是否有显著差异。 H0: 12 = 22 = = k2 vs HA: 并非都相等 其中:2.利用试验数据计算一个统计量的值。1.针对研究的问题提出一对统计假设。3.根据“小概率事件实际上不可能发生”原理作判断。3.如果, 2 2 ,则有(1-)概率推翻H0。用df=k1查2分布表。 p.133例7.4。isi2dfiSSi=dfisi2lnsi2dfi lnsi214.2416.81

11、.435085.7403226.0530.01.791768.9588033.11134.11.1314012.445402080.94.3582427.14452第三节 适合性测验 适合性测验是比较实际比率与理论比率之间是否有显 著差异的方法。 p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 这个问题实际上在第五章就解决了。我

12、们看看 当时是怎样解决的。第三节 适合性测验 p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 因为样本大小为n = 6919,样本中淀粉粒百分率为 ,理论百分率为p0 = 50% = 0.5。 按二项资料百分率测验方法可以解决这个问题。 两尾测验 H0: p = p0 = 0.5 vs HA: p p0 = 0.5 计算统计量

13、: 因为|u|= 0.54101.96,接受H0,认为实际比率为1:1。 现在看看用2测验如何解决这个问题。第三节 适合性测验 p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 先将数据列成上面的表。 测验假设 H0: 比率为1:1 vs HA:比率不是1:1 计算:碘反映观察数(O)理论数(E)变蓝34373459.5不变蓝3

14、4823459.5共计69196919 因为 2 = 0.2927 = 3.84,接受H0,认为实际比 率与理论比率1:1相符。 注意这里 2 的自由度为1。因为自由度= 分组数-限制条件数第三节 适合性测验 p.135例7.5 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 先将数据列成上面的表。 测验假设 H0: 比率为1:1 vs HA:比

15、率不是1:1 计算:碘反映观察数(O)理论数(E)变蓝34373459.5不变蓝34823459.5共计69196919 因为 2 = 0.2927 = 3.84,接受H0,认为实际比 率与理论比率1:1相符。 本章开头就指出,正态离差 u 的平方就等于2 。以本例为例,可以验证两种测验的本质是一样的。 u 测验中: 2 测验中:可以验证: 0.54102=0.2927。 甚至从它们的计算公式也 可以证明。碘反映观察数(O)理论数(E)变蓝3437(x)3459.5(n/2)不变蓝3482(n-x)3459.5(n/2)共计6919(n)6919(n) u 测验中: 2 测验中:第三节 适合性

16、测验 p.55例4.2 玉米花粉粒中形成淀粉粒或糊精是由一对 等位基因控制的性状。淀粉粒加碘将变蓝色,而糊精 加碘则不会变蓝。如果等位基因的复制是等量的,并 且在配子中分配是随机的,F1代中的两种花粉粒的数目 应该是1:1的。现调查了6919粒花粉,发现有3437粒会 变蓝。问实际比率与理论比率1:1之间是否有显著差异。 甚至从它们的计算公式也 可以证明。碘反映观察数(O)理论数(E)变蓝3437(x)3459.5(n/2)不变蓝3482(n-x)3459.5(n/2)共计6919(n)6919(n) u 测验中: 2 测验中: 再看它们 的连续性 矫正公式。 u 测验: 本例中: 未矫正前

17、u=0.5410。 未矫正前 u=0.2927。 可以验证: 0.54102=0.2927 p.135例7.5是一个 理论比率为3:1 (即p0 = 0.75)的例子。 u测验中,当n30,np5时,需要进行连续型矫正。 2 测验中,当自由度为1时,需要进行连续型矫正。第三节 适合性测验你会说,既然是一样的,何必讲两种,前面讲过一种,后面就不要讲这种啦!不尽然!2测验不但可以测验两种结果的比率,还可以测验多种结果的比率。对于这种情况,u 测验就无能为力了! p.136例7.6是一个理论比率9:3:3:1的例子。 注意它的自由度。 p.144习题7.4是一个 理论比率9:3:4的例子。 注意它的

18、自由度。利用适合性测验还可以检查一组试验数据是否符合某种理论分布。看p.137例7.7和p.58例4.4。注意:自由度=组数-限制条件数。第三节 适合性测验于是你又会说,早知道后一种方法更好些,前面那种就不要讲了!这回你说对了,有些书就只讲后一种而不讲前一种的。只是我要你们两种都掌握,不是更好些吗!第四节 独立性测验 独立性测验是检查两个(对计数指标有)影响(的)因素 是否相互独立(或有关)的方法。 例如,“小麦种子是否经过灭菌处理”与“长出的麦穗是 否发病”这两件事情是否有关。所以它的统计假设为: H0:两个因素相互独立 vs HA:两个因素相互有关根据各因素的水平数多少分为: 22 相依表

19、的独立性测验 2C 相依表的独立性测验 RC 相依表的独立性测验第四节 独立性测验 22 相依表的独立性测验 p.139例7.8 调查经过灭菌处理与未经过灭菌处理的两 类小麦种子长出的麦穗发生小麦散黑穗病的株数,得 下表,试分析种子灭菌与否和植株是否发病有无关系。用于处理有两行两列的计数资料,即两个因素各自可分为两种水平时的情况。发病穗数无病穗数合计种子经灭菌265076种子未灭菌184200384合计210250460 这个问题实际上在第五章就解决了。我们看看 当时是怎样解决的。第四节 独立性测验 用两个样本百分数相比较的假设测验就可以解决发病穗数无病穗数合计种子经灭菌265076种子未灭菌

20、184200384合计210250460H0: p1 = p2 vs HA: p1 p2 经灭菌的种子调查了76株,发病26株, ; 未经灭菌的种子调查了384株,发病184株, ; 混合样本共460株,发病210株, 。两种种子发病率大不相同。 再看看用2 测验如何做第四节 独立性测验H0: 灭菌与否和发病无关 vs HA:发病与灭菌与否有关发病穗数无病穗数合计种子经灭菌265076种子未灭菌184200384合计210250460 如果H0正确,灭不灭菌的发病率都应该等于210/460。经 灭菌的种子调查了76株,理论上应有76(210/460) = 34.7 株发病,统计推断:种子灭菌与

21、否和发病不发病有显著关系。26(34.7)50(41.3)184(175.3)200(208.7)76-34.7=41.3株无病;未经灭菌的调查了384株,理论上有384(210/460) =175. 3株发病,384-175.3株无病。 可以验证: 2.19172=4.9036 可以验证: 1.962=3.84 注意2的自由度df =1 比较两种测 验的结果。 再看连续性 矫正公式。 可以验证: 2.06572=4.2671第四节 独立性测验 2C 相依表的独立性测验 p.140例7.9 根据野生大豆193份和栽培大豆223份的某 同工酶电泳分析结果,将两类大豆各分为三种基因型, 数据资料如

22、下表所示,试问该同工酶的基因型与大豆 物种类型之间是否有显著关系。用于处理有两行多列的计数资料,即两个因素各自可分为多种水平或多个因素各自分为两个水平时的情况。 这个问题只能用 2测验,用u测验 就比较困难。物种等位基因型总计123野生大豆296896193栽培大豆221992223总计5126798416第四节 独立性测验物种等位基因型总计123野生大豆296896193栽培大豆221992223总计5126798416H0: 物种与基因型无关 vs HA: 物种与基因型有关 如果H0正确,野生大豆与栽培大豆的基因型1频率都应该 等于51/416。野生种调查193份,理论上应有193(51/

23、416) =23.66份基因型1,29(23.66) 栽培种调查223份,应有223(51/416) =27.34份基因型1;22(27.34) 如果H0正确,两物种的基因型2频率都应该等于267/416。野生种调查193份,有193(267/416)=123.87份基因型2,68(123.87) 其它各个理论数也可以类似地算出。199(143.13)96(45.47)2(52.53)算出各个理论值后,就可以计算 2值了。注意:2 分布的自由度=(2-1)(C-1)=2。查得20.05=5.99。 统计推断:大豆物种的两种类型与该同工酶的等位基因 型之间有显著的联系。 当自由度1时,进行2测验无需要 做连续型矫正。第四节 独立性测验 RC 相依表的独立性测验 p.141例7.10 不同灌溉方式下水稻叶片衰老情况的调 查资料如下表。试问测验水稻叶片的衰老情况与灌溉 方式是否有关。用于处理有多行多列的计数资料,即多个因素各自可分为多种水平时的情况。 用前面所介绍的方法计算出各个实际观察值 所对应的理论值。灌溉方式绿叶株数黄叶株数枯叶株数总计深水14677160浅水183813205湿润1521416182总计4813036547灌溉方式绿叶株数黄叶株数枯叶株数总计深水146(140.69)7(8.78)7(1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论