第四章 显著性检验.ppt_第1页
第四章 显著性检验.ppt_第2页
第四章 显著性检验.ppt_第3页
第四章 显著性检验.ppt_第4页
第四章 显著性检验.ppt_第5页
已阅读5页,还剩102页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、总体,总体,样本,样本,样本,样本,样本,抽样 分布,统计 推断,图 抽样分布与统计推断的关系,第四章 显著性检验,统计推断,假设检验,参数估计,显著性检验,点估计,区间估计,t, u, F,2检验,第一节 显著性检验基本原理 第二节 单个样本平均数的显著性检验 第三节 两个样本平均数差异的显著性检验 第四节 百分数资料的显著性检验 率五节 参数的区间估计,本章主要内容及难点,1.首先介绍显著性检验的基本原理和步骤; 2.其次介绍显著水平、两类错误、一尾检验、两尾检验的概念; 3.单个样本平均数的t检验 4.配对资料t检验,非配对资料t检验 5.百分数资料的u检验 难点:显著性检验基本原理理解

2、,t检验、u检验的使用条件。,第一节 显著性检验的基本原理,一、显著性检验的意义,显著性检验的意义在于:区分样本统计数与所在总体参数的差异是由试验误差引起,还是二者本质不同。,例如,大豆籽粒蛋白质含量高于45%(记为0)的品种为高蛋白品种。某种子公司对一大豆新品种随机抽取5个样品进行测定,得平均蛋白质含量为 , 。我们能否根据1.5%就认定该大豆新品种就是高蛋白品种? 不一定。,真实差异,表面差异,虽然真实差异( 0)不能计算,但表面差异( 0)可以计算,试验误差也可以用数理统计方法估计。所以可将表面差异与试验误差比较间接推断真实差异是否存在。 如果( 0)=0,我们就说真实差异不存在; 如果

3、( 0)0,我们就说真实差异存在。这就是显著性检验的基本思想。,又如,某地做了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为 =510/666.7、 =500/666.7。 =10/666.7。仅凭这个表面差值我们照样不能判断两个水稻品种生产潜力本质上不同。,于是,表面差异,真实差异,试验误差,同样真实差异( 12)不能计算,但表面差异( )可以计算,试验误差也可以用数理统计方法估计。所以可将表面差异与试验误差比较间接推断真实差异是否存在。 如果( 12)=0,我们就说真实差异不存在; 如果( 12)0,我们就说真实差异存在。,统计假设测验的意

4、义用简式表示为 ( 0) 00? 由 推断 ( ) 120?,二、显著性检验的步骤,【例41】已知某品种玉米单穗重xN(300,9.52),即单穗重总体平均数300g,标准差9.5g。种植过程喷洒了增产素,随机抽取9个果穗,测得平均单穗重308g,问这种增产素对该品种玉米的平均单穗重有无真实影响?,(一)提出假设 对样本所在总体作一个假设。假设喷洒增产素的玉米单穗重总体平均数与原玉米单穗重总体平均数0之间没有真实差异,记为H0: 或 。也就是假设表面差异( )全由抽样误差造成。这个假设叫无效假设(null hypothesis)。,与此对应的还有一个备择假设(alternative hypot

5、hesis)。备择假设是在无效假设被否定时,准备接受的假设,记为 HA: 或 。 具体到这个例子,备择假设意味着喷洒增产素的玉米单穗重总体平均数与原来的玉米单穗重总体平均数0之间存在真实差异。,(二)计算概率 在无效假设成立前提下,根据所检验的统计数的抽样分布规律,计算表面差异( )全由抽样误差造成的概率有多大。也就是计算无效假设成立这个事件的概率有多大。,本例是在无效假设H0: 成立的前提下,研究从N(300,9.52)总体中以n=9抽样所得样本平均数 的分布。由抽样分布结论知:,本例,那么u =2.526的概率是多少?,因为 (u0.05=1.96)(u2.526)(u0.01=2.58)

6、,所以,这个u值的概率为:0.01p0.05,说明我们所作的无效假设H0: 成立的可能性在1%与5%之间,也即表面差异( )全由抽样误差造成的概率在0.010.05之间。,(三)统计推断 根据小概率原理作出否定或不能否定无效假设的推断。,若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件。 在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件,称为小概率事件实际不可能原理。,如果把0.05作为判定小概率事件的标准,那么本例所作的无效假设是一个小概率事件。它在一次抽样中实际不可能发生,因而否定H0:=0,接受HA:0,认为这个样本所在的总体与原总体存在真实差

7、异。即喷施增产素对这个玉米品种的平均单穗重有真实影响,它能使玉米的穗重增加。 这种利用u分布计算概率进行的假设检验称为u检验。,三、显著水平与两类错误,(一)显著水平(significant level) 用来判定小概率事件的概率标准叫显著水平,记作。 在生物学研究中常取=0.05、0.01。到底选用哪种显著水平,要根据试验要求或试验结论的重要性而定。,对u检验,若u1.96,说明试验的表面差异属于试验误差的概率 p0.05,即表面差异属于试验误差的可能性大。统计学上把这一检验结果表述为:“总体平均数与0差异不显著”;,若1.96|u|2.58,则说明试验的表面差异属于试验误差的概率p在0.0

8、10.05之间,即0.01p0.05,表面差异属于试验误差的可能性较小。统计学上把这一检验结果表述为:“总体平均数与0差异显著”,u值右上方标记 *;,若|u|2.58,则说明试验的表面差异属于试验误差的概率p不超过 0.01 ,即p 0.01,表面差异属于试验误差的可能性更小。统计上把这一检验结果表述为:“总体平均数与0差异极显著”,U值右上方标记*。,假设检验的几何意义:,否定区域,(二)两类错误 显著性检验可能出现两种类型的错误: 型错误又称为错误,本来无效假设H0正确,但检验结果却否定H0。就是把试验误差当成真实差异。 犯型错误的原因是根据小概率原理否定无效假设造成的。,例如140行水

9、稻产量一例,假如把它们当成一个有限总体,且服从正态分布。每个观察值是一个样本,则距平均数1.96范围内观察值占95%,大于这个范围以外,占5%,处在正态分布的两尾。如果从这个总体抽样,抽到范围外的观察值几率较小,只有5%,但它仍是这个总体的样本。现在我们根据小概率原理否定了它是这个总体的样本,犯的这个错误叫型错误,概率不超过5%。,又如我们在做新品种与原品种的比较试验中,无效假设是新品种不增产,备择假设是新品种增产。=0.05,通过样本信息和在无效假设前提下,计算的概率小于0.05,则否定无效假设,如果概率为10%,则不能否定无效假设,但是新品种不增产的概率也只有10%,增产的可能性为90%,

10、实际应用中,人们把没有充分理由否定的无效假设认可为接受,那么接受这个无效假设就有可能犯型错误,犯型错误的概率在本例为10%。,型错误又称错误,本来无效假设H0是错误的,但检验结果却接受H0。就是把真实差异当成试验误差。 犯型错误,一般是随着 的减小或试验误差的增大而增大。犯型错误的原因是原假设下的抽样分布与真实分布发生部分重叠。,为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数n来考虑。,四、两尾检验与一尾检验,两尾检验:对应于无效假设H0: 的备择假设为HA: 。 在水平上的否定域为 和 ,对称地分配在u分布曲线的两侧尾部 ,每侧尾部的概率为/2。u为水平两尾检验的临界u

11、值。 两尾检验的目的在于判断与0有无显著差异,而不考虑与0谁大谁小。这种利用两尾概率进行的假设检验称两尾检验。,接受区域 95%,图4.1 =0.05时 HA: 0的HA接受区和否定区,一尾检验:对应于无效假设H0:0的备择假设为HA:0(或HA:0)。这时否定域位于u分布曲线的右尾(或左尾),即 或 )。 例如 ,当 = 0.05 时 , 否定域为 (或 ),u为一尾检验的临界u值。这种利用一尾概率进行的假设检验称一尾检验。,图a =0.05, H0: =0 ;HA:0,图b =0.05, H0: =0 ;HA:0,五、显著性检验应注意的问题,1、 要有合理的试验设计和准确的试验操作,避免系

12、统误差、降低试验误差,提高试验的准确性和精确性。,2、 选用的显著性检验方法要符合其应用条件。,3、 选用合理的统计假设。,4、 正确理解显著性检验结论的统计意义。,5、统计分析结论的应用,还要与经济效益 等结合起来综合考虑。,第二节 样本平均数与总体平均数 差异显著性检验,一、总体方差2已知或2虽未知但 样本容量n相当大,用u检验法。,【例42】 糯玉米良种苏玉糯1号的鲜果穗重xN(216.5,45.22)。现引进一高产品种奥玉特1号,在8个小区种植,得其鲜果穗重为:255.0185.0252.0290.0159.9 190.0212.7 278.5(g),问新引入品种鲜果穗重与苏玉糯1号有

13、无显著差异?,1、提出假设 H0:0 216.5g,即新引入品种鲜果穗重与苏玉糯1号鲜果穗重相同; HA: 216.5g,即新引入品种鲜果穗重与苏玉糯1号鲜果穗重不相同。,2、计算u值,3、统计推断 由于计算所得的uu0.05=1.96,故p 0.05。不能否定H0:=0=216.5g,表明新引入品种鲜果穗重与苏玉糯1号鲜果穗重差异不显著,可以认为新引入品种鲜果穗重与苏玉糯1号鲜果穗重相同。,【例43】 晚稻良种汕优63的千粒重027.5g。现育成一高产品种协优辐819,在9个小区种植,得千粒重为:32.5、28.6、28.4、24.7、29.1、27.2、29.8、33.3、29.7(g),

14、试问新育成品种的千粒重与汕优63有无显著差异?,二、总体方差2为未知、且为小样本 (n 30),用t检验法,本例,由于总体方差未知,又是小样本,故采用t检验法。其步骤如下: 1、提出假设 H0:027.5g,即新育成品种千粒重与当地良种汕优63的千粒重相同。 HA:27.5g,即新育成品种千粒重与当地良种汕优63的千粒重不相同。,2、计算t值,3、统计推断 由df=8查临界t值,得:t0.05(8)=2.306,计算所得的|t|t0.05(8),故p0.05 ,不能否定H0:27.5g,表明新育成品种千粒重与当地良种汕优63的千粒重差异不显著,可以认为新育成品种千粒重与当地良种汕优63的千粒重

15、相同。,第三节 两个样本平均数差异显著性检验,一、非配对设计两个样本平均数 差异显著性检验,非配对设计是将试验单位完全随机地分为两组,然后再随机地对两组分别实施两种不同处理;两组试验单位相互独立,所得观测值相互独立;两个处理的样本容量可以相等,也可以不相等,所得数据称为非配对数据(也称成组数据)。,(一)两个样本的总体方差12和22已知或总体方差12和22未知,但为大样本时,用u检验法。,u值的计算公式为:,均数差数标准误计算公式为:,【例44】 已知优质早稻佳辐占小区产量的21.35。现用A、B两种方法抽样,A法取15(n1)个样点,得小区产量 7.69kg;B法取9(n2)个样点,得小区产

16、量 8.77kg。问A、B两种取样方法的小区产量差异是否显著?,1、提出假设 H0:12; 即A、B两种取样法的小 区产量相同; HA:12; 即A、B两种取样法的小 区产量不相同。 显著水平为0.05。,2、计算u值 已知 ,n115,n29,3、统计推断 因为计算所得的|u|介于u0.05=1.96与u0.01=2.58之间,故0.01p0.05 ,否定H0:1=2,接受 HA:12 ,即A、B 两种取样方法所得的小区产量差异显著。,(二)在两个样本的总体方差12和22未知、但 ,且为小样本时,用t 检验法。,又在H0:1=2前提下,意味着两样本来自同一总体,因而可将样本合并,计算样本合并

17、均方估计总体方差。且统计学已证明,合并均方是总体方差的无偏估计。,【例45】 测得马铃薯两个品种鲁引1号和大西洋的块茎干物质含量 (%)结果如下表所示。试检验两个品种的块茎干物质含量有无显著差异。,1、提出假设 H0:12,即两个马铃薯品种的块茎干物质含量相同; HA:12,即两个马铃薯品种的块茎干物质含量不相同。,2、计算t值 本例,3、统计推断 根据df9,查附表3得:t0.05(9)=2.262,因为计算得的|t|1.926t0.05(9)=2.262,故p 0.05,不能否定H0:12,表明两个马铃薯品种的块茎干物质含量差异不显著,可以认为两个马铃薯品种的块茎干物质含量相同。,(三)两

18、个样本的总体方差12 和22为未知, ,且两个样本又为小样本时,用近似t 检验法。,t的自由度为有效自由度 df,其计算公式为,【例46】 测定糯玉米品种江南花糯的出籽率(%)8次(n1=8),得 68.06, 123.74; 测定扬 农01 的出籽率(%)6次(n2=6),得 62.88, 46.67。试检验这两个糯玉米品种出籽率差异是否显著。,1、提出假设 H0:12,即两个糯玉米品种出籽率相同; HA:12,即两个糯玉米品种出籽率不相同。,2、计算t值,3、统计推断 根据df10查附表3得:t0.05(10) =2.228, 因计算得的 |t|2.228,故p0.05,不能否定H0:12

19、,表明两个糯玉米品种出籽率差异不显著,可以认为两个糯玉米品种出籽率相同。,二、配对设计两样本平均数差异显著性检验 当试验单元间差异较大,用完全随机设计将会增大试验误差,降低试验结果的准确性。为此可按局部控制的原理,把条件一致的两个供试单元配成一对,并设多个配对,再对每一配对两个单元随机独立实施一处理,这就是配对试验,实为处理数为2的随机区组试验,这样得到的数据称为配对数据。,(x11, x21),( x12 , x22 ),( x13 , x23 ),( x14 , x24 ),1=2?可由di= x1i- x2i消除不同配对间试验单元的差异。 因此可通过各配对差数的平均数来推断d =0或某一

20、常数?,遵从df=n-1的t分布。,例5.6 选较一致的两株番茄配成一对,共7对,每对中一株接种A处理病毒、另一株接种B处理病毒,以叶面枯斑数作为致病力强弱的指标。试分析这两种处理病毒方法的差异显著性。,1、 提出假设 H0:d120,即两种钝化病毒方式病斑数相同; HA:d120 ,即两种钝化病毒方式病斑数本质不相同;,2、计算t值,t值公式,差数标准误公式,dfn1,3、推断,第四节 百分率资料的显著性检验,二项变量 X(次数), 百分率 (成数、频率), 如 发芽率、死虫率、座果率等。,一、样本百分率与总体百分率差异显著性检验,由 推断,当满足 n 足够大,p 不过小,np 和nq 均大

21、于5的条件时,可近似地采用u 检验法,【例48】 用糯玉米和非糯玉米杂交,预期 F1 植 株 上糯性花粉粒的百分率为P0=0.50。现检视150粒花粉,得糯性花粉68粒,其百分率 =0.453,问此结果和理论百分率P0=0.50是否相符?,1、统计假设 H0:PP0,即糯性花粉粒样本百分率 =0.453所在的总体百分率P与理论百分率P0=0.50相同; HA:PP0=0.50,即糯性花粉粒样本百分率 =0.453所在的总体百分率P与理论百分率P0=0.50不相同。,2、计算u 值,本例,3、统计推断 计算所得的 |u|u0.05 = 1.96,故 p0.05,不能否定H0:P=P0,表明糯性花

22、粉样本百分率 0.453和P0=0.5差异不显著,可以认为糯性花粉粒样本百分率 =0.453所在的总体百分率P与理论百分率P0=0.50相同。,二、两个样本百分率差异显著性检验,由 推断 当两样本的np、nq均大于5时,可以采用正态近似法,即用u 检验法进行检验。,【例49】 调 查 春 大豆品种A的120(n1)个豆荚,其中有瘪荚38(x1)荚,瘪荚率31.7%( );调查春大豆品种B的135(n2)个豆荚,其中有瘪荚52(x2)荚,瘪荚率38.5%( )。试检验这两个品种的瘪荚率差异是否显著?,1、统计假设 H0:P1P2,即两个品种的总体瘪荚率相同; HA:P1P2,即两个品种的总体瘪荚

23、率不相同。,2、计算u 值,本例,3、统计推断 由于计算所得的(|u|=1.133)0.05,不能否定H0:P1=P2,表明两个品种的瘪荚率差异不显著,可以认为两个品种的瘪荚率相同。,三、百分率资料显著性检验的连续性矫正,(一) 样本百分率与总体百分率差异显著性检验的连续性矫正 如果np和nq小于或等于30,还须对u 进行连续性矫正。将连续性矫正后计算的值记为uc,uc的计算公式为:,(二) 两个样本百分率差异显著性检验的连续性矫正,如果两样本的np和nq均小于或等于30,也须对u进行连续性矫正。uc值的计算公式为:,第五节 参数的区间估计,点估计 区间估计:指在一定概率保证下,结合抽样误差估计出参数可能出现的一个范围。这个范围叫置信区间,给出的概率保证称置信度。,一、正态总体平均数的置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论