生物统计学教案5_第1页
生物统计学教案5_第2页
生物统计学教案5_第3页
生物统计学教案5_第4页
生物统计学教案5_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计学教案第五章 统计推断教学时间:5学时教学方法:课堂板书讲授教学目的:重点掌握两个样本的差异显著性检验,掌握一个样本的差异显著性检验,了解二项分布的显著性检验。讲授难点:一个、两个样本的差异显著性检验统计假设检验:首先对总体参数提出一个假设,通过样本数据推断这个假设是否可以接受,如果可以接受,样本很可能抽自这个总体,否则拒绝该假设,样本抽自另外总体。参数估计:通过样本统计量估计总体参数。5.1 单个样本的统计假设检验5.1.1 一般原理及两种类型的错误例: 已知动物体重服从正态分布N(,2),实验要求动物体重10.00g。已知总体标准差0.40g,总体平均数未知,为了得出对总体平均数的

2、推断,以便决定是否接受这批动物,随机抽取含量为n的样本,通过样本平均数,推断。1、假设: H0: =0 或 H0: 00 HA: >0 <0 0 三种情况中的一种。本例的010.00g,因此 H0: =10.00 HA: >10.00 或 <10.00或 10.002、小概率原理 小概率的事件,在一次试验中几乎是不会发生的,若根据一定的假设条件计算出来该事件发生的概率很小,而在一次试验中,它竟然发生了,则可以认为假设的条件不正确,从而拒绝假设。从动物群体中抽出含量为n的样本,计算样本平均数,假设该样本是从N(10.00,0.402)中抽取的,标准化的样本平均数服从N(0

3、,1)分布,可以从正态分布表中查出样本抽自平均数为的总体的概率,即P(U>u), P(U<u), 以及P(|U|>u)的概率。如果得到的值很小,则抽自平均数为0的总体的事件是一个小概率事件,它在一次试验中几乎是不会发生的,但实际上它发生了,说明假设的条件不正确,从而拒绝零假设,接受备择假设。显著性检验:根据小概率原理建立起来的检验方法。显著性水平:拒绝零假设时的概率值,记为。通常采用0.05和0.01两个水平,当P < 0.05时称为差异显著,P < 0.01时称为差异极显著。3、临界值例 从上述动物群体中抽出含量n10的样本,计算出10.23g,并已知该批动物的

4、总体平均数绝不会小于10.00g,规定的显著水平0.05。根据以上条件进行统计推断。H0: =10.00 HA: >10.00 根据备择假设,为了得到落在上侧尾区的概率P(U > u),将标准化,求出u值。P(U >1.82)0.03438,P < 0.05,拒绝H0,接受 HA。在实际应用中,并不直接求出概率值,而是建立在水平上H0的拒绝域。从正态分布上侧临界值表中查出P(U > u)= 时的u值,U > u的区域称为在水平上的H0拒绝域,而U < u的区域称为接受域。接受域的端点一般称为临界值。本例的u1.82,从附表3可以查出u0.05=1.64

5、5, u > u,落在拒绝域内,拒绝H0而接受HA。4、单侧检验和双侧检验上尾单侧检验:上例中的HA:>0,相应的拒绝域为U > u。对应于HA:>0时的检验称为上尾单侧检验。下尾单侧检验:对应于HA:<0时的检验称为下尾单侧检验。其拒绝域为U <u。双侧检验:对应于HA:0时的检验称为双侧检验。双侧检验的拒绝域为|U| >u/2 。5、单侧检验和双侧检验的效率:在样本含量和显著水平相同的情况下,单侧检验的效率高于双侧检验。这是因为在做单侧检验利用了已知有一侧是不可能这一条件,从而提高了它的辨别力。所以,在可能的条件下尽量做单侧检验。例 上例已经计算出

6、u =1.82,上尾单侧检验的临界值u9,0.051.645,u > u,结论是拒绝零假设。在做双侧检验时u仍然等于1.82,双侧检验的临界值为u9, 0.05/2 =1.96, |u|<u0.025, 不能拒绝零假设。6、两种类型的错误(1)I型错误,犯I型错误的概率记为 P(I型错误)P(拒绝H0|H0是正确的,0)(2)II型错误,犯II型错误的概率记为 1P(II型错误)P(接受H0|H0是错误的,1) 例 继续上例,抽出n10的样本,10.20g,检验假设 H0:10.00g HA: >10.00g标准化的样本平均数临界值u0.05 =1.645,u < u0

7、.05, P > 0.05。结论是不能拒绝H0。以样本平均数表示的临界值,可由下式得出在下图中的位置已用竖线标出。犯I型错误的概率,由竖线右侧010.00曲线下面积给出。犯II型错误的概率由竖线左侧110.30曲线下面积给出。犯II型错误的概率10.300.2327。从上图中可以看出(1)当1越接近0时,犯II型错误的概率越大。(2)降低犯I型错误的概率,必然增加犯II型错误的概率。(3)为了同时降低犯两种错误的概率,必须增加样本含量。7、关于两个概念的说明:(1)当P <时,所得结论的正确表述应为:由样本平均数推断出的总体平均数与0之间的差异有统计学意义。即它们属于两个不同总体。

8、习惯上称为“差异是显著的”。(2)接受H0的更严密的说法应是:尚无足够理由拒绝H0。但习惯上采用接受H0和拒绝H0这种表达方法。5.1.2 单个样本显著性检验的程序 (略)5.1.3 在已知的情况下,单个平均数的显著性检验u检验 检验程序如下:1、假设从已知的正态或近似正态总体中抽出含量为n的样本。2、零假设 H0: 0备择假设 HA: > 0 < 0 03、显著性水平 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量5、相应于2中各备择假设之H0的拒绝域 u > u u <u |u| > u/26、得出结论并给予解释例

9、已知豌豆籽粒重量服从正态分布N(377.2,3.32)在改善栽培条件后,随机抽取9粒,其籽粒平均重为379.2,若标准差仍为3.3,问改善栽培条件是否显著提高了豌豆籽粒重量?解 已知 假设: H0: 377.2 HA: > 377.2 显著性水平: 0.05 已知,使用u检验 H0的拒绝域:因HA: >0,故为上尾检验,当u >u0.05时拒绝H0 。u0.05=1.645。 结论: u > u0.05 , 即P < 0.05, 所以拒绝零假设。栽培条件的改善,显著地提高了豌豆籽粒重量。5.1.4 未知时平均数的显著性检验t检验检验程序如下:1、假设从未知的正态或

10、近似正态总体中抽出含量为n的样本。2、零假设: H0: 0 备择假设: HA: > 0 < 0 03、显著性水平: 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量: 当未知时以s代替之,标准化的变量称为t,服 从n1自由度的t分布。t分布的临界值可从附表4中查出。5、相应于2中各备择假设之H0的拒绝域: t > t t <t |t| > t/26、得出结论并给予解释。例 已知玉米单交种群单105的平均穗重0300g。喷洒植物生长促进剂后,随机抽取9个果穗,其穗重为:308、305、311、298、315、300、321、

11、294、320g。问喷药后与喷药前的果穗重差异是否显著?解 未知 假设: H0: 300 HA: 300激素类药物需有适当的浓度,浓度适合时促进生长,浓度过高时反而抑制生长,在这里喷药的效果是未知的,并非仅能促进生长,需采用双侧检验 显著性水平: 0.05 未知应使用t检验,已计算出308,s9.62 H0的拒绝域:因HA:0,故为双侧检验,当|t|>t0.025时拒绝H0 。t0.025=2.306。 结论:因|t|>t0.025 , 即P < 0.05,所以拒绝零假设。喷药前后果穗重的差异是显著的。 若规定0.01,t0.01/2=3.355,t < t0.005,

12、因此喷药前后果穗重的差异尚未达到“极显著”。5.1.5 变异性的显著性检验2检验2检验的基本程序如下:1、假设从正态总体中随机抽取含量为n的样本,计算出样本s2。2、零假设: H0: 0 备择假设: HA: > 0 < 0 03、显著性水平: 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量: 统计量2服从n 1自由度的2分布。5、相应于2中各备择假设之H0的拒绝域: 2 >2 2 <21 2 <21-/2 和 2 >2/26、得出结论并给予解释。例 一个混杂的小麦品种,株高标准差014cm,经提纯后随机抽出10株,

13、它们的株高为:90、105、101、95、100、100、101、105、93、97cm,考查提纯后的群体是否比原群体整齐?解 未知,对未知总体的方差做检验 假设: H0: 14cm0 HA: < 0 小麦经提纯后株高只能变得更整齐,因而使用下侧检验。 显著性水平: 在0.01水平上做检验 检验统计量: 相应于备择假设HA: < 0之H0的拒绝域为2 <21,从附表 6中可以查出20.992.09 结论:因2 < 20.99,即P < 0.01,所以拒绝H0。结论是植株经提纯后变得非常整齐。5.2 两个样本的差异显著性检验 问题的提出(P78)5.2.1 两个方差

14、的检验F检验F检验的基本程序如下:1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2 的两个随机样本,分别计算出s12和s22。与总体平均数i无关。2、零假设: H0: 12 备择假设: HA: 1 > 2 1 < 2 1 23、显著性水平: 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量: 在抽样分布一章中已经给出F的定义 在零假设12下,统计量F变为5、相应于2中各备择假设之H0的拒绝域: 相应于HA:1 > 2,应做上尾单侧检验,当F>F时拒绝H0。 相应于HA:1 < 2,应做下尾单侧检验,当F<

15、;F1-时拒绝H0,F的下侧临界值F1由下式给出:一种变通的办法是把s2中较大者称为s12,这时只会用上侧检验,处理起来更方便些,对于结果无影响。 相应于HA:1 2,应做双侧检验,当F>F/2和F<F1-/2时拒绝H0。6、得出结论并给予解释。 例 测定了20位青年男子和20位老年男子的血压值,问老年人血压值个体间的波动是否显著高于青年人?(数据略)P80 解1 人类血压值是服从正态分布的随机变量。 假设: H0: 1 = 2 HA: 1 < 2 老年人的血压值在个体之间的波动,只会大于青年人,决不会小于青年人。 显著性水平:规定0.05 检验统计量:先计算出 s12 =

16、193.4, s22 = 937.7 建立H0的拒绝域:根据备择假设,应为下侧检验,当F<F0.95时拒绝零假设。下侧临界值 结论:F < F0.95,即P < 0.05。结论是拒绝H0,老年人血压值在个体之间的波动大于年青人。解2 若以s2中较大者作为分子,备择假设则变为HA:2 >1,成为上尾检验,所用的检验统计量为:在查临界值时应注意,现在df2是分子,df1是分母。F0.05=2.18,F>F0.05, P < 0.05, 结论仍然是拒绝H0。5.2.2 标准差(i)已知时,两个平均数间差异显著性的检验检验程序如下:1、从1和2已知的正态或近似正态总

17、体中抽出含量分别为n1和n2 的样本。2、零假设 H0: 12 备择假设 HA: 1 > 2 1 < 2 1 23、显著性水平 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量在i已知时两平均数差的标准化变量在H0:12下,检验统计量为:上式的分母称为平均数差的标准误差,记为5、相应于2中各备择假设之H0的拒绝域 u > u u <u |u| > u/26、得出结论并给予解释例 调查两个不同渔场的马面鲀体长,每一渔场调查20条。平均体长分别为:=19.8cm,=18.5cm。127.2cm。问在0.05水平上,第一号渔场的

18、马面鲀是否显著高于第二号渔场的马面鲀体长? 解 马面鲀体长是服从正态分布的随机变量,1和2已知。 假设: H0: 12 HA: 1 > 2 显著性水平: 已规定为0.05 统计量的值: 建立H0的拒绝域:上尾单侧检验,当u > u0.05时拒绝H0。从表中查出u0.05 = 1.645. 结论:u < u0.05,即P > 0.05,尚不能拒绝H0,第一号渔场马面鲀体长并不比第二号的长。5.2.3 标准差(i)未知但相等时两平均数间差异显著性检验成组数据t检验 I. 方 差 齐 性 检 验: 使用双侧F检验。1、从两个正态或近似正态总体中,独立地抽取含量分别为n1和n2

19、 的两个随机样本,分别计算出s12和s22。2、零假设: H0: 12 备择假设: HA: 1 23、显著性水平: 0.054、检验统计量: 5、建立H0的拒绝域: 对于方差齐性应做双侧检验,当F>F/2和F<F1-/2时拒绝H0。6、得出结论判断方差是否相等。II. 平 均 数 差 异 显 著 性 检 验1、从1和2未知的正态或近似正态总体中抽出含量分别为n1和n2 的样本。2、零假设: H0: 12 备择假设: HA: 1 > 2 1 < 2 1 23、显著性水平: 在0.05水平上拒绝H0称为差异显著 在0.01水平上拒绝H0称为差异极显著4、检验统计量:在标准差

20、未知时,平均数差的标准化变量在抽样分布一章中已经给出。在H0:12下,检验统计量为:服从n11n21自由度的t分布。在n1 = n2 = n时,上式可简化为:在n1和n2都很大时,n11n1 , n21n2 , 上式又可简化为:5、相应于2中各备择假设之H0的拒绝域: t > t t <t |t| > t/26、得出结论并给予解释。例 两个小麦品种从播种到抽穗所需天数如下表,问两者所需的天数差异是否显著? 品种1 品种2 X1 X1X1100 X12 X2 X2=X2-100 X22 101 1 1 100 0 0 100 0 0 98 2 4 99 1 1 100 0 0

21、99 1 1 99 1 1 98 2 4 98 2 4 100 0 0 99 1 1 98 2 4 98 2 4 99 1 1 98 2 4 99 1 1 99 1 1 99 1 1 100 0 0 和 8 14 11 19 平均数 99.2 98.9 解 I. 方 差 齐 性 检 验: 使用双侧F检验。 小麦生长天数是服从正态分布的随机变量。 假设: H0: 12 HA: 1 2 显著性水平: 0.05 检验统计量: 建立H0的拒绝域: F9, 9, 0.0254.026, F9, 9, 0.9750.248 结论:F0.975 < F < F0.025 , 即P > 0.

22、05。方差具齐性。II. 平 均 数 差 异 显 著 性 检 验 小麦生长天数是服从正态分布的随机变量。 假设: H0: 12 HA: 1 2 显著性水平: 0.05 检验统计量: 建立H0的拒绝域: 本例为双侧检验,当 |t| > t/2时拒绝H0,从附表4中查出t18, 0.025=2.10。 结论:t < t0.025,即P > 0.05,接受H0。两个小麦品种从播种到抽穗所需天数差异不显著。例 两种激素类药物对肾组织切片氧消耗的影响,结果为:(1)n1 = 9, x1 = 27.92, s12 = 8.673;(2)n2 = 6, x2 = 25.11, s22 = 1.843。问两种药物对肾组织切片养消耗的影响差异是否显著?解 I. 方差齐性检验 H0:12 HA:12 0.05F < F0.025,即P > 0.05。可以接受12的假设。II. 平均数间差异显著性检验 H0:12 HA: 12 0.05t0.025 = 2.160, t > t0.025, 即P < 0.05。结论是:在0.05水平上,两种药物对肾组织切片氧消耗的影响刚刚达到显著。5.2.4 标准差(i)未知且可能不等时,两平均数间差异显著性检验(略)5.2.5 配对数据的显著性检验配对数据t检验 例 下表为不同

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论