第五章_差异显著性检验_第1页
第五章_差异显著性检验_第2页
第五章_差异显著性检验_第3页
第五章_差异显著性检验_第4页
第五章_差异显著性检验_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 差异显著性检验差异显著性检验 统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第五章第五章 差异显著性检验差异显著性检验一、统计推断的意义和内容一、统计推断的意义和内容统计推断(统计推断(statistical inference):就是根据统计量):就是根据统计量的分布和概率理论,由样本统计量来推断总体的参数。的分布和概率理论,由样本统计量来推断总体的参数。 统计推断统计推断假设检验(假设检验(hypothesis test)参数估计(参数估计(parametric estimate) 统计假设检验又称统计假设检验又称显著性检验显著性检验(sig

2、nificance test),它),它是根据某种实际需要,对未知的或不完全知道的总体参是根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本的实际结果和统计量的数提出一些假设,然后根据样本的实际结果和统计量的分布规律,通过一定的计算,作出在一定概率意义下应分布规律,通过一定的计算,作出在一定概率意义下应当接受哪种假设的方法。统计假设检验的假设是对总体当接受哪种假设的方法。统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种,即与要比较的提出的,由于最后检验的结论只有两种,即与要比较的总体参数间存在显著差异和不存在显著差异两种。总体参数间存在显著差异和不存在显著差

3、异两种。 参数估计包括两个方面:参数估计包括两个方面:一是参数的点估计(一是参数的点估计(point estimation) 直接用样本的统计量数值估计相应总体的参数;直接用样本的统计量数值估计相应总体的参数;二是参数的区间估计(二是参数的区间估计(interval estimation) 在一定的概率保证下(一般为在一定的概率保证下(一般为95%或或99%),),由样本统计量的分布,计算出总体参数可能出现的由样本统计量的分布,计算出总体参数可能出现的数值范围或区间,用该区间来估计总体参数所在位数值范围或区间,用该区间来估计总体参数所在位置。置。学学 习习 目目 标标了解假设检验的基本思想了解

4、假设检验的基本思想 掌握假设检验的步骤掌握假设检验的步骤能对实际问题作假设检验能对实际问题作假设检验利用置信区间进行假设检验利用置信区间进行假设检验利用利用P - 值进行假设检验值进行假设检验第一节第一节 假设检验的一般问题假设检验的一般问题假设检验的概念假设检验的概念假设检验的步骤假设检验的步骤假设检验中的小概率原理假设检验中的小概率原理假设检验中的两类错误假设检验中的两类错误双侧检验和单侧检验双侧检验和单侧检验什么是假设? 对总体参数的一种看法 总体参数包括总体均值总体均值、比例比例、方差方差等 分析之前之前必需叙述概念概念事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某

5、种假设然后利用样本信息来判断原假设是否成立然后利用样本信息来判断原假设是否成立类型类型参数假设检验参数假设检验非非参数假设检验参数假设检验特点特点采用逻辑上的反证法采用逻辑上的反证法依据统计上的小概率原理依据统计上的小概率原理假设检验的基本思想假设检验的基本思想m m = 50假设检验的过程假设检验的过程(提出假设(提出假设抽取样本抽取样本作出决策)作出决策)我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设! 别无选择别无选择.问题的提出问题的提出 例例 :某猪场称该场的猪在体重为:某猪场称该场的猪在体重为100kg时的平均背膘时的平均背膘厚度为厚度为9mm。 问题:

6、此说法是否正确?有问题:此说法是否正确?有4种可能性(假设)种可能性(假设) 1)正确:)正确: m m 9 2)不正确:)不正确: m m 9(| m m 9| 0) 3)不正确:不正确: m m 9三对假设:三对假设: m m 9 vs m m 9, m m 9 vs m m 9假设检验的基本原理假设检验的基本原理 如何回答如何回答 随机抽取一个样本随机抽取一个样本 计算该样本的平均数计算该样本的平均数 比较样本平均数与比较样本平均数与9mm 难题难题 存在抽样误差存在抽样误差 当样本平均数与当样本平均数与9mm之差达到多大时可否定之差达到多大时可否定m m 9假设检验的基本原理假设检验的

7、基本原理 解决的思路解决的思路 针对要回答的问题提出一对对立的假设,并对其中的针对要回答的问题提出一对对立的假设,并对其中的一个进行检验一个进行检验 找到一个样本统计量,它与提出的假设有关,其抽样找到一个样本统计量,它与提出的假设有关,其抽样分布已知分布已知 根据这个统计量观察值出现的概率,利用小概率事件根据这个统计量观察值出现的概率,利用小概率事件原理对假设是否成立做出推断原理对假设是否成立做出推断这个过程称为假设检验这个过程称为假设检验 (hypothesis testing)提出无效假设和备择假设提出无效假设和备择假设 什么是无效假设?什么是无效假设?(Null Hypothesis)

8、1. 待检验的假设,又称待检验的假设,又称“0假设假设” 2. 如果错误地作出决策会导致一系列后果如果错误地作出决策会导致一系列后果 3. 总是有等号总是有等号 , 或 4. 表示为表示为 H0H0: m 某一数值某一数值 指定为指定为 = 号,即号,即 或 例如例如, H0: m 3190(克) 什么是备择假设?什么是备择假设?(Alternative Hypothesis) 1. 与原假设对立的假设 2. 总是有不等号: , 或 3. 表示为 H1H1:m 某一数值,或m 某一数值例如, H1:m 3910(克),或m 3910(克) 什么检验统计量?什么检验统计量?1.用于假设检验问题的

9、统计量用于假设检验问题的统计量2.选择统计量的方法与参数估计相同,需考虑选择统计量的方法与参数估计相同,需考虑是大样本还是小样本是大样本还是小样本总体方差已知还是未知总体方差已知还是未知检验统计量的基本形式为检验统计量的基本形式为nxzm0规定显著性水平规定显著性水平 什么显著性水平?什么显著性水平? 1. 是一个概率值是一个概率值 2. 无效假设为真时,拒绝无效假设的概率无效假设为真时,拒绝无效假设的概率 被称为抽样分布的拒绝域被称为抽样分布的拒绝域 3. 表示为表示为 (alpha) 常用的常用的 值有值有0.01, 0.05, 0.10 4. 由研究者事先确定由研究者事先确定作出统计决策

10、作出统计决策计算检验的统计量计算检验的统计量根据给定的显著性水平根据给定的显著性水平 ,查表得出相应,查表得出相应的临界值的临界值t 或或t /2 /2将检验统计量的值与将检验统计量的值与 水平的临界值进水平的临界值进行比较行比较得出接受或拒绝原假设的结论得出接受或拒绝原假设的结论假设检验中的小概率原理假设检验中的小概率原理 什么小概率?什么小概率? 1. 在一次试验中,一个几乎不可能发生在一次试验中,一个几乎不可能发生的事件发生的概率的事件发生的概率 2. 在一次试验中小概率事件一旦发生,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设我们就有理由拒绝原假设 3. 小概率由研究者事先确

11、定小概率由研究者事先确定某猪场某猪场10头长白猪和头长白猪和10头大白猪经产母猪的产仔数头大白猪经产母猪的产仔数 平均数平均数1x=11头,标准差头,标准差S1=1.76头头 长白猪长白猪10头经产母猪产仔头经产母猪产仔 长白长白111191213101313810大白大白11891012898710平均数平均数1x=9.2头,标准差头,标准差S1=1.55头头 大白猪大白猪10头经产母猪产仔头经产母猪产仔 1x2x能否仅凭这两个平均数的差值能否仅凭这两个平均数的差值 - =1.8头,立即得出头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?长白与大白两品种经产母猪产仔数不同的结论呢?

12、例例造成这种差异可能有两种原因,一是品种造成的差造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪异,即是长白猪与大白猪本质不同本质不同所致,另一可能所致,另一可能是是试验误差(或抽样误差)。试验误差(或抽样误差)。对两个样本进行比较对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的通过样本来推断总体?这正是显著性检验要解决的问题。问题。 两个总体间的差异如何比较?两个总体间的差异如何比较?一

13、种方法是一种方法是研究整个总体研究整个总体,即由总体中的所有个体数据计,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。或者是包含个体很多的有限总体。另一种方法,即另一种方法,即研究样本研究样本,通过样本研究其所代表的总体。,通过样本研究其所代表的总体。 设长白猪经产母猪产仔数的总体平均数为设长白猪经产母猪产仔数的总体平均数为 大白猪经产母猪产仔数的总体平均数为大白猪经产母猪产仔数的总

14、体平均数为 试验研究的目的,就是要给试验研究的目的,就是要给 、 是否相同做出推断。是否相同做出推断。 以样本平均数以样本平均数 、 作为检验对象,更确切地说,是作为检验对象,更确切地说,是以(以( - - )作为检验对象)作为检验对象 1m1m2m2m1x2x1x2x 由于抽样的原因,两样本平均数之差(由于抽样的原因,两样本平均数之差( ),即表),即表面效应,或实得差异中一定包含有抽样误差造成的部分,面效应,或实得差异中一定包含有抽样误差造成的部分,同时也可能包含有由于处理不同造成的总体平均数不等的同时也可能包含有由于处理不同造成的总体平均数不等的部分。部分。 21xx 无偏估计:如果一个

15、统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计:如果一个统计量的抽样分布的均值等于相应的总体参数,此时这个统计量就是此参数的无偏估计值无偏估计值;否则,就是;否则,就是有偏估计值有偏估计值如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的如果两个统计量的抽样分布有相同的均值,那么方差较小的那个统计量称为此均值的有效估计量有效估计量第二节第二节 显著性检验的基本原理显著性检验的基本原理 通过试验测定得到的每个观测值通过试验测定得到的每个观测值 每个观测值决定于:每个观测值决定于:被测个体所属总体的特征被测个体所属总体的特征个体差异和诸多无法控

16、制的随机因素。个体差异和诸多无法控制的随机因素。 所以观测值所以观测值 可以看作由两部分组成,即可以看作由两部分组成,即 ixixiixm 为总体平均数,反映了总体特征为总体平均数,反映了总体特征表示误差表示误差 若样本含量为若样本含量为n,则可得到,则可得到 n 个观测,个观测, , , 样本平均数样本平均数nx1x2xmmnnxxii/)(说明样本平均数并非等于总体平均数,说明样本平均数并非等于总体平均数,它还包含试验误差的成分它还包含试验误差的成分第二节第二节 显著性检验的基本原理显著性检验的基本原理第二节第二节 显著性检验的基本原理显著性检验的基本原理上例中两个品种猪的产子数的样本均值

17、分别可表示为:上例中两个品种猪的产子数的样本均值分别可表示为:() ()() ()212121221121mmmmxxxx111mx长白猪样本均值长白猪样本均值222mx大白猪样本均值大白猪样本均值对对 显著性检验:就是分析试验的表面效应显著性检验:就是分析试验的表面效应主要由处理效应主要由处理效应 引起的引起的 ,还是主要由试验,还是主要由试验误差误差 所造成。所造成。第二节第二节 显著性检验的基本原理显著性检验的基本原理() ()212121mm xx()21xx ()21mm显著性检验的意义显著性检验的意义上式表明:试验的表面效应包括处理效应与误差效应。上式表明:试验的表面效应包括处理效

18、应与误差效应。因此,仅凭样本均值间的因此,仅凭样本均值间的表面差异表面差异就对总体平均数就对总体平均数间的差异作出判断间的差异作出判断(有差异或者没有差异有差异或者没有差异) 是不可靠的。是不可靠的。只有通过显著性检验,才能从作出科学的结论只有通过显著性检验,才能从作出科学的结论()21xx ()21第二节第二节 显著性检验的基本原理显著性检验的基本原理 虽然处理效应虽然处理效应 未知,但试验的表面效应未知,但试验的表面效应 是可以计算的,借助数理统计方法可以对是可以计算的,借助数理统计方法可以对试验误差试验误差 作出估计。所以,可从试验的作出估计。所以,可从试验的表面效应与试验误差的权衡比较

19、中间接地推断表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本处理效应是否存在,这就是显著性检验的基本思想。思想。()21xx ()21mm()21第二节第二节 显著性检验的基本原理显著性检验的基本原理二、显著性检验的基本步骤二、显著性检验的基本步骤(一一) 首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设(二二) 在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量(三三) 给定小概率值给定小概率值(风险水分、显著平准风险水分、显著平准),根据自由度查,根据自由度查 表获取理论临界值表获取理论临界值(四四) 依

20、据样本计算得到的统计量与理论临界值的比较,依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。对相关检验作出判断。 这里假设这里假设 或或 ,即假设长白猪和大白,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:试验的表面效应: 头是试验误差,处理无效,头是试验误差,处理无效,这种假设称为这种假设称为无效假设无效假设, 简记作简记作 : 或或 第二节第二节 显著性检验的基本原理显著性检验的基本原理()21mm()021mm()8 . 121 xx(一一) 首先对试验样本所在的总体作假设首先对试验样本所

21、在的总体作假设()21mm()021mm0H第二节第二节 显著性检验的基本原理显著性检验的基本原理(一一) 首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设无效假设是被检验的假设,通过检验可能被无效假设是被检验的假设,通过检验可能被接接受受,也可能被,也可能被否定否定提出无效假设的同时,相应地提出一对应相反提出无效假设的同时,相应地提出一对应相反假设,称为备择假设,简记假设,称为备择假设,简记 备择假设是在无效假设被否定时准备接受的假备择假设是在无效假设被否定时准备接受的假设设AH上面例子的备择假设是上面例子的备择假设是 :即假设长白猪与大白猪两品种经产母猪产仔数的总体平即假设长白

22、猪与大白猪两品种经产母猪产仔数的总体平均数不相等或两个均值之差不等于零,亦即存在处理效均数不相等或两个均值之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。还含有处理效应在内。 第二节第二节 显著性检验的基本原理显著性检验的基本原理(一一) 首先对试验样本所在的总体作假设首先对试验样本所在的总体作假设:AH()21mm()021mm或或第二节第二节 显著性检验的基本原理显著性检验的基本原理(二二) 在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量计算得到一个

23、计算得到一个 t 统计量:统计量:2121xxSxxt)11() 1() 1()()(212112221211-2121nnnnxxxxSniiniixx其中:其中:均数差异标准误均数差异标准误两样本的含量两样本的含量第二节第二节 显著性检验的基本原理显著性检验的基本原理(二二) 在无效假设成立的前提下,构造并计算合适的统计量在无效假设成立的前提下,构造并计算合适的统计量所得的统计量所得的统计量 t 服从自由度服从自由度 df =(n1-1)+(n2-1)的的 t 分布。分布。根据两个样本的数据,计算得:根据两个样本的数据,计算得:)11() 1() 1()()(212122221121nnn

24、nxxxxSxx742. 0)101101() 110() 110(6 .2128426. 2742. 02 . 9112121xxSxxt第二节第二节 显著性检验的基本原理显著性检验的基本原理(三三) 给定小概率值给定小概率值(风险水分、显著平准风险水分、显著平准),根据自由度查,根据自由度查 表获取理论临界值表获取理论临界值设定风险水平设定风险水平(显著水平显著水平) ,其值通常取为,其值通常取为0.01与与0.05计算自由度计算自由度 df,上例中,上例中, df =(n1-1)+(n2-1)=9+9=18查附表查附表X,得两尾临界概率值:,得两尾临界概率值:101. 2)18(05.

25、0t878. 2)18(01. 0t)(dft第一节第一节 显著性检验的基本原理显著性检验的基本原理 如果:如果: 则接受无效假设则接受无效假设 HO )(05. 0dfxtt(四四) 依据样本计算得到的统计量与理论临界值的比较,依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。对相关检验作出判断。 如果:如果: 则接受备择假设则接受备择假设 HA )(01. 0)(05. 0dfxdfttt 如果:如果: 则接受备择假设则接受备择假设 HA )(01. 0dfxtt两样本均值所代表的总体均值间两样本均值所代表的总体均值间差异不显著差异不显著两样本均值所代表的总体均值间两样本均

26、值所代表的总体均值间差异显著差异显著两样本均值所代表的总体均值间两样本均值所代表的总体均值间差异差异极极显著显著第二节第二节 显著性检验的基本原理显著性检验的基本原理(四四) 依据样本计算得到的统计量与理论临界值的比较,依据样本计算得到的统计量与理论临界值的比较, 对相关检验作出判断。对相关检验作出判断。)(05. 0dfxtt)(01. 0)(05. 0dfxdfttt)(01. 0dfxtt第二节第二节 显著性检验的基本原理显著性检验的基本原理 若若t0.05 (df) |t| t0.01 (df) ,则说明试验的表面效应属于试验,则说明试验的表面效应属于试验误差的概率误差的概率P在在0.

27、010.05 之间,即之间,即0.01 P0.05,表明:,表明:表面效应属于试验误差的可能性较小,应否定无效假设,表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设。接受备择假设。 统计学上把这一检验结果表述为:统计学上把这一检验结果表述为:“两个总体平均数之间两个总体平均数之间差异显著差异显著”,在计算所得的,在计算所得的 t 值的右上方标记值的右上方标记“*”即即t *。 第二节第二节 显著性检验的基本原理显著性检验的基本原理若若|t|t0.01,则说明试验的表面效应属于试验误差的概率,则说明试验的表面效应属于试验误差的概率P不超过不超过0.01,即,即P 0.01,表面效应

28、属于试验误差的可能性更,表面效应属于试验误差的可能性更小小 ,应否定无效假设,接受备择假设。,应否定无效假设,接受备择假设。统计学上把这一检验结果表述为:统计学上把这一检验结果表述为:“两个总体平均数之间两个总体平均数之间差异极显著差异极显著”,在计算所得的,在计算所得的t值的右上方标记值的右上方标记“* *”即即t* *。 第二节第二节 显著性检验的基本原理显著性检验的基本原理101. 2)18(05. 0t878. 2)18(01. 0t426. 2xt前面的实例中前面的实例中 如果:如果: 则接受备择假设则接受备择假设 HA )(01. 0)(05. 0dfxdfttt第二节第二节 显著

29、性检验的基本原理显著性检验的基本原理统计推断结果的理解统计推断结果的理解小概率事件在一次试验中看成是实际上不可能发生的事件,小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。称为小概率事件实际不可能原理。根据这一原理,根据这一原理,当试验的表面效应是试验误差的概率小于当试验的表面效应是试验误差的概率小于0.05时时 ,可以认为在一次试验中试验表面效应是试验误差实,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设际上是不可能的,因而否定原先所作的无效假设HO,接受备,接受备择假设择假设HA,即认为试验的处理效应是存在的。,即认

30、为试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于当试验的表面效应是试验误差的概率大于0.05时时, 则说明则说明 无效假设无效假设HO 成立的可能性大成立的可能性大 ,不能被否定,因而也就不能,不能被否定,因而也就不能接受备择假设接受备择假设HA 。 第二节第二节 显著性检验的基本原理显著性检验的基本原理统计推断结果的理解统计推断结果的理解 综上所述,显著性检验,从提出无效假设与综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应来否定或接受无效假设,这一过程实际上是应用所谓

31、用所谓“概率性质的反证法概率性质的反证法”对试验样本所属对试验样本所属总体所作的无效假设的统计推断。总体所作的无效假设的统计推断。 第二节第二节 显著性检验的基本原理显著性检验的基本原理三、显著水平与两种类型的错误三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的在显著性检验中,否定或接受无效假设的依据是依据是“小概率事件实际不可能性原理小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准用来确定否定或接受无效假设的概率标准叫显著叫显著 水平,记作水平,记作。在生物学研究中常取在生物学研究中常取=0.05 或或=0.01。 第二节第二节 显著性检验的基本原理显著性检

32、验的基本原理三、显著水平与两种类型的错误三、显著水平与两种类型的错误 区间区间 和和 称为称为水平上的否定域,水平上的否定域, 区间区间 则称为则称为水平上的接受域。水平上的接受域。 ()(dft,(),dft( )( )()dftdft,第二节第二节 显著性检验的基本原理显著性检验的基本原理 实际应用中到底如何选取显著水平?实际应用中到底如何选取显著水平? 应根据试验的要求或试验结论的重要性而定应根据试验的要求或试验结论的重要性而定。如果试。如果试验中难以控制的因素较多,试验误差可能较大,则显验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即著水平可选低些,即值取大些。反之,如

33、试验耗费值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即结论的应用事关重大,则所选显著水平应高些,即值应该小些。值应该小些。 显著水平显著水平对假设检验的结论是有直接影响的,所以对假设检验的结论是有直接影响的,所以它它应在试验开始前即确定下来应在试验开始前即确定下来。第二节第二节 显著性检验的基本原理显著性检验的基本原理 显著性检验是根据显著性检验是根据 “小概率事件实际不可小概率事件实际不可能性原理能性原理”来否定或接受无效假设的,来否定或接受无效假设的, 所以不论所以不论是接受

34、还是否定无效假设,都没有是接受还是否定无效假设,都没有 100% 的把握。的把握。也就是说,在检验无效假设时可能犯两类错误,也就是说,在检验无效假设时可能犯两类错误,即即型错误型错误 和和 型错误。型错误。假设检验中的两类错误假设检验中的两类错误 1. 第一类错误(弃真错误)第一类错误(弃真错误) 原假设为真时拒绝原假设原假设为真时拒绝原假设 会产生一系列后果会产生一系列后果 第一类错误的概率为第一类错误的概率为被称为显著性水平被称为显著性水平 2. 第二类错误(纳伪错误)第二类错误(纳伪错误) 原假设为假时接受原假设原假设为假时接受原假设 第二类错误的概率为第二类错误的概率为 (Beta)第

35、二节第二节 显著性检验的基本原理显著性检验的基本原理型错误也叫第一类错误型错误也叫第一类错误,是真实情况为,是真实情况为H0成成立,通过假设检验,却否定了它,犯了立,通过假设检验,却否定了它,犯了“弃真弃真”错误,就是把非真实差异错判为真实差异,即错误,就是把非真实差异错判为真实差异,即H0为真,却接受了为真,却接受了HA型错误也叫第二类错误型错误也叫第二类错误,是,是H0不成立,却接不成立,却接受了它,犯了受了它,犯了“纳伪纳伪”错误,就是把真实差异错误,就是把真实差异错判为非真实差异,即错判为非真实差异,即HA为真,却接受了为真,却接受了H0陪审团审判陪审团审判裁决裁决实际情况实际情况无罪

36、无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为假接受接受H01 - 第二类错第二类错误误( (b)b)拒绝拒绝H0第一类错第一类错误误( ()功效功效(1-(1-b)b) 错误和错误和 b b 错误的关系错误的关系你不能同时减你不能同时减少两类错误少两类错误! 错误和错误和 b b 错误的关系错误的关系接受接受H0拒绝拒绝H0第二节第二节 显著性检验的基本原理显著性检验的基本原理 基于基于 “小概率事件实际不可能性原理小概率事件实际不可能性原理”来否定来否定H0, 但在一次试验中但在一次试验中 小概率事件小概率事件 并不

37、并不是绝对不会发生的。如果我们抽得一个样本,是绝对不会发生的。如果我们抽得一个样本,它虽然来自与它虽然来自与H0 对应的抽样总体,但计算所对应的抽样总体,但计算所得的统计量得的统计量t却落入了否定域中,因而否定了却落入了否定域中,因而否定了H0,于是犯了,于是犯了型错误。但犯这类错误的概型错误。但犯这类错误的概率不会超过率不会超过a。第二节第二节 显著性检验的基本原理显著性检验的基本原理型错误值的大小较难确切估计,型错误值的大小较难确切估计, 它只有与它只有与特定的备择假设结合起来才有意义。特定的备择假设结合起来才有意义。一般与显著水平一般与显著水平、原总体的标准差、原总体的标准差、样本、样本

38、含量含量n、 以及相互比较的两样本所属总体平均以及相互比较的两样本所属总体平均数之差大小等因素有关。数之差大小等因素有关。在其它因素确定时,在其它因素确定时, 型错误值越小,型错误值越小, 型型错误值越大;反之,错误值越大;反之, 型错误值越大,型错误值越大, 型型错误值越小;错误值越小; 样本含量及样本均数差异越大,样本含量及样本均数差异越大, 型错误与型错误与型错误值越小。型错误值越小。 第二节第二节 显著性检验的基本原理显著性检验的基本原理 由于由于型错误值的大小与型错误值的大小与型错误值的型错误值的大小有关,所以在选用检验的显著水平时应大小有关,所以在选用检验的显著水平时应考虑到犯考虑

39、到犯、型错误所产生后果严重性的型错误所产生后果严重性的大小,还应考虑到试验的难易及试验结果的大小,还应考虑到试验的难易及试验结果的重要程度。重要程度。 第二节第二节 显著性检验的基本原理显著性检验的基本原理若一个试验耗费大,可靠性要求高,不允许若一个试验耗费大,可靠性要求高,不允许反复,那么反复,那么型错误值应取小些;型错误值应取小些;当一个试验结论的使用事关重大,容易产生当一个试验结论的使用事关重大,容易产生严重后果,如药物的毒性试验,严重后果,如药物的毒性试验,型错误值型错误值亦应取小些;亦应取小些;对于一些试验条件不易控制,试验误差较大对于一些试验条件不易控制,试验误差较大的试验,可将的

40、试验,可将型错误值放宽到型错误值放宽到0.1,甚至放,甚至放宽到宽到0.25 在上述显著性检验中,在上述显著性检验中, 无效假设无效假设H0: 备择假设备择假设HA: 此时此时 ,备择假设中包括了,备择假设中包括了 或或 两种可能。两种可能。 这这个假设的目的在于判断有无差异,个假设的目的在于判断有无差异, 而不考虑谁大谁小。如而不考虑谁大谁小。如比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪比较长白猪与大白猪两品种猪经产母猪的产仔数,长白猪可能高于大白猪,可能高于大白猪, 也可能低于大白猪。也可能低于大白猪。第二节第二节 显著性检验的基本原理显著性检验的基本原理()21mm()21mm(

41、)21mm四、双侧检验与单侧检验四、双侧检验与单侧检验()21mm第二节第二节 显著性检验的基本原理显著性检验的基本原理四、双侧检验与单侧检验四、双侧检验与单侧检验 在在水平水平上否定域为上否定域为 和和 ,对,对称地分配在称地分配在 t分布曲线的两侧尾部,每侧的概率为分布曲线的两侧尾部,每侧的概率为/2,这种利用两尾概率进行的检验叫双侧检验,这种利用两尾概率进行的检验叫双侧检验,也叫双尾检验。也叫双尾检验。(t ,),t第二节第二节 显著性检验的基本原理显著性检验的基本原理H0的否定域在的否定域在t分布曲线的右尾。在分布曲线的右尾。在水平水平上否定域为上否定域为 ,右侧的概率为,右侧的概率为

42、),t这种利用一尾概率进行的检验叫单侧检验,也叫这种利用一尾概率进行的检验叫单侧检验,也叫单尾检验单尾检验双侧检验显著,单侧检验一定显著;但单侧检验双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著显著,双侧检验未必显著第二节第二节 显著性检验的基本原理显著性检验的基本原理 /2 第二节第二节 显著性检验的基本原理显著性检验的基本原理在有些情况下,在有些情况下, 双侧检验不一定符合实际情况。双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高鸡的产如采用某种新的配套技术措施以期提高鸡的产蛋量,已知此种配套技术的实施不会降低产蛋蛋量,已知此种配套技术的实施不会降低产蛋量。

43、此时,若进行新技术与常规技术的比较试量。此时,若进行新技术与常规技术的比较试验,则无效假设应为验,则无效假设应为 ,即假设新,即假设新技术与常规技术产蛋量是相同的技术与常规技术产蛋量是相同的 ,备择假设应,备择假设应为为 ,即新配套技术的实施使产蛋,即新配套技术的实施使产蛋量有所提高。量有所提高。210mm:H21mm:AH第二节第二节 显著性检验的基本原理显著性检验的基本原理第二节第二节 显著性检验的基本原理显著性检验的基本原理第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 (一)、为了保证试验结果的可靠及正确,要有严密(一)、

44、为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计合理的试验或抽样设计,保证各样本是从相应,保证各样本是从相应同质同质总总体中体中随机抽取随机抽取的。并且处理间要有的。并且处理间要有可比性可比性,即除比较,即除比较的处理外,其它影响因素应尽可能控制相同或基本相的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的近。否则,任何显著性检验的方法都不能保证结果的正确。正确。 第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 (二)、选用的显著性检验方法应(二)、选用的显著性检验方法应符合其应

45、用条件符合其应用条件 。上。上面我们所举的例子属于面我们所举的例子属于“非配对设计两样本平均数差非配对设计两样本平均数差异显著性检验异显著性检验” 。由于研究变量的类型、问题的性质、。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时著性检验方法也不同,因而在选用检验方法时 , 应认应认真考虑其适用条件,不能滥用。真考虑其适用条件,不能滥用。第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 (三)、(三)、要正确理解差异

46、显著或极显著的统计意义要正确理解差异显著或极显著的统计意义。显著性。显著性检验结论中的检验结论中的“差异显著差异显著”或或“差异极显著差异极显著”不应该误解不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。或很重要的价值。“显著显著”或或“极显著极显著”是指表面上如此是指表面上如此差别的不同样本来自同一总体的可能性小于差别的不同样本来自同一总体的可能性小于0.05或或0.01,已,已达到了可以认为它们有实质性差异的显著水平。有些试验达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许

47、还不能得出结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著差异显著”的结论,而有些试验的结果间的差异虽小,的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为但由于试验误差小,反而可能推断为“差异显著差异显著”。第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 显著水平的高低只表示下结论的可靠程度的高显著水平的高低只表示下结论的可靠程度的高低,即在低,即在 0.01 水平下否定无效假设的可靠程度为水平下否定无效假设的可靠程度为99,而在,而在 0.05水平下否定无效假设的可靠程度为水平下否定无效假设的可靠

48、程度为95%。第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 “差异不显著差异不显著”是指表面上的这种差异在同一总体中是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平出现的可能性大于统计上公认的概率水平0.05,不能理解,不能理解为试验结果间没有差异。为试验结果间没有差异。 “差异不显著差异不显著” 客观上存在两种可能:客观上存在两种可能: 一是本质上有差异,但被试验误差所掩盖,表现不出差一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本含量,则异的显著性来。如果减小试验误

49、差或增大样本含量,则可能表现出差异显著性;可能表现出差异显著性; 二是可能确无本质上差异。二是可能确无本质上差异。显著性检验只是用来确定无显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。效假设能否被推翻,而不能证明无效假设是正确的。第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题(四)合理建立统计假设(四)合理建立统计假设 ,正确计算检验统计量,正确计算检验统计量2121xxSxxtmxu第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 (五五)、结

50、论不能绝对化。经过显著性检验最终是否、结论不能绝对化。经过显著性检验最终是否 否定无效否定无效假设假设 则由被研究事物有无本质差异、则由被研究事物有无本质差异、 试验误差的大小及选试验误差的大小及选用显著水平的高低决定的。用显著水平的高低决定的。 同样一种试验,试验本身差异同样一种试验,试验本身差异程度的不同,样本含量大小的不同,显著水平高低的不同,程度的不同,样本含量大小的不同,显著水平高低的不同,统计推断的结论可能不同。统计推断的结论可能不同。 否定否定 H0时可能犯时可能犯型错误,接型错误,接受受H0时可能犯时可能犯型错误。尤其在型错误。尤其在P 接近接近时,下结论应慎重,时,下结论应慎

51、重, 有时应用重复试验来证明。总之,具有实用意义的结论要从有时应用重复试验来证明。总之,具有实用意义的结论要从多方面综合考虑,不能单纯依靠统计结论。多方面综合考虑,不能单纯依靠统计结论。第二节第二节 显著性检验的基本原理显著性检验的基本原理五、显著性检验中应注意的问题五、显著性检验中应注意的问题 此外,报告结论时应列出,由样本算得的检验统计量值此外,报告结论时应列出,由样本算得的检验统计量值(如(如 t 值),注明是单侧检验还是双侧检验,并写出值),注明是单侧检验还是双侧检验,并写出 P 值值的确切范围,如的确切范围,如 0.01P0.05,以便读者结合有关资料进,以便读者结合有关资料进行对比

52、分析。行对比分析。 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验 在实际工作中我们往往需要检验一个样本平均数在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值,如畜禽正常生认的理论数值、经验数值或期望数值,如畜禽正常生理指标、怀孕期、家禽出雏日龄以及生产性能指标等,理指标、怀孕期、家禽出雏日龄以及生产性能指标等,都可以用样本平均数与之比较,检验差异

53、显著性。都可以用样本平均数与之比较,检验差异显著性。 检验的基本步骤是:检验的基本步骤是: 第一步:第一步: 提出无效假设与备择假设设提出无效假设与备择假设设 , 第二步:计算第二步:计算t统计量值,计算公式为:统计量值,计算公式为: 第三步:给出显著平准,并根据自由度查临界第三步:给出显著平准,并根据自由度查临界t值,值, 第四步:作出统计推断第四步:作出统计推断 00mm:H0mm:AHxSxt0m 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验 实例实例 母猪的

54、怀孕期为母猪的怀孕期为114天,今抽测天,今抽测10头母猪的头母猪的怀孕期分别为怀孕期分别为 116、 115、113、 112、 114、 117、 115、 116、 114、 113(天),试检验所得样本平(天),试检验所得样本平均数与总体平均数均数与总体平均数114天有无显著差异?天有无显著差异? 根据题意,本例应进行双侧根据题意,本例应进行双侧t检验。检验。 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验第一步:第一步:提出无效假设与备择假设,即无效假提出无效假设与备择假设,即无效假设认为样本所在总体与已知总体间没有差异,设认为样本所在总体与已

55、知总体间没有差异,备择假设认为样本所在总体与已知总体间没有备择假设认为样本所在总体与已知总体间没有差异。如果用差异。如果用 表示样本所在总体的均值。用表示样本所在总体的均值。用 表示已知总体的均值,在无效假设与备择假设表示已知总体的均值,在无效假设与备择假设可以简单表示为:可以简单表示为:mm00:Hmm0:AH0mm 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验500. 010581. 1dfSSx第二步第二步,计算,计算t值值 经计算得:经计算得:581. 1, 5 .114Sx000. 15 . 01145 .1140 xSuxt 第三节第三节

56、样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验第三步第三步,给出显著平准,自由度,查表得到理论,给出显著平准,自由度,查表得到理论临界值临界值 给出显著平准给出显著平准 0.05 与与 0.01 本题的自由度为本题的自由度为 df=n-1=10-1=9250. 3)9(01. 0t262. 2)9(05. 0t 第三节第三节 样本平均数与总体平均数差异显著性检验样本平均数与总体平均数差异显著性检验第四步第四步,对样本统计量值与理论临界值进行比较,对样本统计量值与理论临界值进行比较 如果:如果: 则接受无效假设则接受无效假设 HO )(05. 0dfxttt=1.000

57、t0.05(9)样本所在总体与已知总体间样本所在总体与已知总体间没有差异没有差异一、总体方差已知时单个平均数的假设一、总体方差已知时单个平均数的假设 检验检验 当总体方差当总体方差 已知时,根据样本平均数分布的性质,无已知时,根据样本平均数分布的性质,无论样本容量是大是小,均可用论样本容量是大是小,均可用u 分布计算实得差异由抽样分布计算实得差异由抽样误差造成的概率,所以称误差造成的概率,所以称u检验。检验。2【例例4-1】测定了某品种测定了某品种37头犊牛头犊牛100g血液中总蛋白的血液中总蛋白的含量,其平均数为含量,其平均数为4.263g;该品种成年母牛;该品种成年母牛100g血液中血液中

58、总蛋白含量为总蛋白含量为7.570g,标准差为,标准差为1.001。问该品种犊牛和。问该品种犊牛和成年母牛血液中总蛋白含量是否存在显著差异?成年母牛血液中总蛋白含量是否存在显著差异?本例总体方差本例总体方差 已知,可采用已知,可采用u u 检验。检验。2第三节第三节 单个平均数的假设检验单个平均数的假设检验:0H犊牛和成年母牛间血液中总蛋白含量无显著差异;犊牛和成年母牛间血液中总蛋白含量无显著差异; :AH犊牛和成年母牛间血液中总蛋白含量存在显著差异。犊牛和成年母牛间血液中总蛋白含量存在显著差异。 :0H:AH0mm0mmvs 165. 037001. 1nx4.2637.5720.040.1

59、65xxum 58. 2|01. 0uu 统计假设检验否定统计假设检验否定 ,接受,接受 ,可以得出结论:,可以得出结论:犊牛和成年母牛间血液中总蛋白含量存在极显著差异。犊牛和成年母牛间血液中总蛋白含量存在极显著差异。0HAH第三节第三节 单个平均数的假设检验单个平均数的假设检验二、总体方差未知时单个平均数的假设检验二、总体方差未知时单个平均数的假设检验 当总体方差当总体方差 未知时,应用未知时,应用t分布计算实得差异由抽样分布计算实得差异由抽样误差造成的概率。误差造成的概率。 【例例4-2】 某屠宰场收购了一批商品猪,一位有经验的收某屠宰场收购了一批商品猪,一位有经验的收购人员估计这批猪的平

60、均体重为购人员估计这批猪的平均体重为100 kg,现随机抽测,现随机抽测10头猪头猪进行称重,得体重数据如下:进行称重,得体重数据如下:115,98,105,95,90,110,104,108,92,118(kg),试检验此收购人员的估计是否),试检验此收购人员的估计是否正确?正确?2第三节第三节 单个平均数的假设检验单个平均数的假设检验本例总体方差本例总体方差 未知,且样本很小,用未知,且样本很小,用t 检验。检验。 2,:10000mmH。:0mmAHvsvs57. 9, 5 .103sx9 .5 73 .0 31 0 xssn103.5 1001.1553.03xxtsm11019dfn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论