(生统与田试)第四章-统计假设检验6课件_第1页
(生统与田试)第四章-统计假设检验6课件_第2页
(生统与田试)第四章-统计假设检验6课件_第3页
(生统与田试)第四章-统计假设检验6课件_第4页
(生统与田试)第四章-统计假设检验6课件_第5页
已阅读5页,还剩287页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(生统与田试)第四章统计假设检验6(生统与田试)第四章统计假设检验61本章主要内容由样本的结果如何来推断总体

假设检验参数估计分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断本章主要内容2第一节假设检验

的原理与方法第一节假设检验

的原理与方法3一、假设检验的概念假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。一、假设检验的概念假设检验就是根据总体的理论分布和小概率原4如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。

生物统计学中,一般认为小于0.05或0.0l的概率为小概率。通过假设检验,可以正确分析处理效应和随机误差,作出可靠的结论。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率5二、假设检验的步骤

在进行假设检验时,一般应包括以下4个步骤:提出假设确定显著水平

计算概率推断是否接受假设二、假设检验的步骤在进行假设检验时,一般应包括以下4个步骤6(一)提出假设

假设检验首先要对总体提出假设(statisticalhypothesis)一般应作两个假设:无效假设,记作H0

;备择假设,记作HA

。(一)提出假设假设检验首先要对总体提出假设(statist7无效假设(nullhypothesis)是直接检验的假设,是对总体提出的一个假想目标。所谓“无效”意指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致。无效假设(nullhypothesis)是直接检验的假设,8备择假设(alternativehypothesis)是和无效假设相反的一种假设,即认为试验结果中的差异是由于总体参数不同所引起的。因此,无效假设与备择假设是对立事件,在检验中,如果接受H0就否定HA;否定H0则接受HA

备择假设(alternativehypothesis)是和9确定无效假设必须遵循两个原则:①无效假设是有意义的;②据此可算出因抽样误差而获得样本结果的概率。确定无效假设必须遵循两个原则:10(生统与田试)第四章--统计假设检验6课件11(生统与田试)第四章--统计假设检验6课件12(二)确定显著水平在进行无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率标准叫显著水平,记作α。α是人为规定的小概率界限,生物统计学中常取α=0.05和α=0.0l两个显著水平。(二)确定显著水平在进行无效假设和备择假设后,要确定一个否13(三)计算概率在假设H0正确的前提下,根据样本平均数的抽样分布计算出由抽样误差造成的概率。对于上面一个样本平均数的例子,在H0

:μ=μ0的前提下,根据式3.27可求得:(三)计算概率在假设H0正确的前提下,根据样本平均数的抽样14查附表2,P(|u|>1.581)=2×0.057l=0.1142,即在N(126,240)的总体中,以n=6进行随机抽样,所得平均数

=136与126相差为10以上的概率为0.1142查附表2,P(|u|>1.581)=2×0.057l=0.115注意:检验所计算的并不是实得差异本身的概率,而是超过实得差异的概率。概率的大小,是推断H0是否正确的依据。在H0假设下,由于有可能大于μ,也有可能小于μ,因此需要考虑差异的正和负两个方面,所以一般计算的都是双尾概率。注意:检验所计算的并不是实得差异本身的概率,而是超过实得差异16(四)推断是否接受假设根据小概率原理作出是否接受H0

:小概率原理指出:如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生(“小概率事件实际上不可能发生”)。(四)推断是否接受假设根据小概率原理作出是否接受H0:小概17统计学中,常把概率小于0.05或0.01作为小概率。如果计算的概率大于0.05或0.01,则认为不是小概率事件;H0的假设可能是正确的,应该接受,同时否定HA

;反之,所计算的概率小于0.05或0.01,则否定H0,接受HA

。统计学中,常把概率小于0.05或0.01作为小概率。18通常把概率等于或小于0.05叫做差异显著标准,或差异显著水平(significancelevel);等于或小于0.01叫做差异极显著标准,或差异极显著水平。一般差异达到显著水平,则在资料的右上方标以“*”,差异达到极显著水平,则在资料右上方标以“**”。通常把概率等于或小于0.05叫做差异显著标准,或差异显著水平19

上例中,所计算的概率为0.1142,大于0.05的显著水平,应接受H0

,可以推断治疗前后的血红蛋白含量未发现有显著差异,其差值10(mg·L-1)应归于误差所致。在实际检验时,可将上述计算简化。由例3.10已知P(|u|>1.96)=0.05,P(|u|>2.58)=0.01,因此,在用u分布进行检验时,如果算得|u|>1.96,就是在α=0.05的水平上达到显著,如果|u|>2.58,就是在α=0.0l的水平上达到显著,即达到极显著水平,勿须再计算u值的概率。上例中,所计算的概率为0.1142,大于0.05的显著水平20(生统与田试)第四章--统计假设检验6课件21样本频率、变异数以及多个平均数的假设检验,都应根据试验目的提出无效假设和备择假设。提出无效假设的目的:可从假设的总体中推论其平均数的随机抽样分布,从而可以算出某一样本平均数指定值出现的概率,这样就可以根据样本与总体的关系,作为假设检验的理论依据。样本频率、变异数以及多个平均数的假设检验,都应根据试验目的提22综上所述,假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0和备择HA

;(2)确定检验的显著水平α;(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;(4)根据显著水平α的u值临界值,进行差异是否显著的推断。综上所述,假设检验的步骤可概括为:23三、双尾检验与单尾检验

Two-tailedtestandone-tailedtest

进行假设检验时,需要提出无效假设和备择假设。提出的这种假设,其总体平均数μ可能大于μ0,也可能小于μ0。在样本平均数的抽样分布中,对于α=0.05时,落在区间(μ-1.96,μ+1.96)的

有95%,落在这一区间之外(即≤μ-1.96和≥μ+1.96)的

只有5%。三、双尾检验与单尾检验

Two-tailedtestan24同理,对于α=0.01时,落在区间(μ-2.58,μ+2.58)的有99%,落在这一区间之外(即≤μ-2.58和≥μ+2.58)的只有1%。在进行假设检验时,前者相当于接受H0的区域,简称接受区(acceptanceregion);后者相当于否定H0的区域,简称否定区(rejectionregion

)(图4.1)。同理,对于α=0.01时,落在区间(μ-2.58,25(生统与田试)第四章--统计假设检验6课件26一般将接受区和否定区的两个临界值写作μ±uα

,即当

在(μ-uα,μ+uα

)内为H0的接受区,而≤μ-

和≥μ+

为H0的两个否定区;x≤μ-uα

:为左尾否定区,

≥μ+

为右尾否定区。上述假设检验的两个否定区,分别位于分布的两尾,称为双尾检验。一般将接受区和否定区的两个临界值写作μ±uα,即当在27当假设检验的 时,则 ,这时备择假设就有两种可能,或

或 ,也就是说在 的情况下,样本平均数有可能落入左尾否定区,也有可能落入右尾否定区,这两种情况都属于 的情况。例如,检验某种新药与旧药的治病疗效是否有差别,就是说新药疗效比旧药好还是旧药疗效比新药好,两种可能性都存在,相应的假设检验就应该用双尾检验。在生物学研究中,双尾检验的应用是非常广泛的。当假设检验的 时,则 ,这时28单尾检验但在某些情况下,双尾检验不一定符合实际。例如,我们已经知道新药疗效不可能低于旧药,于是其无效假设

,备择假设

,这时仅有一种可能性,其否定区只有一个,相应的检验也只能考虑一侧的概率,这种具有左尾或右尾一个否定区的检验叫单尾检验。单尾检验29单尾检验的步骤与双尾检验相同,查u分布表或t分布表时,需将一尾概率乘以2,再进行查表。例如,进行α=0.05的单尾检验时,对

,需进行左尾检验,其否定区为

;对

,需进行右尾检验,其否定区为同理,进行α=0.01的单尾检验时,对 ,其否定区为

,对 ,其否定

单尾检验的步骤与双尾检验相同,查u分布表或t分布表时,需将一30

假设检验是根据一定概率显著水平对总体特征进行推断。否定了H0

,并不等于已证明H0不真实;接受了H0

,也不等于已证明H0是真实的。如果H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,这类错误叫第一类错误,或称α错误,亦称弃真错误。四、假设检验中的两类错误

TypeIerrorandtypeIIerror假设检验是根据一定概率显著水平对总体特征进行推断。否定了H31如对样本平均数的抽样分布,当取概率显著水平α=0.05时,x落在区间(μ-1.96,μ+1.96σ

)的概率为0.95,x落在区间(μ-1.96,μ+1.96

)之外的概率为0.05,当一旦落在区间(μ-1.96,μ+1.96)之外,假设检验时就会否定H0,接受HA,这样就会导致错误的结论。不过,犯这类错误的概率很小,只有0.05。如果取概率显著水平为α=0.01,则x落在区间(μ-2.58,μ+2.58

)的概率为0.99,x落在区间(μ-2.58,μ+2.58

)之外的概率只有0.01,即犯“错误的可能性更小,只有0.01。如对样本平均数的抽样分布,当取概率显著水平α=0.05时,32如果H0不是真实的,假设检验时却接受了H0

,否定了HA,这样就犯了接受不真实的错误,这类错误叫第二类错误,或称β错误,亦称纳伪错误。第一类错误和第二类错误既有区别又有联系。二者的区别是,第一类错误只有在否定H0时才会发生,而第二类错误只有在接受H0时才会发生。二者的联系是,在样本容量相同的情况下,第一类错误减少,第二类错误就会增加;反之,第二类错误减少,第一类错误就会增加。如果H0不是真实的,假设检验时却接受了H0,否定了HA,33统计假设正确不正确接受——没犯错误否定——犯了错误——弃真错误(第一类错误)(危险率以α表示)接受——犯了错误——采伪错误(第二类错误)(危险率以β表示)否定——没犯错误统计假设正确不正确接受——没犯错误否定——犯了错误——弃真错34在假设检验时,一个假设的接受或否定,不可能保证百分之百的正确,肯定会出现一些错误的推断。如何减少犯这两类错误的概率?

(1)概率显著水平的确定与犯两类错误有密切的关系,α取值太高或太低都会导致某一种错误的增加。一般的作法是,将概率显著水平不要定得太高,以取α=0.05作为小概率比较合适,这样可使犯两类错误的概率都比较小。在假设检验时,一个假设的接受或否定,不可能保证百分之百的正确35(2)在计算正态离差u时,总体平均数μ和样本平均数之间的差值不是随意能够进行主观改变的,但在试验研究中, 却是可以减小的。

从理论上讲,

可通过精密的试验设计和增大样本容量而减小到接近0的程度,这样正态分布中接受区就变得十分狭窄,μ和 之间的差别就比较容易发现,所以减小是减少两类错误的关键。因此,在试验和研究中应用假设检验时,要有合理的试验设计和正确的试验技术,尽量增加样本容量,以减小标准误。(2)在计算正态离差u时,总体平均数μ和样本平均数之间的36第二节样本平均数的假设检验一、大样本平均数的假设检验——u检验第二节样本平均数的假设检验一、大样本平均数的假设检验——37(一)一个样本平均数的u检验根据总体方差σ2是否已知,一个样本平均数的u检验分为两种情况。1.总体方差σ2已知时的检验

当总体方差σ2为已知时,检验一个样本平均数的总体平均数μ是否属于某一指定平均数为μ0的总体,不论其样本容量是否大于30,均可采用u检验法。(一)一个样本平均数的u检验根据总体方差σ2是否已知,一个样38例4.1

某鱼场按常规方法所育某鱼苗一月龄的平均体长为7.25cm,标准差为1.58cm,为提高鱼苗质量,现采用一新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65cm,试问新育苗方法与常规方法有无显著差异?

分析:

这里总体σ=1.58cm,σ2为已知,故采用u检验;又新育苗方法的鱼苗体长可能高于常规方法,也可能低于常规方法,故进行双尾检验。检验步骤为:例4.1某鱼场按常规方法所育某鱼苗一月龄的平均体长为7.39(1)假设H0

:μ=μ0=7.25cm,即新育苗方法与常规方法所育鱼苗一月龄体长相同。对HA

:μ≠μ0;(2)选取显著水平α=0.05;(3)检验计算:(1)假设H0:μ=μ0=7.25cm,即新育苗方法与常规40(4)推断:u分布中,当α=0.05时,u0.05=1.96

。实得|u|>1.96

,P<0.05

,故在0.05显著水平上否定H0

,接受HA

,认为新育苗方法一月龄体长与常规方法有显著差异。(4)推断:u分布中,当α=0.05时,u0.05=412.总体方差σ2未知时的检验

当总体方差σ2未知时,只要样本容量n>30,可用样本方差S2来代替总体方差σ2

,仍可用u检验法。例4.2

生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm,问该棉花品种的纤维长度是否符合纺织品的生产?2.总体方差σ2未知时的检验当总体方差σ2未知时,只要样42分析:由题可知,μ=30.0mm,=30.2mm,s=2.5mm,而σ2未知,但由于n=400,属于大样本,故可用S2来代替σ2进行u检验;又由于棉花纤维只有大于30.0mm才符合纺织品生产的要求,故用单尾检验。(1)假设H0

:μ≤30.0mm,即该棉花品种纤维长度达不到纺织品生产的要求。对HA

:μ≥30.0mm;

(2)确定显著水平

=0.05;

(3)检验计算:分析:由题可知,μ=30.0mm,=30.2mm,s43(4)推断:当α=0.05时,单尾检验临界值u0.05=1.645。实得|u|<1.645,P>0.05,故接受H0

,否定HA

,认为该棉花品种纤维长度不符合纺织品生产的要求。(4)推断:当α=0.05时,单尾检验临界值u0.05=144(二)两个样本平均数比较的u检验两个样本平均数比较的u检验是要检验两个样本平均数和所属的总体平均数μ1和μ2是否来自同一个总体。在两个样本方差

已知,或

未知,但两个样本都是大样本,即在n1>30和n2>30时,可用u检验法(二)两个样本平均数比较的u检验两个样本平均数比较的u检验是45在进行两个大样本平均数的比较时,需要计算样本平均数差数的标准误

和u值。当两样本方差和

已知,两个样本平均数差数的标准误为:(4.1,3.37)(4.2)在进行两个大样本平均数的比较时,需要计算样本平均数差数的标准46(4.3)(4.4)(4.5)(4.3)(4.4)(4.5)47(4.6)(4.7)(4.8)(4.6)(4.7)(4.8)48例4.3

根据多年的资料,某杂交黑麦从播种到开花的天数的标准差为6.9d,现在相同试验条件下采取两种方法取样调查,A法调查400株,得出从播种到开花的平均天数为69.5d;B法调查200株,得出从播种到开花的平均天数为70.3d,试比较两种调查方法所得黑麦从播种到开花的天数有无显著差别。例4.3根据多年的资料,某杂交黑麦从播种到开花的天数的49分析:根据题意,总体方差已知,

故用u检验;又事先不知A、B两法所得从播种到开花的天数是否相同,需用双尾检验。(3)检验计算:(1)假设H0

:μ1=μ2

,即A、B两法所得从播种到开花的天数相同。对HA

:μ1≠μ2

;(2)取显著水平α=0.05;分析:根据题意,总体方差已知,故用u检验;又事先不知A、B50(4)推断:由于实得|u|<u0.05=1.96,P>0.05,故在0.05显著水平上接受H0,否定HA

,即A、B两种调查方法所得黑麦从播种到开花的天数没有显著差别。(4)推断:由于实得|u|<u0.05=1.96,P>051例4.4

为了比较“42—67×RRIM603”和“42—67×PB86”两个橡胶品种的割胶产量,两品种分别随机抽样55株和107株进行割胶,割胶平均产量分别为95.4mL.株-l和77.6mL.株-1,割胶产量的方差分别为936.36(mL.株-1)2和800.89(mL·株-1)2试检验两个橡胶品种在割胶产量上是否有显著差别。例4.4为了比较“42—67×RRIM603”和“52分析:(1)

假设H0

:μ1=μ2即两品种的割胶产量没有显著差别。对HA

:μ1≠μ2;(2)

规定显著水平α=0.01

;(3)

检验计算:分析:(1)假设H0:μ1=μ2即两品种的割胶产量没有53(4)推断:现实得|u|>u0.01

=2.58,P<0.01

,故否定H0,接受HA,即两个橡胶品种的割胶产量存在极显著的差别,由于,所以可以得出“42—67×RRIM603”的割胶产量显著高于“42—67×PB86”的结论。(4)推断:现实得|u|>u0.01=2.58,P<0.54二、小样本平均数的假设检验

——t检验

当样本容量n<30且总体方差σ2未知时,就无法使用u检验法对样本平均数进行假设检验,这时,要检验样本平均数与指定总体平均数μ0的差异显著性,就必须使用t检验法。在生物学研究中,由于试验条件和研究对象的限制,有许多研究的样本容量都很难达到30,因此,采用小样本平均数的t检验法在生物学研究中具有重要的意义。二、小样本平均数的假设检验

——t检验

当样本容量n<355(一)一个样本的假设检验检验总体方差σ2未知,样本容量n<30的平均数

是否属于平均数为μ0的指定总体的一种t分布。因为小样本的S2和σ2相差较大,故

遵循自由度dƒ

=n-1的t分布。

例4.5

某鱼塘水中的含氧量,多年平均为4.5mg·L-1,现在该鱼塘设10个点采集水样,测定水中含氧量分别为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26mg·L-1,试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。(一)一个样本的假设检验检验总体方差σ2未知,样本容量n<356分析:此题σ2未知,且n=l0,为小样本,故用t检验;又该次测定的水中含氧量可能高于也可能低干多年平均值,故用双尾检验。(1)

假设H0

:μ=μ0=4.5mg.L-1,即该次测定的水中含氧量与多年平均值没有显没有显著差别。对HA

:μ≠μ0;(2)

选取显著水平α=0.05

;(3)

检验计算:分析:此题σ2未知,且n=l0,为小样本,故用t检验;又该次57(生统与田试)第四章--统计假设检验6课件58查附表4,当dƒ=n-1=9时,t0.05=2.262,现实得|t|<t0.05,故P>0.05;(4)推断:接受H0

,认为该次抽样测定的鱼塘水中含氧量与多年平均含氧量没有显著差别,与μ相差0.079mg·L-1属于随机误差。查附表4,当dƒ=n-1=9时,t0.05=2.262,59(二)两个样本平均数的假设检验

———成组数据的平均数比较成组数据资料的特点:是指两个样本的各个变量是从各自总体中抽取的,两个样本之间的变量没有任何关联,即两个抽样样本彼此独立。这样,不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数进行相互比较,来检验其差异的显著性。(二)两个样本平均数的假设检验

———成组数据的平均数比较成60当总体方差σ12和σ22已知,或总体方差σ12和σ22未知,但两个样本均为大样本时,采用u检验法检验两组平均数的差异显著性。这里讨论当总体方差σ12和σ22未知,且两样本为小样本(n1<30,n2<30),进行两组平均数差异显著性检验的t检验法。当总体方差σ12和σ22已知,或总体方差σ12和σ22未知,611.两样本的总体方差σ12和σ22未知,但可假设σ12=σ22=σ2时的检验首先,用样本方差σ12和σ22进行加权求出平均数差数的方差σe2

,作为对σ2的估计,计算公式为:(4.9,5.6)1.两样本的总体方差σ12和σ22未知,但可假设σ12=62(4.10,5.7)(4.11,5.8)(4.12,5.9A)(4.10,5.7)(4.11,5.8)(4.12,563例4.6

用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个月时,测定两组大白鼠的增重量(g),两组的数据分别为:(4.13,5.9B)例4.6用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个64

高蛋白组:134,146,106,119,124,161,l07,83,113,129,97,123; 低蛋白组:70,118,101,85,107,132,94。 试问两种饲料饲养的大白鼠增重量是否有差别?分析:本题σ12和σ22未知,且为小样本,用t检验;又事先不知两种饲料饲养的大白鼠增重量孰高孰低,故用双尾检验。 高蛋白组:134,146,106,119,124,16165(1)

假设H0

:μ1=μ2,即两种饲料饲养的大白鼠体重没有显著差别。对HA

:μ1≠μ2

;(2)

规定显著水平α=0.05

;(3)

检验计算:(1)假设H0:μ1=μ2,即两种饲料饲养的大白鼠体重66(生统与田试)第四章--统计假设检验6课件67(4)推断:接令H0

,认为两种饲料饲养大白鼠的增重量没有显著差别。(4)推断:接令H0,认为两种饲料饲养大白鼠的增重量没有显682.两样本的总体方差σ12和σ22未知,且σ12≠σ22(可由F检验得知),但n1=n2时的检验。这种情况仍可用t检验法,其计算也与可假设两总体方差σ12=σ22的情况一样,只是在查t值表时,所用自由度dƒ=n-1,而不是2(n

-1)。2.两样本的总体方差σ12和σ22未知,且σ12≠σ269例4.7

两小麦品种千粒重(g)的调查结果如下:品种甲:50,47,42,43,39,5l,43,38,44,37;品种乙:36,38,37,38,36,39,37,35,33,37。试检验两品种的干粒重有无显著差异。分析:此题n1=n2=10,经F检验,得知两品种千粒重的方差有显著的不同。例4.7两小麦品种千粒重(g)的调查结果如下:70(1)

假设H0

:μ1=μ2,即两品种的千粒重没有显著差别。对HA

:μ1≠μ2

;(2)

取显著水平α=0.05

;(3)检验计算:(1)假设H0:μ1=μ2,即两品种的千粒重没有显著差71(生统与田试)第四章--统计假设检验6课件72查附表4,dƒ=10-1=9,现实得|t|>t0.05,故P<0.05(4)推断:否定H0,接受HA

,认为两品种千粒重有显著差异,甲品种的千粒重显著高于乙品种。查附表4,dƒ=10-1=9,现实得|t|>t0.05737373743.两样本的总体方差σ12和σ22未知,且σ12≠σ22

n1≠n2时的检验这种情况所构成的统计数t不再服从相应的t分布,只能进行近似的t检验。由于σ12≠σ22

,所以两样本平均数差数的标准误不能使用加权方差,需用两个样本方差S12和S12分别估计总体方差σ12和σ22

,即有:(4.14,5.10)3.两样本的总体方差σ12和σ22未知,且σ12≠σ2275作t检验时,需先计算R和dƒ′:式4.17的tdƒ′近似服从于t分布,其自由度为dƒ′,查t值表得tα

(dƒ′)

,临界值。(4.15,5.11)(4.16)(4.17,5.12A)作t检验时,需先计算R和dƒ′:式4.17的tdƒ′近似服76例4.8

测定冬小麦东方红3号的蛋白质含量(%)10次,得,S12=1.621;测定农大193的蛋白质含量5次,得,S22=0.135。试检验两品种蛋白质含量是否有显著差异。分析:经F检验,得知两品种蛋白质含量的方差有显著的不同,又由于n1≠n2

,故需计算tdƒ′,作近似的t检验。使用双尾检验。例4.8测定冬小麦东方红3号的蛋白质含量(%)10次,得77(1)

假设H0

:μ1=μ2即两品种蛋白质含量没有显著差别。对HA

:μ1≠μ2

;(2)

取显著水平α=0.01

;(3)

检验计算:(1)假设H0:μ1=μ2即两品种蛋白质含量没有显著差78(生统与田试)第四章--统计假设检验6课件79(4)推断:否定H0

,接受HA

,认为两品种蛋白质含量有极显著差异。(4)推断:否定H0,接受HA,认为两品种蛋白质含量有极80(三)成对数据平均数比较的假设检验成对数据的比较要求两样本间配偶成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。成对数据特点:由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较高精确度。(三)成对数据平均数比较的假设检验成对数据的比较要求两样本间81

设两样本的变量分别为x1和x2,共配成n对,各对的差数为d=

x1-

x2

,则样本差数平均数为:(4.18)(4.19)设两样本的变量分别为x1和x2,共配成n对,各对的差数为d82(4.20,5.14)(4.21,5.15A)(4.20,5.14)(4.21,5.15A)83(4.22,5.15B)(4.22,5.15B)84例4.9

在研究饮食中缺乏维生素E与肝中维生素A的关系时,将试验动物按性别、体重等配成8对,并将每对中的两头试验动物用随机分配法分配在正常饲料组和维生素E缺乏组,然后将试验动物杀死,测定其肝中的维生素A的含量,其结果如表4-1,试检验两组饲料对试验动物肝中维生素A含量的作用是否有显著差异。例4.9在研究饮食中缺乏维生素E与肝中维生素A的关系时,85(生统与田试)第四章--统计假设检验6课件86分析:此题为配对数据,因两组饲料对试验动物肝中维生索A含量的作用孰大孰小,事先并不明确,故用双尾检验。(1)

假设H0

:μd=0,两组饲料对试验动物肝中维生索A含量的作用没有显著差别。对HA

:μ1≠0

;(2)确定显著水平α=0.01

;(3)

检验计算:

分析:此题为配对数据,因两组饲料对试验动物肝中维生索A含量的87(生统与田试)第四章--统计假设检验6课件88

(4)推断:否定H0

:ud=0,接受HA

:ud≠0,即两组饲料对试验动物肝中维生素A含量的作用有极显著差异,用正常饲料饲养的试验动物肝中的维生素A含量显著高于维生素E缺乏组饲养的试验动物肝中的维生素A含量。(4)推断:否定H0:ud=0,接受HA:ud≠089第三节样本频率的假设检验

第三节样本频率的假设检验

90在生物学研究中,有许多试验或调查结果是用频率(或百分数、成数)表示的。比如总体或样本中的个体分属两种属性,象药剂处理后害虫的死与活、种子的发芽与不发芽、动物的雌与雄、试验的成功与失败等,类似这些性状组成的总体通常服从二项分布,因此叫二项总体,即由“非此即彼”组成的总体。有些总体中的个体有多个属性,但可根据研究目的经适当的统计处理分为“目标性状”和“非目标性状”两种属性,也可看作二项总体。在生物学研究中,有许多试验或调查结果是用频率(或百分数、成数91在二项总体中抽样,样本中的“此”性状出现的情况可用次数表示,也可用频率表示,因此频率的假设检验可按二项分布进行,即从二项式(p+q)n的展开式中求出“此”性状频率的概率,然后作出统计推断。但是,如果样本容量n较大,0.1≤p≤0.9时,np和nq又均不小于5,(p十q)n的分布就趋于正态,因而可将频率资料作正态分布处理,从而作出近似的检验。在二项总体中抽样,样本中的“此”性状出现的情况可用次数表示,92一、一个样本频率的假设检验检验一个样本频率与某一理论频率p0的差异显著性。根据n和p的大小,其检验方法是不一样的。当np或nq<5,则由二项式(p+q)n展开式直接检验。当np或nq>5时,二项分布趋近正态,可用u检验,但需进行连续性矫正。如np或nq均大于30时,则可不进行连续性矫正。一、一个样本频率的假设检验检验一个样本频率与某一理论频93(4.23,5.16)(4.24,5..17)(4.25,5.23)(4.23,5.16)(4.24,5..17)(4.2594例4.10

有一批蔬菜种子的平均发芽率p0=0.85,现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,试检验种衣剂对种子发芽有无效果。分析:本题中,p0=0.85,n=500,由于np和nq都大于30,故不需进行连续性矫正。(1)

假设H0

:p=p0=0.85,即用种衣剂浸种后的发芽率仍为0.85。对HA:

p≠p0

;(2)

确定显著水平α=0.05

;两尾检验例4.10有一批蔬菜种子的平均发芽率p0=0.85,现随95(3)

检验计算:(4)推断:由于|u|>u0.05=1.96,p<0.05,故否定H0

,接受HA,认为用种衣剂浸种能够显著提高蔬菜种子的发芽率。(3)检验计算:(4)推断:由于|u|>u0.05=1.96例4.11

规定种蛋的孵化率p0>0.80为合格,现对一批种蛋随机抽取100枚进行孵化检验,结果有78枚孵出,问这批种蛋是否合格?分析:本题中,np和nq都大于5,但nq<30,故需进行连续性矫正。又只有孵化率≤

0.80才认为是不合格,故采作单尾检验。(1)

假设H0

:p≤p0=0.80,即该批种蛋不合格。对HA:

p>p0

;(2)

确定显著水平α=0.05

;(3)

检验计算:例4.11规定种蛋的孵化率p0>0.80为合格,现对一批97(4)推断:由于|u|<u0.05=1.645,

p>0.05,故接受H0,认为这批种蛋不合格。(4)推断:由于|u|<u0.05=1.645,p>098二、两个样本频率的假设检验检验两个样本频率和差异显著性,一般假定两个样本的方差是相等的,即σp12=σp22。这类检验在实际应用中具有更重要的意义。由于在抽样试验中,其理论频率p为未知数,就不能对两样本某属性出现的次数进行比较,只能进行频率的比较。二、两个样本频率的假设检验检验两个样本频率和99和单个样本频率的假设检验一样,当np或nq<5,则按二项分布直接进行检验;当np或nq>5时,用u检验,并需进行连续性矫正;当np或nq均大于30时,则可不进行连续性矫正。两个样本频率差数标准误为:(4.26,5.18)和单个样本频率的假设检验一样,当np或nq<5,则按二项分布100(4.27,5.21)(4.28)(4.29,5.22)(4.27,5.21)(4.28)(4.29,5.22)101如果n1<30,n2<30,对式4.29,可用t代替u值;对式4.30,可用tc代替uc值,进行t检验。例4.12

研究地势对小麦锈病发病的影响,调查低洼地麦田378株,其中锈病株342株,调查高坡地麦田396株,其中锈病株313株,试比较两块麦田锈病发病率是否有显著性差异。(4.30)如果n1<30,n2<30,对式4.29,可用t代替u值;对102分析:本题np和nq均大于30,不需进行连续性矫正。又事先不知两块麦的锈病发病率孰高孰低,故进行双尾检验。(1)

假设H0

:p1=p2

,即两块麦田锈病发病率没有显著差异。对HA

:

p1≠p2

;(2)

确定显著水平α=0.01

;(3)

检验计算:分析:本题np和nq均大于30,不需进行连续性矫正。又事先不103(4)推断:由于|u|>u0.01=2.58,p<0.01,故否定H0

,接受HA

,认为两块麦田锈病发病率有极显著差异。(4)推断:由于|u|>u0.01=2.58,p<0.01,104例4.13

某养鱼场发生了药物中毒,抽查甲池中的29鱼尾中有20尾死亡,抽查乙池中28鱼尾中有21尾死亡,试检验甲、乙两池发生药物中毒后,鱼的死亡是否有差异。分析:本题np和nq均小于30,需进行连续性矫正。采用双尾检验。(1)

假设H0

:p1=p2

,即甲、乙两池鱼的死亡率没有显著差异。对HA

:

p1≠

p2

;例4.13某养鱼场发生了药物中毒,抽查甲池中的29鱼尾105(2)

确定显著水平α=0.05;(3)

检验计算:(2)确定显著水平α=0.05;106(4)推断:接受H0

,认为发生药物中毒后,甲、乙两鱼池鱼的死亡率没有显著差异。(4)推断:接受H0,认为发生药物中毒后,甲、乙两鱼池鱼的107第四节参数的区间估计与点估计第四节参数的区间估计与点估计108

参数估计是统计推断的另一个方面,它是指由样本结果对总体参数在一定概率水平下所作出的估计。参数估计包括区间估计和点估计。一、参数区间估计与点估计的原理

参数的区间估计和点估计是建立在一定理论基础上的一种方法。参数估计是统计推断的另一个方面,它是指由样本结果对总体参数109由中心极限定理和大数定理得知,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似服从的正态分布,因而,当概率水平α=0.05或0.01时,即置信度为P=1-α=0.95或0.99的条件下,有:(4.31)(4.32)由中心极限定理和大数定理得知,只要抽样为大样本,不论其总体是110(4.33)(4.34)(4.35)(4.33)(4.34)(4.35)111上面式子表明,尽管我们只知道

而不知道μ

,但知道区间

内包含μ在内的可靠程度为1-α

,其中, 叫做μ的1-α置信区间。(4.36)对于μ的1-α置信区间的下限L1和上限L2可写作:上面式子表明,尽管我们只知道而不知道μ,但知道区112区间(L1,

L2)便是用样本平均数对总体平均数μ的置信度为P=1-α的区间估计。那么,可用:(4.37)表示样本平均数对总体平均数μ的置信度为P=1-α的点估计。当α=0.05时,包含有μ的置信度为0.95的区间估计和点估计为:(4.38)区间(L1,L2)便是用样本平均数对总体平均数μ113实际上,参数的区间估计也可用于假设检验,因为置信区间是在一定置信度P=1-α下总体参数的所在范围,故对参数所进行的假设如果落在该区间内,就说明这个假设与真实情况没有不同,因而就可以接受H0。(4.39)当α=0.01时,包含有μ的置信度为0.99的区间估计和点估计为:(4.40)(4.41)实际上,参数的区间估计也可用于假设检验,因为置信区间是在一定114反之,如果对参数所进行的假设落在区间之外,则说明假设与真实情况有本质的不同,就应否定H0

,接受HA。注意:无论区间估计还是点估计,都与概率显著水平α的大小联系在一起,

α越小,则相应的置信区间就越大,也就是说用样本平均数对总体平均数估计的可靠程度越高,但这时估计的精度就降低了。在实际应用中,应合理选取概率显著水平α的大小,不能认为α取值越小越好。反之,如果对参数所进行的假设落在区间之外,则说明假设与真实情115二、总体平均数μ的区间估计与点估计当总体方差σ2为已知或总体方差σ2未知但为大样本时,可以利用样本平均数和总体方差σ2作出在置信度为P=1–α下的总体平均数μ的区间估计:由式4.36,其置信区间的下限L1和上限L2为:二、总体平均数μ的区间估计与点估计当总体方差σ2为已知或总体116当样本为小样本且总体方差σ2未知时,

σ2需由样本方差S2来估计,于是置信度为P=l-α的总体平均数μ的置信区间可估计为:由式4.37,总体平均数μ的点估计L为:(4.42)其置信区间的下限L1和上限L2为:(4.43)当样本为小样本且总体方差σ2未知时,σ2需由样本方差S2来117例4.14

测得某批25个小麦样本的平均蛋白质含量

=14.5%,已知σ=2.50%,

试进行95%置信度下的蛋白质含量的区间估计和点估计。分析:本例σ为已知,置信度P=1-σ=0.95,即α=0.05,查附表2得u0.05=1.96。由σ可求出:(4.44)例4.14测得某批25个小麦样本的平均蛋白质含量118(生统与田试)第四章--统计假设检验6课件119

例4.15

从某鱼场收虾的总体中,随机取20尾对虾,测得平均体长,标准差,试估计置信度为99%的对虾总体平均数。分析:本例中,由于总体方差σ2未知,需用S2估计σ2

。查附表4,当dƒ=20–1=19时,t0.01=2.861。具体计算如下:例4.15从某鱼场收虾的总体中,随机取20尾对虾,测得120(生统与田试)第四章--统计假设检验6课件121三、两个总体平均数差数μ1-μ2的区间估计与点估计当两个总体方差σ12和σ22为已知,

或总体方差σ12和σ22未知但为大样本时,在置信度为P=1–α下,两个总体平均数差数μ1–μ2的区间估计为:(4.45,5.28A)三、两个总体平均数差数122当两个样本为小样本,且两总体方差σ12和σ22未知,但两总体方差相等,即σ12=σ22=σ2时,可由两样本方差S12和S22估计总体方差σ12和σ22。(4.46,5.28B)(4.47)当两个样本为小样本,且两总体方差σ12和σ22未知,但两总123在置信度为P=1–α下,两个总体平均数差数μ1–μ2的区间估计为:(4.48,5.29A)(4.49,5.29B)(4.50)这里,dƒ=n1+n2-2在置信度为P=1–α下,两个总体平均数差数μ1–μ2124当两个样本为小样本,且两总体方差不相等,即σ12≠σ22

时,由两样本方差S12和S22估计总体方差σ12和σ22

而算出的t值,已不再是dƒ=n1+n2-2的t分布,

而是近似服从自由度为dƒ′的t分布,在置信度为P=1–α下,两个总体平均数差数μ1–μ2的区间估计为:(4.51,5.32A)当两个样本为小样本,且两总体方差不相等,即σ12≠σ22时125当两样本为成对资料时,在置信度为P=1–

α时,两个总体平均数差数μ1–μ2的区间估计为:(4.53)上面三式中,tα,

dƒ′为置信度为置信度为P=1–α时自由度为dƒ′的t临界值。当两样本为成对资料时,在置信度为P=1–α时,两个总体平126例4.16

对例4.6数据进行置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。(4.54,5.33A)(4.55,5.33B)(4.56)例4.16对例4.6数据进行置信度为95%时两种蛋白饲料127解:在例4.6中,已算得

,

,并查得附表4,当dƒ=17时,t0.05=2.110,所以置信度为95%时两种蛋白饲料饲养的大白鼠增重的差数区间估计为:解:在例4.6中,已算得128分析:在例4.9中,已算得

,从附表4中查得,当dƒ=7时,t0.01=3.499

。于是,两种饲料饲养下动物肝中维生素A含量差数的区间估计为:例4.17

试对表4—1资料进行置信度为99%的区间估计和点估计分析:在例4.9中,已算得 , 129两种饲料饲养下动物肝中维生素A含量差数的点估计为两种饲料饲养下动物肝中维生素A含量差数的点估计为130四、总体频率p、两总体频率差数pl-p2的区间估计与点估计(4.57,5.34B)(4.58)(4.59)四、总体频率p、两总体频率差数pl-p2的区间估计与点估计131当样本容量较小或者np、nq远小于30时,对总体频率p进行的区间估计和点估计需要作连续性矫正,矫正公式为:(4.60)(4.61)

在进行两个总体频率差数pl–p2的区间估计和点估计时,一般应明确两个频率有显著差异才有意义。在置信度为P=1–α下,两个总体频率差数p1–p2的区间估计为当样本容量较小或者np、nq远小于30时,对总体频率p进行的132例4.18

调查100株玉米,得到受玉米螟为害的为20株,即

=0.2或np=20。试进行置信度为95%的玉米螟为害率的区间估计和点估计。(4.62)(4.63)(4.64)例4.18调查100株玉米,得到受玉米螟为害的为20株,133分析:分析:134例4.19

利用例4.12计算结果,试进行置信度为99%的两块麦田锈病发病率差数的区间估计和点估计。分析:所以置信度为99%的两块麦田锈病发病率差数的区间估计为:例4.19利用例4.12计算结果,试进行置信度为99%的135(生统与田试)第四章--统计假设检验6课件136第五节方差的同质性检验

第五节方差的同质性检验

137平均数、频率表示的是计量数据资料的中心位置,但其代表性的好坏,与样本资料中各个观测数的变异程度密切相关,而方差是表示变异度的一个重要统计数。事实上,对样本平均数、频率的假设检验,是以方差的同质性为前提的,否则假设检验的结论将是不正确的。方差的同质性,就是指各个总体的方差是相同的。方差同质性检验,就是要从各样本的方差来推断其总体方差是否相同。平均数、频率表示的是计量数据资料的中心位置,但其代表性的好坏138一、一个样本方差的同质性检验从式3.46中,我们知道,从标准正态总体中抽取k个独立u2之和为χ2

,即:(4.65,7.2)(4.66,7.3)一、一个样本方差的同质性检验从式3.46中,我们知道,从标准139上式中,分子表示样本的离散程度,分母表示总体方差,其χ2服从自由度为n-1的χ2分布。(4.67,7.3)上式中,分子表示样本的离散程度,分母表示总体方差,其χ2服从140由于附表6所列出的为单尾(右尾)概率,所以,进行右尾检验时,否定区为χ2>

χ2α

;进行左尾检验时,否定区为χ2

χ21-α

例4.20

已知某农田受到重金属的污染,经抽样测定其铅浓度为4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2(ug·g-1)2,方差为0.150

(ug·g-1)2

,试检验受到污染的农田铅浓度的方差是否高于正常农田铅浓度的方差0.065

(ug·g-1)2。由于附表6所列出的为单尾(右尾)概率,所以,进行右尾检验时,141分析:此题为一个样本方差与总体方差的同质性检验。(1)

假设H0

:σ2

0.065,即受到污染的农田铅浓度的方差与正常农田铅浓度的方差相同。对HA

:

σ2

0.065;(2)

确定显著水平α=0.05;(3)

检验计算:

分析:此题为一个样本方差与总体方差的同质性检验。142查附表6,当dƒ=8–1=7时,

χ20.05

=14.07,

χ20.95

=2.17,

现实得

χ2

>χ20.05;(4)推断:否定H0

,接受HA

,即样本方差与总体方差是不同质的,认为受到污染的农田铅浓度的方差与正常农田铅浓度的方差0.065

(ug·g

-1)2有显著差异。查附表6,当dƒ=8–1=7时,χ20.05=143二、两个样本方差的同质性检验

假设两个样本的样本容量分别为n1和n2,方差分别为S12和S22(一般把数值较大的样本方差作为S12),总体方差分别为σ12和σ22

,当检验σ12和σ22是否同质时,可用F检验法。根据式3.49,当两样本所属总体均服从正态分布,且两样本的抽样是随机的和独立的,其F值等于两样本方差S12和S22之比,即:二、两个样本方差的同质性检验假设两个样本的样本容量分别为n144服从dƒ1=n1-1,dƒ2=n2-1的F分布。当F<Fα时,接受H0:σ12=σ22

,即认为两样本的方差是同质的;当F>Fα

时,否定H0

σ12=σ22

,接受HA

σ12≠σ22

,即认为两样本的方差不是同质的。例4.21

检验例4.7中两个小麦品种千粒重的方差是否同质。分析:

该题中,S12=22.933,S22=2.933,nl=n2=10。服从dƒ1=n1-1,dƒ2=n2-1的F分布。当F145(1)

假设H0:σ12=σ22

;HA:σ12

σ22

;(2)

确定显著水平α=0.05

;(3)

检验计算:(1)假设H0:σ12=σ22;HA:σ12≠146版权所有

引用本片内容请注明出处设计制作:Dr.瞿波华中农业大学植物科学技术学院版权所有

引用本片内容请注明出处设计制作:Dr.瞿波147(生统与田试)第四章统计假设检验6(生统与田试)第四章统计假设检验6148本章主要内容由样本的结果如何来推断总体

假设检验参数估计分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断本章主要内容149第一节假设检验

的原理与方法第一节假设检验

的原理与方法150一、假设检验的概念假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。一、假设检验的概念假设检验就是根据总体的理论分布和小概率原151如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。

生物统计学中,一般认为小于0.05或0.0l的概率为小概率。通过假设检验,可以正确分析处理效应和随机误差,作出可靠的结论。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率152二、假设检验的步骤

在进行假设检验时,一般应包括以下4个步骤:提出假设确定显著水平

计算概率推断是否接受假设二、假设检验的步骤在进行假设检验时,一般应包括以下4个步骤153(一)提出假设

假设检验首先要对总体提出假设(statisticalhypothesis)一般应作两个假设:无效假设,记作H0

;备择假设,记作HA

。(一)提出假设假设检验首先要对总体提出假设(statist154无效假设(nullhypothesis)是直接检验的假设,是对总体提出的一个假想目标。所谓“无效”意指处理效应与总体参数之间没有真实的差异,试验结果中的差异乃误差所致。无效假设(nullhypothesis)是直接检验的假设,155备择假设(alternativehypothesis)是和无效假设相反的一种假设,即认为试验结果中的差异是由于总体参数不同所引起的。因此,无效假设与备择假设是对立事件,在检验中,如果接受H0就否定HA;否定H0则接受HA

备择假设(alternativehypothesis)是和156确定无效假设必须遵循两个原则:①无效假设是有意义的;②据此可算出因抽样误差而获得样本结果的概率。确定无效假设必须遵循两个原则:157(生统与田试)第四章--统计假设检验6课件158(生统与田试)第四章--统计假设检验6课件159(二)确定显著水平在进行无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率标准叫显著水平,记作α。α是人为规定的小概率界限,生物统计学中常取α=0.05和α=0.0l两个显著水平。(二)确定显著水平在进行无效假设和备择假设后,要确定一个否160(三)计算概率在假设H0正确的前提下,根据样本平均数的抽样分布计算出由抽样误差造成的概率。对于上面一个样本平均数的例子,在H0

:μ=μ0的前提下,根据式3.27可求得:(三)计算概率在假设H0正确的前提下,根据样本平均数的抽样161查附表2,P(|u|>1.581)=2×0.057l=0.1142,即在N(126,240)的总体中,以n=6进行随机抽样,所得平均数

=136与126相差为10以上的概率为0.1142查附表2,P(|u|>1.581)=2×0.057l=0.1162注意:检验所计算的并不是实得差异本身的概率,而是超过实得差异的概率。概率的大小,是推断H0是否正确的依据。在H0假设下,由于有可能大于μ,也有可能小于μ,因此需要考虑差异的正和负两个方面,所以一般计算的都是双尾概率。注意:检验所计算的并不是实得差异本身的概率,而是超过实得差异163(四)推断是否接受假设根据小概率原理作出是否接受H0

:小概率原理指出:如果假设一些条件,并在假设的条件下能够准确地算出事件A出现的概率α为很小,则在假设条件下的n次独立重复试验中,事件A将按预定的概率发生,而在一次试验中则几乎不可能发生(“小概率事件实际上不可能发生”)。(四)推断是否接受假设根据小概率原理作出是否接受H0:小概164统计学中,常把概率小于0.05或0.01作为小概率。如果计算的概率大于0.05或0.01,则认为不是小概率事件;H0的假设可能是正确的,应该接受,同时否定HA

;反之,所计算的概率小于0.05或0.01,则否定H0,接受HA

。统计学中,常把概率小于0.05或0.01作为小概率。165通常把概率等于或小于0.05叫做差异显著标准,或差异显著水平(significancelevel);等于或小于0.01叫做差异极显著标准,或差异极显著水平。一般差异达到显著水平,则在资料的右上方标以“*”,差异达到极显著水平,则在资料右上方标以“**”。通常把概率等于或小于0.05叫做差异显著标准,或差异显著水平166

上例中,所计算的概率为0.1142,大于0.05的显著水平,应接受H0

,可以推断治疗前后的血红蛋白含量未发现有显著差异,其差值10(mg·L-1)应归于误差所致。在实际检验时,可将上述计算简化。由例3.10已知P(|u|>1.96)=0.05,P(|u|>2.58)=0.01,因此,在用u分布进行检验时,如果算得|u|>1.96,就是在α=0.05的水平上达到显著,如果|u|>2.58,就是在α=0.0l的水平上达到显著,即达到极显著水平,勿须再计算u值的概率。上例中,所计算的概率为0.1142,大于0.05的显著水平167(生统与田试)第四章--统计假设检验6课件168样本频率、变异数以及多个平均数的假设检验,都应根据试验目的提出无效假设和备择假设。提出无效假设的目的:可从假设的总体中推论其平均数的随机抽样分布,从而可以算出某一样本平均数指定值出现的概率,这样就可以根据样本与总体的关系,作为假设检验的理论依据。样本频率、变异数以及多个平均数的假设检验,都应根据试验目的提169综上所述,假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0和备择HA

;(2)确定检验的显著水平α;(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;(4)根据显著水平α的u值临界值,进行差异是否显著的推断。综上所述,假设检验的步骤可概括为:170三、双尾检验与单尾检验

Two-tailedtestandone-tailedtest

进行假设检验时,需要提出无效假设和备择假设。提出的这种假设,其总体平均数μ可能大于μ0,也可能小于μ0。在样本平均数的抽样分布中,对于α=0.05时,落在区间(μ-1.96,μ+1.96)的

有95%,落在这一区间之外(即≤μ-1.96和≥μ+1.96)的

只有5%。三、双尾检验与单尾检验

Two-tailedtestan171同理,对于α=0.01时,落在区间(μ-2.58,μ+2.58)的有99%,落在这一区间之外(即≤μ-2.58和≥μ+2.58)的只有1%。在进行假设检验时,前者相当于接受H0的区域,简称接受区(acceptanceregion);后者相当于否定H0的区域,简称否定区(rejectionregion

)(图4.1)。同理,对于α=0.01时,落在区间(μ-2.58,172(生统与田试)第四章--统计假设检验6课件173一般将接受区和否定区的两个临界值写作μ±uα

,即当

在(μ-uα,μ+uα

)内为H0的接受区,而≤μ-

和≥μ+

为H0的两个否定区;x≤μ-uα

:为左尾否定区,

≥μ+

为右尾否定区。上述假设检验的两个否定区,分别位于分布的两尾,称为双尾检验。一般将接受区和否定区的两个临界值写作μ±uα,即当在174当假设检验的 时,则 ,这时备择假设就有两种可能,或

或 ,也就是说在 的情况下,样本平均数有可能落入左尾否定区,也有可能落入右尾否定区,这两种情况都属于 的情况。例如,检验某种新药与旧药的治病疗效是否有差别,就是说新药疗效比旧药好还是旧药疗效比新药好,两种可能性都存在,相应的假设检验就应该用双尾检验。在生物学研究中,双尾检验的应用是非常广泛的。当假设检验的 时,则 ,这

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论