生物统计学:第四章 统计推断差异显著性检验_第1页
生物统计学:第四章 统计推断差异显著性检验_第2页
生物统计学:第四章 统计推断差异显著性检验_第3页
生物统计学:第四章 统计推断差异显著性检验_第4页
生物统计学:第四章 统计推断差异显著性检验_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计推断(差异显著性检验)1生命科学与技术学院欧阳乐军制作

前面主要讨论了从总体到样本的关系,本章将讨论逆命题—从样本到总体的问题,即统计推断问题。所谓统计推断(statisticalinference),就是根据抽样分布律和概率理论,进行假设检验2生命科学与技术学院欧阳乐军制作例:某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:

我们能否根据10公斤的差异就判定这两个水稻品种平均产量不同?结论是,不一定。3生命科学与技术学院欧阳乐军制作因为两个水稻品种平均产量都是从试验种植的10个小区获得,仅是两个品种有关总体平均数μ的估计值。由于存在试验误差,样本平均数并不等于总体平均数,样本平均数包含总体平均数与试验误差二部分,即

=μ0+εi

(i=1,2,…,n)4生命科学与技术学院欧阳乐军制作

显著性检验的目的在于判明,试验差异主要是由试验的真实差异造成的,还是由试验误差造成的,从而得到可靠的结论。

5生命科学与技术学院欧阳乐军制作

统计假设测验是指根据于某种实际需要,对未知的或不完全知道的统计总体提出一些假设;然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的测验。6生命科学与技术学院欧阳乐军制作4.1

统计假设测验的基本原理4.1.1统计假设4.1.2统计假设测验的基本方法4.1.3两尾测验与一尾测验4.1.4统计假设的两类错误7生命科学与技术学院欧阳乐军制作4.1.1统计假设由于总体多是无限的(尤其是自然科学),往往需要用样本推断总体,因此首先需要提出一个有关其总体参数的假设。例如假设某小麦新品种的产量和原地方品种的产量一样,或者比旧地方品种好。这种假设称为统计假设(statisticalhypothesis)。下面是一些统计假设的例子:8生命科学与技术学院欧阳乐军制作一、单个平均数的假设一个样本是从具有平均数μ0的总体中随机抽出的,记作H0:μ=μ0。例如:1、某一小麦品种的产量具有原地方品种的产量,这指新品种的产量表现乃原地方品种产量表现的一个随机样本,其平均产量μ等于某一指定值μ0,故记为

H0:μ=μ02、某一棉花品种的纤维长度(μ)具有工业上某一指定标准(C),可记为H0:μ=C9生命科学与技术学院欧阳乐军制作二、两个样本平均数比较的假设两个样本乃从两个具有相同参数的总体中随机抽出的,记为H0:μ1=μ2或H0:μ1-μ2=0例如:(1)两个小麦品种的产量是相同的。(2)两种杀虫剂对于某种害虫的药效是相等的。10生命科学与技术学院欧阳乐军制作上述假设称为无效假设(nullhypothesis)(零假设)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等,即假设没有效应差异,或者说实得差异是由抽样误差造成的。11生命科学与技术学院欧阳乐军制作上述假设称为无效假设(nullhypothesis)(零假设)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等,即假设没有效应差异,或者说实得差异是由抽样误差造成的。12生命科学与技术学院欧阳乐军制作备择假设(alternativehypothesis),和无效假设相对立的一个假设,也称为对应假设。记作HA:μ≠μ0或HA:μ1≠μ2。意思是说,如果否定了无效假设,则必须接受备择假设,反之亦然。这些统计假设构成了完全事件系。13生命科学与技术学院欧阳乐军制作三、统计假设测验的基本思想设某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数为μ0=300(kg),并从多年种植结果获得其方差σ2=(75)2kg。若从这一总体中随机抽取n个个体构成样本,则样本观察值可表示为:

yi=μ0+εi(i=1,2,…,n)14生命科学与技术学院欧阳乐军制作现有某新品种通过25个小区的试验,计算其样本平均产量为每667m2330kg。新品种的样本观察值可表示为:yi=μ+εi(i=1,2,…,n)式中μ为新品种的总体平均数。新品种与地方品种的差异(品种效应)用τ表示,则τ

=μ-μ0

15生命科学与技术学院欧阳乐军制作代入上式得:yi=μ0+τ+εi(i=1,2,…,n)对yi求平均数,并将式子稍作变形得:-μ0=τ+为表型效应,在本例中,τ为处理效应,为误差效应。16生命科学与技术学院欧阳乐军制作

由于处理效应τ

=μ-μ0

无法计算,统计推断只能从第(2)种可能性出发,即假设处理效应不存在,试验表型效应全为试验误差。(1)处理效应与误差效应;(2)全为试验误差。-μ0=τ+从式可知表型效应的构成有二种可能性17生命科学与技术学院欧阳乐军制作

然后再计算该假设出现的概率,最后依概率的大小判断假设是否成立,从而推断处理效应是否存在(反证法)。这就是统计假设测验的基本思想。18生命科学与技术学院欧阳乐军制作4.1.2统计假设测验的基本方法

设某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数μ0=300(kg),并从多年种植结果获得其标准差σ2=752(kg),而现有某新品种通过25个小区的试验,计算其样本平均产量为每667m2产330kg,即=330,那么新品种样本所属总体与μ0=300的当地品种这个总体是否有显著差异呢?19生命科学与技术学院欧阳乐军制作一、对所研究的总体首先提出一个无效假设H0:μ=μ0或:H0:μ=300即新品种与老品种之间不存在真实的差异,样本平均数二、在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率对应假设为:HA:μ≠μ0与μ0之间的差数:330-300=30(kg)属随机误差。20生命科学与技术学院欧阳乐军制作先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。通过试验,如果新品种的平均产量很接近300kg,例如301kg或299kg等,则试验结果当然与假设相符,于是应接受H0。如果新品种的平均产量为500kg,与总体假设相差很大,那当然应否定H0。但如果试验结果与总体假设并不相差悬殊,就要借助于概率原理,具体做法有以下两种:21生命科学与技术学院欧阳乐军制作1.计算概率在假设

为正确的条件下,根据的抽样分布算出获得=330kg的概率,或者说算得出现随机误差=30(kg)的概率:在此,根据u测验公式可算得:因为假设是新品种产量有大于或小于当地品种产量的可能性,所以需用两尾测验。查附表3,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果:=30(kg),属于抽样误差的概率小于5%。

22生命科学与技术学院欧阳乐军制作2.计算接受区和否定区在假设H0为正确的条件下,根据的抽样分布划出一个区间,如在这一区间内则接受H0,如在这一区间外则否定H0。如何确定这一区间呢?根据上章所述和的分布,可知:

因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。23生命科学与技术学院欧阳乐军制作如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptanceregion);和为否定假设的区域,简称否定区(rejectionregion)。同理,若以1%作为接受或否定H0的界限,则()为接受区域,和为否定区域。

所以在测验时需先计算1.96

或2.58

,然后从加上和减去1.96

或2.58

,即得两个否定区域的临界值。24生命科学与技术学院欧阳乐军制作如上述小麦新品种例,

=300,,1.96=29.4(kg)。因之,它的两个2.5%概率的否定区域为

≤300-29.4和

≥300+29.4,即大于329.4(kg)和小于270.6(kg)的概率只有5%(见图5.1)。图5.15%显著水平假设测验图示(表示接受区域和否定区域)25生命科学与技术学院欧阳乐军制作

(三)根据“小概率事件实际上不可能发生”原理接受或否定假设当由随机误差造成的概率小于5%或1%时,就可认为它不可能属于抽样误差,从而否定假设。如果因随机误差而得到某差数的概率P<0.05,则称这个差数是显著的。如果因随机误差而得到某差数的概率P<0.01,则称这个差数是极显著的。而这种假设测验也叫显著性测验。用来测验假设的概率标准5%或1%等,称为显著水平(significancelevel)。

一般以表示,如=0.05或=0.01。26生命科学与技术学院欧阳乐军制作综合上述,统计假设测验的步骤可总结如下:

(1)对样本所属的总体提出统计假设,包括无效假设和备择假设。

(2)规定测验的显著水平值。

(3)在为正确的假定下,根据平均数()或其他统计数的抽样分布,如为正态分布的则计算正态离差u值。由u值查附表3即可知道因随机抽样而获得实际差数(如等)由误差造成的概率。或者根据已规定概率,如=0.05,查出u=±1.96,因而划出两个否定区域为:和

(4)将规定的值和算得的u值的概率相比较,或者将试验结果和否定区域相比较,从而作出接受或否定无效假设的推断。27生命科学与技术学院欧阳乐军制作4.1.3两尾测验与一尾测验在提出一个统计假设时,必有一个相对应的备择假设。例如上述单个平均数测验,若H0:μ=μ0,则备择假设为HA:μ≠μ0。后者即指该新品种的总体平均产量不是300kg,这包括大于300kg和小于300kg两种可能性。28生命科学与技术学院欧阳乐军制作因而在假设测验时所考虑的概率为正态曲线左边一尾概率(小于300kg)和右边一尾概率(大于300kg)的总和。这类测验称为两尾测验(two-tailedtest),它具有两个否定区域。29生命科学与技术学院欧阳乐军制作0.000.010.02285300270255y0.03315330345fN

(y)接受区域95%否定区域2.5%否定区域2.5%270.6329.430生命科学与技术学院欧阳乐军制作但在某些情况一下,两尾测验不一定符合实际需要。例如,某型计算机的寿命(使用时数)规定为≥μ0。如果进行抽样测验,则在>μ0时,都不需要否定H0;但如果<μ0,即可能是一批不合格产品。因此,测验的假设应为H0:μ≥μ0(产品合格)对

HA:μ<μ0(产品不合格)。这样否定区在左尾。31生命科学与技术学院欧阳乐军制作反之,如果<μ0是不需要否定H0的(如农产品中有毒物质的含量),而>μ0却可能有严重后果,则所作假设应为:H0:μ≤μ0对HA:μ>μ0。这时否定区就只有右尾。32生命科学与技术学院欧阳乐军制作μ0接受区α=0.05否定区μ0左尾测验否定区α=0.05接受区右尾测验0.950.9533生命科学与技术学院欧阳乐军制作4.1.4统计假设的两类错误统计假设测验是根据一定的概率标准对总体特征作出推断。否定了H0,并不等于已证明H0不真实;接受了H0,也不等于已证明H0是真实的。如果H0是真实的,我们通过测验却否定了它,就犯了一个否定真实假设的错误。这叫第一类错误(firstkinderror)或I型错误。由于规定了显著水平α值,就注定要犯错误,故I型错误又称为α错误。34生命科学与技术学院欧阳乐军制作

如果H0是错误的,我们通过测验没有发现其不真实而接受了它,即犯了一个接受不真实的H0的错误。这叫第二类错误(secondkinderror)或II型错误。由于犯这类错误的概率通常用β表示,故又称其为β错误。现以P83上的例子说明β值的计算。35生命科学与技术学院欧阳乐军制作β值的计算。已知总体的均值300,其平均数抽样标准误为15,被抽样的总体平均数315kg、标准误也为15,由此可以画出这两个总体的分布曲线如图4.2,图中标出了已知总体的接受区域在c1和c2之间。由于两个总体的平均数不同,这种可能性正是第二类错误的概率值,其一般计算方法为:36生命科学与技术学院欧阳乐军制作μβ=83%c1c2255270285300315330345360μ0270.6329.4图4.2

:=300是错误时的β

值37生命科学与技术学院欧阳乐军制作329.4c1c2255270285300315330345360μ0375390μ15%38生命科学与技术学院欧阳乐军制作255270285300315330345360μ0μ39生命科学与技术学院欧阳乐军制作两类错误的要点:1、在样本容量n固定的条件下,提高显著水平α的值,将减小犯β错误的概率。2、在n和显著水平α相同的条件下,真总体平均数μ和假设平均数μ0

相差愈大,则犯第二类错误的概率β愈小。3、为了降低犯两类错误的概率,需要采用一个较低的显著水平,如α=0.05;同时适当增加样本容量,或适当减小总体方差,或两者兼有之。4、如果显著水平α已经确定,则改进试验技术和增加样本容量,可以有效地降低犯第二类错误的概率。40生命科学与技术学院欧阳乐军制作4.2单个样本平均数的假设测验4.2.1u检验4.2.2t

分布及t检验41生命科学与技术学院欧阳乐军制作4.2.单个样本平均数的假设测验4.2.1检验从一个平均数为、方差为σ2

的正态总体中抽样,样本平均数的分布必趋向正态分布并且N(u,σ2/n)例5.4(P87)42生命科学与技术学院欧阳乐军制作4.2.2t

分布及t检验当样本容量不太大(n<30)而σ2为未知时,前已述及,从一个N(μ,σ2)中抽样,或者在一个非正态总体里抽样只要样本容量足够大,则所得一系列样本平均数的分布必趋向正态分布,具有N(μ,σ2/n)。43生命科学与技术学院欧阳乐军制作如以样本均方s2估计σ2,则其标准化离差的分布不呈正态分布,而作t分布:44生命科学与技术学院欧阳乐军制作t-分布(t-distribution)是1908年W.S.Gosset首先提出的,又叫学生氏分布(studenttdistribut

ion)。它是一组对称密度函数曲线,具有一个单独参数df以确定某一特定分布。df是自由度。当df

增大时,t-分布趋向于正态分布。

t-分布的密度函数为:

45生命科学与技术学院欧阳乐军制作0.000.100.150.200.2502-2-440.300.350.400.45正态分布t分布(ν=4)标准化正态分布与自由度为4的t分布曲线46生命科学与技术学院欧阳乐军制作47生命科学与技术学院欧阳乐军制作和正态概率累积函数一样,t分布的概率累积函数也分一尾和两尾表。一尾表为t到∞的面积,两尾表为﹣∞到-t

和t到∞两个相等尾部的和。附表4(P329)是t值表。按t分布进行的假设测验称t测验。在t表中,若df相同,则α越大,t越小;α越小,t越大。48生命科学与技术学院欧阳乐军制作4.2.2单个样本平均数的假设测验这是测验某一样本所属的总体平均数是否和某一指定的总体平均数相同。[例5.1]某春小麦良种的千粒重μ0=34g,现自外地引入一高产品种,在8个小区种植,得其千粒重(g)

35.6,37.6,33.4,35.1,32.7,36.8,35.9,34.6,问新引入品种的千粒重与当地良种有无显著差异?49生命科学与技术学院欧阳乐军制作测验步骤为:H0:新引入品种千粒重与当地良种千粒重指定值相同,即μ=μ0=34g;对HA:μ≠34g显著水平α=0.05测验计算:

=(35.6+37.6+…+34.6)/8=35.2(g)50生命科学与技术学院欧阳乐军制作51生命科学与技术学院欧阳乐军制作查附表4,ν=7时,t

0.05=2.365。现实得|t|<tα=2.365,故P>0.05。推断:接受H0:μ=34g,即新引入品种千粒重与当地良种千粒重指定值无显著差异。52生命科学与技术学院欧阳乐军制作习题

用山楂加工果冻儿,传统工艺平均每100g山楂出果冻儿500g.现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻儿平均数为520g,标准差为S=12g,问新工艺与传统工艺之间有无极显著差异?

在此例中,总体方差未知,而样本容量又不大,所以应该用t测验。其测验步骤如下:53生命科学与技术学院欧阳乐军制作.提出假设.H0:=0,即新工艺和传统工艺之间无极显著差异;对HA:0,即新工艺和传统工艺之间存在极显著差异..确定显著水平..检验计算.均数标准误统计量t值自由度df=n-1=16-1=15(t0.-1(df=15)=2.947).统计推断.本例推断否定H0而接受HA.即新工艺和传统工艺之间存在极显著差异.54生命科学与技术学院欧阳乐军制作4.3两个样本平均数的假设测验这是由两个样本平均数的相差,以测验这两个样本所属的总体平均数有无显著差异。测验的方法因试验设计的不同而分为成组数据的平均数比较和成对数据的比较两种。55生命科学与技术学院欧阳乐军制作1、在两个样本的总体方差已知时,用u测验。一、成组数据的平均数比较

如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组平均数作为相互比较的标准。56生命科学与技术学院欧阳乐军制作由抽样分布的公式知,两样本平均数和的差数标准误,在和是已知时为:并有:在假设

下,正态离差u值为,故可对两样本平均数的差异作出假设测验。57生命科学与技术学院欧阳乐军制作[例4.3.1]据以往资料,已知某小麦品种每平方米产量的σ2=0.4(kg)2。今在该品种的一块地上用A、B两法取样,A法取了12个样点,得每平方米=1.2(kg);B法取得8个样点,得=1.4(kg)。试比较A、B两法的每平方米产量是否有显著差异?系随机误差;假设H0:A、B两法的产量相同,即H0:58生命科学与技术学院欧阳乐军制作推断:接受H0:μ1=μ2,即A、B两种取样方法所得每平方米产量没有显著差异。测验计算:因为实得|u|<u0.025=1.96,故P>0.05。59生命科学与技术学院欧阳乐军制作的加权平均值,即:

2、在两个样本的总体方差和为未知,但可假定==σ2,而两个样本又为小样本时,用t测验。首先,从样本变异算出平均数差数的均方,作为对σ2的估计。由于可假定==σ2,故应为两样本均方60生命科学与技术学院欧阳乐军制作61生命科学与技术学院欧阳乐军制作由于假设H0:μ1=μ2,故上式为:[例4.3.2]研究矮壮素使玉米矮化的效果,在抽穗期测定喷矮壮素小区8株、对照区玉米9株,其观察值如下表:62生命科学与技术学院欧阳乐军制作y1(喷施矮壮素)160160200160200170150210y2(对照)170270180250270290270230170从理论上判断,喷施矮壮素只可能矮化无效而不可能促进植物长高,因此假设H0:喷施矮壮素的株高与未喷的相同,即H0:μ1=μ2HA:μ1<μ2,即喷施矮壮素的株高较未喷的为矮。显著水平α=0.05。测验计算:63生命科学与技术学院欧阳乐军制作64生命科学与技术学院欧阳乐军制作

按df

=7+8=15,查t表得一尾t0.05=1.753(一尾测验t0.05等于两尾测验的t0.10),现实得t=-3.05<-t0.05=-1.753,故P<0.05。推断:否定H0:μ1=μ2,接受HA:μ1<μ2,即认为玉米喷施矮壮素后,其株高显著地矮于对照。65生命科学与技术学院欧阳乐军制作练习

调查某农场每亩30万苗和35万苗的稻田各5块,得亩产量(单位:kg)于表5.2,试测验两种密度亩产量的差异显著性。表5.2

两种密度的稻田亩产(kg)y1(30万苗)y2(35万苗)400450420440435445460445425420假设H0:两种密度的总体产量没有差异,即对显著水平=0.05

测验计算:=428kg=440kg

SS1=1930SS2=550

故66生命科学与技术学院欧阳乐军制作查附表4,v=4+4=8时,t0.05=2.306。现实得|t|=1.08<t0.05,故P>0.05。推断:接受假设

,两种密度的亩产量没有显著差异。67生命科学与技术学院欧阳乐军制作二、成对数据的比较

若试验设计是将性质相同的两个供试单位配成对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。

68生命科学与技术学院欧阳乐军制作成对数据,由于同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件差异又可通过同一配对的差数予以消除,因而可以控制试验误差,具有较高的精确度。设两个样本的观察值分别为y1和y2,共配成n对,各个对的差数为d=y1-y2,差数的平均数为69生命科学与技术学院欧阳乐军制作它具有ν=n-1。若假设H0:μd=0,则上式改成:,则差数平均数的标准误为:即可测验H0:μd=0。70生命科学与技术学院欧阳乐军制作[例]选生长期、发育进度、植株大小和其它方面皆比较一致的两株番茄构成一组,共得7组,每组中一株接种A处理病毒,另一株接种B处理病毒,以研究不同处理方法的纯化的病毒效果,表中结果为

组别y1(A法)y2(B法)d11025-152131213814-64315-1252027-76202007618-1271生命科学与技术学院欧阳乐军制作病毒在番茄上产生的病痕数目,试测验两种处理方法的差异显著性。假设:两种处理对纯化病毒无不同效果,即:H0:μd=0

;对HA:μd≠0。显著水平α=0.01。测验计算:72生命科学与技术学院欧阳乐军制作查附表4,ν=7-1=6时,t0.01=3.707。实得|t|>t0.01,故P<0.01。推断:否定H0:μd=0,接受HA:μd≠0,即A、B两法对纯化病毒的效应有极显著差异。73生命科学与技术学院欧阳乐军制作练习

现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见下表。问两种饲料喂饲仔猪增重有无极显著差异?74生命科学与技术学院欧阳乐军制作:=0,即假定两种饲料喂饲仔猪平均增重无差异:≠0,即假定两种饲料喂饲仔猪平均增重有差异2、计算得=0.975,故且=8-1=7=8-1=7查临界值,作出统计推断由df=7,查值表得:=3.499,|t|>3.499,P<0.01,表明甲种饲料与乙种饲料喂饲仔猪平均增重差异极显著,这里表现为甲种饲料喂饲仔猪的平均增重极显著高于乙种饲料喂饲的仔猪平均增重。1、提出无效假设与备择假设75生命科学与技术学院欧阳乐军制作本章总结

一、统计推断的基本概念统计推断(statisticalinference),就是根据抽样分布律和概率理论,进行假设检验和总体参数估计。统计推断的基本内容两个样本平均数的比较单个样本差异显著性检验76生命科学与技术学院欧阳乐军制作例:某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:

我们能否根据二者的差值10kg,就判定这两个水稻品种平均产量不同?结论是,不一定。77生命科学与技术学院欧阳乐军制作因为两个水稻品种平均产量都是从试验种植的10个小区获得,仅是两个品种有关总体平均数μ的估计值。由于存在试验误差,样本平均数并不等于总体平均数,样本平均数包含总体平均数与试验误差二部分,即

=μ0+εi

(i=1,2,…,n)78生命科学与技术学院欧阳乐军制作所以两品种相差10kg是有以下两种可能:(1)处理效应与误差效应;(2)全为试验误差。79生命科学与技术学院欧阳乐军制作

然后再计算该假设出现的概率,最后依概率的大小判断假设是否成立,从而推断处理效应是否存在(反证法)。这就是统计假设测验的基本思想。80生命科学与技术学院欧阳乐军制作统计假设测验的步骤为:对样本所属的总体提出统计假设,包括无效和备择假设。规定测验的显著水平α值。在H0为正确的前提下,根据平均数或其它统计数的抽样分布,计算误差出现的概率。将规定的α值与算得的概率值相比,从而作出接受或否定无效假设的推断。二、统计推断的基本过程81生命科学与技术学院欧阳乐军制作

下面以一个例子说明假设测验方法的具体内容。设某地区的当地小麦品种一般667m2产300kg,即当地品种这个总体的平均数=300(kg),并从多年种植结果获得其标准差=75(kg),而现有某新品种通过25个小区的试验,计得其样本平均产量为每667m2330kg,即

=330,那么新品种样本所属总体与=300的当地品种这个总体是否有显著差异呢?以下将说明对此假设进行统计测验的方法。82生命科学与技术学院欧阳乐军制作

(一)对所研究的总体首先提出一个无效假设通常所做的无效假设常为所比较的两个总体间无差异。测验单个平均数,则假设该样本是从一已知总体(总体平均数为指定值)中随机抽出的,即。如上例,即假定新品种的总体平均数等于原品种的总体平均数=300kg,而样本平均数和之间的差数:330-300=30(kg)属随机误差;对应假设则为。如果测验两个平均数,则假设两个样本的总体平均数相等,即,也就是假设两个样本平均数的差数

属随机误差,而非真实差异;其对应假设则为。83生命科学与技术学院欧阳乐军制作

(二)在承认上述无效假设的前提下,获得平均数的抽样分布,计算假设正确的概率先承认无效假设,从已知总体中抽取样本容量为n=25的样本,该样本平均数的抽样分布具正态分布形状,平均数=300(kg),标准误=15(kg)。通过试验,如果新品种的平均产量很接近300kg,例如301kg或299kg等,则试验结果当然与假设相符,于是应接受H0。如果新品种的平均产量为500kg,与总体假设相差很大,那当然应否定H0。但如果试验结果与总体假设并不相差悬殊,就要借助于概率原理,具体做法有以下两种:84生命科学与技术学院欧阳乐军制作1.计算概率在假设

为正确的条件下,根据的抽样分布算出获得=330kg的概率,或者说算得出现随机误差=30(kg)的概率:在此,根据u测验公式可算得:

因为假设是新品种产量有大于或小于当地品种产量的可能性,所以需用两尾测验。

查附表3,当u=2时,P(概率)界于0.04和0.05之间,即这一试验结果:=30(kg),属于抽样误差的概率小于5%。

85生命科学与技术学院欧阳乐军制作2.计算接受区和否定区在假设H0为正确的条件下,根据的抽样分布划出一个区间,如在这一区间内则接受H0,如在这一区间外则否定H0。如何确定这一区间呢?根据上章所述和的分布,可知:

因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外的只有5%。86生命科学与技术学院欧阳乐军制作如果以5%概率作为接受或否定H0的界限,则上述区间()为接受假设的区域,简称接受区(acceptanceregion);和为否定假设的区域,简称否定区(rejectionregion)。同理,若以1%作为接受或否定H0的界限,则()为接受区域,和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论