版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试验设计与统计统计假设测验试验设计与统计统计假设测验试验设计与统计统计假设测验第五章统计假设检验第一节统计假设检验的基本原理
第二节样本平均数的假设检验第三节参数的区间估计本章主要内容试验设计与统计统计假设测验试验设计与统计统计假设测验试验设计试验设计与统计统计假设测验课件2试验设计与统计统计假设测验课件3试验设计与统计统计假设测验课件4试验设计与统计统计假设测验课件5
一个试验相当于一个样本,由一个样本平均数可以对总体平均数作出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差。用存在误差的样本平均数来推断总体,其结论并不是绝对正确的。总体随机样本123无穷个样本图5.1总体和样本的关系一个试验相当于一个样本,由一个样本平均数可以对总体平6
例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态时每罐净质量具有正态分布N(500,64)(单位为g)。某日随机抽查了10瓶罐头,得结果如下:505,512,497,493,508,515,502,495,490,510,问该装罐机该日工作是否正常?
该装罐机该日所装罐头的平均重量比正常工作状态时所装罐头重量看起来高,即502.7-500=2.7g是试验的表面效应。
方法是将表面效应与误差作比较,若表面效应并不大于误差,则无充分证据说该装罐机不正常;相反,若表面效应大于误差,则推断表面效应不是误差,该装罐机有问题。这个尺度如何掌握呢?造成这种差异可能有两种原因该装罐机有问题可能是试验误差
如何权衡并判断造成这种差异是哪种原因?例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态7
根据上章抽样误差出现的概率可利用抽样分布来计算,因此,只要设定一概率标准,例如,表面效应属于误差的概率不大于5%便可推论表面效应不大可能属误差所致。
这里把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的方法称为统计推断。
此时计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成,也就是假设该装罐机工作正常。根据上章抽样误差出现的概率可利用抽样分布来计算,因此8一、统计假设两个总体间的差异如何比较?一种方法是检验整个总体材料,获得全部结果
这种研究全部总体的方法是很准确的,但往往是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。另一种方法,即研究样本,通过样本研究其所代表的总体。
如果发现假设和试验结果相符的可能性大,该假设就被接受;反之,假设符合试验结果的可能性很小,该假设就被否定。因此往往首先需要提出一个有关某一总体参数的假设。
在科学研究中,往往首先要提出一个有关某一总体参数的假设,这种假设称为统计假设。一、统计假设两个总体间的差异如何比较?一种方法是检验整个总体9
这种利用样本的结果以检验假设是否正确(或错误)的过程称为假设检验。
通过测验,发现假设和试验结果相符,该假设就被接受;反之,如果假设不符合试验结果,该假设就应被否定。这种利用样本的结果以检验假设是否正确(或错误)的过通过测10(一)单个平均数的假设
假设一个样本是从一个具有平均数μ0的总体中随机抽出的,记作:HO:μ=μO
假设某一新工艺的加工产量与原来旧工艺加工产量一样。即新工艺是原来旧工艺的一个随机样本,其平均产量μ等于某一指定值μ0,记为HO:μ=μO例:
假设某一品牌奶粉的蛋白质含量(μ)具有行业标准上某一指定的标准(C),记为:HO:μ=C(一)单个平均数的假设假设一个样本是从一个具有平均数11(二)两个平均数相比较的假设
假设两个样本是从两个具有相等参数的总体中随机抽出,记为:HO:μ1=μ2
或HO:μ1-μ2
=0和零假设相对应的称为备择假设(alternativehypothesis),记作HA:μ≠μO或HA:μ1≠μ2
。如果否定了零假设,则接受备择假设;如果接受了零假设,则否定了备择假设。上述假设称为零假设(nullhypothesis)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等,即假设其没有效应差异,或者说实际得到的差异是由误差造成的。(二)两个平均数相比较的假设假设两个样本是从两个具有12为什么首先要做零假设?
只有当零假设成立时,才能从假设的总体中获得其平均数的抽样分布,并进一步计算出某一样本平均数指定值出现的概率,这样就可以研究样本和总体的关系,作为假设检验的理论依据。为什么首先要做零假设?只有当零假设成立时,才能从假设13先按研究目的提出一个假设;然后通过试验或调查,取得样本资料;最后检查这些资料结果,看看是否与零假设所提出的有关总体参数相符。如果在一定的概率范围内两者接近,则接受零假设;反之,则接受备择假设。二、统计假设检验的基本方法◆基本方法先按研究目的提出一个假设;二、统计假设检验的基本方法◆基本14
例:某酿造厂原生产标准酿出的醋的醋酸含量为μ0=9.75%,并从长期生产结果获得其标准差σ=5.30%。现引进了一种酿醋的新曲种,采用新曲种酿造得30个醋样,其醋酸含量平均值为=11.99%,问是否能由采用新曲种的30个醋样的平均数与原生产标准的总体平均数μ0的差异-μ0=2.24%来说明采用新曲种后醋酸含量有所改变?例:某酿造厂原生产标准酿出的醋的醋酸含量为μ0=9.15
则假设两个样本的总体平均数相等,即H0:μ1=μ2,也就是假设两个样本平均数的差数属随机误差,而非真实差异;其对应假设则为HA:μ1≠μ2。上例中,假定采用新曲种总体平均数μ等于原曲种的总体平均数μ0=9.75%,而样本平均数和μ0之间的差数:11.9%-9.75%=2.24%属随机误差;对应假设则为HA:μ≠μ0。
检验单个平均数
检验两个平均数(一)提出一个零假设
则假设该样本是从一已知总体(总体平均数为指定值μ0)中随机抽出的,即H0:μ=μ0。则假设两个样本的总体平均数相等,即H0:μ1=μ2,16
上例中,零假设为H0:μ=μ0,即新曲种醋酸产量与原曲种醋酸产量总体无显著差异。在此前提下,该样本平均数的抽样分布是可以推知的,即呈正态分布(n=30)。(二)在承认零假设的前提下,获得平均数的抽样分布,计算假设正确的概率
通过试验,如果新品种的平均产量很接近9.75%,则应接受H0。如果新品种的平均产量为20%,与总体假设相差很大,则应否定H0。但如果试验结果与总体假设并不相差悬殊,例如上例那样-μ0=2.24%,那应如何判断呢?第五章统计假设测验
平均数:=μ=9.75%
标准误:上例中,零假设为H0:μ=μ0,即新曲种醋酸产量与原17
在假设H0为正确的条件下,根据的抽样分布算出获得=11.99%的概率,或者说算得出现随机误差-μ0=2.24%的概率:1.计算概率
方法:u检验公式可算得:
因为假设是新曲种醋酸产量有大于或小于原曲种产量的可能性,所以需用两尾检验。查附表2,当u=2.315时,P(概率)界于0.02和0.03之间,即这一试验结果:-μ0=2.24%,属于抽样误差的概率小于5%。于是可作出供选择的两种推论:
或者这一差数是随机误差,但其出现概率小于5%。
或者这一差数不是随机误差,则这一样本(=11.99%)不是假设总体
(μ0=9.75%)中的一个随机样本,其概率大于95%。u在假设H0为正确的条件下,根据的抽样分布算出获得18如在这一区间外则否定H0。如在这一区间内则接受H0。在假设H0为正确的条件下,根据的抽样分布划出一个区间。2.计算接受区和否定区若落在这一区间外,该差数应解释为真实差数。其意思是:若落在这一区间内,则可解释为随机误差;如在这一区间外则否定H0。如在这一区间内则接受H0。19
因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外(即≤-1.96和≥+1.96)的只有5%。如何确定这一区间呢?根据上章所述和的分布,2.计算接受区和否定区可知:因之可写为:因此,在的抽样分布中,落在(20而≤μ-1.96和≥μ+1.96为两个否定H0区域。否定区域和接受区域的两个临界值写作μ±1.96,即当在(μ-1.96,μ+1.96
)区间内为接受H0区域。
如果以5%概率作为接受或否定H0的界限,则前者为接受假设的区域,简称接受区(acceptanceregion);后者为否定假设的区域,简称否定区(rejectionregion)。在u检验时,一般将上述区间为95%置信度如果将置信度设为99%,则:否定区域和接受区域的两个临界值写作μ±2.58,即当在(μ-2.58,μ+2.58
)区间内为接受H0区域。而≤μ-2.58和≥μ+2.58为两个否定H0区域。而≤μ-1.96和≥μ+21
如上述酿醋的新曲种为例,μ0=9.75%,=0.97%,1.96
=1.90%。因之,它的两个2.5%概率的否定区域为≤9.75%-1.90%和≥9.75%+1.90%,即大于等于10.65%和小于等于7.85%的概率只有5%。5%显著水平假设检验图示(表示接受区域和否定区域)如上述酿醋的新曲种为例,μ0=9.75%,=022(三)根据“小概率事件实际上不可能发生”原理接受或否定零假设当一事件的概率很小时可认为该事件在一次试验中几乎是不可能实现。故当
由随机误差造成的概率小于5%或1%时,即可认为它不属于抽样误差,应否定零假设。因随机误差而得到该差数的概率P<0.05,称这个差数是显著的;如果概率P<0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平,一般以α表示,如α=0.05或α=0.01。上例算得u值的概率小于5%,即说明差数2.24%已达α=0.05显著水平(significancelevel)。(三)根据“小概率事件实际上不可能发生”原理接受或否定零假设23假设检验时选用的显著水平:应根据试验的要求或试验结论的重要性而定:常用α=0.05和α=0.01,有时也选α=0.10或α=0.001。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。
显著水平α对假设测验的结论是有直接影响的,所以它应在试验开始前即规定下来。假设检验时选用的显著水平:应根据试验的要求或试验结论的重要性24在假设检验时所考虑的概率为正态曲线左边一尾概率(小于9.75%)和右边一尾概率(大于9.75%)的总和。这类检验称为两尾检验(two-tailedtest),它具有两个否定区域。三、两尾检验与一尾检验
在提出一个统计假设时,必有一个相对应的备择假设。备择假设为否定零假设时必然要接受的假设。若零假设为H0:μ=μ0则备择假设为HA:μ≠μ0
例上述单个平均数检验,在假设检验时所考虑的概率为正态曲线左边一尾概率(小于9.7525若否定H0,则必然接受HA:μ>90%。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即正态曲线的右边一尾。这类检验称为一尾检验(one-tailedtest)。零假设为H0:μ≤μ0备择假设为HA:μ>μ0
又如统计假设:例某杀菌剂规定杀菌效果达90%方为合格,则其统计假设为:零假设为H0:μ≤90%备择假设为HA:μ>90%若否定H0,则必然接受HA:μ>90%。因而,这个对应的备择26零假设为H0:μ≥μ0备择假设为HA:μ<μ0
一尾检验还有另一种情况,即否定区域在左边一尾:
例使用某种防腐剂后腐败率为10%,不使用的情况下为20%,要检验使用防腐剂后是否降低了腐败率。零假设为H0:μ≥20%备择假设为HA:μ<20%零假设为H0:μ≥μ0一尾检验还有另一种情况,即否定区27四、假设检验的两类错误
假设检验时由样本结果来推断总体,依据的是“小概率事件实际不可能发生原理”,我们并不能百分之百地肯定不发生错误。●零假设是错误的,检验结果却接受了它◆这种错误包括两类:●零假设是正确的,但检验结果却否定了它参数间本来有差异,可检验结果无差异,这种错误称为第二类错误(typeIIerror)。不同总体的参数间本来没有差异,可是检验结果有差异,这种错误称为第一类错误(typeIerror)。四、假设检验的两类错误假设检验时由样本结果来推断总28
犯第一类错误的概率犯第一类错误的概率为α犯第一类错误的概率犯第一类错误的概率为α29
作出这种统计推断可能犯的错误是:如果客观上样本所代表的总体参数与已知总体间有差异,可是假设测验却不能发现这种差异,测验结果认为没有差异,这是第二类错误,错误的概率为β值。β值的计算方法就是计算抽样平均数落在已知总体接受区的概率(这里的已知总体是假定的)。
犯第二类错误的概率作出这种统计推断可能犯的错误是:如果客观上样本所代表30已知总体的均值μ0=300kg,其平均数抽样标准误为15,被抽样总体的平均数μ=315kg、标准误为15。从被抽样总体抽得的平均数可能落在c1和c2间的概率为被抽样总体的抽样分布曲线与c1和c2两条直线以及横轴围成的面积,这个面积正是抽样平均数落在已知总体接受区的可能性。已知总体的均值μ0=300kg,其平均数抽样标准误为15,被31提高显著水平α,如取α=0.01或0.001,则c1线向左移动,c2线向右移动,因而β值会增大。注意!由此说明,显著水平过高(α值过小),会增大犯第二类错误的危险。提高显著水平α,如取α=0.01或0.001,则c1线向左移32如果假定新总体的μ=345kg,即离μ0=300kg更远一些,则犯第二类错误的概率β=0.15=15%。注意!因此,β值的大小依赖于真μ与假设的μ0间的距离。如μ和μ0靠近,则易接受错误的H0,犯第二类错误的概率β较大,如μ和μ0相距较远,则犯第二类错误概率较小。如果假定新总体的μ=345kg,即离μ0=300kg更远33
样本容量增加,则两类错误的概率都可减小。注意!现如将n从25增至225,则因而μ0=300kg曲线的否定区域为:<290.2和>309.8kgμ=345kg曲线的否定区域为:<335.2和>354.8kg样本容量增加,则两类错误的概率都可减小。注意!现如将34第二节平均数的假设检验第五章统计假设测验第二节平均数的假设检验第五章统计假设测验35从一个平均数为μ、方差为σ2的正态总体中抽样,或者在一个非正态总体里抽样只要样本容量有足够大,则所得一系列样本平均数的分布必趋向正态分布,具有N(μ,),并且标准化离差遵循标准正态分布N(0,1)。一、u检验和t检验1、u/z检验
当总体方差σ2已知,或σ2虽未知但样本容量相当大,可用s2直接作为σ2估计值时采用u检验。从一个平均数为μ、方差为σ2的正态总体中抽样,或者在一个非正36
为样本平均数的标准误,它是的估计值,其中s为样本标准差,n为样本容量。当样本容量不太大(n<30)且σ2为未知时,如以样本均方s2估计σ2,则其标准化离差的分布不呈正态,而作t分布,具有自由度ν=n-1。其中2、t检验为样本平均数的标准误,它是的估计37◆t分布(t-distribution)1908年W.S.Gosset首先提出,又叫学生氏分布,因为他当时是以笔名“学生student”发表研究论文的。
它是一组对称密度函数曲线,具有一个单独参数ν以确定某一特定分布。ν是自由度。在理论上,当ν增大时,t分布趋向于正态分布。t分布的概率密度函数为◆t分布(t-distribution)1908年38t检验:在假设检验时,当算得的|t|大于或等于tα时,则表明其属于随机误差的概率小于规定的显著水平,因而可否定零假设。反之,若算得的|t|<tα,则接受零假设。t检验:在假设检验时,当算得的|t|大于或等于tα时,则表明39
这是检验某一样本平均数所属总体平均数是否和某一指定的总体平均数相同。二、单个样本平均数的假设检验这是检验某一样本平均数所属总体平均数是否和某一指定的40这里总体σ2为未知,又是小样本,故需用t
检验;又新工艺每100g山楂出果冻量可能高于也可能低于原工艺,故需作两尾检验。检验步骤为:H0:新工艺每100g山楂出果冻的量与传统工艺相同,即μ=μ0=500g;或简记为H0:μ=500g。HA:μ≠500g。显著水平α=0.01因为:例:用山楂加工果冻,传统工艺平均每100g山楂出果冻500g,现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻平均数为520g,标准差S=12g。问新工艺每100g山楂出果冻量与传统工艺有无差异?ν=15时,t0.01=2.947。得|t|>tα=2.947
,故P<0.01。推断:否定H0,接受HA。即新工艺每100g山楂出果冻量与传统工艺有极显著差异。这里总体σ2为未知,又是小样本,故需用t检验;又新工艺每141①成组数据三、两个样本平均数相比较的假设检验
这是检验两个样本平均数所属的两个总体平均数间有无显著差异的检验方法,因试验设计不同而分为两种:②成对数据①成组数据三、两个样本平均数相比较的假设检验这是检验42(一)成组数据的平均数比较
如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。
成组数据的平均数比较又依两个样本所属的总体方差(σ12和σ22)是否已知、是否相等而采用不同的检验方法。1、在两个样本的总体方差σ12和σ22为已知时,用u检验;2、在两个样本的总体方差σ12和σ22为未知,但可假定σ12=σ22=σ2,而两个样本又为小样本时,用t检验3、两个样本的总体方差σ12和σ22为未知,且σ12≠σ22时,用近似t检验(一)成组数据的平均数比较如果两个处理为完全随机设计431、在两个样本的总体方差σ12和σ22为已知时,用u检验
由抽样分布的公式可知,两个样本平均数和的差数标准误,在σ12和σ22是已知时为:并有:在假设H0:μ1-μ2=0下,正态离差u值为故可对两样本平均数的差异作出假设检验。1、在两个样本的总体方差σ12和σ22为已知时,用u检验44[例]某食品厂在甲乙两条生产线上个测试了30个日产量。试检验两条生产线的平均日产量有无显著差异。甲乙两条生产线日产量记录甲生产线(y1)乙生产线(y2)746261775971577265625662625478546970585371737863677863746270655858606853495870705451666552605371585556665356556962566957假设H0:μ1=μ2,即两条生产线的平均日产量无差异
HA:μ1≠μ2
[例]某食品厂在甲乙两条生产线上个测试了30个日产量。试检验45
因为实得|u|>u0.01=2.58,故P<0.01,推断:否定H0,接受HA:μ1≠μ2,即甲乙两条生产线的平均日产量有极显著差异。因为实得|u|>u0.01=2.58,故P<0.01462、在两个样本的总体方差σ12和σ22为未知,但可假定σ12=
σ22=σ2,而两个样本又为小样本时,用t检验
首先,从样本变异算出平均数差数的均方Se2,作为对σ2的估计。由于可假定σ12=σ22=σ,故Se2应为两样本均方的加权平均值,即有:
上式的Se2又称合并均方,式中ν1=n1-1,ν2=n2-1,分别为两样本的自由度,分别为两样本的离均差平方和。求得Se2后,其两样本平均数差数标准误为:2、在两个样本的总体方差σ12和σ22为未知,但可假定σ1247当n1=n2=n时,则上式变为:于是有:它具有自由度ν=(n1-1)+(n2-1),据之即可检验H0:μ1=μ2。由于假设H0:μ1=μ2,故上式变为:当n1=n2=n时,则上式变为:于是有:它具有自由度ν=(n48[例]海关检查某罐头厂生产的出口红烧花蛤罐头时发现,虽然罐头外观无胖听现象,但产品存在质量问题。于是从该厂随机抽取6个样品,同时随机抽取6个正常罐头测定其SO2含量,测定结果如表所示。试检验两种罐头的SO2含量是否有差异。
表正常罐头与异常罐头SO2含量记录g/ml正常罐头(y1)100.094.298.599.296.4102.5异常罐头(y2)130.2131.3130.5135.2135.2133.5
因为是小样本,故需用t检验;又由于事先并不知道两种罐头的SO2含量孰高孰低,故用两尾检验。检验步骤:
假设H0:两种罐头的SO2含量没有差异,即H0:μ1=μ2,对HA:μ1≠μ2。
显著水平α=0.01检验计算:=98.47=132.65SS1
=41.6333SS2=26.1750[例]海关检查某罐头厂生产的出口红烧花蛤罐头时发现,虽然罐49故
ν=5+5=10时,t0.01(10)=3.169。
|t|=22.735>t0.01,故P<0.01推断:否定无效假设H0:μ1=μ2,接受HA。即两种罐头的SO2含量存在极显著差异,说明该批罐头有质量问题。故ν=5+5=10时,t0.01(10)=3.1650
表醇沉淀法和超滤法粗提物中茶多糖含量%醇沉淀法(y1)27.5227.7828.0328.8828.7527.94超滤法(y2)29.3228.1528.0028.5829.00[例]比较两种茶多糖提取工艺的试验,分别从两种工艺中各取1个随机样本来测定其粗提物中茶多糖的含量,问两种工艺的粗提物中茶多糖含量有无明显差异。假设H0:两种工艺的粗提物中茶多糖含量无差异,即H0:μ1=μ2。
HA:μ1μ2显著水平α=0.05,两尾检验测验计算:=28.15=28.61
SS1=1.4852SS2=1.2408表醇沉淀法和超滤法粗提物中茶多糖含量51
按ν=5+4=9,查t表得t0.05(9)=2.262,现实得
t=-1.382<-t0.05(9),故P>0.05。
推断:肯定H0:μ1=μ2,即认为两种工艺的粗提物中茶多糖含量无明显差异。按ν=5+4=9,查t表得t0.05(9)=523、两个样本的总体方差σ12和σ22为未知,且σ12≠σ22时,用近似t检验
由于σ12≠σ22,故差数标准误需用两个样本的均方s12和s22分别估计σ12和σ22,即有:
但是,所得t值不再做成准确的t分布,因而仅能进行近似的t检验。在作t检验时需先计算k值和ν/(有效自由度)。3、两个样本的总体方差σ12和σ22为未知,且σ12≠σ2253近似于t分布,具有有效自由度为ν/,从而据之查t表得出概率。近似于t分布,具有有效自由度为ν/,从而据之查t表得出概率。54(二)成对数据的平均数比较
若试验设计是将性质相同的两个供试单位配成一对,并设有多个配对,然后对每一配对的两个供试单位分别随机地给予不同处理,则所得观察值为成对数据。
同一配对内两个供试单位的试验条件很是接近,而不同配对间的条件可以有差异,而这一差异又可通过同一配对的差数予以消除。可以有效地控制试验误差,精确度较高。例:①在每一批产品内分别安排一对处理的试验;②同一食品对分成两部分来安排一对处理的试验;③同一供试单位进行处理前和处理后的对比。(二)成对数据的平均数比较若试验设计是将性质相同的55设两个样本的观察值分别为y1和y2共配成n对观察值:各对的差数为di=y1i-y2i,可简写为d=y1-y2差数的平均数为则差数平均数的标准误为:即可检测H0:μd=0。设两个样本的观察值分别为y1和y2共配成n对观察值:各对的差56[例]为研究电渗处理对草莓果实中钙离子含量的影响,选用10个草莓品种来进行电渗处理与对照的对比试验(配对果实条件基本一致),问电渗处理对草莓钙离子含量是否有影响?品种号12
345678910电渗处理(y1)/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照(y2)/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=y1-y2)4.193.103.615.003.081.995.921.712.444.14电渗处理草莓果实钙离子含量配对设计,因电渗处理对果实中钙离子含量的影响并未明确,故用两尾测验。假设:处理对果实中钙离子含量无影响,即H0:μd=0;HA:μd≠0;显著水平α=0.01(两尾概率)[例]为研究电渗处理对草莓果实中钙离子含量的影响,选用1057ν=10-1=9时,t0.01(9)=3.250。现实得|t|>t0.01(9),故P<0.01。推断:否定H0:μd=0;接受HA:μd≠0,即电渗处理对草莓钙离子含量有极显著影响。ν=10-1=9时,t0.01(9)=3.250。现实得|t58在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发生第二类错误,即不能鉴别应有的显著差异。故在应用时需严格区别。注意!成对数据和成组数据平均数比较所依据的条件是不相同的。成对数据是假定各个配对的差数来自差数的分布为正态总体,具有N(0,);而每一配对的两个供试单位是彼此相关的。成组数据则是假定两个样本皆来自具有共同(或不同)方差的正态总体,而两个样本的各个供试单位都是彼此独立的。在实践上,如将成对数据按成组数据的方法比较,容易使统计推断发59第五章统计假设测验第三节参数的区间估计第五章统计假设测验第三节参数的区间估计60用样本计算的统计量估计总体参数。参数估计
点估计指以样本的统计量直接估计总体的相应参数μ。
由于抽样误差,不同样本将有不同的值,那么哪一个值最能代表总体相应参数呢?
这是难以判断的。因此,有必要在一定的概率保证之下,估计出一个范围或区间能够覆盖参数μ。用样本计算的统计量估计总体参数。参数估计点估计指以样本的统61
区间估计
这个区间称置信区间(confidenceinterval),区间的上、下限称为置信限(confidencelimit),区间的长度称为置信距。一般以L1和L2分别表示置信下限和上限。保证该区间能覆盖参数的概率以P=(1-α)表示,称为置信系数或置信度。以上这种估计就称为参数的区间估计。区间估计这个区间称置信区间(confide62
例:在的分布中,,则按图5.1的接受区域,将有95%(即1-α,α=0.05)的样本值将落在(μ-1.96)至(μ+1.96)的范围内,即:或称在(1-α)概率下:当α=0.05时,所以于是可得在置信度P=(1-α)时,对μ的置信区间为:
上述置信区间的意义为:如果从总体中抽出容量为n的所有样本,并且每一样本都算出其[L1,L2],则在所有的[L1,L2]区间中,将有95%区间能覆盖参数μ。例:在的分布中,63一、总体平均数μ的置信限(一)在总体方差σ2为已知或σ2未知但为大样本时μ的置信区间为:以上式中的μα为正态分布下置信度1-α时的u临界值。(二)在总体方差σ2为未知时σ2需由样本均方s2估计,于是置信区间为:上式中的tα为置信度P=(1-α)时t分布的t临界值。一、总体平均数μ的置信限(一)在总体方差σ2为已知或σ2未知64[例5.13]某肉类加工线36天的肉类平均日产量为吨,已知σ=0.3吨,求99%置信度下该肉类加工线日产量μ的置信区间。(一)在总体方差σ2为已知或σ2未知但为大样本时在置信度P=(1-α)=99%下,由附表3查得u0.01=2.58;并算得故99%置信区间为:(4.1-2.58×0.05)≤μ≤(4.1+2.58×0.05)即:4.0≤μ≤4.2推断:估计该肉类加工线平均日产量在4.0~4.2吨之间,此估计值的可靠度有99%。[例5.13]某肉类加工线36天的肉类平均日产量为65[例5.14]假设一条香肠加工线在8个工作日的平均重量,。试估计在置信度为95%时该加工线生产的香肠重量范围。(二)在总体方差σ2为未知时由附表4查得v=7时,t0.05=2.365故有:35.2-2.365×0.58≤μ≤35.2+2.365×0.58即:33.8≤μ≤36.6推断:该加工线总体香肠重μ在33.8g~36.6g之间的置信度为95%。[例5.14]假设一条香肠加工线在8个工作日的平均重量66二、两总体平均数差数(μ1-μ2)的置信限在一定的置信度下,估计两总体平均数μ1和μ2至少能差多少。估计方法依两总体方差是否已知或是否相等而有不同。1、在两总体方差为已知或两总体方差虽未知但为大样本时2、在两总体方差为未知,且为小样本时(1)两总体方差相等(2)两总体方差不相等二、两总体平均数差数(μ1-μ2)的置信限在一定的置信度下,67(一)在两总体方差为已知或两总体方差虽未知但为大样本时对μ1-μ2的1-α置信区间应为:
上式中的为平均数差数标准误,uα为正态分布下置信度为1-α时的u临界值。(一)在两总体方差为已知或两总体方差虽未知但为大样本时对μ168例:测得A品种西红柿332株的单株平均产量,750g,s1=265g,B品种西红柿282株,=600(g),s2=185(g)。试估计两品种单株平均产量的相差在95%置信度下的置信区间。(一)在两总体方差为已知或两总体方差虽未知但为大样本时由附表3查得置信度为0.95时,u0.05=1.96;并可算得:因而,95%的置信限为:L1=(750-600)-1.96×18=114.7(g)L2=(750-600)+1.96×18=185.3(g)例:测得A品种西红柿332株的单株平均产量,7569(二)在两总体方差为未知时1、两总体方差相等,即σ12=σ22=σ2μ1-μ2的1-α置信区间为:
以上的为平均数差数标准误,是置信度为1-α,自由度为n1+n2-2时t分布的临界t值。(二)在两总体方差为未知时1、两总体方差相等,即σ12=σ270(二)在两总体方差为未知时1、两总体方差相等,即σ12=σ22=σ2
例.两个肉牛屠宰场收购活牛(样本量均为5头)的平均重量为两个屠宰场活牛重量差数在置信度为99%时的置信区间。由附表4查得ν=8时,t0.01=3.355,故有:L1=(428-440)-(3.355×11.136)=-49.4(kg),
L2=(428-440)+(3.355×11.136)=25.4(kg)。(二)在两总体方差为未知时1、两总体方差相等,即σ12=σ271
这时由两样本的S12和S22作为σ12和σ22估计而算得的t,已不是ν=ν1+ν2的t分布,而是近似于自由度为ν/的t分布,μ1-μ2的1-α的置信区间为:(二)在两总体方差为未知时2、两总体方差不相等,即σ12≠σ22这时由两样本的S12和S22作为σ12和σ22估计而72(三)成对数据总体差μd的置信限
μd的1-α置信区间,其两个置信限分别为:tα为置信度为1-α,ν=n-1时t分布的临界t值。(三)成对数据总体差μd的置信限μd的1-α置信区间,其两73=-8.3,=1.997(三)成对数据总体差μd的置信限
例.试求下列资料μd的99%置信限。ν=6时,t0.01=3.707于是有:L1=-8.3-(3.707×1.997)=-15.7L2=-8.3+(3.707×1.997)=-0.9或写作:-15.7≤μd≤-0.9
以上L1和L2皆为负值,表明A法处理使产品货架期要比B法缩短0.9~15.7天,此估计的置信度为99%。组别y1(A法)y2(B法)d
11025-152131213814-64315-125512-762027-77618-12A、B两法处理某类产品的货架期=-8.3,=74三、区间估计与假设检验◆区间估计亦可用于假设检验
置信区间是一定置信度下总体参数的所在范围,故对参数所作假设若恰落在该范围内,则这个假设与参数就没有真实的不同,接受H0。反之,如果对参数所作的假设落在置信区间之外,则说明假设与参数不同,应否定H0,接受HA。落在置信区间内对参数所作假设接受H0落在置信区间外接受HA三、区间估计与假设检验◆区间估计亦可用于假设检验75END16、业余生活要有意义,不要越轨。——华盛顿
17、一个人即使已登上顶峰,也仍要自强不息。——罗素·贝克
18、最大的挑战和突破在于用人,而用人最大的突破在于信任人。——马云
19、自己活着,就是为了使别人过得更美好。——雷锋
20、要掌握书,莫被书掌握;要为生而读,莫为读而生。——布尔沃END16、业余生活要有意义,不要越轨。——华盛顿试验设计与统计统计假设测验试验设计与统计统计假设测验试验设计与统计统计假设测验第五章统计假设检验第一节统计假设检验的基本原理
第二节样本平均数的假设检验第三节参数的区间估计本章主要内容试验设计与统计统计假设测验试验设计与统计统计假设测验试验设计试验设计与统计统计假设测验课件78试验设计与统计统计假设测验课件79试验设计与统计统计假设测验课件80试验设计与统计统计假设测验课件81
一个试验相当于一个样本,由一个样本平均数可以对总体平均数作出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差。用存在误差的样本平均数来推断总体,其结论并不是绝对正确的。总体随机样本123无穷个样本图5.1总体和样本的关系一个试验相当于一个样本,由一个样本平均数可以对总体平82
例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态时每罐净质量具有正态分布N(500,64)(单位为g)。某日随机抽查了10瓶罐头,得结果如下:505,512,497,493,508,515,502,495,490,510,问该装罐机该日工作是否正常?
该装罐机该日所装罐头的平均重量比正常工作状态时所装罐头重量看起来高,即502.7-500=2.7g是试验的表面效应。
方法是将表面效应与误差作比较,若表面效应并不大于误差,则无充分证据说该装罐机不正常;相反,若表面效应大于误差,则推断表面效应不是误差,该装罐机有问题。这个尺度如何掌握呢?造成这种差异可能有两种原因该装罐机有问题可能是试验误差
如何权衡并判断造成这种差异是哪种原因?例:某罐头厂生产肉类罐头,其自动装罐机在正常工作状态83
根据上章抽样误差出现的概率可利用抽样分布来计算,因此,只要设定一概率标准,例如,表面效应属于误差的概率不大于5%便可推论表面效应不大可能属误差所致。
这里把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的方法称为统计推断。
此时计算表面效应由误差造成的概率首先必须假设表面效应是由误差造成,也就是假设该装罐机工作正常。根据上章抽样误差出现的概率可利用抽样分布来计算,因此84一、统计假设两个总体间的差异如何比较?一种方法是检验整个总体材料,获得全部结果
这种研究全部总体的方法是很准确的,但往往是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。另一种方法,即研究样本,通过样本研究其所代表的总体。
如果发现假设和试验结果相符的可能性大,该假设就被接受;反之,假设符合试验结果的可能性很小,该假设就被否定。因此往往首先需要提出一个有关某一总体参数的假设。
在科学研究中,往往首先要提出一个有关某一总体参数的假设,这种假设称为统计假设。一、统计假设两个总体间的差异如何比较?一种方法是检验整个总体85
这种利用样本的结果以检验假设是否正确(或错误)的过程称为假设检验。
通过测验,发现假设和试验结果相符,该假设就被接受;反之,如果假设不符合试验结果,该假设就应被否定。这种利用样本的结果以检验假设是否正确(或错误)的过通过测86(一)单个平均数的假设
假设一个样本是从一个具有平均数μ0的总体中随机抽出的,记作:HO:μ=μO
假设某一新工艺的加工产量与原来旧工艺加工产量一样。即新工艺是原来旧工艺的一个随机样本,其平均产量μ等于某一指定值μ0,记为HO:μ=μO例:
假设某一品牌奶粉的蛋白质含量(μ)具有行业标准上某一指定的标准(C),记为:HO:μ=C(一)单个平均数的假设假设一个样本是从一个具有平均数87(二)两个平均数相比较的假设
假设两个样本是从两个具有相等参数的总体中随机抽出,记为:HO:μ1=μ2
或HO:μ1-μ2
=0和零假设相对应的称为备择假设(alternativehypothesis),记作HA:μ≠μO或HA:μ1≠μ2
。如果否定了零假设,则接受备择假设;如果接受了零假设,则否定了备择假设。上述假设称为零假设(nullhypothesis)。因为假设总体参数(平均数)与某一指定值相等或假设两个总体参数相等,即假设其没有效应差异,或者说实际得到的差异是由误差造成的。(二)两个平均数相比较的假设假设两个样本是从两个具有88为什么首先要做零假设?
只有当零假设成立时,才能从假设的总体中获得其平均数的抽样分布,并进一步计算出某一样本平均数指定值出现的概率,这样就可以研究样本和总体的关系,作为假设检验的理论依据。为什么首先要做零假设?只有当零假设成立时,才能从假设89先按研究目的提出一个假设;然后通过试验或调查,取得样本资料;最后检查这些资料结果,看看是否与零假设所提出的有关总体参数相符。如果在一定的概率范围内两者接近,则接受零假设;反之,则接受备择假设。二、统计假设检验的基本方法◆基本方法先按研究目的提出一个假设;二、统计假设检验的基本方法◆基本90
例:某酿造厂原生产标准酿出的醋的醋酸含量为μ0=9.75%,并从长期生产结果获得其标准差σ=5.30%。现引进了一种酿醋的新曲种,采用新曲种酿造得30个醋样,其醋酸含量平均值为=11.99%,问是否能由采用新曲种的30个醋样的平均数与原生产标准的总体平均数μ0的差异-μ0=2.24%来说明采用新曲种后醋酸含量有所改变?例:某酿造厂原生产标准酿出的醋的醋酸含量为μ0=9.91
则假设两个样本的总体平均数相等,即H0:μ1=μ2,也就是假设两个样本平均数的差数属随机误差,而非真实差异;其对应假设则为HA:μ1≠μ2。上例中,假定采用新曲种总体平均数μ等于原曲种的总体平均数μ0=9.75%,而样本平均数和μ0之间的差数:11.9%-9.75%=2.24%属随机误差;对应假设则为HA:μ≠μ0。
检验单个平均数
检验两个平均数(一)提出一个零假设
则假设该样本是从一已知总体(总体平均数为指定值μ0)中随机抽出的,即H0:μ=μ0。则假设两个样本的总体平均数相等,即H0:μ1=μ2,92
上例中,零假设为H0:μ=μ0,即新曲种醋酸产量与原曲种醋酸产量总体无显著差异。在此前提下,该样本平均数的抽样分布是可以推知的,即呈正态分布(n=30)。(二)在承认零假设的前提下,获得平均数的抽样分布,计算假设正确的概率
通过试验,如果新品种的平均产量很接近9.75%,则应接受H0。如果新品种的平均产量为20%,与总体假设相差很大,则应否定H0。但如果试验结果与总体假设并不相差悬殊,例如上例那样-μ0=2.24%,那应如何判断呢?第五章统计假设测验
平均数:=μ=9.75%
标准误:上例中,零假设为H0:μ=μ0,即新曲种醋酸产量与原93
在假设H0为正确的条件下,根据的抽样分布算出获得=11.99%的概率,或者说算得出现随机误差-μ0=2.24%的概率:1.计算概率
方法:u检验公式可算得:
因为假设是新曲种醋酸产量有大于或小于原曲种产量的可能性,所以需用两尾检验。查附表2,当u=2.315时,P(概率)界于0.02和0.03之间,即这一试验结果:-μ0=2.24%,属于抽样误差的概率小于5%。于是可作出供选择的两种推论:
或者这一差数是随机误差,但其出现概率小于5%。
或者这一差数不是随机误差,则这一样本(=11.99%)不是假设总体
(μ0=9.75%)中的一个随机样本,其概率大于95%。u在假设H0为正确的条件下,根据的抽样分布算出获得94如在这一区间外则否定H0。如在这一区间内则接受H0。在假设H0为正确的条件下,根据的抽样分布划出一个区间。2.计算接受区和否定区若落在这一区间外,该差数应解释为真实差数。其意思是:若落在这一区间内,则可解释为随机误差;如在这一区间外则否定H0。如在这一区间内则接受H0。95
因此,在的抽样分布中,落在()区间内的有95%,落在这一区间外(即≤-1.96和≥+1.96)的只有5%。如何确定这一区间呢?根据上章所述和的分布,2.计算接受区和否定区可知:因之可写为:因此,在的抽样分布中,落在(96而≤μ-1.96和≥μ+1.96为两个否定H0区域。否定区域和接受区域的两个临界值写作μ±1.96,即当在(μ-1.96,μ+1.96
)区间内为接受H0区域。
如果以5%概率作为接受或否定H0的界限,则前者为接受假设的区域,简称接受区(acceptanceregion);后者为否定假设的区域,简称否定区(rejectionregion)。在u检验时,一般将上述区间为95%置信度如果将置信度设为99%,则:否定区域和接受区域的两个临界值写作μ±2.58,即当在(μ-2.58,μ+2.58
)区间内为接受H0区域。而≤μ-2.58和≥μ+2.58为两个否定H0区域。而≤μ-1.96和≥μ+97
如上述酿醋的新曲种为例,μ0=9.75%,=0.97%,1.96
=1.90%。因之,它的两个2.5%概率的否定区域为≤9.75%-1.90%和≥9.75%+1.90%,即大于等于10.65%和小于等于7.85%的概率只有5%。5%显著水平假设检验图示(表示接受区域和否定区域)如上述酿醋的新曲种为例,μ0=9.75%,=098(三)根据“小概率事件实际上不可能发生”原理接受或否定零假设当一事件的概率很小时可认为该事件在一次试验中几乎是不可能实现。故当
由随机误差造成的概率小于5%或1%时,即可认为它不属于抽样误差,应否定零假设。因随机误差而得到该差数的概率P<0.05,称这个差数是显著的;如果概率P<0.01,则称这个差数是极显著的。用来测验假设的概率标准5%或1%等,称为显著水平,一般以α表示,如α=0.05或α=0.01。上例算得u值的概率小于5%,即说明差数2.24%已达α=0.05显著水平(significancelevel)。(三)根据“小概率事件实际上不可能发生”原理接受或否定零假设99假设检验时选用的显著水平:应根据试验的要求或试验结论的重要性而定:常用α=0.05和α=0.01,有时也选α=0.10或α=0.001。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。
显著水平α对假设测验的结论是有直接影响的,所以它应在试验开始前即规定下来。假设检验时选用的显著水平:应根据试验的要求或试验结论的重要性100在假设检验时所考虑的概率为正态曲线左边一尾概率(小于9.75%)和右边一尾概率(大于9.75%)的总和。这类检验称为两尾检验(two-tailedtest),它具有两个否定区域。三、两尾检验与一尾检验
在提出一个统计假设时,必有一个相对应的备择假设。备择假设为否定零假设时必然要接受的假设。若零假设为H0:μ=μ0则备择假设为HA:μ≠μ0
例上述单个平均数检验,在假设检验时所考虑的概率为正态曲线左边一尾概率(小于9.75101若否定H0,则必然接受HA:μ>90%。因而,这个对应的备择假设仅有一种可能性,而统计假设仅有一个否定区域,即正态曲线的右边一尾。这类检验称为一尾检验(one-tailedtest)。零假设为H0:μ≤μ0备择假设为HA:μ>μ0
又如统计假设:例某杀菌剂规定杀菌效果达90%方为合格,则其统计假设为:零假设为H0:μ≤90%备择假设为HA:μ>90%若否定H0,则必然接受HA:μ>90%。因而,这个对应的备择102零假设为H0:μ≥μ0备择假设为HA:μ<μ0
一尾检验还有另一种情况,即否定区域在左边一尾:
例使用某种防腐剂后腐败率为10%,不使用的情况下为20%,要检验使用防腐剂后是否降低了腐败率。零假设为H0:μ≥20%备择假设为HA:μ<20%零假设为H0:μ≥μ0一尾检验还有另一种情况,即否定区103四、假设检验的两类错误
假设检验时由样本结果来推断总体,依据的是“小概率事件实际不可能发生原理”,我们并不能百分之百地肯定不发生错误。●零假设是错误的,检验结果却接受了它◆这种错误包括两类:●零假设是正确的,但检验结果却否定了它参数间本来有差异,可检验结果无差异,这种错误称为第二类错误(typeIIerror)。不同总体的参数间本来没有差异,可是检验结果有差异,这种错误称为第一类错误(typeIerror)。四、假设检验的两类错误假设检验时由样本结果来推断总104
犯第一类错误的概率犯第一类错误的概率为α犯第一类错误的概率犯第一类错误的概率为α105
作出这种统计推断可能犯的错误是:如果客观上样本所代表的总体参数与已知总体间有差异,可是假设测验却不能发现这种差异,测验结果认为没有差异,这是第二类错误,错误的概率为β值。β值的计算方法就是计算抽样平均数落在已知总体接受区的概率(这里的已知总体是假定的)。
犯第二类错误的概率作出这种统计推断可能犯的错误是:如果客观上样本所代表106已知总体的均值μ0=300kg,其平均数抽样标准误为15,被抽样总体的平均数μ=315kg、标准误为15。从被抽样总体抽得的平均数可能落在c1和c2间的概率为被抽样总体的抽样分布曲线与c1和c2两条直线以及横轴围成的面积,这个面积正是抽样平均数落在已知总体接受区的可能性。已知总体的均值μ0=300kg,其平均数抽样标准误为15,被107提高显著水平α,如取α=0.01或0.001,则c1线向左移动,c2线向右移动,因而β值会增大。注意!由此说明,显著水平过高(α值过小),会增大犯第二类错误的危险。提高显著水平α,如取α=0.01或0.001,则c1线向左移108如果假定新总体的μ=345kg,即离μ0=300kg更远一些,则犯第二类错误的概率β=0.15=15%。注意!因此,β值的大小依赖于真μ与假设的μ0间的距离。如μ和μ0靠近,则易接受错误的H0,犯第二类错误的概率β较大,如μ和μ0相距较远,则犯第二类错误概率较小。如果假定新总体的μ=345kg,即离μ0=300kg更远109
样本容量增加,则两类错误的概率都可减小。注意!现如将n从25增至225,则因而μ0=300kg曲线的否定区域为:<290.2和>309.8kgμ=345kg曲线的否定区域为:<335.2和>354.8kg样本容量增加,则两类错误的概率都可减小。注意!现如将110第二节平均数的假设检验第五章统计假设测验第二节平均数的假设检验第五章统计假设测验111从一个平均数为μ、方差为σ2的正态总体中抽样,或者在一个非正态总体里抽样只要样本容量有足够大,则所得一系列样本平均数的分布必趋向正态分布,具有N(μ,),并且标准化离差遵循标准正态分布N(0,1)。一、u检验和t检验1、u/z检验
当总体方差σ2已知,或σ2虽未知但样本容量相当大,可用s2直接作为σ2估计值时采用u检验。从一个平均数为μ、方差为σ2的正态总体中抽样,或者在一个非正112
为样本平均数的标准误,它是的估计值,其中s为样本标准差,n为样本容量。当样本容量不太大(n<30)且σ2为未知时,如以样本均方s2估计σ2,则其标准化离差的分布不呈正态,而作t分布,具有自由度ν=n-1。其中2、t检验为样本平均数的标准误,它是的估计113◆t分布(t-distribution)1908年W.S.Gosset首先提出,又叫学生氏分布,因为他当时是以笔名“学生student”发表研究论文的。
它是一组对称密度函数曲线,具有一个单独参数ν以确定某一特定分布。ν是自由度。在理论上,当ν增大时,t分布趋向于正态分布。t分布的概率密度函数为◆t分布(t-distribution)1908年114t检验:在假设检验时,当算得的|t|大于或等于tα时,则表明其属于随机误差的概率小于规定的显著水平,因而可否定零假设。反之,若算得的|t|<tα,则接受零假设。t检验:在假设检验时,当算得的|t|大于或等于tα时,则表明115
这是检验某一样本平均数所属总体平均数是否和某一指定的总体平均数相同。二、单个样本平均数的假设检验这是检验某一样本平均数所属总体平均数是否和某一指定的116这里总体σ2为未知,又是小样本,故需用t
检验;又新工艺每100g山楂出果冻量可能高于也可能低于原工艺,故需作两尾检验。检验步骤为:H0:新工艺每100g山楂出果冻的量与传统工艺相同,即μ=μ0=500g;或简记为H0:μ=500g。HA:μ≠500g。显著水平α=0.01因为:例:用山楂加工果冻,传统工艺平均每100g山楂出果冻500g,现采用一种新工艺进行加工,测定了16次,得知每100g山楂出果冻平均数为520g,标准差S=12g。问新工艺每100g山楂出果冻量与传统工艺有无差异?ν=15时,t0.01=2.947。得|t|>tα=2.947
,故P<0.01。推断:否定H0,接受HA。即新工艺每100g山楂出果冻量与传统工艺有极显著差异。这里总体σ2为未知,又是小样本,故需用t检验;又新工艺每1117①成组数据三、两个样本平均数相比较的假设检验
这是检验两个样本平均数所属的两个总体平均数间有无显著差异的检验方法,因试验设计不同而分为两种:②成对数据①成组数据三、两个样本平均数相比较的假设检验这是检验118(一)成组数据的平均数比较
如果两个处理为完全随机设计,各供试单位彼此独立,不论两个处理的样本容量是否相同,所得数据皆称为成组数据,以组(处理)平均数作为相互比较的标准。
成组数据的平均数比较又依两个样本所属的总体方差(σ12和σ22)是否已知、是否相等而采用不同的检验方法。1、在两个样本的总体方差σ12和σ22为已知时,用u检验;2、在两个样本的总体方差σ12和σ22为未知,但可假定σ12=σ22=σ2,而两个样本又为小样本时,用t检验3、两个样本的总体方差σ12和σ22为未知,且σ12≠σ22时,用近似t检验(一)成组数据的平均数比较如果两个处理为完全随机设计1191、在两个样本的总体方差σ12和σ22为已知时,用u检验
由抽样分布的公式可知,两个样本平均数和的差数标准误,在σ12和σ22是已知时为:并有:在假设H0:μ1-μ2=0下,正态离差u值为故可对两样本平均数的差异作出假设检验。1、在两个样本的总体方差σ12和σ22为已知时,用u检验120[例]某食品厂在甲乙两条生产线上个测试了30个日产量。试检验两条生产线的平均日产量有无显著差异。甲乙两条生产线日产量记录甲生产线(y1)乙生产线(y2)7462617759715772656256
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年食品加工生产线升级项目评估报告
- 2025年渔业年度工作总结
- 市政污水管维修调排水方案及流程
- 地下连续墙施工质量控制要点
- 2025年抗肿瘤药物临床合理使用考试试题及答案
- 财务部年度工作总结报告范文
- 2025年工程质量监管年度工作总结
- 2025年节后复工复产通信施工安全知识培训考试题及答案
- 人造草坪技术交底
- 建设工程施工合同纠纷要素式起诉状模板贴合实际案例
- 口述史研究活动方案
- 高压燃气管道施工方案
- 房屋租赁合同txt
- 加工中心点检表
- 水库清淤工程可行性研究报告
- THBFIA 0004-2020 红枣制品标准
- GB/T 25630-2010透平压缩机性能试验规程
- GB/T 19610-2004卷烟通风的测定定义和测量原理
- 精排版《化工原理》讲稿(全)
- 市场营销学-第12章-服务市场营销课件
- 小微型客车租赁经营备案表
评论
0/150
提交评论