实验数据处理与分析 第四章_第1页
实验数据处理与分析 第四章_第2页
实验数据处理与分析 第四章_第3页
实验数据处理与分析 第四章_第4页
实验数据处理与分析 第四章_第5页
已阅读5页,还剩131页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

[例1]某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为9.75%,其标准差为5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为11.99%。问新曲种和原曲种有无差异?[例2]在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。甲生产线(x1)乙生产线(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557

[例3]:意大利对进口谷物六六六(丙怀)农药残留限量为0.5mg/kg,现我国某地区出口大米抽样检验所得10个试样的检验结果,0.51、0.48、0.43、0.56、0.53、0.52、0.49、0.51、0.50、0.47,问能否放行?第四章统计假设检验本章主要内容统计假设检验概述样本平均数的假设检验二项百分率的假设检验统计假设检验中应注意的问题参数的区间估计第一节统计假设检验概述统计假设检验的意义和基本原理

统计假设检验的步骤统计假设检验的几何意义与两类错误两尾检验与一尾检验

例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为μ0=9.75%,其标准差为σ=5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为=11.99%。问新曲种是否好于原曲种?

一、统计假设检验的意义和基本原理统计假设检验的意义从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。统计假设检验的基本原理小概率事件在一次试验中被认为是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。

0.050.010.001称之为小概率事件。

(一)对试验样本所在的总体提出假设;(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,估计表面效应仅有误差造成的概率;(三)根据“小概率事件实际不可能性原理”否定或接受无效假设。二、统计假设检验步骤

[例1]某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为9.75%,其标准差为5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为11.99%。问新曲种是否好于原曲种?显著水平

在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。

在试验研究中常取α=0.05或α=0.01。三、统计假设检验的几何意义与两类错误

假设检验时选用的显著水平,除α=0.05和0.01为常用外,也可选α=0.10或α=0.001等等。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。

如何选择显著水平

如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。差异显著性判定:

差异不显著差异显著差异极显著

因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。统计假设检验的两类错误

显著性检验可能出现两种类型的错误:

Ⅰ型错误与Ⅱ型错误。

Ⅰ型错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上H0正确,检验结果为否定H0。犯Ⅰ类型错误的可能性一般不会超过所选用的显著水平; Ⅱ型错误又称为错误,就是把真实的差异错判为是非真实的差异,即实际上HA正确,检验结果却未能否定H0。犯Ⅱ类型错误的可能性记为,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。

显著性检验的两类错误归纳如下:表4-1显著性检验的两类错误

因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?

为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯Ⅰ类型错误的概率,但与此同时也增大了犯Ⅱ型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?四、双侧检验与单侧检验这样,在α水平上否定域有两个和,对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如图4-3所示。这种利用两尾概率进行的检验叫双侧检验(two-sidedtest),也叫双尾检验(two-tailedtest),为双侧检验的临界u值。

如酿醋厂的企业标准规定,曲种酿造醋的醋酸含量应保持在12%以上(μ0),如果进行抽样检验,样本平均数,该批醋为合格产品,但如果时,可能是一批不合格产品。对这样的问题,我们关心的是所在总体平均数μ是否小于已知总体平均数数μ0(即产品是否不合格)。此时,无效假设应为(产品合格),备择假设则应为HA:(产品不合格)。这样,只有一个否定域,并且位于分布曲线的左尾,为左尾检验,如图4-3B所示,左侧的概率为α。单侧检验利用一尾概率进行的检验叫单侧检验(one-sidedtest),也叫单尾检验(one-tailedtest)。此时uα为单侧检验的临界u值。单侧检验的uα=双侧检验的u2α。下一张

主页

退出

上一张

图4-3一尾检验

H0:μ≥μ0HA:μ<μ0

H0:μ≤μ0HA:μ>μ0临界值u2α或t2αα

在食品分析中,常遇到两个平均值的比较问题,如测定平均值和已知值的比较,不同分析人员,不同实验室,或不同分析方法测定的平均值的比较,对比性试验研究等。这些问题都属于显著性检验问题。第二节样本平均数的假设检验单个样本平均数的假设检验

两个样本平均数的假设检验

在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。

一、单个样本平均数的假设检验

已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。如产品正常微生物的指标、生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。

单个样本平均数的u检验

u检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。

有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;总体方差虽然未知,但样本平均数来自于大样本(n≥30)。【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?

(1)提出假设无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。(2)确定显著水平

α=0.05(两尾概率)(3)构造统计量,并计算样本统计量值均数标准误:样本平均数:统计量u值:(4)统计推断由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明,试验表面效应仅由误差引起的概率P>0.05,故不能否定H0,所以,当日装罐机工作正常。单个样本平均数的t检验

t检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n<30)。其中,为样本平均数,S为样本标准差,n为样本容量。[例4-2]用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为520g,标准差12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?(1)提出无效假设与备择假设,即新老工艺没有差异。

,即新老工艺有差异。(2)确定显著水平

α=0.01

(3)计算t值=520g,S=12g所以(4)查临界t值,作出统计推断由df=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|>t0.01,P<0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记**)[例4-3]某名优绿茶含水量标准为不超过5.5%。现有一批该绿茶,从中随机抽出8个样品测定其含水量,平均含水量=5.6%,标准差S=0.3%。问该批绿茶的含水量是否超标?(1)提出无效假设与备择假设

H0:≤=5.5%,HA:>(2)计算t值

(3)查临界t值,作出统计推断单侧=双侧=1.895,t=1.000<单侧t0.05(7),P>0.05,不能否定H0:≤=5.5%,可以认为该批绿茶的含水量符合规定要求。[练习1]某植物油厂在正常生产情况下,豆油中的平均酸价为3.5,经抽查了9份样品,测得其酸价为3.8,4.0,3.9,4.1,4.2,4.0,4.2,3.7,4.1,问该生产线生产是否正常?在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计或调查取样不同,一般可分为非配对和配对设计两种。二、两个样本平均数的差异显著性检验成组资料平均数的假设检验成组设计:当一个试验只有两个处理时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k=2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见表4-1。

表4-1成组设计(非配对设计)资料的一般形式成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等u

检验(1)如果两个样本所在总体为正态分布,且总体方差和已知;(2)总体方差未知,但两个样本都是大样本(n1,n2≥30),由样本方差S12、S22分别估计总体方差σ12、σ22。在H0:μ1=μ2下,统计量为其中:根据4-2,4-3即可对两样本均数的差异做出检验(4-2)(4-3)[例4-4]在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。甲生产线(x1)乙生产线(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557表4-2甲乙两条生产线日产量记录(1)建立假设。即两条生产线的平均日产量无差异。(2)确定显著水平α=0.01(3)计算故:(4)统计推断。由α=0.01查附表2,得u0.01=2.58实际|u|=3.28>u0.01=2.58,故P<0.01,应否定H0,接受HA。说明两个生产线的日平均产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。补充内容:两样本的总体方差齐性检验

进行两个样本平均数比较的t检验之前,需要判断两样本的总体方差是否齐同(相等)。两总体方差齐与不齐,所采用的t检验计算公式将有所差异。若两组资料的总体方差相同,即,则称这两个总体具有方差齐性。

检验统计量F<F(0.05)则接受无效假设,两个总体方差相同。当两个样本所在总体方差未知,又是小样本,但假定时,有t

检验~t()当样本含量相等时()自由度df=2(n-1)(4-4)[例4-5]海关抽检出口罐头质量,发现有胀听现象,随机抽取了6个样品,同时随机抽取6个正常罐头样品测定其SO2含量,测定结果见表4-3。试分析两种罐头的SO2含量有无差异。表4-3正常罐头与异常罐头SO2含量测定结果正常罐头(x1)100.094.298.599.296.4102.5异常罐头(x2)130.2131.3130.5135.2135.2133.5(1)提出无效假设与备择假设

两种罐头SO2含量没有差异;(2)确定显著水平α=0.01(两尾概率)

(3)计算

(4)统计推断由df=10,α=0.01查附表3得t0.01(10)=3.169。实得|t|=22.735>t0.01(10)=3.169,P<0.01,故应否定无效假设H0,即两种罐头的SO2含量有高度显著差异,该批罐头质量不合格。[例4-6]现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表4-4。问两种工艺的粗提物中茶多糖含量有无差异?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.00表4-4两种工艺粗提物中茶多糖含量测定结果(1)建立假设,提出无效假设与备择假设

(2)确定显著水平α=0.05(两尾概率)

(3)计算

因两个样本的容量不等,所以(4)查临界t值,作出统计推断

当df=9时,查临界值得:t0.05(9)=2.262,|t|=1.381<t0.05(9),所以P>0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。

在成组设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样本含量相等比两样本含量不等有较高检验效率,因为此时使最小,从而使t的绝对值最大。所以在进行成组设计时,两样本含量以相等为好。

近似t检验-t’检验两样本所在总体方差未知,而且两个方差不等,此时只能作近似t检验。检验原理、过程同t检验,只是计算上有区别。均数差数标准误:t’不再准确地服从自由度为的t分布,而只是近似地服从t分布,此时,应采用近似t检验法。此法在作统计推断时,所用临界值不是由附表直接查得的,而须进行矫正。(4-6)实例见例4-7,P82

非配对设计要求试验单元尽可能一致。如果试验单元变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。成对资料平均数的假设检验

配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测用两种不同方法对农产品中毒物或药物残留量的测定结果变化,同一食品在贮藏前后的变化。同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。

成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见表4-5。

表4-5配对设计试验资料的一般形式两个处理的观测值一一配对,即(X11,X21),(X12,X22),(X13,X23),…,(X1n,X2n)。那么,每对观测值之间的差数为di=X1i-X2i(i=1,2,3,…,n)差数d1,d2,d3,…,dn组成容量为n的差数样本,差数样本的平均数为(i=1,2,3,…,n)差数均数标准误(4-7)(4-8)根据(4-7)式和(4-8)式即可对成对资料平均数的差异性进行检验。【例4-8】为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?品种编号12345678910电渗处理X1/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照X2/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=X1-X2)4.193.103.615.003.081.995.921.712.444.14表4-5电渗处理对草莓钙离子含量的影响,即电渗处理后草莓钙离子含量与对照钙离子含量无差异

(1)建立假设

(2)确定显著水平α=0.01

(3)计算将计算所得t值的绝对值与临界值比较,(4)查临界t值,作出统计推断根据df=n-1=9,查临界t值:t0.01(9)=3.250因为|t|=8.358>t0.01(9),P<0.01,否定H0,接受HA,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。

一般说来,相对于成组设计,配对设计能够提高试验的精确性。配对内的误差是相同的且是随机的;配对间的误差不同,但它们是独立的,可分离出来,为系统误差。在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设HA的建立和临界值的查取就行了,具体计算与双侧检验相同。成对检验的优点(1)由于加强了试验控制,成对观测值的可比性提高,因而随机误差将减小,可以发现较小的真实差异。(2)成对比较不受两个样本总体方差σ12≠σ22的干扰,不需考虑两者是否相等。[思考1]经甲乙双方用微量法,测定同一批面粉中蛋白质的含量,分别得到如下结果(%):甲方:13.5713.9713.3413.6213.79乙方:13.7413.8513.3413.51[练习1]比较两种包装储藏方法对红星苹果果肉硬度的影响,分别从两种包装中各取1个随机样本,红星苹果果肉硬度结果见下表。问两种包装储藏方法对红星苹果果肉硬度影响有无差异?第1种11.79.210.413.9第2种7.97.47.67.8

[练习2]

某人研究了两种浸提条件下山楂中可溶性固形物的浸提率,试验结果见表试问这两种浸提条件下山楂可溶性固形物提取率有无显著差异?(α=0.05)浸提条件可溶性固形物提取率(%)条件142.541.343.741.041.844.0条件247.648.246.347.946.049.0第三节二项百分率的假设检验

在食品科研中,有许多试验结果以百分率表示,例如产品合格率、食品贮藏变质率、一级出品率等等。这些百分数资料是服从二项分布的,故称为二项百分率。它们与一般百分数不同(如食品中各种营养成分的含量)。对二项百分率的检验,从理论上讲,应按二项分布进行。这样的检验方法虽然比较准确,但计算较麻烦,所以常用正态近似法来代替。当样本含量n较大,p不是很小,且np和nq均大于5时,二项分布接近于正态分布。所以,对于服从二项分布的百分率资料,当n足够大时,可以近似地用u检验法,进行差异显著性检验。适用于正态近似法的二项样本条件见表4-6。表4-6适用于正态近似法的二项样本条件<<<<<<≥≥≥≥≥≥≥≥≥≥≥≥需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,其目的在于检验一个样本百分率所在二项总体百分率p是否与已知二项总体百分率p0相同。单个样本百分率的假设检验一个样本百分率与已知总体百分率的差异显著性检验由第3章可知,二项百分率的总体均值,方差,标准差分别为:在n≥30,np、nq>5时,标准化后有在下u统计量百分率标准误利用这样两个公式即可进行单个样本百分率检验。(4-9)(4-10)

【例4-9】某微生物制品的企业标准规定有害微生物超标产品不准超过1%(p0),现从一批产品中抽取500件(n),发现有害微生物超标的产品有7件(x)。问该批产品是否合格?(1)提出假设即该批产品合格;由一尾概率α=0.05查附表,得一尾临界值u0.05=1.64,实际计算,p>0.05,表明该批产品达到了企业标准,为合格产品。(2)计算所以(3)作出统计推断

检验服从二项分布的两个样本百分率差异是否显著。其目的在于检验两个样本百分率、所在的两个二项总体百分率P1、P2是否相同。当两样本的np、nq均大于5时,可以近似地采用u检验法进行检验。两样本百分率之差近似服从正态分布。两个样本百分率的差异显著性检验所以在下,则(4-13)可借助正态分布作两样本百分率的差异检验。样本百分率的差数标准误为:在下由于总体百分率p未知,只能由样本百分率来估计。这里用两个样本百分率的加权平均数来估计共同的总体百分率p:由样本获得的两样本百分率的差数标准误为:【例4-10】葡萄贮藏试验。装入塑料袋不放保鲜片的葡萄385粒(n1),一个月后发现有25粒(x1)葡萄腐烂;装入塑料袋放保鲜片的葡萄598粒(n2),一个月后发现有20粒(x2)葡萄腐烂。问加保鲜片与不加保鲜片的两种葡萄的腐烂率是否有显著差异?(1)提出假设两种贮藏葡萄的腐烂率没有差异,即保鲜效果一致。(2)计算由α=0.05和α=0.01查附表得,临界值u0.05=1.96,u0.01=2.58。由于实际计算1.96<<2.58,所以0.05<p<0.01,应否定H0,接受HA,表明两种贮藏葡萄的腐烂率有显著差异,加保鲜片贮藏葡萄有利于葡萄保鲜。

(3)作出统计推断

二项样本百分率假设检验时的连续性矫正在np和(或)nq小于或等于5时,需作连续性矫正。[练习1]某种大量生产的袋装食品,按规定不得少于250g。今从一批该食品中任意抽取50袋,发现有6袋低于250g。若规定不符合标准的比例超过5%就不得出厂,该批食品能否出厂?

第四节统计假设检验中应注意的问题要有严密的试验设计和正确的试验技术

试验中各个处理的非处理条件应尽可能一致,以保证各样本是从方差同质的总体中抽取的。这样可使假设检验中获得较小而无偏的标准误,提高分析精度,减少犯两类错误的可能性。否则,任何显著性检验的方法都不能保证结果的正确。

由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论