实验设计与数据处理第二部分_第1页
实验设计与数据处理第二部分_第2页
实验设计与数据处理第二部分_第3页
实验设计与数据处理第二部分_第4页
实验设计与数据处理第二部分_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 方差分析3.1 数据处理的概念和意义p 数据处理主要研究实验测量或观察数据分析计算的处理方法,从而得出可靠或规律性的结果。依据这个规律和结果对工业生产、农业生产、天气、地震等进行预报和控制,从而掌握和主宰客观事物的发展规律,使之服从和服务于人类。p 数据处理的方法很多,如参数估计、假设检验、方差分析和回归分析等。3.2 方差分析的概述p 方差分析 (Analysis of Variance) 由英国统计学家R.A.Fisher首创 ,为纪念Fisher, 以 F命名,故方差分析又称 F 检验。3.2.1 方差分析的概念和意义p 方差分析的中心点 是把实验观测数据总的波动分解为反映因素水平变化引起的波动和反映实验误差引起的波动两部分。p 方差分析亦即把实验观测数据的总的偏差平方和( ST)分解为反映必然性的各个因素的偏差平方和( SA、 SB、 、 SN)与反映偶然性的误差偏差平方和( Se),并计算比较它们的平均偏差平方和,以找出对实验观测数据起决定性影响的因素作为进行定量分析判断的依据。p 方差分析能把实验过程中实验条件改变所引起的数据波动与实验误差引起的数据波动区分开,同时对影响实验结果的各因素的重要程度给以精确的数量估计。p 方差分析类型很多,概括起来有以下几种:( 1)单因素实验的方差分析( 2)多因素实验的方差分析( 3)正交实验设计的方差分析( 4) SN比实验设计法3.2.2 单因素实验的方差分析p 在一项实验中,若只有一个因素的水平在改变,而其他因素的水平固定不变,这就叫做 单因素实验 。3.2.2.1 方差分析的基本思想例 3.1 考察生产某化工产品时反应温度 A( )对收率 y()的影响。为此,比较两个反应温度 A1 30 , A2 40 。1 2 3 4 5 平均值A1( 30 ) 75 78 60 61 83 71.4A2( 40 ) 89 62 93 71 85 80.0实验号水平表 3.1 某化工产品收率实验数据表p 条件误差: 由于实验条件的不同而引起的差异叫 “条件误差 ”。p 实验误差: 即同一条件(同水平)下,存在偶然因素而引起的差异叫 “实验误差 ”,即 “随机误差 ”。p 为了考察某个因素对指标的作用,必须将 总误差 分解为条件误差和实验误差,并比较之,作出因素对指标的作用是否显著的结论,这种分析方法称为 方差分析法 。条件误差、实验误差、总误差之间有什么关系呢?p 用全部 10个实验数据与总的平均值 ( 75.7) 之差的偏差平方和来估计总的误差,这个平方和称为 总的偏差平方和 ,记为 ST,即ST (75-75.7)2 + (78-75.7)2 + + (85-75.7)2 1294.10p 用同一条件(水平)下 5次实验的数据与其平均值之差的偏差平方和来估计实验误差,即对 A1( 30 ) 条件下:S1 (75-71.4)2 + (78-71.4)2 + + (83-71.4)2 429.20对 A2 ( 40 ) 条件下:S2 (89-80.0)2 + (62-80.0)2 + + (85-80.0)2 680.00这两个偏差平方和相加,反映了实验误差的大小,称为 组内偏差平方和 或误差平方和( Se) :Se S1 + S2 429.20 + 680.00 1109.20p 用每种条件(水平)的数据平均值与总的平均值差的偏差平方和来估计条件误差。因每种条件重复了 5次,故将此平方和 5倍,称为 组间偏差平方和 或因素的偏差平方和( SA ):SA 5(71.4 - 75.7)2 + 5(80.0 75.7)2 184.90 p 可以看出,此处有ST SA + Se 184.90 + 1109.20 1294.10即总的偏差平方和可以分解为组间偏差平方和与组内偏差平方和。有了 SA和 Se之后,是否就能直接比较出由于因素水平的变化引起的数据波动与实验误差引起的数据波动之间的差异呢?p 偏差平方和不仅与数据本身有关,而且还与数据的个数有关。为此,必须消除数据个数的影响,采用平均偏差平方和 SA/fA (组间方差)与 Se/fe (组内方差)进行比较,并以此作出推断。其中, fA和 fe分别称为 SA与 Se的自由度(即偏差平方和式中独立数据的个数)。p 对 Se而言,因为其中的 10个数据满足两个关系式(75+78+60+61+83)/5 = 71.4(89+62+93+71+85)/5 = 80.0所以 Se的自由度 fe =10-2 8.p 对 SA而言,因为其中的 2个数据有一个关系式(71.4+80.0)/2 = 75.7所以 SA的自由度 fA = 2-1 = 1.p 对 ST而言,因为其中的 10个数据有一个关系式(75+78+60+61+83+89+62+93+71+85)/10 = 75.7所以 ST的自由度 fT = 10-1 = 9.显然 fT = fA + fe = 1+8 = 9.p 如果平方和是由 n项组成,它的自由度就是 n 1,如果一个平方和是由几部分的平方和组成,则总的自由度等于各部分自由度之和。p 计算 F值:然后对因素进行显著性检验。F值的大小,可以用来判断因素水平对考察指标影响的显著性。 F值接近 1,说明因素水平改变对考察指标的影响在误差范围内,即水平间无显著差异; F值越大,说明因素水平的改变对指标的影响超过了实验误差造成的影响,即条件误差相对实验误差大得多。F多大时,可以说因素的水平改变对考察指标的影响是显著的呢 ?小到多小,认为实验结果的误差主要是实验误差引起的,这就需要有一个标准。这个标准由 F表给出。在 F表上,横行 n1代表 F值中分子的自由度,竖行 n2代表 F值中分母的自由度,相交后的数值即为 F比的临界值。本例中,因对 0.05, 查得 F0.05(1,8) 5.3, 为置信度(显著水平),表示在作出某种判断时犯错误的概率。因 F 1.335.3 ,故可以认为在水平 0.05下,反应温度 A对指标收率的影响不显著,或反应温度 30 和 40 对收率的影响没有显著差异,实验结果出现的波动主要是由实验误差造成的。3.2.2.2 单因素实验方差分析的一般步骤p 设有一单因素实验,因素 A有 m个水平,每个水平均重复 k次实验,水平 Ai的第 j次实验值为 xij (i=1,2, , m; j=1,2, , k )。水平数 重 复 数1 2 j k 合计 平均值A1 x11 x12 x1j x1k T1A2 x21 x22 x2j x2k T2Ai xi1 xi2 xij xik TiAm xm1 xm2 xmj xmk Tm总和 T 表 3.2 数据计算表Ti表示 Ai水平下 k次实验数据的合计, 表示 Ai水平下 k次实验数据的算术平均值。共进行了 mk次实验,令 n=mk,用 T表示 n个实验值的总和,即用 表示 n个实验值的总平均值,即1.偏差平方和的分解p 把整个实验结果所得的每一个观测值 xij对其总平均值 求偏差平方和,用 ST表示,可用下式计算:I II IIIp 式中 I项是在同一条件(水平)下, k次实验的数据与其平均值的偏差平方和,称为组内偏差平方和,因为它反映了实验过程引起的误差,所以也称误差平方和,用 Se表示。p 式中 II项p 式中 III项是每一种条件(水平)下, k次实验数据的平均值与 km次实验总的平均值的偏差平方和,称为组间偏差平方和,因为它反映了条件(水平)引起的误差,所以也称条件误差。用 SA或 S1表示。所以 ST Se+ SA 总偏差平方和分解公式在实际计算中,往往先算出 ST及 SA,而 Se由 ST SA求得。2.平均偏差平方和与自由度( 1) 自由度令 f、 fe及 fA分别为总自由度、组内自由度和组间自由度,则它们之间的关系为f = fe + fA 偏差平方和的自由度分解式( 2) 方差令 V、 Ve和 VA分别为总方差、组内方差和组间方差,则3.用 F检验法进行显著性检验p 为了计算方便,计算 ST, Se, SA时经常采用以下简化公式ST R P, Se R Q, SA Q P 例 3.2 某 4个实验室同用碘量法测定一种黄铜合金试样中的铜含量,均测定 5次,结果如下表所示。实验室 测定结果 /Cu%A 60.37 60.85 60.50 60.92 60.22B 60.86 60.98 61.04 60.53 60.71C 60.63 60.47 60.82 60.39 60.77D 61.44 61.24 61.67 61.04 61.15试分析各实验室的测定结果之间是否存在显著性差异。fe = n-m = 20-4 =16fA = m-1=4-1=3f = n-1 =20-1=19f = fA+ fe =16+3=19为了方便计算,可对数据进行简化。将整数部分去掉(不影响计算结果)。(1) 偏差平方和实验室 简化数据A 0.37 0.85 0.50 0.92 0.22B 0.86 0.98 1.04 0.53 0.71C 0.63 0.47 0.82 0.39 0.77D 1.44 1.24 1.67 1.04 1.15ST Se SA 0.9278+1.7044=2.6322(2) 方差(3) F检验(4) 方差分析表误差来源 偏差平方和 自由度 方差 F值 F临界值实验室间 1.7044 3 0.5681 9.80 F0.05( 3,16) =3.24实验误差 0.927 16 0.05799总和 2.6322 19 0.1385方差分析表即各实验室的测定结果之间存在显著性差异。因此,实验室间存在系统误差,应仔细查找原因,采取有效措施加以消除。作业现有四种型号 1、 2、 3、 4的轮胎,欲比较各型号轮胎在运行 20km后支撑瓦的磨损情况,为此,从每型号轮胎中任取四只,并随机地安装于四辆汽车上,汽车运行20km后,对各支撑瓦进行检测得表中所示的数据,问四种型号的轮胎是否具有明显的差别? 1 2 3 41 14 14 12 102 13 14 11 93 17 8 12 134 13 13 9 11型号实验号3.2.3 正交实验设计方差分析的基本原理p 在正交表上进行方差分析的基本步骤与格式如下 :(1) 偏差平方和的计算与分解现以 L4( 23)正交表上安排实验来说明1 2 3 实验结果1 1 1 1 x12 1 2 2 x23 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论