试验误差的分析及数据处理_第1页
试验误差的分析及数据处理_第2页
试验误差的分析及数据处理_第3页
试验误差的分析及数据处理_第4页
试验误差的分析及数据处理_第5页
已阅读5页,还剩135页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、材料制备与工艺实践材料制备与工艺实践 朱洪波朱洪波 2014.09. 试验误差分析及数据处理试验误差分析及数据处理试验设计与数据处理 作者:郑少华 姜奉华编著 出版日期:2004年03月第1版试验设计与数据处理 作者:何少华 文竹青 娄涛编著 出版日期:2002年10月第1版参考书目:参考书目: 一项科学合理的试验安排方法应能做列以下三点:一项科学合理的试验安排方法应能做列以下三点: (1)试验次数尽可能的少;例:某试验研究了3个影响因素: A:A1,A2,A3 B:B1,B2,B3 C:C1,C2,C3 全面试验:27次 正交试验:9次(2)便于分析和处理试验数据;(3)能得到满意的结果。试

2、验步骤试验步骤 (1)指标、因素和水平的确定; (2)研究技术路线的建立 (3)进行试验设计 单因素实验设计 正交试验设计 均匀实验设计 (4)误差分析和数据处理第四章第四章 试验误差分析及数据处理试验误差分析及数据处理n概述概述n真值与误差n有效数字及运算法则n可疑值的取舍n试验数据的处理n试验数据的整理和归纳 由于受方法、仪器、试剂、实验环境、实验者的主观因素等方面的限制,使测得的实验结果与真实含量不可能完全一致。这就造成误差。误差是客观上难以避免的。 在一定条件下,测量结果只能接近于真实值,而不能达到真实值。 为了提高分析结果测量的准确度,将误差减小到最低限度,必须了解误差产生的原因,采

3、取减小误差的有效措施,提高分析结果的准确度。下面具体介绍误差的种类、来源及产生的原因。n一、误差的基本概念一、误差的基本概念 1真值与平均值真值与平均值 真值真值(true value):任何一个物理量客观存在的大小(真任何一个物理量客观存在的大小(真实值、实际值)实值、实际值) 真值是指观察次数真值是指观察次数无限无限多时,求得的平均值。多时,求得的平均值。 平常我们观察的次数都是有限的,故用平常我们观察的次数都是有限的,故用有限有限观察次数观察次数求出的平均值,只能是求出的平均值,只能是近似真值近似真值,或称为最佳值。,或称为最佳值。 平均值平均值(mean):是用来描述实验数据取值的水平

4、位置的是用来描述实验数据取值的水平位置的位置特征参数位置特征参数,常用的平均值有以下几种:(,常用的平均值有以下几种:(1)算术平)算术平均值;(均值;(2)均方根平均值;()均方根平均值;(3)加权平均值;()加权平均值;(4)中)中位值(或中位数);(位值(或中位数);(5)几何平均值。)几何平均值。vc2 2直接测量值与间接测量值直接测量值与间接测量值n直接测量值直接测量值就是通过仪器直接测试读数得到的数据。就是通过仪器直接测试读数得到的数据。 如:如: 用压力表测量容器中的压力值。用压力表测量容器中的压力值。 用电流表测量电路中的电流值。用电流表测量电路中的电流值。 过滤实验中,测压管

5、的读数。过滤实验中,测压管的读数。 如混凝实验中,通过光电式浊度仪测出的剩余浊度值。如混凝实验中,通过光电式浊度仪测出的剩余浊度值。n间接测量值间接测量值就是直接测量值经过公式计算后所得的另外一就是直接测量值经过公式计算后所得的另外一些测量值。些测量值。 n所谓数据分析就是要对这些直接测量值或间接测量值进行所谓数据分析就是要对这些直接测量值或间接测量值进行分析整理,得出结论。分析整理,得出结论。 3 3误差与误差的分类误差与误差的分类误差误差( (error) ):测量值与真实值的差值。 例: 用分析天平称量两个样品,质量分别是1.4380克和0.1437克,假定两个真值分别为1.4381克和

6、0.1438克。其两者测量值的绝对误差都是-0.0001克,但相对误差却差别很大。一个是-0.00007,一个是-0.0007。 可见,绝对误差相等,相对误差不一定相等。因可见,绝对误差相等,相对误差不一定相等。因此,用相对误差来表示结果的准确度更为确切些。此,用相对误差来表示结果的准确度更为确切些。2 2)系统误差、)系统误差、 偶然误差与过失误差偶然误差与过失误差 系统误差系统误差(systematic error) :由于某种经常性的原因造:由于某种经常性的原因造成的比较恒定的误差。成的比较恒定的误差。l分类:分类: 方法误差方法误差系统误差系统误差 仪器或试剂误差仪器或试剂误差 操作误

7、差操作误差a. 方法误差方法误差:是由于不适当的实验设计或所选的分析方法不恰当不恰当造成的。如重量分析中,沉淀的溶解,会使分析结果偏低,而沉淀吸附杂质,又使结果偏高。b. 仪器或试剂误差仪器或试剂误差:是由于仪器未经校准或试剂不仪器未经校准或试剂不合格合格的原因造成的。如称重时,天平砝码不够准确;配标液时,容量瓶刻度不准确;对试剂而言,杂质与水的纯度,也会造成误差。c. 操作误差操作误差:是由于分析操作不规范操作不规范造成。如标准物干燥不完全进行称量;l 特点特点 重现性:同一样品进行多次重复测定可重复出现。(2)单向性;产生误差,要么是正,要么是负。(3)恒定性;影响的大小总是相同。l 消除

8、系统误差的方法消除系统误差的方法:加校正值的方法(利用对照实验、空白实验、校准仪器的方法进行) 偶然误差偶然误差n偶然误差偶然误差(random error)也称为随机误差。它是由不确定不确定的原因的原因或某些难以控制原因某些难以控制原因造成的。n偶然误差产生原因偶然误差产生原因:主要由环境因素所造成(如:环境温度、湿度和气压的微小波动)n偶然误差特点偶然误差特点 (1) 双向性 (时正时负) (2) 不可测性(忽大忽小)n减免方法减免方法:增加平行测定次数,取算术平均值。n除系统误差外,还有一种不按规程操作而引起的分析结果的差异,这种差异我们称为“过失”。它不属于误差范围,而属于工作中的错误

9、。例如:加错试剂、读错读数、试液溅失、和计算错误等。n因此在实际工作中,当出现错误时,应认真寻找原因,如果确定是过失引起的,其测定结果必须舍去,并重新测定。只要我们加强责任心,严格按照规程操作,过失是完全可以避免的。 过失误差过失误差( (mistake) )4.4.精度精度1 1)精度精度:反映观测结果与真实结果接近程度的量。精度在数 值上可用相对误差的倒数来表示。 例:例:如观测的相对误差为0.01%,则其精度为1:10-4=104; 如观测的相对误差为1ppm=10-6, 则精度为1:10-6=1062 2)精度又分精密度精度又分精密度( (precision) 、正确度、正确度( (c

10、orrectness)与精确度与精确度( (accuracy)l精密度反映偶然误差大小的程度精密度反映偶然误差大小的程度。如观测的偶然误差小,则称观测的精密度高,可以增加观测次数,取其平均值来提高观测的精密度。 l 正确度反映系统误差的大小的程度正确度反映系统误差的大小的程度。如观测的系统误差小,则称观测的正确度高。可以使用更精确的仪器来提高观测的精密度。精确度反映偶然误差与系统误差合成的综合误差大小精确度反映偶然误差与系统误差合成的综合误差大小的程度。的程度。 对于测量来说,精密度高,正确度不一定高;同样,正确度高,精密度也不一定高;精确度高,则精密度和正确度都高。n例如:甲、乙、丙、丁四个

11、人同时用碘量法测定某铜矿中例如:甲、乙、丙、丁四个人同时用碘量法测定某铜矿中CuO含含量(真实含量为量(真实含量为37.40)测定)测定4次,其结果如下图所示:分析此次,其结果如下图所示:分析此结果精密度与正确度的关系结果精密度与正确度的关系。n由图可知:甲所得结果的正确度和精密度都好,结果可靠;乙的结果精密度高,但正确度较低;丙的精密度和正确度都很差;丁的分析结果相差甚远,精密度太差,其平均值虽然也接近真值,但这是由于正负误差相互抵消所致。如果只取2次或3次来平均,结果会与真实值相差很大。因此这个结果是凑巧的,不可靠。n综上所述,可得到以下结论(1)精密度是保证正确度的先决条件,精密度差,所

12、得结果不可靠,就失去衡量准确度的前提。(2)精密度高不一定能保证有高的正确度。(3)精确度高一定伴随着高的精密度和正确度。n例如:甲乙两人用同一方法测定同一盐垢样品中时,测定例如:甲乙两人用同一方法测定同一盐垢样品中时,测定三次结果如下:三次结果如下: 甲:甲:2.16% 2.20% 2.18% 平均值平均值2.18% 乙:乙:3.24% 3.46% 3.38% 平均值平均值3.36%n在一组测量中,尽管精密度高,偶然误差小,但可能由于在一组测量中,尽管精密度高,偶然误差小,但可能由于存在系统误差,使正确度不高;反之,正确度高时,由于存在系统误差,使正确度不高;反之,正确度高时,由于仪器灵敏度

13、低或其他原因,使精密度不够。仪器灵敏度低或其他原因,使精密度不够。n所以,在消除系统误差之后,通过精细操作才能得出它的所以,在消除系统误差之后,通过精细操作才能得出它的精密度和正确度都高的结论。精密度和正确度都高的结论。 3 3)提高精度的方法)提高精度的方法l减小系统误差减小系统误差 办法:则应从分析方法、仪器和试剂、实验操作等方面,减少或消除可能出现的系统误差,具体有:u方法选择方法选择 常量常量组分的分析,常采用化学分析,而微量和痕量分析微量和痕量分析常采用灵敏度较高的仪器分析方法;u取样量要适当取样量要适当 过小过小的取样量将影响测定的准确度。如用分析天平称量,一般要求称量至少为至少为

14、0.2g0.2g,滴定管用于滴定,一般要求滴定液体积至少20ml20ml。 u需检查并校正系统误差需检查并校正系统误差 如分析天平及各种仪器的定期校正,滴定管、移液管等容量仪器,应注意其质量等级,必要时可进行体积的校正。l减小随机误差减小随机误差 办法:多次测定取其平均值可以减小随机误差的的多次测定取其平均值可以减小随机误差的的 影响,因此,在消除系统误差的前提下,平行测定的次数越多,影响,因此,在消除系统误差的前提下,平行测定的次数越多,平均值越接近真值。对同一试样,一般要求平行测定平均值越接近真值。对同一试样,一般要求平行测定2 24 4次。次。4 4)精密度与偏差)精密度与偏差 精密度精

15、密度(precision)是平行测量的各测量值(实验值)之间互相接近的程度。 用偏差表示,偏差为测定值测定值与平均值平均值之差,偏差可分为:绝对偏差(d)与相对偏差(dr)平均偏差、相对平均偏差、标准偏差、相对标准偏差等: (1)绝对偏差(d):(2)相对偏差(dr)为绝对偏差与平均值之比,常用百分率表示:XXdi%100Xddr(3)平均偏差与相对平均偏差)平均偏差与相对平均偏差n 平均偏差平均偏差 为各次测定值的偏差的绝对值的平均值, 式中n为测量次数。由于各测量值的绝对偏差有正有负,取平均值时会相互抵消。只有取偏差的绝对值的平均值才能正确反映一组重复测定值间的符合程度。dnXXdnii1

16、n相对平均偏差:为平均偏差与平均值之比,常用百分率表示:(4) 标准偏差标准偏差(standard deviation) 使用标准偏差是为了突出较大偏差的影响。标准偏差分为总体标准偏差和样本标准偏差。A、总体标准偏差,用符号表示,此偏差也称为均方根偏差:它是指测量值对总体平均值的偏差,其数学表达式为:%100Xddrn从上式可以看出,计算标准偏差时,对单次测量偏差加以平方,这样做可以避免单次测量偏差相加时正负抵消,更重要的是大偏差更能显著地反映出来,能更好地反映数据的离散程度以及结果的精确度。()nXnii12msnB、样本标准偏差(S)n在总体平均值不知道的情况下,可用样本标准偏差来衡量一组

17、数据的离散程度。其数学表达式为:n上式主要是校正以 代替 所引起的误差。1)(12nxxsniixmn式中的n为测定次数, n-1称为自由度,是指独立偏差的个数,通常以f表示。如果测量次数越多, n-1就越接近n,此时的n所以上式可变为:mX()()nxnxxsxniinii12121msm(5)相对标准偏差)相对标准偏差(Sr)或称变异系数或称变异系数(CV) 实际工作中都用RSD表示分析结果的精密度,更能说明一组数据的离散程度。()RSDXnXXXSSniir%1001%10012_n(6)相差(D)和相对相差(Dr)n对测定次数只有两次平行测定的结果,精密度通常用相差或相对相差表示:nA

18、:相差: D=x1-x2nB:相对相差:n(7)极差(range)(R)-是衡量精密度最简单的一种方法,是指一组测定数据中最大值和最小值之差:n下面举例说明: %10021xxxDrminmaxxxR例:一组重复测定值为15.67, 15.69, 16.03, 15.89。求15.67这次测量值的绝对偏差和相对偏差,这组测量值的平均偏差、相对平均偏差、标准偏差及相对标准偏差。解: =(15.67+15.69+16.03+15.89)/4=15.82 =15.82-15.67=0.15 =0.15/15.82100%=0.95% =(0.15+0.13+0.21+0.07)/4=0.14XXXd

19、i%100XddrnXXdnii1()17. 0307. 021. 013. 015. 01222212nXXSnii%1.1%10082.1517.0%100XSRSD0089.00010082.1514.000100 xddr(8)方差(方差(variance) 标准差的平方:标准差的平方:n样本方差(样本方差( s2 )n总体方差(总体方差(2 )n方差方差,精密度,精密度5. 直接测量值误差分析直接测量值误差分析a. a. 单次测量值误差分析单次测量值误差分析 实验中有些量都是一次测量读数的,其误差分析有两种方法:实验中有些量都是一次测量读数的,其误差分析有两种方法:n仪器上没有说明误

20、差范围,则按其最小刻度的仪器上没有说明误差范围,则按其最小刻度的1/2作为误差。作为误差。n例:某天平的最小刻度为例:某天平的最小刻度为0.1mg,则表明该天平有把握的最小称量,则表明该天平有把握的最小称量质量是质量是0.1mg,所以其绝对误差为,所以其绝对误差为0.1/2=0.05。n仪器上有误差范围,则按给定的误差范围分析计算。仪器上有误差范围,则按给定的误差范围分析计算。 例:例:SJG-203A型型DO分析仪,仪器精度为分析仪,仪器精度为0.5级(级(0.5%)(相对)(相对误差)误差) 当测得当测得DO=3.2mg/L时,其绝对误差值为时,其绝对误差值为 3.20.005 0.016

21、mg/L 实际测量值:实际测量值:3.20.016(mg/L)b. b. 重复多次测量值误差分析重复多次测量值误差分析2)标准偏差标准偏差(standard error)自由度自由度 算术平均值的简便计算法算术平均值的简便计算法 标准误差的简便计算法标准误差的简便计算法6. 间接测量值误差分析间接测量值误差分析n由误差传递理论可知,间接测量值一定也存在误差。由误差传递理论可知,间接测量值一定也存在误差。n误差大小取决于两点:误差大小取决于两点: 1.1.各直接测量值误差大小各直接测量值误差大小 2.2.公式形式公式形式a. a. 间接测量值算术平均误差计算间接测量值算术平均误差计算1)加减运算

22、中间接测量值误差)加减运算中间接测量值误差 N=A+B N=A-B即加减运算的绝对误差等于各直接测得值的即加减运算的绝对误差等于各直接测得值的绝对绝对误差之和。误差之和。2)乘除运算中间接测量值误差)乘除运算中间接测量值误差 N=AB NA/B即乘除运算的相对误差等于各直接测量值即乘除运算的相对误差等于各直接测量值相对相对误差之和。误差之和。3)方次与根)方次与根设设N= ,则,则 ,故方次的相对误差等于故方次的相对误差等于m倍的相对误差。倍的相对误差。结论:当间接测量值计算式只含加、减运算时,以先计算绝对误差后结论:当间接测量值计算式只含加、减运算时,以先计算绝对误差后计算相对误差为宜;当式

23、中只含乘、除、乘方、开方时,以先计算相计算相对误差为宜;当式中只含乘、除、乘方、开方时,以先计算相对误差,后计算绝对误差为宜。对误差,后计算绝对误差为宜。BANBBAANNmmmm mErb b间接测量值标准误差计算间接测量值标准误差计算3.3.误差传递公式的应用误差传递公式的应用测量仪器精度的选择测量仪器精度的选择n在任何试验中,虽然误差是不可避免的,但希望将间接在任何试验中,虽然误差是不可避免的,但希望将间接测量值或函数的误差控制在某一范围内,为此也可根据测量值或函数的误差控制在某一范围内,为此也可根据误差传递的基本公式,反过来计算出直接测量值的误差误差传递的基本公式,反过来计算出直接测量

24、值的误差限,然后根据这个误差限来选择合适的测量仪器或方法,限,然后根据这个误差限来选择合适的测量仪器或方法,以保证试验完成后,试验结果的误差能满足实际任务的以保证试验完成后,试验结果的误差能满足实际任务的要求。要求。n工程中,当要求间接测量值的相对误差为工程中,当要求间接测量值的相对误差为 时,时,通常采用等分配方案将其误差分配给各直接测量值通常采用等分配方案将其误差分配给各直接测量值 ,即即NNANsix1ixiAxns 式中式中 某待测量的直接测量值;某待测量的直接测量值; 某直接测量值的绝对误差值;某直接测量值的绝对误差值; n 待测量值的数目待测量值的数目 则根据则根据 的大小就可以选

25、定测量时所用仪器的精的大小就可以选定测量时所用仪器的精度。度。在仪器精度能满足测试要求的前提下,尽量使用精度低在仪器精度能满足测试要求的前提下,尽量使用精度低的仪器,否则由于仪器对周围环境、操作等要求过高,的仪器,否则由于仪器对周围环境、操作等要求过高,使用不当,反而加速仪器的损坏。使用不当,反而加速仪器的损坏。ixs1Anix3 3 有效数字及运算规则有效数字及运算规则一、有效数字一、有效数字(significant figure)概念概念:分析工作中实际上能测量到的数字能测量到的数字,除最后一位为可疑数字,其余的数字都是有效数字。如:分析天平称量:1.21 23 (g)(万分之一) 滴定管

26、读数:23.26 (ml) 在测量过程中,对一次测量数据的有效数字位数,在测量过程中,对一次测量数据的有效数字位数,应与所用仪器的精度相一致。应与所用仪器的精度相一致。二二. 位数确定位数确定(1) 记录测量数据时,只允许保留一位可疑数字只允许保留一位可疑数字。(2) 有效数字的位数反映了测量的相对误差,不能随意不能随意舍去或保留舍去或保留最后一位数字(3) 若第一位数字大于或等于大于或等于8,其有效数字位数应多其有效数字位数应多算一位算一位,如如9.13,可算作,可算作4位有效数字,因其相对误差约位有效数字,因其相对误差约为为0.1% %,与,与10.1510.15,10.2510.25等这

27、些具有等这些具有4 4位的有效数字的位的有效数字的数据相对误差相近。数据相对误差相近。(4) 数据中的“0”作具体分析,如1.2007g, 0.0012007kg均为五位有效数值,(5) 常数等非测量所得数据,视为无限多位有效数字;(6) pH、pM等对数值,有效数字位数仅取决于小数部分数字的位数小数部分数字的位数。如pH=10.20,应为两位有效数值看看下面各数的有效数字的位数:1.0008 43181 五位有效数字0.1000 10.98% 四位有效数字0.0382 1.9810-10 三位有效数字54 0.0040 二位有效数字0.05 2105 一位有效数字3600 100 位数模糊P

28、H=11.20对应于H+=6.310-12 二位有效数字三、有效数字的计算规则三、有效数字的计算规则1.数值相加减时,结果有效数字保留应与小数小数点点后位数最少者后位数最少者相同(绝对绝对误差最大误差最大) 0.0121+12.56+7.8432=0.01+12.56+7.84=20.41 总绝对误差取决于绝对误差大的在有效数字的运算过程中,必须遵循在有效数字的运算过程中,必须遵循“先进舍,后运算先进舍,后运算”的原则的原则2. 数值相乘除时,结果保留位数应与有效数字位数有效数字位数最少者最少者相同。(相对相对误差最大误差最大), (0.014224.43305.84)/28.7=(0.014

29、224.4306) /28.7=3.69 总相对误差取决于相对误差大的。3. 乘方或开方乘方或开方时,结果有效数字位数不变有效数字位数不变。 如8 .4254. 6275. 256. 74. 对数运算时,对数尾数对数尾数的位数应与真数真数有效数字位数相同;如尾数0.20与真数都为二位有效数字,而不是四位有效数字。 20.10,/103 . 6)(11pHLmolHc四、数字修约规则四、数字修约规则1.四舍六入五成双。如测量值为4.135、4.125、4.105、4.1251;修约为4.14、4.12、4.10和4.13。2.只允许对原测量值一次修约至所需位数,不能分次修约。如4.1349修约为

30、三位数。不能先修约成4.135,再修约为4.14,只能修约成4.13。3.大量数据运算时,可先多保留一位有效数字,运算后,再修约。4. 修约标准偏差。修约的结果应使准确度变得更差些。如S=0.213,取两位有效数字,修约为0.22,取一位为0.3。4 4 可疑值的取舍可疑值的取舍 在整理分析数据时,常出现个别与其它数据相差很大的可疑值可疑值。如果确定知道此数据由实验差错引起,可以舍去,否则,应根据一定的统计一定的统计学方法决定其取舍学方法决定其取舍。统计学处理取舍的方法有多种,下面仅介绍三种常用的方法。 1. Q1. Q检验法检验法步骤如下:(1) 将测定值按大小顺序排列,(2) 由可疑值与其

31、相邻值之差的绝对值除以极差,求得Q值: Q值愈大,表明可疑值离群愈远,当Q值超过一定界限时应舍去。 (3) 查表得Q值,比较Q表与Q计 判断,当Q计Q表,该可疑值应舍去,否则应保留。最小最大邻疑XXXXQ例如,平行测定盐酸浓度(mol/l),结果为0.1014,0.1021,0.1016,0.1013。试问0.1021在置信度为90%时是否应舍去。解: (1)排序:0.1013, 0.1014, 0.1016, 0.1021 (2)Q=(0.1021-0.1016)/(0.1021-0.1013)=0.63 (3)查表3-3,当n=4, Q0.90=0.76 因Q G0.05,6, 故测定值0

32、.2188应舍去。XXSXXG疑4.肖维涅准则 (2)根据观测次数n查肖维涅数值取舍标准表,得系数k; 以上面例子为例以上面例子为例:(1)求出 和S。 =0.2176 S=0.00059XX 5 5 试验数据的处理试验数据的处理 n 随机误差是由一些偶然的或不确定偶然的或不确定的因素引起的误差。在消除了系统误差后,多次重复测定仍然会有所不同,具有分散的特性。测定值的分布符合正态分布。n一、正态分布一、正态分布n若以概率密度(或误差频率)Y为纵坐标,测定值X与总体平均值的差值(或误差)为横坐标作图,可得到随机误差的正态分布曲线,也称为高斯分布曲线,如图1所示n由图可以看出随机误差的分布规律性:

33、n1、单峰性:当 n时,Y值最大,呈现一个峰值。故称单峰性n2、对称性(相消性)n 这一点的垂直线为对称轴,说明正负误差出现的概率相等,故称为对称性。n3、有界性:随机误差的分布具有有限的范围。mxmx图图1 随机误差的正态分布曲线随机误差的正态分布曲线 二、精密度与分布曲线的关系二、精密度与分布曲线的关系 由图2可以看出,反映了测定值的分散程度,愈大,曲线愈平坦,测定值愈分散; 精密度越差。愈小,曲线愈尖锐,测定值愈集中。精密度越好。三、置信区间三、置信区间从前面讨论可知,正态分布曲线的“高、矮、胖、瘦”取决于分布曲线标准偏差的大小, 小,分布曲线是“瘦高”的,精密度高; 大,分布曲线是“矮

34、胖”的,精密度低;如图2所示。2如果在正态分布图中,把曲线上各点代表某个误差出现的概率密度,曲线与横轴之间的面积代表各种大小误差出现概率的总和,如图所示:图图3 n由图3可知:在符合正态分布的情况下,当n为原点(即消除系统误差),总体标准偏差为,由统计学可知,测得的结果落在范围内的概率为68.3%,落在范围内的概率为95.5%,落在范围内的概率为99.7%,测定结果超出的概率只有0.3%。n换句话说:在1000次测定中,测定结果落在n范围内683次,落在范围内955次,落在n范围内997次,落在范围之外的结果只有3次。所以,通常认为大于3的误差已不属于随机误差了,这样的分析结果应该舍去。sxm

35、xs2xs3xs3sxs2xs3xs3xn上述误差出现的概率68.3%,95.5%,99.7%,n称为置信概率或置信度。n在一定置信度下,以测定结果为中心的包含总体平均值在内的可信范围,称为置信区间,可用下式表示:n式中:t为校正系数,也称为置信因子,它随置信度和自由度的大小而变化。n对于测定次数n20时, t已与n时的t值相差不大了,若再增加测定次数,不但费时、费力,而且对提高分析的准确度已没有多大意义了。例5 用8-羟基喹啉法测定Al含量,9次测定的标准偏差为0.042%,平均值为10.79%。估计真实值在95%和99%置信水平时应是多大?解:1.P=0.95; (称为显著性水准)=1-P

36、=0.05; f=n-1=9-1=8 t0.05,8=2.306 %032. 079.109/042. 0306. 279.108 ,05. 0mmnStX2.P=0.99; =0.01; t0.01,8=3.355 结论:总体平均值在10.7610.82%间的概率为95%;在10.7410.84%间的概率为99%。%047. 079.109/042. 0355. 379.108 ,01. 0mmnStX例如,测定试样中氯的含量W(Cl), 四次重复测定值为0.4764, 0.4769, 0.4752, 0.4755。求置信度为95%时, 氯平均含量的置信区间。解:可算出 =0.4760,S=

37、0.008 查表2-2 t0.05,3=3.18 =0.47603.18 =0.47600.0013X4008. 0n四、显著性检验四、显著性检验 显著性检验就是利用数理统计的方法,来检验分析结果之间是否存在显著性误差。其最常用、最重要的方法是t检验法和F检验法:(一)、t检验法1. 平均值平均值与标准值标准值的比较准确度显著性检验首先由下式计算t 值若t计t表,则平均值与标准值存在显著性差异,为系统误差引起,应查找原因,消除系统误差引起,应查找原因,消除。 ntSx |例1:用分光光度法测定标准物质中的铝的含量。五次测定结果的平均值 (Al)为0.1080, 标准偏差为0.0005。已知铝含

38、量的标准值 (Al)为0.1075。问置信度为95%时,测定是否可靠?解: =查表双边t值检验表, t0.05,4=2.776。因t t0.05,4, 故平均值与标准值之间无显著性差异,测定不存在系统误差。wwntSx |24. 250005. 01075. 01080. 0例2:为了检验一种新的测定微量二价铜的原子吸收方法,取一铜样,已知其含量是11.7ppm。测量5次,得标准品含量平均值为10.8ppm;其标准偏差S为0.7ppm。试问该新方法在95%的置信水平上,是否可靠?解:查表双测检验,得t0.05,4=2.78。因t t0.05,4, 故平均值与标准值之间有显著性差异,测定存在系统

39、误差。9 . 25/7 . 07 .118 .10|ntSx 例3:测定某一制剂中某组分的含量,熟练分析工作人员测得含量均值为6.75%。一个刚从事分析工作的人员,用相同的分析方法,对该试样平行测定6次,含量均值为6.94%,S为0.28%。问后者的分析结果是否显著高于前者。解:题意为单测检验。查单测检验表=0.05, f=6-1=5; 1.7t0.05,5,说明新手的准确度合乎要求,但精密度不佳。7 . 1628. 075. 694. 6t2. 两组平均值两组平均值的比较 当t检验用于两组测定值的比较时,用下式计算统计量tSR为合并的标准偏差(pooled standard deviatio

40、n) 若t计t表,则两组平均值间存在显著性差异,反之无显著性差异。2)1()1(|21222112121212nnSnSnSnnnnSxxtRR例4:用同一方法分析样品中的镁含量。样品1的分析结果:1.23%、1.25%及1.26%;样品2:1.31%、1.34%、1.35%。试问这两个样品的镁含量是否有显著性差别?解:可算得 =1.25, =1.33 S1=0.015, S2=0.021f=3+3-2=4,查表2-2, t0.05,4=2.776。 t计 t0.05,4故两个样品的镁含量有显著差别。1X2X4 . 53333018. 033. 125. 1018. 0233021. 0) 1

41、3(015. 0) 13(22tSR(二)、F检验法 F检验法是比较两组数据的方差两组数据的方差,以确定精密度之间有无显著性差异,用统计量F表示 F计F表,则两组数据的精密度存在显著性差异 F计F表,则两组数据的精密度不存在显著性差异22小大SSF 例5:用两种方法测定同一样品中某组分。第1法,共测6次,S1=0.055;第2法,共测4次,S2=0.022。试问这两种方法的精密度有无显著性差别。解:f1=6-1=5;f2=4-1=3。由表查得F=9.01。FF0.05,5,3因此, S1与S2无显著性差别,即两种方法的精密度相当。2 . 6022. 0055. 02222小大SSF(三)、使用

42、显著性检验的几点注意事项1.两组数据的显著性检验顺序是先进行F检验而后进行t检验。2.单侧与双侧检验3.置信水平P或显著性水平的选择数据统计处理的步骤: 1.求统计量 2.可疑值的取舍检验 3.F检验 4.t检验 总总 结结5.1 5.1 列表法列表法 n将试验数据列成表格,将各变量的数值依照一定的形式和将试验数据列成表格,将各变量的数值依照一定的形式和顺序一一对应起来顺序一一对应起来 (1)试验数据表)试验数据表记录表记录表n试验记录和试验数据初步整理的表格试验记录和试验数据初步整理的表格 n表中数据可分为三类:表中数据可分为三类: 原始数据原始数据 中间数据中间数据最终计算结果数据最终计算

43、结果数据6 6 试验数据的整理和归纳试验数据的整理和归纳 结果表示表结果表示表n表达试验结论表达试验结论 n应简明扼要应简明扼要(2)说明:)说明:n三部分:三部分:表名、表头、数据资料表名、表头、数据资料 n必要时,在表格的下方加上必要时,在表格的下方加上表外附加表外附加 n表名表名应放在表的上方,主要用于说明表的主要内容,为了应放在表的上方,主要用于说明表的主要内容,为了引用的方便,还应包含引用的方便,还应包含表号表号 n表头表头常放在第一行或第一列,也称为行标题或列标题,它常放在第一行或第一列,也称为行标题或列标题,它主要是表示所研究问题的类别名称和指标名称主要是表示所研究问题的类别名称

44、和指标名称 n数据资料数据资料:表格的主要部分,应根据表头按一定的规律排表格的主要部分,应根据表头按一定的规律排列列 n表外附加表外附加通常放在表格的下方,主要是一些不便列在表内通常放在表格的下方,主要是一些不便列在表内的内容,如指标注释、资料来源、不变的试验数据等的内容,如指标注释、资料来源、不变的试验数据等 (3)注意)注意 :n表格设计应简明合理、层次清晰,以便阅读和使用;表格设计应简明合理、层次清晰,以便阅读和使用;n数据表的表头要列出变量的名称、符号和单位;数据表的表头要列出变量的名称、符号和单位;n要注意有效数字位数;要注意有效数字位数;n试验数据较大或较小时,要用科学记数法来表示

45、,并记入试验数据较大或较小时,要用科学记数法来表示,并记入表头,注意表头中的与表中的数据应服从下式:数据的实表头,注意表头中的与表中的数据应服从下式:数据的实际值际值10n 表中数据;表中数据;n数据表格记录要正规,原始数据要书写得清楚整齐,要记数据表格记录要正规,原始数据要书写得清楚整齐,要记录各种试验条件,并妥为保管。录各种试验条件,并妥为保管。5.2.1 常用数据图常用数据图 (1)线图()线图(line graph/chart) n表示因变量随自变量的表示因变量随自变量的变化情况变化情况 n线图分类:线图分类:单式线图:表示某一种事物或现象的动态单式线图:表示某一种事物或现象的动态 复

46、式线图:在同一图中表示两种或两种以上事物或现象的复式线图:在同一图中表示两种或两种以上事物或现象的动态,可用于不同事物或现象的比较动态,可用于不同事物或现象的比较5.2 5.2 图示法图示法 图图1 1 高吸水性树脂保水率与时间和温度的关系高吸水性树脂保水率与时间和温度的关系图图2 某离心泵特性曲线某离心泵特性曲线(2)XY散点图(散点图(scatter diagram) n表示两个变量间的相互关系表示两个变量间的相互关系 n散点图可以看出变量关系的统计规律散点图可以看出变量关系的统计规律 图图3 散点图散点图(3)条形图和柱形图)条形图和柱形图n用等宽长条的长短或高低来表示数据的大小,以反映

47、各数用等宽长条的长短或高低来表示数据的大小,以反映各数据点的差异据点的差异 n两个坐标轴的性质不同两个坐标轴的性质不同 数值轴数值轴 :表示数量性因素或变量:表示数量性因素或变量 分类轴分类轴 :表示的是属性因素或非数量性变量:表示的是属性因素或非数量性变量 图图4 不同提取方法提取率比较不同提取方法提取率比较n分类:分类:单式:只涉及一个事物或现象单式:只涉及一个事物或现象 复式:涉及到两个或两个以上的事物或现象复式:涉及到两个或两个以上的事物或现象 图图5 不同提取方法对两种原料有效成分提取率效果比较不同提取方法对两种原料有效成分提取率效果比较(4)圆形图和环形图)圆形图和环形图圆形图(圆

48、形图(circle chart)n也称为饼图(也称为饼图(pie graph) n表示总体中各组成部分所占的表示总体中各组成部分所占的比例比例 n只适合于包含一个数据系列的只适合于包含一个数据系列的情况情况 n饼图的总面积看成饼图的总面积看成100% ,每,每3.6圆心角所对应的面积为圆心角所对应的面积为1% ,以扇形面积的大小来分,以扇形面积的大小来分别表示各项的比例别表示各项的比例 图图6 全球天然维生素全球天然维生素E消费比例消费比例 环形图(环形图(circular diagram)n每一部分的比例用环中的一段表示每一部分的比例用环中的一段表示 n可显示多个总体各部分所占的相应比例可显

49、示多个总体各部分所占的相应比例 ,有利于比较有利于比较图图7 全球合成、天然维生素全球合成、天然维生素E消费比例比较消费比例比较(5)三角形图()三角形图(ternary) 常用于表示三元混合物各组分含量或浓度之间的关系常用于表示三元混合物各组分含量或浓度之间的关系 n三角形:等腰三角形:等腰Rt、等边、不等腰、等边、不等腰Rt等等n顶点:纯物质顶点:纯物质n边:二元混合物边:二元混合物n三角形内:三元混合物三角形内:三元混合物MABSxAxSxB1 xA xS图图8 等腰直角三角形坐标图等腰直角三角形坐标图0.000.250.500.751.000.000.250.500.751.000.0

50、00.250.500.751.00ABCxCxBxAxAxAxCxCxBxBMEF图图9 等边三角形坐标图等边三角形坐标图(6)三维表面图()三维表面图(3D surface graph) n三元函数三元函数Z=f(X,Y)对应的曲面图,根据曲面图可以看出因对应的曲面图,根据曲面图可以看出因变量变量Z值随自变量值随自变量X和和Y值的变化情况值的变化情况 图图10 三维表面图三维表面图 (7)三维等高线图()三维等高线图(contour plot) n三维表面图上三维表面图上Z值相等的点连成的曲线在水平面上的投影值相等的点连成的曲线在水平面上的投影 图图11 三维等高线图三维等高线图 绘制图形时

51、应注意绘制图形时应注意 :(1)在绘制线图时,要求曲线光滑)在绘制线图时,要求曲线光滑,并使曲线尽可能通过较多并使曲线尽可能通过较多的实验点,或者使曲线以外的点尽可能位于曲线附近,并使的实验点,或者使曲线以外的点尽可能位于曲线附近,并使曲线两侧的点数大致相等;曲线两侧的点数大致相等;(2)定量的坐标轴,其分度不一定自零起;)定量的坐标轴,其分度不一定自零起;(3)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表)定量绘制的坐标图,其坐标轴上必须标明该坐标所代表的变量名称、符号及所用的单位,一般用纵轴代表因变量;的变量名称、符号及所用的单位,一般用纵轴代表因变量;(4)坐标轴的分度应与试验数据的

52、有效数字位数相匹配;)坐标轴的分度应与试验数据的有效数字位数相匹配;(5)图必须有图号和图题(图名),以便于引用,必要时还)图必须有图号和图题(图名),以便于引用,必要时还应有图注。应有图注。5.2.2 坐标系的选择坐标系的选择 n坐标系(坐标系(coordinate system) 笛卡尔坐标系(又称普通直角坐标系)、半对数坐笛卡尔坐标系(又称普通直角坐标系)、半对数坐标系、对数坐标系、极坐标系、概率坐标系、三角形标系、对数坐标系、极坐标系、概率坐标系、三角形坐标系坐标系 .n对数坐标系(对数坐标系(semi-logarithmic coordinate system) 半对数坐标系半对数坐

53、标系 双对数坐标系双对数坐标系 (1)选用坐标系的基本原则:)选用坐标系的基本原则:根据数据间的函数关系根据数据间的函数关系n线性函数:普通直角坐标系线性函数:普通直角坐标系n幂函数:双对数坐标系幂函数:双对数坐标系n指数函数:半对数坐标指数函数:半对数坐标根据数据的变化情况根据数据的变化情况n两个变量的变化幅度都不大,选用普通直角坐标系;两个变量的变化幅度都不大,选用普通直角坐标系;n有一个变量的最小值与最大值之间数量级相差太大时,可以选用半对有一个变量的最小值与最大值之间数量级相差太大时,可以选用半对数坐标;数坐标;n两个变量在数值上均变化了几个数量级,可选用双对数坐标;两个变量在数值上均

54、变化了几个数量级,可选用双对数坐标;n在自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引起因在自变量由零开始逐渐增大的初始阶段,当自变量的少许变化引起因变量极大变化时,此时采用半对数坐标系或双对数坐标系,可使图形变量极大变化时,此时采用半对数坐标系或双对数坐标系,可使图形轮廓清楚轮廓清楚例:x10204060801001000200030004000y24146080100177181188200图图12 普通直角坐标系普通直角坐标系图图13 对数坐标系对数坐标系(2) 坐标比例尺的确定坐标比例尺的确定 在变量在变量x和和y的误差的误差x,y已知时,比例尺的取法应使试验已知时,比例尺的取

55、法应使试验“点点”的边长为的边长为2x,2y,而且使,而且使2x2y12,若若2y2,则,则y轴的比例尺轴的比例尺My应为:应为:推荐坐标轴的比例常数推荐坐标轴的比例常数M(1、2、5)10 n (n为正为正整数),而整数),而3、6、7、8等的比例常数绝不可用;等的比例常数绝不可用;纵横坐标之间的比例不一定取得一致,应根据具体情况选择,纵横坐标之间的比例不一定取得一致,应根据具体情况选择,使曲线的坡度介于使曲线的坡度介于3060之间之间例例2: 研究研究pH值对某溶液吸光度值对某溶液吸光度A的影响,已知的影响,已知pH值的测值的测量误差量误差pH0.1,吸光度,吸光度A的测量误差的测量误差A

56、0.01。在一定波。在一定波长下,测得长下,测得pH值与吸光度值与吸光度A的关系数据如表所示。试在普通的关系数据如表所示。试在普通直角坐标系中画出两者间的关系曲线。直角坐标系中画出两者间的关系曲线。pH8.09.010.011.0吸光度A1.341.361.451.36设设2pH2A2mm解:解: pH0.1,A0.01 横轴的比例尺为横轴的比例尺为 2210/20.2pHmmmmMmmpHpH(单位值)纵轴的比例尺为纵轴的比例尺为 22100/20.01AmmmmMmmA(单位吸光度)图图14 坐标比例尺对图形形状的影响坐标比例尺对图形形状的影响5.3 方程法方程法5.3.1 直线图解法直线

57、图解法 凡是试验数据可以直接绘成一条直线或经变量变换后能改成为直线的,都可以用此种方法。 直线图解法的优点是简便,但由于个人用直尺凭直觉画出的直线可能不同,因此,精确度较差。当问题比较简单,或者精度要求低于0.2%0.5%,即有效数字位数为3时可以用此种方法。一、基本概念一、基本概念 (1) 相互关系相互关系 确定性关系确定性关系 :n变量之间存在着严格的函数关系变量之间存在着严格的函数关系相关关系相关关系 :n变量之间近似存在某种函数关系变量之间近似存在某种函数关系(2) 回归分析(回归分析(regression analysis) 处理变量之间相关关系的统计方法处理变量之间相关关系的统计方

58、法n确定回归方程确定回归方程:变量之间近似的函数关系式变量之间近似的函数关系式n检验回归方程的显著性检验回归方程的显著性 n试验结果预测试验结果预测5.3.2 回归分析法回归分析法二、二、 一元线性回归分析一元线性回归分析 1. 一元线性回归方程的建立一元线性回归方程的建立 (1)最小二乘法原理)最小二乘法原理n设有一组试验数据设有一组试验数据 (如表),若(如表),若x,y符合线性关系符合线性关系 xx1x2xnyy1y2yn 计算值计算值 与试验值与试验值yi不一定相等不一定相等 与与yi之间的偏差称为残差:之间的偏差称为残差:a,b回归系数(回归系数(regression coeffic

59、ient) iyiyiyiiieyy回归值回归值/拟合值,由拟合值,由xi代入回归方程计算出的代入回归方程计算出的y值。值。iiyabxn 一元线性回归方程一元线性回归方程 :n残差平方和残差平方和 :112()02()0niiiniiiiQyabxaQyabx xb n残差平方和最小时,回归方程与试验值的拟合程度最好残差平方和最小时,回归方程与试验值的拟合程度最好求残差平方和极小值:求残差平方和极小值:222111()()nnneiiiiiiiiSSQeyyyabxn正规方程组(正规方程组(normal equation) :112111nniiiinnniiiiiiinabxyaxbxx

60、y11112222111()()()( )nnnniiiiiiiiiinnniiiiiinx yxyx ynxybnxxxn xaybxn 解正规方程组:解正规方程组:n简算法:简算法:22211()( )nnxxiiiiLxxxn x11()()nnxyiiiiiiLxxyyx ynxyxyxxLbLaybx三、三、 一元线性回归效果的检验一元线性回归效果的检验 (1)相关系数检验法)相关系数检验法 相关系数(相关系数(correlation coefficient) :n描述变量描述变量x与与y的线性相关程度的线性相关程度n定义式:定义式: xyxxyyLrLL相关系数特点:相关系数特点:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论