版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
误差和分析数据处理
1数据的准确度和精度
在任何一项分析工作中,我们都可以看到用同一个分析方
法,测定同一个样品,虽然经过多少次测定,但是测定结果总不
会是完全一样。这说明在测定中有误差。为此我们必须了解误
差产生的原因及其表示方法,尽可能将误差减到最小,以提高
分析结果的准确度。
1.1真实值、平均值与中位数
(一)真实值
真值是指某物理量客观存在的确定值。通常一个物理量的
真值是不知道的,是我们努力要求测到的。严格来讲,由于测量
仪器,测定方法、环境、人的观察力、测量的程序等,都不可能
是完善无缺的,故真值是无法测得的,是一个理想值。科学实验
中真值的定义是:设在测量中观察的次数为无限多,则根据误
差分布定律正负误差出现的机率相等,故将各观察值相加,加
以平均,在无系统误差情况下,可能获得极近于真值的数值。故
“真值”在现实中是指观察次数无限多时,所求得的平均值(或
是写入文献手册中所谓的“公认值”)。
(二)平均值
然而对我们工程实验而言,观察的次数都是有限的,
故用有限观察次数求出的平均值,只能是近似真值,或称
为最佳值。一般我们称这一最佳值为平均值。常用的平均值有
下列几种:
(1)算术平均值
这种平均值最常用。凡测量值的分布服从正态分布时,用
最小二乘法原理可以证明:在一组等精度的测量中,算术平均
值为最佳值或最可信赖值。
n
Xi
i1
n
式中:TX2Xn---------各次观测值;门一观察的次数。
(2)均方根平均值
n
'X2X2xnx2
Uu
(3)加权平均值
设对同一物理量用不同方法去测定,或对同一物理量
由不同人去测定,计算平均值时,常对比较可靠的数值予以加
重平均,称为加权平均。
n
WX
—WXWXwXi1ii
W]]22
WiW2Wn
nW
i
式中;XI、X2Xn"
——各次观测值;
WlxW2Wn各测量值的对应权重。各观测值的
权数一般凭经验确定。
(4)几何平均值
j7=-l•町.士龙4
(5)对数平均值
—XXXX
nInxInxx
i2Inj
x
2
以上介绍的各种平均值,目的是要从一组测定值中找出最
接近真值的那个值。平均值的选择主要决定于一组观测值的分
布类型,在化工原理实验研究中,数据分布较多属于正态分布,
故通常采用算术平均值。
(三)中位数6乂)
一组测量数据按大小顺序排列,中间一个数据即为中位数。
当测定次数为偶数时,中位数为中间相邻的两个数据的平均值。
它的优点是能简便地说明一组测量数据的结果,不受两端具有
过大误差的数据的影响。缺点是不能充分利用数据。
1.2准确度与误差
准确度与误差是指测定值与真实值之间相符合程度。准确
度的高低常以误差的大小来衡量。即:误差越小,准确度越高;
误差越大,准确度越低。误差有两种表示方法:绝对误差和相
对误差。
1、绝对误差(E)
某物理量在一系列测量中,某测量值与其真值之差称绝对误差。实
际工作中常以最佳值代替真值,测量值与最佳值之差称残余误差,
习惯上也称为绝对误差。
绝对误差(E)=测定值(乂)-真实值(T)
2、相对误差(RE)
为了比较不同测量值的精确度,以绝对误差与真值(或近
似地与平均值)之比作为相对误差。
测定值〔舅-真实值(T)
相对误差(RE)=------------
真实值(T)
由于测定值可能大于真实值,也可能小于真实值,所以绝
对误差和相对误差都有正、负之分。
绝对误差相同,相对误差可能相差很大。相对误差是指误
差在真实值中所占的百分比率。相对误差不同说明它们的误差
在真实值众所站的百分比率,用相对误差来衡量测定的准确度
更具有实际意义。
但应注意有时为了说明一些仪器测量的准确度,用绝对误
差更清楚。例如分析天平的称量误差是土0.0002g,常量滴定
的读书误差是±0.01mL等。这些都是用绝对误差来说明的。
1.3精密度与偏差
精密度是指在相同条件下n次重复测定结果彼此相
符合的程度。精密度的大小用偏差表示,偏差愈小说明精
密度愈高。
(一)偏差
偏差有绝对偏差和相对偏差。
绝对偏差(d)=xx
相对偏差是指单次测定值与平均值的偏差。
XX
—100%
相对偏差二x相对偏差是指绝对偏差在平均值中所占的百
分率。
绝对偏差和相对偏差都有正负之分,单次测定的偏差
之和等于零。
对多次测定数据的精密度常用算术平均偏差表示。
(~)算术平均偏差
算术平均偏差是指单次测定值与平均值的偏差(取绝
对值)之和,除以测定次数。即
(d)=...
算数平均偏差n(i1,2,n)
算术平均偏差和相对平均偏差不计正负。
例计算下面这一组测量值的平均值,算术平均偏差和相
对平均偏差。
解:55.51,55.50,55.46,55.49,55.51
x55.5155.5055.4655.4955.51
平均值二丁二_____出55殁49
0.020.010.030.000.02
---------------------0.016
n=
d100%0016100%
0.028%
相对平均偏差=二55.49
(三)标准偏差
在数理统计中常用标准偏差来衡量精密度。
1、总体标准偏差
总体标准偏差是用来表达测定数据的分散程度,其数学表
达式为:
():'1^______h
总体标准偏差Vn
2、样本标准偏差一般测定次数有限,值不知道,只能用样
本标准偏差来表示精密度,其数学表达式为:
(S)I%X)2
样本标准偏差一rf一
上式中(n-1)在统计学中成为自由度,意思是在n次测定
中,只有(n-1)个独立可变的偏差,因为「个绝对偏差之和等
于零,所以只要知道(n-1)个绝对偏差,就可以确定第n个的
偏差。
3、相对标准偏差
标准偏差在平均值中所占的百分率叫做相对标准偏差,也
叫变异系数或变动系数O,其计算式为:
S
=100%CV=x
用标准偏差表示精密度比用算术平均偏差表示要好。因为
单次测定值的偏差经平方后,较大的偏差就能显著地反应出来。
所以产生和科研的分析报告中常用CV表示精密度。
例如,现有两组测量结果,各次测量的偏差分别为:
第一组0.30.20.4-0.2-0.40.00.1
-0.30.2~0.3
第二组0.00.1-0.70.20.1-0.20.6
0.1-0.30.1
两组的算术平均偏差分别为:
了di0.24
第一组
F-d10.24
第二组裔
从两组的算术平均偏差的数据看,都等于0.24,说明两组的算
术平均偏差相同。但很明显的可以看出第二组的数据较分散,其中有
2个数据即-0.7和0.6偏差较大。
用算术平均值表示显示不出这两个差异,但用标准偏差表示时,就明
显的显示第二组数据偏差较大。
各次的标准偏差分别为:
(S)a㈤2.28
第一组1〃n1
公、:(XX)2
第二组(S)]i0.34
2\n1
由此说明第一组的精密度较好。
4、样本标准偏差的简化计算
按上述公式计算,得先求出平均值,再求出(\X),然后计算出
S值,比较麻烦。可以通过数学推导,简化为
下列等效公式:
:x2(x)2n
vi--------------i---------
S—n1
利用这个公式,可直接从测定值来计算s值,而且很
多计算器上都有乂以及X?功能,有的计算器上还有S及
功能,所以计算s值还是十分方便的。
(四)极差
一般分析中,平行测定次数不多,常用极差(R)来
说明偏差的范围,极差也称为“全距”。
R二测定最大值一测定最小值
100%
相对极差二x
(五)公差
公差也称允差。是指分析方法所允许的平行测定的绝
对偏差,公差的数值是将多次测定的分析数据经过数理统计方法
处理而确定的,生产实践中用以判断分析结果是否合格的依据。
若2次平行测定的数值之间在规定允差绝对值的2倍以内,认为
有效,如果测定结果超出允许的公差范围,成为“超差”,就应
重做。
例如:重铝酸钾发测定铁矿石中含铁,2次平行测定结果为
33.18%和32.78%,2次结果之差为
33.18%-32.78%=-0.40%。生产部门规定铁矿石含铁量在
30%—40%之间,允差为±0.3%。因为0.4%小于允差±0.3%
的绝对值的2倍(即0.6%),所以测定结果有效。可以用2次
测定结果的平均值作为分析结果,即W3M人T%32.98%
Fe2
这里要指出的是,以上公差表示方法只是其中的一种,在各
种标准分析方法总公差的规定不尽相同,除上述表示方法外,还
有用相对误差表示,或用绝对误差表示。要看公差的具体规定。
1.4准确度与精密度的关系
关于准确度与精密度的关系的定义及确定方法,在前面已
有叙述。准确度和精密度是两个不同的概念,它们相互之间有一
定的关系。现举例说明。
例如现有2组各分析结果的数据如下表所示,并绘制成
如图所示的图表(标准值为0.31)。
二二三四平均值
组
第一组0.200.200.180.170.19
第二组0.400.300.250.230.30
第三组0.360.350.340.330.35
第一组测定结果:精密度很高,但是平均值与标准
值相差很大,说明准确度很低。
第二组测定的结果:精密度不高,测定数据分散,虽然平
均值接近标准值,但这是凑巧的来的,如只取2次或3次来平
均,结果与标准值相差较大。
第三组数据的结果:测定的数据较集中并接近标准数据,
说明其精密度和准确度都较高。
由此可见欲使准确度高,首先必须要求精密度也要高。但
精密度高并不说明其准确度也高,因为可能在测定中存在系统
误差,可以说精密度是保证准确度的先决条件。
2误差的来源与消除方法
我们进行样品分析的目的是为了获取准的分析结果,然而
即使我们用最可靠的分析方法,最精密的仪器,熟悉细致的操
作,所测得的数据也不可能和真实值完全一致。这说明误差是
可观存在的。但是如果我们掌握了产生误差的基本规律,就可
以将误差减小到允许的范围内。为此必须了解误差产生的性质
和产生的原因以及减免的方法。
根据误差产生的原因和性质,我们将误差分为系统误差和
偶然误差两大类。
2.1系统误差
系统误差又可成为可测误差。它是由分析操作过程中的某
些经常原因造成的。在重复测定时,它会重复表现出来,对分析
结果的影响比较固定。这种误差可以设法减小得到可忽略的程
度。化验分析中,将系统误差产生的原因归纳为一下几个方面。
1、仪器误差
这种误差是由于使用仪器本身不够精密所造成的。如
使用未经过校正的容量瓶、移液管和祛码等。
2、方法误差
这种误差是由于分析方法本身造成的。如在滴定过程中,
由于分应进行的不完全,化学计量点和滴定终点不相符合,以
及由于条件没有控制好和发生其它副反应等等原因,都会引起
系统的测定误差。
3、试剂误差
这种误差是由于所用蒸储水含有杂质或所使用的试剂不纯
所引起的。
4、操作误差
这种误差是由于分析操作者掌握分析操作的条件不熟练,
个人观察器官不敏锐和固有的习惯所致。如对滴定终点颜色的
判断偏深或偏浅,对仪器刻度标线读数不准确等都会引起测定
误差。
2.2偶然误差
(-)偶然误差的规律
偶然误差又称随机误差,是指测定值受各种因素的随机波
动而引起的误差。例如,测量时的环境温度、湿度和气压的微小
波动,仪器性能的微小变化等,都会使分析结果在一定范围内
波动。偶然误差的形成取决于测定过程中一系列随机因素,其
大小和方向都是不固定的。因此,无法测量,也不可能校正,所
以偶然误差又成不可测误差,
它是客观存在的,是不可避免的。
根据上述规律,为了减少偶然误差,应该多做几次平行实
验并取其平均值。这样可使正负偶然误差相互抵消,在消除了
系统误差的条件下,平均值就可能接近真实值。
除以上两类误差外,还有一种误差被称为过失误差,这种
误差是由于操作不正确,粗心大意而造成的。例如加错试剂,
读错祛码,溶液溅失等,皆可引起较大的误差。有较大误差的
数据在找到误差原因之后应弃去不用。绝不允许把过失误差当
作偶然误差,只要工作认真操作正确,过失误差是完全可以避
免的。
(三)随机不确定度
准确度和精密度只对测量结果的定性描述。不确定度才是
对结果的定量描述。由于测量误差的存在,对被测量值不能肯
定的程度称为不确定度。对随机误差来说不能完全消除,所以
测量结果总是存在随机不确定度。
单次测量的随机不确定度(△),可用标准偏差(O)和置
信因子⑴)的乘积表示,即△二U。。
2.3提高分析结果准确度的方法
要提高分析结果的准确度,必须考虑在分析过程中可能产
生的各种误差,采取有效的措施,将这些误差减小到最小。
选择合适的分析方法
各种分析方法的准确度是不相同的。化学分析法对高含量
组分的测定,能获得准确和较满意的结果,相对误差一班在千
分之几。而对低含量组分的确定,化学分析法就达不到这个要
求。仪器分析法虽然误差较大,但是由于灵敏度高,可以测出低
含量组分。在选择分析方法时,主要根据组分含量对准确度的
要求,在可能的条件下选择最佳的分析方法。
增加平行测定的次数
如前所述,增加测定次数可以减少偶然误差。在一般的分
析测定中,测定次数为3—5次,如果没有意外发生,基本上可
以得到比较准确的分析结果。
减小测量误差
尽管天平和滴定管矫正过,但在使用中仍会引起一定的误
差。如果使用分析天平称取一份试样,就会引入土0.0002g的
绝对误差,使用滴定管完成一次滴定,就会引入±0.02mL的
绝对误差。为了使测量的相对误差小于0.1%,则
试样的最低称取量为
绝对误差0.0002
-------------------------g0.2g
试样质量=相对误差0.001
滴定剂的最小消耗体积为:
绝对误差202mL
0.2mL
V二相对误差0.001
消除测定中的系统误差,消除系统误差可以采取以下措
施:
空白试验由试剂和器皿引入的杂质所造成的系统误差,
一般可做空白试验来加以校正。空白试验是指在不加试剂的情
况下,按试样分析规程在同样的操作条件下进行的测定。空白
试验所得的结果数值称为空白值。从试样的测定值中减去空白
值,就得到较准确的分析结果。
校正仪器分析测定中,具有准确体积和质量的仪器,如滴
定管、移液管、容量瓶和分析天平祛码,都应进行校正,以消
除仪器不准确所引起的系统误差。因为这些仪器数据都是参加
分析结果计算的。
对照试验常用的对照试验有三种:
用组成与待测试样相近,已知准确含量的标准样品,按所
选方法测定,将对照试验的测定结果与标样的已知含量相比
较,其比值称为校正系数。
标准试样组分的标准含量
校正系数=标准试样测得的含量,则试样中被测定
组分的含量为:被测试样组分的含量=测得的含量*校正系数。
用标准方法与所选用的方法测定同一试样,若测定结果符
合公差要求,说明所选方案可靠。
用加标回收率的方法检验,即取2等份分试样,在一份中
加入一定量待测组分的纯物质进行测定,用相同的方法测定,
计算测定结果和加入纯物质的回收率,以检验分析方法的可靠
性。
3分析结果的表示方法
3.1离群值的检验与取舍
由于随机误差的存在,对同一试样进行的多次测定结果中,
测定值不可能完全相同。因此,一组测定数据存在一定的离散
性,处于一组数据中的极大值和极小值,称为极值,明显偏离一
组数据中其它的测定值称为离群值(离异值)。离群值包括极
值,但也包能包括次极值等,所以离群值不等于极值。
一组测定值数据中,有的数据明显处于合理的偏差范围之
外,它是一个异常值,必须舍去。离群值可能是异常值,也可能
不是异常值,所以必须对离群值进行检验以决定其取舍。
离群值的检验方法很多,一般分为两大类:一类是标准偏
差预先知道的场合,另一类是标准偏差未知的场合。在标准偏
差已知的场合,可采用28、38作为取舍标准,即离群值与平
均值之差大于28、38作为异常值舍去。
在标准偏差未知的场合,可采用Q检验法作为取舍标准,这里不
详述,可参阅有关专著。
3.2有效数字及修约规则
(1)准确数与近似数有些数是准确的,不存在误差,称为准确
数。例如1、2、3、……都是准确数。但人们在分析测定工作中
经常遇到近似数。例如在测定数据时,读取的数据是近似数,而
不是准确数。读取数据的准确程度应与测试时所用的仪器和测
试方法的精度一致。
(2)有效数字测定数据时,只保1位不准确数字,
其余数字都是准确数字的,称为有效数字。所以有效数字是指
分析测定中得到的有实际意义的数字,该数据除去最末1位数
字为估计值外,其余数字都是准确的。因此,有效数字的位数取
决于测定仪器、工具和方法的精度。
比如,使用滴定管进行滴定,测定溶液的体积时,因为滴
定管的最小刻度是0.1!"所以只能读准至0.1mL,因而记录
的体积有效数字位数为准确数外加1位估计数,例如45.25mL
为4位有效数字。
“0”在数据首位不算有效数字位数,在数据中间及末尾可
作为有效数字位数计算。
关于有效数字及位数应说明下面几个问题:
有效数字首位数〉8位时,可多计算1位有效数字,例如
0.098mol/L的浓度可看成4位有效数字。
单位换算,要注意有效数字的位数,不能混淆。例如:
1.37kg于1370g,应视为1.37x103g。
非测量数据应视为准确数,例如色谱峰面积衰减2倍或溶
液稀释10倍等,此处的2或10应视为准确数。圆周率虽然为
固定数,计算时,它所取得有效数字的位数应和其它的测定值
的有效数位数一致。
有效数字修约和运算
有效数字修约采用“4舍6入5取舍”的修约规则,即有
效数字后面第一位若《4时舍去。而〉6时应进位,当刚好=5
时,入后看前面的数,该数为奇数时,5进位,该数为偶数时,
5舍去。
按国家标准规定,凡产品标准中有界限数字不允许采用修
约方法。例如:规定某产品含量>98.0%时为合格产品,不允许
将含量为97.96%的产品修约98.0%而成为合格产品;同样,如
果规定某杂志含量V0.3%,也不能把杂质含量为0.32%修约为
0.3%而成为合格产品。
有效数字的运算可分为如下几种情况。
①加减法几个数相加减得到的和与差的有效数字位数,应该以
几个数中,小数点后位数最少的那个数的位数为准。例如:
0.0154、34.37、4.32751三个数相加,应该以34.37为准,
最后得到37.71291,修约成37.71.
②乘除法几个数相乘除得到的积与商的有效数字位数,应以几
个数中,有效数字位数最少的那个数的位数为准。例如:0.0121、
25.64、1.05782三个数相乘得到的积应该以0.0121的位数
为准,即取3位有效数字为0.328.
③对数运算所得到的对数的小数部分(尾数)的位数应该和真
数位数相同,而其整数部分(首数)只起定位作用。例如:
lgl43.7=2.1575,因为143.7为4位有效数字,所以对数的尾
数(小数部分)也取4位。为1575,而整数2仅仅是定位作用,
不影响有效数字位数。
④乘方与开方运算得到结果的有效数字位数应该和原来数据
的有效数字为数相同。例如:1892=357*102,0.049的开方
结果为0.220
应该指出在有效数字的运算过程中应注意如下几点:
数据中首位数大于或等于8者,可以多1为有效数字位数参加
运算。
参加计算的准确度,入2倍等可视为无穷多位的有效数字,
不决定计算结果的有效数字的位数。
参加计算的常数,例如口。气体常数等,它们所取得位数应
该由其它测定值的位数决定,取相同位数。
多步骤运算,每步可多保留1位有效数字参加运算,而不
要修约,直至得到最后结果再按规定修约,不允许连续累计修
约,这样会增加误差。
3.3分析结果的表示
1)两个平行试样测定结果的表示,如果采取2个平行试
样,得到2个测定结果两、河,一般用其算术平均值三来表示。
这是人们经常使用的。
2)1组式样测定结果的表示如果得到1组测试结果均、狗、
应该计算其算术平均值城和样本偏差s值:
附
分析结果的表示为真值:
x-Lt
<7/7a.f
式中,n为测定次数;f为自由度,f=nT;a为显著水
平,置信度=1—a,若置信度为95%,则a=0.05%;ta,f为在
置信度等于(1-穴)义100%与自由度f二「T情况下的置信
系数,该系数可以从t分布表5.3—1中查得。
表5.3—It分布值(a=0.05,f=nT)
n4567891011
t3.182.782.572.452.372.312.622.23
表5.3-1中列出当置信度为95%,f=nT时不同测定次数n的
置信系数t值。
4回归分析
在分析测定工作中,人们通常是通过测定试样的一组物
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年老年护理需求评估考核标准课件
- 医学26年:神经科人才培养要点 查房课件
- 2025年执业兽医资格考试综合应用科目真题与答案
- 评审工作方案及质量保证措施
- 监控员考试试题及答案
- 妇产科护士个人述职报告
- 大数据在毒品犯罪案件侦查中的具体应用
- 2026年四川省安全员B证考试题库(附答案)
- 农产品合格证春节采购查验
- 2026年智能婴儿床智能音乐创新报告
- 学生成长记录册
- 2026重庆德润环境有限公司招聘2人考试备考试题及答案解析
- 2026年广东省东莞市卫生健康系统人员招聘笔试参考题库及答案解析
- 2026年天津市部分区中考一模历史试卷和答案
- 大学生创业校园便利店
- 儿保宣教工作制度
- 2024年同等学力申硕《临床医学》试题及答案
- 中国主动脉夹层诊疗指南(2025版)
- 2026中国武夷实业股份有限公司招聘笔试备考试题及答案解析
- 中科曙光公司在线测评题
- 2026年党的二十届四中全会知识竞赛试卷及答案(四)
评论
0/150
提交评论