分析化学中的误差及数据处理综述_第1页
分析化学中的误差及数据处理综述_第2页
分析化学中的误差及数据处理综述_第3页
分析化学中的误差及数据处理综述_第4页
分析化学中的误差及数据处理综述_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章分析化学中的误差及数据处理3.1分析化学中的误差3.2有效数字及其运算规则3.3有限数据的统计处理3.4回归分析法§3.1分析化学中的误差3.1.1误差(Error)与准确度(Accuracy)相对误差表示误差占真值的百分率或千分率。1.

误差——测定值xi与真实值μ之差(真实值TrueValue:在一定的时间和空间条件下,被测量的物质的客观存在值,它是可趋进而不可达到的哲学概念。真值是客观存在的,它分为科学规定真值、标准真值、理论真值。)

误差的大小可用绝对误差E(AbsoluteError)和相对误差RE(RelativeError)表示。

E=xi-μ22.准确度

(1)测定平均值与真值接近的程度;(2)准确度高低常用误差大小表示,误差小,准确度高。3例1:

分析天平称量两物体的质量各为1.6380g和0.1637g,假定两者的真实质量分别为1.6381g

和0.1638g,则两者称量的绝对误差分别为:

(1.6380-1.6381)g=-0.0001g

(0.1637-0.1638)g=-0.0001g两者称量的相对误差分别为:绝对误差相等,相对误差并不一定相同。43.讨论(1)绝对误差相等,相对误差并不一定相同;(2)同样的绝对误差,被测定的量较大时,相对误差就比较小,测定的准确度也就比较高;(选分子量大的基准物质)(3)用相对误差来表示各种情况下测定结果的准确度更为确切;(4)绝对误差和相对误差都有正值和负值。正值表示分析结果偏高,负值表示分析结果偏低;(5)实际工作中,真值实际上是无法获得;常用纯物质的理论值、国家标准局提供的标准参考物质的证书上给出的数值、或多次测定结果的平均值当作真值;53.1.2

偏差(Deviation)与精密度(Precision)1.偏差

个别测定结果xi与几次测定结果的平均值的差。绝对偏差di:测定结果与平均值之差;相对偏差dr:绝对偏差在平均值中所占的百分率或千分率。6各偏差值的绝对值的平均值,称为单次测定的平均偏差,又称算术平均偏差(AverageDeviation):单次测定的相对平均偏差表示为:72.标准偏差(StandardDeviation)

又称均方根偏差,当测定次数趋於无限多时,称为总体标准偏差,用σ表示如下:

μ为总体平均值,在校正了系统误差情况下,μ即代表真值;n为测定次数。

(n-1)表示n个测定值中具有独立偏差的数目,又称为自由度f。

有限次测定时,标准偏差称为样本标准差,以s表示:8用下式计算标准偏差更为方便:

s与平均值之比称为相对标准偏差,以sr(或RSD)表示:也可用千分率表示(即式中乘以1000‰)。如以百分率表示又称为变异系数

CV(CoefficientofVariation)。93.精密度(1)精密度:在确定条件下,将测试方法实施多次,求出所得结果之间的一致程度。精密度的大小常用偏差表示。(2)精密度的高低还常用重复性(Repeatability)和再现性(Reproducibility)表示。重复性(r):同一操作者,在相同条件下,获得一系列结果之间的一致程度。再现性(R):不同的操作者,在不同条件下,用相同方法获得的单个结果之间的一致程度。(3)用标准偏差比用算术平均偏差更合理。10对比:

有两组测定值,判断精密度的差异。

甲组2.92.93.03.13.1乙组2.83.03.03.03.2计算:平均偏差相同;标准偏差不同,两组数据的离散程度不同;在一般情况下,对测定数据应表示出标准偏差或变异系数。113.1.3准确度与精密度的关系精密度是保证准确度的先决条件;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。精密度准确度

好好

好稍差

差差

很差偶然性

12

分析铁矿中铁含量,得如下数据:37.45%,37.20%,37.50%,37.30%,37.25%计算此结果的平均值、平均偏差、标准偏差、变异系数。计算:例2:13中位数:数据从小到大排列,测量值个数n为奇数时,正中间的那个数为中位数,当n为偶数时,中间相邻两个测量值的平均值为中位数。(与平均值比较?)极差:一组测量数据中最大值与最小值之差R=Xmax-Xmin143.1.4误差的分类及减免误差的方法

系统误差或称可测误差(DeterminateError)

偶然误差或称未定误差、随机误差(IndeterminateErrors)1.系统误差产生的原因、性质及减免产生的原因:(1)方法误差(MethodErrors):如反应不完全;干扰成分的影响;指示剂选择不当;(2)试剂或蒸馏水纯度不够;15(3)仪器误差(InstrumentalErrors)如容量器皿刻度不准又未经校正,电子仪器“噪声”过大等造成;(4)人为误差(PersonalErrors),如观察颜色偏深或偏浅,第二次读数总是想与第一次重复等造成。16系统误差的性质:(1)重复性:同一条件下,重复测定中,重复地出现;(2)单向性:测定结果系统偏高或偏低;(3)恒定性:大小基本不变,对测定结果的影响固定。(4)可校正性:其大小可以测定,可对结果进行校正。

系统误差的校正方法:

选择标准方法、提纯试剂和使用校正值等办法加以消除。常采用对照试验和空白试验的方法。172.偶然误差产生的原因、性质及减免产生的原因:由一些无法控制的不确定因素引起的。(1)如环境温度、湿度、电压、污染情况等的变化引起样品质量、组成、仪器性能等的微小变化;(2)操作人员实验过程中操作上的微小差别;(3)其他不确定因素等所造成。性质:时大时小,可正可负。减免方法:无法消除。通过增加平行测定次数,降低;183.过失误差(粗差):认真操作,可以完全避免。沉淀的溅失或玷污;试样溶解或转移不完全或损失;称样时试样撒落在容器外;读错刻度;记录和计算错误;加错试剂等19

系统误差与随机误差的比较204.公差公差是生产部门对分析结果误差允许的一种限量,如果误差超出允许的公差范围,该分析工作必须重做。公差范围的确定:1.对分析结果准确度的要求;2.试样组成及待测组分的含量;3.分析方法的准确度。21误差传递的方式取决于误差的性质(系统误差或随机误差),取决于分析结果与测量值之间的化学计量关系(计算方式)。一个样品经称重,溶解。分析对象是唯一有颜色的物质,样品含量采用吸收法测定,分别测定空白和样品的吸光度,测定结果的数学表达式Canalyte=(Asample–Ablank)/b每一个测定步骤有误差(随机的或可测的)3.1.5误差的传递22分析化学教程(2005-2006学年)系统误差

a.加减法

R=mA+nB-pC

ER=mEA+nEB-pECb.乘除法

R=mA×nB/pC

ER/R=EA/A+EB/B-EC/Cc.指数运算

R=mAn

ER/R=nEA/Ad.对数运算

R=mlgA

ER=0.434mEA/A设分析结果R由测量值A、B、C计算获得,测量值的绝对误差分别为EA、EB、EC,标准偏差分别为sA、sB、sC。随机误差

a.加减法

R=mA+nB-pC

sR2=m2sA2+n2sB2+p2sC2b.乘除法

R=mA×nB/pC

sR2/R2=sA2/A2+sB2/B2+sC2/C2c.指数运算

R=mAn

sR/R=nsA/Ad.对数运算

R=mlgA

sR=0.434msA/A设分析结果Y由测量值A、B、C计算获得,测量值的系统误差分别为EA、EB、EC,标准偏差分别为sA、sB、sC。极值误差最大可能误差R=mA+nB-pC

ER=m|EA|+n|EB|+p|EC|R=mAB/C

ER/R=|EA/A|+|EB/B|+|EC/C|例如:分析天平的绝对误差为±0.1mg,称量试样读取2次平衡点,最大可能的误差为0.2mg;滴定管读数误差为±0.01mL,滴定时读取2次度数,滴定体积的最大可能误差为0.02mL。p47例题3天平称量的标准偏差s=0.10mg,求称量试样时的标准偏差。解:称一个样需读两次平衡点,例题5滴定管的初读数为(0.05±0.01)mL,末读数为(22.10±0.01)mL,问滴定剂的体积可能在多大范围内波动?解:极值误差

V=0.01+0.01=0.02滴定剂体积为:(22.10-0.05)

0.02mL=22.050.02mL26分析化学教程(2005-2006学年)解:计算NaOH溶液的浓度(C1)移液管体积V1的标准偏差SV1=S1=0.02滴定管体积V2的标准偏差SC1=0.0001mol.L-1C1=0.1250±0.0001mol.L-1P48例4用0.1000mol.L-1(C2)HCl标准溶液标定20.00mL(V1)

NaOH溶液的浓度,耗去HCl25.00mL(V2),已知用移液管量取溶液使得标准偏差为s1=0.02mL,每次读取滴定管读数时的偏差为s2=0.01mL,假设HCl溶液的浓度是准确的,计算NaOH溶液的浓度。27分析化学教程(2005-2006学年)3.2有效数字及运算规则

1有效数字:分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内a数字前0不计,数字后计入:0.03400b数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103,1.00×103,1.000×103)c自然数和常数可看成具有无限多位数(如倍数、分数关系)d数据的第一位数大于等于8的,可多计一位有效数字,如9.45×104,95.2%,8.65e对数与指数的有效数字位数按尾数计,如pH=10.28,则[H+]=5.2×10-11f误差只需保留1~2位g化学平衡计算中,结果一般为两位有效数字(由于K值一般为两位有效数字);h常量分析法一般为4位有效数字(Er≤0.1%),微量分析为2位。m

分析天平(称至0.1mg):12.8228g(6), 0.2348g(4),0.0600g(3)

千分之一天平(称至0.001g):0.235g(3)

1%天平(称至0.01g):4.03g(3),0.23g(2)

台秤(称至0.1g):4.0g(2),0.2g(1)V

☆滴定管(量至0.01mL):26.32mL(4),3.97mL(3)

☆容量瓶:100.0mL(4),250.0mL(4)

☆移液管:25.00mL(4);

☆量筒(量至1mL或0.1mL):25mL(2),4.0mL(2)2有效数字运算中的修约规则尾数≤4时舍;尾数≥6时入尾数=5时,若后面数为0,舍5成双;若5后面还有不是0的任何数皆入四舍六入五成双例下列值修约为四位有效数字

0.32474 0.32475 0.32476 0.32485 0.324851

0.32470.32480.32480.32480.3249禁止分次修约运算时可多保留一位有效数字进行0.57490.570.5750.58×加减法:结果的绝对误差应不小于各项中绝对误差最大的数。(与小数点后位数最少的数一致)0.112+12.1+0.3214=12.5乘除法:结果的相对误差应与各因数中相对误差最大的数相适应(与有效数字位数最少的一致)

0.0121×25.66×1.0578=0.328432

3运算规则例0.0192H2O+CO2系统误差:可校正消除随机误差:不可测量,无法避免,可用统计方法研究1随机误差的正态分布频数分布:

测定某样品100次,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。相对频数分布直方图35s:

总体标准偏差

随机误差的正态分布

m离散特性:各数据是分散的,波动的集中趋势:有向某个值集中的趋势m:总体平均值d:

总体平均偏差d=0.797s正态分布曲线规律(消除了系统误差后):*x=μ

时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。μ反映测量值分布集中趋势。*曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。*当x趋于-∞或+∞时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。*σ越大,测量值落在μ附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。σ反映测量值分布分散程度。。横坐标分别以x和x-μ表示时,曲线分别表示为测量值和随机误差的正态分布曲线两组精密度不同的测量值的正态分布曲线37标准正态分布曲线——x~N(0,1)曲线以u~y作图

注:u是以σ为单位来表示随机误差x-μ38正态分布横坐标:偶然误差的值,纵坐标:误差出现的概率大小。1.服从正态分布的前提

测定次数无限多;系统误差已经排除。2.定义393.偶然误差分布具有以下性质(1)对称性:相近的正误差和负误差出现的概率相等,误差分布曲线对称;(2)单峰性:小误差出现的概率大,大误差的概率小。误差分布曲线只有一个峰值。误差有明显集中趋势;(3)有界性:由偶然误差造成的误差不可能很大,即大误差出现的概率很小;(4)抵偿性;误差的算术平均值的极限为零。40

从-∞~+∞,所有测量值出现的总概率P为1,即偶然误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率标准正态分布

区间概率%

正态分布概率积分表4.误差范围与出现的概率之间的关系

414.误差范围与出现的概率之间的关系

42例题2-1(1)解查表:u=1.5时,概率为:20.4332=0.866=86.6%(2)解查表:u>2.5时,概率为:0.5–0.4938=0.0062=0.62%一样品,标准值为1.75%,测得=0.10,求结果落在(1)1.750.15%概率;(2)测量值大于2%的概率。86.6%0.62%P½a½ap+a=1a

显著水平

P置信度43分析化学教程(2005-2006学年)5.置信度与置信区间置信度-置信水平(ConfidenceLevel):

在某一定范围内测定值或误差出现的概率叫置信度-置信水平

。68.3%,95.5%,99.7%即为置信度置信区间(ConfidenceInterval):真实值在指定概率下,分布的某个区间叫置信区间

。μ±σ,μ±2σ,μ±3σ等称为置信区间。置信度选得高,置信区间就宽。44平均值的标准偏差:用m个样本,每个样本作n次测定的平均值的标准偏差与单次测定结果的标准偏差的关系:对于无限次测量值,则平均值的平均偏差与单次测量的平均偏差之间,讨论:测量次数增加,平均值的标准偏差减小。平均值的精密度会随着测定次数的增加而增加;在分析化学工作中,一般平行测定3~4次即可,要求较高时可测定5~9次。(P59)45对有限次测量:1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。结论:测量次数46N→∞:随机误差符合正态分布(高斯分布) (,)n有限:t分布和s代替,x2有限次测量数据的统计处理t分布曲线曲线下一定区间的积分面积,即为该区间内随机误差出现的概率

f→∞时,t分布→正态分布某一区间包含真值(总体平均值)的概率(可能性)置信区间:一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围)(包括总体平均值的概率μ是多少,不能说μ落在某一区间的概率是多少)

置信度p:表示在某一t值时,测定值落在(μ±ts)范围内的概率。测定值落在此范围之外的概率(1-p),称为显著性水准,用α表示。

平均值的置信区间讨论:(1)由式:(2)置信区间的宽窄与置信度、测定值的精密度和测定次数有关,当测定值精密度↑(s值小),测定次数愈多(n↑)时,置信区间↓,即平均值愈接近真值,平均值愈可靠。得:该式常作为分析结果的表达式。49(3)上式的意义:在一定置信度下(如95%),真值(总体平均值)将在测定平均值附近的一个区间即在之间存在,把握程度95%。

该式常作为分析结果的表达式。(4)置信度↑,置信区间↑,其区间包括真值的可能性↑,一般将置信度定为95%或90%。50例3:

测定SiO2的质量分数,得到下列数据,求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。

28.62,28.59,28.51,28.48,28.52,28.63解:查表2-2

置信度为90%,n=6时,t=2.132置信度为95%时:结论置信度↑,置信区间↑。51例4:

测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次测定和五次测定平均值的置信区间(95%置信度)。

查表2-2,得t95%=12.7。解:n=2时52

n=5时:查表2-2,得t95%=2.78。在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,即可使测定的平均值与总体平均值μ接近。53

定量分析数据的评价---解决两类问题:(1)可疑数据的取舍

过失误差的判断

方法:4d法、Q检验法和格鲁布斯(Grubbs)检验法确定某个数据是否可用。(2)分析方法的准确性系统误差及偶然误差的判断

显著性检验:利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异。(分析结果之间存在“显著性差异”,认为有明显的系统误差;否则认为没有系统误差,纯属于随机误差引起的)方法:t检验法和F检验法确定某种方法是否可用,判断实验室测定结果准确性可疑数据的取舍过失误差的判断

4d法

偏差大于4d的测定值可以舍弃

步骤:求异常值(Qu)以外数据的平均值和平均偏差

如果|Qu-x|>4d,舍去

Q检验法

步骤:(1)数据排列X1

X2……Xn(2)求极差Xn-X1

(3)求可疑数据与相邻数据之差

Xn-Xn-1或X2-X1(4)计算:(5)根据测定次数和要求的置信度,(如90%)查表:

不同置信度下,舍弃可疑数据的Q值表

测定次数Q90

Q95

Q99

3

0.940.980.994

0.760.850.93

8

0.470.540.63

(6)将Q与QX

(如Q90

)相比,若Q>QX

舍弃该数据,(过失误差造成)若Q<QX

保留该数据,(偶然误差所致)当数据较少时舍去一个后,应补加一个数据。Q

值表(3-6)格鲁布斯(Grubbs)检验法

(4)由测定次数和要求的置信度,查表得G

表(5)比较若G计算>G

表,弃去可疑值,反之保留。由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q检验法高。基本步骤:(1)排序:X1,X2,X3,X4……(2)求X和标准偏差s(3)计算G值:G(p,n)值表例5:

测定某药物中Co的含量(10-4)得到结果如下:1.25,1.27,1.31,1.40,用Grubbs法和Q值检验法判断1.40是否保留。查表,置信度选95%,n=4,G表=1.46

G计算<G表故1.40应保留。解:①用Grubbs法:=1.31;s=0.066②用Q值检验法:可疑值xn查表,n=4,

Q0.90=0.76Q计算<Q0.90故1.40应保留。讨论:(1)

Q值法不必计算x

及s,使用比较方便;(2)Q值法在统计上有可能保留离群较远的值。(3)Grubbs法引入s,判断更准确。(4)不能追求精密度而随意丢弃数据;必须进行检验;置信区间:40.07~40.23之间(置信度为95%)。置信区间:40.04~40.30,变大。舍去40.12:例:三个测定值,40.12,40.16和40.18分析方法准确性的检验b.由要求的置信度和测定次数,查表,得:t表c.比较

t计>t表,表示有显著性差异,存在系统误差,被检验方法需要改进

t计<t表,表示无显著性差异,被检验方法可以采用。t检验法---系统误差的检测

平均值与标准值(

)的比较

a.计算t值例6:

用一种新方法来测定试样含铜量,用含量为11.7

mg/kg的标准试样,进行五次测定,所得数据为:10.9,11.8,10.9,10.3,10.0判断该方法是否可行?(是否存在系统误差)。解:计算平均值=10.8,标准偏差S=0.7查表2-2t值表,t(0.95,n=5)=2.78t计算

>t表说明该方法存在系统误差,结果偏低。c查表(自由度f=f1+f2=n1+n2-2),比较:t计>t表,表示有显著性差异两组数据的平均值比较(同一试样)

b计算t值:新方法--经典方法(标准方法)两个分析人员测定的两组数据两个实验室测定的两组数据

a求合并的标准偏差:F检验法-两组数据间偶然误差的检测b按照置信度和自由度查表(F表),比较F计算和F表a计算F值:表2-5置信度95%时F值fs大:方差大的数据的自由度;fs小:方差小的数据的自由度。(f=n-1)置信度95%时部分F值(单边)

置信度90%时部分F值(双边)P65例题练习例:用两种不同方法测定合金中铌的百分含量第一法1.26%1.25%1.22%第二法1.35%1.31%1.33%1.34%试问两种方法是否存在显著性差异(置信度90%)?解:69续前70练习例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准偏差s1=0.055;用性能稍好的新仪器测定4次,得到标准偏差s2=0.022。试问新仪器的精密度是否显著地优于旧仪器?解:71练习例:采用不同方法分析某种试样,用第一种方法测定11次,得标准偏差s1=0.21%;第二种方法测定9次得到标准偏差s2=0.60%。试判断两方法的精密度间是否存在显著差异?(P=90%)解:72例7:甲、乙二人对同一试样用不同方法进行测定,得两组测定值:甲:1.26,1.25,1.22乙:1.35,1.31,1.33,1.34问两种方法间有无显著性差异?解:n甲

=3S甲

=0.021n乙

=4S乙=0.017查表2-5,F值为9.55,说明两组的方差无显著性差异。进一步用t公式进行计算。再进行

t检验:查表2-2t值表f=n1+n2-2=3+4-2=5,置信度95%t表

=2.57(n=6),t计算>t表甲乙二人采用的不同方法间存在显著性差异例7的讨论:(1)计算表明甲乙二人采用的不同方法间存在显著性差异;

系统误差有多大?如何进一步查明哪种方法可行?(2)分别与标准方法或使用标准样品进行对照试验,根据实验结果进行判断。(3)本例中两种方法所得平均值的差为:

其中包含了系统误差和偶然误差。(4)根据t分布规律,偶

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论