第3章 分析化学中的误差与数据处理_第1页
第3章 分析化学中的误差与数据处理_第2页
第3章 分析化学中的误差与数据处理_第3页
第3章 分析化学中的误差与数据处理_第4页
第3章 分析化学中的误差与数据处理_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章分析化学中的误差及数据处理3.1分析化学中的误差3.2有效数字及其运算规则3.3分析化学中的数据处理3.4显著性检验3.5可疑值取舍3.6回归分析法3.7提高分析结果准确度的方法23.1分析化学中的误差

分析的核心是准确的“量”的概念,凡是测量就有误差,减少测量误差是分析工作的重点之一.

必然存在减小合理3

1.真值T(Truevalue)

某一物理量本身具有的、客观存在的真实值。 真值是未知的、客观存在的量。在特定情况下认为是已知的:3.1.1误差和偏差理论真值(如化合物的理论组成)计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)相对真值(高一级精度的测量值相对于低一级精度的测量值,如人们采用可靠办法、使用最精密仪器,经不同实验室、不同人员进行平行分析,用数理统计方法得到的各组分相对准确的含量)42.误差(Error):

绝对误差E=x-xTE>0E<0相对误差绝对误差单位与测量值单位相同,误差越小,准确度越高。绝对误差有大小、正负之分,反映的是误差在真实值中所占的比例大小。绝对误差相同的条件下,待测组分含量越高,相对误差越小,反之则越大。5如:对于1000kg和10kg,绝对误差相同(±1kg),但产生的相对误差却不同。绝对误差和相对误差都有正负之分。6例:用重量分析法测定纯BaCl2﹒2H2O试剂中Ba的含量,结果为56.14%,56.16%,56.17%,56.13%,计算测定结果的绝对误差和相对误差。先求4次测定的平均值=(56.14%+56.16%+56.17%+56.13%)/4=56.15%纯BaCl2﹒2H2O中Ba的理论含量为真值,查Ar(Ba)=137.33,

Mr(BaCl2﹒2H2O)=244.27,则xT=(137.33/244.27)×100%=56.22%绝对误差E=-xT=56.15%-56.22%=-0.07%相对误差Er=E/xT×100%=-0.07%/56.22%×100%=-0.12%xx73.偏差

测量结果的离散性测量值与平均值的差值,用d表示算术平均值d=x-x∑di=01)偏差(devoation)82)平均偏差(meandeviation)通常以单次测量偏差的绝对值的算术平均值即平均偏差来表示精密度。3)相对平均偏差(relativemenadeviation)

注意:不计正负号,di则有正负之分。9例:测定某试样中氯的百分含量,三次分析结果分别为25.12、25.21和25.09,计算平均偏差和相对平均偏差。如果真实百分含量为25.10,计算绝对误差和相对误差。解:平均值平均偏差相对平均偏差=(0.05/25.14)×1000‰=2‰绝对误差E=25.14-25.10=+0.04(%)相对误差=(+0.04/25.10)×1000‰=+2‰10

当测定次数较多时,常使用标准偏差或相对标准偏差表示一组平行测定值的精密度。单次测定的标准偏差:相对标准偏差亦称变异系数(RSD或sr):

标准偏差:通过平方运算,能将较大的偏差更显著地表现出来,能更好地反映测定值的精密度。实际工作中,都用RSD表示分析结果的精密度。11S对单次测量偏差平方和不仅避免单次测量偏差相加时正负抵消,更重要的是大偏差能更显著地反映出来,能更好地说明数据的分散程度,如二组数据,各次测量的偏差为:+0.3,-0.2,-0.4,+0.2,+0.1,+0.4,0.0,-0.3,+0.2,-0.3;0.0,+0.1,-0.7,+0.2,-0.1,-0.2,+0.5,-0.2,+0.3,+0.1;两组数据的平均偏差均为0.24,但明显看出第二组数据分散大。S1=0.28;S2=0.33(注意计算S时,若偏差d=0时,也应算进去,不能舍去)可见第一组数据较好。124.中位数(XM)-Medianvalue

一组测量数据按大小顺序排列,中间一个数据即为中位数XM,当测量值的个数位偶数时,中位数为中间相临两个测量值的平均值。

优点:是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响;

缺点:是不能充分利用数据,因而不如平均值准确。135.极差(R)极差(Range):衡量一组数据的分散性。一组测量数据中最大值和最小值之差,也称全距或范围误差。

R=xmax—xmin相对极差:用极差表示偏差,简单直观,便于运算,不足之处是没有利用全部测量数据。141、准确度(Accuracy)

准确度表征测量值与真实值相符合的程度。

准确度用误差表示。反映测定的正确性,是系统误差大小的量度。2、精密度(precision)

精密度表征平行测量值的相互符合程度。精密度用偏差表示。有时用重复性(repeatability)和再现性(reproducibility)表示不同情况下分析结果的精密度。

3.1.2准确度与精密度1536.0036.5037.0037.5038.00测量点平均值真值ABCD表观准确度高,精密度低准确度高,精密度高准确度低,精密度高准确度低,精密度低(不可靠)1、准确度高一定要求精密度高,即精密度是保证准确度的前提。2、精密度高,不一定准确度就高。准确度与精密度的关系16定量分析中对准确度和精密度的要求决定于分析的目的。不同组分含量要求相对误差的数值分析成分(%)~100~10~1~0.10.001~0.0001相对误差(%)0.1~0.3~11~2~5~10173.1.3.系统误差和随机误差由于各种原因导致的误差,根据性质不同可区分为:系统误差和随机误差两大类1.系统误差(systematicerror)由一些固定的原因所产生,其大小、正负有重现性,也叫可测误差。1)方法误差

实验设计或所选分析方法不恰当造成的误差,溶解损失、终点误差-用其他方法校正。2)仪器误差

刻度不准、砝码磨损-校准(绝对、相对)3)试剂误差

不纯-空白实验4)操作误差

操作不当5)主观误差

个人误差18系统误差的性质可归纳为如下三点:1)重现性2)单向性3)可以校正。随机误差由偶然因素引起的误差,所以又称偶然误差如,同一坩埚称重(同一天平,砝码),得到以下克数:

29.3465,29.3463,29.3464,29.34662.随机误差(randomerror)19对于天秤称量,原因可能有以下几种:1)天平本身有一点变动性2)天平箱内温度有微小变化3)坩埚和砝码上吸附着微量水分的变化偶然误差的性质:误差的大小、正负都是不固定的。偶然误差

不可测误差,不可校正,无法避免。在消除系统误差后,在同样条件下多次测定,可发现偶然误差服从统计规律。测定次数越多其平均值越接近真值。一般平行测定4-6次。过失:由粗心大意引起,可以避免的20系统误差与随机误差的比较项目系统误差随机误差产生原因固定因素,有时不存在不定因素,总是存在分类方法误差、仪器与试剂误差、主观误差环境的变化因素、主观的变化因素等性质重现性、单向性(或周期性)、可测性服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数21公差:生产部门对于分析结果允许误差表示法,超出此误

差范围为超差,分析工作应重做。公差范围根据实际情况对分析结果准确度的要求而定。公差范围依试样组成及待测组分含量而不同,分析组分越复杂,公差的范围也大些。公差范围与各种分析方法所能够达到的准确度与有关。3.1.4.公差待测组分的质量分数/%908040201051.00.10.010.001公差(相对误差)/%±0.3±0.4±0.6±1.0±1.2±1.6±5.0±20±50±10022

3.1.5误差的传递

1.系统误差的传递1)加减法若R=A+B-C,则ER=EA+EB-EC

即分析结果的绝对误差是各测量步骤绝对误差的代数和若R=A+mB-C则ER=EA+mEB-EC

在误差计算中含相关系数m测量值误差会传递到分析结果中,影响分析结果的准确度。误差传递规律依系统误差和随机误差有所不同,还与运算方法有关。23

2)乘除法在乘除法的误差计算公式中,不考虑系数m在乘除运算中,分析结果的相对系统误差等于各测量值相对系统误差的代数和3)指数关系4)对数关系分析结果的相对系统误差为测量值相对系统误差的指数倍24

2.随机误差的传递1).加减法

分析结果的标准偏差的平方是各测量步骤标准偏差的平方和。若带有系数,则系数也相应平方2).乘除法在乘除法的误差计算公式中,不考虑系数m;无论是相加还是相减,分析结果的相对标准偏差的平方等于各测量值相对标准偏差的平方之和+25

3).指数关系4).对数关系26

例:设天平称量的标准偏差S=0.1mg,求称量试样时的标准偏差Sm解:称取试样时,无论是用差减法,或固定称量法,都需要称量两次,读取两次平衡点,试样质量是两次称量所得质量之差,即

m=m1-m2故:27

例:用移液管移取NaOH溶液25.00mL,用0.1000mol/LHCl标准溶液滴定,用去30.00mL,已知用移液管移溶液时的标准偏差S1=0.02mL,滴定管读数每次S2=0.01mL设HCl溶液浓度准确,计算标定NaOH溶液浓度时的标准偏差解:由误差传递滴定管要读两次仅最后一位相差1,所以偏差极小28

3.极值误差

即:考虑在最不利的情况下,由各步骤带来的误差相互叠加。(也有相互抵消)例如:滴定时读滴定管两次,极值误差±0.02mL所以,在滴定时,为了使读数误差<0.1%,一般体积>20mL天平称量两次读数,极值误差±0.0002g所以,在称量时,为了使读数误差<0.1%,一般质量>0.2g则极值相对误差29

例:用间接法测定Cu含量,若测量相对误差均为0.1%,问Cu的质量分数的极值相对误差为多少?解:计算公式为:若误差0.1%0.2%0.1%0.1%有时误差可相互抵消303.2.1有效数字

有效数字—significantfigure

分析工作中实际能测量到的数字,包括全部可靠数字及一位不确定数字在内。 有效数字位数由仪器准确度决定,它直接影响测定的相对误差。在测量准确度范围内,有效数字位数越多,测量越准确。3.2有效数字及其运算规则31a

一个量值只保留一位不确定数字,必须且只能记一位b数字前0不计,数字后计入

:如0.03400和1.0080c数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103,1.00×103,1.000×103)d自然数和常数可看成具有无限多位数(如倍数、分数关系)e不能因为变换单位而改变有效数字的位数。0.0345g=34.5mg=3.45×104μgf对数(如pH,pM,lgK等)的有效数字位数取决于小数部分(尾数)数字的位数,如pH=10.28,则[H+]=5.2×10-11,有效数字是两位,而不是4位。g误差只需保留1~2位确定有效数字位遵循的原则:32m

分析天平(称至0.1mg):12.8228g(6),0.2348g(4),0.0600g(3)

千分之一天平(称至0.001g):0.235g(3)

1%天平(称至0.01g):4.03g(3),0.23g(2)

台秤(称至0.1g):4.0g(2),0.2g(1)V

☆滴定管(量至0.01mL):26.32mL(4),3.97mL(3)

☆容量瓶:100.0mL(4),250.0mL(4)

☆移液管:25.00mL(4);

☆量筒(量至1mL或0.1mL):25mL(2),4.0mL(2)331.000843.1810.100010.98%0.03821.98×10-10

540.00400.052×10536001005位4位3位2位1位位数比较模糊343.2.2有效数字的修约规则

“四舍六入五成双”原则:

修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约。尾数≤4时舍去;尾数≥6时则进位尾数=5时,若5后面数为0,则看5前面的数字,若是奇数则进位,若是偶数则将5舍掉;若5后还有不是0的任何数字,则无论5前面是奇数还是偶数,均进位。35

有效数字的修约:

0.32554(修为4位)→

0.036236(修为4位)→

10.2150(修为4位)→

150.65(修为4位)→

75.55496(修为4位)→

16.0851(修为4位)→

22.4450(修为4位)→0.32550.0362410.22150.675.5516.0922.4436禁止分次修约0.57490.570.5750.58×373.2.3运算规则加减法:当几个数据相加减时,有效数字位数,应以小数点后位数最少的数据为准,因小数点后位数最少的数据的绝对误差最大。例:0.0121+25.64+1.05782=?绝对误差±0.0001±0.01±0.00001

在加合的结果中总的绝对误差值取决于25.64。

0.01+25.64+1.06=26.7138

乘除法:当几个数据相乘除时,有效数字位数应以有效数字位数最少的数据为准,因有效数字位数最少的数据的相对误差最大。例:0.0121×25.64×1.05782=?相对误差±0.8%±0.4%±0.009%

结果的相对误差取决于0.0121,因它的相对误差最大,所以

0.0121×25.6×1.06=0.328

乘除法运算中,若遇到9以上的大数,如9.00,9.86等,通常将其作四位有效数字处理。39

在计算过程中,为提高计算结果可靠性,可暂时多保留一位数字,在得到最后结果时再舍去多余数字在计算分析结果时,高含量(>10%)组分的测定,一般要求四位有效数字;含量在1%-10%的一般要求三位有效数字,含量小于1%的组分只要求两位有效数字分析中的各类误差通常取1-2位有效数字40例H2O+CO20.019241总体(或母体):所考查对象的某特性值的全体

样本(子样):自总体中随机抽出的一组测量值样本大小(或容量):样本中所含测量值的数目若样本容量为n,平均值3.3分析化学中的数据处理42对无限次测定,平均值即为总体平均值没有系统误差时,µ

就是真实值xT单次测量的平均偏差当n<20

用统计方法处理数据时,广泛采用标准偏差来衡量数据的分散程度.43标准偏差

当测量次数为无限多次时,各测量值对总体平均值μ

的偏离,用总体标准偏差σ表示。1、总体标准偏差2、样本标准偏差

避免单次测量偏差相加时正负抵消;大偏差能更显著地反映出来。

测量值不多,μ不知时,用来衡量数据的分散程度。f44

此时,3、相对标准偏差单次测量的相对标准偏差(亦称变异系数,sr或RSD%)为:454、标准偏差与平均偏差的关系当

n>20时,δ:测定次数非常多时的平均偏差当n<20,则用表示46

3.3.1随机误差的正态分布

1频数分布例:在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:

1.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.651.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.52

1.491.561.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.6947

分组:容量大时分为10-20组,容量小时(n<50)分为5-7组,本例分为9组;极差:R=1.74%-1.49%=0.25%;组距:组距=R/9=0.25%/9=0.03%。每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等。为了使每一个数据只能进入某一组内,将组界值较测定值

多取一位。即:1.485-1.515,1.515-1.545,1.545-1.575等等。统计频数:测定值落在每组内的个数(称为频数),相对频数:计算出数据出现在各组内的频率(即相对频数)。48

分组(%)频数频率

1.485-1.51520.0221.515-1.54560.0671.545-1.57560.0671.575-1.605170.1891.605-1.635220.2441.635-1.665200.2221.665-1.695100.1111.695-1.72560.0671.725-1.75510.011∑901.0049

平均值:1.62

特点:

1.离散特性(σ)

2.集中趋势(μ)

频率分布的直方图50

2正态分布正态分布,又称高斯分布,它的数学表达式即正态分布函数式为:

式中,y表示概率密度;x表示测量值;

μ为总体平均值;

σ为总体标准偏差51

正态分布曲线(μ相同,σ2>σ1)

μxx-μ0μ是正态分布曲线最高点的横坐标值,决定曲线的位置σ是从总体平均值μ到曲线拐点间的距离,决定曲线的形状σ小,数据的精密度好,曲线瘦高;σ大,数据分散,曲线较扁平;随机误差的正态分布曲线52

正态分布曲线具有以下特点:

1.集中趋势当

x

=μ时,y值最大,说明零误差出现的概率最大。即:大多数测量值集中在算术平均值附近。

2.对称性曲线以x

=μ这一点的垂直线为对称轴,表明绝对值相等的正负误差出现的概率相等。

3.有界性当x趋向-∞或+∞时,曲线以x为渐近线,说明小误差出现的概率大,大误差出现的概率小。

4、当x=μ时,概率密度

综上所述,一旦μ和σ确定后,正态分布曲线的位置和形状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态分布用N(μ,σ2)表示。53

计算某区间变量出现的概率,也即计算某取值范围的误差出现的概率:

-∞<x

<+∞计算与μ和σ有关,计算麻烦。54

令:代入:得:由于:则:故:u:以σ为单位的随机误差55

经过上述变换,总体平均值为μ的任一正态分布均可化为μ=0,σ2=1的标准正态分布,以N(0,1)表示。标准正态分布曲线的形状与μ和σ的大小无关。标准正态分布曲线,用符号N(0,1)表示56

3随机误差的区间概率

正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。

欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对上式积分求面积而得到。例如随机误差在±σ区间(u=±1),即测定值在μ±σ区间出现的概率是:57

概率=面积=

随机误差出现的区间测定值出现的区间概率

u=±1x=μ±σ

0.3413×2=0.683u=±2x=μ±2σ

0.4773×2=0.955u=±3x=μ±3σ

0.4987×2=0.997P5758

正态分布概率积分表P57

|u|面积|u|面积|u|面积

0.00.00001.10.36432.20.48210.10.03981.20.38492.20.48610.20.07931.30.40322.30.48930.30.11791.40.41922.40.49180.40.15541.50.43322.50.49380.50.19151.60.44522.580.49510.60.22581.70.45542.60.49530.70.25801.80.46412.70.49650.80.28811.90.47132.80.49740.90.31591.960.49503.00.49871.00.34132.00.4773∞0.500059

以上概率值表明,对于测定值总体而言,随机误差在±2σ范围以外的测定值出现的概率小于0.045,即20次测定中只有1次机会。随机误差超出±3σ的测定值出现的概率更小。平均1000次测定中只有3次机会。通常测定仅有几次,不可能出现具有这样大误差的测定值。如果一旦发现,从统计学的观点就有理由认为它不是由随机误差所引起,而应当将其舍去,以保证分析结果准确可靠。60

概率积分面积表的另一用途是由概率确定误差界限例1经过无数次测定并在消除了系统误差的情况下,测得某钢样中磷的质量分数为0.099%。已知σ=0.002%,问测定值落在区间0.095%-0.103%的概率是多少?解:由

|u|=2,由表3-1查得相应的概率为0.4773,则P(0.095%≤x≤0.103%)=0.4773×2=0.95561

例2对烧结矿样进行150次全铁含量分析,已知结果符合正态分布(0.4695,0.00202)。求大于0.4735的测定值可能出现的次数。查表,P=0.4773,故在150次测定中大于0.4773的测定值出现的概率为:

0.5000-0.4773=0.0227150×0.0227≈3解:62例3:(1)解:查表:u=1.5时,概率为:20.4332=0.866=86.6%(2)解:查表:u>2.5时,概率为:0.5–0.4938=0.0062=0.62%一样品,标准值为1.75%,测得

=0.10,求结果落在(1)1.750.15%概率;(2)测量值大于2%的概率。86.6%0.62%631.平均值的标准偏差

设有一样品,m

个分析工作者对其进行分析,每人测n

次,计算出各自的平均值。试样总体样本1样本2……样本m平均值的总体标准偏差:对有限次测量:3.3.2总体平均值的估计64

纵座标为的相对值在实际分析工作中,一般测定3~4次,由图知:当n>5,偏差已较小,所以对要求准确度较高的分析,可测定5~9次,当n>10,偏差改变已很小了。平均值的标准偏差与测定次数的平方根成反比;测定次数增加时,平均值的标准偏差减少。65同理,平均值的平均偏差无限多次测定有限次测定66例:某试样中铝的质量分数4次测定值为:1.62%,1.60%,1.30%,1.22%。计算平均值的平均偏差及平均值的标准偏差解:67

在实际工作中,通过有限次的测定是无法得知μ和σ的,只能求出平均值和S。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用S代替σ从而对μ作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。

2.少量实验数据的统计处理(1)t分布曲线定义:以t为统计量的分布称为t分布,说明n不大时(n<20)随机误差的分布规律。t:置信因子68

t分布曲线f

<10时,与正态分布曲线差别较大;f

>20时,与正态分布曲线很接近;f→∞时,与正态分布曲线严格一致。69

表3-3tP,f值表(双边)

t值P90%95%99%99.5%f(n-1)

16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01)601.672.002.66(2.87)1201.661.982.622.81∞1.641.962.582.8170

表中置信度用P表示,它表示在某一

t值时,测定值落在(μ±ts)范围内的概率。显然,落在此范围之外的概率为(1-P),称为显著性水准,用α表示。71(2)平均值的置信区间

如前所述,只有当测定次数n无穷大时,才能得到最可靠的分析结果。显然这是作不到的。平均值x

总带有一定的不确定性,只能在一定置信度下,根据x

值对可能存在的区间作出估计。由定义:当用单次测量结果(x)来表示总体平均值时,其表达式为:72对n次测定,若以样本平均值来估计总体平均值可能存在的区间:对于少量测量数据,必须根据

t分布进行统计处理:则,置信区间置信区间

上式表示在一定置信度下,以平均值为中心,包括总体平均值的可靠性范围,称为平均值的置信区间。

该范围越小,测定的准确度越高。由该式可知,当P一定时,置信区间的大小与tP,f、S、n均有关,而且tP,f与S实际也都受n的影响,即n值越大,置信区间越小。73例:对某试样Cl-的质量分数4次测定结果如下:(%)47.64

47.69

47.52

47.55,计算置信度为90%、95%、99%时总体平均值µ的置信区间。解:置信度为90%,t0.10,3=2.3574

置信度为95%,t0.05,3=3.18置信度为99%,t0.01,3=5.84计算结果可以理解为:通过4次测定,有90%、95%、99%的把握,认为真实值在…….范围之内。由上例可知,置信度越高,置信区间越宽。实际工作中,置信度不能定的过高或过低。分析化学中,一般将置信度定在95%或90%。75置信度与置信区间的含义区别置信度:测定值在置信区间出现的概率,一般为90%,

95%置信区间:在一定的置信度时,一般为95%,以测定值为中心的包容总体平均值在内的可能范围76

为什么进行显著性检验?在分析工作中,对样品进行分析往往会得到下列情况:a.测定结果的平均值与标准值不完全一致b.两种分析方法或不同分析人员对同一试样进行分析时,所得两组平均值有一定差异。为了判断测定值的差异是由系统误差引起的还是由偶然误差引起的,所以要进行显著性检验什么叫显著性检验?用统计的方法检验测定值之间是否存在显著性差异,以此推断它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。定量分析中常用的有t检验法和F检验法。3.4显著性检验77

3.4.1t检验法1.平均值与标准值的比较先计算统计量t根据平均值的置信区间的定义计算t值与表3-3中的tα,f进行比较

(查表时,一般取95%的置信水平的ta,f值)若t>tα,f

,测定结果存在显著性差异,(有系统误差)若t<tα,f,测定结果不存在显著性差异,(无系统误差)78

例如:用某种新方法测定分析纯NaCl中氯的百分比含量。10次测试结果为60.64,60.63,60.67,60.66,60.70,60.71,60.75,60.70,60.61,60.70。已知试样中氯的真实值为60.66%。问这种方法是否准确可靠?解:置信度为95%时,f=n-1=9,

查表:t0.05,9=2.26

t<ta,f

故:可以认为此方法没有系统误差。也即这种新方法准确可靠。79

2.两组平均值的比较设两组分析数据为:如F检验法证明两精密度之间无显著性差异,可认为S1≈S2求合并标准偏差80

计算t值:总自由度:f=n1+n2-2,查表3-3,95%置信水平t

值若t>tα,f

,可认为存在显著性差异。(有系统误差)若t<tα,f

,无显著性差异。(无系统误差)81

3.4.2F检验法F检验法主要是比较两组数据的方差S2,以确定它们的精密度是否有显著的差异。

用于在t

检验中两个样本的S1和S2合并前,确定他们的精密度有无显著性差异。再进行t

检验。82

步骤:首先计算出两个样本的标准差S大和S小,然后计算F值。如果两组数据的精密度相差不大,F值趋近于1。相反,如果他们两者之间存在显著性差异,则F值一定很大,在一定的置信度及自由度的情况下,若:F>F表,则认为它们之间存在显著性差异。注意:表中F值属单边检验值,检验某组数据的精密度是否大于或等于另一组数据的精密度,置信度为95%,若判断两组数据之间是否有显著性差异,则表中F值属双边检验值,置信度为90%。83

f大

f小23456219.0019.1619.2519.3019.3339.559.289.129.018.9446.946.596.396.166.0955.795.415.195.054.9565.144.764.534.394.28置信度95%时部分F值(单边)

置信度90%时部分F值(双边)84

例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得S1=0.055,用一台新仪器测定4次,得S2=0.022,问:(1)两种方法的精密度之间有无显著性差异?(2)新仪器精密度是否显著优于旧仪器的精密度?解:85

查表7-4,判断:(1)两种分析方法精密度间无显著性差异,置信度为90%。

(2)新仪器的精密度不能显著地优于旧仪器的精密度,置信度为95%。F<F表86

3.5异常值的取舍平行测定的数据中,有时会出现个别与其结果相差较大的测定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。

为什么取舍可疑值?实质是区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判断。根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。

87

根据正态分布规律,偏差超过3σ的个别值的概率小于0.3%,故这一测量值可以舍去。由3σ≈4δ,则偏差超过4δ的测量值可舍去。对少量测定数据:步骤:求出除异常值外的其余数据的平均值和平均偏差。该方法简便,但误差较大为什么取绝对值?88

例:测定某药物中钴的含量得结果如下:1.25、1.27、1.31、1.40(μg/g),问1.40是否应保留?解:1.40除外,求平均值89

3.5.2Grubbs法步骤设x1是可疑值,则若xn是可疑值,则查表:P.67表3-5Tα,n值表若T>T(表),则异常值应舍去若T<T(表),则异常值应保留该方法的准确度较Q法高将结果从小到大排列为:x1x2,x3……,xn-1,xn,

其中x1或xn可能为异常值计算出该组数据的平均值和标准偏差。计算统计量T,90

例:测定某药物中钴的含量得结果如下:1.25、1.27、1.31、1.40(μg/g),问1.40是否应保留?解:应保留91

3.5.3Q

检验法

1、将测定值由小至大排列,其中可疑值为x1或xn。

2、计算舍弃商Q值或3、查表3-6,Q值表:若Q>Q(表),舍弃若Q<Q(表),保留分析化学中通常取90%置信度的Q值。92

表3-6QP,n值表

nP345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49

93

例:测定某药物中钴的含量得结果如下:1.25、1.27、1.31、1.40(μg/g),问1.40是否应保留?解:上述讲了三种异常值的取舍方法,平时做实验,如遇到偏差较大的数据,也可用这种方法检验94

3.6回归分析法在仪器分析中,常常用工作曲线求未知溶液的浓度,例:分光光度分析:A=KC作A~C曲线AC0如何估计直线上各点的精密度及数据间的相互关系,一般常用一元线性回归方程来处理95No.标样浓度

g/L吸收值15.000.045210.00.093320.00.140430.00.175540.00.2366试样0.200问题:1、每个测量值都有误差,标准曲线应怎样作才合理?2、应怎样估计线性的好坏?A=KC963.6.1线性回归

Linearregression1、每个测量值都有误差,标准曲线应怎样作才合理?——线性回归问题最小二乘法methodofleastsquares设对y作n次独立的观测,得到一系列观测值。一元线性回归方程表示为:根据最小二乘法的原理,最佳的回归线应是各观测值yi与相对应的落在回归线上的值之差的平

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论