误差和分析数据的处理_第1页
误差和分析数据的处理_第2页
误差和分析数据的处理_第3页
误差和分析数据的处理_第4页
误差和分析数据的处理_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

关于误差和分析数据的处理

因此,人们在进行定量分析时,不仅要得到被测组分的含量,而且必须对分析结果进行评价,判断分析结果的准确性(可靠程度),检查产生误差的原因,采取减小误差的有效措施,从而不断提高分析结果的准确程度。

第2页,共76页,2024年2月25日,星期天§1

2-1误差及其产生的原因

分析结果与真实值之间的差值称为误差。分析结果大于真实值,误差为正;分析结果小于真实值,误差为负。根据误差的性质与产生的原因,可将误差分为系统误差和偶然误差两类。第3页,共76页,2024年2月25日,星期天

一、系统误差

系统误差也叫可测误差,它是定量分析误差的主要来源,对测定结果的准确度有较大影响。它是由于分析过程中某些确定的、经常的因素造成的,对分析结果的影响比较固定。系统误差的特点是具有“重现性”、“单一性”和“可测性”。即在同一条件下,重复测定时,它会重复出现;使测定结果系统偏高或系统偏低,其数值大小也有一定的规律;如果能找出产生误差的原因,并设法测出其大小,那么系统误差可以通过校正的方法予以减小或消除。系统误差产生的主要原因是:

第4页,共76页,2024年2月25日,星期天

(一)方法误差

这种误差是由于分析方法本身所造成的。例如:在重量分析中,沉淀的溶解损失或吸附某些杂质而产生的误差;在滴定分析中,反应进行不完全,干扰离子的影响,滴定终点和等当点的不符合,以及其他副反应的发生等,都会系统地影响测定结果。

(二)仪器误差

主要是仪器本身不够准确或未经校准所引起的。如天平、法码和量器刻度不够准确等,在使用过程中就会使测定结果产生误差。

(三)试剂误差由于试剂不纯或蒸馏水中含有微量杂质所引起。第5页,共76页,2024年2月25日,星期天

(四)操作误差

主要是指在正常操作情况下,由于分析工作者掌握操作规程与正确控制条件稍有出入而引起的。例如,使用了缺乏代表性的试样;试样分解不完全或反应的某些条件控制不当等。与上述情况不同的是,有些误差是由于分析者的主观因素造成的,称之为“个人误差”例如,在读取滴定剂的体积时,有的人读数偏高,有的人读数偏低;在判断滴定终点颜色时,有的人对某种颜色的变化辨别不够敏锐,偏深或偏浅等所造成的误差。第6页,共76页,2024年2月25日,星期天

二、偶然误差

偶然误差也叫不可测误差,产生的原因与系统误差不同,它是由于某些偶然的因素(如测定时环境的温度、湿度和气压的微小波动,仪器性能的微小变化等)所引起的,其影响有时大,有时小,有时正,有时负。偶然误差难以察觉,也难以控制。但是消除系统误差后,在同样条件下进行多次测定,则可发现偶然误差的分布完全服从一般的统计规律:

(一)大小相等的正、负误差出现的几率相等;

(二)小误差出现的机会多,大误差出现的机会少,特别大的正、负误差出现的几率非常小、故偶然误差出现的几率与其大小有关。第7页,共76页,2024年2月25日,星期天

§

2-2测定值的准确度与精密度一、准确度与误差

误差愈小,表示分析结果的准确度愈高,反之,误差愈大,准确度就越低。所以,误差的大小是衡量准确度高低的尺度。误差又分为绝对误差和相对误差。其表示方法如下:绝对误差=测定值-真实值

(12-1)相对误差%=(绝对误差/真实值)

×100%

(12-2)第8页,共76页,2024年2月25日,星期天

相对误差表示误差在测定结果中所占的百分率。分析结果的准确度常用相对误差表示。绝对误差和相对误差都有正值和负值。正值表示分析结果偏高,负值表示分析结果偏低。二、精密度与偏差

精密度是指在相同条件下多次测定结果相互吻合的程度,表现了测定结果的重现性。精密度用“偏差”来表示。偏差越小说明分析结果的精密度越高。所以偏差的大小是衡量精密度高低的尺度。偏差也分为绝对偏差和相对偏差。第9页,共76页,2024年2月25日,星期天

(一)绝对偏差、平均偏差和相对平均偏差绝对偏差=个别测定值一测定平均值

(12-4)如果对同一种试样进行了n次测定,若其测得的结果分别为:x1,x2,x3,…,xn,则它们的算术平均值()算术平均偏差()和相对平均偏差分别可由以下各式计算:

(12-5)第10页,共76页,2024年2月25日,星期天

相对平均偏差%=(12—6)

值得注意的是:平均偏差不计正负号,而个别测定值的偏差要记正负号。使用平均偏差表示精密度比较简单,但这个表示方法有不足之处,因为在一系列的测定中,小偏差的测定总是占多数,而大偏差的测定总是占少数,按总的测定次数去求平均偏差所得的结果偏小,大偏差得不到充分的反映。所以,用平均偏差表示精密度方法在数理统计上一般是不采用的。

第11页,共76页,2024年2月25日,星期天

(二)标准偏差和相对标准偏差

近年来,在分析化学的教学中,愈来愈广泛地采用数理统计方法来处理各种测定数据。在数理统计中,我们常把所研究对象的全体称为总体(或母体);自总体中随机抽出的一部分样品称为样本(或子样);样本中所含测量值的数目称为样本大小(或容量)。例如,我们对某一批煤中硫的含量进行分析,首先是按照有关部门的规定进行取样、粉碎、缩分,最后制备成一定数量的分析试样,这就是供分析用的总体。如果我们从中称取10份煤样进行平行测定,得到10个测定值,则这一组测定结果就是该试样总体的一个随机样本,样本容量为10。第12页,共76页,2024年2月25日,星期天

若样本容量为n,平行测定次数分别为x1,x2,x3,…,xn,则其样本平均值为:

(12-7)当测定次数无限增多,既n→∞时,样本平均值即为总体平均值μ:

若没有系统误差,且测定次数无限多(或实用上n>30次)时,则总体平均值μ就是真实值T。此时,用σ代表总体标准偏差,其数学表示式为:

(12-8)第13页,共76页,2024年2月25日,星期天

可见,在定量分析的实验中,测定次数一般较少(n<20次),故其平均偏差,须由式(3-9)求得。但是,在分析化学中测定次数一般不多(n<20),而总体平均值又不知道,故只好用样本的标准偏差S来衡量该组数据的分散程度。样本标准偏差的数学表达式为:

(12-9)第14页,共76页,2024年2月25日,星期天

式中:(n-1)称为自由度,以f表示。它是指在n次测量中,只有n-1个可变的偏差。自由度也可以理解为:数据中可供对比的数目。例如,两次测定a值和b值,只有a与b之间的一种比较,三次测定可有两种比较(即其中任何两个数据之间及其平均值与第三个数据之间比较),n次测定n-1个可供对比的数目。这里引入(n-1)的目的,主要是为了校正以代替μ所引起的误差。很明显,当测定次数非常多时,测定次数n与自由度(n-1)的区别就变得很小,→μ。即

(12-9)此时,S→σ。第15页,共76页,2024年2月25日,星期天

另外,在许多情况下也使用相对标准偏差(亦称变异系数)来说明数据的精密度,他代表单次测定标准偏差(S)对测定平均值()的相对值,用百分率表示:变异系数(%)=(12-10)

(三)平均值的标准偏差

如果从同一总体中随机抽出容量相同的数个样本,由此可以得到一系列样本的平均值。实践证明,这些样本平均值也并非完全一致,它们的精密度可以用平均值的标准偏差来衡量。显然,与上述任一样本的各单次测定值相比,这些平均值之间的波动性更小,即平均值的精密度较单次测定值的更高。

第16页,共76页,2024年2月25日,星期天

因此,在实际工作中,常用样本的平均值对总体平均值μ进行估计。统计学证明,平均值的标准偏差与单次测定值的标准偏差σ之间有下述关系。

(n→∞)

(12-11)对于有限次的测定,则有:

(12-12)第17页,共76页,2024年2月25日,星期天

式中称样本平均值的标准偏差。由以上两式可以看出,平均值的标准偏差与测定次数的平方根成反比。因此增加测定次数可以减小随机误差的影响,提高测定的精密度。除了偏差之外,还可以用极差R来表示样本平行测定值的精密度。极差又称全距,是测定数据中的最大值与最小值之差,其值愈大表明测定值愈分散。由于没有充分利用所有的数据,故其精确性较差。偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。第18页,共76页,2024年2月25日,星期天

三、准确度和精密度的关系

从以上的讨论可知,系统误差是定量分析中误差的主要来源,它影响分析结果的准确度;偶然误差影响分析结果的精密度。获得良好的精密度并不能说明准确度就高(只有在消除了系统误差之后,精密度好,准确度才高)。根据以上分析,我们可以知道:准确度高一定需要精密度好,但精密度好不一定准确度高。若精密度很差,说明所测结果不可靠,虽然由于测定的次数多可能使正负偏差相互抵消,但已失去衡量准确度的前提。因此,我们在评价分析结果的时候,还必须将系统误差和偶然误差的影响结合起来考虑,以提高分析结果的准确度。第19页,共76页,2024年2月25日,星期天

§12-3随机误差的正态分布

一、频率分布

在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:

1.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.651.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.521.491.561.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.69第20页,共76页,2024年2月25日,星期天

首先视样本容量的大小将所有数据分成若干组:容量大时分为10-20组,容量小时(n<50)分为5-7组,本例分为9组。再将全部数据由小至大排列成序,找出其中最大值和最小值,算出极差R。由极差除以组数算出组距。本例中的R=1.74%-1.49%=0.25%,组距=R/9=0.25%/9=0.03%。每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等。为了使每一个数据只能进入某一组内,将组界值较测定值多取一位。即:1.485-1.515,1.515-1.545,1.545-1.575等等。统计测定值落在每组内的个数(称为频数),再计算出数据出现在各组内的频率(即相对频数)。第21页,共76页,2024年2月25日,星期天

分组(%)频数频率

1.485-1.51520.0221.515-1.54560.0671.545-1.57560.0671.575-1.605170.1891.605-1.635220.2441.635-1.665200.2221.665-1.695100.1111.695-1.72560.0671.725-1.75510.011∑901.00第22页,共76页,2024年2月25日,星期天

图12-3

频率分布的直方图第23页,共76页,2024年2月25日,星期天

由表中的数据和图3-3可以看出,测定数据的分布并非杂乱无章,而是呈现出某些规律性。在全部数据中,平均值1.62%所在的组(第五组)具有最大的频率值,处于它两侧的数据组,其频率值仅次之。统计结果表明:测定值出现在平均值附近的频率相当高,具有明显的集中趋势;而与平均值相差越大的数据出现的频率越小。二、正态分布正态分布,又称高斯分布,它的数学表达式即正态分布函数式为:

(12-13)第24页,共76页,2024年2月25日,星期天

式中y表明测定次数趋于无限时,测定值xi出现的概率密度。若以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线。曲线的最高点,它对应的横坐标值μ即为总体平均值,这就说明了在等精密度的许多测定值中,平均值是出现概率最大的值。式(12-13)中的σ为总体标准偏差,是曲线两侧的拐点之一到直线x=μ的距离,它表征了测定值的分散程度。标准偏差较小的曲线陡峭,表明测定值位于μ附近的概率较大,即测定的精密度高。与此相反,具有较大标准偏差较大的曲线平坦,表明测定值位于μ附近的概率较小,即测定的精密度低。第25页,共76页,2024年2月25日,星期天

图12-4

正态分布曲线(μ相同,σ2>σ1)

第26页,共76页,2024年2月25日,星期天

综上所述,一旦μ和σ确定后,正态分布曲线的位置和形状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态分布用N(μ,σ2)表示。正态分布曲线关于直线x=μ呈钟形对称,且具有以下特点:

1.对称性绝对值大小相等的正负误差出现的概率相等,因此它们常可能部分或完全相互低消。

2.单峰性峰形曲线最高点对应的横坐标x-μ值等于0,表明随机误差为0的测定值出现的概率密度最大。

3.有界性一般认为,误差大于的测定值并非是由随机误差所引起的。也就是说,随机误差的分布具有有限的范围,其值大小是有界的。

第27页,共76页,2024年2月25日,星期天

三、标准正态分布

由于μ和σ不同时就有不同的正态分布,曲线的形状也随之而变化。为了使用方便,将正态分布曲线的横坐标改用u来表示(以σ为单位表示随机误差),并定义(12-14)代入(3-13)中得:由于1第28页,共76页,2024年2月25日,星期天

u称为标准正态变量。此时式(12-13)就转化成只有变量u的函数表达式:(12-15)经过上述变换,总体平均值为μ的任一正态分布均可化为μ=0,σ2=1的标准正态分布,以N(0,1)表示。标准正态分布曲线如图3-5所示,曲线的形状与μ和σ的大小无关。第29页,共76页,2024年2月25日,星期天

图12-5标准正态分布曲线

第30页,共76页,2024年2月25日,星期天

四、随机误差的区间概率

正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。(12-16)欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对式(12-16)积分求面积而得到。例如随机误差在±σ区间(u=±1),即测定值在μ±σ区间出现的概率是:第31页,共76页,2024年2月25日,星期天

按此法求出不同u值时的积分面积,制成相应的概率积分表可供直接查用。表2-1中列出的面积对应于图中的阴影部分。若区间为±|u|值,则应将所查得的值乘以2。例如:随机误差出现的区间测定值出现的区间概率

u=±1x=μ±σ0.3413×2=0.6826u=±2x=μ±2σ0.4773×2=0.9546u=±3x=μ±3σ0.4987×2=0.9974

第32页,共76页,2024年2月25日,星期天

以上概率值表明,对于测定值总体而言,随机误差在±2σ范围以外的测定值出现的概率小于0.045,即20次测定中只有1次机会。随机误差超出±3σ的测定值出现的概率更小。平均1000次测定中只有3次机会。通常测定仅有几次,不可能出现具有这样大误差的测定值。如果一旦发现,从统计学的观点就有理由认为它不是由随机误差所引起,而应当将其舍去,以保证分析结果准确可靠。第33页,共76页,2024年2月25日,星期天

概率=面积=第34页,共76页,2024年2月25日,星期天

表12-1正态分布概率积分表

|u|面积|u|面积|u|面积

0.00.00001.10.36432.20.48210.10.03981.20.38492.20.48610.20.07931.30.40322.30.48930.30.11791.40.41922.40.49180.40.15541.50.43322.50.49380.50.19151.60.44522.580.49510.60.22581.70.45542.60.49530.70.25801.80.46412.70.49650.80.28811.90.47132.80.49740.90.31591.960.49503.00.49871.00.34132.00.4773∞0.5000第35页,共76页,2024年2月25日,星期天

概率积分面积表的另一用途是由概率确定误差界限。例如要保证测定值出现的概率为0.95,那么随机误差界限应为±1.96σ。例1经过无数次测定并在消除了系统误差的情况下,测得某钢样中磷的质量分数为0.099%。已知σ=0.002%,问测定值落在区间0.095%-0.103%的概率是多少?解:根据得

|u|=2,由表3-1查得相应的概率为0.4773,则P(0.095%≤x≤0.103%)=0.4773×2=0.955第36页,共76页,2024年2月25日,星期天

例2对烧结矿样进行150次全铁含量分析,已知结果符合正态分布(0.4695,0.00202)。求大于0.4735的测定值可能出现的次数。解:查表,P=0.4773,故在150次测定中大于0.4773的测定值出现的概率为:

0.5000-0.4773=0.0227150×0.0227≈3

第37页,共76页,2024年2月25日,星期天

§12-4有限测定数据的统计处理一、置信度与的置信区间

日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,测定值总是在以μ为中心的一定范围内波动,并有着向μ集中的趋势。因此,如何根据有限的测定结果来估计μ可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与μ愈接近,即测定的准确度愈高。但由于测定次数毕竟较少,由此计算出的置信区间也不可能以百分之百的把握将μ包含在内,只能以一定的概率进行判断。

第38页,共76页,2024年2月25日,星期天

(一)已知总体标准偏差σ时对于经常进行测定的某种试样,由于已经积累了大量的测定数据,可以认为σ是已知的。根据(12-14)式并考虑u的符号可得:(12-14a)由随机误差的区间概率可知,测定值出现的概率由u决定。例如,当u=±1.96时。x在μ-1.96σ至μ+1.96σ区间出现的概率为0.95。如果希望用单次测定值x来估计μ可能存在的范围,则可以认为区间x±1.96σ能以0.95的概率将真值包含在内。即有(12-14b)第39页,共76页,2024年2月25日,星期天

由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有

式(12-14b)和式(12-17)分别表示在一定的置信度时,以单次测定值x或以平均值为中心的包含真值的取值范围,即μ的置信区间。在置信区间内包含μ的概率称为置信度,它表明了人们对所作的判断有把握的程度,用P表示。u值可由表12-1中查到,它与一定的置信度相对应。

(12-17)第40页,共76页,2024年2月25日,星期天

在对真值进行区间估计时,置信度的高低要定得恰当。一般以95%或90%的把握即可。式(12-14b)和式(12-17)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。当σ一定时,置信度定得愈大,∣u∣值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或越接近真值,即测定的准确度越高。例题1:第41页,共76页,2024年2月25日,星期天

注意:μ是确定且客观存在的,它没有随机性。而区间x±uσ或是具有随机性的,即它们均与一定的置信度相联系。因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95。

(二)已知样本标准偏差S时

在实际工作中,通过有限次的测定是无法得知μ和σ的,只能求出和S。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用S代替σ从而对μ作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。

第42页,共76页,2024年2月25日,星期天

t分布法:t值的定义:

(12-18)t分布是有限测定数据及其随机误差的分布规律。t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。显然,在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。第43页,共76页,2024年2月25日,星期天

图12-6t分布曲线第44页,共76页,2024年2月25日,星期天

与正态分布曲线一样,t分布曲线下面某区间的面积也表示随机误差在此区间的概率。但t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的t值见表12-2中。

第45页,共76页,2024年2月25日,星期天

表12-2tP,f值表(双边)

t值P90%95%99%99.5%f(n-1)

16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01)601.672.002.66(2.87)1201.661.982.622.81∞1.641.962.582.81第46页,共76页,2024年2月25日,星期天

由表3-2中的数据可知,随着自由度的增加,t值逐渐减小并与u值接近。当f=20时,t与u已经比较接近。当f→∞时,t→u,S→σ。在引用t值时,一般取0.95置信度。根据样本的单次测定值x或平均值分别表示μ的置信区间时,根据t分布则可以得出以下的关系:(12-18a)或(12-19)第47页,共76页,2024年2月25日,星期天

式(12-18a)和式(12-19)的意义在于,真值虽然不为所知(σ也未知),但可以期望由有限的测定值计算出一个范围,它将以一定的置信度将真值包含在内。该范围越小,测定的准确度越高。例题2:式(12-19)是计算置信区间通常使用的关系式。由该式可知,当P一定时,置信区间的大小与tP,f、S、n均有关,而且tP,f与S实际也都受n的影响,即n值越大,置信区间越小。例3:二、可疑测定值的取舍

平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。第48页,共76页,2024年2月25日,星期天

对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判断。根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。

(一)Q检验法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。第49页,共76页,2024年2月25日,星期天

求出可疑值与其最邻近值之差xn-xn-1或x2-x1,然后用它除以极差xn-x1,计算出统计量Q:或(12-20)

Q值越大,说明离群越远,远至一定程度时则应将其舍去。故Q称为舍弃商。根据测定次数n和所要求的置信度P查QP,n值表3-3。若Q>QP,n,则以一定的置信度弃去可疑值,反之则保留,分析化学中通常取0.90的置信度。第50页,共76页,2024年2月25日,星期天

表12-3QP,n值表

nP345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49

如果测定数据较少,测定的精密度也不高,因Q与QP,n值接近而对可疑值的取舍难以判断时,最好补测1-2次再进行检验就更有把握。如果没有条件再做测定,则宜用中位数代替平均值报告结果。因是否取舍可疑值对平均值的影响较大,对中位值的影响较小。第51页,共76页,2024年2月25日,星期天

(二)格鲁布斯法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。先计算该组数据的平均值和标准偏差,再计算统计量G。若x1可疑,(12-21)

若xn可疑,(12-21a)

第52页,共76页,2024年2月25日,星期天

根据事先确定的置信度和测定次数查表3-4。若G>GP,n,说明可疑值对相对平均值的偏离较大,则以一定的置信度弃去可疑值,反之则保留。在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数己和s,故该方法的准确度较Q法高,因此得到普遍采用。

第53页,共76页,2024年2月25日,星期天

表12-4GP,n值表测定次数置信度(P)测定次数置信度(P)

n

95%99%n

95%99%

31.151.15122.292.5541.461.49132.332.6151.671.75142.372.6661.821.94152.412.7171.942.10162.442.7582.032.22172.472.7992.112.32182.502.82102.182.41192.532.85112.232.48202.562.88第54页,共76页,2024年2月25日,星期天

三、显著性检验用统计的方法检验测定值之间是否存在显著性差异,以此推断它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。定量分析中常用的有t检验法和F检验法。

(一)样本平均值与真值的比较(t检验法)

t检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异,从而对分析方法的准确度作出评价。第55页,共76页,2024年2月25日,星期天

当检验一种分析方法的准确度时,采用该方法对某标准试样进行数次测定,再将样本平均值与标准值T进行比较。则置信区间的定义可知,经过n次测定后,如果以平均值为中心的某区间已经按指定的置信度将真值T包含在内,那么它们之间就不存在显著性差异,根据t分布,这种差异是仅由随机误差引起的。t可由下式计算:

(12-22a)

若t>tP,f,说明与T之差已超出随机误差的界限,就可以按照相应的置信度判断它们之间存在显著性差异。第56页,共76页,2024年2月25日,星期天

进行显著性检验时,如置信度定得过低,则容易将随机误差引起的差异判断为显著性差异,如置信度定得过高,又可能将系统误差引起的不一致认同为正常差异,从而得出不合理的结论。在定量分析中,常采用0.95或0.90的置信度。

(二)两组数据平均值之间的比较(F检验法和t检验法)(自学)在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平,用α表示,即这些测定值位于一定置信度所对应的随机误差界限之外。如置信度P=0.95,则显著水平α=0.05,即α=1-P。第57页,共76页,2024年2月25日,星期天

例1.用标准方法平行测定钢样中磷的质量分数4次,其平均值为0.087%。设系统误差已经消除,且σ=0.002%。(1)计算平均值的标准偏差;(2)求该钢样中磷含量的置信区间。置信度为P=0.95。解:(1)(2)已知P=0.95时,u=±1.96。根据第58页,共76页,2024年2月25日,星期天

例2.标定HCl溶液的浓度时,先标定3次,结果为0.2001mol/L、0.2005mol/L和0.2009mol/L;后来又标定2次,数据为0.2004mol/L和0.2006mol/L。试分别计算3次和5次标定结果计算总体平均值μ的置信区间,P=0.95。解:标定3次时,标定5次时,第59页,共76页,2024年2月25日,星期天

例3.测定某试样中SiO2质量分数得s=0.05%。若测定的精密度保持不变,当P=0.95时,欲使置信区间的置信限,问至少应对试样平行测定多少次?解:根据式(3-19)和题设得:已知s=0.05%,故:查表3-2得知,当f=n-1=5时,t0.95,5=2.57,此时。即至少应平行测定6次,才能满足题中的要求。第60页,共76页,2024年2月25日,星期天

§

12-5有效数字及其运算规则

在科学实验中,为了得到准确的测量结果,不仅要准确地测定各种数据,而是还要正确地记录和计算。分析结果的数值不仅表示试样中被测成分含量的多少,而且还反映了测定的准确程度。所以,记录实验数据和计算结果应保留几位数字是一件很重要的事,不能随便增加或减少位数。例如用重量法测定硅酸盐中的SiO2时,若称取试样重为0.4538克,经过一系列处理后,灼烧得到SiO2沉淀重0.1374克,则其百分含量为:SiO2%=(0.1374/0.4538)×100%=30.277655354%

第61页,共76页,2024年2月25日,星期天

上述分析结果共有11位数字,从运算来讲,并无错误,但实际上用这样多位数的数字来表示上述分析结果是错误的,它没有反映客观事实,因为所用的分析方法和测量仪器不可能准确到这种程度。那么在分析实验中记录和计算时,究竟要准确到什么程度,才符合客观事实呢?这就必须了解“有效数字”的意义。一、有效数字的意义及位数

有效数字是指在分析工作中实际上能测量到的数字。记录数据和计算结果时究竟应该保留几位数字,须根据测定方法和使用仪器的准确程度来决定。在记录数据和计算结果时,所保留的有效数字中,只有最后一位是可疑的数字。第62页,共76页,2024年2月25日,星期天

例如:

坩埚重18.5734克

六位有效数字

标准溶液体积24.41毫升

四位有效数字由于万分之一的分析天平能称准至±0.0001克,滴定管的读数能读准至±0.01毫升,故上述坩埚重应是18.5734±0.0001克,标准溶液的体积应是24.41±0.01毫升,因此这些数值的最后一位都是可疑的,这一位数字称为“不定数字”。在分析工作中应当使测定的数值,只有最后一位是可疑的。

有效数字的位数,直接与测定的相对误差有关。例如称得某物重为0.5180克,它表示该物实际重量是0.5180±0.0001克,其相对误差为:

(±0.0001/0.5180)×100%=±0.02%第63页,共76页,2024年2月25日,星期天

如果少取一位有效数字,则表示该物实际重量是0.518±0.001克,其相对误差为:

(±0.001/0.518)×100%=±0.2%表明测量的准确度后者比前者低10倍。所以在测量准确度的范围内,有效数字位数越多,测量也越准确。但超过测量准确度的范围,过多的位数是毫无意义的。

必须指出,如果数据中有“0”时,应分析具体情况,然后才能肯定哪些数据中的“0”是有效数字,哪些数据中的“0”不是有效数字。第64页,共76页,2024年2月25日,星期天

例如:1.0005五位有效数字

0.5000;31.05%;6.023×102

四位有效数字

0.0540;1.86×10-5三位有效数字

0.0054;0.40%两位有效数字

0.5;

0.002%一位有效数字在1.0005克中的三个“0”,0.5000克中的后三个“0”,都是有效数字;在0.0054克中的“0”只起定位作用,不是有效数;在0.0540克中,前面的“0”起定位作用,最后一位“0”是有效数字。同样,这些数值的最后一位数字,都是不定数字。第65页,共76页,2024年2月25日,星期天

因此,在记录测量数据和计算结果时,应根据所使用的仪器的准确度,必须使所保留的有效数字中,只有最后一位数是“不定数字”。例如,用感量为百分之一克的台秤称物体的重量,由于仪器本身能准确称到±0.0l克,所以物体的重量如果是10.4克,就应写成10.40克,不能写成10.4克。分析化学中还经常遇到pH、pC、lgK等对数值,其有效数字的位数仅取决于小数部分数字的位数,因整数部分只说明该数的方次。例如,pH=12.68,即[H+]=2.1×l0-13mol/L,其有效数字为两位,而不是四位。第66页,共76页,2024年2月25日,星期天

对于非测量所得的数字,如倍数、分数、π、e等等,它们没有不确定性,其有效数字可视为无限多位,根据具体情况来确定。另外,如果有效数字位数最少的因数的首位数是“8”或“9”,则有效数字可认为比这个因数多取一位。二、数字修约规则

“四舍六入五留双”。具体的做法是,当尾数≤4时将其舍去;尾数≥6时就进一位;如果尾数为5而后面的数为0时则看前方:前方为奇数就进位,前方为偶数则舍去;当“5”后面还有不是0的任何数时,都须向前进一位,无论前方是奇还是偶数,“0”则以偶数论。第67页,共76页,2024年2月25日,星期天

0.53664→0.53660.58346→0.583510.2750→10.2816.4050→16.4027.1850→27.1818.06501→18.07

必须注意:进行数字修约时只能一次修约到指定的位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论