误差和分析数据的处理

上传人：7*** IP属地：湖北上传时间：2022-02-22 格式：PPT 页数：76 大小：867.50KB 积分：25 举报 版权申诉

已阅读5页，还剩71页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、定量分析定量分析(Quantitative Analysis)的任务是准确测的任务是准确测定试样组分的含量，因此必须使分析结果具有一定的定试样组分的含量，因此必须使分析结果具有一定的准确度。不准确的分析结果可以导致生产上的损失、准确度。不准确的分析结果可以导致生产上的损失、资源的浪费、科学上的错误结论。资源的浪费、科学上的错误结论。在定量分析中，由于受分析方法、测量仪器、所在定量分析中，由于受分析方法、测量仪器、所用试剂和分析工作者主观条件等方面的限制，使测得用试剂和分析工作者主观条件等方面的限制，使测得的结果不可能和真实含量完全一致；即使是技术很熟的结果不可能和真实含量完全一致；即使是技

2、术很熟练的分析工作者，用最完善的分析方法和最精密的仪练的分析工作者，用最完善的分析方法和最精密的仪器，对同一样品进行多次测定，其结果也不会完全一器，对同一样品进行多次测定，其结果也不会完全一样。这说明客观上存在着难于避免的误差。样。这说明客观上存在着难于避免的误差。因此，人们在进行定量分析时，不仅要得到被因此，人们在进行定量分析时，不仅要得到被测组分的含量，而且必须对分析结果进行评价，判测组分的含量，而且必须对分析结果进行评价，判断分析结果的准确性断分析结果的准确性(可靠程度可靠程度)，检查产生误差的，检查产生误差的原因，采取减小误差的有效措施，从而不断提高分原因，采取减小误差的有效措施，从

3、而不断提高分析结果的准确程度。析结果的准确程度。分析结果与真实值之间的差值称为误差。分析结果与真实值之间的差值称为误差。分分析结果大于真实值，误差为正；分析结果小于真析结果大于真实值，误差为正；分析结果小于真实值，误差为负。实值，误差为负。根据误差的性质与产生的原因，可将误差分根据误差的性质与产生的原因，可将误差分为为系统误差系统误差和和偶然误差偶然误差两类。两类。系统误差也叫可测误差，它是定量分析误差的系统误差也叫可测误差，它是定量分析误差的主要来源，对测定结果的准确度有较大影响。它是主要来源，对测定结果的准确度有较大影响。它是由于分析过程中某些确定的、经常的因素造成的，由于分析过程中

4、某些确定的、经常的因素造成的，对分析结果的影响比较固定。系统误差的特点是具对分析结果的影响比较固定。系统误差的特点是具有有“重现性重现性”、“单一性单一性”和和“可测性可测性”。即在同即在同一条件下，重复测定时，它会重复出现；使测定结一条件下，重复测定时，它会重复出现；使测定结果系统偏高或系统偏低，其数值大小也有一定的规果系统偏高或系统偏低，其数值大小也有一定的规律；如果能找出产生误差的原因，并设法测出其大律；如果能找出产生误差的原因，并设法测出其大小，那么系统误差可以通过校正的方法予以减小或小，那么系统误差可以通过校正的方法予以减小或消除。系统误差产生的主要原因是消除。系统误差产生的主要原因

5、是这种误差是由于分析方法本身所造成的。例如：这种误差是由于分析方法本身所造成的。例如：在重量分析中，沉淀的溶解损失或吸附某些杂质而产在重量分析中，沉淀的溶解损失或吸附某些杂质而产生的误差；在滴定分析中，反应进行不完全，干扰离生的误差；在滴定分析中，反应进行不完全，干扰离子的影响，滴定终点和等当点的不符合，以及其他副子的影响，滴定终点和等当点的不符合，以及其他副反应的发生等，都会系统地影响测定结果。反应的发生等，都会系统地影响测定结果。主要是仪器本身不够准确或未经校准所引起的。主要是仪器本身不够准确或未经校准所引起的。如天平、法码和量器刻度不够准确等，在使用过程中如天平、法码和量器刻度不够准

6、确等，在使用过程中就会使测定结果产生误差。就会使测定结果产生误差。由于试剂不纯或蒸馏水中含有微量杂质所引起。由于试剂不纯或蒸馏水中含有微量杂质所引起。主要是指在正常操作情况下，由于分析工作者掌主要是指在正常操作情况下，由于分析工作者掌握操作规程与正确控制条件稍有出入而引起的。例如，握操作规程与正确控制条件稍有出入而引起的。例如，使用了缺乏代表性的试样；试样分解不完全或反应的使用了缺乏代表性的试样；试样分解不完全或反应的某些条件控制不当等。某些条件控制不当等。与上述情况不同的是，有些误差是由于分析者的与上述情况不同的是，有些误差是由于分析者的主观因素造成的，称之为主观因素造成的，称之为“个

7、人误差个人误差” 例如，在读例如，在读取滴定剂的体积时，有的人读数偏高，有的人读数偏取滴定剂的体积时，有的人读数偏高，有的人读数偏低；在判断滴定终点颜色时，有的人对某种颜色的变低；在判断滴定终点颜色时，有的人对某种颜色的变化辨别不够敏锐，偏深或偏浅等所造成的误差。化辨别不够敏锐，偏深或偏浅等所造成的误差。偶然误差也叫不可测误差，产生的原因与系统偶然误差也叫不可测误差，产生的原因与系统误差不同，它是由于某些偶然的因素误差不同，它是由于某些偶然的因素(如测定时环如测定时环境的温度、湿度和气压的微小波动，仪器性能的微境的温度、湿度和气压的微小波动，仪器性能的微小变化等小变化等)所引起的，其影响有时

8、大，有时小，有所引起的，其影响有时大，有时小，有时正，有时负。偶然误差难以察觉，也难以控制。时正，有时负。偶然误差难以察觉，也难以控制。但是消除系统误差后，在同样条件下进行多次测定，但是消除系统误差后，在同样条件下进行多次测定，则可发现偶然误差的分布完全服从一般的统计规律：则可发现偶然误差的分布完全服从一般的统计规律： (一一)大小相等的正、负误差出现的几率相等；大小相等的正、负误差出现的几率相等； (二二)小误差出现的机会多，大误差出现的机会小误差出现的机会多，大误差出现的机会少，特别大的正、负误差出现的几率非常小、故偶少，特别大的正、负误差出现的几率非常小、故偶然误差出现的几率与其大小有关

9、。然误差出现的几率与其大小有关。 3-2 测定值的准确度与精密度测定值的准确度与精密度一、准确度与误差一、准确度与误差误差愈小，表示分析结果的准确度愈高，反之，误差愈小，表示分析结果的准确度愈高，反之，误差愈大，准确度就越低。所以，误差的大小是衡误差愈大，准确度就越低。所以，误差的大小是衡量准确度高低的尺度。误差又分为绝对误差和相对量准确度高低的尺度。误差又分为绝对误差和相对误差。其表示方法如下：误差。其表示方法如下：绝对误差测定值绝对误差测定值-真实值真实值（3-1）相对误差相对误差% =(绝对误差绝对误差/真实值真实值) 100% （3-2） TxEa%100TEEar 相对误差表示

10、误差在测定结果中所占的百分相对误差表示误差在测定结果中所占的百分率。分析结果的准确度常用相对误差表示。绝对率。分析结果的准确度常用相对误差表示。绝对误差和相对误差都有正值和负值。正值表示分析误差和相对误差都有正值和负值。正值表示分析结果偏高，负值表示分析结果偏低。结果偏高，负值表示分析结果偏低。二、精密度与偏差二、精密度与偏差精密度是指在相同条件下多次测定结果相互精密度是指在相同条件下多次测定结果相互吻合的程度，表现了测定结果的重现性。精密度吻合的程度，表现了测定结果的重现性。精密度用用“偏差偏差”来表示。偏差越小说明分析结果的精来表示。偏差越小说明分析结果的精密度越高。所以偏差的大小是衡量

11、精密度高低的密度越高。所以偏差的大小是衡量精密度高低的尺度。偏差也分为绝对偏差和相对偏差。尺度。偏差也分为绝对偏差和相对偏差。（一）绝对偏差、平均偏差和相对平均偏差（一）绝对偏差、平均偏差和相对平均偏差绝对偏差个别测定值一测定平均值绝对偏差个别测定值一测定平均值（3-4）如果对同一种试样进行了如果对同一种试样进行了n次测定，若其测得次测定，若其测得的结果分别为：的结果分别为：x1，x2，x3，xn，则它们的算，则它们的算术平均值（术平均值（）算术平均偏差）算术平均偏差( )和相对平均偏差分和相对平均偏差分别可由以下各式计算：别可由以下各式计算：（3-5)2 , 1(ixxdiixd

12、nxnx.xxxxin321dnddddn|.|321ndi 相对平均偏差相对平均偏差% = （36）值得注意的是：平均偏差不计正负号，而个别值得注意的是：平均偏差不计正负号，而个别测定值的偏差要记正负号。测定值的偏差要记正负号。使用平均偏差表示精密度比较简单，但这个表使用平均偏差表示精密度比较简单，但这个表示方法有不足之处，因为在一系列的测定中，小偏示方法有不足之处，因为在一系列的测定中，小偏差的测定总是占多数，而大偏差的测定总是占少数，差的测定总是占多数，而大偏差的测定总是占少数，按总的测定次数去求平均偏差所得的结果偏小，大按总的测定次数去求平均偏差所得的结果偏小，大偏差得不到充分的反

13、映。所以，用平均偏差表示精偏差得不到充分的反映。所以，用平均偏差表示精密度方法在数理统计上一般是不采用的。密度方法在数理统计上一般是不采用的。%100 xddr 近年来，在分析化学的教学中，愈来愈广泛地采近年来，在分析化学的教学中，愈来愈广泛地采用数理统计方法来处理各种测定数据。在数理统计中，用数理统计方法来处理各种测定数据。在数理统计中，我们常把所研究对象的全体称为我们常把所研究对象的全体称为总体总体（或母体）；自（或母体）；自总体中随机抽出的一部分样品称为总体中随机抽出的一部分样品称为样本样本（或子样）；（或子样）；样本中所含测量值的数目称为样本中所含测量值的数目称为样本大小样本大小（或容

14、量）。（或容量）。例如，我们对某一批煤中硫的含量进行分析，首先是例如，我们对某一批煤中硫的含量进行分析，首先是按照有关部门的规定进行取样、粉碎、缩分，最后制按照有关部门的规定进行取样、粉碎、缩分，最后制备成一定数量的分析试样，这就是供分析用的总体。备成一定数量的分析试样，这就是供分析用的总体。如果我们从中称取如果我们从中称取10份煤样进行平行测定，得到份煤样进行平行测定，得到10个个测定值，则这一组测定结果就是该试样总体的一个随测定值，则这一组测定结果就是该试样总体的一个随机样本，样本容量为机样本，样本容量为10。若样本容量为若样本容量为n，平行测定次数分别为，平行测定次数分别为x1，x2，

15、x3，xn，则其样本平均值为：，则其样本平均值为：（3-7）当测定次数无限增多，既当测定次数无限增多，既n时，样本平均值时，样本平均值即为总体平均值即为总体平均值：若没有系统误差，且测定次数无限多（或实用若没有系统误差，且测定次数无限多（或实用上上n30次）时，则总体平均值次）时，则总体平均值就是真实值就是真实值T。此。此时，用时，用代表总体标准偏差，其数学表示式为：代表总体标准偏差，其数学表示式为：（3-8） ixnx1xnlimnxi2)( 可见，在定量分析的实验中，测定次数一般较可见，在定量分析的实验中，测定次数一般较少（少（n20次），故其平均偏差次），故其平均偏差，须由式

16、（，须由式（3-9）求）求得。得。但是，在分析化学中测定次数一般不多但是，在分析化学中测定次数一般不多(n20)，而总体平均值又不知道，故只好用样本的标准偏，而总体平均值又不知道，故只好用样本的标准偏差差S来衡量该组数据的分散程度。样本标准偏差的数来衡量该组数据的分散程度。样本标准偏差的数学表达式为：学表达式为：（3-9）1)(2nxxSid 式中：（式中：（n-1）称为自由度，以）称为自由度，以 f 表示。它是指在表示。它是指在n次测量中，只有次测量中，只有n-1个可变的偏差。自由度也可以理个可变的偏差。自由度也可以理解为：数据中可供对比的数目。例如，两次测定解为：数据中可供对比的数目。

17、例如，两次测定a值和值和b值，只有值，只有a与与b之间的一种比较，三次测定可有两种之间的一种比较，三次测定可有两种比较（即其中任何两个数据之间及其平均值与第三个比较（即其中任何两个数据之间及其平均值与第三个数据之间比较），数据之间比较），n次测定次测定n-1个可供对比的数目。这个可供对比的数目。这里引入（里引入（n-1）的目的，主要是为了校正以）的目的，主要是为了校正以代替代替所引所引起的误差。很明显，当测定次数非常多时，测定次数起的误差。很明显，当测定次数非常多时，测定次数n与自由度（与自由度（n-1）的区别就变得很小，）的区别就变得很小，。即。即（5-9）此时，此时，S。 xxnux

18、nxxnii22)(1)(lim 另外，在许多情况下也使用相对标准偏差（亦称另外，在许多情况下也使用相对标准偏差（亦称变异系数）来说明数据的精密度，他代表单次测定标变异系数）来说明数据的精密度，他代表单次测定标准偏差（准偏差（S）对测定平均值（）对测定平均值（）的相对值，用百分率）的相对值，用百分率表示：表示：变异系数（变异系数（%）= (3-10)如果从同一总体中随机抽出容量相同的数个样本，如果从同一总体中随机抽出容量相同的数个样本，由此可以得到一系列样本的平均值。实践证明，这些由此可以得到一系列样本的平均值。实践证明，这些样本平均值也并非完全一致，它们的精密度可以用平样本平均值也并非完

19、全一致，它们的精密度可以用平均值的标准偏差来衡量。显然，与上述任一样本的各均值的标准偏差来衡量。显然，与上述任一样本的各单次测定值相比，这些平均值之间的波动性更小，即单次测定值相比，这些平均值之间的波动性更小，即平均值的精密度较单次测定值的更高。平均值的精密度较单次测定值的更高。x%100 xssr 因此因此，在实际工作中在实际工作中常用样本的平均值常用样本的平均值对总体对总体平均值平均值进行估计。统计学证明，平均值的标准偏进行估计。统计学证明，平均值的标准偏差差与单次测定值的标准偏差与单次测定值的标准偏差之间有下述关系。之间有下述关系。（n） (3-11)对于有限次的测定对于有限次的测定

20、, ,则有：则有：（3-12）nssxnxxx 式中式中称样本平均值的标准偏差。由以上两式称样本平均值的标准偏差。由以上两式可以看出，平均值的标准偏差与测定次数的平方根可以看出，平均值的标准偏差与测定次数的平方根成反比。因此增加测定次数可以减小随机误差的影成反比。因此增加测定次数可以减小随机误差的影响，提高测定的精密度。响，提高测定的精密度。除了偏差之外，还可以用极差除了偏差之外，还可以用极差R来表示样本平来表示样本平行测定值的精密度。行测定值的精密度。极差极差又称全距，是测定数据中又称全距，是测定数据中的最大值与最小值之差，其值愈大表明测定值愈分的最大值与最小值之差，其值愈大表明测定值

21、愈分散。由于没有充分利用所有的数据，故其精确性较散。由于没有充分利用所有的数据，故其精确性较差。偏差和极差的数值都在一定程度上反映了测定差。偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。中随机误差影响的大小。xs 从以上的讨论可知，系统误差是定量分析中误从以上的讨论可知，系统误差是定量分析中误差的主要来源，它影响分析结果的准确度；偶然误差的主要来源，它影响分析结果的准确度；偶然误差影响分析结果的精密度。获得良好的精密度并不差影响分析结果的精密度。获得良好的精密度并不能说明准确度就高能说明准确度就高(只有在消除了系统误差之后，只有在消除了系统误差之后，精密度好，准确度才高精密度好

22、，准确度才高)。根据以上分析，我们可以知道：根据以上分析，我们可以知道：准确度高一定准确度高一定需要精密度好，但精密度好不一定准确度高需要精密度好，但精密度好不一定准确度高。若精。若精密度很差，说明所测结果不可靠，虽然由于测定的密度很差，说明所测结果不可靠，虽然由于测定的次数多可能使正负偏差相互抵消，但已失去衡量准次数多可能使正负偏差相互抵消，但已失去衡量准确度的前提。因此，我们在评价分析结果的时候，确度的前提。因此，我们在评价分析结果的时候，还必须将系统误差和偶然误差的影响结合起来考虑，还必须将系统误差和偶然误差的影响结合起来考虑，以提高分析结果的准确度。以提高分析结果的准确度。 3-3

23、随机误差的正态分布随机误差的正态分布在相同条件下对某样品中镍的质量分数（在相同条件下对某样品中镍的质量分数（%）进行重复测定，得到进行重复测定，得到90个测定值如下：个测定值如下： 1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.5

24、6 1.58 1.60 1.58 1.59 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69 首先视样本容量的大小将所有数据分成若干组：首先视样本容量的大小将所有数据分成若干组：容量大时分为容量大时分为10-2

25、0组，容量小时（组，容量小时（n1）综上所述，一旦综上所述，一旦和和确定后，正态分布曲线的位确定后，正态分布曲线的位置和形状也就确定，因此置和形状也就确定，因此和和是正态分布的两个基本是正态分布的两个基本参数，这种正态分参数，这种正态分布用布用N（，2）表示。）表示。正态分布曲线关于直线正态分布曲线关于直线x=呈钟形对称，且具有以呈钟形对称，且具有以下特点：下特点： 1.对称性对称性绝对值大小相等的正负误差出现的概率绝对值大小相等的正负误差出现的概率相等，因此它们常可能部分或完全相互低消。相等，因此它们常可能部分或完全相互低消。 2.单峰性单峰性峰形曲线最高点对应的横坐标峰形曲线最高点

26、对应的横坐标x-值等值等于于0，表明随机误差为，表明随机误差为0的测定值出现的概率密度最大。的测定值出现的概率密度最大。 3.有界性有界性一般认为，误差大于一般认为，误差大于的测定值并的测定值并非是由随机误差所引起的。也就是说，随机误差的分非是由随机误差所引起的。也就是说，随机误差的分布具有有限的范围，其值大小是有界的。布具有有限的范围，其值大小是有界的。3 由于由于和和不同时就有不同的正态分布，曲线的不同时就有不同的正态分布，曲线的形状也随之而变化。为了使用方便，将正态分布曲形状也随之而变化。为了使用方便，将正态分布曲线的横坐标改用线的横坐标改用u来表示（以来表示（以为单位表示随机误为单

27、位表示随机误差），并定义差），并定义（3-14）代入（代入（3-13）中得：）中得：由于由于xu2221)(uexfydudx 故故 u称为称为标准正态变量标准正态变量。此时式（。此时式（3-13）就转化）就转化成只有变量成只有变量u的函数表达式：的函数表达式：（3-15）经过上述变换，总体平均值为经过上述变换，总体平均值为的任一正态分的任一正态分布均可化为布均可化为=0，2=1的标准正态分布，以的标准正态分布，以N（0，1）表示。标准正态分布曲线如图表示。标准正态分布曲线如图3-5所示，曲线的形所示，曲线的形状与状与和和的大小无关。的大小无关。duuduedxxfu)(21)(2222

28、21)(ueuy 图图3-5 标准正态分布曲线标准正态分布曲线正态分布曲线与横坐标之间所夹的总面积，就正态分布曲线与横坐标之间所夹的总面积，就等于概率密度函数从等于概率密度函数从-至至+的积分值。它表示来自的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现同一总体的全部测定值或随机误差在上述区间出现概率的总和为概率的总和为100%，即为，即为1。（3-16）欲求测定值或随机误差在某区间出现的概率欲求测定值或随机误差在某区间出现的概率P，可取不同的可取不同的u值对式（值对式（3-16）积分求面积而得到。例）积分求面积而得到。例如随机误差在如随机误差在区间（区间（u=1），即测

29、定值在），即测定值在区间出现的概率是：区间出现的概率是： 121)(22dueduuu 按此法求出不同按此法求出不同u值时的积分面积，制成相应值时的积分面积，制成相应的概率积分表可供直接查用。的概率积分表可供直接查用。表表3-1中列出的面积对应于图中的阴影部分。中列出的面积对应于图中的阴影部分。若区间为若区间为|u|值值,则应将所查得的值乘以则应将所查得的值乘以2。例如：。例如：随机误差出现的区间随机误差出现的区间测定值出现的区间测定值出现的区间概率概率 u=1 x= 0.34132=0.6826 u=2 x=2 0.47732=0.9546 u=3 x=3 0.49872=0.9974

30、 683. 021) 11(1122dueuPu 以上概率值表明，对于测定值总体而言，随以上概率值表明，对于测定值总体而言，随机误差在机误差在2范围以外的测定值出现的概率小于范围以外的测定值出现的概率小于0.045，即，即20次测定中只有次测定中只有1次机会。随机误差超次机会。随机误差超出出3的测定值出现的概率更小。平均的测定值出现的概率更小。平均1000次测次测定中只有定中只有3次机会。通常测定仅有几次，不可能次机会。通常测定仅有几次，不可能出现具有这样大误差的测定值。如果一旦发现，出现具有这样大误差的测定值。如果一旦发现，从统计学的观点就有理由认为它不是由随机误差从统计学的观点就有理由认为

31、它不是由随机误差所引起，而应当将其舍去，以保证分析结果准确所引起，而应当将其舍去，以保证分析结果准确可靠。可靠。概率概率=面积面积=dueuu02221xu 表表3-1 正态分布概率积分表正态分布概率积分表 |u| 面积面积 |u| 面积面积 |u| 面积面积 0.0 0.0000 1.1 0.3643 2.2 0.4821 0.1 0.0398 1.2 0.3849 2.2 0.4861 0.2 0.0793 1.3 0.4032 2.3 0.4893 0.3 0.1179 1.4 0.4192 2.4 0.4918 0.4 0.1554 1.5 0.4332 2.5 0.4938 0.5

32、 0.1915 1.6 0.4452 2.58 0.4951 0.6 0.2258 1.7 0.4554 2.6 0.4953 0.7 0.2580 1.8 0.4641 2.7 0.4965 0.8 0.2881 1.9 0.4713 2.8 0.4974 0.9 0.3159 1.96 0.4950 3.0 0.4987 1.0 0.3413 2.0 0.4773 0.5000 概率积分面积表的另一用途是由概率确定误差概率积分面积表的另一用途是由概率确定误差界限。例如要保证测定值出现的概率为界限。例如要保证测定值出现的概率为0.95，那么，那么随机误差界限应为随机误差界限应为1.96。例例

33、1 经过无数次测定并在消除了系统误差的情况下，经过无数次测定并在消除了系统误差的情况下，测得某钢样中磷的质量分数为测得某钢样中磷的质量分数为0.099%。已知。已知=0.002%，问测定值落在区间，问测定值落在区间0.095%-0.103%的概的概率是多少？率是多少？解：根据得解：根据得 |u|=2，由表，由表3-1查得相应的概率为查得相应的概率为0.4773，则，则P（0.095%x0.103%）=0.47732=0.955xu2002. 0099. 0103. 01u2002. 0099. 0095. 02u 例例2 对烧结矿样进行对烧结矿样进行150次全铁含量分析，已知次全铁含量分析，已

34、知结果符合正态分布（结果符合正态分布（0.4695,0.00202）。求大于）。求大于0.4735的测定值可能出现的次数。的测定值可能出现的次数。解：解：查表，查表，P=0.4773，故在，故在150次测定中大于次测定中大于0.4773的的测定值出现的概率为：测定值出现的概率为： 0.5000-0.4773=0.0227 1500.02273 20020. 04695. 04735. 0 xu 3-4 有限测定数据的统计处理有限测定数据的统计处理日常分析中测定次数是很有限的，总体平均值日常分析中测定次数是很有限的，总体平均值自然不为人所知。但是随机误差的分布规律表明，自然不为人所知。但是随机

35、误差的分布规律表明，测定值总是在以测定值总是在以为中心的一定范围内波动，并有着为中心的一定范围内波动，并有着向向集中的趋势。因此，如何根据有限的测定结果来集中的趋势。因此，如何根据有限的测定结果来估计估计可能存在的范围（称之为置信区间）是有实际可能存在的范围（称之为置信区间）是有实际意义的。该范围愈小，说明测定值与意义的。该范围愈小，说明测定值与愈接近，即测愈接近，即测定的准确度愈高。但由于测定次数毕竟较少，由此定的准确度愈高。但由于测定次数毕竟较少，由此计算出的置信区间也不可能以百分之百的把握将计算出的置信区间也不可能以百分之百的把握将包包含在内，只能以一定的概率进行判断。含在内，只能以一定

36、的概率进行判断。对于经常进行测定的某种试样，由于已经积累对于经常进行测定的某种试样，由于已经积累了大量的测定数据，可以认为了大量的测定数据，可以认为是已知的。根据是已知的。根据（3-14）式并考虑）式并考虑u的符号可得：的符号可得：（3-14a）由随机误差的区间概率可知，测定值出现的概由随机误差的区间概率可知，测定值出现的概率由率由u决定。例如，当决定。例如，当u=1.96时。时。x在在-1.96至至+1.96区间出现的概率为区间出现的概率为0.95。如果希望用单次测。如果希望用单次测定值定值x来估计来估计可能存在的范围，则可以认为区间可能存在的范围，则可以认为区间x1.96能以能以0.

37、95的概率将真值包含在内。即有的概率将真值包含在内。即有（3-14b） uxux 由于平均值较单次测定值的精密度更高，因此由于平均值较单次测定值的精密度更高，因此常用样本平均值来估计真值所在的范围。此时有常用样本平均值来估计真值所在的范围。此时有式式（3-14b）和式（）和式（3-17）分别表示在一定分别表示在一定的置信度时，以单次测定值的置信度时，以单次测定值x或以平均值为中心的或以平均值为中心的包含真值的取值范围，即包含真值的取值范围，即的置信区间的置信区间。在置信区。在置信区间内包含间内包含的概率称为的概率称为置信度置信度，它表明了人们对所，它表明了人们对所作的判断有把握的程度，用作

38、的判断有把握的程度，用P表示。表示。u值可由表值可由表3-1中查到，它与一定的置信度相对应中查到，它与一定的置信度相对应。 (3-17)nuxuxx 在对真值进行区间估计时，置信度的高低要定在对真值进行区间估计时，置信度的高低要定得恰当。一般以得恰当。一般以95%或或90%的把握即可。的把握即可。式（式（3-14b）和式（）和式（3-17）还可以看出置信区间）还可以看出置信区间的大小取决于测定的精密度和对置信度的选择，对的大小取决于测定的精密度和对置信度的选择，对于平均值来说还与测定的次数有关。当于平均值来说还与测定的次数有关。当一定时，一定时，置信度定得愈大，置信度定得愈大， u 值愈大，

39、过大的置信区间值愈大，过大的置信区间将使其失去实用意义。若将置信度固定，当测定的将使其失去实用意义。若将置信度固定，当测定的精密度越高和测定次数越多时，置信区间越小，表精密度越高和测定次数越多时，置信区间越小，表明明x或或越接近真值，即测定的准确度越高。越接近真值，即测定的准确度越高。例题例题1： x 注意：注意：是确定且客观存在的，它没有随机性。是确定且客观存在的，它没有随机性。而区间而区间xu或或是具有随机性的，即它们均与是具有随机性的，即它们均与一定的置信度相联系。因此我们只能说置信区间包含一定的置信度相联系。因此我们只能说置信区间包含真值的概率是真值的概率是0.95，而不能认为真值

40、落在上述区间的，而不能认为真值落在上述区间的概率是概率是0.95。（二）已知样本标准偏差（二）已知样本标准偏差S时时在实际工作中，通过有限次的测定是无法得知在实际工作中，通过有限次的测定是无法得知和和的，只能求出的，只能求出和和S。而且当测定次数较少时，测。而且当测定次数较少时，测定值或随机误差也不呈正态分布，这就给少量测定数定值或随机误差也不呈正态分布，这就给少量测定数据的统计处理带来了困难。此时若用据的统计处理带来了困难。此时若用S代替代替从而对从而对作出估计必然会引起偏离，而且测定次数越少，偏离作出估计必然会引起偏离，而且测定次数越少，偏离就越大。如果采用另一新统计量就越大。如果采

41、用另一新统计量tP,f取代取代u(仅与仅与P有关有关)，上述偏离即可得到修正。上述偏离即可得到修正。 x x xxxux t分布法：分布法：t值的定义：值的定义： (3-18) t分布是有限测定数据及其随机误差的分布规分布是有限测定数据及其随机误差的分布规律。律。t分布曲线见图分布曲线见图3-6，其中纵坐标仍然表示概率，其中纵坐标仍然表示概率密度值，横坐标则用统计量密度值，横坐标则用统计量t值来表示。显然，在值来表示。显然，在置信度相同时，置信度相同时，t分布曲线的形状随分布曲线的形状随f（f=n-1）而变）而变化，反映了化，反映了t分布与测定次数有关有实质。由图分布与测定次数有关有实质。由图

42、3-6可知，随着测定次数增多，可知，随着测定次数增多，t分布曲线愈来愈陡峭，分布曲线愈来愈陡峭，测定值的集中趋势亦更加明显。当测定值的集中趋势亦更加明显。当f时，时，t分布分布曲线就与正态分布曲线合为一体，因此可以认为正曲线就与正态分布曲线合为一体，因此可以认为正态分布就是态分布就是t的极限。的极限。 sxtfP, 与正态分布曲线一样，与正态分布曲线一样，t分布曲线下面某区间分布曲线下面某区间的面积也表示随机误差在此区间的概率。但的面积也表示随机误差在此区间的概率。但t值与值与标准正态分布中的标准正态分布中的u值不同，它不仅与概率还与测值不同，它不仅与概率还与测定次数有关。不同置信度和自由度所

43、对应的定次数有关。不同置信度和自由度所对应的t值见值见表表3-2中。中。 t 值值 P 90% 95% 99% 99.5%f(n-1) 1 6.31 12.71 63.66 127.32 2 2.92 4.30 9.92 14.98 3 2.35 3.18 5.84 7.45 4 2.13 2.78 4.60 5.60 5 2.02 2.57 4.03 4.77 6 1.94 2.45 3.71 4.32 7 1.90 2.36 3.50 4.03 8 1.86 2.31 3.35 3.83 9 1.83 2.26 3.25 3.69 10 1.81 2.23 3.17 3.58 20 1.7

44、2 2.09 2.84 3.15 30 1.70 2.04 2.75 (3.01) 60 1.67 2.00 2.66 (2.87) 120 1.66 1.98 2.62 2.81 1.64 1.96 2.58 2.81 由表由表3-2中的数据可知，随着自由度的增加，中的数据可知，随着自由度的增加，t值逐渐减小并与值逐渐减小并与u值接近。当值接近。当f=20时，时，t与与u已经比较已经比较接近。当接近。当f时，时，tu，S。在引用。在引用t值时，一般值时，一般取取0.95置信度。置信度。根据样本的单次测定值根据样本的单次测定值x或平均值分别表示或平均值分别表示的的置信区间时，根据置信区间时，

45、根据t分布则可以得出以下的关系：分布则可以得出以下的关系：（3-18a）或或（3-19） stxfP,nstxstxfPxfP, 式（式（3-18a）和式（）和式（3-19）的意义在于，真值）的意义在于，真值虽然不为所知（虽然不为所知（也未知），但可以期望由有限的也未知），但可以期望由有限的测定值计算出一个范围，它将以一定的置信度将真测定值计算出一个范围，它将以一定的置信度将真值包含在内。该范围越小，测定的准确度越高。值包含在内。该范围越小，测定的准确度越高。例例题题2：式（：式（3-19）是计算置信区间通常使用的关系）是计算置信区间通常使用的关系式。由该式可知，当式。由该式可知，当P一定

46、时，置信区间的大小与一定时，置信区间的大小与tP,f、S、n均有关，而且均有关，而且tP,f与与S实际也都受实际也都受n的影响，的影响，即即n值越大，置信区间越小。值越大，置信区间越小。例例3：平行测定的数据中，有时会出现一二个与其结平行测定的数据中，有时会出现一二个与其结果相关较大的测定值，称为可疑值或异常值。对于果相关较大的测定值，称为可疑值或异常值。对于为数不多的测定数据，可疑值的取舍往往对平均值为数不多的测定数据，可疑值的取舍往往对平均值和精密度造成相当显著的影响。和精密度造成相当显著的影响。对可疑值的取舍实质是区分可疑值与其它测定对可疑值的取舍实质是区分可疑值与其它测定值之间的差

47、异到底是由过失、还是随机误差引起的。值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失，则无论此数据是否如果已经确证测定中发生过失，则无论此数据是否异常，一概都应舍去；而在原因不明的情况下，就异常，一概都应舍去；而在原因不明的情况下，就必须按照一定的统计方法进行检验，然后再作出判必须按照一定的统计方法进行检验，然后再作出判断。根据随机误差分布规律，在为数不多的测定值断。根据随机误差分布规律，在为数不多的测定值中，出现大偏差的概率是极小的，因此通常就认为中，出现大偏差的概率是极小的，因此通常就认为这样的可疑值是由过失所引起的，而应将其舍去，这样的可疑值是由过失所引起的，而应

48、将其舍去，否则就予以保留。否则就予以保留。将测定值由小至大按顺序排列，其中可疑值为将测定值由小至大按顺序排列，其中可疑值为x1或或xn。求出可疑值与其最邻近值之差求出可疑值与其最邻近值之差xn-xn-1或或x2-x1，然，然后用它除以极差后用它除以极差xn-x1，计算出统计量，计算出统计量Q：或或（3-20） Q值越大，说明离群越远，远至一定程度时则应将值越大，说明离群越远，远至一定程度时则应将其舍去。故其舍去。故Q称为舍弃商。称为舍弃商。根据测定次数根据测定次数n和所要求的置信度和所要求的置信度P查查QP,n值表值表3-3。若。若QQP,n，则以一定的置信度弃去可疑值，反之，则以一定

49、的置信度弃去可疑值，反之则保留，分析化学中通常取则保留，分析化学中通常取0.90的置信度。的置信度。 11xxxxQnnn112xxxxQn nP 3 4 5 6 7 8 9 10 Q0.9 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41Q0.95 0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49 如果测定数据较少，测定的精密度也不高，因如果测定数据较少，测定的精密度也不高，因Q与与QP,n值接近而对可疑值的取舍难以判断时，最值接近而对可疑值的取舍难以判断时，最好补测好补测1-2次再进行检验就更有把握。次再进行检验就更有把握。如果

50、没有条件再做测定，则宜用中位数代替平如果没有条件再做测定，则宜用中位数代替平均值报告结果。因是否取舍可疑值对平均值的影响均值报告结果。因是否取舍可疑值对平均值的影响较大，对中位值的影响较小。较大，对中位值的影响较小。将测定值由小至大按顺序排列，其中可疑值为将测定值由小至大按顺序排列，其中可疑值为x1或或xn。先计算该组数据的平均值和标准偏差，再。先计算该组数据的平均值和标准偏差，再计算统计量计算统计量G。若若x1可疑，可疑，（3-21）若若xn可疑，可疑，（3-21a） sxxG1sxxGn 根据事先确定的置信度和测定次数查表根据事先确定的置信度和测定次数查表3-4。若若GGP,n，

51、说明可疑值对相对平均值的偏离较大，说明可疑值对相对平均值的偏离较大，则以一定的置信度弃去可疑值，反之则保留。则以一定的置信度弃去可疑值，反之则保留。在运用格鲁布斯法判断可疑值的取舍时，由于在运用格鲁布斯法判断可疑值的取舍时，由于引入了引入了t分布中最基本的两个参数己分布中最基本的两个参数己和和s，故该方，故该方法的准确度较法的准确度较Q法高，因此得到普遍采用。法高，因此得到普遍采用。 x 表表3-4 GP,n值表值表测定次数测定次数置信度（置信度（P）测定次数测定次数置信度（置信度（P） n 95 99n 95 99 3 1.15 1.15 12 2.29 2.55 4 1.46 1

52、.49 13 2.33 2.61 5 1.67 1.75 14 2.37 2.66 6 1.82 1.94 15 2.41 2.71 7 1.94 2.10 16 2.44 2.75 8 2.03 2.22 17 2.47 2.79 9 2.11 2.32 18 2.50 2.82 10 2.18 2.41 19 2.53 2.85 11 2.23 2.48 20 2.56 2.88 用统计的方法检验测定值之间是否存在显著用统计的方法检验测定值之间是否存在显著性差异，以此推断它们之间是否存在系统误差，性差异，以此推断它们之间是否存在系统误差，从而判断测定结果或分析方法的可靠性，这一过从而判断测

53、定结果或分析方法的可靠性，这一过程称为显著性检验。定量分析中常用的有程称为显著性检验。定量分析中常用的有t检验法检验法和和F检验法。检验法。（） t检验法用来检验样本平均值或两组数据的平检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异，从而对分析方法均值之间是否存在显著性差异，从而对分析方法的准确度作出评价。的准确度作出评价。当检验一种分析方法的准确度时，采用该方法当检验一种分析方法的准确度时，采用该方法对某标准试样进行数次测定，再将样本平均值与标对某标准试样进行数次测定，再将样本平均值与标准值准值T进行比较。则置信区间的定义可知，经过进行比较。则置信区间的定义可知，经过n

54、次次测定后，如果以平均值为中心的某区间已经按指定测定后，如果以平均值为中心的某区间已经按指定的置信度将真值的置信度将真值T包含在内，那么它们之间就不存包含在内，那么它们之间就不存在显著性差异，根据在显著性差异，根据t分布，这种差异是仅由随机分布，这种差异是仅由随机误差引起的。误差引起的。t可由下式计算：可由下式计算： (3-22a) 若若ttP,f，说明与，说明与T之差已超出随机误差的界限，之差已超出随机误差的界限，就可以按照相应的置信度判断它们之间存在显著性就可以按照相应的置信度判断它们之间存在显著性差异。差异。xsTxt 进行显著性检验时，如置信度定得过低，则容进行显著性检验时，如置信度定

55、得过低，则容易将随机误差引起的差异判断为显著性差异，如置易将随机误差引起的差异判断为显著性差异，如置信度定得过高，又可能将系统误差引起的不一致认信度定得过高，又可能将系统误差引起的不一致认同为正常差异，从而得出不合理的结论。在定量分同为正常差异，从而得出不合理的结论。在定量分析中，常采用析中，常采用0.95或或0.90的置信度。的置信度。在显著性检验中，将具有显著性差异的测定值在显著性检验中，将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平，用在随机误差分布中出现的概率称为显著性水平，用表示，即这些测定值位于一定置信度所对应的随机表示，即这些测定值位于一定置信度所对应的随机误

56、差界限之外。如置信度误差界限之外。如置信度P=0.95，则显著水平，则显著水平=0.05，即即=1-P。例例1. 用标准方法平行测定钢样中磷的质量分数用标准方法平行测定钢样中磷的质量分数4次，其平均值为次，其平均值为0.087%。设系统误差已经消除，且。设系统误差已经消除，且 =0.002%。（。（1）计算平均值的标准偏差；（）计算平均值的标准偏差；（2）求该）求该钢样中磷含量的置信区间。置信度为钢样中磷含量的置信区间。置信度为P=0.95。解解：（：（1）（2）已知）已知P=0.95时，时，u=1.96。根据。根据%001. 04%002. 0nx%002. 0%087. 0%001.

57、096. 1%087. 0 xux 例例2. 标定标定HCl溶液的浓度时，先标定溶液的浓度时，先标定3次，结果次，结果为为0.2001mol/L、0.2005mol/L和和0.2009mol/L；后来又；后来又标定标定2次，数据为次，数据为0.2004mol/L和和0.2006mol/L。试分。试分别计算别计算3次和次和5次标定结果计算总体平均值次标定结果计算总体平均值的置信区的置信区间，间，P=0.95。解：标定解：标定3次时，次时，标定标定5次时，次时，故查表,30. 4,/0004. 0,/2005. 02,95. 0tLmolsLmolx0010. 02005. 030004. 03

58、0. 42005. 0,nstxfP故查表,78. 2,/0003. 0,/2005. 04,95. 0tLmolsLmolx0004. 02005. 050003. 078. 22005. 0,nstxfP 例例3. 测定某试样中测定某试样中SiO2质量分数得质量分数得s=0.05%。若。若测定的精密度保持不变，当测定的精密度保持不变，当P=0.95时，欲使置信区间时，欲使置信区间的置信限的置信限，问至少应对试样平行测定多，问至少应对试样平行测定多少次？少次？解：根据式（解：根据式（3-19）和题设得：）和题设得：已知已知s=0.05%,故：故：查表查表3-2得知，当得知，当f=n-1

59、=5时，时，t0.95,5=2.57，此时，此时。即至少应平行测定。即至少应平行测定6次，才能满足次，才能满足题中的要求。题中的要求。%05. 0,xfPt%05. 0,nstxfP105. 005. 0nt16/57. 2 3-5 有效数字及其运算规则有效数字及其运算规则在科学实验中，为了得到准确的测量结果，不在科学实验中，为了得到准确的测量结果，不仅要准确地测定各种数据，而是还要正确地记录和仅要准确地测定各种数据，而是还要正确地记录和计算。分析结果的数值不仅表示试样中被测成分含计算。分析结果的数值不仅表示试样中被测成分含量的多少，而且还反映了测定的准确程度。所以，量的多少，而且还反映了测

60、定的准确程度。所以，记录实验数据和计算结果应保留几位数字是一件很记录实验数据和计算结果应保留几位数字是一件很重要的事，不能随便增加或减少位数。例如用重量重要的事，不能随便增加或减少位数。例如用重量法测定硅酸盐中的法测定硅酸盐中的SiO2时，若称取试样重为时，若称取试样重为0.4538克，经过一系列处理后，灼烧得到克，经过一系列处理后，灼烧得到SiO2沉淀重沉淀重0.1374克，则其百分含量为：克，则其百分含量为：SiO2 % =(0.1374/0.4538)100%30.277655354% 上述分析结果共有上述分析结果共有11位数字，从运算来讲，并位数字，从运算来讲，并无错误，但实际上用这样

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

误差和分析数据的处理

文档简介

温馨提示

最新文档

评论

误差和分析数据的处理

文档简介

温馨提示

最新文档

评论

相关文档