误差和分析数据处理.ppt_第1页
误差和分析数据处理.ppt_第2页
误差和分析数据处理.ppt_第3页
误差和分析数据处理.ppt_第4页
误差和分析数据处理.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 误差和分析数据处理 (Errors in Quantitative Analysis and Statistical Data Treatment ),2.1 测定误差及其分类 2.2 有效数字及运算规则 2.3 分析数据的统计处理,2.1 测定误差及其分类,2.1.1 准确度和精密度 1. 误差和准确度 真值(xT):某一物理量本身具有的客观存在的真实数值,通常未知。 测量值(x):以某种方法测得的某物理量的数值。 准确度(accuracy):测量值是真值的接近程度,(在一定测量精度的条件下多次测定的平均值与真值的接近程度)。,绝对误差(absolute error, Ea):测量值x与真值xT的差值。 Ea = x - xT 相对误差(relative error, Er):绝对误差在真值中所占百分率。 绝对误差和相对误差都有正负之分。 绝对误差值相同时,测量值越大,相对误差越小。定量分析 的结果用相对误差表示更为合适。,2偏差与精密度,平均值( , mean):n 次测量数据的算术平均值。 平均值比单次测量值 x 更客观地代表待测参数。 精密度(precision):一组测定数值彼此之间的接近程度(即多次重复测定某一量时所得测量值的离散程度),常以偏差、平均偏差、标准偏差等形式表示。,偏差(deviation, d):单个测定值x与多次测定平均值之间差别。 相对偏差(relative deviation dr):偏差占平均值中的份额。 平均偏差(mean deviation, ):将一组测量值之各次测定偏差的绝对值对测定次数求得的平均值。平均偏差无正负之分。,相对平均偏差 (relative mean deviation, ):平均偏差占测量平均值的比例。 标准偏差(standard deviation, s):偏差平方和之均值的平方根(特点:将突现大偏差对测定结果的影响)。 相对标准偏差( relative standard deviation, RSD ):标准偏差占测量平均值的比例。,如:在进行10次射击后 (A)精密度和准确度都很高。 (B)精密度很高,但准确度不高。 (C)和(D)精密度及准确度都不高。,3. 准确度与精密度的关系,精密度高不一定准确度好,而欲得高准确度,必须有高精密度。,解:两组平均偏差均为0.035。 而标准偏差分别为S1=0.0457, S2=0.0358。 因此第二组数据的精密度好。 用标准偏差表示的优点: 可避免各偏差之间的正负抵消。 使大的偏差更加明显。,例1:有两组数据如下,问哪一组的精密度好些? D1 = +0.08, -0.01, -0.04, +0.02, -0.07, +0.02, -0.02, +0.02 D2 = +0.03, +0.03, -0.04, -0.03, -0.04, +0.03, -0.03, -0.05,2.1.2 误差的种类和性质,1.系统误差(systematic errors) 由某种固定因素引起的误差,是在测量过程中重复出现、正负及大小可测,并具有单向性的误差,系统误差可通过其他方法验证而加以校正。 可分为: 方法误差( method errors):由所选择的方法本身(分析系统的化学或物理化学性质)决定的,是无法避免的。 仪器/试剂误差(instrument & reagent errors):由仪器性能及所用试剂的性质(仪器准确度不够、器皿间不配套、试剂不纯等)所决定 操作误差(personal errors):操作者本人所引起的(如滴定管读数时弯月面高度总是偏低于眼睛位置、观察终点颜色总是偏深等),可通过提高操作者技能来消除或减少。,2. 随机误差(random error),由测量过程中一系列有关因素的微小随机波动而引起的、具有相互抵消性的误差,具有统计规律性,多次测量时正负误差可能相互抵消。 随机误差不可避免,也无法严格控制,仅可尽量减少(如增加测定次数)。 系统误差的单向性和可重复性决定其只影响准确度而不影响精密度;随机误差的双向和不确定性则对准确度和精密度都有影响。 有时系统误差与随机误差很难严格区分: 某人判断滴定终点颜色总是偏深系统误差。 但每次偏深程度不一定相等随机误差。,2.1.3 提高分析准确度的措施,分析结果的允许误差应视组分含量、分析对象等而改变对准确度的要求。,1. 选择合适的分析方法 容量分析的准确度高,但灵敏度较低;而仪器分析灵敏度高,相对误差较大。 2. 减少测量误差 应减少每个测量环节的误差,天平称量应取样0.2 克以上,滴定剂体积应大于20毫升,均可使相对误差控制在0.2%左右。 3. 减小随机误差 适当增加平行测定次数,通常要求在3-5次。,4.消除系统误差,对照试验(contrast test): 以标准样品代替试样进行测定,以校正测定过程中的系统误差。有标准样比对法(用标准样品、管理样、人工合成样等)或加入回收法、选择标准方法(主要是国家标准等)、相互校验(内检、外检等)。 空白试验(blank test):不加试样但完全照测定方法进行操作的试验,可消除由试剂、溶剂或器皿所引入的待测物或干扰杂质所产生的系统误差。所得结果为空白值,需扣除。若空白值过大,则需提纯试剂或更换容器。 仪器校准:消除因仪器不准引起的系统误差。主要校准砝码、容量瓶、移液管,以及容量瓶与移液管的配套校准。 分析结果校正:主要校正在分析过程中产生的系统误差。通过校正系数、测残余量等来校正。,2.2 有效数字及运算规则,2.2.2 有效数字(Significant figures) 有效数字是实际能测到的数字,只保留一位可疑值。不仅表示数量,也表示精度。 试样重(克):0.5180(4位,天平称出) 0.52 (2位,台秤) 溶液体积(毫升):25.34 (4位,滴定管读数) 25.3 (3位,量筒读数) 离解常数:1.810-5 (2位) pH:11。02(或4.35) (均为2位) 整数部分:1000(位数不清楚)。 整倍数、分数、常数(e、等)、化学计量数等:有效位数为任意位。,2.2.2 修约规则,数字修约确定有效位数后,对多余位数的舍弃过程,其规则为修约规则。 具体修约规则: 四舍六入五成双。 如: 3.7464 3.746 3.5236 3.524 7.2155 7.216 6.5345 6.534 6.53451 6.535 (5 后为非零数字),1. 加减法 有效位数以绝对误差最大的数为准,即小数点后位数最少的数字为依据。,2.2.3 运算规则,例2: 计算 50.1 + 1.45 + 0.5812,解:每个数据最后一位都有 1的绝对误差,在上述数据中,50.1的绝对误差最大( 0.1),所以各数值及计算结果都取到小数点后第一位。 所以:50.1 + 1.45 + 0.5812 = 50.1+1.4 + 0.6 = 52.1,2. 乘除法 有效位数以相对误差最大的数为准,即有效位数最少的数字为依据。,例3: 计算 2.1879 0.154 60.06,解:各数的相对误差分别为: 1/21879 100% = 0.005% 1/154 100% = 0.6% 1/6006 100% = 0.02% 上述数据中,有效位数最少的0.154,其相对误差最大,结果只能取三位有效数字,所以: 2.1879 0.154 60.06 = 2.19 0.154 60.1 = 20.3,应先修约,后计算。 常量分析时结果一般要求保留四位有效数字,微量分析时可减少其位数。,2.3 分析数据的统计处理,2.3.1 平均值的置信区间 1. 总体标准偏差和平均值的标准偏差: 以分析某湖水中有害物质组分含量来理解:整个湖是考察对象的全体(总体),不可能取全湖水也不能只取50或100毫升的水样进行分析,须在水体的各个角落、各个层面都取部分水样混匀后分析才能代表总体(取样要有代表性),若按规则取样40升作为分析总体。操作时从中取20份(25mL/份)分析,得到20组数据该分析总体中的一个随机样本,其样本容量 n=20,测定结果的平均值为样本平均值:,如把整湖水都取来分析,即 ,可得总体平均值 : 在扣除系统误差后, 即为真值xT。此时可得总体平均偏差和总体标准偏差: 实际中不可能取 ,n 只能是有限次,所得到的也只能是样本平均偏差d 和样本标准偏差s,从一个总体中抽取容量为n的多个样本进行等精度测量,所产生的多个平均值也会具有一定的分散性;同样,随着样本数 n 的增加,平均值的分散性也将逐步减小,并最终使样本平均值 趋向于总体平均值。 因而,有必要以平均值的标准偏差 来表示测量值的分散性。 可以证明,对于n次测定平均值的标准偏差:,可见 随测定次数的增加迅速减小,但46次已足够。,2. 正态分布 因测量过程中存在随机误差,测量数据具有分散的特性,如果测量次数非常多,这些测量数据的分布一般服从正态分布:,式中: x 单次测量值 F(x) 测定值 x 值在总体中出现的概率密度 总体的平均值,在无系统误差时为真值,体现了无限多个数据的集中趋势。 总体的标准差,正态分布曲线上两个拐点间的距离,表示众多数据的离散程度。,只要确定了 和 ,便确定了分布曲线的图形。,x = (即误差为零)时,F(x)值最大。说明大多数测量值集中在算术平均值附近,或说算术平均值是最可信赖值。 x 值趋于 或- (即 x 与 差很大)时,曲线以轴为渐近线,说明小误差出现的概率大而大误差出现的概率小。 曲线以x = 的直线呈轴对称分布,即正、负误差出现概率相等。 值越大,测量值的分布越分散; 越小,测量值越集中,曲线越尖锐。,具有不同 值的测量值的正态分布,相同 值但不同 值的测量值的正态分布,F(u)-u的函数关系称为标准正态分布,其分布曲线是以总体平均值为原点、变量u为横座标单位的曲线。,以测定值x为横坐标的正态分布曲线,会因 和 的变化而有不同形状,在使用中不太方便。为此引入一个新变量 u :,代入:,得到:,正态分布曲线在 x 区间内的概率密度为1,即所有测量值出现的概率为1。 其中u值在1,2,3 范围内(即x值落在 1、 2和 3范围内)的概率分别为68.3 %、95.5 %和99.7 %。 当出现在 3以外的测量值可当作异常值,舍去。,标准正态分布的特点:,3. t 分布 实际工作中测量次数不可能很多,所产生的随机误差不完全遵循正态分布。为满足人们希望由有限次测量平均值 估算出总体平均值的愿望,引入置信因子 t :,t 的定义与正态分布的 u 相似,因而形状也相似,只是曲线随自由度 f 而改变( f = n-1) ,f 趋近时,t 分布就趋于正态分布。,置信度的含义 置信度是人们对所做判断之可靠性的把握程度,它包括两重含义:置信概 率和置信区间。 如:经3次测定,某样品中磷含量的平均值为 0. 079 %,标准偏差 s = 0.002%。该样品总体平均值出现在0.0790.004(置信区间)的可能 性(置信概率)有多大? 样品总体平均值出现在0.0790.002的可能性又 有多大? 经推算, 出现在0.0790.004范围内可能性有95.5%。 出现在0.0790.002范围内的可能性只有近70%了. 因而预报时划定区间小,其判断结果出现的可能性就小。反之则为预报留下了 更充分的余地,其置信概率就高。,在数学上: 置信度P 是在指定置信因子 t 值时,测定值落在( ts)范围以内的概率(图中曲线下的空白部分) 。 显著性水准 则是在某一 t 值时,测量值落在( ts)范围以外(图中阴影部分)的概率(=1-P),图中阴影部分分别为 /2 空白部分为 P = 1-。,前人已经将不同自由度 f 的置信因子计算好并制成表。在引用 t 值表须加下标说明,如: 0.01,10 = 3.17 表示 P = 99%,f = 10 时的 t 值。,4. 平均值的置信区间 平均值的置信区间以测定结果(平均值)为中心的可靠性范围,该区间有(1-)100%的概率包含总体平均值。 置信度定得高易出现“存伪 ”(保留过多); 置信度定得过低则出现“拒真 ”。 分析化学中通常取 P = 95%。,例4:测定某作物中的含糖量,结果为15.40%,15.44%,15.34%,15.41%,15.38%,求置信度为95%和99%时的置信区间。,解:平均值为15.40%, s =0.0385, n=5, f=4, 若置信度取95%时, 则 = 0.05 查表得到 t0.05,4 = 2.78,代入置信区间计算式得到,可理解为:在15.40 0.048%的区间内包括该作物中含糖量总体平均值 的可能性是95%。 不能理解为:该作物中的含糖量下一次测定的实验平均值有95%的可能性落在15.40 0.048%的区间内。,若置信度为99%,则t 0.01,4 = 4.60,于是,2.3.2 测量数据的统计检验 一个人对同一样本测定多次所得的结果会不一致,有时甚至出现偏差较大的数据;不同人、不同实验室采用相同方法对同一样本测定,结果也会不同。因而在定量分析中,常常需判定实验测量数据是否“合群”、实验测量结果是否可靠。这可分别用可疑值取舍和显著性检验的方法给予解决。 1实验数据的评价 定量分析中实验数据总有一定离散性。任一数据均不能随意地保留或舍去。可疑值取舍问题实质上是区分随机误差与过失误差的问题,可借统计检验来判断。 基本方法是:设计一个统计量并计算其值,并将该统计量计算值与相应的表值进行比较,若大于表值则该数据需要舍弃,否则就需要保留。,Grubbs法: 根据统计量T 值进行判断。T 值与平均值、组数据的标准偏差及置信度有关。其检验步骤为: 将测量数据顺序排列, x1, x2, x3, x4, xn,并求出平均值与标准偏差。 求出T值: 以表中T,n 与计算T 值比较,若 T算T表,则该值舍去,否则保留。 T 的下标中n为数据个数,当可疑值有两个时,需分别判断:在同侧时,先判段内值,计算时 n = n -1 ;在两侧时,不分先后,但当确定先判断值需舍去后,须重新计算平均值与标准偏差。 Grubbs法的效果比较好但计算较麻烦,Q 检验法: 根据统计量Q 值进行判断。其检验步骤为: 将数据顺序排列为:x1,x2,xn-1,xn 计算出统计量Q 值:,式中分子为可疑值与相邻值的差值,分母为整组数据的 极差。Q算越大,说明x1或xn离群越远。 根据测定次数和要求的置信度查得Q 表(表值)。 再以计算值与表值相比较,若Q算Q表,则该值需舍去, 否则必须保留。 Q检验法计算比较简单,但原则上只适合于仅有一个可疑值的情况。,例5:某一标准溶液的四次标定结果为 0.1014, 0.1012, 0.1025, 0.1016 (mol/L),4个数据是否都要保留。,解: 很明显,可疑值为0.1025。取=0.05,2.实验结果的检验 分析工作中,同一人用不同方法对同一样品进行测定,所得结果会有所不同;不同人员在不同实验室用同一方法对同一样品进行测定,所得结果也会有不同。 问题:差异何来?属何种性质?差异大小可否被接受?故需进行检验。 方法:进行显著性检验,即用统计的方法检验数据组间是否存在显著差异的方法。 其基本思路是: 提出一个零假设,即假定两组数据间不存在显著性差异; 为回答零假设是否正确,确定一个适当的置信度; 根据所确定的置信度检验两组数据的差异是否显著。,F 检验: 比较两组数据的方差,用以考察这两组数据的精密度是否存在系统误差。方法为: 计算两个标准偏差的比值F(S 值大的在分子上以确保 F 1):,再比较计算得到的F 值与F表值比较,若F算 F表, 则有显著性差异存在。 F表以自由度 f 值划分,故要确定两组数据的自由度。 F表值为单边值,即要求S1 S2 ,而不能 S1 S2 。 F表为P = 95%时( =0.05)的值,当进行双边检验时, 值为单边时的两倍( =0.1),即P=90%。,例6:以两种方法测定碱灰中Na2CO3含量,结果为: 方法一 X1=42.34% S1=0.10 n1=5 方法二 X2=42.44% S2=0.12 n2=4 问在置信度为95%时两方法在精密度上有否显著差异?,解: n1 = 5, f1 = 4,n2 = 4, f2 = 3,s2 s1, f大 = 3, f小 = 4 , 查得 F表=6.59 , F表 F算,即两方法无显著差异。,t 检验: 比较两组数据的平均值来确定它们之间是否存在系统误差。 求得两组数据各自的平均值 ; 由 求得 t 值; 将 t算 与ta,f 比较,若 t算t表 则不存在显著性差异。 根据相比较两组数据的来源可分为 平均值与标准值的比较; 两组平均值的比较。,平均值与标准值的比较,例7:为鉴定一个方法,取基准物(含量100%)作10次平行测定,其结果是100.3, 99.2, 99.4, 100.0, 99.4, 99.9, 99.4, 100.1, 99.4, 99.6 (%) , 试对分析方法作出评价(P=95%)。,解:求得 x = 99.67% s =0.374 n =10 查得t0.05,9 = 2.26 t算,差异显著,即测量值偏低。这说明误差不仅仅由随机误差引起,还有系统误差。若基准物可靠,则该分析方法有系统误差,应寻求而校正之。,两组平均值的比较,用两种方法对同一总体进行测定,得到的两组结果数据为:,经推导,得,s为合并标准偏差,n1+n2 2为总自由度 f。,例8:以两种方法测定碱灰中Na2CO3含量,结果为: 方法一 X1=42.34% S1=0.10 n1=5 方法二 X2=42.44% S2=0.12 n2=4 问在置信度为95%时两方法有否显著性差异?,查表得 t0.05,7 = 2.36 t算, 说明两种方法无显著性差异(即

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论