




已阅读5页,还剩67页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章误差和分析数据的处理 本章内容 误差有效数字误差计算减小误差措施 分类 系统误差随机误差过失误差 3 1误差及其产生的原因一 系统误差 可测误差 由固定原因产生特点 单向性 大小 正负一定可测性 原因固定 可消除重现性 重复测定重复出现 一 方法误差 分析方法本身造成 例如 1 在重量分析中 沉淀的溶解损失或吸附某些杂质而产生的误差 2 滴定分析中 反应进行不完全 干扰离子的影响 滴定终点和等当点的不符合 以及其他副反应的发生等 都会系统地影响测定结果 二 仪器误差 仪器本身不够准确或未经校准所引起的 如天平 法码和量器刻度不够准确等 三 试剂误差试剂不纯或蒸馏水中含有微量杂质所引起 四 操作误差 实际操作与操作规程有出入 例 使用了缺乏代表性的试样 试样分解不完全或反应的某些条件控制不当等 个人误差 在读取滴定剂的体积时 有的人读数偏高 有的人读数偏低 在判断滴定终点颜色时 有的人对某种颜色的变化辨别不够敏锐 偏深或偏浅等所造成的误差 二 偶然误差 随机误差 由不确定原因引起 特点 1 不具单向性 大小 正负不定 2 不可消除 原因不定 但可减小 测定次数 3 分布服从统计学规律 正态分布 3 2测定值的准确度与精密度一 准确度与误差1 准确度 指测量结果与真值的接近程度2 误差a 绝对误差ea 测量值与真实值之差绝对误差 测定值 真实值b 相对误差er 绝对误差占真实值百分比相对误差 绝对误差 真实值 100 二 精密度与偏差精密度 平行测量的各测量值间相互接近的程度 精密度用 偏差 表示 偏差越小说明分析结果的精密度越高 一 绝对偏差 平均偏差和相对平均偏差 1 绝对偏差 单次测量值与平均值之差2 相对偏差 绝对偏差占平均值的百分比 相对平均偏差 3 6 说明 平均偏差不计正负号 缺点 小偏差的测定总是占多数 大偏差的测定总是占少数 按总的测定次数去求平均偏差所得的结果偏小 大偏差得不到充分的反映 二 标准偏差和相对标准偏差总体 研究对象的全体 母体 样本 总体中随机抽出的一部分样品 子样 容量 样本大小 样本中所含测量值的数目 例 对某一批煤中硫的含量进行分析 首先是进行取样 粉碎 缩分 最后制成一定数量的分析试样 这就是供分析用的总体 如果我们从中称取10份煤样进行平行测定 得到10个测定值 则这一组测定结果就是该试样总体的一个随机样本 样本容量为10 若样本容量为n 平行测定次数分别为x1 x2 x3 xn 则其样本平均值为 当测定次数无限增多 既n 时 样本平均值即为总体平均值 若没有系统误差 且测定次数无限多 或实用上n 30次 时 则总体平均值 就是真实值t 此时 用 代表总体标准偏差 其数学表示式为 在定量分析的实验中 测定次数一般较少 n 20次 故其平均偏差 须由式 3 9 求得 分析化学中测定次数一般不多 n 20 而总体平均值又不知道 只好用样本的标准偏差s来衡量该组数据的分散程度 样本标准偏差的数学表达式为 3 9 n 1 自由度 以f表示 指在n次测量中 只有n 1个可变的偏差 自由度也可以理解为 数据中可供对比的数目 当测定次数非常多时 测定次数n与自由度 n 1 的区别就变得很小 变异系数 3 10 三 平均值的标准偏差从同一总体中随机抽出容量相同的数个样本 由此可以得到一系列样本的平均值 这些样本平均值也并非完全一致 它们的精密度可以用平均值的标准偏差来衡量 与上述任一样本的各单次测定值相比 这些平均值之间的波动性更小 即平均值的精密度较单次测定值的更高 实际工作中 常用样本的平均值对总体平均值 进行估计 平均值的标准偏差与单次测定值的标准偏差之间关系 n 3 11 有限次测定则有 3 12 样本平均值的标准偏差 平均值的标准偏差与测定次数的平方根成反比 增加测定次数可以减小随机误差 提高测定的精密度 除偏差之外 还可用极差r表示样本平行测定值的精密度 极差又称全距 是测定数据中的最大值与最小值之差 其值愈大表明测定值愈分散 因无充分利用所有数据 故精确性较差 偏差和极差的数值一定程度上反映了测定中随机误差影响的大小 三 准确度和精密度的关系说明 系统误差是定量分析中误差的主要来源 影响分析结果的准确度 偶然误差影响分析结果的精密度 1 准确度高 要求精密度一定高但精密度好 准确度不一定高2 准确度反映了测量结果的正确性精密度反映了测量结果的重现性 四 提高分析结果准确度的方法1 选择合适的分析方法例 测全fe含量k2cr2o7法40 20 0 2 40 20 比色法40 20 2 0 40 20 2 减小测量误差1 称量例 天平一次的称量误差为0 0001g 两次的称量误差0 0002g re 0 1 计算最少称样量 2 滴定例 滴定管一次的读数误差为0 01ml 两次的读数误差为0 02ml re 0 1 计算最少移液体积 3 增加平行测定次数 一般测3 4次以减小偶然误差4 消除测量过程中的系统误差1 校准仪器 消除仪器的误差2 空白试验 消除试剂误差3 对照实验 消除方法误差4 回收实验 加样回收 以检验是否存在方法误差 3 3随机误差的正态分布 主要内容 偶然误差的正态分布偶然误差的区间概率 一 频率分布在相同条件下对某样品中镍的质量分数 进行重复测定 得到90个测定值如下 1 601 671 671 641 581 641 671 621 571 601 591 641 741 651 641 611 651 691 641 631 651 701 631 621 701 651 681 661 691 701 701 631 671 701 701 631 571 591 621 601 531 561 581 601 581 591 611 621 551 521 491 561 571 611 611 611 501 531 531 591 661 631 541 661 641 641 641 621 621 651 601 631 621 611 651 611 641 631 541 611 601 641 651 591 581 591 601 671 681 69 1 分组 视样本容量的大小将所有数据分成若干组 容量大时分为10 20组 容量小时 n 50 分为5 7组 本例分为9组 2 排序 3 找最大值和最小值4 算极差r r 1 74 1 49 0 25 组距 r 9 0 25 9 0 03 每组内两个数据相差0 03 即 1 48 1 51 1 51 1 54等等 为了使每一个数据只能进入某一组内 将组界值较测定值多取一位 1 485 1 5151 515 1 5451 545 1 575等频数 测定值落在每组内的个数相对频数 数据出现在各组内的频率 分组 频数频率1 485 1 51520 0221 515 1 54560 0671 545 1 57560 0671 575 1 605170 1891 605 1 635220 2441 635 1 665200 2221 665 1 695100 1111 695 1 72560 0671 725 1 75510 011 901 00 图3 3频率分布的直方图 全部数据中 平均值1 62 所在的组 第五组 具有最大的频率值 处于它两侧的数据组 其频率值仅次之 结果 测定值出现在平均值附近的频率相当高 具有明显的集中趋势 与平均值相差越大的数据出现的频率越小 二 正态分布又称高斯分布 数学表达式即正态分布函数式为 3 13 y 测定次数趋于无限时 测定值xi出现的概率密度 若以x值表示横坐标 y值表示纵坐标 就得到测定值的正态分布曲线 曲线的最高点 它对应的横坐标值 即为总体平均值 说明了在等精密度的许多测定值中 平均值是出现概率最大的值 总体标准偏差 曲线两侧的拐点之一到直线x 的距离 表征了测定值的分散程度 标准偏差较小的曲线陡峭 表明测定值位于 附近的概率较大 即测定的精密度高 与此相反 具有较大标准偏差的曲线平坦 测定值位于 附近的概率较小 测定的精密度低 图3 4正态分布曲线 相同 2 1 总结 和 确定后 正态分布曲线的位置和形状也就确定 和 是正态分布的两个基本参数 正态分布用n 2 表示 正态分布曲线关于直线x 对称 具有的特点 1 对称性 绝对值大小相等的正负误差出现的概率相等 2 单峰性 峰形曲线最高点对应的横坐标x 值等于0 表明随机误差为0的测定值出现的概率密度最大 3 有界性 误差大于的测定值不是由随机误差所引起的 即随机误差的分布具有有限的范围 其值大小是界的 三 标准正态分布曲线的形状由 和 决定 将正态分布曲线的横坐标改用u来表示 以 为单位表示随机误差 3 14 代入 3 13 中得 u称为标准正态变量 3 15 经过上述变换 总体平均值为 的任一正态分布均可化为 0 2 1的标准正态分布 以n 0 1 表示 标准正态分布曲线如图3 5所示 曲线的形状与 和 的大小无关 图3 5标准正态分布曲线 四 随机误差的区间概率正态分布曲线与横坐标之间所夹的总面积 等于概率密度函数从 至 的积分值 它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100 即为1 3 16 求测定值或随机误差在某区间出现的概率p 可取不同的u值对式 3 16 积分求面积而得到 例如随机误差在 区间 u 1 即测定值在 区间出现的概率是 按此法求出不同u值时的积分面积 制成相应的概率积分表表3 1中列出的面积对应于图中的阴影部分 若区间为 u 值 则应将所查得的值乘以2 例如 随机误差出现的区间测定值出概率u 1x 0 3413 2 0 6826u 2x 2 0 4773 2 0 9546u 3x 3 0 4987 2 0 9974 随机误差在 2 范围以外的测定值出现的概率小于0 045 即20次测定中只有1次机会 随机误差超出 3 的测定值出现的概率更小 平均1000次测定中只有3次机会 通常测定仅有几次 不可能出现具有这样大误差的测定值 如果一旦发现 从统计学的观点就有理由认为它不是由随机误差所引起 而应当将其舍去 以保证分析结果准确可靠 概率 面积 表3 1正态分布概率积分表 u 面积 u 面积 u 面积0 00 00001 10 36432 20 48210 10 03981 20 38492 20 48610 20 07931 30 40322 30 48930 30 11791 40 41922 40 49180 40 15541 50 43322 50 49380 50 19151 60 44522 580 49510 60 22581 70 45542 60 49530 70 25801 80 46412 70 49650 80 28811 90 47132 80 49740 90 31591 960 49503 00 49871 00 34132 00 4773 0 5000 概率积分面积表的另一用途是由概率确定误差界限 例如要保证测定值出现的概率为0 95 那么随机误差界限应为 1 96 例1经过无数次测定并在消除了系统误差的情况下 测得某钢样中磷的质量分数为0 099 已知 0 002 问测定值落在区间0 095 0 103 的概率是多少 解 根据得 u 2 由表3 1查得相应的概率为0 4773 则p 0 095 x 0 103 0 4773 2 0 955 例2对烧结矿样进行150次全铁含量分析 已知结果符合正态分布 0 4695 0 00202 求大于0 4735的测定值可能出现的次数 解 查表 p 0 4773 故在150次测定中大于0 4773的测定值出现的概率为 0 5000 0 4773 0 0227150 0 0227 3 3 4有限测定数据的统计处理一 置信度与 的置信区间引言 日常分析中测定次数是有限的 总体平均值自然不为人所知 但是随机误差的分布规律表明 测定值总是在以 为中心的一定范围内波动 并有着向 集中的趋势 因此 如何根据有限的测定结果来估计 可能存在的范围 称之为置信区间 是有实际意义的 该范围愈小 说明测定值与 愈接近 即测定的准确度愈高 但由于测定次数较少 由此计算出的置信区间也不可能以百分之百的把握将 包含在内 只能以一定的概率进行判断 一 已知总体标准偏差 时对于经常进行测定的某种试样 积累了大量的测定数据 可认为 是已知的 根据 3 14 式并考虑u的符号可得 3 14a 由随机误差区间概率可知 测定值出现的概率由u决定 例当u 1 96时 x在 1 96 至 1 96 区间出现的概率为0 95 如果希望用单次测定值x来估计 可能存在的范围 则可以认为区间x 1 96 能以0 95的概率将真值包含在内 即有 3 14b 平均值较单次测定值的精密度更高 因此常用样本平均值来估计真值所在的范围 式 3 14b 和式 3 17 分别表示在一定的置信度时 以单次测定值x或以平均值为中心的包含真值的取值范围 即 的置信区间 在置信区间内包含 的概率称为置信度 它表明了人们对所作的判断有把握的程度 用p表示 3 17 对真值进行区间估计时 置信度的高低要定得恰当 一般以95 或90 的把握即可 式 3 14b 和 3 17 还可看出置信区间的大小取决于测定的精密度和对置信度的选择 对于平均值来说还与测定的次数有关 当 一定时 置信度定得愈大 u 值愈大 过大的置信区间将使其失去实用意义 若将置信度固定 当测定的精密度越高和测定次数越多时 置信区间越小 表明x或越接近真值 即测定的准确度越高 注意 是确定且客观存在的 没有随机性 而区间x u 或是具有随机性的 即它们均与一定的置信度相联系 因此我们只能说置信区间包含真值的概率是0 95 而不能认为真值落在上述区间的概率是0 95 二 已知样本标准偏差s时实际工作中 通过有限次的测定是无法得知 和 的 只能求出和s 而且当测定次数较少时 测定值或随机误差也不呈正态分布 给少量测定数据的统计处理带来了困难 此时若用s代替 从而对 作出估计必然会引起偏离 而且测定次数越少 偏离就越大 如果采用另一新统计量tp f取代u 仅与p有关 上述偏离即可得到修正 t分布法 3 18 t分布是有限测定数据及其随机误差的分布规律 其中纵坐标仍然表示概率密度值 横坐标则用统计量t值来表示 在置信度相同时 t分布曲线的形状随f f n 1 而变化 反映了t分布与测定次数有关 随着测定次数增多 t分布曲线愈来愈陡峭 测定值的集中趋势亦更加明显 当f 时 t分布曲线就与正态分布曲线合为一体 可以认为正态分布就是t的极限 图3 6t分布曲线 t分布与正态分布曲线关系 t分布曲线下面某区间的面积也表示随机误差在此区间的概率 但t值与标准正态分布中的u值不同 它不仅与概率还与测定次数有关 表3 2tp f值表 双边 t值p90 95 99 99 5 f n 1 16 3112 7163 66127 3222 924 309 9214 9832 353 185 847 4542 132 784 605 6052 022 574 034 7761 942 453 714 3271 902 363 504 0381 862 313 353 8391 832 263 253 69101 812 233 173 58201 722 092 843 15301 702 042 75 3 01 601 672 002 66 2 87 1201 661 982 622 81 1 641 962 582 81 由表知 随自由度的增加 t值逐渐减小并与u值接近 当f 20时 t与u已经比较接近 当f 时 t u s 在引用t值时 一般取0 95置信度 根据样本单次测定值x或平均值分别表示 的置信区间时 根据t分布则可以得出以下的关系 3 18a 3 19 二 可疑测定值的取舍平行测定的数据中 有时会出现一二个与其结果相关较大的测定值 称为可疑值或异常值 对于为数不多的测定数据 可疑值的取舍往往对平均值和精密度造成相当显著的影响 引言 对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到底是由过失 还是随机误差引起的 如果已经确证测定中发生过失 则无论此数据是否异常 一概都应舍去 而在原因不明的情况下 必须按照一定的统计方法进行检验 然后再作出判断 根据随机误差分布规律 在为数不多的测定值中 出现大偏差的概率是极小的 通常就认为这样的可疑值是由过失所引起的 而应将其舍去 否则就予以保留 一 q检验法 舍弃商 将测定值由小至大按顺序排列 其中可疑值为x1或xn 求出可疑值与其最邻近值之差xn xn 1或x2 x1 然后用它除以极差xn x1 计算出统计量q q值越大 说明离群越远 远至一定程度时将其舍去 根据测定次数n和所要求的置信度p查qp n值表3 3 若q qp n 则以一定的置信度弃去可疑值 反之则保留 分析化学中通常取0 90的置信度 表3 3qp n值表np345678910q0 90 940 760 640 560 510 470 440 41q0 950 970 840 730 640 590 540 510 49测定数据较少时 测定的精密度也不高 因q与qp n值接近而对可疑值的取舍难以判断时 最好补测1 2次再进行检验就更有把握 如果没有条件再做测定 则宜用中位数代替平均值报告结果 因是否取舍可疑值对平均值的影响较大 对中位值的影响较小 二 格鲁布斯法将测定值由小至大排列 其中可疑值为x1或xn 先计算该组数据的平均值和标准偏差 再计算统计量g 若x1可疑 3 21 若xn可疑 3 21a 根据置信度和测定次数查表 若g gp n可疑值对相对平均值的偏离较大 弃去可疑值 反之则保留 在运用格鲁布斯法判断可疑值的取舍时 由于引入了t分布中最基本的两个参数己和s 故该方法的准确度较q法高 因此得到普遍采用 表3 4gp n值表测定次数置信度 p 测定次数置信度 p n95 99 n95 99 31 151 15122 292 5541 461 49132 332 6151 671 75142 372 6661 821 94152 412 7171 942 10162 442 7582 032 22172 472 7992 112 32182 502 82102 182 41192 532 85112 232 48202 562 88 三 显著性检验显著性检验 用统计的方法检验测定值之间是否存在显著性差异 以此推断它们之间是否存在系统误差 从而判断测定结果或分析方法的可靠性 常用的有t检验法和f检验法 一 t检验法 样本平均值与真值的比较t检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异 从而对分析方法的准确度作出评价 当检验一种分析方法的准确度时 采用该方法对某标准试样进行数次测定 再将样本平均值与标准值t进行比较 则置信区间的定义可知 经过n次测定后 如果以平均值为中心的某区间已经按指定的置信度将真值t包含在内 那么它们之间就不存在显著性差异 根据t分布 这种差异是仅由随机误差引起的 若t tp f 说明与t之差已超出随机误差的界限 按照相应的置信度判断它们之间存在显著性差异 如置信度定得过低 容易将随机误差引起的差异判断为显著性差异 如置信度定得过高 又可能将系统误差引起的不一致认同为正常差异 从而得出不合理的结论 在定量分析中 常采用0 95或0 90的置信度 显著水平 具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平 用 表示 即这些测定值位于一定置信度所对应的随机误差界限之外 如置信度p 0 95 则显著水平 0 05 即 1 p 例1 用标准方法平行测定钢样中磷的质量分数4次 其平均值为0 087 设系统误差已经消除 且 0 002 1 计算平均值的标准偏差 2 求该钢样中磷含量的置信区间 置信度为p 0 95 解 1 2 已知p 0 95时 u 1 96 根据 例2 标定hcl溶液的浓度时 先标定3次 结果为0 2001mol l 0 2005mol l和0 2009mol l 后来又标定2次 数据为0 2004mol l和0 2006mol l 试分别计算3次和5次标定结果计算总体平均值 的置信区间 p 0 95 解 标定3次时 标定5次时 例3 测定某试样中sio2质量分数得s 0 05 若测定的精密度保持不变 当p 0 95时 欲使置信区间的置信限 问至少应对试样平行测定多少次 解 根据式 3 19 和题设得 已知s 0 05 故 查表3 2得知 当f n 1 5时 t0 95 5 2 57 此时 即至少应平行测定6次 才能满足题中的要求 5 4有效数字及其应用主要内容 有效数字有效数字的修约规则有效数字的运算法则 引言 科学实验中 为了得到准确的测量结果 不仅要准确地测定各种数据 而是还要正确地记录和计算 分析结果的数值不仅表示试样中被测成分含量的多少 而且
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 救援技师考试题库及答案
- 电工考试的实操电路题及答案
- 国际组织视角下的兽药残留风险分析与管理策略探究
- 全国教师笔试试题及答案
- 2025年自考审计学试题及答案
- 2025年保护环境知识竞赛题库及答案
- 青岛市幼师考编笔试题及答案
- 青岛地铁招聘笔试题库及答案
- 前端面试笔试题及答案
- 2025年岗位模拟主管护师考试试题及答案
- 2024年无锡工艺职业技术学院公开招聘辅导员笔试题含答案
- 高压氧治疗脑卒中
- 2025年三峡银行考试真题及答案
- 2025年度哈尔滨市平房区纪委监委公开招聘雇员2人考试参考题库及答案解析
- 10KV变电送受电安全作业方案
- 2025年江西省高考化学试卷真题(含答案)
- 海上作业安全培训教学课件
- 2025年ARVR行业研究报告及未来行业发展趋势预测
- 【初中数学】单项式与单项式相乘(课件)+华东师大版(2024)数学八年级上册
- 情绪管理课2025年职场压力释放与心灵成长分析报告
- 交管12123驾驶证学法减分考试题库和答案
评论
0/150
提交评论