误差与数据处理_第1页
误差与数据处理_第2页
误差与数据处理_第3页
误差与数据处理_第4页
误差与数据处理_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章,分析化学中的误差与数据处理,3.1 分析化学中的误差3.2 有效数字及其运算规则3.3 分析化学中的数据处理3.4 显著性检验3.5 可疑值取舍3.6 回归分析法3.7 提高分析结果准确度的方法,3.1 分析化学中的误差,3.1.1 误差与偏差,1. 真值(xT)(True value),(1) 理论真值:化合物的理论组成等。,分析化学中的真值:,物理量本身具有的客观存在的真实数值。未知,(2) 约定真值: 国际计量大会定义的单位, 如长度、质量、物质的量等; 国际原子量委员会修订的相对原子质量等。例:1983年国际计量会议上通过的光速米的定义,“1米是光在真空中 299 792 458分之一秒时间内所传播的距离。”,(3) 相对真值(标准值):采用可靠的分析方法,在不同的经认证的实验室,由不同分析人员对同一试样(标准试样)进行反复多次测定所获得的大量分析数据的统计结果。,2. 平均值,3. 误差(Error) : 表示准确度高低的量,个别测定的误差为:,测定结果的绝对误差(absolute error),测定结果的相对误差(relative error),4. 偏差(deviation) 表示精密度高低的量,当平行测定次数不多时,常用相对平均偏差表示分析结果的精密度。相对平均偏差小,精密度高。,5),当平行测定次数较多时,常用标准偏差或相对标准偏差表示分析结果的精密度。标准偏差小,精密度高。,(6)极差(R):又称全距或范围误差,3.1.2 准确度与精密度,准确度(accuracy) :准确度表征测量值与真值 的符合程度。准确度用误差表示。,重现性 (repeatability): 同一分析人员在同一条件下所得分析结果的精密度,再现性 (reproducibility): 不同分析人员或不同实验室之间在各自的条件下所得分析结果的精密度,精密度(precision):精密度表征平行测量值 的相互符合程度。精密度用偏差表示。,准确度与精密度的关系例:甲、乙、丙、丁 四个分析工作者对同一铁标样(Fe= 50.36 %)中的铁含量进行测量,结果如图示,比较其准确度与精密度。,49.00 49.50 50.00 50.50 51.00,表观准确度高,精密度低,准确度高,精密度高,准确度低,精密度高,准确度低,精密度低,结论1. 精密度高,准确度不一定就高。2. 精密度是保证准确度的前提。,无系统误差时,可用精密度表达测定结果的准确度,3.1.3 系统误差与随机误差,系统误差 (systematic error): 某种固定的因素造成的误差。,随机误差 (random error):不定的因素造成的误差,过失误差 (Gross error, mistake):由疏忽或差错导致,一旦发生, 必须重做实验。,系统误差与随机误差的比较,3.1.4 公差 生产部门对结果误差允许的一种限量。3.1.5 误差的传递,Study by yourself,3.2 有效数字及其运算规则,3.2.1 有效数字 (Significant figures),有效数字:用来表示量的多少,同时反映测量准确程度的数字。即指实际能测得的数字,其最后一位是可疑的。,例: 滴定管读数 27.58 mL,分析天平读数 0.4891 g,移液管读数 25.00 mL,有效数字的意义及位数,1. 记录和计算时根据方法及仪器的准确度确定有效数字的位数,且只有最后一位是可疑的数字(或不定数字)。,如:1.85730.0001g(分析天平) 五位,1.860. 1g(百分之一天平) 三位,2. 有效数字的位数直接与测定的相对误差有关。有效数字位数越多,越准确,但超出准确度的范围,过多的位数毫无意义。,如:0.0001/ 1.8573 = 0.005%,0.01 /1.86 = 0.5%,6),不定位,2 .50103 mg 三位 定位,3. “0”的双重作用。,如: 0.02030,有效数字,定位作用,2.50 g,4. pH、pM、pK、lgK等对数的小数部分代表有效数字(一般保留两位),整数部分只说明方次,即定位作用。 如: pH 12.68 H+ 2 .110-13mol/L 定位 两位,2500 mg,5. 数据首位8时,乘除运算时有效数字可多算一位 如:9.37(接近10.00 ),可当作四位有效数字,6. 倍数或分数的有效数字可视为无限多位。,7. 表示准确度和精密度时,各种误差一般只保留一位至多两位有效数字(因误差值本身均很小)。,8. 化学平衡中的有关计算(如求平衡状态下某一离子的浓度)一般保留两位或三位有效数字。,3.2.2 数字的修约规则,四舍六入,五成双,如:将以下有效数字修约为4位,7.2375,7.234,7.238,注: 0以偶数计,7.2305,7.230,7.23451 7.23459,7.235,7.2345,待修约的5后面有非0的数字时,全部进一位,一次性修约不能分次修约,3.2.3 运算规则,如计算 AgCN 的相对分子量。已知原子量为: Ag:107.87; C: 12.011; N: 14.007.,=107.87+12.01+14.01,107. 8 7,14. 0 0 7,12. 0 1 1,MW = 107.87 + 12.011 + 14.007,加减法:以绝对误差最大的数值为准进行修约(即以小数点后位数最少的数据为准),先修约再加减。,可疑数字,=133.89,乘除法:修约时以相对误差最大的数值为准进行修约(即以有效数字位数最少的数据为准),先修约再乘除。,例:以甲基橙作指示剂,用0.1089 mol/L盐酸溶液滴定一含有Na2CO3的碱样,甲基橙由黄色变为橙色时,消耗盐酸9.35 mL,与盐酸反应的Na2CO3质量是多少克?,解:,= 0.05396 g,4位有效数字,3.3 分析化学中的数据处理,总体(母体):,样本(子样):自总体中随机抽取的一组测量值,样本容量:样本中所含测量值的数目,考察对象的全体,例:分析某土壤样品800 g(总体),从中称取6份试样平行分析,得到6个分析结果,这一组分析结果即是该土壤样品总体中的一个随机样本,样本容量为6。,3.3.1 随机误差的正态分布,测定某一合金样品中铁的含量,获得100个平行测量数据,1. 频率分布,测定值频率密度直方图,测定值的正态分布曲线,两个特点,(1) 离散特性,(2) 集中特性,总体标准偏差,总体平均值,总体平均偏差,x,2. 正态分布(高斯GAUSS分布),测量值正态分布N (, 2) 的概率密度函数,y 概率密度,x 随机测量值, 表示无限次测量值集中的趋势, 表示无限次测量分散的程度,x- 随机误差,随机误差的正态分布,测量值的正态分布,x-,0,7),随机误差的概率统计规律,1. x = 时,y 值最大,说明误差为零的测量值出现的概率最大,即大多数测量值集中在算术平均值附近。2、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。3、正误差出现的概率与其绝对值相等的负误差出现的概率相等。,标准正态分布曲线N(0, 1) : 用u和概率密度表示的正态分布曲线,引入新变量u的原因:用N(, 2)计算 “某取值范围的误差”出现的概率很麻烦,标准正态分布曲线形状与大小无关,即不同曲线皆合为一条,即,标准正态分布N(0, 1)概率密度函数,随机误差的区间概率,正态分布曲线与横坐标-到之间所夹的面积代表全部数据出现概率的总和,即,u取不同值进行积分,求得的面积,即为测量值或随机误差在某一区间出现的概率。为方便使用,将不同u值对应的积分值制成表(正态分布概率积分表),查表即可获得测量值或随机误差在某一区间出现的概率。,由于积分上下限不同,表的形式有很多种,为了区别,在表上方一般绘图说明表中所列值是什么区间的概率。 表3-2中列出的面积与图中阴影部分相对应,其值即是随机误差在此区间的概率,若是求u区间的概率,利用正态分布的对称性,必须乘以2。,P57表32,随机误差,P57 例7:按照正态分布求x在区间 出现的概率。,解:,查表3-2,u=-0.5时,面积为0.1915 u=1.5时,面积为0.4332,所以, x在区间 出现的概率为:,19.15%+43.32%=62.47%,3.3.2 总体平均值的估计,设有一样品,m 个分析工作者对其进行分析,每人测 n 次,计算出各自的平均值,这些平均值的分布也符合正态分布,试样总体,样本1样本2样本m,平均值的总体标准偏差,1. 平均值的标准偏差,单个样本的平均值,m个样本的平均值,有限次测量平均值的标准偏差,1.增加测量次数可以提高精密度,2. 增加过多的测量次数的代价不一定能从减小误差得到补偿,结论:,一般平行测定24次;要求较高时,可测定59次。,概率,区间大小,例:平行测定某矿石样品3次,测得钨的平均 百分含量为20.41,把握相对大,把握相对小,100%的把握,少量实验数据的统计处理 (总体)平均值的置信区间,无意义,1) t分布,无限次测量,有限次测量 (n ,则 之间存在显著性差异, 即 不仅由随机误差引起,也包含系统误差的贡献。,假设不存在系统误差,那么:,例1:某化验室测定某样品中CaO的含量,得如下结果: 。已知该样品中CaO的标准含量为30.43%,问此测定有无系统误差? ( = 0.05) 。,解:,比较:,说明 和T 有显著差异,此测定有系统误差。,例2:在用氯丁二烯氯化生产二氯丁二烯时,产品中总有少量的三氯丁二烯杂质存在。分析表明,杂质的平均含量为1.60%。改变条件进行试生产,每5小时取样1次,共取6次,测定杂质含量分别为1.46%、1.62%、1.37%、1.71%、1.52%和1.40%。问改变反应条件后,产品中杂质含量与改变前有明显差异吗? ( = 0.05) 。,解:,比较:, F表,说明s1与s2差异显著; 否则,s1与s2之间不存在显著性差异。,2. t 检验检验两组数据的平均值 有无显著性 差异,1) 计算合并标准偏差和t值,2) 查 t, f (P61表3-3), 其中fn1n22, 若t计算 t, f ,则说明两组平均值有显著性差异,3.5 可疑值(异常值)的检验,步骤:,1) 挑出可疑值,2) 用剩下的数据计算,3) 计算,4) 比较,若 ,舍去可疑值,2. Q检验法,1) 按大小顺序排列测量数据,2) 计算R值 ( R=xmax- xmin ),3) 计算可疑值与相邻值之差的绝对值d,4) 计算Q值,5) 查Q表值 ( P68表3-6 ),6) 比较,若Q计算 Q表, 舍去可疑值。,例题:测定碱灰总碱量(%Na2O)得到5个数据,按其大小顺序排列为40.02,40.12,40.16,40.18,40.20。判断是否有应舍弃的数据?(置信度为90%)。,解:,查表: n = 5时 , Q0.90 = 0.64,最有可能舍去的数据是40.02,R = 40.20-40.02,d = 40.12-40.02,没有应舍去的数据,3.6 回归分析法 (linear regression),例:分光光度法,A,比尔定律:,=K,c,一定条件下,K是常数,线性方程:A = 0.031 + 0.005c,标准曲线,相关系数:r = 0.9911,9),1. 一元线性回归方程及回归直线,a值与b值的估计根据最小二乘法原理,最佳的回归线应是各观测值yi 与回归直线的误差的平方和(Q)最小。,一元线性回归方程:y = a + bx,(x1, y1)(x2, y2)(x3, y3)(x4, y4),y1,x1,其中:,2. 相关系数 (Correlation coefficient ),1. 当两个变量存在完全的线性关系,r =1。,2. 当两个变量完全不存在线性关系,r =0。,用于检验回归直线是否有意义,3. 当0 r计算 r表, 两变量间线性相关性显著,回归直线有意义。,步骤一 分别将标准溶液浓度及对应的信号值输入A列(x轴)和B列(y轴),3. Excel线性拟合方法,步骤二,1. 用鼠标选中数据区域,2. 点击“图表向导”,图表向导,步骤三,选择散点图,然后点击“下一步”、“完成”,步骤四,用鼠标将箭头移动到图形中的一个数据点,然后点击鼠标右键,选择“添加趋势线”,步骤五,点击 “选项”,步骤六,勾选“显示公式”和“显示R平方”,点击“确定”,步骤七,将试样溶液的信号值(y)代入线性方程计算试液中目标分析物浓度(x)。,3.7提高分析结果准确度的方法,1. 选择合适的分析方法,分析方法选择的依据1. 测定的具体要求,待测组分性质、含量范围2. 了解共存状况,选择合适的分离富集方法3. 考虑准确度、灵敏度的要求4. 实验条件、测定成本及实验时间等,2. 减小测量误差,常量分析一般要求: Er 0.1%,称量: 分析天平的读数误差,一次称量 Ea = 0.0002 g,滴定: 体积读数误差,一次滴定 Ea = 0.02 mL,例:以CaCO3为基准物质标定EDTA的浓度,若EDTA的浓度约为0.01 mol/L,当要求测量的相对误差0.1%时,基准物质应该称大样还是称小样?

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论