分析化学中的数据处理.ppt_第1页
分析化学中的数据处理.ppt_第2页
分析化学中的数据处理.ppt_第3页
分析化学中的数据处理.ppt_第4页
分析化学中的数据处理.ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,3.3分析化学中的数据处理,总体 样本 数据 统计方法 样本容量n: 样本所含的个体数.,一、基本概念,2,平均值(设样本容量为n ) 总体均值 若没有系统误差,则总体平均值 就是真值xT,总体平均偏差: 在分析化学中,测量值一般较少(例如少于20,故涉及到的是测量值较少时的平均偏差;但在用统计学处理数据时,广泛采用标准偏差来衡量数据的分散程度。,3,总体标准偏差: (测量次数为无限多次时),样本标准偏差: (测量值不多时),式中(n - 1)称为自由度,以 f 表示,当测 量次数非常多时,4,偏差和标准偏差关系 例如:求下列三组数据的d 和S 第一组 10.02,10.02,9.98, 9.98 平均值= 10.00 , = 0.02,S = 0.02 第二组 10.01, 10.01, 10.02, 9.96 平均值 = 10.00 = 0.02 S = 0.027 第三组 10.02, 10.02, 9.98, 9.98, 10.02, 10.02, 9.98, 9.98 平均值 = 10.00, = 0.02, S = 0.021,5,3.3.1 随机误差的正态分布,1 频数分布 :测定某样品100次,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。,相对频数分布直方图分布特点,(1)离散特性,(2)集中趋势,6,7,测量数据一般符合正态分布规律,即高斯曲线 y:概率密度; x:测量值 :总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。 :标准偏差,反映测量值分布的分散程度; x-:随机误差,2 正态分布,8,正态分布曲线规律:,* x= 时,y值最大,体现了测量值的集中趋势 * 曲线以x=这一直线为其对称轴,说明正误差和负误差出现的概率相等 * 当x趋于或时,曲线以轴为渐近线。即小误差出现概率大,大误差出现概率小 *越大,即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。反映测量值分布分散程度,9,横坐标改为u,纵坐标为概率密度,此时曲线的形状与大小无关,不同的曲线合为一条,标准正态分布曲线,标准正态分布曲线,10,随机误差的区间概率,正态分布曲线与横坐标-到+之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即概率P为:,11,不同u值对应的积分值做成表,表3.2 正态分布概率积分表,12,随机误差出现的区间 测量值出现的区间 概率 (以为单位) u=1 x=1 68.3% u=1.96 x=1.96 95.0% u=2 x=2 95.5% u=2.58 x=2.58 99.0% u=3 x=3 99.7%,13,例1 已知某试样中质量分数的标准值为1.75%,=0.10%,又已知测量时没有系统误差,求分析结果落在(1.750.15)%范围内的概率。 解: 例2 同上例,求分析结果大于2.00%的概率。 解:属于单边检验问题。 阴影部分的概率为0.4938。整个正态分布曲线右侧的概率为1/2,即为0.5000,故阴影部分以外的概率为0.50000.4938=0.62%,即分析结果大于2.00%的概率为0.62%。,14,1.平均值的标准偏差,设有一样品,m 个分析工作者对其进行分析,每人测 n 次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。,试样总体,样本1 样本2 样本m,3.3.2 总体平均值的估计,平均值的标准偏差 一定比单个样品n次测定的s要小,15,对有限次测量:,1、增加测量次数可以提高精密度。,2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。一般34次就可以了。,结论:,平均值的总体标准偏差:,平均值的标准偏差 单次测定结果的s之间的关系,16,2 少量数据的统计处理,1 t 分布曲线 正态分布是无限次测量 数据的分布规律,而对有 限次测量数据则用t 分布曲 线处理。用s代替,纵坐 标仍为概率密度,但横坐 标则为统计量t。t定义为:,17,t分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。,t分布曲线的意义:,18,t分布曲线与标准正态分布曲线的区别,t值与u值的区别:用有限次测定的s代替了总体。 t分布曲线随f的不同而不同。 t分布曲线比正态分布曲线更“矮胖”,说明有限次测定值的分布更分散。 t积分,是先设定p,已知f,查t值,此时p对应了正负t曲线下的面积;u积分,是已知,值,求 , 再查p值。,19,平均值的置信区间,置信度P:在某一t值时,测定值落在(ts)范围内的概率。落在此范围之外的概率为(1-P),称为显著性水准。 ta,f :t值与置信度P及自由度f关系。 例: t005,10表示置信度为95%,自由度为10时的t值。 t001,5表示置信度为99%,自由度为5时的t值。,20,单次测量结果、样本平均值来估计总体平均值可能存在的区间:, 对于少量测量数据,即当 n有限时,必须根据t分布进行统计处理: 它表示在一定置信度下,以平均值为中心,包括总体平均值的可靠性范围,即平均值的置信区间。,平均值的置信区间,21,t 分布值表,22,例 对其未知试样中Cl-的质量分数进行测定,4次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为90%,95%和99%时,总体平均值的置信区间。 解:,23,24,3.4 显著性检验,1. 平均值与标准值的比较-t检验法 步骤:a.将 ,和 n代入 ,求t计 b. 由已知的f和P值查t表(表3-3,61页) c. 比较,如t计 t表,说明有显著性差异,存在系统误差。反之则无显著性差异,25,例 采用某种新方法测定基准明矾中铝的质量分数,得到下列9个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知明矾中铝含量的标准值(以理论值代)为10.77%。试问采用该新方法后,是否引起系统误差(置信度95%)? 解 n=9, f=91=8 查表,P=0.95,f=8时,t0.05,8=2.31。tt0.05,8,故x与之间不存在显著性差异,即采用新方法后,没有引起明显的系统误差。,二、F 检验法两组数据间偶然误差的检测,用于在 t 检验中两组平均值的S1和S2合并前,确定他们的精密度有无显著性差异。再进行t检验。,F检验法主要是比较两组数据的方差S2,以确定它们的精密度是否有显著的差异。,步骤: 首先计算出两个样本的标准偏差S大和S小,然后计算F值。 如果两组数据的精密度相差不大,则 与 也相差不大,即F值趋于是 1。相反,如果他们两者之间存在显著性差异,则 与 之间差别就会很大。F值一定很大,在一定的置信度及自由度的情况下,F值大于F表的值,则认为它们之间存在显著性差异。即 F Fa,f, 存在显著性差异。 P65,例12,1. 先F检验,两组数据精密度有没有差别 2. 再t检验,两组平均值的比较,不同分析人员或是同一分析人员采用不同方法分析同一试样,所得到的平均值,一般是不相等的,若要判断这两组数据之间是否存在系统误差,即两平均值之间是否有显著差异,对于这样的问题,也可以采用t 检验法。,设两组分析数据为:,S 称为合并标准偏差,总自由度f=n1+n2-2,当tt表时,可以认为有显著性差异,t t表无显著差异,30,例 用两种方法测定合金中铝的质量分数,所得结果如下: 第一法 1.26% 1.25% 1.22% 第二法 1.35% 1.31% 1.33% 1.33% 试问两种方法之间是否有显著性差异(置信度90%)? 解 n1=3, x1=1.24% s1=0.021% n2=4, x2=1.33% s2=0.017% f大=2 f小=3 F表=955 F t010,5,故两种分析方法之间存在显著性差异.,统计检验的正确顺序:,可疑数据取舍,F 检验,t 检验,32,3.5 异常值的取舍,在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。 处理方法有4 法、格鲁布斯(Grubbs)法和Q检验法。,33,(1)4 法,步骤: 排序 求出除异常值外的其余数据的平均值和平均偏差 异常值与平均值进行比较,如绝对差值大于4 ,则将可疑值舍去,否则保留。 当4 法与其他检验法矛盾时,以其他法则为准。,34,例 测定某药物中钴的含量如(g/g),得结果如下:1.25,1.27,1.31,1.40。试问1.40这个数据是否应保留? 解 首先不计异常值1.40,求得其余数据的平均值 x和平均偏差d为 异常值与平均值的差的绝对值为 |1.40一1.28|=0.124 d(0.092) 故1.40这一数据应舍去。,4d法例题,35,(2)格鲁布斯(Grubbs)法,有一组数据,从小到大排列为: x1, x2,xn-1, xn 其中x1或xn可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量T进行判断。 若T计T表(表3-5,p67),则异常值应舍去,否则应保留,36,格鲁布斯(Grubbs)法例题,例 前一例中的实验数据,用格鲁布斯法判断时,1.40这个数据应保留否(置信度95%)? 解 平均值 x=1.31, s=0.066 查表T005,4=1.46,TT005,4,故1.40这个数据应该保留。,37,(3)Q检验法,设一组数据,从小到大排列为: x1, x2,xn-1, xn 设x1、xn为异常值,则统计量Q为: Q值越大,说明xn离群越远。Q称为“舍弃商”。当Q计算Q表时,异常值应舍去,否则应予保留。,38,39,3.6 回归分析法,3.6.1 一元线性回归方程 式中x,y分别为x和y的平 均值,a为直线的截矩, b为直线的斜率,它们的 值确定之后,一元线性回 归方程及回归直线就定了。,40,2 相关系数-correlation coefficient 相关系数的物理意义如下: a.当所有的认值都在回归线上时,r= 1。 b.当y与x之间完全不存在线性关系时,r=0。 c.当r值在0至1之间时,表示例与x之间存在相关关系。r值愈接近1,线性关系就愈好。,41,例 用吸光光度法测定合金钢中Mn的含量,吸光度与Mn的含量间有下列关系: Mn的质量g 0 0.02 0.04 0.06 0.08 0.10 0.12 未知样 吸光度A 0.032 0.135 0.187 0.268 0.359 0.435 0.511 0.242 试列出标准曲线的回归方程并计算未知试样中Mn的含量。 解 此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量Mn,或者含有其它在该测量波长下有吸光的物质。 设Mn含量值为x,吸光度值为y,计算回归系数a,b值。 a=0.038 b=3.95 标准曲线的回归方程为 y=0.38+3.95x r=0.9993r99%,f 标准曲线具有很好的线性关系未知试样中含Mn 0.052g。,42,3.7 提高分析结果准确度的方法,1 选择合适的分析方法 (1) 根据试样的中待测组分的含量选择分析方 法。高含量组分用滴定分析或重量分析法;低 含量用仪器分析法。 (2) 充分考虑试样中共存组分对测定的干扰, 采用适当的掩蔽或分离方法。 (3) 对于痕量组分,分析方法的灵敏度不能满 足分析的要求,可先定量富集后再进行测定.,滴定法误差0.2%,比色法误差2% 测定Fe铁矿石(40.20%)中铁含量,滴定法的40.12-40.28%;比色法41.0-39.4%范围内。 测定含铁废水(0.40%),滴定法无法测,比色法的绝对误差为0.008%,44,2 减小测量误差 称量:分析天平的称量误差为0.0002g,为了使测量时的相对误差在0.1%以下,试样质量必须在0.2 g以上。 滴定管读数常有0.0l mL的误差,在一次滴定中,读数两次,可能造成0.02 mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20 mL以上,最好使体积在25 mL左右,一般在20至30mL之间。 微量组分的光度测定中,可将称量的准确度提高约一个数量级。,45,3 减小随机误差 在消除系统误差的前提下,平行测定次数愈多,平均值愈接近真实值。因此,增加测定次数,可以提高平均值精密度。在化学分析中,对于同一试样,通常要求平行测定(parallel determination)34次。,46,4 消除系统误差 由于系统误差是由某种固定的原因造成的, 因而找出这一原因,就可以消除系统误差 的来源。有下列几种方法。 (1) 对照试验-contrast test (2) 空白试验- blank test (3) 校准仪器 -calibrating instrument (4) 分析结果的校正-correction result,47,(1) 对照试验(检测是否有系统误差) 与标准试样的标准结果进行对照; 标准试样、管理样、合成样、加入回收法。 与其它成熟的分析方法进行对照; 国家标准分析方法或公认的经典分析方法。 由不同分析人员,不同实验室来进行对照试验。,4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论