误差与分析数据的处理ppt课件_第1页
误差与分析数据的处理ppt课件_第2页
误差与分析数据的处理ppt课件_第3页
误差与分析数据的处理ppt课件_第4页
误差与分析数据的处理ppt课件_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,1,分析化学教程,第二章分析数据处理及分析测试的质量保证,.,2,第二章分析数据处理及分析测试的质量保证,2.1有关误差的一些基本概念2.1.1准确度与精密度2.1.2误差与偏差2.1.3系统误差与随机误差2.1.4系统误差与准确度2.2随机误差的分布2.2.1频率分布2.2.2正态分布2.2.3随机误差的区间概率,要点,.,3,2.3有限数据的统计处理2.3.1集中趋势和分散趋势的表示2.3.2平均值的置信区间2.3.3显著性检验讨论2.3.4离群值的取舍2.3.5误差的传递2.3.6标准曲线及线性回归2.4提高分析准确度的方法2.4.1减小测量误差2.4.2控制随机误差2.4.3消除系统误差,.,4,2.5有效数字2.6分析测试的质量保证2.6.1取样的质量保证2.6.1取样的质量保证2.6.2分析过程的质量控制2.6.3标准物质2.6.4标准方法2.6.5质量评定内部质量评定外部质量评定2.6.6实验室认证,讨论,.,5,2.1.1准确度与精密度准确度Accuracy准确度表征测量值与真实值的符合程度。准确度用误差表示。精密度Precision精密度表征平行测量值的相互符合程度。精密度用偏差表示。,.,6,2.1.1准确度与精密度,准确度与精密度的关系例:A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。,36.0036.5037.0037.5038.00,表观准确度高,精密度低,准确度高,精密度高,准确度低,精密度高,准确度低,精密度低,(不可靠),.,7,准确度与精密度的关系,结论:,1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。,.,8,2.1.2误差与偏差,误差(Error):表示准确度高低的量。,对一B物质客观存在量为T的分析对象进行分析,得到n个个别测定值x1、x2、x3、xn,对n个测定值进行平均,得到测定结果的平均值,那么:个别测定的误差为:,测定结果的绝对误差为:,测定结果的相对误差为:,.,9,2.1.2误差与偏差,真值T(Truevalue)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:,1、理论真值(如化合物的理论组成)(如,NaCl中Cl的含量)2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精度的测量值)(例如,标准样品的标准值),.,10,2.1.2误差与偏差,偏差(deviation):表示精密度高低的量。偏差小,精密度高。偏差的表示有:偏差di,极差R标准偏差S相对标准偏差(变异系数)CV,具体定义和计算在后续内容中介绍。,平均偏差,.,11,2.1.3系统误差与随机误差,系统误差(Systematicerror)某种固定的因素造成的误差方法误差、仪器误差、试剂误差、操作误差随机误差(Randomerror)不定的因素造成的误差仪器误差、操作误差过失误差(Grosserror,mistake),.,12,系统误差与随机误差的比较,.,13,系统误差的校正,方法系统误差方法校正主观系统误差对照实验校正(外检)仪器系统误差对照实验校正试剂系统误差空白实验校正,如何判断是否存在系统误差?,.,14,系统误差与准确度Biasandaccuracy,测量值的误差:,可以写成:,注:系统误差systematicerror或者bias,对单一测量值:,误差=随机误差+系统误差,Error=randomerror+bias,由足够多的单一测量求得的“稳定”的平均值:,绝对误差=系统误差,.,15,系统误差与准确度Biasandaccuracy,无限次测量求平均值,得到的总体平均值,绝对误差=总体平均值真值=系统误差,系统误差影响结果的准确度,误差的分配,.,16,误差的分配,系统误差=实验室系统误差+方法系统误差,注:实验室系统误差指单一实验室内重复测量所表现出的系统误差。,有j个实验室对同一样品进行分析,每个实验室得到i个测量值,将单一测量值表示为xij,实验室1,实验室2,实验室j,.,17,误差分配示意图,.,18,2.2.1频率分布,学生对海水中的卤素进行测定,得到,数据集中与分散的趋势,.,19,海水中卤素测定值频率密度直方图,海水中卤素测定值频率密度分布图,问题,测量次数趋近于无穷大时的频率分布?,测量次数少时的频率分布?,某段频率分布曲线下的面积具有什么意义?,.,20,测量值与随机误差的正态分布,测量值正态分布N(,2)的概率密度函数,1=0.047,2=0.023,x,y概率密度,x个别测量值,总体平均值,表示无限次测量值集中的趋势。,总体标准偏差,表示无限次测量分散的程度。,x-随机误差,随机误差的正态分布,测量值的正态分布,0 x-,.,21,总体标准偏差相同,总体平均值不同,总体平均值相同,总体标准偏差不同,原因:,1、总体不同,2、同一总体,存在系统误差,原因:,同一总体,精密度不同,.,22,测量值和随机误差的正态分布体现了随机误差的概率统计规律,1、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。2、正误差出现的概率与负误差出现的概率相等。3、x=时,y值最大,体现了测量值的集中趋势。集中的程度与有关。,结论:增加平行测量次数可有效减小随机误差。,x,.,23,标准正态分布曲线N(0,1),令:,正态分布函数转换成标准正态分布函数:,.,24,随机误差的区间概率,正态分布概率积分表(部分数值),.,25,测量值与随机误差的区间概率,.,26,正态分布概率积分表(部分数值),.,27,例题2-1,(1)解,查表:u=1.5时,概率为:20.4332=0.866=86.6%,(2)解,查表:u2.5时,概率为:0.50.4938=0.0062=0.62%,一样品,标准值为1.75%,测得=0.10,求结果落在(1)1.750.15%概率;(2)测量值大于2%的概率。,86.6%,P,a,a,p+a=1,a显著水平P置信度,.,28,有限数据的统计处理,总体,样本,甲,样本容量,平均值,500g,乙,平行测定3次,平行测定4次,丙,平行测定4次,有限数据的处理:,计算,估计,显著性检验,没有系统误差,=T,有系统误差,T,.,29,2.3.1数据集中趋势和分散程度的表示,数据集中趋势的表示:对一B物质客观存在量为T的分析对象进行分析,得到n个个别测定值x1、x2、x3、xn,,平均值Average,中位数Median,有限次测量:测量值向平均值集中,无限次测量:测量值向总体平均值集中,对和的估计,.,30,数据分散程度的表示,极差RRange,相对极差R,偏差Deviation,平均偏差Meandeviation,相对平均偏差relativemeandeviation,标准偏差standarddeviation,相对标准偏差(变异系数)Relativestandarddeviation(Coefficientofvariation,CV),.,31,总体标准偏差与标准偏差的比较,总体标准偏差,标准偏差,无限次测量,对总体平均值的离散,有限次测量对平均值的离散,自由度,计算一组数据分散度的独立偏差数,自由度的理解:例如,有三个测量值,求得平均值,也知道x1和x2与平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独立的变数。,.,32,平均值的标准偏差,设有一样品,m个分析工作者对其进行分析,每人测n次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。,试样总体,样本1样本2样本m,平均值的总体标准偏差,对有限次测量,.,33,对有限次测量:,1、增加测量次数可以提高精密度。,2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。,结论:,.,34,2.3.2总体平均值的置信区间,对的区间的估计,对一样品分析,报告出:,问题:,例如,在的某个范围内包含的概率有多大?,无限次测量,对有限次测量,1、概率,2、区间界限,多大区间,置信水平Confidencelevel,置信度DegreeofconfidenceProbabilitylevel,置信区间Confidenceinterval,置信界限Confidencelimit,必然的联系,这个问题涉及两个方面:,.,35,总体平均值的置信区间,例:,包含在区间,几率相对大,几率相对小,几率为100%无意义,平均值的置信区间的问题,.,36,1.对一个样品进行无限次测定,可以得到和,测量值和随机误差遵从正态分布规律。2.若用u表示随机误差,可得到一个随机误差的标准正态分布.3.根据随机误差的标准正态分布,可求得随机误差出现在某一区间的概率,根据u的定义,也可求出x出现在某一区间的概率。,随机误差,.,37,1、t分布曲线,无限次测量,得到,有限次测量,得到,s,t分布曲线,u分布曲线,.,38,t分布值表,P=1-,置信度,,显著水平,返回例题2-4,返回例题2-31,返回例题2-32,返回例题2-5,.,39,t分布值表,还原为u分布,单位为,单位为,.,40,2、置信区间,有限次测量,服从自由度f的t分布,时,t代入,得,改写为,置信度为(1-)100%的的置信区间为,或,.,41,区间概率与置信区间,例2-2,查表,若用单次测量值来估计的区间:,这是一个在一定置信度下总体平均值的置信区间的问题,是说在区间有95%的可能包含。,则,这是一个区间概率的问题,是说测量值落在范围内的概率为95%。,即,实际分析工作中通常是以样本平均值估计总体平均值,是说在区间有95%的可能包含,总体标准偏差未知时,,总体标准偏差已知例行分析,.,42,例题2-3,分析铁矿中的铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25(%)。(1)计算此结果的平均值、中位值、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。(2)求置信度分别为95%和99%的置信区间。,解(1)解题过程,分析结果,.,43,例题2-3解(1),.,44,例题2-3续解(1),分析结果:,.,45,解(2)求置信度分别为95%和99%的置信区间。,置信度为95%,即1-=0.95,=0.05,查表,t0.05,4=2.78,的95%置信区间:,(1)的结果,置信度为99%,即1-=0.99,=0.01,查表,t0.01,4=4.60,的99%置信区间,结论,.,46,结论,置信度高,置信区间大。区间的大小反映估计的精度,置信度的高低说明估计的把握程度。,.,47,总体标准偏差已知情况下的总体平均值的置信区间,常规例行分析,每天进行,可认为n,是已知的,t分布还原为u分布,总体平均值的置信区间为:,比较总体标准偏差已知与未知情况下的总体平均值的置信区间,置信区间概念的应用,.,48,置信区间概念的应用-0,对某海区沉积物中的油份进行分析,已知测量的精度(sd)显著优于采样的精度(ss)。为使分析误差不超过1ss,问至少应采集多少个样?(置信度95%),循环法,以t0.05,=1.96为起点,n1=3.844,n1=4,t0.05,3=3.18,得n2=10.111,n2=11,t0.05,10=2.23,得n35,n3=5,t0.05,4=2.78,得n48,n4=8,t0.05,7=2.37,得n56,n5=6,t0.05,5=2.57,得n67,n6=7,t0.05,6=2.45,得n76,至少取7个样,尚未考虑采样精度也是n的函数,,.,49,置信区间概念的应用-1,对某海区沉积物中的油份进行分析,已知测量的精度(sd)显著优于采样的精度(ss)。经初步试验得6.50.55g/g。为使分析的相对误差不超过5%,问至少应采集多少个样?(置信度95%),R=5%,根据题意,t与n有关,采用循环法,以t0.05,=1.96为起点,n1=11,t0.05,10=2.23,得n2(2.23)22.86=14.2215,n2=15,t0.05,14=2.15,得n3(2.15)22.86=13.2214,n3=14,t0.05,13=2.16,得n4(2.16)22.86=13.3414,.,50,置信区间概念的应用-2,方法的总体标准偏差为已知,一位分析化学家被要求测定一批市售果汁中的铅。客户指出铅含量的量级为100g/kg,并要求5g/kg的准确度和95%的置信水平。假定在所要求的浓度水平下所用的分析方法的精密度为8g/kg,计算满足这些要求所需的样品数。,.,51,2.3.3显著性检验SignificantTest,(1)对含量真值为T的某物质进行分析,得到平均值,(2)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值,问题:是由随机误差引起,或存在系统误差?,显著性差异,非显著性差异,校正,正常,显著性检验,但,但,.,52,1.平均值与标准值的比较,t检验法,假设不存在系统误差,那么,是由随机误差引起的,测量误差应满足t分布,,根据计算出的t值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。,t检验法的方法,1、根据算出t值;,2、给出显著性水平或置信度,3、将计算出的t值与表上查得的t值进行比较,若,习惯上说表明有系统误差存在。,表示落在为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。,.,53,例题2-4,某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:,问此测定有无系统误差?(给定=0.05),解,查表,比较:,说明和T有显著差异,此测定有系统误差。,假设:=T,.,54,u检验法,u检验法与t检验的不同在于用u分布,而不是用t分布。,例题2-5:,某炼铁厂生产的铁水,从长期经验知道它的碳含量服从正态分布,T为4.55%,为0.08%。现在又生产了5炉铁水,其碳含量分别为4.28%,4.40%,4.42%,4.35%,4.37%。试问均值有无变化?(给定=0.05),解,假设:=T,查表,比较:,结论:均值比原来的降低了。(表明生产过程有差异),问题:如果分析方法存在系统误差,这个结论可靠吗?,.,55,2、两组平均值的比较,两个实验室对同一标样进行分析,得到:,和,假设不存在系统误差,那么:,是由于随机误差引起的,应满足自由度f=(n1+n22)的t分布,,.,56,两组平均值的比较的方法,1、F检验法检验两组实验数据的精密度S1和S2之间有无显著差异:,查表,精密度无显著差异。,2、t检验确定两组平均值之间有无显著性差异,3、查表,4、比较,非显著差异,无系统误差,具体计算见教材的例题。,.,57,置信度95%时部分F值(单边)置信度90%时部分F值(双边),.,58,2.3.4异常值的检验Outlierrejection,异常值的检验方法:,1.Q检验法DixonsQ-test,(1)将测量的数据按大小顺序排列。,(2)计算测定值的极差R。,(3)计算可疑值与相邻值之差(应取绝对值)d。,(4)计算Q值:,(5)比较:,舍弃。,舍弃商Q值,.,59,(1)将可疑值除外,求其余数据的平均值和平均偏差;,(2)求可疑值x与平均值之间的差的绝对值,(3)判断,舍弃。,统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差有下列关系=0.79790.80,43,偏差超过4的测量值可以舍弃。,Return,.,60,测定碱灰总碱量(%Na2O)得到6个数据,按其大小顺序排列为40.02,40.12,40.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论