误差与分析数据处理-分析化学-02复习过程_第1页
误差与分析数据处理-分析化学-02复习过程_第2页
误差与分析数据处理-分析化学-02复习过程_第3页
误差与分析数据处理-分析化学-02复习过程_第4页
误差与分析数据处理-分析化学-02复习过程_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

误差与分析数据处理-分析化学-02§2.3有限数据的统计处理

2.3.1集中趋势和分散趋势的表示2.3.2平均值的置信区间2.3.3显著性检验2.3.4离群值的取舍2.3.5误差的传递2.3.6标准曲线及线性回归§2.4提高分析准确度的方法

2.4.1减小测量误差2.4.2控制随机误差2.4.3消除系统误差§2.5有效数字§2.6分析测试的质量保证

2.6.1测试过程中的质量保证2.6.2有效测量系统

2.1.1准确度与精密度准确度Accuracy准确度表征测量值与真实值的符合程度。准确度用误差表示。精密度precision精密度表征平行测量值的相互符合程度。精密度用偏差表示。

2.1.1准确度与精密度准确度与精密度的关系例:A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。36.0036.5037.0037.5038.00测量点平均值真值DCBA表观准确度高,精密度低准确度高,精密度高准确度低,精密度高准确度低,精密度低(不可靠)准确度与精密度的关系结论:1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。2.1.2误差与偏差误差(Error):表示准确度高低的量。对一B物质客观存在量为T的分析对象进行分析,得到n个个别测定值x1、x2、x3、•••xn,对n个测定值进行平均,得到测定结果的平均值,那么:个别测定的误差为:测定结果的绝对误差为:测定结果的相对误差为:2.1.2误差与偏差真值T(Truevalue)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:1、理论真值(如化合物的理论组成)2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精度的测量值)例如,标准样品的标准值2.1.2误差与偏差偏差(deviation):表示精密度高低的量。偏差小,精密度高。偏差的表示有:偏差di极差R标准偏差S相对标准偏差(变异系数)CV具体定义和计算在后续内容中介绍。平均偏差2.1.3系统误差与随机误差系统误差(Systematicerror)—某种固定的因素造成的误差。随机误差(Randomerror)—不定的因素造成的误差过失误差(Grosserror,mistake)系统误差与随机误差的比较项目系统误差随机误差产生原因固定的因素不定的因素分类方法误差、仪器与试剂误差、主观误差性质重现性、单向性(或周期性)、可测性服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数系统误差的校正方法系统误差——方法校正主观系统误差——对照实验(外检)仪器系统误差——对照实验试剂系统误差——空白实验系统误差与准确度Biasandaccuracy测量值的误差:可以写成:注:系统误差systematicerror或者bias对单一测量值:误差=随机误差+系统误差Error=randomerror+bias由足够多的单一测量求得的“稳定”的平均值:绝对误差=系统误差系统误差与准确度Biasandaccuracy无限次测量求平均值,得到的总体平均值绝对误差=总体平均值–真值=系统误差误差的分配系统误差=实验室系统误差+方法系统误差注:实验室系统误差指单一实验室内重复测量所表现出的系统误差。有j个实验室对同一样品进行分析,每个实验室得到i个测量值,将单一测量值表示为xij实验室1实验室2……实验室j误差分配示意图单一实验室的误差分配实验室间误差分配随机误差再现性Reproducibitity重现性

Repeatability

正态分布的实验室内随机误差正态分布的实验室系统误差方法系统误差正态分布的实验室内随机误差方法系统误差+实验室系统误差实验室1实验室2……实验室j2.2.1频率分布No分组频数(ni)频率(ni/n)频率密度(ni/ns)115.8410.0050.17215.8710.0050.17315.9030.0150.51415.9380.0401.35515.96180.0913.03615.99340.1725.72716.02550.2789.26816.06400.2026.73916.09200.1013.371016.12110.0561.851116.1550.0250.841216.1820.0100.341316.2100.0000.00厦门大学的学生对海水中的卤素进行测定,得到:74.24%88.38%数据集中与分散的趋势海水中卤素测定值频率密度直方图海水中卤素测定值频率密度分布图测量值与随机误差的正态分布测量值正态分布N(,2)的概率密度函数:1=0.047

2=0.023xy概率密度x个别测量值总体平均值,表示无限次测量值集中的趋势。总体标准偏差,表示无限次测量分散的程度。x-随机误差随机误差的正态分布测量值的正态分布0x-总体标准偏差相同,总体平均值不同总体平均值相同,总体标准偏差不同原因:1、总体不同2、同一总体,存在系统误差原因:同一总体,精密度不同测量值和随机误差的正态分布体现了随机误差的概率统计规律:1、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。2、正误差出现的概率与负误差出现的概率相等。3、x=时,y值最大,体现了测量值的集中趋势。集中的程度与有关。结论:增加平行测量次数可有效减小随机误差。平均值标准正态分布曲线N(0,1)令:正态分布函数转换成标准正态分布函数:68.3%95.5%99.7%u随机误差的区间概率|u|面积|u面积|u面积|u面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.49870.5000正态分布概率积分表(部分数值)正态分布概率积分表(部分数值)|u|面积|u面积|u面积|u面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.49870.50000.5000.19151.5000.43322.5000.4938返回例题22返回例题21随机误差出现的区间u(以为单位)测量值出现的区间概率%(-1,+1)(-1,+1)68.3(-1.96,+1.96)(-1.96,+1.96)95.0(-2,+2)(-2,+2)95.5(-2.58,2.58)(-2.58,+2.58)99.0(-3,+3)(-3,+3)99.7测量值与随机误差的区间概率例题2-1:(1)解:查表:u=1.5时,概率为:20.4332=0.866=86.6%(2)解:查表:u>2.5时,概率为:0.5–0.4938=0.0062=0.62%一样品,标准值为1.75%,测得=0.10,求结果落在(1)1.750.15%概率;(2)测量值大于2%的概率。86.6%0.62%P½a½aP+a=1a

显著性水平P置信度有限数据的统计处理总体样本甲样本容量平均值500g乙平行测定3次平行测定4次丙平行测定4次有限数据的处理:计算估计显著性检验没有系统误差,=T有系统误差,

T2.3.1数据集中趋势和分散程度的表示数据集中趋势的表示:对一B物质客观存在量为T的分析对象进行分析,得到n个个别测定值x1、x2、x3、•••xn,平均值Average:中位数Median:有限次测量:测量值向平均值集中无限次测量:测量值向总体平均值集中——对和的估计数据分散程度的表示极差RRange相对极差R偏差Deviation平均偏差Meandeviation相对平均偏差relativemeandeviation标准偏差standarddeviation相对标准偏差(变异系数)Relativestandarddeviation(Coefficientofvariation,CV)总体标准偏差与标准偏差的比较总体标准偏差:标准偏差:无限次测量,对总体平均值的离散有限次测量对平均值的离散自由度:计算一组数据分散度的独立偏差数自由度的理解:例如,有三个测量值,求得平均值,也知道x1和x2与平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独立的变数。平均值的标准偏差设有一样品,m

个分析工作者对其进行分析,每人测n

次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。试样总体样本1样本2……样本m平均值的总体标准偏差:对有限次测量:对有限次测量:1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。结论:测量次数2.3.2总体平均值的置信区间——对的区间的估计对一样品分析,报告出:估计问题:例如在

的某个范围内包含的把握有多大?无限次测量:对有限次测量1、把握程度,多少把握2、区间界限,多大区间置信水平Confidencelevel置信度

DegreeofconfidenceProbabilitylevel置信区间Confidenceinterval置信界限Confidencelimit必然的联系平均值的置信区间的问题这个问题涉及两个方面:总体平均值的置信区间概率区间大小例:

包含在

包含在把握相对大把握相对小100%的把握无意义包含在复习区间概率的概念1、对一个样品进行无限次测定,可以得到和,测量值和随机误差遵从正态分布规律。2、若用u表示随机误差,可得到一个随机误差的标准正态分布;3、根据随机误差的标准正态分布,可求得随机误差出现在某一区间的概率,根据u的定义,也可求出x出现在某一区间的概率。1=0.047

2=0.023x0x-

随机误差测量值±u区间概率与置信区间例2-2:查表得:若用单次测量值来估计的区间:这是一个在一定置信度下总体平均值的置信区间的问题,是说有95%的把握说包含在的范围内。则有:这是一个区间概率的问题,是说测量值落在范围内的概率为95%。即:实际分析工作中通常是以样本平均值估计总体平均值是说有一定的把握说包含在的范围内。1、t分布曲线无限次测量,得到:u分布曲线有限次测量,得到:st分布曲线t分布值表自由度f=(n-1)显著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.850.671.651.962.58P=1-,置信度,显著性水平返回例题2-4返回例题2-31返回例题2-32返回例题2-56次测量,随机误差落在±2.57范围内的概率为95%。无限次测量,随机误差落在±1.96范围内的概率为95%。2、置信区间有限次测量:服从自由度f

的t

分布时:t代入,得改写为:置信度为(1-)100%的的置信区间为也写成:是说当测定n次时,有一定的把握说总体平均值包含在的范围里。例题2-3分析铁矿中的铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25(%)。(1)计算此结果的平均值、中位值、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。(2)求置信度分别为95%和99%的置信区间。解(1):续解(1):分析结果:解(2):求置信度分别为95%和99%的置信区间。置信度为95%,即1-=0.95,=0.05,查表:t0.05,4=2.78的95%置信区间:(1)的结果:置信度为99%,即1-=0.99,=0.01,查表:t0.01,4=4.60的99%置信区间:结论置信度高,置信区间大。区间的大小反映估计的精度,置信度的高低说明估计的把握程度。总体标准偏差已知情况下的总体平均值的置信区间常规例行分析,每天进行,可认为n,是已知的,t分布还原为u分布,总体平均值的置信区间为:例如,比较总体标准偏差已知与未知情况下的总体平均值的置信区间置信度为95%,t0.05,4=2.78未知置信度为95%,u0.05=1.96已知2.3.3显著性检验SignificantTest问题的提出:(1)对含量真值为T的某物质进行分析,得到平均值,但;(2)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值,但;是由随机误差引起,或存在系统误差?显著性检验显著性差异非显著性差异系统误差校正随机误差正常显著性检验1.平均值与标准值的比较t检验法假设不存在系统误差,那么:是由于随机误差引起的,测量误差应满足t分布,根据计算出的t值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。t检验法的方法1、根据计算出t值。2、给出显著性水平或置信度3、将计算出的t值与表上查得的t值进行比较,若表示落在为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。习惯上说表明有系统误差存在。例题2-4某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:问此测定有无系统误差?(给定=0.05%)解:查表:比较:说明和T有显著差异,此测定有系统误差。假设:=Tu检验法u检验法与t检验的不同在于用u分布,而不是用t分布。例题2-5:某炼铁厂生产的铁水,从长期经验知道它的碳含量服从正态分布,T为4.55%,为0.08%。现在又生产了5炉铁水,其碳含量分别为4.28%,4.40%,4.42%,4.35%,4.37%。试问均值有无变化?(给定=0.05%)解:假设:=T查表:比较:结论:平均值比原来的降低了。注意:得到这个结论的前提是:测试是可靠的,测试过程不存在系统误差。2、两组平均值的比较两个实验室对同一标样进行分析,得到:和假设不存在系统误差,那么:是由于随机误差引起的,应满足自由度f=(n1+n2–2)的t分布,两组平均值的比较的方法1、F检验法检验两组实验数据的精密度S1和S2之间有无显著差异:查表:精密度无显著差异。2、t检验确定两组平均值之间有无显著性差异3、查表:4、比较:非显著差异,无系统误差具体计算见教材的例题。置性度95%时部分F值(单边)

置信度90%时部分F值(双边)

f大f小23456219.0019.1619.2519.3019.3339.559.289.129.018.9446.946.596.396.166.0955.795.415.195.054.9565.144.764.534.394.282.3.4异常值的检验Outlierrejection异常值的检验方法:1、法(1)将可疑值除外,求其余数据的平均值和平均偏差;(2)求可疑值x与平均值之间的差的绝对值;(3)判断舍弃。统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差有下列关系=0.7979

0.80

4

3,偏差超过4的测量值可以舍弃。2、Q检验法Dixon’sQ-test(1)将测量的数据按大小顺序排列。(2)计算测定值的极差R。(3)计算可疑值与相邻值之差(应取绝对值)d。(4)计算Q值:(5)比较:舍弃。舍弃商Q值测定次数n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49例题2-6:测定碱灰总碱量(%Na2O)得到6个数据,按其大小顺序排列为40.02,40.12,40.16,40.18,40.18,40.20。第一个数据可疑,判断是否应舍弃?(置性度为90%)。解:查表:n=6,Q表=0.56舍弃。3、格鲁布斯Grubbs)法(1)将测量的数据按大小顺序排列。(2)设第一个数据可疑,计算或设第n个数据可疑,计算(3)查表:T计算>T表,舍弃。1、系统误差的传递ki为常数设分析结果Y由测量值A、B、C计算获得,测量值的系统误差分别为A、B、C,标准偏差分别为sA、sB、sC。2.3.5误差的传递PropagationofError要点:误差传递的方式取决于误差的性质(系统误差或随机误差),取决于分析结果与测量值之间的化学计量关系(计算方式)。2、随机误差的传递设分析结果Y由测量值A、B、C计算获得,测量值的系统误差分别为A、B、C,标准偏差分别为sA、sB、sC。3、极值误差例题2-7设天平称量时的标准偏差s=0.10mg,求称量试样时的标准偏差。解:称一个样需读两次平衡点,例题2-8滴定管的初读数为(0.05±0.01)mL,末读数为(22.10±0.01)mL,问滴定剂的体积可能在多大范围内波动?解:极值误差V=0.01+0.01=0.02滴定剂体积为:(22.10-0.05)0.02mL=22.050.02mL2.36标准曲线及线性回归No.标样浓度g/L吸收值15.000.045210.00.093320.00.140430.00.175540.00.2366试样0.200问题:1、每个测量值都有误差,标准曲线应怎样作才合理?2、应怎样估计线性的好坏?线性回归Linearregression1、每个测量值都有误差,标准曲线应怎样作才合理?——线性回归问题最小二乘法methodofleastsquares设对y作n次独立的观测,得到一系列观测值。一元线性回归方程表示为:根据最小二乘法的原理,最佳的回归线应是各观测值yi与相对应的落在回归线上的值之差的平方和(Q)为最小。

yiyx令:解得:

其中:相关系数Correlationcoefficient相关系数的定义为:2、应怎样估计线性的好坏?——相关系数的问题判断一元回归线是否有意义,可用相关系数来检验。相关系数的物理意义3.当

R的值在0与1之间时,可根据测量的次数及置信水平与相应的相关系数临界值比较,绝对值大于临界值时,则可认为这种线性关系是有意义的。1.

当所有的yi值都在回归线上时,R=1。yxR=1xyR=-12.

当y与x之间不存在直线关系时,R=0。xyR=0例题2-9

f=n-20.100.050.010.00110.9880.9970.99980.99999920.9000.9500.9900.99930.8050.8780.9590.991相关系数的临界值表(部分)做了一条工作曲线,测量次数n=5,R=0.920,因变量与自变量之间有无相关性(置信度95%)?解:f=5–2=3,=0.05,查表R0=0.878,R>R0,有相关性2.4提高分析结果准确度的方法2.4.1减小测量误差称量分析天平的绝对误差Ei=0.0001g一次称量Ea=0.0002g常量分析Er<0.1%,滴定体积读数Ei=0.01mL一次滴定Ea=0.02mL常量分析Er<0.1%,例题2-10用返滴定法测定某酸,为了保证测定的准确度,加入足够过量的40.00mL0.1000mol.L-1NaOH,再用浓度相近的HCl返滴定,消耗39.10mL,有同学报告结果为10.12%,对不对?答:不对。实际与样品作用的碱的体积为:V=40.00–39.10=0.90(mL)测量精度:结果精度:结果精度>测量精度,不合理。2.4.2减小随机误差——增加测量次数1、检查有无系统误差——对照实验(1)标样对照(2)标准方法对照显著性检验有无系统误差(3)标准加入法2.4.3消除系统误差测定显著性检验有无系统误差消除系统误差空白实验仪器校正方法校正2.5有效数字Significantfigures1、有效数字的定义Significantfigures---allthedigitsknownwithcertaintyplusthefirstuncertaindigit.有效数据——实际能测得的数据,其最后一位是可疑的。例:滴定管读数28.56mL分析天平读数0.2080g最后一位为估计值2、数字的修约四舍六入,五成双3、运算规则依据的原则是误差传递加减法:是各个数值绝对误差的传递,修约时以绝对误差最大的数值为准进行修约。乘除法:是各个数值相对误差的传递,修约时以相对误差最大的数值为准进行修约。Calculatethemolarmass(MW)ofHNO3;atomicmassare:H:1.00797;N:14.0067;O:15.9994.MW=1.00797+14.0067+47.9982=63.01287≈63.0129gmol-1Calculatethemolarconcentrationofa70%HNO3solutionwhosedensityis1.413kgL-1C=1.413×0.70×1000/63.0129=15.6967≈16molL-12.6分析测试的质量保证

QualityAssurance(QA)质量评定标准参考物质试验室内部评定控制图试验室之间对比联合测试统计分析质量保证试验室各项规章制度校正标准化仪器设备的维护保养教育和训练质量控制2.6.1测试过程中的质量保证样品测量过程样品数据质量评定合格/应用质量控制SRMSRM数据QC样品QC样品数据技术标准SRM,StandardReferenceMaterial,标准参考物质QC,QualityControl,质量控制分析测试质量保证的目的降低测量误差到允许的程度。为得到可靠的数据尽量减少工作量。改善实验室之间数据可比性的基础。提供统计学基础,以作出评价。2.6.2有效测量系统

MeaningMeasurementSystem在国家与国家、工业部门之间、买主与卖主之间,实际上总是存在着两个以上部门之间的测量。要想测量有实际意义,对于一个客观存在量的测量,各部门的测量结果应在一个实用限度内是一致的,精密的,没有系统误差

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论