《计算化学》-计算化学-第1章_第1页
《计算化学》-计算化学-第1章_第2页
《计算化学》-计算化学-第1章_第3页
《计算化学》-计算化学-第1章_第4页
《计算化学》-计算化学-第1章_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.1误差1.1.1误差的定义误差是指测量值与真值之差,误差可表不为测量值偏离真值的程度,也可以反映测量值的不确定度。1.1.2误差的来源误差必然存在于一切科学实验和测量过程中,这一点已被科学工作者所公认。误差的来源比较广泛,总体来说可以分为测量装置误差、环境误差、方法误差、入员误差、数据处理误差等几大类。1.测量装置误差测量装置误差包括标准器误差、仪器误差、附件误差、结构误差、调整误差、变化性误差等六种。下一页返回1.1误差2.环境误差许多仪器设备对使用环境都有较为严格的要求,如对温度、湿度、噪声、灰尘、加速度、电磁场、气压、光、震动等。如果使用仪器设备的环境与要求的环境状态不一致,就会引起环境误差。3.方法误差方法误差是由于测量方法不完善,对标准方法进行了某些省略或测量所依据的理论不完善而引起的。4.入员误差测量入员操作过程中一些主观因索引起的误差这些主观因索包括测量入员的心理和生理索质、感觉能力、读数习惯、操作技术水平等。下一页返回上一页1.1误差5.数据处理误差很多测量在取得数据后,须对其进行整理、计算才能取得最终结果,在这个过程中经常碰到下列问题:①常数的取值问题,如e,π等。②有些函数无法直接求值,须通过近似计算才能得到结果,如在积分计算中常用的辛普森积分法。下一页返回上一页1.1误差1.1.3误差的类型1.绝对误差测量值x与真值μ0之差称为绝对误差,即绝对误差=x-μ0测量值大于真值时误差为正数,表不结果偏高;反之,误差为负数时表不结果偏低。2.相对误差绝对误差与真值之比称为相对误差一般用百分率表示。

相对误差(%)=当真值为末知时,可用多次重复测定结果的算术平均值代替μ0,相对误差量纲为1。下一页返回上一页1.1误差3.系统误差系统误差是在测量过程中绝对值与符号保持恒定,或遵循一定规律变化的误差。例如,随样品或试剂用量的大小按比例进行变化。系统误差有一定的指向,例如称量一种吸湿性物质,其误差总是正值。对系统误差的处理办法是发现和掌握其规律性,然后尽量避免和消除。根据系统误差的规律性,可以将其分为恒定系统误差、线性规律变化系统误差、周期性变化系统误差和复杂规律系统误差。下一页返回上一页1.1误差4.随机误差在实际测量条件下,多次测量同一量时,在极力消除或改正一切明显的系统误差之后,每次测量的结果仍会出现无规律的误差,这种误差称为随机误差,也叫偶然误差。随机误差单个地看是无规律性的,但就其总体来说,由于正负有相消的机会,随着变量个数的增加,误差的平均值将趋近于零这种抵偿正是统计规律的表现,所以随机误差是可以用概率统计来处理的。5.粗大误差粗大误差就是超出在规定条件下预期的误差。它是一种与事实不符的误差,主要是测试入员粗心大意、过度疲劳或者操作不正确引起的,如读错刻度尺、对错了标记、记录错误、计算错误等。另外,当实验条件末达到预想的指标时匆忙实验也会带来粗大误差。含有粗大误差的测定值一般为坏值或者异常值,所有的异常值都应该剔除。下一页返回上一页1.1误差1.1.4精密度和准确度误差表不测量的不精密度和不准确度,即不确定度。精密度和准确度是两个不同的概念。精密度(precision)是指在确定的条件下,将测试方法实施多次,所得结果的一致程度。精密度的大小常用偏差表T。在分析化学中,也常用重复性(repeatability)和再现性(reproducibility)来表T精密度。重复性是指同一操作者,在相同的条件下,获得一系列结果之间的一致程度;再现性是指不同的操作者,在不同条件下,用相同的方法获得的单个结果之间的一致程度。准确度表不测量值与真值的偏离程度,常用误差表不准确度的大小。如由4个学生用浓度准确为0.1mol/L、的盐酸滴定浓度准确为0.1mol/L、的氢氧化钠,氢氧化钠的体积准确为10.00mL每个学生重复测量5次,其结果示于表1.1。下一页返回上一页1.1误差由表1.1可见.学生A尽管测试结果重复性较好,即精密,但是准确性较差(A的均值为10.10mL),所有结果均偏高,这是由系统误差所致。学生B的测试落到准确值的两侧,其均值为10.01mL此结果较准确,但精密度较差,主要是受到了偶然误差的影响学生C的测量值中既有偶然误差的影响,又有系统误差的影响,所以既不精密,也不准确。只有学生D的测试结果比较精密(范围为9.97~10.04mL),又比较准确(均值为10.01mL)。下一页返回上一页1.1误差1.1.5偶然误差的传递1.线性加和如分析结果y为各步骤测量值a,b和c等的线性组合,即式中,和等为常数。则加和或差值的标准偏差是各测量值方差加和的平方根下一页返回上一页1.1误差如滴定中,移液管的初值和终值分别为3.51mL、和15.67mL,其标准偏差均为0.02mL,则用去滴定液的体积及标准偏差分别为由此例说明,线性组合后的标准偏差大于单个测量值的标准偏差,但小于各测量的标准偏差之和。下一页返回上一页1.1误差2.乘除表达式若分析结果y的表达式为

y=kab/cd式中,a,b,c,d为各步骤的测定量;k为常数。则相对标准偏差有如下关系下一页返回上一页1.1误差如荧光的量子产率可用下式计算式中,I0为入射光强度,I0=0.5%;If为荧光强度,If=20%;e为摩尔收,e=1%;c为浓度,c=0.2%;L为液槽长度,L=0.2%;k为仪器常数。则Φ的相对标准偏差为由此可见,最终结果的相对标准偏差略大于上述分量中具有最大相对标准偏差的那个分量(If)。这一结果给我们的启不是,若拟提高测试的精度,则首先应该设法改善具有最大相对标准偏差的那个分量的测试精度。上一页下一页返回1.1误差另外,对于某一量的乘方,如则y的相对标准偏差为因为b和b^n不是分别独立的量。上一页下一页返回1.1误差3.其他函数若y是x的函数y=f(x)则x和y的标准偏差具有如下关系如某溶液的吸收值A为光透过率的函数

A=-lgT上一页下一页返回1.1误差若T的测定值为0.501,标准偏差为0.001,则A的值及其dA/dT分别为由此可得A的标准偏差为上一页下一页返回1.1误差1.1.6系统误差的传递1.线性组合如分析结果y是测定量a,b,c的线性组合,测定量a,b,c中的系统误差分别为△a,△b,△c,则分析结果y中的系统误差△y为上一页下一页返回1.1误差2.乘除表达式如分析结果y可以用各步骤的测定量a,b,c,d乘除来表示,即y可以表示为y=kabc/d则相对系统误差为同样,若则y的相对系统误差为上一页下一页返回1.1误差3.其他函数系统误差和偶然误差具有类似的表达式,即上一页返回1.2基础统计学概念1.总体、个体和样本在数理统计中把研究对象的全体称为总体(母体),而把组成总体的每个单位称为个体。为了对总体的分布规律进行各种研究,就必须对总体进行抽样观测,根据抽样观测的结果来推断总体的性质,从总体中随机抽取若干个体的集合称为样本。样本中所含个体的数目称为样本容量在分析化学中,样本也称为试样。下一页返回1.2基础统计学概念2.均值和标准偏差在统计学中对某试样进行,了次测定,每次的测量结果记为xi,则称表达式所代表的数值称为试样的均值。均值也称平均值或者期望值,常用表示。总体的均值常用μ表示。若无系统偏差,μ则为真值。若进行n次测定,其均值为,则是μ的估计。上一页下一页返回1.2基础统计学概念标准偏差是一种量度数据分布的分散程度的标准,用以衡量数据值偏离均值的程度。标准偏差越小,这些值偏离平均值就越少。同样,若总体的标准偏差为σ,样本容量为n的样本标准偏差为s,则s为σ的估计当n趋于无穷大时,s将趋近于σ。s的表达式为标准偏差可以用来表征测定结果对于均值(期望)的离散程度,但不能指不这些数据的分布情况。在数理统计分析学中一般用直方图(或频谱图)表征数据的分布情况。如对某一溶液进行50次测定,其均值为0.50μg/mL。其中,0.46μg/mL出现1次,0.47μg/mL,出现3次,0.48μg/mL出现5次,0.49μg/mL出现10次等。将每一测定值出现的频率对测定值作图即为直方图(或频谱图)。上一页下一页返回1.2基础统计学概念3.平均值的标准偏差将一组独立重复测定值进行平均时一部分偶然误差相互抵消,使平均值带有的误差比原测定值要小。平均值的标准偏差又称“标准误差”.与单次测量值的σ之间的关系为故标准误差是服从N(μ,)的正态分布。上一页下一页返回1.2基础统计学概念4.正态分布在数学上常用正态分布(即高斯分布)来描述某试样的总体式中,x为试样测量值;p为测量值的概率密度。正态分布具有如下重要性质(图1.1):①数据关于产为对称分布;②σ值越大,数据的离散程度越大;③样本值落入任意区间(a,b)的概率记为p(a<x<b),等于线段x=a,x=b和曲线组成的面积,即上一页下一页返回1.2基础统计学概念经计算,样本落入μ±σ的范围内约为总体的68%;落入μ±2σ的范围内约为总体的95%;落入μ±3σ,的范围内约为总体的99.7%(图1.2)。在分析化学中,绝大多数情况下的测量符合正态分布。上一页返回1.3区间估计区间估计(intervalestimation)是从点估计值和抽样标准误差出发,按给定的概率值建立包含待估计参数的区间。在前面的介绍中对于总体参数即均值(期望值)和方差的估计仅是参数的近似值,而与参数的真值可能会存在差异。因此,在一定的要求下,估计出末知参数的一个数值范围,即确定一个区间,使这一区间内包含参数真值的概率达到我们预先所要求的程度,这就是参数的区间估计问题。1.3.1允许区间允许区间是对总体而言的。μ±zσ区间内的分布曲线称为覆盖域,以P表示,它由z值所规定。在有限次测定中用样本的和s分别代替总体的μ和σ时,由于和s是随样本而异的随机变量,致使由选定的k值所组成的±ks区间也是随机的,即对覆盖域难以进行定量。但是在选择P和k的同时再加一个出现P值的概率γ,便能回答所需要的问题。如欲知使覆盖率不小于P的可能性为γ应该取什么k值,表1.2给出了常用的P和γ及对应的k值。下一页返回1.3区间估计由给定P和k值组成的样本区间±k(P,γ)、称为统计允许区间。例如,从同一批产品小包装中随机抽样10个测定某组分的质量分数,得=15.32%和s=0.24%,若以90%的把握估计至少为99%的产品的质量分数,可以从表1.2查出y=0.90,P=0.99,n=10时k值为3.959,由此计算得到允许区间为15.32=3.959X0.24到15.32+3.959X0.24,即由14.37%~16.27%。这个答案是,如果产品中某组分的质量分数遵从正态分布,便能以90%的把握断定99%的产品中该组分质量分数在14.37%~16.27%区间。上一页下一页返回1.3区间估计1.3.2总体均值的置信区间估计根据正态分布的性质我们可以对总体均值定义一范围了±.此范围称为置信区间.而称为置信限。置信限的意义是当一置信度(也称置信概率)即一确定的概率被指定之后.则总体均值将落在置信区间之内。置信区间的大小依赖于所指定的确定性(置信概率p),确定性越大.所需的置信区间也越大例如:通常.我们习惯于采用置信概率为99%的置信区间上一页下一页返回1.3区间估计事实上.我们并不知道σ。但当测定次数n足够大时.在计算中常用标准偏差s代替σ。如某溶液中硝酸根离子50次测量的均值为0.50μg/mL,s=0.00165μg/mL.则其95%的置信区间为当n不够大时.则由s代替σ所引进的误差将较大。此时计算置信区间可用式(1.1)表示。式中.t为置信因子[由W.S.戈塞特于1908年提出.也称学生分布(来自戈塞特的笔名Student),t可由t值表查到];α为显著性水平;f为自由度.f=n-1。上一页下一页返回1.3区间估计另外.式(1.1)中t分布依赖于自由度(n-1)。自由度为计算s中独立偏差的个数.在此情况下为(n-1)。因为所以只要(n-1)个为已知.则第n个可由式(1.2)计算出。某些t值列于表1.3中。由表1.3看出.当n>50时.t将非常接近于1.96(对应于置信概率95%)和2.58(对应于置信概率99%)。这就证明了上述硝酸根离子浓度计算中所做假设(即用s代替σ)的正确性。如用离子选择性电极进行尿中钠离子的测量.结果(单位为mmol)分别为102,97,98,99,101,106.试分别计算置信概率为95%和99%的置信区间。上一页下一页返回1.3区间估计自由度=6-1=5.由表1.3可知对应于置信概率95%和99%的t值分别为2.57和4.03,6次测量均值为100.5mmol.标准偏差为3.27mmol.故得和上一页返回1.4结果的表示测量结果都是包含误差的近似数据.在其记录、计算时应以测量可能达到的精度为依据来确定数据的位数和取位。如果参加计算的数据位数取少了.就会损害其测量结果的精度并影响计算结果的应有精度;如果位数取多了.易使入误认为测量精度很高.且增加了不必要的计算工作量。测量结果最常用的表不方式是均值和标准偏差。前者表征测试量的大小.后者表征测试量的精密度。1.4.1有效数字的定义一般而言.对一个数据取其可靠位数的全部数字加上第一位可疑数字.就称为这个数据的有效数字。一个近似数据的有效位数是该数中有效数字的个数.指从该数左方第一个非零数字算起到最末一个数字(包括零)的个数.它不取决于小数点的位置。下一页返回1.4结果的表示与之有关的是有效位的取舍。所谓有效位是指某种测量所达到的精度如下列测试值:10.09,10.11,10.09,10.10,10.12.其均值为10.102.标准偏差为0.0130。但测试值仅准确到小数点后面第一位.而第二位为可疑位.故结果的表示为但也有研究者建议表示为式中的下标是为避免信息的丢失而加的。另外.对于小数点后面数字的取舍一般遵循“四舍五入”的规则。但有研究者建议."5”的入或舍.应使它前一位数成为与“5”最接近的偶数.如9.65应为9.6.而9.75应为9.8。依此类推。上一页下一页返回1.4结果的表示1.4.2有效数字与不确定度的关系有效数字的末位是估读数字.存在不确定性。一般情况下不确定度的有效数字只取一位.其数位即是测量结果的存疑数字的位置;有时不确定度需要取两位数字.其最后一个数位才与测量结果的存疑数字的位置对应。由于有效数字的最后一位是不确定度所在的位置.因此有效数字在一定程度上反映了测量值的不确定度(或误差限值)。测量值的有效数字位数越多.测量的相对不确定度越小;有效数字位数越少.相对不确定度就越大可见.有效数字可以粗略反映测量结果的不确定度。上一页返回1.5置信区间的其他应用置信区间可以用于系统误差的测试。如一分光光度计对其标准溶液在某一波长处测试.其吸收值为0.470。现在进行9次测定.均值=0.461.标准偏差s=0.003,置信度若为95%.则由于0.470并不落在所得置信区间范围内.所以仪器有系统误差。置信区间还可用于试样的测定。如有一大批药物的片剂.欲知片剂的质量.则不可能对每片一一称量。另外.若想知道片剂的组分及其质量分数.特}!l是采用破坏性分析方法.如原子吸收.则也不可能对每片药物进行分析。在这种情况下.可从中取出试样.测得均值和标准偏差.继而得到测定量的置信区间。返回1.6显著性检验抽样实验会产生抽样误差.对实验资料进行比较分析时.不能仅凭两个结果(均值或标准偏差)的不同就作出结论.而是要进行统计学分析.鉴另of出两者差异是由抽样误差引起的.还是由特定的实验处理引起的。同样.在实际应用中仅估计总体的值还不够.常‘常需要说明总体的某种性质.例如两个样本的均值差异是否显著到不能代替同一总体。这里包括工艺改变后产品质量有无显著变化.两种分析方法测定结果是否一致等问题。该类统计推断都是先提出假设.然后按照某种逻辑在一定概率上做出是否有显著性差异的判断。下一页返回1.6显著性检验1.6.1显著性水平显著性检验离不开预设的小概率.如正态分布的测量值落到区间[μ±2σ]以外的概率小于0.05,落到区间[μ±3σ]以外的概率小于o.01。在概率论中.小概率的原则是:如果一个事件发生的概率很小.那么在一次实验中.实际上可把它看成不可能发生的事件。如果某个小概率事件竞然发生了.则认为这是一反常现象。小概率越小就越显得异常.所以此小概率在显著性检验中称为显著性水平α。α反映的是显著差异的程度.通常α在0.05以下便认为是显著。上一页下一页返回1.6显著性检验1.6.2检验检验是有关于某事件发生频率的测试。我们用一具体例子来说明这种方法的原理。例如.由实验室中4位工作者打破玻璃器皿的件数.用检验他们的可信度有无区别。打破件数:24,17,11,9。若做H0假设.则认为他们之间可信赖度无区间.就是说在同一段时间内.他们打破玻璃器皿的件数是相同的。由于打破的总件数为61,所以对于每位工作者打破器皿的期望值为61/4=15.25现在我们拟得到的答案是观测值与期望值是否有显著性差别为此.进行如下计算:上一页下一页返回1.6显著性检验其中.O-E列的加和恒等于0.故可做计算中的校验。若超出一定的临界值.则拒绝H0假设。在此例中.自由度为4-1=3.若α=0.05.则由的分布表可知的临界值为7.81.计算值大于查表值.说明4位工作者的可信赖度确有区别。上一页下一页返回1.6显著性检验作为检验的应用.观测总数要大于或等于50次.而个体重复次数不应低于5。另外.检验可用于检验总体方差是否正常。但总体方差σ要已知。运用时首先计算出统计量然后查分布表,并将查表值与计算值进行比较·以判断某批产品正常与否。上一页下一页返回1.6显著性检验1.6.3t检验运用t分布在前面已述及下面介绍该种分布的其他一些应用1.两套实验平均值的比较将t用于显著性检验可判断两套实验均值是否有显著性差别。设两套实验的均值分别为和.若做假设H0.即假设两种方法所得均值没有差别.在判断中.首先由单一标准偏差s1和s2做综合标准偏差的计算:上一页下一页返回1.6显著性检验t值的计算为式中.n1和n2分别为两试样的容量。t的自由度为n1+n2-2,如果t≥t(a,f),则否定原假设.即两种方法所得结果有显著性差异。t(a,f)为显著性水平α、自由度f的查表值。如用两种方法测定植物中的硼,结果如下:分光光度法(μg/g)均值=28.0;标准偏差=0.3荧光光度法(μg/g)均值=26.0;标准偏差=0.23n1=n2=10上一页下一页返回1.6显著性检验为判别两种方法所得结果是否有显著性差异,则首先计算则上一页下一页返回1.6显著性检验自由度为18.若α=0.05.查表得t(a,f)的临界值为2.1。由于实验的t值大于t(a,f)(临界值).故拒绝原假设。换言之.两种方法所得结果有显著性差异。另外.该种检验还可用于实验条件改变时对结果产生的影响。如食物中Sn的测定可在HCI介质中进行蒸馏,对应于不同的蒸馏时间,其结果为上一页下一页返回1.6显著性检验对于这两种时间.均值和方差分别为上一页下一页返回1.6显著性检验做Ho假设.即蒸馏时间对测定结果无影响.方差总值为以及此例中自由度为10.若α=0.05.t的临界值为2.23。由于实验的t小于t的临界值.所以接受原假设.即煮沸时间的长短对Sn的回收无明显影响。

上一页下一页返回1.6显著性检验在前面的计算中.事实上假设两种方法或在不同条件下的方差大体上是相等的。若此假定不合理.t值的计算可采用式(1.3)。自由度的计算为其值取其最临近的整数。上一页下一页返回1.6显著性检验如风湿病入和对照组血中硫醇浓度(mmol/L)如下:对照组1.84,1.92,1.94,1.92,1.85,1.91,2.07风湿病入2.81,4.06,3.62,3.27,3.27,3.76由此,可计算得到依照式(1.4).计算的自由度为5.若取a=0.01.查得t的临界值为4.03。实验t值大于t的查表值.否定原假设.即风湿病入血中硫醇的浓度与对照组(正常入)有显著差别。上一页下一页返回1.6显著性检验2.实验均值与已知值的比较为了判断实验均值.与真值μ是否有显著性差别,与上类同,一将方程重写为然后由实验数据可计算t值。若|t|>t(α,f).则放弃Ho假设。同样.t(α,f)由查表得到。上一页下一页返回1.6显著性检验如用冷蒸气原子吸收法测定某标样中的汞.已知汞的质量分数为38.9%.其测试值为38.9%,37.4%,37.1%。由此可得平均值为37.8%.标准偏差为0.964%。做Ho假设.即设定无系统误差.则利用式(1.6)可计算t值当自由度为2时,查t值分布表可得t(α,f)=4.3(a=0.05)。由于|t|<t临界,Ho假设为真,即无明显的系统误差。上一页下一页返回1.6显著性检验若沿用上述算法直接比较两种方法的均值是不合适的.因为测试结果的差异有可能是由试样不同所致。在此情况下.可以采用同一试样两个测试结果进行比较的方法。如上述数据.对应试样的差值分别为-5,-7,2,3.这些差值的均值=-1.75;差值的标准偏差s=4.99。由于差值的期望值μ=0,所以t的自由度为n-1=3.取α=0.05.查表得t值为3.18,t的实验值为-0.70,|t|<t(a,f).故两种方法测得Pb的质量分数的均值没有显著性差别。上一页下一页返回1.6显著性检验1.6.4F检验F检验主要用于两套数据方差的比较。有两种情况:①我们希望知道是否方法A比方法B更精密(单尾检验);②拟知道方法A与方法B的精密度上有否差别(双尾检验)。在第一种情况下是假定方法A不会比方法B精密;在第二种情况下.比较的是两种方法的相对精密度。假若我们希望测试一种新的方法是否比已有的标准方法更精密.则用单尾检验;假若我们希望比较两种标准偏差是否有显著性差异.则用双尾检验。F检验的表达方式为在式(1.7)中.应使F≥1.即大者为分子.小者为分母上一页下一页返回1.6显著性检验如测定废水中的氧(n1=n2=8).其结果如下:试问.新方法的精密度是否明显高于标准方法?对于此问题可以采用单尾F检验在两种情况下均测定8次.所以自由度均为7。若a=0.05.查表(单尾)得F的临界值为3.787由于计算值大于该临界值.故可得新方法比标准法具有更高精密度的结论。上一页下一页返回1.6显著性检验再如第1.6.3节中硼的测定。两种方法的测定次数均为10.即自由度均为9.标准偏差分别为0.30和0.23若采用F检验显然.在此种情况下为双尾检验。查双尾F分布表所得临界值为4.026(a=0.05)计算值小于临界值.说明两种方法的标准偏差没有显著性差别必须指出.在进行双尾检验时.若使用的F分布表为单尾.则显著性水平a应为双尾a的1/2.如上例.a应为0.025而不是0.05。上一页返回1.7坏值的剔除在实际测量、实验

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论