版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章分析化学的误差与数据处理2/8/20231NWNU-DepartmentofChenistry
教学目的:了解分析化学中的误差及表示方法;能运用有效数字的运算规律,正确记录实验数据,并进行结果的计算;
学会用数理统计的方法处理实验数据,会评价分析结果的准确度和可靠性,掌握提高分析结果准确度的方法。2/8/20232NWNU-DepartmentofChenistry重点:用数理统计的方法处理实验数据,会评价分析结果的准确度和可靠性。难点:1、随机误差的正态分布规律。2、少量数据的统计处理——t分布。3.置信度和置信区间的含义。4.显著性检验及异常值的取舍。2/8/20233NWNU-DepartmentofChenistry§3.1.1误差与偏差准确度与误差1.准确度(accuracy)测定值(xi)与真实值(xT)符合的程度反映测定的正确性,是系统误差大小的量度。2.表示方法误差1)绝对误差(absoluteerror-E)E=
测定值-真实值=x-xT
(3-1a)2/8/20235NWNU-DepartmentofChenistry2)相对误差(relativeError)表示误差在真实值中所占的百分率,分析结果的准确度常用相对误差表示。
(3-1b)如:对于1000kg和10kg,绝对误差相同(±1kg),但产生的相对误差却不同。绝对误差和相对误差都有正负之分。2/8/20236NWNU-DepartmentofChenistry真值(XT)truevalue某一物理量本身具有的客观存在的真实数值。一般说来,真值是未知的,但下列情况的真值可以知道:a、理论真值,如某化合物的理论组成等;b、计量学约定真值,如国际计量大会上确定的长度、质量、物质的量单位等等;c、相对真值,认定精度高一个数量级的测定值作为低一级的测量值的真值,这种真值是相对比较而言的,如科学实验中使用的标准样品及管理样品组分的含量等。2/8/20237NWNU-DepartmentofChenistry精密度与偏差1.精密度(precision)
多次测量值(xi)之间相互接近的程度。反映测定的再现性。2.表示方法偏差1)算术平均值对同一种试样,在同样条件下重复测定n次,结果分别为:x1,x2,
xn
(3-3)2/8/20239NWNU-DepartmentofChenistry中位数(xM)median将一系列测定数据按大小顺序排列时,中间位置的数据即为中位数XM。若测定个数为偶数时,中位数为正中两个数的平均值。它的优点是求法简便,而又有直观意义,但它与两端的数据分布无关。只有在测定数据是正常地在两端均匀分布的情况下,它才能代表这个系列测定的最佳值,此时的中位值与平均值相符合。但在一般情况下,特别是测定次数较少时,平均值与中位值总是不完全符合的。2/8/202310NWNU-DepartmentofChenistry2)偏差(devoation)单次测量值与平均值之差绝对偏差。将各次测量的偏差加起来:单次测量结果的偏差之和等于零。2/8/202311NWNU-DepartmentofChenistry例1:测定钢样中铬的百分含量,得如下结果:1.11,1.16,1.12,1.15和1.12。计算此结果的平均偏差及相对平均偏差。
解:
2/8/202313NWNU-DepartmentofChenistry用表示精密度比较简单。该法的不足之处是不能充分反映大偏差对精密度的影响。2/8/202314NWNU-DepartmentofChenistry例2:用碘量法测定某铜合金中铜的百分含量,得到两批数据,每批有10个。测定的平均值为10.0%。各次测量的偏差分别为:第一批di:+0.3,-0.2,-0.4*,+0.2,+0.1,+0.4*,0.0,-0.3,+0.2,-0.3第二批di:0.0,+0.1,-0.7*,+0.2,-0.1,-0.2,+0.5*,-0.2,+0.3,+0.1试以平均偏差表示两批数据的精密度。2/8/202315NWNU-DepartmentofChenistry标准偏差
(standarddeviation)基本术语数理统计研究的对象是不确定现象。1.随机现象
个体上表现为不确定性而大量观察中呈现出统计规律性的现象。2.总体
研究对象的全体(包括众多直至无穷多个体2/8/202317NWNU-DepartmentofChenistry3.样本
自总体中随机抽出一部分样品,通过样品推断总体的性质。4.样本容量
样本中所含个体的数目。样本容量为n,其平均值为2/8/202318NWNU-DepartmentofChenistry5.总体平均值(-populationmean)
测量无限次,即n趋于时,为:若无系统误差,则就是xT。实用时,n>30,就认为=xT。2/8/202319NWNU-DepartmentofChenistry计算总体标准偏差时,对单次测定的偏差平方作用:(1)避免单次测定偏差相加时正负抵销(2)大偏差会得到放大,能更显著的反映出来,能更好地说明数据的分散程度。在实际分析测定中,测定次数一般不多,n<20,而总体平均值又不知道。一般是用抽样的方法对样品进行测定。只能用样本标准偏差反映该组数据的分散程度。总体标准偏差2/8/202321NWNU-DepartmentofChenistry8.样本标准偏差(standarddeviation)
(3-6a)f=n-1,自由度:n个测定数据能相互独立比较的是n-1个。引入n-1是为了校正以样本平均值代替总体平均值引起的误差。2/8/202322NWNU-DepartmentofChenistry样本标准偏差当测定次数非常多时,测定次数n与自由度(n-1)的区别就变小,。即
此时,S。2/8/202323NWNU-DepartmentofChenistry样本标准偏差计算S的等效公式和S公式的不同点:
S
当n
n-1nnn-12/8/202325NWNU-DepartmentofChenistry9.相对标准偏差
(relativestandarddeviation-RSD)又称变异系数(coefficientofvariation-CV)10.平均值的标准偏差m个n次平行测定的平均值:由统计学可得:2/8/202326NWNU-DepartmentofChenistry标准偏差解:2/8/202329NWNU-DepartmentofChenistry准确度(accuracy):测量值与真实值相接近的程度。用误差来评估。精密度(precision):各个测量值之间相互接近的程度。用偏差来评估。实际工作中并不知道真实值,又不刻意区分误差和偏差,习惯把偏差称做误差。但实际含义是不同的。系统误差是分析误差的主要来源,影响结果的准确度偶然误差影响结果的精密度§3.1.2准确度与精密度2/8/202330NWNU-DepartmentofChenistry甲
乙
丙
丁
分析结果准确度高,要求精密度一定要高。分析结果精密度高,准确度不一定高。精密度好,准确度不好,系统误差大准确度、精密度都好,系统误差、偶然误差小精密度较差,接近真值是因为正负误差彼此抵销精密度、准确度差。系统误差、偶然误差大真值例如,甲、乙、丙、丁四人同时测定铜合中Cu的百分含量,各分析6次。设真值=10.00%,结果如下:2/8/202331NWNU-DepartmentofChenistry准确度与精密度的关系2/8/202332NWNU-DepartmentofChenistry§3.1.3系统误差和随机误差误差分类及其产生的原因误差是分析结果与真实值之差。根据性质和产生的原因可分为三类:系统误差偶然误差过失误差2/8/202333NWNU-DepartmentofChenistry由一些固定的原因所产生,其大小、正负有重现性,也叫可测误差。1.方法误差
分析方法本身所造成的误差。2.仪器误差3.试剂误差4.操作误差
操作不当1.系统误差(systematicerror)2/8/202334NWNU-DepartmentofChenistry系统误差的性质可归纳为如下三点:1)重现性2)单向性3)数值基本恒定系统误差可以校正。随机误差由偶然因素引起的误差,所以又称偶然误差如,同一坩埚称重(同一天平,砝码),得到以下克数:
29.3465,29.3463,29.3464,29.34662.随机误差(randomerror)2/8/202335NWNU-DepartmentofChenistry对于天秤称量,原因可能有以下几种:1)天平本身有一点变动性2)天平箱内温度有微小变化3)坩埚和砝码上吸附着微量水分的变化4)空气中尘埃降落速度的不恒定偶然误差的性质:误差的大小、正负都是不固定的。偶然误差不可测误差。在消除系统误差后,在同样条件下多次测定,可发现偶然误差服从统计规律。2/8/202336NWNU-DepartmentofChenistry随机误差统计规律1)大小相等的正负误差出现的机会相等。2)小误差出现的机会多,大误差出现的机会少。随测定次数的增加,偶然误差的算术平均值将逐渐接近于零(正、负抵销)。2/8/202337NWNU-DepartmentofChenistry过失误差由于操作人员粗心大意、过度疲劳、精神不集中等引起的。其表现是出现离群值,极端值。综上所述系统误差
可校正偶然误差
可控制过失误差
可避免2/8/202338NWNU-DepartmentofChenistry§3.1.4公差(commondifference)生产部门不强调误差和偏差概念,均称误差。用公差范围表示允许误差大小如分析结果超出公差范围称超差。2/8/202339NWNU-DepartmentofChenistry3.1.5误差的传递在化学分析中,测定结果通常由多个量的量测数据计算出来的,每一个数据都有各自的误差,各别数据的误差又同时以一定的途径累积起来影响计算结果。它们究竟是怎样影响分析结果的准确度的呢?2/8/202340NWNU-DepartmentofChenistry1.系统误差的传递(1)加减法设R=计算结果A、B、C=测量的量,由它们计算出R;它们分别各有绝对系统误差为EA、EB、EC,计算结果的绝对误差为R,则计算结果与三个数据的关系式为:R=A+B-C。按误差的定义,计算结果R以及三个数据的真值应是(R+ER),(A+EA),(B+EB),(C+EC),故R+ER=(A+EA)+(B+EB)-(C+EC)也即:ER=EA+EB-EC,(7-25)分析结果的绝对误差是各测量步骤绝对误差的代数和。2/8/202341NWNU-DepartmentofChenistry如果有关项有系数,例如R=A+mB-C则为ER=EA+mEB-EC(3-8a)2/8/202342NWNU-DepartmentofChenistry例:设有三个测量数据+0.50、+4.10及-1.97,它们的系统误差分别为+0.02,-0.03及-0.05,求计算结果的系统误差。解:R=0.05+4.10-1.97=2.63ER=0.02+(-0.03)-(-0.05)=+0.042/8/202343NWNU-DepartmentofChenistry(2)乘除法若分析结果R是A,B,C三个测量值相乘除的结果,例如R=则得到(3-9a)即分析结果的相对误差是各测量步骤相对误差的代数和。如果计算公式带有系数,如同样可得到2/8/202344NWNU-DepartmentofChenistry(3)指数关系若分析结果R与测量值A有下列关系:R=mAn
其误差传递关系式为:(3-10)2/8/202345NWNU-DepartmentofChenistry(4)对数关系若分析结果R与测量值A有下列关系:R=mlgA其误差传递关系式为:ER=0.434m(3-11)2/8/202346NWNU-DepartmentofChenistry系统误差a.加减法R=mA+nB-pCER=mEA+nEB-pECb.乘除法R=mA×nB/pC
ER/R=EA/A+EB/B-EC/Cc.指数运算R=mAn
ER/R=nEA/Ad.对数运算R=mlgA
ER=0.434mEA/A3误差的传递2/8/202347NWNU-DepartmentofChenistry2.随机误差的传递偶然误差用标准偏差来衡量,但是,偶然误差不同于系统误差,误差的符号是可正可负的,正误差和负误差的出现机会相等。要用数理统计方法去研究偶然误差的传递。(1)加减法:R=A+B-C则有:(3-12a)可见分析结果的标准偏差的平方是各测量步骤标准偏差的平方的总和。证明略,见宋清《定量分析中的误差和数据评价》2/8/202348NWNU-DepartmentofChenistry(2)乘除法:R=则可得到(3-13)可见分析结果的相对标准偏差的平方是各测量步骤相对标准偏差的平方的总和。若有关项有系数,例如R=m其误差传递公式与(3-13)式相同。2/8/202349NWNU-DepartmentofChenistry(3)指数关系若关系式为R=mAn可得到
或(3-14)2/8/202350NWNU-DepartmentofChenistry(4)对数关系若关系式为R=mlgA可得到SR=0.434m(3-15)2/8/202351NWNU-DepartmentofChenistry随机误差a.加减法R=mA+nB-pC
sR2=m2sA2+n2sB2+p2sC2b.乘除法R=mA×nB/pC
sR2/R2=sA2/A2+sB2/B2+sC2/C2c.指数运算R=mAn
sR/R=nsA/Ad.对数运算R=mlgA
sR=0.434msA/A2/8/202352NWNU-DepartmentofChenistry
3.极值误差在分析化学中,通常用一种简便的方法来估计测量过程中可能出现的最大误差。这就是在最不利的情况下,各种误差都是最大的,而且互相叠加。这种误差称为极值误差。当然,这种估计不是很合理,因为这种不利情况出现的概率是很小的。但是,用这种方法来粗略估计可能出现的最大误差,在实际上仍是有用的。2/8/202353NWNU-DepartmentofChenistry如果分析结果R是A、B、C三个测量数值相加减的结果,例如R=A+B+C,则极值误差为=(3-16)如果分析结果R是A、B、C三个测量数值相乘除的结果,例如R=则极值相对误差为(3-17)2/8/202354NWNU-DepartmentofChenistry极值误差最大可能误差R=A+B-C
ER=|EA|+|EB|+|EC|R=AB/C
ER/R=|EA/A|+|EB/B|+|EC/C|2/8/202355NWNU-DepartmentofChenistry例:滴定管的初读数为(0.05±0.01)ml,末读数为(22.10±0.01)ml,问滴定剂的体积可能在多大范围内波动?解:极值误差故滴定剂体积为(22.10-0.05)±0.02=22.05±0.02ml。2/8/202356NWNU-DepartmentofChenistry例:用容量法测定矿石中铁的含量,若天平称量误差及滴定体积测量误差均为±1‰,问分析结果的极值相对误差为多少?解:矿石中铁的百分含量的计算式为只考虑m和V的测量误差,按(3-17)式,求得分析结果的极值相对误差为2/8/202357NWNU-DepartmentofChenistry3.2有效数字及其计算规则3.2.1有效数字,(significantfigures)在分析化学中是指实际能够测量得到的数字,这是由所用的测量仪器,测定方法的准确度所决定的,它是能够正确反映一定量(物理量和化学量)的数字。2/8/202358NWNU-DepartmentofChenistry有效数字位数的一般规定:(1)非零的数字都是有效数字;(2)“0”在非零数字中间的是有效数字;如:30.054位(3)“0”在非零数字前面的不是有效数字;如0.51位但0作为非有效数字时,并不意味着不重要,如有三位有效数字为1.12,0.112,0.0112,因为小数点位置不同,表示各数的误差程度也不同。1.12=1.12±0.010.112=0.112±0.0010.0112=0.0112±0.00012/8/202359NWNU-DepartmentofChenistry(4)尾部有零的大数字的有效数字位数不好确定,因此,在实际应用中要作明确的说明,如4800,用4.8×103表示,有两位有效数字,表示4800±100;用4.80×103表示时,有三位有效数字,表示4800±10;用4.800×103表示,有四位有效数字,表示4800±1。用10的乘方表示一个很大或很小的数时,习惯上用小数点前保留一位数字表示,计算有效数字位数时,只算10X以前的数字位数。2/8/202360NWNU-DepartmentofChenistry(5)π,e等自然数的有效数字位数,根据需要自由定。(6)对数、pH等,有效数字只考虑对数尾数部分的位数,不考虑定位部分,保留尾数的位数与真数有效数字位数一致。2/8/202361NWNU-DepartmentofChenistry3.2.2数字修约规则
舍去多余数字的过程称为“数字修约”。目前一般采用“四舍六入五留双”的原则。即当尾数≤4时舍去,≥6时进位。当尾数恰为5时,则看保留下来的末位数是奇数还是偶数,若为奇数时就将5进位;若是偶数时,则将5舍弃。总之,应保留“偶数”,这样可以避免舍入后数字取平均值时又出现5,而造成系统误差。2/8/202362NWNU-DepartmentofChenistry当测量值中被修约的那个数字等于5时,如果其后还有数字,则该数字总是比5大,在这种情况下,该数字以进位为宜。根据这一原则,将下列测量值修约为两位有效数字:3.1487.39760.43675.53.17.40.44763.452.45183.50093.42.584修约数字时,只允许对原测量值一次修约到所需的位数,不能分次修约。2/8/202363NWNU-DepartmentofChenistry3.23运算规则
测量数据的运算,必须遵守一定的计算规则,这一定的计算规则,是依据测定值误差对分析结果影响的规律而制定的,按照计算规则运算,可以合理地反映各测定值的准确度和精密度,得到可靠的结果。计算规则是:2/8/202364NWNU-DepartmentofChenistry1、参加运算的每一数值或运算结果,只应保留一位不确定数字;2、第一位数≥8,其有效数字可多算一位,如9.84可看成四位有效数字。在较多数据的运算过程中,运算前,各数据的有效数字可多保留一位,作为“安全数字”,计算完成后,再按规则舍弃多余的可疑数字,以防止计算过程中误差的积累。2/8/202365NWNU-DepartmentofChenistry3、加减运算结果的有效数字位数决定于各因数中绝对误差最大的数据。即它们的和或差的有效数字的保留应以小数点后位数最少的为依据。例:1.3413+21.3+2.446,绝对误差±0.0001,±0.1,±0.001,其中21.3的绝对误差最大,故有效数字保留到小数点后第一位。1.34+21.3+2.45=25.09=25.12/8/202366NWNU-DepartmentofChenistry4乘除运算其积或商的有效数字位数,以各数中相对误差最大的为依据(即有效数字位数最少的为准。)例:2/8/202367NWNU-DepartmentofChenistry0.0121的相对误差为:3.423的相对误差为:50.35的相对误差为:
246.3的相对误差为:2/8/202368NWNU-DepartmentofChenistry可见各因数中0.0121相对误差最大,有效数字位数最少。因此,积的有效数字位数也应取三位,即:0.00847。此数的相对误差为:与0.0121的相对误差相适应。正确计算方法为:2/8/202369NWNU-DepartmentofChenistry例:土壤中全氮含量一般约0.2%左右,测定结果要求相对误差为2.5%,,若试样重为0.5g左右,用0.0200mol·L-1HCl滴定,按下式计算,问试样称量及消耗HCl体积测量应准确至几位有效数字?计算公式:2/8/202370NWNU-DepartmentofChenistry解:分析结果要求相对误差2.5%,全氮量在0.2%左右时,其绝对误差为:0.2%×2.5%=(0.2×0.025)%=0.005%即分析结果应为(0.2±0.005)%有效数字应为三位。故试样称量及HCl体积至少也应有三位有效数字,即0.5克应称准至小数后第三位,2/8/202371NWNU-DepartmentofChenistry盐酸体积大约为:VHCl=3.57≈45ml的滴定管每分刻度为0.02ml,10ml的为0.05ml,都能准至小数点后第二位,而可估计至小数点后第三位,故可满足准确度要求。
2/8/202372NWNU-DepartmentofChenistry在计算分析结果时,高含量(>10%)组分的测定,一般要求四位有效数字;含量在1%~10%的一般要求三位有效数字;含量小于1%的组分只要求两位有效数字。分析中的各类误差通常取1~2位有效数字。2/8/202373NWNU-DepartmentofChenistry3.3分析化学中的数据处理近年来,分析化学中愈来愈广泛地采用统计学方法来处理各种分析数据。在统计学中,对于所考察的对象的全体,称为总体(或母体)。自总体中随机抽出的一组测量值,称为样本。样本中所含测量值的数目,称为样本大小(容量)。2/8/202374NWNU-DepartmentofChenistry例如对某批矿石中的铁含量进行分析,我们按照有关部门规定取样、细碎并缩分后,得到一定数量(例如500g)的试样供分析用。这就是分析试样,是供分析用的总体。如果我们从中称取8份试样进行平行分析,得到8个分析结果,则这一组分析结果就是该矿石分析试样总体的一个随机样本,样本容量为8。2/8/202375NWNU-DepartmentofChenistry§3.3.1随机误差的正态分布随机事件以统计形式表现的规律性称为统计规律。随机误差对测定结果的影响是服从统计规律的。1.频率分布例如有一矿石样品,在相同条件下测定Ni的百分含量。共有90个测定值,这些测定值彼此独立,属随机变量。2/8/202376NWNU-DepartmentofChenistry2/8/202377NWNU-DepartmentofChenistry为了研究测量数据分布的规律性,按如下步骤编制频数分布表和绘制出频数分布直方图,以便进行考察。1.算出极差R=1.74-1.49=0.252.确定组数和组距组数视样本容量而定,本例分成9组。2/8/202378NWNU-DepartmentofChenistry频率分布为了研究测量数据分布的规律性,按如下步骤编制频数分布表和绘制出频数分布直方图,以便进行考察。1.算出极差R=1.74-1.49=0.252.确定组数和组距组数视样本容量而定,本例分成9组。2/8/202379NWNU-DepartmentofChenistry组距:极差除以组数即得组距,此例组距为:每组数据相差0.03,如1.481.51,1.511.54。为了避免一个数据分在两个组内,将组界数据的精度提高一位,即1.4851.515,1.5151.545。这样1.51就分在1.4851.515组。频数:落在每个组内测定值的数目。相对频数:频数与样本容量总数之比。3.统计频数和计算相对频数2/8/202380NWNU-DepartmentofChenistry表3.1频数分布表分组频数相对频数1.4851.51522.2%1.5151.54566.7%1.5451.57566.7%1.5751.6051718.9%1.6051.6352224.4%1.6351.6652022.2%1.6651.6951011.1%1.6951.725
66.7%1.7251.75511.1%∑90100%2/8/202381NWNU-DepartmentofChenistry4.绘直方图测量数据有明显的集中趋势μ数据有离散性σ这种既分散又集中的特性,就是其规律性。绘直方图以组值范围为横坐标,以频数为纵坐标绘制直方图。2/8/202382NWNU-DepartmentofChenistry在分析化学中,偶然误差一般按正态分布规律处理。正态分布也称高斯分布(Gauss),在概率论和统计学上可用正态概率密度函数来表示:(3-22)2.正态分布y:概率密度函数,是x的函数:总体平均值(无系统误差时就是真值)
:总体标准偏差2/8/202383NWNU-DepartmentofChenistry1.正态分布规律1)测量值分布的集中趋势()x=时,y值最大,此即分布曲线的最高点。大多数测量值集中在算术平均值的附近,或者说算术平均值是最可信赖值或最佳值。它能很好地反映测定的集中趋势。
x=时的概率密度乘以dx就是测量值落在dx范围内的概率。越小,y越大,测量值分布越集中。越大,y越小,测量值分布越分散。2)测量值分布的分散趋势()2/8/202384NWNU-DepartmentofChenistry3)正误差和负误差出现的概率相等正态分布曲线以
x=这一直线为其对称轴。4)小误差出现的概率大,大误差出现的概率小出现很大误差的概率极小,趋近于零。这是因为当x趋向于-或+时,曲线以x轴为渐近线。2/8/202385NWNU-DepartmentofChenistry总体标准偏差相同,总体平均值不同总体平均值相同,总体标准偏差不同原因:1、总体不同2、同一总体,存在系统误差原因:同一总体,精密度不同2/8/202386NWNU-DepartmentofChenistry2.概率(possibility)无论和值为多少,曲线和横坐标之间的总面积为1。即各种偏差的测定值出现的概率总和为1。
(3-23)测定值落在区间(a,b)的概率为曲线与a,b间所夹面积。2/8/202387NWNU-DepartmentofChenistry
即
为简化计算,作变量替换
(3-25)(3-24)2/8/202388NWNU-DepartmentofChenistry68.3%95.5%99.7%u标准正态分布曲线与横坐标由-∞到+∞之间所夹面积即为正态分布密度函数在此区间的积分值2/8/202389NWNU-DepartmentofChenistry标准正态分布曲线的特点曲线形状与大小无关。横坐标是以为单位的x-值。特点:曲线最高点对应于u=0,标准正态分布曲线就是以总体平均值为原点,以为横坐标单位的曲线。拐点在u=1的垂线上。无论多大,都被看成1,对不同的和,标准正态分布曲线都适用。2/8/202390NWNU-DepartmentofChenistry正态分布概率积分表(部分数值)|u|面积|u面积|u面积|u面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.49870.50000.5000.19151.5000.43322.5000.49382/8/202391NWNU-DepartmentofChenistry随机误差的区间概率(概率)密度函数在整个区间内积分,也就是在标准正态曲线所包围的面积等于1,代表着所有数据出现概率的总和为1。在正态分布图中阴影部分的面积为相应概率。如考虑u范围内所相应的概率,则必须乘以2。
2/8/202392NWNU-DepartmentofChenistry随机误差出现的区间u(以为单位)测量值出现的区间概率%(-1,+1)(-1,+1)68.3(-1.96,+1.96)(-1.96,+1.96)95.0(-2,+2)(-2,+2)95.5(-2.58,2.58)(-2.58,+2.58)99.0(-3,+3)(-3,+3)99.7测量值与随机误差的区间概率2/8/202393NWNU-DepartmentofChenistry随机误差的区间概率从以上的概率的计算结果看,1)分析结果落在
3范围内的概率达99.7%,即误差超过3的分析结果是很少的,只占全部分析结果的0.3%。2)在多次重复测定中,出现特别大误差的概率是很小的,平均1000次中只有3次机会。3)一般分析化学测定次数只有几次,出现大于3的误差是不可能的。2/8/202394NWNU-DepartmentofChenistry随机误差的区间概率如果出现了,有理由认为不是由偶然误差造成的,可以舍弃。分析化学中,通常以
2作为最大允许的误差范围,对应的概率为95.5%。即误差超过2的分析结果是很少的,只占全部分析结果的4.5%。2/8/202395NWNU-DepartmentofChenistry例4经过无数次分析并在已消除系统误差的情况下,测得某钢样中磷的百分含量为0.099()。已知其=0.002,问测定值落在区间0.1030.095%的概率是多少?解:2/8/202396NWNU-DepartmentofChenistryu=2,由表7-5查得相应的概率为0.47732/8/202397NWNU-DepartmentofChenistry§3.3.2总体平均值的估计1.置信度与置信区间1.置信度(置信概率或置信水平):与置信区间相对应的概率,以P表示。2.置信区间:一定置信度时,以测定值或样本平均值为中心,包括总体平均值在内的可靠性范围。2/8/202398NWNU-DepartmentofChenistry3.已知总体标准偏差时的情况用单次测定值x估计的取值范围4.用样本平均值估计的取值范围
(3-31)
=xu2/8/202399NWNU-DepartmentofChenistry以上两式表示在一定概率下,以单次测定值或样本平均值为中心的包括真值在内的取值范围。即平均值的置信区间
u,u置信区间界限u:置信系数。根据要求的置信度由表中查到2/8/2023100NWNU-DepartmentofChenistry当置信度定为95%时,
由表3-2查得u=1.96与其相对应的单侧分布概率为:2/8/2023101NWNU-DepartmentofChenistry例5:用标准方法分析钢样中磷的百分含量。共测定4次,其平均值为0.087。设系统误差已消除,且=0.002。试求该试样中磷含量的置信区间,设其置信度为95%。2/8/2023102NWNU-DepartmentofChenistry解:已知置信度为95%时,u=1.96通过4次测定,有95%的把握认为钢样中磷的含量在0.0850.089之间。2/8/2023103NWNU-DepartmentofChenistry总体平均值的置信区间概率区间大小例:
包含在区间几率相对大几率相对小几率为100%无意义平均值的置信区间的问题2/8/2023104NWNU-DepartmentofChenistry对于少量实验数据必须根据t分布进行处理。t分布由英国化学家W.S.Gosset提出。其定义为:S相当于
6.已知样本标准偏差S的情况2/8/2023105NWNU-DepartmentofChenistry
t分布与标准正态分布的区别:1、横坐标不同(t,u)2、随测定次数减少,t分布曲线趋于平坦,n>30,t分布与标准正态分布一致。置信度(置信水平)t值与有关,tP,f
测定次数(自由度)
(3-29)2/8/2023106NWNU-DepartmentofChenistry用t分布估计置信区间用单次测定值估计
=xtP,f
S用样本平均值估计:(3-32)查t值表P.250表7-3f=3P=99%t=5.84f=5P=95%t=2.57n
各置信度下t值与正态分布的u值一致。2/8/2023107NWNU-DepartmentofChenistry1、t分布曲线t分布曲线u分布曲线2/8/2023108NWNU-DepartmentofChenistry1-1/21/2-t,ft,ft分布值表自由度f=(n-1)显著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.850.671.651.962.58P=1-,置信度,显著水平返回例题2-4返回例题2-31返回例题2-32返回例题2-56次测量,随机误差落在±2.57范围内的概率为95%。无限次测量,随机误差落在±1.96范围内的概率为95%。2/8/2023109NWNU-DepartmentofChenistryt分布值表自由度f=(n-1)显著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.850.671.651.962.58还原为u分布单位为单位为2/8/2023110NWNU-DepartmentofChenistry例6分析矿石中铁的百分含量,在一定条件下平行测定了5次,其结果分别为:39.10,39.12,39.19,39.17和39.22。求置信度为95%时平均值的置信区间。解:=39.16,S=0.05f=5-1=4查表P250P=95%f=4t=2.782/8/2023111NWNU-DepartmentofChenistry§3.4显著性检验小概率事件:小概率事件在有限次试验中不会发生,一旦发生就可认为不是由于偶然误差造成的,而是存在系统误差或其它原因。显著性检验利用统计的方法来检验被处理的问题是否存在统计上的显著性。换句话说就是检验差别是否显著。2/8/2023112NWNU-DepartmentofChenistry通常需要作显著性检验的有:1.为了检查分析方法或操作过程是否存在较大的系统误差,而需做对照试验时,检查—μ有无显著差别。2.两分析方法进行比较时即。3.两操作者之间比较。4.两种不同来源的样品。2/8/2023113NWNU-DepartmentofChenistry进行显著性检验的一般步骤是:1.先提出一个否定假设(nullhypothesis)就是说,先假定被检验的问题不存在显著性差异,即不存在系统误差,这样就可以用误差的分布规律来处理。2.确定一个适当的置信水平(或显著性水平)。在分析工作中通常使用95%的置信水平。如果被检验的差异的出现机会有95%以上(即超过这种差异的出现机会少于5%),就认为被检验的差异存在显著性。3.进行检验和作出判断。2/8/2023114NWNU-DepartmentofChenistry3.4.1t检验
1.平均值与标准值的比较检验一种新方法的准确度与精密度时,必须用已知的纯净物质或试样进行对照分析。2/8/2023115NWNU-DepartmentofChenistryt-检验的步骤1.计算 (7-19)2.查表P61表3-3得tα.f,3.比较:若t≤tα.f无系统误差若t>tα.f有系统误差2/8/2023116NWNU-DepartmentofChenistry小概率事件2/8/2023117NWNU-DepartmentofChenistry例11用某种新方法测定基准明矾中铝的百分含量,得到下列9个分析结果:10.74,10.77,10.77,10.77,10.81,10.82,10.73,10.86,10.81。已知明矾中铝的标准值(以理论值代替)为10.77。试问采用新方法后是否引起系统误差(置信度为95%)?解:n=9,f=8
2/8/2023118NWNU-DepartmentofChenistry2/8/2023119NWNU-DepartmentofChenistry刚才的例子是x与μ值比较,如果两组平均值的比较,则首先要假设两组分析数据来自同一总体,然后要检验两组数据的标准偏差有没有显著性差异,如果没有,则要求合并标准偏差。
总自由度(3-34a)
或 (3-34b)然后求t,再与t值表对照,由此决定两种方法是否存在显著性差异。2/8/2023120NWNU-DepartmentofChenistry例:用两种不同方法测定合金中铌的百分含量,所得结果如下:第一法1.261.251.22第二法1.341.311.331.34试问两种方法之间是否有显著性差异(置信度90%)2/8/2023121NWNU-DepartmentofChenistry解:n1=3=1.24%n2=4=1.33%
假定标准偏差没有显著性差异,故求得合并标准偏差为:=0.019 t=查表7-3当P=0.90,f=n1+n2-2=5时,t0.10,5=2.02,t>tα.f,故两种分析方法之间存在显著性差异,必须找出原因,加以解决。2/8/2023122NWNU-DepartmentofChenistry3.4.2.F检验法F检验法是英国统计学家Fisher提出来的。F检验法主要通过比较两组数据的方差S2,以确定它们的精密度是否有显著性差异。也就是说要检验两组数据之间是否存在系统误差,必须先进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。2/8/2023123NWNU-DepartmentofChenistry已知样本标准偏差S为故样本方差S2为S2=F检验步骤很简单,先计算出两个样本方差,分别为S大2和S小2。两者方差之比就是F值:F= (3-36)2/8/2023124NWNU-DepartmentofChenistry例2:采用两种不同的方法分析某种试样,用第一种方法分析11次,得标准偏差S1=0.21(%),用第二种方法分析9次,得标准偏差S2=0.60(%),试判断两种分析方法的精密度之间是否有显著性差异?2/8/2023125NWNU-DepartmentofChenistry解:在本例中,不论是第一种方法的精密度显著地优于或劣于第二种方法的精密度,都认为它们之间有显著性差异,因此,这是属于双边检验。已知n1=11S1=0.21%n2=9S2=0.60%S大2=0.36S小2=0.044F==2/8/2023126NWNU-DepartmentofChenistry表7-4列出的为单边检验的F值,其置信度为95%,即其显著性水准为5%。当这些F值用于双边检验时,其显著性水准α应为单边检验时的2倍,α=0.05+0.05=0.10,即相当于显著性水准由5%变为10%,而置信度则由95%变为90%。查表7-4f大=9-1=8f小=11-1=10F表=3.07,F>F表,故可以认为两种方法的精密度之间存在显著性差异。作出判断的置信度为90%。2/8/2023127NWNU-DepartmentofChenistry在F检验中,不必考虑两样本值中是否存在系统误差,因为F检验只涉及到多次测定值的一致性,而不涉及测定结果的准确度。因此在F检验之前,不要求进行t检验,然而,在进行t检验之前,必须先进行F检验,只有在两方差一致性的前提下才能进行t检验。2/8/2023128NWNU-DepartmentofChenistry不同的f1和f2相结合按95%置信水平的F值表见P253表7-4。在一定的置信度及自由度的情况下,如F值大于表7-4所相应的F值,则认为它们之间存在显著性差异,否则不存在显著性差异。2/8/2023129NWNU-DepartmentofChenistry用F检验法来检验两组数据的精密度是否有显著性差异时,必须首先确定它是属于单边检验还是双边检验。前者是指一组数据的方差只能大于、等于但不可能小于另一组数据的方差,后者是指一组数据的方差可能大于、等于或小于另一组数据的方差。2/8/2023130NWNU-DepartmentofChenistry例1,在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准偏差S1=0.055,再用一台性能稍好的新仪器测定4次,得标准偏差S2=0.022。试问新仪器的精密度是否显著地优于旧仪器的精密度?2/8/2023131NWNU-DepartmentofChenistry解:因为新仪器的精密度比旧仪器好,故这属于单边检验问题。已知n1=6S1=0.055n2=4S2=0.022S大2=S12=0.0552=0.0030S小2=S22=0.0222=0.00048F==查表7-4f大=6-1=5f小=4-1=3F表=9.01F<F表故两种仪器的精密度之间不存在统计学上的显著性差异,即不能作出新仪器显著地优于旧仪器的结论,并由置信度可知,作出这种判断的可靠性达95%。2/8/2023132NWNU-DepartmentofChenistry以F为变量的概率分布称为F—分布。F分布的概率密度曲线形状是不对称的,这种分布取决于计算两个方差时的自由度数目f1和f2。2/8/2023133NWNU-DepartmentofChenistry§3.5可疑值的取舍可疑值,异常值或极端值。无明显过失误差,不可随意舍弃某一测定值。可疑值是保留还是舍弃,应按一定的统计学方法进行处理。统计学处理可疑值有几种方法:根据正态分布规律,偏差超过3的个别测定值出现的概率小于0.3%当测定次数不多时,这样的测定值通常可以舍去。已知:测定次数非常多时
=0.80,3
4即偏差超过4的测量值通常可以舍去。1.3.54法2/8/2023134NWNU-DepartmentofChenistry对于少量实验数据,只能用S代替,用代替,故粗略地可以认为偏差大于4的个别测定值可以舍去。计算步骤如下:1、2/8/2023135NWNU-DepartmentofChenistry用Na2CO3作基准试剂对HCl溶液的浓度进行标定,共做6次,其结果为0.5050,0.5042,0.5086,0.5063,0.5051和0.5064molL-1。试问0.5086这个数据是否应舍去?解:除去0.5086,求其余数据的平均值和平均偏差=0.5054=0.00076根据x可疑-/>4例72/8/2023136NWNU-DepartmentofChenistry0.5086应该舍去该方法用于3次以上测定值的检验。
2/8/2023137NWNU-DepartmentofChenistry3.5.2.格鲁布斯(Grubbs)检验法分三种情况:1)一组数据中只有一个可疑值设:
n个测定值递增顺序为:x1,x2,,xn其中
x1或xn可能是可疑值。用统计量G判断,G是与、S有关的统计量2/8/2023138NWNU-DepartmentofChenistry若x1为可疑值时;若xn为可疑值时查表P67表3-5,GP,n值(不是n-1)G计Gp,n,应舍去可疑值,反之则保留。2/8/2023139NWNU-DepartmentofChenistry2、如果可疑值有两个以上,又均在同侧,应先检验最内侧的一个x2或xn-1,这时用n-1个测定值来计算,S(不包括x1或xn),通过G来判断x2或xn-1是否应舍去。如果x2或xn-1应舍去,则x1或xn更应舍去。2/8/2023140NWNU-DepartmentofChenistry例9有一组测定值为73.5,69.5,69.0,69.5,67.0,67.0,63.5,69.5,70.0,70.5。问可疑值63.5和73.5是否应该舍去?置信度95%。解:2/8/2023141NWNU-DepartmentofChenistry=68.9(10个测定值)63.5的偏差d=-5.473.5的偏差d=4.6暂时舍去63.5,用其余数据计算和S=69.5S=1.9G计==2/8/2023142NWNU-DepartmentofChenistry查表G0.95,9=2.11G计<GP,n
73.5不应舍弃。再用10个测定值计算和S=68.9S=2.6
G计=G0.95,10=2.18>G63.5也不能舍弃2/8/2023143NWNU-DepartmentofChenistry3.5.3.Q检验法该方法由Dean和Dixon提出,适用于3-10次测定值的检验。步骤:1)将所有测定值由小到大排序,设其可疑值为x1或xn2)求出极差R=xn-x12/8/2023144NWNU-DepartmentofChenistry3)求出可疑值与其最邻近值之差x2-x1或xn-xn-1
4)求出统计量Q计5)根据要求的置信度P和测定次数n查表P68表3-6Q值2/8/2023145NWNU-DepartmentofChenistry6、若Q计QP,则可以舍去可疑值,否则保留。该方法的优点:Q检验法符合数理统计原理,具有直观性,计算方法简单。其缺点是分母是xn-x1,数据离散性越大,可疑数据越不能舍去。Q检验法准确度较差。如果Q计=QP时,最好再补测1-2次,或用中位值作为测定结果。2/8/2023146NWNU-DepartmentofChenistry例8例7中的0.5086用Q检验法是否应舍去?置信度为90%。解:6次测定结果的顺序为0.5042,0.5050,0.5051,0.5063,0.5064,0.5086molL-1。Q计=
查表Q0.90,6=0.56Q计<QP0.5086应该保留2/8/2023147NWNU-DepartmentofChenistry4.t检验法置信区间检验法可疑值在置信区间
tP,f
内则应保留,否则应舍去。例10测定铁矿石中铁的百分含量(以Fe2O3%表示),经6次测定其结果为:40.02,40.12,40.16,40.18,40.20,40.18。试以t检验法判断该组数据中是否有可以舍去的数据。置信度为95%。2/8/2023148NWNU-DepartmentofChenistry解:t0.95,5=2.57=40.14S=0.066置信区间
tP,f
=40.142.57=40.140.0740.02不在此范围内,应舍去。G和t检验法引入了两个重要参数和S,准确度较高。2/8/2023149NWNU-DepartmentofChenistry§3.6回归分析法
(regressionalanalysis)在分析化学,特别是仪器分析中,常常要作工作曲线(也叫标准曲线或校正曲线或检量线),例如分光光度法和原子吸收法中作吸光度和浓度的工作曲线,极谱法中作波高和浓度的工作曲线等等。在分析化学中所使用的工作曲线2/8/2023150NWNU-DepartmentofChenistry通常都是直线,一般是把实验点描在坐标纸上,横坐标X表示波测物质的浓度,叫自变量,通常都是把可以精确测量或严格控制的变量(如标准溶液的浓度),作为自变量;纵坐标y表示某种特征性质(吸光度、波高等)的量,称为因变量,一般假设因变量是一组相互独立、且服从同一正态分布N(0.σ)的随机变量,然后根据坐标纸上这些散点(实验点)的走向,用直尺描出一条直线,这就是分析工作者习惯的制作工作曲线的方法。2/8/2023151NWNU-DepartmentofChenistry若吸光度—浓度的直线能通过所有实验点,在统计上就说溶液的吸光度和浓度有最密切的线性相关,吸光度完全依赖于浓度的改变而变化,完全遵循比尔定律,实验条件中的各种偶然因素对它无任何影响,(亦即没有实验误差),我们称这种关系为确定性关系或函数关系,这时作工作曲线图的任务比较简单,借助于一支直尺和一支铅笔就能完成。2/8/2023152NWNU-DepartmentofChenistry但是由于实验中不可避免的有误差存在,实验点全部密集在回归线上的情况通常是极少见的,尤其当误差较大时,实验点比较分散,并不在一条直线上,这时作图就有困难了,因为凭直觉很难判断怎样才能使所联的线对于所有实验点来说是误差最小的,亦即难于确定到底哪条线才是最好的回归线。2/8/2023153NWNU-DepartmentofChenistry例如,用次甲基蓝一二氯乙烷萃取比色法测硼,得到下列数据,μgB/60ml0.51.02.03.04.05.0A0.140.160.280.380.410.56从数据看,虽然吸光度与浓度之间有着密切的关系,但不能从一个变量的数值精确地求出另一个变量的值,我们称这类变量之间的关系为相关关系。对于相关关系较差或较分散的数据
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 招标采购制度流程
- 上海器械阳光采购制度
- 采购部降本奖惩制度
- 采购降本奖惩制度
- 采购项目验收制度
- 采购风险控制制度
- 钢材采购招标制度
- 2025年前台沟通练习题
- S高职学院教师心理契约的诊断与建设研究
- 第20章 勾股定理(知识 4大易错 )(知识清单)(原卷版)-人教版(2024)八下
- 高考语文二轮复习高中语文选用变换句式练习题含答案
- 异地升学协议书范本
- 水利工程项目法人保证安全生产措施方案
- 《AIGC文案策划与写作》-课程标准
- 企业管理顶层设计方案
- 2025年军事基础知识试题及答案
- 雨课堂在线学堂《资治通鉴》导读课后作业单元考核答案
- 2025年南京市事业单位招聘考试综合类专业能力测试试卷(管理类)真题
- 重大疾病保险科普知识培训课件
- 中文俄文贸易合同范本
- 矿山年度生产计划编制模板
评论
0/150
提交评论