误差及数理统计基础._第1页
误差及数理统计基础._第2页
误差及数理统计基础._第3页
误差及数理统计基础._第4页
误差及数理统计基础._第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一章第一章误差及数理统计基础误差及数理统计基础1.1误差误差1.1.1误差的定义误差的定义测量值测量值x带有误差带有误差E,测量值去掉误差就等于真值,测量值去掉误差就等于真值 0, 0 xE。所以误差的定义为:。所以误差的定义为:Ex 0,即测量值偏离,即测量值偏离真值的程度,也就是测量值的不确定度真值的程度,也就是测量值的不确定度.1.1.2误差的类型误差的类型1.绝对误差绝对误差测量值大于真值时误差为正数,表示结果偏高;反之,测量值大于真值时误差为正数,表示结果偏高;反之,误差为负数时表示结果偏低误差为负数时表示结果偏低.这里的误差都是绝对误差,这里的误差都是绝对误差,它具有与测量值和真

2、值相对应的量纲它具有与测量值和真值相对应的量纲.00 xx2.相对误差相对误差绝对误差在真值中所占的比率称相对误差,一般用百分率表绝对误差在真值中所占的比率称相对误差,一般用百分率表示示相对误差()相对误差()当真值为未知时,可用多次重复测定结果的算术平均值代替当真值为未知时,可用多次重复测定结果的算术平均值代替 。相对误差没有量纲。相对误差没有量纲.3.粗差粗差粗差也称过失误差,是由于非正常实验条件或非正常操作所粗差也称过失误差,是由于非正常实验条件或非正常操作所造成的造成的.如测量时对错了标志如测量时对错了标志,误读了数码误读了数码,实验仪器未达到预想实验仪器未达到预想的指标等的指标等.含

3、有粗差的测量值常称为坏值或异常值含有粗差的测量值常称为坏值或异常值,应予以剔除应予以剔除.4.系统误差系统误差由于某种原因所产生,并遵循一定的规律进行变化由于某种原因所产生,并遵循一定的规律进行变化.例如,随样例如,随样品或试剂用量的大小按比例进行变化品或试剂用量的大小按比例进行变化.系统误差有一定的指向,系统误差有一定的指向,例如称量一种吸湿性物质,其误差总是正值例如称量一种吸湿性物质,其误差总是正值.从系统误差从系统误差的来源看,它属于方法和技术问题,知道了产生的原因,的来源看,它属于方法和技术问题,知道了产生的原因,便可消除或修正,所以此种误差也称可定误差便可消除或修正,所以此种误差也称

4、可定误差.5.随机误差随机误差在相同条件下重复多次测定同一物理量时,误差大小或在相同条件下重复多次测定同一物理量时,误差大小或正负变化纯属偶然而毫无规律,这种误差称为随机误差,正负变化纯属偶然而毫无规律,这种误差称为随机误差,也叫偶然误差也叫偶然误差.单个地看是无规律性的,但就其总体来单个地看是无规律性的,但就其总体来说,由于正负有相消的机会,随着变量个数的增加,误说,由于正负有相消的机会,随着变量个数的增加,误差的平均值将趋近于零差的平均值将趋近于零.这种低偿正是统计规律的表现,这种低偿正是统计规律的表现,所以随机误差是可以用概率统计来处理的所以随机误差是可以用概率统计来处理的.1.1.3精

5、密度和准确度精密度和准确度误差表示测量的不精密度和不准确度,即不确定度误差表示测量的不精密度和不准确度,即不确定度.精密精密度和准确度是两个不同的概念度和准确度是两个不同的概念.精密度表示一组测定数据相互精密度表示一组测定数据相互接近的程度或分散的程度,它的大小完全决定于偶然误差接近的程度或分散的程度,它的大小完全决定于偶然误差.在在分析化学中,常用重复性(分析化学中,常用重复性(repeatability)和再现性)和再现性(reproducibility)(reproducibility)来来表示精密度表示精密度.重复性重复性是指在完全相同条件下,即同一操作者、是指在完全相同条件下,即同一

6、操作者、同一仪器、同一仪器、同一实验室,在较短时间内分析同一样品所得结果的精密度;同一实验室,在较短时间内分析同一样品所得结果的精密度;再现性再现性是指在不同的条件下,即不同的操作者、非同一台仪是指在不同的条件下,即不同的操作者、非同一台仪器、不同的实验室、不同的时间,但是用相同的分析方法和器、不同的实验室、不同的时间,但是用相同的分析方法和分析相同样品所得结果的精密度分析相同样品所得结果的精密度.准确度表示测量值与真值的准确度表示测量值与真值的偏离程度,它由系统误差和偶然误差共同决定偏离程度,它由系统误差和偶然误差共同决定.如由如由4个学生用浓度准确为个学生用浓度准确为0.1mol/L的盐酸

7、滴定浓度准确为的盐酸滴定浓度准确为0.1mol/L的氢氧化钠的氢氧化钠,氢氧化钠的体积准确为氢氧化钠的体积准确为10.00ml.每个学每个学生重复测量生重复测量5次次,其结果示于表其结果示于表1.1.学学生生结果结果(ml)注释注释ABCD10.0810.1110.0910.1010.129.8810.1410.029.8010.2110.199.799.6910.059.7810.049.9810.029.9710.04精密但不准精密但不准确确准确但不精准确但不精密密不准确也不不准确也不精密精密准确而且精准确而且精密密由表由表1.1可见可见,学生学生A尽管测试结果尽管测试结果重复性较好重复性

8、较好,即精密即精密,但是准确性较差但是准确性较差(A的均值为的均值为10.10),所有结果均偏高所有结果均偏高.这是由于系统误差所致这是由于系统误差所致.学生学生B的测试的测试落到准确值落到准确值(即真值即真值)的两侧的两侧,其均值为其均值为10.01.此结果较准确此结果较准确,但精密度较差但精密度较差,主要受到了偶然误差的影响主要受到了偶然误差的影响.学生学生C测测量中既有偶然误差的影响量中既有偶然误差的影响,又有系统误又有系统误差的影响差的影响,所以既不精密所以既不精密,也不准确也不准确.只只有学生有学生D测试结果比较精密测试结果比较精密(范围为范围为9.97-10.04ml),又比较准确

9、又比较准确(均值为均值为10.01).表表1.1用盐酸进行氢氧用盐酸进行氢氧化钠的滴定结果化钠的滴定结果1.1.4 1.1.4 偶然误差的传递偶然误差的传递 1.1.线性加和线性加和 如如y y为测定量为测定量a a, , b b和和c c等的线性组合:等的线性组合:cKbKaKKycba 式中式中K Ka a,K Kb b,和,和K Kc c等为常数,则加和或差值的标准偏差是各等为常数,则加和或差值的标准偏差是各量方差加和的平方根量方差加和的平方根:222)()()(ccbbaayKKK 如滴定中,移液管的初值和终值分别为:如滴定中,移液管的初值和终值分别为:3.51ml 3.51ml 和和

10、 15.67ml, 15.67ml, 其标准偏差均为其标准偏差均为0.02ml,0.02ml,则用去滴定液的体积及标准则用去滴定液的体积及标准偏差分别为:偏差分别为:消耗的滴定液体积消耗的滴定液体积=15.67-3.51=12.16(ml)标准偏差标准偏差=028. 0)02. 0()02. 0(22(ml)此例说明,组合的标准偏差大于单个读数的标准偏差,但小此例说明,组合的标准偏差大于单个读数的标准偏差,但小于各量的标准偏差之和于各量的标准偏差之和.2.2.乘除表达式乘除表达式 若计算若计算y的表达式为:的表达式为:y=kab/cd式中式中a, b, c和和d分别为测定量,分别为测定量,k为

11、常数,则相对标准偏差有为常数,则相对标准偏差有如下关系:如下关系:2222)()()()(dcbaydcbay如荧光的量子产率可用下式计算:如荧光的量子产率可用下式计算:ekcLIIf0/式中各量的相对标准偏差是:式中各量的相对标准偏差是:I0为入射光强度,为入射光强度,0.5%;If 为荧光强度,为荧光强度,2%;E 为摩尔吸收,为摩尔吸收,1%;c为浓度,为浓度,0.2%;的相对标准偏差为:的相对标准偏差为:(%)3 . 215 . 02 . 02 . 02.22222dsr由此可见,最终结果的相对标准偏差略大于上述分量中具有由此可见,最终结果的相对标准偏差略大于上述分量中具有最大相对标准

12、偏差的那个分量最大相对标准偏差的那个分量(If).).这一结果给我们的启示这一结果给我们的启示是,若拟提高测试的精度,则首先应该设法改善具有最大相是,若拟提高测试的精度,则首先应该设法改善具有最大相对标准偏差的那个分量的测试精度对标准偏差的那个分量的测试精度. .另外,对于某一量的乘方,如另外,对于某一量的乘方,如y=bn则则y y的相对标准偏差为的相对标准偏差为bnyby因为因为b和和bn不是分别独立的量不是分别独立的量.)(xfy 则则x和和y的标准偏差具有如下关系:的标准偏差具有如下关系:dxdyxy如某溶液的吸收值如某溶液的吸收值A为光透过率的函数:为光透过率的函数:)lg(TA若若T

13、的测定值为的测定值为0.501,标准偏差为,标准偏差为0.001,则,则A的值及其的值及其dA/dT分别为:分别为:300. 0501. 0lgATTedTdA/434. 0/lg和和由此可得由此可得A的标准偏差为:的标准偏差为:s=|0.001(-0.434/0.501)|=0.000872.3.其他函数其他函数若若y是是x的函数的函数1.1.5 1.1.5 系统误差的传递系统误差的传递 1 1线性组合线性组合 如测试量如测试量a a, , b b, , c c等中的系统误差分别为等中的系统误差分别为 cba和,等,等,则则y中的系统误差中的系统误差y为:为: ckbkakycbaddccb

14、baayy2.乘除表达式乘除表达式如如y=kabc/d则,相对系统误差为:则,相对系统误差为:同样,若同样,若 nby 则则y的相对系统误差为:的相对系统误差为:bbnyy3.其他函数其他函数 和偶然误差具有相类似的表达式,即和偶然误差具有相类似的表达式,即dxdyxy1.2 1.2 基础统计学概念基础统计学概念1.1.总体、个体和样本总体、个体和样本 所研究对象的全体称为总体,其中每个单位称为个体。所研究对象的全体称为总体,其中每个单位称为个体。从总体中随机抽取若干个体的集合称为样本。样本中所含从总体中随机抽取若干个体的集合称为样本。样本中所含个体的数目个体的数目n n称为样本容量。如称为样

15、本容量。如, , 某产品设为总体某产品设为总体, , 考察考察某产品中铅的含量某产品中铅的含量, , 随机选取该类产品随机选取该类产品100100个个, , 那么那么100100个个产品铅的含量产品铅的含量x x1 1, , x x2 2, , , , x x100100就是来自总体的容量为就是来自总体的容量为100100的样本的样本. . 在分析化学中,样本的英文(在分析化学中,样本的英文(samplesample)一词为一)一词为一分析实物。而在分析数据处理时(即在统计学中),此词分析实物。而在分析数据处理时(即在统计学中),此词指的是一组数据,即自总体中随机抽取的一组测量值。为指的是一组

16、数据,即自总体中随机抽取的一组测量值。为了避免混淆,在分析化学中的了避免混淆,在分析化学中的“样本样本”可用可用“试样试样”一词一词。1.均值和标准偏差均值和标准偏差 对某试样作无限次测定,所得数据称为总体的均值对某试样作无限次测定,所得数据称为总体的均值(亦亦称期望值称期望值)常用常用 表示表示. 若无系统偏差,若无系统偏差, 则为真值。事实上不则为真值。事实上不可能作无限次测定可能作无限次测定. 若作若作n次测定,其均值次测定,其均值(即算数平均值即算数平均值)为为 nxxnii/ )(1x是是 的估计的估计. x的表达式为:的表达式为:同样,若总体的标准偏差为同样,若总体的标准偏差为 ,

17、有限次如有限次如n 次测定的标准偏次测定的标准偏差为差为s,则,则s为为 的估计的估计.当当n趋于无穷大时,趋于无穷大时,s将趋近于将趋近于 。s的表达式为:的表达式为:niinxxs121 )/()(标准偏差可以表征测定结果对于均值的离散程度,但却不标准偏差可以表征测定结果对于均值的离散程度,但却不能指示这些数据的分布情况。而表征数据的分布情况要用能指示这些数据的分布情况。而表征数据的分布情况要用直方图(或频谱图)直方图(或频谱图).如对某一溶液作如对某一溶液作50次测定,其均值为次测定,其均值为0.50ug/ml.其中,其中,0.46ug/ml出现出现1次,次,0.47ug/ml出现出现3

18、次次,0.48ug/ml出现出现5次,次,0.49ug/ml出现出现10次,等等次,等等.将每将每一测定值出现的频率对测定值作图即为直方图(或频谱一测定值出现的频率对测定值作图即为直方图(或频谱图)。图)。3.平均值的标准偏差平均值的标准偏差 将一组独立重复测定值进行平均时,一部分偶然误差相将一组独立重复测定值进行平均时,一部分偶然误差相互抵消,使平均值带有的误差比原测定值要小互抵消,使平均值带有的误差比原测定值要小.平均值的标平均值的标准偏差准偏差又称又称“标准误差标准误差”,与单次测量值的,与单次测量值的 之间的关之间的关系为系为xnx/ 故标准误差故标准误差 服从服从x)/,(nN2的正

19、态分布的正态分布.4.正态分布正态分布在数学上常用正态分布(即高斯分布)来描述某试在数学上常用正态分布(即高斯分布)来描述某试样的总体:样的总体:22221)( xep其中,其中,x为试样测量值,为试样测量值,p为测量值的概率密度。正态分布为测量值的概率密度。正态分布具有如下重要性质(见图具有如下重要性质(见图1.1):):(1)数据关于数据关于 为对称分布;为对称分布;(2) 值越大,数据的离散程度越大;值越大,数据的离散程度越大;(1)样本值落入任意区间(样本值落入任意区间(a,b)的概率记作)的概率记作p(axt( ,f),则放弃假设,则放弃假设.同样同样,t( ,f)由查表得到由查表得

20、到.)/(ntsx snxt)(用冷蒸汽原子吸收法测定某标样中的汞用冷蒸汽原子吸收法测定某标样中的汞已知汞的含量为已知汞的含量为38.9%.其测试值为其测试值为38.9%,37.4%和和37.1%.由此可得平均值为由此可得平均值为37.8%,标准偏差为,标准偏差为0.964%.作假设,即设定无系统误差,则利用上述公式可计算作假设,即设定无系统误差,则利用上述公式可计算t值:值:当自由度为当自由度为2时,查时,查t值分布表可得值分布表可得t( ,f)=4.3( =0.05).由由于于|t|t临界临界,假设为真,即无明显的系统误差假设为真,即无明显的系统误差.981964103./| *|38.9

21、-37.8|t0H3 3、成对结果的、成对结果的t检验(检验(pairedt-test) 两种方法对于两种方法对于4个试样个试样Pb的测定结果的测定结果(ug/L)为:为:试样试样 湿法氧化湿法氧化 直接萃取直接萃取 1 1 717176762 2 61 6168683 3 50 5048484 4 60 605757若沿用上述算法去直接比较两种方法的均值是不适合的,因为若沿用上述算法去直接比较两种方法的均值是不适合的,因为测试结果的差异有可能由于本试样不同所导致。测试结果的差异有可能由于本试样不同所导致。在此种情况下,可以采用同一试样两个测试结果比较的方法在此种情况下,可以采用同一试样两个测

22、试结果比较的方法.如上述数据,对应试样的差值分别为如上述数据,对应试样的差值分别为-5,-7,2,3;这些差值这些差值的均值的均值=-1.75;差值的标准偏差;差值的标准偏差s=4.99.由于差值的期望值由于差值的期望值=0,所以,所以t的自由度为的自由度为n-1=3,取取 =0.05,查表得,查表得t值为值为3.18,t的实验的实验值为值为-0.70,| t|=1, , 即大者为分子,小者为即大者为分子,小者为分母。分母。2221/ssF 测定废水中的氧,其结果为:测定废水中的氧,其结果为: 均值(均值(mg/L) 标准偏差标准偏差(mg/L) (mg/L) 标准方法:标准方法:723.31

23、新方法:新方法:721.51n1=n2=8试问,新方法的精密度是否明显高于标准方法?对试问,新方法的精密度是否明显高于标准方法?对于此问题可以采用单尾于此问题可以采用单尾F检验检验.F=3.312/1.512=4.8在两种情况下均测定在两种情况下均测定8次,所以自由度均为次,所以自由度均为7.若若 =0.05,查表(单尾)得,查表(单尾)得F的临界值为的临界值为3.787.由于计由于计算值大于该临界值,故可得新方法比标准法具有更算值大于该临界值,故可得新方法比标准法具有更高精密度的结论高精密度的结论.再如再如1.6.2中硼的测定中硼的测定 两种方法的测定次数均为两种方法的测定次数均为10,即自

24、由度均为,即自由度均为9,标准偏标准偏差分别为差分别为0.30和和0.23.若采用若采用F检验:检验:F=0.32/0.232=1.7显然,在此种情况下为双尾检验显然,在此种情况下为双尾检验.查双尾查双尾F分布表所分布表所得临界值为得临界值为4.026( =0.05).计算值小于临界值,说计算值小于临界值,说明两种方法的标准偏差没有显著性差别明两种方法的标准偏差没有显著性差别.须指出须指出,在进行双尾检验时在进行双尾检验时,若使用的若使用的F分布表为单尾分布表为单尾,则显著性水平则显著性水平 应为双尾的应为双尾的 的的1/2.如上例如上例, 应为应为0.025而不是而不是0.05.1.6.4检

25、验检验22 2检验是有关于某事件发生频率的测试检验是有关于某事件发生频率的测试.如,由实验室中如,由实验室中4位工作者打破玻璃器皿的件数,用位工作者打破玻璃器皿的件数,用2检验他们的可信赖度有否区别检验他们的可信赖度有否区别.打破件数:打破件数:24,17,11,9若作若作假设,则认为他们间可信赖度无区别假设,则认为他们间可信赖度无区别.就是说在同就是说在同一段时间内,他们打破玻璃器皿的件数是相同的一段时间内,他们打破玻璃器皿的件数是相同的.由于打由于打破的总件数为破的总件数为61,所以对于每位工作者打破器皿的期望值,所以对于每位工作者打破器皿的期望值为为61/4=15.25.现在我们拟得到的

26、答案是,观测值与期望现在我们拟得到的答案是,观测值与期望值是否有显著性差别值是否有显著性差别.为此,作如下计算:为此,作如下计算:0H观测频率,观测频率,O期待频率,期待频率,EOE(O-E)2/E2415.258.755.0201715.251.750.2011115.25-4.251.184915.25-6.252.5610.002=8.966其中,其中,OE列的加和恒等于列的加和恒等于0,故可作计算中的校验故可作计算中的校验.若若2超超出一定的临界值则拒绝假设出一定的临界值则拒绝假设.在此例中,自由度为在此例中,自由度为4-1=3,若若 =0.05,则由则由2的分布表可知的分布表可知2的

27、临界值为的临界值为7.81,计算值大,计算值大于查表值,说明于查表值,说明4位工作者的可信赖度确有区别位工作者的可信赖度确有区别.作为作为2检验的应用,观测总数要大于或等于检验的应用,观测总数要大于或等于50次,而个体重复次数不应低于次,而个体重复次数不应低于5。另外另外,2检验可用于检验总体方差是否正常,检验可用于检验总体方差是否正常,但总体方差但总体方差 要已知要已知.运用时首先计算出统计量:运用时首先计算出统计量:然后查分布表,并将查表值与计算值进行比较,然后查分布表,并将查表值与计算值进行比较,以判断如某批产品正常与否以判断如某批产品正常与否.222) 1(sn 1.6坏值的剔除坏值的

28、剔除用统计法进行坏值剔除的基本思想是:给定一显著性水平用统计法进行坏值剔除的基本思想是:给定一显著性水平 ,并确定一门限值,凡超过这个门限的误差就认为它不,并确定一门限值,凡超过这个门限的误差就认为它不属于随机误差的范畴,而是粗差,并予以剔除属于随机误差的范畴,而是粗差,并予以剔除.1. 法则法则 设残差为:设残差为:样本的标准偏差为样本的标准偏差为s,若,若则认为则认为xi是含有粗差的坏值,应予剔除是含有粗差的坏值,应予剔除.2.Chauvenet准则准则 同上,当同上,当 时剔除坏值时剔除坏值.式中可由表式中可由表1.5查出查出.xxviisvi3svii表表1.5Chauvenet系数的

29、数值表系数的数值表 n in in i34567891011121.381.531.651.731.801.861.921.962.002.03131415161718192021222.072.102.132.152.172.202.222.242.262.28232425304050751002005002.302.312.332.392.492.582.712.813.023.203. Grubbs准则准则同上,当同上,当 时则认为时则认为x xi i是含有粗值的坏是含有粗值的坏值,应予剔除值,应予剔除. . 值列于表值列于表1.6.1.6. 表表1.6 Grubbs 1.6 Grubb

30、s 数值表数值表 snvi),(sn),(n n n 0.010.050.010.050.010.05345678910111.151.491.751.912.102.222.322.412.481.151.461.671.821.912.032.112.182.241213141516171819202.552.612.662.702.742.782.822.852.882.292.332.372.412.412.472.502.532.562122232425303540502.912.942.952.993.013.103.183.213.342.582.602.622.642.662.

31、742.812.872.964、t 检验准则检验准则同上,但是在均值计算中不包括怀疑值,标准偏差同上,但是在均值计算中不包括怀疑值,标准偏差s的计算的计算自由度为自由度为n-2.当当 时,剔除坏值时,剔除坏值xi.式中式中其中其中 为为t分布,分布,f=n-2.snkvi),(21),()1/(),(nntnkf),(ft5、Dixon准则准则 这一准则是运用极差比的方法。首先将测试数据依小至大排这一准则是运用极差比的方法。首先将测试数据依小至大排序,则可计算序,则可计算f值,若值,若f f( ,n),则应剔除,则应剔除x(1)或或x(n)。f( ,n)为查为查表值(见表表值(见表1.7)。)。表表1.7Dixon系数系数f( ,n)和和f f计算公式计算

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论