版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验优化设计,叶春生 华中科技大学材料科学与工程学院 Tel第1章:误差分析,1.1 误差的分类 1.2 误差的表示 1.3 测量值和随机误差的正态分布 1.4 少量数据的统计处理 1.5 提高分析结果准确度的方法 1.6 有效数字及运算规则 小结,1.1 误差的分类,1.1.1.系统误差(Systematic errors): 由比较固定的原因引起的误差,主要来源如下: 1.方法误差:方法本身造成的 2.仪器误差:仪器本身的局限 3.试剂误差:试剂不纯 4.操作误差:操作不正确 5.主观误差:操作习惯,辨别颜色读刻度的差别 特点:重复性,单向性,可测性,2.1 误
2、差的分类,1.1.2.随机误差(Random errors): 随机偶然,难以控制,不可避免 来源:偶然性因素 特点:原因. 方向. 大小. 正负不定,不可测 1.1.3.错误误差:操作者的粗心大意 1.过失误差:确系发生,数据必舍 2.系统误差:采用对照试剂,加以改正 3.随机误差:增加平行测定次数 1.1.4.公差:生产部门对分析结果允许的误差 1.1.5.减少误差的方法,2.2 误差的表示,2.2.1.真值与平均值(True and Mean): 1.真值xT:表示某一物理量的客观存在的真实数值,其中包括: (1)理论真值; (2)计量学恒定真值; (3)相对真值 2.平均值 : n次测
3、定的算术平均值,2.2.2.准确度与误差(Accuracy and Error),误差: 测定值与真值之差,表征测定结果的准确度 准确度: 测定值与真值接近的程度 1.绝对误差:Ea= x - xT 2.相对误差:Er=(Ea /xT)100% 相对误差更能体现误差的大小,Ea相同的数据,Er可能不同,例 ( 天平 Ea=0.0002g ),_ 甲:x=3.3460g xT=3.3462g 则:Ea甲= 0.0002 Er甲= 0.006%,_ 乙:x=0.3460g xT=0.3462g 则:Ea乙= 0.0002 Er乙= 0.06%,甲. 乙Ea(绝对误差)相同,但Er(相对误差)差10
4、倍说明当Ea一定时,测定值愈大,Er愈小. 这就是当天平的Ea一定时为减小称量的误差,要求:m称 0.2 g 的道理.,例3测定莫尔盐FeSO47H2O中Fe%,四次分析结果为(%):20.01,20.03,20.04,20.05,解 _ (1) n=4 x =20.03%, |di| (2) d= =0.012% n, d 0.012 (3) = 10000/00=0.60/00 x 20.03,1.3:测量值与随机误差的正态分布,1.3.1.基本概念,1. 总体:考察对象的全体 2. 样本:从总体中随机抽取的一组测量值 3. 样本容量:样本所含的测量值的数目(n) 4. 总体平均值:,1
5、当n ,=lim x n,_ 当x=,=x T(真值),6. 总体的平均偏差: 与 的关系: =0.7979 0.8 7. 随机误差: x- _ 8. 偏差的自由度: f=(n-1), 为了校正代替引起的误差. 当n时, f与n无差别, 此时S.,5.总体的标准偏差:,9.样本平均值的标准偏差:,有限次测量时:,例如某试样中Al%的测定样本容量为4,xi:1.62,1.60,1.30,1.22;计算平均值的平均偏差及平均值的标准偏差,_ _ 解 x=1.44 %,d=0.18%,S=0.20%,Sx,由此可见S(X)与n的平方根成反比,增加测定次数, 可使平均值的标准偏差减小,但并不能使精密度
6、成比例提高,通常测量46次足以,2.3.2.频率和概率(Frequency and probability),1. 频率(frequency): 如果n次测量中随机事件A出现了 nA次,则称 F(A)= nA/n,2. 概率(probability):随机事件A的概率P(A)表示事件A发生的可能性大小 当n无限大时,频率的极限为概率: limF(A)=P(A) (0P(A)1) P的可加性 P(A1+A2+A3+.An)=1,1.3.3.测量值的概率分布:,组数 1. 直方图:组距:x = 级差,(组距),ni nx 对 频 相 率,图22 相对频数分布直方图,所有 参差 有序 的矩 形面 积
7、之 和为 1,频数分布表,1.2651.295 1 0.01 1.2951.325 4 0.04 1.3251.355 7 0.07 1.3551.385 17 0.17 1.3851.415 24 0.24 1.4151.445 24 0.24 1.4451.475 15 0.15 1.4751.505 6 0.06 1.5051.535 1 0.01 1.5351.565 1 0.01, 100 1,规律:测量数据既分散又集中,2. 概率密度 (当数据非常多,分得非常细时),n,折线变为平滑曲线正态分布曲线纵坐标由相对频率概率密度,P dp P 定义:lim = = f(x) X dx,3
8、.正态分布 (Normal Distribution Curve),通过对测量值分布的抽象与概括,得到正态分布的数学模型:正态分布密度函数,以X= 为对称轴,当X= 时,f(x)最大概率密度(说明测量值落在的领域内的概率)最大. 决定曲线横轴的位置.,1 2,(相同,1不等于2),图23相同而不同时曲线形态,(相同, 2 1),两个拐点到X= 的距离均为. 小精密度高, 两拐点间距2; 大精密度差, 两拐点间距大, 测量值分散性大 决定曲线形状,图24 相同不同时曲线形态,1.3.4.随机误差的分布 (Distribution of Random Errors),1. 若以r=(x-)表示随机
9、误差,以 x-为横坐标,则曲线最高点对应的横坐标为零,此曲线成为随机误差的正态分布曲线,2.随机误差的正态分布密度函数,3. 测量值的分布与随机误差的分布,只在横轴位置不同,平移了个单位,4.随机误差的规律性:,(1).单峰性 (2).对称性 (3).有界性,5.对测量值和随机误差的正态分布曲线分析:,_ 1).x=时 P值最大,大多数测量值集中在 x 附近,是最可信赖值 2).曲线以x=为对称轴,正负误差出现概率相等 3).当x-或x+曲线以X轴为渐进线,说明:愈大,x落在附近的概率愈小,精密度差,愈小,x落在附近的概率愈大,精密度好,图25 精密度不同时测定值分布形态,2.3.5.标准正态
10、分布:,=0,2=1的正态分布,以符号N(0.1)表示,若测量值误差u以标准偏差为单位,改横 坐标为,因为x-=u ,dx=du 所以,图26 标准正态分布曲线(u分布曲线),f(x)dx=1 :总体中所有测量值出现的总概率为1,f(u)du=1: 各种大小随机误差出现的总概率为1,显然: 随机变量在区间a,b上出现的概率等于曲线与横轴在该区间所围的面积,对应的积分为1,2.3.6. 随机误差的区间概率概率,概率面积,正态分布概率积分表(|u|=|x-|/),0.0 0.0000 1.0 0.3413 2.0 0.4773 0.1 0.0398 1.1 0.3643 2.1 0.4821 0.
11、2 0.0793 1.2 0.3849 2.2 0.4861 0.3 0.1179 1.3 0.4032 2.3 0.4893 0.4 0.1554 1.4 0.4192 2.4 0.4918 0.5 0.1915 1.5 0.4332 2.5 0.4938 0.6 0.2258 1.6 0.4452 2.6 0.4953 0.7 0.2580 1.7 0.4554 2.7 0.4965 0.8 0.2881 1.8 0.4641 2.8 0.4974 0.9 0.3159 1.9 0.4713 3.0 0.4987,例4已知某试样中Co%的标准值为=1.75%,= 0.10%,若无系统误差存
12、在,试求:分析结果落在1.75 0.15%范围内的概率,解 |X-| |X-1.75%| 0.15% |u|= = = =1.5 0.10% 0.10%,查表得概率为20.4332=86.6%(双边),例5上例求分析结果大于2.00%的概率? (大于2.00% 属于单边检验问题),解 |x-| |2.00%-1.75%| 0.25% |u|= = = =2.5 0.10% 0.10%,查表得阴影部分的概率为0.4938,整个正态分布曲线右侧的概率为1/2,即0.5000. 故阴影部分以外的概率为0.5000-0.4938=0.62% 即分析结果大于2.00%的概率仅为0.62%,任一随机变量在
13、某一区间出现的概率,可由求该区间的定积分制成 概率积分表,1.4:少量数据的统计处理,1). 与u分布不同的是,曲线形状随f而变化 2). n时, t 分布=u分布 3). t 随P和f而变化,当f=20时,tu 4). t : 置信因子,随减小而增大,置信区间变宽,图 27 t 分布曲线,5).:危险率(显著性水平), 数据落在置信区间外的概率 =(1-P),6).P:置信度,测量值落在(+u)或(+ts)范围内的概率 7).f:自由度f=(n-1) 8).t,f的下角标表示:置信度(1-)=P,自由度f=(n-1)时的t值 例如:写作为t0.05,6t,f,t,f值表(双边),1.4.2.
14、平均值的置信区间 (Confidence Interval of the Mean ),数学表达式:=x u (u可查表得到),若以样本平均值估计总体平均值可能存在的区间,数学表达式为:,对少量测量值须用t分布进行统计处理,则改写t定义式:,_ 定义:在一定置信度下,以平均值X为中心,包括总体平均值的置信区间,_ 例1某学生测Cu% x =35.21%,S=0.06%, n=4 求P=0.95;0.99时平均值的置信区间,解查t值表 P=0.95 f=3 t=3.18,P=0.99 f=3 t=5.84 同理:=n=( 35.21+0.18 )%,(1)P变大,置信区间变宽,包括真值的可能性大
15、 (2)分析中常定置信度为95%或90%,(3)对平均值置信区间的解释:在35.21+0.1区间包括的把握为95%,(4)当n很大,S时,可用公式,(5)通常分析要求测量次数为n=4-6,2.4.3.显著性检验(Testing of Signifficance ),分析中经常遇到的两种情况:,_ x 与不一致,准确度判断;,_ _ x 1与x 2不一致,精密度判断,检验同一样品在不同实验室; 检验同一样品用两种方法,(一) t 检验法(t test ):对结果准确度的检验,对系统误差的检验,1.实验平均值与已知标准值的比较:检验新的分析方法,对标样进行n次测定,在一定置信度下改写t定义计算t计
16、,若t计t表 说明存在显著性差异(有系统误差的存在),例2采用丁基罗丹明B-Ge-Mo杂多酸光度法测中草药中Ge含量(g),结果(n=9):10.74;10.77; 10.77;10.77;10.81;10.82;10.73;10.86;10.81(已知标样值=10.77g问新方法是否有系统误差),_ 解P=0.95 f=8 X=10.79 S=0.042,_ 查t值表得:t表=2.31t计 说明X与无显著性差异,新方法无系统误差,2.两组平均值的比较:不同人员分析同一样品,同一人用不同方法分析同一样品,_ _ x 1与 x 2 两组数据之间是否存在系统误差,_ 设:n1 S1 x 1 _ n
17、2 S2 x 2 假定:S1=S2=S,_ _ x 1与x 2 之间有否差异,须两平均值之差的t值,用t 检验,_ _ 假定: x 1与 x 2 出自同一母体,则1=2,S,若:t计t表 则1=2,_ _ 两组数据不属同一母体 X1与X2有显著性差异,有系统误差,(二)F检验法(F test ):分析结果精密度检验,两组数据方差S2比较,一般先进行F检验确定精密度无差异,再进行t 检验(准确度检验),已知:样本的标准偏差,样本的方差:,F检验的步骤:,(1)先计算两个样本的方差S大2 和S小2 (2)再计算F计=S大2/S小2 (规定S大2为分子) (3)查F 值表 若F计F表 则S1与S2有
18、显著性差异, 否则无,置信度为95%时F 值(单边),2 3 4 5 6 7 8 9 10 ,f大:大方差数据自由度 f小:大方差数据自由度,例3当置信度为95%时,下列两组数据是否存在显著性差异?,A: n=4 0.09896;0.09891;0.09901;0.09896 B: n=5 0.09911;0.09896;0.09886;0.09901; 0.09906,解属两平均值的比较,先用F检验精密度,证明无差异之后,再用t检验系统误差,_ (2) XB=0.09900 SB2=92.510-10,S大2 SB2 92.510-10 (3) F计= = = =5.54 S小2 SA2 1
19、6.710-10,(4)查表F=9.12因F计F表故SA与SB精密度无显著性差异,(6) 查 t0.05,7=2.36 t计 t表 故两组数据无显著性差异,2.4.4.异常值(Qutliers)的取舍(离群值的统计检验),检验步骤 (1)去掉可疑值,求余下的值的平均值X好,_ _ (3)计算:|x 可疑-x 好|4d则舍去,否则保留,_ _ (4)若可以值可保留,则重算 x 和 d,例4 测药物中的Co(g/g)结果为:1.25,1.27,1.31,1.40问:1.40是否为可疑值?,_ _ 解去掉1.40 求余下数据 X=1.28 d=0.023,_ 则:| x 可疑-x 好|=|1.40-
20、1.28|=0.1240.023 说明:1.40为离群值应舍去,_ 2.格鲁布斯法(Grubbs):引入两个样本参数 x 和S,方法准确但麻烦,检验步骤,(1)从小到大排列数据,可以值为两端值;,_ (2)计算 x 和S; _,| x xi| (3)求统计量T计= S,(4)查表T,n (P256)若T计T表则该值舍去,否则保留,检验步骤: (1)从小到大排列数据,可疑值为两个端值,例5 某学生测N%:20.48;20.55;20.60;20.53;20.50 问: (1)用Q检验20.60是否保留 _ _ _ (2)报告分析结果 n,S ,x ,d/x (3)若xT=20.56 计算Er%
21、(4)P=0.95时平均值的置信区间并说明含义,|20.60-20.55| 解 (1)Q计= =0.42 (20.60-20.48),Q表 =0.86Q计 20.60保留,_ _ _ (2)x =20.53% (d / x )10000/00 =1.70/00 S=0.035%,_ x xT 20.53-20.56 (3) Er%= 100= 100 = - 0.14 x T 20.56,这说明在20.530.043区间中包括总体平均值的把握性为95%,Q值表,测量 次数(n),1.4.4 误差的传递,一 系统误差的传递,1.加减法,若R为A,B,C 三个测量值相减的结果,R=A+B-C,则绝
22、对误差E是各测量步骤结果 绝对误差的代数和,ER=EA+EB-EC,2.乘除法,R是A,B,C 三个测量值的结果,则相对误差是各测量步骤相对误差的代数和,3.指数关系,则相对误差为测量值的相对误差的指数倍,4.对数关系,则误差传递关系为,二. 随机误差的传递,1. 加减法,分析结果的标准偏差的平方是 各测量步骤标准偏差的平方和,标准偏差的平方总和SR2为,2.乘除法,是各测量步骤相对标准偏差的平方总和,3.指数关系运算时( )则为,4. 对数关系运算时( ),则为,三. 极值误差,加减法是各测量值的绝对误差的绝对值累加 乘除法是各测量值相对误差的绝对值累加,2.4.5 回归分析,一. 一元线性
23、回归方程,分析化学中经常用工作曲线来获取未知物的量, A与C的关系是否为线形相关(各实验点是否全部 落在一条直线上?)用数字统计方法找出各实验点 误差最小的直线回归分析,1.回归方程,截距:,斜率:,和 分别为x和y的平均值,当回归系数a,b 确定后,回归直线就确定下来了,2. 回归方程的意义和用途,a.从一组数据出发确定这些变量间的定量关系 回归方程的建立,b. 评价和度量变量间的关系的密切程度 相关系数检验,c.应用回归方程,从一些变量值去估计另一变量值,d.对回归方程的主要参数作进一步评价和比较 回归曲线的检验,二. 相关系数,1. r值计算,判断y与x之间的相关性好坏的尺度,2. r
24、值的物理意义,当 都在回归线上时,r=1 完全相关 当y与x无相关性时,r=0 r在01之间时,y与x有相关性, r愈接近1, 相关性愈好,3. 相关系数的显著性检验,求r值 在一定置信度下,当 ,则x和y相关, 所拟合的回归曲线有意义,否则x与y不相关, 所得回归方程不可靠,1.5:提高分析结果准确度的方法,1.5.1.选择合适的分析方法,1. 根据分析准确度要求: 常量分析:重量法,滴定法的准确度高,灵敏度低 2. 根据分析灵敏度要求: 微量分析:仪器法灵敏度高,准确度低,3. 根据分析干扰情况: 如:,2.5.2.减少测量误差,1. 称量:1/万天平 mS=Ea/Er=0.0002g/0
25、.1%=0.2g,2. 体积:滴定管 V=Ea/Er=0.02mL/0.1%20mL,例6 以K2Cr2O7标定0.02mol/L 的Na2S2O3要使VNa2S2O3=25mL,称 m(K2Cr2O7)=?,解 (1)Cr2O72-+6I -+14H+=2Cr3+3I2+7H2O I2+2S2O32-=2I -+S4O62 -,1 1 (2) nK2Cr2O7 = nI2= nNa2S2O3 3 6,(4)Er%=(+0.0002/0.024)100=10.1,(5)为使Er0.1%,加大称样量,扩大10倍,配制成250mL(取25mL即为0.024g的量),2.5.3.增加平行测定次数,减
26、小随机误差:,一般 n=46(见图21),2.5.4.消除测量过程中的系统误差:,1. 对照试验:检验系统误差 2. 空白试验:扣除系统误差 3. 校正仪器: 4. 分析结果校正:,1.6:有效数字及运算规则,1.6.1.有效数字(Significant Figures) : 分析结果中的有效数字是:实际测定的数值包含一位不确定数字(可疑数字),有效位数: 从数值左方非零数字算起到最后一位可疑数字,确定有效位数的位数. 可疑数字: 通常理解为,它可能有1或0.5单位的误差(不确定性),测量结果的表达:例:测量值10.09,10.11,10.09,10.10,10. 12,平均值为10.102,
27、标准偏差为0.01304,显然小数点后第二位存在不确定性,为可疑值,而第一位是确定的。结果表示为:s=10.100.013 (n=5),1.0008;0.010001;4.5371 105为五位 20.00,0.02000为四位 0.002;210-3 为一位 3.6103为二位,1.6.2.有效数字的记录,1. 几个重要物理量的测量精度: 天平(1/10000):Ea=0.0001g 滴定管: 0.01mL pH计: 0.01单位 光度计: 0.001单位 电位计: 0.0001V(E),2. “0”的双重意义: (1)普通数字使用是有效数字:20.30mL (2)作为定位不是有效数字:0.02030 四位,3. 改变单位不改变有效数字的位数:0.0250g25.0mg2.50104g,4. 各常数视为“准确数”,不考虑其位数:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年鱼菜共生系统安装合同
- 2026年农产品收购合同协议范本
- 2026年云南省瑞丽市高三生物上册期末考试模拟检测卷及参考答案【巩固】
- 2026年河北省南宫市高三生物上册期末考试模拟卷附答案(模拟题)
- 2026年汽车售后服务合同
- 文化旅游合作项目合同债务履约保障专用2026年版
- 2026年江西省德兴市高二生物下册期末考试模拟卷含答案(夺分金卷)
- 2026年河北省遵化市高二生物下册期末考试测试卷含答案【达标题】
- 2026年安徽省宁国市高二生物下册期末考试模拟卷及完整答案(夺冠)
- 2026年吉林省和龙市高二生物下册期末考试试卷带答案(精练)
- 小学信息技术教师讲座
- GB/T 3871.9-2025农业拖拉机试验规程第9部分:牵引功率试验
- 车载冰箱项目可行性研究报告(总投资14000万元)(58亩)
- 【语文】海南省海口市第九小学小学三年级下册期末试题(含答案)
- 基于多源数据的利辛县耕地地力与土壤养分特征的综合解析
- 电缆厂员工环境保护培训
- 液氧站安全知识培训课件
- 医疗机构环境表面清洁与消毒管理标准
- 市政有限空间培训
- 《发展心理学》考试题库及答案
- 【MOOC答案】《软件测试》(南京邮电大学)章节期末慕课答案
评论
0/150
提交评论