




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1,上节课回顾,3-1 有效数字极其运算规则 一、有效数字(有效数字的位数) 二、修约规则 “四舍六入五成双” 三、计算规则 加减法小数点后位数最少的数字为依据。 乘除法有效位数最少的数字为依据。,2,3-2 分析化学中的误差 绝对误差 相对误差 偏差 平均偏差 相对平均偏差 标准偏差相对标准偏差 平均值中位数 极差(全距),3,3-3 分析化学中的数据处理,第三章 误差及数据处理,4,一、随机误差的正态分布,1、 Frequency distribution (频数分布) 因测量过程中存在随机误差,使测量数据具有分散的特性,但仍具有一定的规律性:具有一定的集中趋势。 分散测量时误差的不可避免
2、, 集中大误差少而小误差多,第三章 误差及数据处理 3-3,5,在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下: 1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59
3、 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.69,第三章 误差及数据处理 3-3,6,首先视样本容量的大小将所有数据分成若干组:容量大时分为10-20组,容量小时(n50)分为5-7组,本例分为9组。 再将全
4、部数据由小至大排列成序,找出其中最大值和最小值,算出极差R。由极差除以组数算出组距。本例中的R=1.74% -1.49%=0.25%,组距= R/9 =0.25%/9=0.03%。每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等。为了使每一个数据只能进入某一组内,将组界值较测定值多取一位。即: 1.485-1.515,1.515-1.545,1.545-1.575等等。 统计测定值落在每组内的个数(称为频数),再计算出数据出现在各组内的频率(即相对频数)。,第三章 误差及数据处理 3-3,7,表3-1 频数分布表 分组(%) 频数 频率 1.485-1.515 2 0
5、.022 1.515-1.545 6 0.067 1.545-1.575 6 0.067 1.575-1.605 17 0.189 1.605-1.635 22 0.244 1.635-1.665 20 0.222 1.665-1.695 10 0.111 1.695-1.725 6 0.067 1.725-1.755 1 0.011 90 1.00,第三章 误差及数据处理 3-3,8,图3-2 频率分布的直方图,如果数据很多且分组很细,直方图的形状将趋于一条平滑的曲线。,第三章 误差及数据处理 3-3,9,由表中的数据和图3-2可以看出,测定数据的分布并非杂乱无章,而是呈现出某些规律性。在全
6、部数据中,平均值1.62%所在的组(第五组)具有最大的频率值,处于它两侧的数据组,其频率值仅次之。统计结果表明:测定值出现在平均值附近的频率相当高,具有明显的集中趋势;而与平均值相差越大的数据出现的频率越小。,第三章 误差及数据处理 3-3,10,直方图的特点 (1)离散特性 总体标准偏差,(2)集中趋势 总体平均值,总体平均偏差,(3-18),(3-19),(3-20),第三章 误差及数据处理 3-3,11,在确认消除了系统误差的前提下,总体平均值就是真值xT 总体标准偏差和总体平均偏差 间的关系( n20),(3-21),第三章 误差及数据处理 3-3,12,2、正态分布(Normal d
7、istribution),根据概率统计理论:若随机变量是由为数众多的相互独立的随机因素的影响迭加而成,且这些随机因素每一个的影响又都表现得十分微弱,则这个随机变量表现为正态分布。 因测定值与测定误差都是随机变量(随机因素),故分析测试中的误差可用正态分布来描述。,第三章 误差及数据处理 3-3,13,正态分布曲线 N(,),特点: 极大值在 x = 处. 拐点在 x = 处. 于x = 对称. 4. x 轴为渐近线.,y: 概率密度 x: 测量值 : 总体平均值 x-: 随机误差 : 总体标准偏差,(3-22),第三章 误差及数据处理 3-3,14,式中y表明测定次数趋于无限时,测定值xi出现
8、的概率密度。若以x 值表示横坐标, y 值表示纵坐标,就得到测定值的正态分布曲线。曲线的最高点,它对应的横坐标值即为总体平均值,这就说明了在等精密度的许多测定值中,平均值是出现概率最大的值。 式(3-22)中的为总体标准偏差,是曲线两侧的拐点之一到直线 x=的距离,它表征了测定值的分散程度。标准偏差较小的曲线陡峭,表明测定值位于附近的概率较大,即测定的精密度高。与此相反,具有较大标准偏差较大的曲线平坦,表明测定值位于附近的概率较小,即测定的精密度低。,第三章 误差及数据处理 3-3,15,由图可得: x = (即误差为零)时y值最大。说明大多数测量值集中在算术平均值附近,或说算术平均值是最可信
9、赖值。 曲线以x = 的直线呈轴对称分布,即正、负误差出现概率相等。 x值趋于或(即 x与 差 很大)时,曲线以轴为渐近线,说明小误差出现的概率大而大误差出现的概率小。 值越大,测量值的分布越分散;越小,测量值越集中,曲线越尖锐。,第三章 误差及数据处理 3-3,16, 和 是误差的正态分布的两个重要参数: 说明了数据的集中趋势 表示了数据的离散程度 只要确定了 和,便确定了分布曲线的图形。故通常把表达式记作用 N(,2)。并将N(0,1)称为标准正态分布。,第三章 误差及数据处理 3-3,17,相同,321,不相同,相同,第三章 误差及数据处理 3-3,18,误差(测量值)在某区间出现概率的
10、计算:,(3-23),第三章 误差及数据处理 3-3,19,3、标准正态分布 由于和不同时就有不同的正态分布,曲线的形状也随之而变化。为了使用方便,将正态分布曲线的横坐标改用 u(注意不是)来表示(以为单位表示随机误差),并定义 (3-24) 代入(3-22)中得: 由于,第三章 误差及数据处理 3-3,20,故 u称为标准正态变量。此时式(3-22)就转化成只有变量u的函数表达式: (3-25) 经过上述变换,总体平均值为的任一正态分布均可化为= 0,2 =1的标准正态分布,以N(0,1)表示。 标准正态分布曲线是以总体平均值为原点,标准偏差为横座标单位的曲线。 标准正态分布曲线如图3-4所
11、示,曲线的形状与和的大小无关。,第三章 误差及数据处理 3-3,21,图3-4 标准正态分布曲线,第三章 误差及数据处理 3-3,22,4、随机误差的区间概率 正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-至+的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。 (3-26) 欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对式(3-26)积分求面积而得到。例如随机误差在区间(u=1),即测定值在区间出现的概率是:,第三章 误差及数据处理 3-3,23,按此法求出不同u值时的积分面积,制成相应的概率积分表可供直接查用。 表3-2中
12、列出的面积对应于图中的阴影部分。若区间为|u|值,则应将所查得的值乘以2。例如: 随机误差出现的区间 测定值出现的区间 概率 u=1 x= 0.34132=0.6826 u=2 x=2 0.47732=0.9546 u=3 x=3 0.49872=0.9974,第三章 误差及数据处理 3-3,24,以上概率值表明,对于测定值总体而言,随机误差在2范围以外的测定值出现的概率小于0.045,即20次测定中只有1次机会。随机误差超出3的测定值出现的概率更小。平均1000次测定中只有3次机会。通常测定仅有几次,不可能出现具有这样大误差的测定值。如果一旦发现,从统计学的观点就有理由认为它不是由随机误差所
13、引起,而应当将其舍去,以保证分析结果准确可靠。,第三章 误差及数据处理 3-3,25,表3-2 正态分布概率积分表 |u| 面积 |u| 面积 |u| 面积 0.0 0.0000 1.1 0.3643 2.2 0.4821 0.1 0.0398 1.2 0.3849 2.2 0.4861 0.2 0.0793 1.3 0.4032 2.3 0.4893 0.3 0.1179 1.4 0.4192 2.4 0.4918 0.4 0.1554 1.5 0.4332 2.5 0.4938 0.5 0.1915 1.6 0.4452 2.58 0.4951 0.6 0.2258 1.7 0.4554
14、2.6 0.4953 0.7 0.2580 1.8 0.4641 2.7 0.4965 0.8 0.2881 1.9 0.4713 2.8 0.4974 0.9 0.3159 1.96 0.4750 3.0 0.4987 1.0 0.3413 2.0 0.4773 0.5000,第三章 误差及数据处理 3-3,26,概率积分面积表的另一用途是由概率确定误差界限。例如要保证测定值出现的概率为0.95,那么随机误差界限应为1.96。 例1 经过无数次测定并在消除了系统误差的情况下,测得某钢样中磷的质量分数为0.099%。已知=0.002%,问测定值落在区间0.095%-0.103%的概率是多少?
15、解:根据得 |u|=2,由表3-2查得相应的概率为0.4773,则 P(0.095%x0.103%)=0.47732=0.955,第三章 误差及数据处理 3-3,27,例2 对烧结矿样进行150次全铁含量分析,已知结果符合正态分布(0.4695, 0.00202)。求大于0.4735的测定值可能出现的次数。 解: 查表,P=0.4773,故在150次测定中大于0.4773的测定值出现的概率为: 0.5000-0.4773=0.0227 1500.02273,第三章 误差及数据处理 3-3,28,(一)、平均标准偏差 如果从同一总体中随机抽出容量相同的数个样本,由此可以得到一系列样本的平均值。实
16、践证明,这些样本平均值也并非完全一致,它们的精密度可以用平均值的标准偏差来衡量。显然,与上述任一样本的各单次测定值相比,这些平均值之间的波动性更小,即平均值的精密度较单次测定值的更高。,二、总体平均值的估计,第三章 误差及数据处理 3-3,29,因此,在实际工作中,常用样本的平均值 对总体平均值进行估计。统计学证明,平均值的标准偏差 与单次测定值的标准偏差之间有下述关系。 (n) (3-27b) 对于有限次的测定则有: (3-27a),第三章 误差及数据处理 3-3,30,式中 称样本平均值的标准偏差。由以上两式可以看出,平均值的标准偏差与测定次数的平方根成反比。因此增加测定次数可以减小随机误
17、差的影响,提高测定的精密度。,第三章 误差及数据处理 3-3,31,(二)、有限测定数据的统计处理 置信度与的置信区间 日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,测定值总是在以为中心的一定范围内波动,并有着向集中的趋势。因此,如何根据有限的测定结果来估计可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与愈接近,即测定的准确度愈高。但由于测定次数毕竟较少,由此计算出的置信区间也不可能以百分之百的把握将包含在内,只能以一定的概率进行判断。,第三章 误差及数据处理 3-3,32,1、已知总体标准偏差时 对于经常进行测定的某种试样,由于已
18、经积累了大量的测定数据,可以认为是已知的。根据(3-24)式并考虑u的符号可得: (3-24a) 由随机误差的区间概率可知,测定值出现的概率由u决定。例如,当u=1.96时。x在-1.96至+1.96区间出现的概率为0.95。如果希望用单次测定值x来估计可能存在的范围,则可以认为区间x1.96能以0.95的概率将真值包含在内。即有 (3-30),第三章 误差及数据处理 3-3,33,由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有,式(3-30)和式(3-31)分别表示在一定的置信度时,以单次测定值 x 或以平均值为中心的包含真值的取值范围,即的置信区间。在置
19、信区间内包含的概率称为置信度,它表明了人们对所作的判断有把握的程度,用P表示。u 值可由表3-2中查到,它与一定的置信度相对应。,(3-31),第三章 误差及数据处理 3-3,34,在对真值进行区间估计时,置信度的高低要定得恰当。一般以95%或90%的把握即可。 式(3-30)和式(3-31)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。当一定时,置信度定得愈大,u值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或 越接近真值,即测定的准确度越高。 例题1:,第三章 误差及数据处理
20、 3-3,35,注意:是确定且客观存在的,它没有随机性。而区间xu或 是具有随机性的,即它们均与一定的置信度相联系。因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95。 2、已知样本标准偏差s时 在实际工作中,通过有限次的测定是无法得知和的,只能求出 和 s。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用 s 代替从而对作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量 tP,f 取代 u (仅与P有关),上述偏离即可得到修正。,第三章 误差及数据处理 3-3,36,t分布法
21、:t值的定义: (3-29) t分布是有限测定数据及其随机误差的分布规律。t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。显然,在置信度相同时,t分布曲线的形状随f(f = n-1)而变化,反映了t分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当f时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。,第三章 误差及数据处理 3-3,37,图3-6 t分布曲线,第三章 误差及数据处理 3-3,38,与正态分布曲线一样,t 分布曲线下面某区间的面积也表示随机误差在此区间的概率。但t
22、 值与标准正态分布中的u 值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的t值见表3-3中。,第三章 误差及数据处理 3-3,39,表3-3 tP,f 值表(双边) P=90% P=95% P=99% P= 99.5% f (n-1) 1 6.31 12.71 63.66 127.32 2 2.92 4.30 9.92 14.98 3 2.35 3.18 5.84 7.45 4 2.13 2.78 4.60 5.60 5 2.02 2.57 4.03 4.77 6 1.94 2.45 3.71 4.32 7 1.90 2.36 3.50 4.03 8 1.86 2.31 3.35 3.83 9 1.83 2.26 3.25 3.69 10 1.81 2.23 3.17 3.58 20 1.72 2.09 2.84 3.15 30 1.70 2.04 2.75 (3.01) 60 1.67 2.00 2.66 (2.87) 120 1.66 1.98 2.62 2.81 1.64 1.96 2.58 2.81,第三章 误差及数据处理 3-3,40,由表3-3中的数据可知,随着自由度的增加,t值逐渐减小并与 u 值接近。当 f=20 时,t 与u 已经比较接近。当f时,tu,s。在引用t值时,一般取 0.95 置信度。 根据样本的单次测定值 x 或少数测量值的平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业环境信用管理办法
- 企业培训课时管理办法
- 企业人员晋升管理办法
- 人文社科项目管理办法
- 仓库施工备案管理办法
- 优化完善风险管理办法
- 临时占用道路管理办法
- 产业资金管理办法举措
- 企业用水登记管理办法
- 企业外汇账户管理办法
- YY/T 1623-2018可重复使用医疗器械灭菌过程有效性的试验方法
- GB/T 28055-2011钢质管道带压封堵技术规范
- GB/T 23936-2018工业氟硅酸钠
- GB/T 1874-1995磷矿石和磷精矿中酸不溶物含量的测定重量法
- GB 30980-2014海洋倾倒物质评价规范疏浚物
- GA/T 1393-2017信息安全技术主机安全加固系统安全技术要求
- 尼可地尔临床应用优势课件
- 超星尔雅《诗经》导读检测题答案
- 地源热泵埋管冬夏季换热平衡计算
- 湖北省职称评审专业目录表(工程系列)
- 中考《红星照耀中国》各篇章练习题及答案(1-12)
评论
0/150
提交评论