




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析化学中的误差与数据[教学目的]
通过本章的教学,使学生掌握分析化学中有关的数据处理方法,学习并掌握标准偏差、变异系数和平均值的置信区间的计算,掌握显著性差异和极端值的取舍的处理方法及其应用,了解误差传递和回归分析法等知识。[教学重点与难点]
标准偏差、变异系数和平均值的置信区间的计算,显著性差异和极端值的取舍的处理方法。3.1分析化学中的误差误差与偏差1.误差
测量值(X)与真值(XT)之间的差值(E)。(1)绝对误差:表示测量值与真值(XT)的差。
E=X-XT(2)相对误差:表示误差在真值中所占的百分率。
Er=E/XT。测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。
2.真值T(Truevalue)
某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的。(1)理论真值(如化合物的理论组成)(2)计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)(3)相对真值(如高一级精度的测量值相对于低一级精度的测量值)7提高分析结果准确度的方法生产部门对分析结果误差允许的一种限量。对于少量测量数据,即当n有限时,必须根据t分布进行统计处理:吸量管,移液管:25.(2)充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。0121,因它的相对误差最大,所以(1)绝对误差:表示测量值与真值(XT)的差。n次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,它表示一组测定数据的集中趋势。缺点是不能充分利用数据,因而不如平均值准确。95xr=0.例采用某种新方法测定基准明矾中铝的质量分数,得到下列9个分析结果:10.20,有效数字的位数为两位。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。解不论是第一种方法的精密度显著地优于或劣于第二种方法的精密度,都认为它们之间有显著性差异,因此,这是属于双边检验问题。d=x--x
3.平均值-Meanvaluen次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,它表示一组测定数据的集中趋势。
d=x--x4.中位数(XM)-Medianvalue
一组测量数据按大小顺序排列,中间一个数据即为中位数XM,当测量值的个数位偶数时,中位数为中间相邻两个测量值的平均值。它的优点是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响;缺点是不能充分利用数据,因而不如平均值准确。含量在1%至10%:3位有效数字x1,x2,……,xn-1,xnpH:0.重现性、单向性(或周期性)、可测性0.缺点是不能充分利用数据,因而不如平均值准确。(2)个体:组成总体的每个单元。在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。正态分布是无限次测量限次测量数据则用t分布曲解:平均值x=1.*曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。95xr=0.4分析化学中数据处理对于少量测量数据,即当n有限时,必须根据t分布进行统计处理:5.偏差
测量值与平均值的差值.用于衡量所得结果的精密度.单次测定结果的平均偏差:
d=1/n∑∣di∣
单次测定结果的相对平均偏差:
dr=d/x×100%标准偏差:相对标准偏差:又称变异系数.极差:又称全距.
R=xmax--xmin3.1.2准确度与精密度1.准确度Accuracy
准确度表征测量值与真实值的符合程度。准确度用误差表示。2.精密度precision
精密度表征平行测量值的相互符合程度。精密度用偏差表示。
准确度与精密度的关系例:A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。36.0036.5037.0037.5038.00测量点平均值真值DCBA表观准确度高,精密度低准确度高,精密度高准确度低,精密度高准确度低,精密度低(不可靠)准确度与精密度的关系:结论:1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。系统误差与随机误差1.系统误差
由某种固定的原因造成的,具有重复性、单向性。又称可测误差。
A.方法误差
B.仪器和试剂误差
C.操作误差
D.主观误差2.随机误差
又称偶然误差。由某些难以控制的且无法避免的偶然因素造成的。3.过失误差
在分析过程中由于疏忽或差错引起的所谓过失。系统误差与随机误差的比较:项目系统误差随机误差产生原因固定因素,有时不存在不定因素,总是存在分类方法误差、仪器与试剂误差、主观误差环境的变化因素、主观的变化因素等性质重现性、单向性(或周期性)、可测性服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数3.1.4公差
生产部门对分析结果误差允许的一种限量。公差范围的确定与很多因素有关:1.根据实际情况对分析结果准确度的要求而定。2.依试样组成及待测组分含量而不同。3.1.5误差的传递
分析结果通常是经过一系列测量步骤之后获得的,其中每一步骤的测量误差都会反映到分析结果中去。
设分析结果Y由测量值A、B、C计算获得,测量值的系统误差分别为A、B、C,标准偏差分别为SA、SB、SC。ki为常数。
(1)绝对误差:表示测量值与真值(XT)的差。10%,又已知测量时没有系统误差,求分析结果落在(1.查表,f大=9-1=8,f小=11-1=10,F表=3.两组数据的精密度相差不大,则F值趋近于1;0040中,前面3个“0”不是有效数字,大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。正态分布:测量数据一般符合正态分布规律,即高斯分布,正态分布曲线数学表达式为:例用两种方法测定合金中铝的质量分数,所得结果如下:40,求得其余数据的平均值x和平均偏差d为10.(2)个体:组成总体的每个单元。在分析过程中由于疏忽或差错引起的所谓过失。置信度一般定为95或90。(2)个体:组成总体的每个单元。μ反映测量值分布集中趋势。1.系统误差的传递(1)加减法(2)乘除法(3)指数关系(4)对数关系2.随机误差的传递
(1)加减法(2)乘除法(3)指数关系(4)对数关系3.极值误差
3.2.1有效数字significantfigure
实际能测到的数字。在有效数字中,只有最后一位数是不确定的,可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。有效数字的修约规则
“四舍六入五成双”规则:当测量值中修约的那个数字等于或小于4时,该数字舍去;等于或大于6时,进位;等于5时(5后面无数据或是0时),如进位后末位数为偶数则进位,舍去后末位数位偶数则舍去。5后面有数时,进位。修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约。3.2有效数字及其运算规则
有效数字的修约:
0.32554→0.32550.36236→0.362410.2150→10.22150.65→150.675.5→7616.0851→16.093.2.3运算规则1.有效数字位数的确定(1)零的作用
*在1.0008中,“0”是有效数字;*在0.0382中,“0”定位作用,不是有效数字;*在0.0040中,前面3个“0”不是有效数字,后面一个“0”是有效数字。*在3600中,一般看成是4位有效数字,但它可能是2位或3位有效数字,分别写3.6×103,3.60×103或3.600×103较好。
(2)倍数、分数关系:无限多位有效数字。(3)pH,pM,lgc,lgK等对数值,有效数字的位数取决于小数部分(尾数)位数,因整数部分代表该数的方次。如pH=11.20,有效数字的位数为两位。(4)9以上数,9.00,9.83,4位有效数字。2.加减法
当几个数据相加减时,它们和或差的有效数字位数,应以小数点后位数最少的数据位依据,因小数点后位数最少的数据的绝对误差最大。例:0.0121+25.64+1.05782=?绝对误差±0.0001±0.01±0.00001
在加合的结果中总的绝对误差值取决于25.64。
0.01+25.64+1.06=26.713.乘除法当几个数据相乘除时,它们积或商的有效数字位数,应以有效数字位数最少的数据位依据,因有效数字位数最少的数据的相对误差最大。例:0.0121×25.64×1.05782=?相对误差±0.8%±0.4%±0.009%
结果的相对误差取决于
0.0121,因它的相对误差最大,所以
0.0121×25.6×1.06=0.328
3.2.4分析化学中数据处理
1.记录测量结果时,只保留一位可疑数据。
分析天平称量质量:0.000Xg
滴定管体积:0.0XmL
容量瓶:100.0mL,250.0mL,50.0mL
吸量管,移液管:25.00mL,10.00mL,5.00mL,1.00mLpH:0.0X单位吸光度:0.00X2.分析结果表示的有效数字
高含量(大于10%):4位有效数字含量在1%至10%:3位有效数字含量小于1%:2位有效数字3.分析中各类误差的表示
通常取1至2位有效数字。4.各类化学平衡计算
2至3位有效数字。3.4分析化学中的数据统计处理总体与样本:(1)总体:在统计学中,对于所考察的对象的全体,称为总体(或母体)。(2)个体:组成总体的每个单元。(3)样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。(4)样本容量:样品中所包含个体的数目,用n表示。
例如:分析延河水总硬度,依照取样规则,从延河中取来供分析用2000ml样品水,这2000ml样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是延河样品水的一个随机样本,样本容量为20。随机变量来自同一总体的无限多个测量值都是随机出现的,叫随机变量。
设样本容量为n,则其平均值为:当测定次数无限增多时,所得平均值即为总体平均值μ:
若没有系统误差,则总体平均值μ就是真值此时,单次测量的平均偏差δ为
总体标准偏差:
当测定次数为无限多次时,各测量值对总体平均值μ的偏离,用总体标准偏差σ表示:计算标准偏差时,对单次测量加以平方,这样做不仅能避免单次测量偏差相加时正负抵消,更重要的是大偏差能显著地反应出来,因而可以更好地说明数据的分散程度。标准偏差与平均偏差:用统计学方法可以证明,当测定次数非常多(例如大于20)时,标准偏差与平均偏差有下列关系:δ=0.979σ≈0.80σ,但应当指出:当测定次数较少时,与S之间的关系就可能与此式相差颇大了。
1.频数分布
测定某样品100次,因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。3.3.1随机误差的正态分布
2.正态分布:测量数据一般符合正态分布规律,即高斯分布,正态分布曲线数学表达式为:
y:概率密度;x:测量值μ:总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。σ:标准偏差,反映测量值分布的分散程度;x-μ:随机误差正态分布曲线规律:*x=μ时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。μ反映测量值分布集中趋势。*曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。*当x趋于-∞或+∞时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。*σ越大,测量值落在μ附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。σ反映测量值分布分散程度。标准正态分布曲线:
横坐标改为u,纵坐标为概率密度,此时曲线的形状与σ大小无关,不同σ的曲线合为一条。
X-μ
u=-------------
σ3.随机误差的区间概率
正态分布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即概率P为:
随机误差出现的区间测量值出现的区间概率(以σ为单位)u=±1x=μ±1σ68.3%u=±1.96x=μ±1.96σ95.0%u=±2x=μ±2σ95.5%u=±2.58x=μ±2.58σ99.0%u=±3x=μ±3σ99.7%例1已知某试样中山质量分数的标准值为1.75%,σ=0.10%,又已知测量时没有系统误差,求分析结果落在(1.75±0.15)%范围内的概率。解:例2同上例,求分析结果大于2.00%的概率。解:属于单边检验问题。
阴影部分的概率为0.4938。整个正态分布曲线右侧的概率为1/2,即为0.5000,故阴影部分以外的概率为0.5000-0.4938=0.62%,即分析结果大于2.00%的概率为0.62%。少量实验数据的统计处理:(1)t分布曲线正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t分布曲线处理。用s代替σ,纵坐标仍为概率密度,但横坐标则为统计量t。t定义为:3.3.2总体平均值的估计1.平均值的标准偏差自由度f—degreeoffreedom
(
f=n-1)
t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近∞时,t分布就趋近正态分布。置信度P—confidencedegree
在某一t值时,测定值落在(μ+ts)范围内的概率。置信水平α—confidencelevel
在某一t值时,测定值落在(μ+ts)范围以外的概率(l-P)ta,f
:t值与置信度P及自由度f关系。例:t0·05,10表示置信度为95%,自由度为10时的t值。
t0·01,5表示置信度为99%,自由度为5时的t值。(2)平均值的置信区间(confidenceinterval)当n趋近∞时:单次测量结果:以样本平均值来估计总体平均值可能存在的区间:
对于少量测量数据,即当n有限时,必须根据t分布进行统计处理:它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。例对其未知试样中Cl-的质量分数进行测定,4次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为90%,95%和99%时,总体平均值μ的置信区间。解:置信度越高,置信区间就越大,所估计的区间包括真值的可能性就越大。置信度一般定为95或90。3.4显著性检验—Significancetestt检验法—ttest*平均值与标准值的比较*两组平均值的比较F检验法—Ftest
比较两组数据的方差s2
3.4.1t检验法
1.平均值与标准值的比较为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析,再利用t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。进行t检验时,首先按下式计算出t值:
若t计算>tα,f,存在显著性差异,否则不存在显著性差异。通常以95%的置信度为检验标准,即显著性水准为5%。例采用某种新方法测定基准明矾中铝的质量分数,得到下列9个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知明矾中铝含量的标准值(以理论值代)为10.77%。试问采用该新方法后,是否引起系统误差(置信度95%)?
解:n=9,f=9-1=8
查表,P=0.95,f=8时,t0.05,8=2.31。t<t0.05,8,故x与μ之间不存在显著性差异,即采用新方法后,没有引起明显的系统误差。2.两组平均值的比较设两组分析数据为:n1s1x1n2s2x2
在一定置信度时,查出表值(总自由度f=n1+n2-2),若t>t表两组平均值存在显著性差异。t<t表,则不存在显著性差异。例用两种方法测定合金中铝的质量分数,所得结果如下:
第一法1.26%1.25%1.22%
第二法1.35%1.31%1.33%
试问两种方法之间是否有显著性差异(置信度90%)?解
n1=3,x1=1.24%s1=0.021%
n2=4,x2=1.33%s2=0.017%f大=2f小=3F表=9·55F<F表→说明两组数据的标准偏差没有显著性差异.→当P=0.90,f=n1+n2-2=5时,t0·10,5=2.02。t>t0·10,5,故两种分析方法之间存在显著性差异.
3.4.2F检验法
比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。统计量F定义为两组数据的方差的比值,分子为大的方差,分母为小的方差。两组数据的精密度相差不大,则F值趋近于1;若两者之间存在显著性差异,F值就较大。在一定的P(置信度95%)及f时,F计算>F表,存在显著性差异,否则,不存在显著性差异。例1在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准偏差s1=0.055;再用一台性能稍好的新仪器测定4次,得标准偏差s2=0.022。试问新仪器的精密度是否显著地优于旧仪器的精密度?解已知新仪器的性能较好,它的精密度不会比旧仪器的差,因此,这是属于单边检验问题。已知n1=6,s1=0.055n2=4,s2=0.022
查表,f大=6-1=5,f小=4-1=3,F表=9·01,F<F表,故两种仪器的精密度之间不存在显著性差异,即不能做出新仪器显著地优于旧仪器的结论。做出这种判断的可靠性达95%。例2采用两种不同的方法分析某种试样,用第一种方法分析11次,得标准偏差s1=0.21%;用第二种方法分析9次,得标准偏差s2=0.60%。试判断两种分析方法的精密度之间是否有显著性差异?解不论是第一种方法的精密度显著地优于或劣于第二种方法的精密度,都认为它们之间有显著性差异,因此,这是属于双边检验问题。已知n1=11,s1=0·21%n2=9,s2=0·60%
查表,f大=9-1=8,f小=11-1=10,F表=3.07,F>F表,故认为两种方法的精密度之间存在显著性差异。作出此种判断的置信度为90%。
3.5可疑值(cutlier)取舍
在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。
处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。
3.5.1.4d法根据正态分布规律,偏差超过3σ的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而δ=0.80σ,3σ≈4δ,即偏差超过4δ的个别测定值可以舍去。用4d法判断异常值的取舍时,首先求出除异常值外的其余数据的平均值和平均偏差d,然后将异常值与平均值进行比较,如绝对差值大于4d,则将可疑值舍去,否则保留。当4d法与其他检验法矛盾时,以其他法则为准。例测定某药物中钴的含量如(μg/g),得结果如下:1.25,1.27,1.31,1.40。试问1.40这个数据是否应保留?解:首先不计异常值1.40,求得其余数据的平均值x和平均偏差d为异常值与平均值的差的绝对值为:
|1.40一1.28|=0.12>4d(0.092)
故1.40这一数据应舍去。
3.5.2格鲁布斯(Grubbs)法
有一组数据,从小到大排列为:
x1,x2,……,xn-1,xn
其中x1或xn可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量T进行判断。若T>Ta,n,则异常值应舍去,否则应保留。例:前一例中的实验数据,用格鲁布斯法判断时,1.40这个数据应保留否(置信度95%)?
解:平均值x=1.31,s=0.066
查表T0·05,4=1.46,T<T0·05,4,故1.40这个数据应该保留。
格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数x及s,故方法的准确性较好。缺点是需要计算x和s,手续稍麻烦。
3.5.3Q检验法
设一组数据,从小到大排列为:
x1,x2,……,xn-1,xn
设x1、xn为异常值,则统计量Q为:
式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。Q值越大,说明xn离群越远。Q称为“舍弃商”。当Q计算>Q表时,异常值应舍去,否则应予保留。3.6回归分析法3.6.1一元线性回归方程(linearregression)及回归直线
式中x,y分别为x和y的平均值,a为直线的截矩,b为直线的斜率,它们的值确定之后,一元线性回归方程及回归直线就定了。
3.6.2相关系数-correlationcoefficient
相关系数的物理意义如下:
a.当所有的认值都在回归线上时,r=1。
b.当y与x之间完全不存在线性关系时,r=0。
c.当r值在0至1之间时,表示例与x之间存在相关关系。r值愈接近1,线性关系就愈好。例用吸光光度法测定合金钢中Mn的含量,吸光度与Mn的含量间有下列关系:Mn的质量μg00.020.040.060.080.100.12未知样吸光度A0.0320.1350.1870.2680.3590.4350.5110.242试列出标准曲线的回归方程并计算未知试样中Mn的含量。解此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量Mn,或者含有其它在该测量波长下有吸光的物质。设Mn含量值为x,吸光度值为y,计算回归系数a,b值。
a=0.038b=3.95
标准曲线的回归方程为y=0.38+3.95xr=0.9993<r99%,f标准曲线具有很好的线性关系未知试样中含Mn0.052μg。90,f=n1+n2-2=5时,t0·10,5=2.0.大多数测量值集中在算术平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 库房物资结存方案(3篇)
- 职业操守-评价方案(3篇)
- DB23-T3022-2021-市场主体电子档案影像管理系统信息化规范-黑龙江省
- 初中家长生活管理制度
- 培训学员教学管理制度
- 仓储现场管制方案(3篇)
- 园林环卫服务管理制度
- 医院精神卫生管理制度
- 农村养鸭日常管理制度
- 医院合同评审管理制度
- C919机组培训-导航系统
- 药理学知到智慧树章节测试课后答案2024年秋哈尔滨商业大学
- 智能病历质控系统需求说明
- 【MOOC】运输包装-暨南大学 中国大学慕课MOOC答案
- 山东省烟台市莱州市一中2025届高考数学押题试卷含解析
- 叉车出租行业市场调研分析报告
- 数据中心建设成本分析
- 专题9.8不等式(组)的新定义问题大题专练(重难点培优30题)-2022-2023学年七年级数学下册尖子生培优必刷题(原卷版)
- 专题02代数推理题(真题2个考点模拟16个考点)(原卷版+解析)
- 变压器维修投标方案
- 2025届山东师范大学附中高考适应性考试历史试卷含解析
评论
0/150
提交评论