




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,分析化学中的数据处理,2偶然误差的正态分布,3少量数据的统计处理,1总体、样本、偏差,2,1总体、样本、偏差,一、总体:,二、样本:,对于所考察对象的全体称为总体,自总体中随机抽出一部分供分析用的试样称为样本;,样本中所含测量值的数目称为样本大小(样本容量),它能回答总体的含量。,3,平均值,平均偏差,三、偏差总体(无限次测量)样本(有限次测量),标准偏差,平均值标准偏差,平均值平均偏差,4,说明:(1)对测量次数很多,统计学证明0.80(2)在有限次测量中,增加测量次数可提高精密度一般平行测定34次;要求高精密测量,可测59次。,5,2偶然误差的正态分布,有一矿石试样在相同条件下,用AAS法测定其Cu%,得如下数据:1.361.411.441.371.391.461.371.351.421.421.491.361.421.341.461.351.451.471.401.431.371.501.401.381.551.411.461.391.45.(100个数),分一下组(10组)就会发现这些数据既有分散性又有集中性。位于1.361.44%有65个数,小于1.27%或大于1.55%数据很少。每组测量值出现的次数称为频数;出现次数/100为相对频数(概率密度)。,一、频数分布,6,二、正态分布曲线,y:概率密度x:测量值:总体平均值:总体标准偏差,(一)正态分布方程(高斯分布),0,x,-,+,-,+,说明:,x=时,y值最大,对应于正态分布曲线的最高点,此时误差等于零;代表了数据的集中趋势。,7,3.当x+或x-曲线以x轴为渐近线,说明小误差出现的几率大,很大误差出现的几率很小,趋近于零。,2.曲线以x=这点的垂线为对称轴,说明正负误差出现的几率相等。,4.当x=时,ymax=,,,越大y越小,曲线越平坦,测得数据越分散,反之则相反。,代表了数据的离散程度,5.是正态分布方程两个非常重要的参数,可用N(,2)表示正态分布方程。,8,平均值相同,精密度不同,9,三、偶然误差的区间概率,将正态分布曲线横坐标以u表示,令u=,得y=,对其进行积分:,说明:(1)正态分布曲线与横坐标到之间所夹面积,代表所有数据出现的几率总和其值等于1,(2)若改变积分区间,可得围成的不同面积。,10,随机误差在某一区间出现的概率,可以取不同的u值进行积分.,0123+,-,-3-2-1,u=,(x=+u),68.3%,11,随机误差出现区间测量值出现区间概率,u=1x=168.3%,u=1.96x=1.9695.0%,u=2x=295.5%,u=2.58x=2.5899.0%,u=3x=399.7%,说明:若是求测量值在u区间出现的概率,p57表值2因为它列出是u的单边。若是求0到+u或-u区间出现概率,为单边区间不用乘2,12,u检验:在无系统误差的情况下,检验u(或单边)范围内分析结果(或随机误差)出现的概率。,用单次测量值:=xu,用平均量值:,并且u检验适用于已知的正态分布方程N(,2),例题p588,13,例题:某炼铁炉中铁水含C量符合正态分布方程(4.550.1082)现对某日一炉铁水分析5次4.284.434.424.354.30,如果分析正常(无系统误差),问这炉铁水是否合格(p=95%),解,x,4.36,查表知:p=95%时,u计3.93u表1.96,分析结果不在要求的范围内,这炉铁水不合格,14,3少量数据的统计处理,一、t分布曲线(有限次测量),t=,n,正态分布,u=,15,P(置信度):指在某一t值下,测定值落在(ts)范围内的概率.,t分布曲线与正态分布曲线相似,t分布曲线下一定区间内的积分面积就是该区间内随机误差或测量值出现的概率,t分布曲线不仅随t值改变还与f有关。,P61表33列出不同f值及p值所对应的t,f值,f(自由度):f=n-1,(显著性水准):=1-P,指测定值落在(ts)范围之外的概率.,如:t0.05,10=2.23表示95%置信度,自由度为10的t值(2.23),t0.01,8=3.3699%.8(3.36),16,二、平均值的置信区间(分析结果的表示方法),表示在一定置信度下,以平均值X为中心,包括总体平均值的范围.,置信区间,总体平均值,X测得数据的平均值,S标准偏差t,f表值,n测量次数,17,对某未知试样中Cl-测定4次,47.64%47.69%47.52%47.55%计算置信度90%95%99%时,总体平均值置信区间,解:X=47.60%,P=90%,t0.10,3=2.35,P=95%,t0.05,3=3.18,P=99%,t0.01,3=5.84,18,说明:要求的p不同,包括总体平均值的范围不同。置信度越高(p越大),置信区间越宽即所估计的区间包括的可能性就越大;p越小,置信区间越窄,精密度好但可靠性差即包括的可能性就小。所以我们即要考虑到可靠性又要考虑到置信区间,一般在分析工作中选p=95%或p=90%.,19,三、显著性检验,在实际工作中往往会遇到下列几种情况:,a.某一分析人员对标准试样进行多次分析,所得平均值与标准值进行比较存在差异,b.采用两种不同的方法,分析同一试样所得两组数据的平均值有差异,c.两个不同的分析人员或不同实验室,对同一试样进行分析所得结果也存在差异,判断是系统误差引起的还是偶然误差引起的要进行t检验和F检验。,20,1.t检验,在一定的置信度下,检验一组测量值在测量过程中有无系统误差;也可检验一种分析方法是否存在系统误差;或者与标准值比较是否存在显著性差异。,同t,f表值进行比较,若t计t表说明无显著性差异,不存在系统误差,若t计t表说明有显著性差异,存在系统误差,21,2000年中科院考题(10分)采用一种新的分光光度法测定不锈钢中Ni%结果:1.561.401.481.421.461.48已知标样中Ni含量的标准值为1.40,当置信度95时问(1)求出测量结果的置信区间(2)新方法是否存在系统误差,解:(1),P=95%查表,,t0.05,5=2.57,22,(2)t检验,t表=2.57,有显著性差异,新方法存在系统误差,23,2005年中科院考研题(10分)电分析法测定某患者血糖的浓度(mmol/L)10次测定结果:7.57.47.77.67.57.67.67.57.67.6.求(1)相对标准偏差(RSD)(2)置信区间(p=95%)(3)正常人血糖标准值为6.7mmol/L,问此人血糖是否异常,解:(1),24,(2),(3),存在显著性差异,此人血糖有异常。,t表=2.26,25,2.F检验,检验来自同一总体两组测量值的精密度有无显著性差异,设:甲n1次x1S1=0.037,乙n2次x2S2=0.040,F表有显著性差异(表P64),F表无显著性差异,26,例题:甲、乙二人对同一试样用不同方法进行测定:甲:1.26,1.25,1.22乙:1.35,1.31,1.33,1.34问两种方法的精密度之间有无显著性差异?,解:n甲=3,S甲=0.021,n乙=4,S乙=0.017,说明两组的精密度无显著性差异(p=90%),查表F2,39.55,27,说明:判断某组数据的精密度是否大于、等于、小于或者优于另一组数据的精密度为单边(=0.05p=95%);若判断两组数据的精密度有无显著性差异为双边(=0.10p=90%),28,3.检验来自同一总体两组数据的平均值是否存在显著性差异(先F检验,再进行t检验),a.先通过F检验若,F表说明两组数据的精密度无,显著性差异,再进行t检验。否则存在显著性差异。,b.通过F检验后,S1与S2无显著性差异;求它们的合并偏差,再进行,29,若t计t表说明两组数据的平均值有显著性差异,若t计t表.无.,说明:查p61中表t,ffn1n22(总自由度),30,例题:用两种方法测得Na2CO3%方法一、n1=5x1=42.34S1=0.10方法二、n2=4x2=42.44%S2=0.12问两组数据的平均值是否有显著性差异(p=90%),解:,查表F3,4=6.59,两组数据的精密度无显著性差异,t检验:,31,知f总=n1n22=7,查表t0.10,7=1.90,说明两组数据的平均值无显著性差异,t计,32,2006年中科院考研题(15分)某同学用重量法测定合金标样中Ni%得如下数据:10.3710.3210.4010.5810.4710.54;指导教师用同样方法也测定6次其平均值为10.17%,标准偏差为0.05%问(1)学生测定结果的置信区间(2)指导教师测定结果是否显著优于学生的测定结果p=95%,解:(1),查表t0.05,5=2.57,33,(2),F5,5=5.05(表值),t0.05,10=2.23,有显著性差异,说明指导教师的测定结果显著的优于学生的测定结果。,34,四、异常值(可疑值、离群值)的取舍,xT,0,6次测定,离群值,舍去还是保留?,35,(一)4法,测量值40.0040.2040.1840.1640.1240.19,1.将数据由小到大排列,确定异常值,40.0040.1240.1640.1840.1940.20,40.00是异常值,2.计算不包括异常值在内的平均值(xn-1)和平均偏差(dn-1),36,3.判断异常值的取舍,异常值舍去,异常值保留,上例:,40.022,异常值40.00应该舍去,优点:不查表,通过计算得出结论,37,(二)Q检验法,1.先将数据由小到大排列,确定异常值。40.0040.1240.1640.1840.1940.20,2.计算,3.根据不同置信度的要求,查p68Q表值与Q计比较。,若Q计Q表异常值舍去,若Q计Q表异常值保留,38,要求p=90%:Q计=0.6Q表(0.90,6)=0.5640.00舍去,Q计=0.6Q表(0.96,6)=0.6440.00保留,Q检验法选用不同的置信度对异常值的取舍不同,置信度越小,要求的精密度就越高;反之则相反。,p=96%:,39,(三)Grubbs法(格鲁布斯T法),1.将数据由小到大排列,确定异常值(仍以上题为例),2.求出该组数据的平均值x和标准偏差S,3.计算T值,40,4.根据不同置信度要求查p67T,n表值,判断异常值取舍,P=95%查T0.05,6=1.82T计=1.89异常值40.00应舍去,P=99%查T0.01,6=1.94T计.保留,T计T表异常值舍去,.保留,41,说明:以上三种方法比较以Grubbs法最合理、最准确,因为它涉及到在数据处理中两个重要参数x和S,它能充分的利用所有数据,它即考虑到了准确度又考虑到了精密度。,42,2007年中科院(10分),用新方法测定某试样中Zn%,平行6次测
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论