




已阅读5页,还剩53页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第7章分析化学中的数据处理7.1标准偏差(标准差或均方误差)7.2随机误差的正态分布7.3少量数据的统计处理7.4误差的传递7.5回归分析7.6提高分析结果准确度的方法,.,几个概念(术语)1、总体(母体)所研究对象的某特性值的全体。2、个体总体中的每一个单元,指全体中的一个单位或某一次测定。3、样本(子样)从总体中随机抽出的一组测量值或指总体的一个部分。4、样本容量(样本大小)指样本中个体的数目,或样本中测量值数目。,.,总体、个体、样本、样本容量间的关系当n时:又n20次,有限次测量,且无系统误差当n时:n20次,无限次测量,且无系统误差,个体,样本平均值,样本容量,总体平均值,样本平均偏差,总体平均偏差,.,7.1标准偏差(标准差或均方误差)7.1.1总体标准偏差当n时:测量值x对总体平均值的偏离用表示。(此式应用于n,=xT;无系统误差)式中:差方和(它能更好地说明数据的分散程度),.,7.1.2样本标准偏差S(n为有限值,一般20且无系统误差)同样:式中差方和(即偏差的平方和)S与比较:(1)用代替了;(2)用n1代替了n。式中:n-1=f自由度标准偏差的计算:(等效式,可直接利用测量数据计算),.,7.1.3相对标准偏差(变异系数或变动系数)相对标准偏差=(或1000)7.1.4标准偏差(或s)与平均偏差(或)的异同点1、不必考虑偏差的正负号2、(或s)增强了大偏差数据的作用如P243-二组数据:可见:S3、与的关系统计学证明:当n时,=0.8(即),或4=3(但有的书中也有=0.8S或4=3S)。,.,7.1.5平均值的标准偏差,统计学上证明:(无限次测量)或:(有限次测量),.,可见:(1)且是S的倍,即:平均值的误差按测定次数的比例减小;(2)上式的意义:(3)增加测定次数n,可以提高测定结果的精密度,但事实上增加n所取得的效果是有限制的。,即:4次测量时:是S的1/2倍9次测量时:是S的1/3倍酬答依次减小25次测量时:是S的1/5倍,.,同理:单次测量的()与平均值的间也有:(无限次测量)(有限次测量),.,7.2随机误差的正态分布7.2.1频数分布,频数(ni)每组中出现的数据个数相对频数(或频率)频率密度以频数(或频率密度)组值范围作图,得频数(或频率密度)分布直方图。(见P245-图7-1),.,7.2.2正态分布(高斯G.F.Gauss分布)对上述分析数据进行整理时,数据具有以下特性:向某中心值集中的趋势;偏离此中心值的倾向。为明确表达数据的特性,我们通常用两个特性参数来表征一组数据:(1)数据的集中趋势(2)数据的离散倾向1、正态分布曲线,.,式中:y相当于测量值x出现的频率密度(或概率密度)相当于总体平均值相当于曲线最高点对应的横坐标值,表征数据的集中趋势总体标准差相当于到曲线两拐点之一的距离,表征数据的分散程度x(自变量)个别测量值x-代表测量值对的偏离(表征随机误差),.,随机误差有以下规律:(1)单峰性当x=时(无系统误差时=xT),ymax体现了测量值的集中趋势,或()是最佳值或最可信赖值;(2)对称性曲线以x=为对称轴,呈钟形对称,说明正负误差出现的机率相等;(3)有界性当x+或x时,曲线以x轴为渐近线,即:大误差出现机率小,小误差出现机率大;(4)当x=时概率密度测量值落在dx范围内的概率,.,当时,数据分散,分布曲线平坦(矮胖);当时,数据集中,分布曲线尖锐(高瘦)。当相同,不同时,曲线形状一致,而位置发生左(或右)移,所以的大小代表数据集中于何处。(5)所以只要、确定之后,分布曲线便确定下来,这种分布曲线记作:,.,2、标准正态分布曲线为一方便求出某区间的概率,将横坐标进行变量代换。定义:(即:以为单位来表征随机误差)则:概率即这样的曲线称之标准正态分布曲线,记作N(0,1),.,标准正态分布曲线的特征是:(1)当X=时,y有极值,当=1时(2)正负误差出现的机会均等;(3)大误差出现的概率小,小误差出现的概率大。,.,7.2.3随机误差的区间概率实际分析工作中,对误差有两类问题需回答:(1)某一给定范围的测定,这些测定出现的机会是多少?(2)为保证测定有一定把握,这些测定的误差可以要求在什么范围内?以上这些问题的回答都要知道误差的区间概率,(即概率密度的积分),.,正态分布曲线y与横轴所夹面积表示全部数据出现的概率的总和,显然:曲线与横轴间所夹面积=正态分布密度函数在x+区间的积分值,它代表了各种大小偏差的本样值出现概率的总和。,.,或:某范围内测量值出现的概率=该部分面积/总面积或:取不同u值对积分得到。P248-表7-2为:的积分值即概率单边值。,.,注意:(1)表中积分值的上下限为0u(单边),若考虑|u|时,应将积分值2(双边),同样:若考虑|u|以外的概率=12P(双边)或u的概率=0.5P。(2)由此表可计算随机误差或测量值出现在某区间内(或外)的概率。(3)此表的另一个应用:可以从概率倒过来找误差界限(范围),.,可见:随机误差超过3的测量值出现的概率很小(仅0.3%),一般这样的极端值可舍弃(所以常将3称之随机误差的极限值)。,.,例1:某年全国参加高考的学生化学成绩平均值为=75分,=10分,若满分为100分,总分为120分,计算:高于100分和不及格(低于60分)学生的概率。解:x=ux=100时:x=60时:查P248-表7-2知:|u|=2.5时,P=0.4938|u|=1.5时,P=0.4332。高于100分学生概率为:0.5000-0.4938=0.062低于60分学生概率为:0.5000-0.4332=0.0668,.,例2:求测量值落在区间(-0.7,+0.7)的概率。解:,x=u当u=0.7时,查P248-表7-2知:P=0.2580求得其概率P=0.25802=0.5160=51.6%例3:求测量值落在(-0.4,+1.0)区间的概率解:|u1|=0.4时,查P248-表7-2知:P=0.1554|u2|=1.0时,查P248-表7-2知:P=0.3413求得其概率P=0.1554+0.3413=0.4967(49.67%)可见:当两区间宽度相等时,测量值落在对称区间的概率大于不对称区间的概率,这种现象对正态分布来说是普遍的。,.,例4:某班学生117个数据基本遵从正态分布N(66.62,(0.21)2),求测量值落在(66.1567.04)中的概率。解:=66.62,=0.21,而当x1=67.04时,查得P1=0.4773当x2=66.15时,查得P2=0.4861P=0.4773+0.4861=0.9634(96.34%)同理:落在66.1567.04以外的概率=1-96.34%=3.66%(4%)理论上约有1173.66%=4.28=4个数据落在上述范围以外(事实也如此),故:这批数据的确符合正态分布。,.,7.3少量数据的统计处理只有当n时,这时才能准确无误地找到,显然,这是做不到的,实际工作中,涉及的测量数据通常不多,此时得到的总带有一定的不确定性,由于xT不知,所以是算不出来的。若以代替xT,以S代替,而又按理论上的正态分布来处理实际问题,是不合理的,甚至可能得到错误的判断。为了解决用统计方法处理有限次测量数据,并能合理的地推断总体的特性问题,英国统计学家兼化学家戈塞特(W.S.Gosset)以笔名“student”发表了其研究工作,提出在统计处理少量实验数据时,为了补偿以S代替带来的误差,可以根据测量数据的多少,用另一数值“t”代替“u”,这一代替和补偿的办法称之“t分布”或“学生氏t”法。,.,7.3.1t分布曲线在进行有限次测量时,用S代替所带来的误差,用一新的量“t”来补偿。t值的定义为:(对应)注:有些书中定义:在t分布曲线中:纵坐标概率密度横坐标t值。,0.4,.,可见:当n时,t分布正态分布。同理:t分布曲线下某区间的面积也表示随机误差在该区间内的概率。t分布中,t值随概率和f值变化。(不同概率和f值对应的t值,见P250-表7-3)注意:(1)表中:P置信度(置信概率),它表示在某t值时,测量值x落在ts范围内的概率(或代表我们相信测量值x的误差不超过ts的把握);(2)显著性水准(危险率):它表示测量值x落在ts以外的概率,显然:=1P;(3)当f时,tu(当f=20时,t与u已很接近)。,.,7.3.2平均值的置信区间分析测量结果可表示为:(或:=xts)=xts或=xu表示:在一定置信度时,以测量值x为中心的,包括总体平均值在内的可靠性范围置信区间。而或表示:在一定置信度下,以样本平均值为中心的,包括总体平均值在内的可靠性范围平均值的置信区间。以上关系式也表明了平均值(或xT)与总体平均值的关系,即:说明了平均值的可靠性。,.,例1:钢中铬百分含量的测定,先测两次:1.12,1.15,再测三次:1.11,1.16,1.12。试计算按两次和五次测定的数据来表示平均值的置信区间(=0.05)。解:两次测定:=1.14(%),S=0.021(%),三次测定:=1.13(%),S=0.022(%),可见:同一置信度下n(f),置信区间;S,置信区间,平均值的可靠性。,.,例2:P251-例5。解:P=0.90时,=(47.600.09)%P=0.95时,=(47.600.13)%可见P,置信区间P=0.99时,=(47.600.23)%所以置信概率越高,置信区间就越宽,判断失误的机会就越小。反之,则判断失误的可能性上升。统计意义上的推断通常不把P定为100%,而通常将P定为95%或90%。注意:对平均值的置信区间必须正确理解如例1中:(1.130.03)%表示“在此区间中包括总体平均值的把握为95%”,若理解为“在未来测定中,实验平均值有95%落在(1.130.03)%区间内”是错误的。,.,7.3.3显著性检验在定量分析中,当我们取得一系列数据后,必须对这些数据进行正确的评价,要肯定地回答这些数据是否全部有效,是否存在系统误差,对于比较两种分析方法或两实验室的分析结果,或进行各种测定条件下试验等实验结果作出合理的判断。所谓“显著性检验”就是利用统计的方法来检验被处理的问题是否存在统计上的显著性差异即:“假设检验”。,.,1、t检验法(1)平均值与标准值的比较方法:如一批数据:n,S,f=n1,并已知标准值。计算:;查P250-表7-3得;比较:若,则有显著性差异(存在系统误差);若,则无显著性差异(不存在系统误差),.,此类t检验法可应用于以下几个方面:已知(如标样的标准值);已知其理论值,且误差是正态分布的,所以此理论值视为;常规分析中,产品规格所定的值视作;已作过一组n20的数据,其可视作,则另一组n值较少的数据可与之比较。,.,例:某厂生产复合维生素丸,要求每50g维生素丸中含Fe2400mg,从某次生产中随机抽取部分试样测定五次,得铁含量如:2372,2409,2395,2399,2411,问此产品是否合格?解:n=5,f=4,查P250-表7-3知:,无显著性差异,故此产品合格。,.,(2)两组平均值的比较方法:先进行F检验,证明两组数据的精密度间无显著性差异;再用t检验,证明两平均值间无显著性差异。设:两组测定结果计算:;查P253-表7-4的F表;比较:若FF表,无显著性差异,反之,FF表,有显著性差异;用t检验法(检验与间有无显著性差异):计算t值:,.,式中:合并标准偏差比较:t与(f=n1+n22):有显著性差异;:无显著性差异(与间差别由随机误差引起),.,2、F检验法此法通过计算两组数据的方差S2之比来检验它们之间在精密度上是否存在显著性差异。如:若,则相应地计算(F值总是大于1)比较F与F表注意:(1)进行F检验时,应确定属于单边或双边检验问题(表中单边P=95%,双边P=90%);(2)任何结论都是相对、有条件的。,.,例1:为鉴定一分析方法的准确度,取含量为100mg的某基准物进行了五次测定:100.3,99.2,99.4,100.0,99.7如何评价此组数据。解:查表,无显著性差异。讨论:=99.7100.0(低0.3mg),但S=0.45,且仅测5次,判断此法不存在负系统误差的证据不足。(此时t=1.5P=80%,即:随机误差出现的机会有20%),.,例2:在上例基础上又补充五次测定:99.9,99.4,100.1,99.4,99.6此时结果如何?解:存在显著性差异(即存在系统误差),.,7.3.4异常值的取舍(或可疑值的取舍或过失误差的判断)1、法(四倍法)(1)原理:依正态分布,偏差大于3的值出现的概率小于0.3%,所以认为该偏差属过失误差所致(属小概率事件),因为3=4,所以偏差大于4的值是属过失误差所致,在有限次测量中,4近似为4,所以偏差大于4的值应舍去。(2)方法:除去可疑值(异常值)后,求其余数据的及;判断:若,则x异应弃去,反之则保留。,.,2、Grubbs法方法:(1)将数据由小至大依次排列:x1,x2,xn1,xn(2)计算,S(全部数据的)(3)计算(4)查表:Tn(P256-表7-5)(5)判断:当TTn,则X异应舍弃,反之则应保留。,.,3、Q检验法(舍弃商法)方法:(1)将数据依小至大排列:X1,X2,Xn1,Xn(2)计算极差:R=xmaxxmin,即R=xnx1(3)计算舍弃商Q:(或)(4)查表:Q表(P257-表7-6)(5)判断:当QQ表,则X异应舍弃,反之应保留。,.,说明:(1)法较简单,不需表值,易为人们所接受,但此法数据上不严格,因为在以内或以外测定出现的机会是多少是不明确的,要找出的分布也很困难;判断中没有联系n值,且先将X异排除在外,然后检验,所以极易将有效数据舍弃(因为可疑限得较低),因此,目前使用不多,仅在要求不高,n=48次时使用。(2)Q法符合统计原理,具直观、计算方便的优点,所以常采用,但此法将可疑限订得太高,所以有时会过多保留异常值(仅适于310次测定)。(3)Grubbs法是目前最合理,舍取效果最好,使用最普通的方法,但计算麻烦(,S),当其他方法与Grubbs法发生矛盾时,以后者为主。,.,7.4误差的传递7.4.1系统误差的传递1.加减法和、差的绝对误差=各测量值绝对误差的和差如:则:2.乘除法积、商的相对误差=各测量值相对误差的和差如:则:3.指数关系分析结果的相对误差=指数倍的测量值的相对误差如:则:4.对数关系分析结果的绝对误差=0.434系数倍的测量值的相对误差如:则:,.,7.4.2随机误差的传递1.加减法分析结果的方差=各测量值方差的总和如:则:2.乘除法分析结果的相对标准差的平方=各测量值相对标准差平方的总和如:则:3.指数关系分析结果的相对标准偏差=指数倍的测量值的相对标准偏差如:则:4.对数关系分析结果的相对标准偏差=0.434系数倍的测量值的相对标准偏差如:则:,.,7.4.3极值误差(极限误差或极差误差法)1.加减法如:则:(极值误差)2.乘除法如:则:,.,例1:用一台停点的标准差为0.4mg的分析天平进行重量分析,称取含银试样0.2000g,得AgCl沉淀0.2500g,问在求Ag%时,由于称量时观察停点所带来的标准差是多少?解:而测定中:试样称量读两次停点;沉淀称量读四次停点(随机误差传递),.,例2:某滴定分析用去标液体积为25.00ml,其体积测量的标准差为0.05ml,称量试样0.2000g,其称量标准差为0.4mg,标液浓度的相对标准偏差为0.1%,试计算分析结果的相对标准偏差。解:,.,例3:电位法测定某一价金属离子的活度,若电势测定的标准差为103,求分析结果的SC/C。解:(当a为氧化态时取+,当a为还原态时取),.,7.5回归分析7.5.1一元线性回归方程如:一元线性方程(即回归方程)回归线:利用最小二乘法确立的最佳直线称之(线上所有测量值y的偏差平方和最小)回归系数:a、b1、回归系数的确定x自变量(准确的或可精确测量,严格控制的),误差较小y因变量(测量值),总带有误差,设其为e(偏差)回归线模型:n次测定后得(xi,yi),i=1,2,3n,.,令:y的偏差平方和为Q(总误差)(1)回归线是所有直线中差
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师招聘之《幼儿教师招聘》能力检测试卷附答案详解【巩固】
- 2025呼伦贝尔莫力达瓦达斡尔族自治旗尼尔基第一中学校园引才笔试备考有完整答案详解
- 未包括的互联网服务创新创业项目商业计划书
- 用户生成图文故事创作平台创新创业项目商业计划书
- 教师招聘之《幼儿教师招聘》考试模拟试卷附参考答案详解【夺分金卷】
- 教师招聘之《幼儿教师招聘》考前冲刺测试卷附有答案详解及参考答案详解【达标题】
- 智能制造数字化全产业链解决方案
- 教师招聘之《幼儿教师招聘》强化训练模考卷及答案详解【名校卷】
- 2025年四川宜宾市珙县事业单位选调13人笔试备考题库附答案详解
- 教师招聘之《小学教师招聘》强化训练模考卷【名师系列】附答案详解
- 1.3加与减①(课件)数学沪教版二年级上册(新教材)
- 2025至2030中国HPV相关疾病行业项目调研及市场前景预测评估报告
- 2025版全新离婚协议书:财产分割、子女抚养及离婚后财产保全合同范本
- 石油钻井知识课件
- 永辉超市快消培训
- “学回信精神·助改革发展”专题调研报告
- 2025年医学基础知识题库及答案
- (2025秋新版)苏教版三年级数学上册全册教案
- 2025至2030中国催收外包服务行业销售模式及未来营销策略分析报告
- 职业院校实习生考核评价标准
- 水果保鲜的秘密课件
评论
0/150
提交评论