粗大误差四种判别准则的比较_第1页
粗大误差四种判别准则的比较_第2页
粗大误差四种判别准则的比较_第3页
粗大误差四种判别准则的比较_第4页
粗大误差四种判别准则的比较_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

粗大偏差四种鉴别准则的比较之宇文皓月创作粗大偏差是指在测量过程中,有时发生的某些不应有的失常要素造成的测量数值高出正常测量偏差范围的小概率偏差。含有粗大偏差的数据会扰乱对实验结果的剖析,甚至扭曲实验结果。若不按统计的原理剔除异样值,而把一些包括较大正常偏差但不属于异样值的数据舍弃或保留一些包括较小粗大偏差的异样值,就会错估了仪器的精准等级。所以,系统查验测量数据能否含有粗大偏差是担保原始数据的靠谱及其相关计算的正确的前提。清除异样数占有四种较常常使用的准则,分别是拉伊达准则、格拉布斯准则、肖维勒准则和狄克逊准则。每种鉴别准则都有其办理方法,致使用分歧准则对异样值鉴别的结果有时会纷歧致。当前异样值的剔除还没有一致的准则,本文综合鉴别粗大偏差四种方法的特色,系统概括各样准则的应用,以便更好地发现和鉴别含有粗大偏差的数据。四种鉴别粗大偏差准则的特色1.1拉伊达准则拉伊达准则[4]是以三倍测量列的尺度偏差为极限弃取尺度,其给定的置信概率为99.73%,该准则合用于测量次数n>10或早先经大批重复测量已统计出其尺度偏差σ的状况。Xi为听从正态散布的等精度测量值,可先求得它们的算术均匀值X、残差vi和尺度偏差σ。若|Xi-X|>3σ,则可疑值Xi含有粗大偏差,应舍弃;若|Xi-X|≤3σ,则可疑值Xi为正常值,应保留。把可疑值舍弃后再从头算出除掉这个值的其余测量值的均匀值和尺度偏差,而后持续使用鉴别依照判断,依此类推。1.2格拉布斯准则格拉布斯准则合用于测量次数较少的状况(n<100),往常取置信概率为95%,对样本中仅混入一个异样值的状况鉴别效率最高。其鉴别方法以下:先将呈正态散布的等精度多次测量的样本按从小到大摆列,统计临界系数G(a,n)的值为G0,而后分别计算出G1、Gn:G1=(X-X1)/σ,Gn=(Xn-X)/σ(1)若G1≥Gn且G1>G0,则X1应予以剔除;若Gn≥G1且Gn>G0,则Xn应予以剔除;若G1<G0且Gn<G0,则不存在“坏值”。而后用剩下的测量值从头计算均匀值和尺度偏差,还有G1、Gn和G0,重复上述步伐持续进行判断,依此类推。1.3肖维勒准则肖维勒准则是成立在频次p=m/n趋近于概率P{|Xi-X|>Zcσ}的前提下的(此中m是绝对值大于Ecσ的偏差出现次数,P是置信概率)。设等精度且呈正态散布的测量值为Xi,若其残差

vi

≥Zcσ则

Xi

可视为含有粗大偏差

,此时把读数

Xi

应舍弃。把可疑值舍弃后再从头计算和持续使用鉴别依照判断

,依此类推。1.4狄克逊准则狄克逊准则是一种用极差比两侧查验来鉴别粗大偏差的准则。它从测量数据的最值下手,一般取明显性水平a为0.01.此准则的特色是把测量数据区分为四个组,每个组都有相应的极端异样值统计量R1、R2的计算方法,再依据测量次数n和所对应的统计临界系数D(a,n)依照以下方法来鉴别:若R1>R2,R1>D(a,n),则鉴别X1为异样值,应舍弃;若R2>R1,R2>D(a,n),则应舍弃Xn;若R1<D(a,n)且R2<D(a,n),则没有异样值。四种鉴别粗大偏差准则的比较2.1四种鉴别粗大偏差准则的概括实质上教课实验中的测量样本大多比较小,四种准则所要求的正态散布前提不简单知足,尺度偏差会因为偏离正态散布而禁止确。若不考虑详细的临界系数与置信水平,这四种准则的思想方法都可概括为

:第一计算某组测量值

X1,X2,X3Xn

的均匀值x、残差

vi

和尺度偏差σ。关于第

i

次测量值

,假如

vi>k

σ

(2)则可鉴别为含有粗大偏差,此中k为统计临界系数。狄克逊准则是用极差比来检测异样值的,它的统计临界系数与其余准则不具有可比性。除狄克逊准则外,作拉伊达准则、格拉布斯准则和肖维勒准则在测量次数3≤n≤250的曲线关系,见图1。2.2四种鉴别粗大偏差准则的比较议论拉伊达准则、格拉布斯准则和肖维勒准则的对照曲线能够看出:对应于同样的测量次数,各判别准则的统计临界系数各不同样,以拉伊达准则的统计临界系数3为线索,当n=25时,格拉布斯准则(a=0.01)的统计临界系数恰好抵达3以上,而当n=185时,肖维勒准则的统计临界系数恰好也抵达3。所以可把总范围分为以下三个小范围。在3≤n<25这个范围内,建议用狄克逊准则或格拉布斯准则(a=0.01)来鉴别可疑数据。在少许样品时,拉伊达准则的统计临界系数相对照较大,不简单实时发现异样数据,使用它会比较苛刻。而肖维勒准则的统计临界系数太小,简单剔除仅含有较大正常偏差的测量值。所以用可一次性剔除多个异样值且无需求出样本均匀值X、残差vi和尺度偏差σ的狄克逊准则或格拉布斯准则(a=0.01)来鉴别据是合

测量次数范围建议使用的准则3≤n<25狄克逊准则,格拉布斯准则(a=0.01)25≤n≤185格拉布斯准则(a=0.05),肖维勒准则n>185拉伊达准则

可疑数适的。在25≤n≤185的范围内,建议用格拉布斯准则(a=0.05)或肖维勒准则来鉴别可疑数据。统计临界系数最大的是格拉布斯准则(a=0.01),固然肖维勒准则的统计临界系数偏小,但在这一范围内肖维勒准则能够填补拉伊达准则的缺少,所以鉴别数据时采纳格拉布斯准则(a=0.05)或肖维勒准则比较适合。在测量次数n>185时,建议采纳拉伊达准则。因为此时肖维勒准则的统计临界系数偏大,在剔除异样值时简单把含有较小粗大偏差的数据遗遗漏。所以,为了更好地对测量数据作出切实的判断且尽量防备让被剔除的数据丢掉整体信息,能够采纳以下方法:鉴别前最好先依照从小到大摆列测量数据。第一思疑最值,假如最值不是异样值则其余值也就不会含有粗大偏差了。对此四种准则的综合鉴别方法,见表1。表1综合鉴别方法结论综上所述,因为四种鉴别准则在理论上剔除异样值是各自相关于某个精度而言的,它们的检验范围和鉴别成效分歧,在分歧的状况下应用分歧的准则的严格程度分歧,但不加比较随意使用某一种准则来鉴别测量值能否含有粗大偏差,这样有时会获得相对禁止确的结论,可能把仅包括正常偏差的可疑值剔除了,或许保留了含有粗大偏差的异样值。本文中的图1直观了然、使用方便,所以采纳本文建议的综合归纳方法能够使在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论