标准解读

《GB/T 8056-1987 数据的统计处理和解释 指数样本异常值的判断和处理》这一标准,主要针对在数据分析过程中遇到的指数分布样本中可能存在的异常值问题,提供了系统性的方法来识别这些异常值,并给出相应的处理策略。该标准适用于需要对数据进行精确分析与处理的各种领域,如科学研究、质量控制等。

首先,它定义了什么是异常值:在一组给定的数据集中,如果某个或某些观测值与其他大部分数据相比显得过于极端,则可被视为异常值。对于遵循指数分布的数据集来说,这类值的存在可能会严重影响到统计分析的结果准确性。

接着,标准介绍了一系列用于检测指数分布样本中是否存在异常值的技术手段,包括但不限于基于概率模型的方法(例如使用Grubbs' test或者Dixon's Q test)。这些测试通常会设定一个显著性水平(比如0.05),通过比较观测到的最大或最小值与理论上的临界值来决定是否将特定数据点标记为异常值。

此外,《GB/T 8056-1987》还讨论了当发现确实存在异常值时应采取何种措施。这些建议涵盖了从简单地删除异常值到采用更加复杂的数据调整技术等多个方面。值得注意的是,在实际操作中选择哪种方式取决于具体的应用场景以及研究人员的专业判断。

最后,本标准强调了在整个过程中保持透明度的重要性,即任何关于异常值识别及其后续处理的决策都应该被详细记录下来,以便于他人能够复现研究过程并对其结果进行验证。


如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。

....

查看全部

  • 被代替
  • 已被新标准代替,建议下载现行标准GB/T 8056-2008
  • 1987-07-08 颁布
  • 1988-04-01 实施
©正版授权
GB 8056-1987 数据的统计处理和解释 指数样本异常值的判断和处理_第1页
GB 8056-1987 数据的统计处理和解释 指数样本异常值的判断和处理_第2页
免费预览已结束,剩余14页可下载查看

下载本文档

GB 8056-1987 数据的统计处理和解释 指数样本异常值的判断和处理-免费下载试读页

文档简介

056一87of of 参数)的随机样木中判断和处理异常观测值的一般原则和实施方法。适用于来自指数总体或近似指数总体的样本,即除了个别或少数异常值外,其余大部分数据(主体数据)来自同一个指数总体或近似指数总体。指数分布的分布函数为:尸(X)二1一0X 0XU (1)概率密度函数为,(X)=称异常值)是指样木11元eX9X、_u.2)0的个别值,其数值明显偏离它(或它们)所在样本的其余观测值。 值可能仅仅是数据,】州有的随机变异性的极端表现,若确是这样,就应把它和样木,其它观测值以同样的方式对待。是在计算或记录这个数值时出现的失误。这种异常俏与其它观测值不属同一个总休。2引用标准358计学名词及符号统计分布数值表3符号及其意义X()n(刀”(飞)一一”(”)万)(1一a):(a)衬。(v,,测值j,自小到大的第本大小,4a 10。时,检验最大的观测值X(.)是否为异常值时所用的统计量。样本大小。叹1000寸,检验最小的观测值X(1)是否为异常值时所用的统计量。样木大小n100时,检验最大的观测值刃(。是否为异常值时所用的统计鼠。样本大小。100时,检验最小的观测值X (1是否为异常值时所用的统计著性水平为统计量7。(。)作检验时的临界值。显著性水平为统计量7:u)作检验时的临界值。自由度为的,.卫定数截尾样本.,判断h1是否为异常小时所用的统计v% 056一87判断异常值的统计学原则判断一个观测值是否为异常值时,通常可根据技术卜或物理如当实脸者已经知道实验偏离规定的实验方法,或测试仪器发生问题等等。当上述理由不明确时,可用统计方法。,的异常值:单侧情形a):根据以往经验,异常值都为佰端值;单侧情形b):根据以千经验,异常值都为低端值;双侧中韶(规定在样本中检出异常值的个数的卜限(占样木观测值个数的较小比例),当超过了这个卜限时,对此样本的代表性,应作慎重的研究和处理。为原假设;后根据统计学原理构造判断异常值的统计量。荐的而不宜采用超过5%的据确定统计4将该批数据代人统计u,所得统计判断事先待查的极端观测值为异常;否则就判断没有异常值。的个数可大于1的情标准规定的方法是重复使用同一种判断单个异常俏的检验规则,没有检出异常俏,则铭个检验停11:;若检出了1个异常值,就再用相同的显著性水平和相同的规则,对除去已检出的异常值后余下的观测值继续检验,直到没有检出异常值,或检出的异常值个数达到仁限为止。尽可能寻找其技术上的和物理上的原因,作为处理异常值的依据。把异常值从样本追加适宜的观测值计人样本。衡寻找产生异常值原因的花费,正确判断异常值的得益及错误剔除正常观测定实施下述几个规则中的一个:无充分的技术上或物理上的原因,则不得剔除或进行修,几。l l,除有充分的技术上或物理统计仁表现为高度异常的(即本标准规定的显著性水平显著的观测值),才允许剔除或进行修正。予记录,以备查询。样木大小。-, 100时,使用统n (n)(或.)进行检验。lf,i a)_:100时,按卜法实施:,)的佑:056一87一T,。X,。)(1一a)时,判X (n)为异常值,乏戈f”,)否则就判为没有异常值(1 当T 100时,按下法实施:n)的值:F(。、(X(。)犬,1) )(a)E - A (出对应当F。)的值大于2,2。一2)时,判x(。)为异常侦,00时,按法实施:,,的值:n(”一1)X (1)Fn 一6)艺 k;一。X!),在,查出对应一。,, 2。一2)。当的值小:临界值,2。一2)时,判万、1)为异常值,否则就判为没有异常值。x;100时,按下法实施:、,T.(,)的值。确定显著性水平a,在表A1 出对应于八,号的临界值了。(。,(1一号,;在表查出对应于。,号的临界值丁,二告典; (7)Y, 下法实施:计算统计量E(。),E。(。的值。确定显著性水平a,在尸变量的分位数表中,杳出对应于”,号的临界值,2”一2)2么叹和2z 2”一2)。i x,.(8)a)夕 1,E (1), 2”一2)时,判X ()为异常值,否则就判为没有异常值。测量后得到观测值如卜: 893 否为异常值,取a 15,计算得。由表 15)(5 (15) T 15(,:,(故不能M 2从一指数总体中得到。个观侧值,得到=1戈“。100,最小的观测值X 本大小。=101,检验X (1) = 算得E 11)=,2),2。一2),故判X (1) =判断多个异常值的规则当样本中可能有多个异常值需要检验时,单侧情形a),b)的规则执行,具体判断异常值的方法,数截尾(右边)样本中最小的观测值X(,)边)样本。从总体中抽取。个个体,按数值由小到大的次序排列,取其前1) X (2)喊X (.)1 )是否为异常小时,按下法实施:.,(I)的值。n (,(1)二9)2: X()+(。一r) X (r)一。X、)288确定显著性水平a,在出对应于r, (2,2。一2)。、,)小于,2,判X 为异常小,否则判X ,)为非异常值。056一87附录A(#卜充件)表A I T。:;:;:;:;:.:7吕91011此1314巧1617比1920刽咒邓朋2526罗洲朋303132洲服艺89:一:056一87续表T川的临界俏农()108. 2006 x x !x x x 105 x x x x 101. 2496 x x x 101 x x x x 102.5 x x x x x )x 0x 10,x 10,x 0-x 10,2. 116 x 10,x 10,x 10,x 0,x 10,x 0 9. 12 x 10-0 x 10-x 10-x 10 x 10-x x 10-x 10-x 10-x 10 x 10-x 10“0-0-x 10-x 10-x 10”x x 10,x 10-x 10 x 10 x 109. 1321 x x x x x 1862 x:.:x x x x x x x x x x x 101. 1550 x x 101.()130x x x x x x x x 106. 1275 x x x x 105. 0753 x x x x x x x x x x x x x x 10、x 10026 x x 10 x x 10,x 10,x 10。x 10,x 10。x x x 10,x 10x 10“x x 10,802 x x 10,x x 10,x 10,x 10,x 10,0,x x x x x x x x x x x x x x x x 105. 1664 x x x x x x x x x x x x x 10-x 1010“x 100 x x 10x 10 x 10-10-x 10-0-x 1010-x 1000-x 10-x 10-x x x x 10x 10 x x 103. 3836 x 10 x 10-3. 1483 x 1010x 10-x 10-x 10-x 10-x 10-2. 4924 x 10-x 10-x 10x 10,x 10x 10-x 10079- x x 109. 54 x 109. 17 x x x x 10 01 x 100807 0 10 x 108.7 x 10 8.5 x 10-8.4 x 10 x 10-7.8 x 107 x 10 x 107.2 x 101 x .7 x 10-:.:;x x 10-x 10 0., 10-x x 10-x 10-x 0-x x 10-10-x 10 x 1021 x x x x 107. 16 x x x x x 106. 05. 89 x x x 105. 22 x x x 104. 68 x x x x 104. 20 x 104. 11 x x x x x x x x x x x x x x x x x x 4009 x 0x 10:x 10x 10-x x x 100928 x x 100、x x x 10-10,x 10 x 10 x 10,0,x 10,x x x 10-7. 3548 x 10-0 x 10 绷49505152洲5455565758朋60616263叔65666768朋70717273刊757677787980818283848586卫明 x 10-6.6 x 10,6.4 x 10-6.1 x 106.0 x 10-6.0 x 10-10-5.7 x 10-5.5 x 10-5.4 x 10-5.4 x 10-5.3 x 10-5.1 x 10-100 x 10x x 10-100x 101. 1254 x 101. 1020 x 10-10x 101. 0359 x 10-x 1

温馨提示

  • 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
  • 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
  • 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。

评论

0/150

提交评论