标准解读
《GB/T 6380-1986 数据的统计处理和解释 I 型极值分布样本异常值的判断和处理》是一项国家标准,主要针对在I型极值分布背景下如何识别数据集中的异常值,并提供相应处理方法。该标准适用于需要对极端事件进行分析的情境下,如环境科学、工程安全评估等领域,通过对数据集中潜在异常值的有效识别与适当处理,提高数据分析结果的准确性和可靠性。
根据此标准,首先定义了异常值的概念,即那些显著偏离其他观测值的数据点,这些数据点可能由于测量错误、记录失误或确实反映了某种特殊现象而产生。接着,标准介绍了几种用于检测I型极值分布中异常值的方法,包括但不限于基于概率论原理的统计测试法。此外,还详细说明了如何计算检验统计量及其临界值,从而为判断某个特定值是否应被视为异常提供了依据。
对于被确认为异常的数据点,《GB/T 6380-1986》给出了多种处理建议,比如直接剔除、替换或者保留但需特别标注等策略。选择何种方式取决于具体应用场景以及异常值产生的原因。同时,标准也强调了在整个过程中保持透明度的重要性,确保所有步骤都有据可查,以便于后续审查或复现研究结果。
如需获取更多详尽信息,请直接参考下方经官方授权发布的权威标准文档。
....
查看全部
文档简介
中华人民共和国国家标准数据的统计处理和解释工型极值分布样本异常值的判断和处理380of of in of 型极值分布也称贡贝尔( )分布,其分布函数为尸(,x)二e,)概率密度函数为f (x)一会、一“一“,其中:4二(b, b o,一- - x.十况。当T)一一一、一2一1 0 1 2 3 1 5 象、地震以及可靠性等很多领域内有着广泛的应用。 异常观测值)是指样本中的个别值,其数值明显偏离它(或它们)所属样本的其余观测值。 异常值可能是总体固有的随机变异性的极端表现。这种异常值和样本中其余观侧值属于同一总体异常值也可能是由于试验条件和试验方法的偶然偏离所产生的后果国家标准局198605产生于观测、计算、记录 1987一05一01实施380一种异常值和样木中其余观测值不属于同总体。一:本标准使用的其它统计学名词,见计学名词和符号。应用条件:当有充分理论根据或经验确信所检验样本中诸观测值,除了个别异常值外,其余大部分值称为样本主休来自同一个型极值分布总体。当样木卜休来自同一个工型极小位分布时,经过变换型极小值分布的分布函数为F (x)=1一概率密度函数为/(x)二借、一)其中:刀二当。0(b, o,一二_x、1时的概率密度曲线如二)泣宜二一钊朋2认仇认一4 3一2一1 规定在样本中检出异常值的个数的上限(占样本观测值个数的较小比例),当超过了这个此样本的代表性应作慎重的研究和处理。22判断单个异常值的检验规则根据实际情(R,选定适宜的异常值检验规则(见本标准4);指定一个为检出异常值的统计检验的显著性水平a,简称检出水平。根据各观测值代人检验规则中给出的统计最,所得值若超过临界值,则判断事先确定待检验的最大观测值为异常值;否则就判断没有异常值。检出水平宜取为1%或5%。标准规定的方法是重复使用同一种判断单个异常俏约检验规则:没有检出异常值,则整个检验停正;若检出了一个异常值,就再用相同的检出水平和相同的规则,对除去,检出的异常值个数超过卜限为止。尽可能详找产生异常值的技术上的、物理上的原因,作为处理异常值的依据。常值保留在样本中,并参加其后的数据分析;允许剔除异常值,即把异常值从样木中剔除;允许剔除异常值,并追加适宜的观测值计人样本;在找到实际原因时修正异常值。衡详找产生异常值原因的花费,:!确判断异常值的得益及错误剔除正常观侧值的风险,确定实施下述三个规则中的一个:无充分说明其异常的技术土的、物理上的原因,则不得剔除或进行修正。理上的原因者可以剔除或进行修正外,如果在统计上表现为高度异常的,也允许剔除或进行修正。统计上表现为高度异常的意义是:指定一个为检验异常值是否高度异常的统计检验的显著性水中a*,简称剔除水平,其值小于检出水平a,实施时,按2. 2规定以剔除水平a*代替检出水平a,对检出的异常值进行检验,若在剔除水乎a* 此异常值表现为高度异常。在重复使用同一检验规则的情况下,每次检出了异常值后都要再检验它在剔除水平下是否高度异常,若某次检验中检出的异常值为高度异常,则这个异常值及在它前面检出的异常值都可被剔除或进行修正。除特殊悄况外,剔除水t=一般宜取为1%,而不宜取大于5%的值口在选用剔除水平的情况下,检出水平可取5或再稍大些。正的理由应予以记录,以备查询。取剔除水平a.= 1“、,查附表1得从彭6)二。D、;(6),(6),故判断X)复核查实,此数据系误记,2(重复使用狄克逊型检验法以判断多个异常值的示例)从某种绝缘材料失效时间分别为(单位:h)64, 15, 论此经变换X=一对来自型极伯分布的样木X(,=X (:,X,一62, 16,从,X (m。X、验最大观测仇X(I、及次大观测值刃。)是否异常。这里算统计鼠一X。)X(。一X(675取检出水平。=5%,万1,十;杳附表1得(11)再对余下的10个数据继续检验,=子D,(11),仍取检出水平a= 5。,对判断计x(。一X(,)X.()634(附表1得(10)于/)D,,。(10),故不能认为X、为异常值。:.,欧文3!本人小30。气50情形 挑选出最小观测值尤(1),最大观测值X。),以及次大观测俏一X ,S,嘶期S2, (X,)X,2_ X,380一8及最大观测俏X。)后的所有样本观测值进行的。附表2查出对应于n, n)。最大观测值一X ,:.:;:581,加1112招讨伟1617比19202122器时2526罗路2
温馨提示
- 1. 本站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究。
- 2. 本站所提供的标准均为PDF格式电子版文本(可阅读打印),因数字商品的特殊性,一经售出,不提供退换货服务。
- 3. 标准文档要求电子版与印刷版保持一致,所以下载的文档中可能包含空白页,非文档质量问题。
最新文档
- 2025四川成都交通投资集团有限公司春季校园招聘10人笔试参考题库附带答案详解
- 日照职业技术学院《医用电子学》2023-2024学年第二学期期末试卷
- 安徽工贸职业技术学院《工程结构抗震A》2023-2024学年第二学期期末试卷
- 贵州经贸职业技术学院《显微构造地质学》2023-2024学年第二学期期末试卷
- 萍乡学院《ORACE数据库》2023-2024学年第二学期期末试卷
- 集宁师范学院《nternet协议分析A(实验)》2023-2024学年第二学期期末试卷
- 沈阳城市建设学院《剧本创作》2023-2024学年第二学期期末试卷
- 青岛职业技术学院《教育基础理论理工》2023-2024学年第二学期期末试卷
- 和君职业学院《资源循环科学与工程概论》2023-2024学年第二学期期末试卷
- 上海民远职业技术学院《专业导论(人工智能)》2023-2024学年第二学期期末试卷
- 中央空调系统(多联机)改造设计方案
- 教师教学能力比赛-教学实施报告(计算机-网络系统集成)
- 2023年中级《专业知识与实务(农业)》核心考点题库300题(含详解)
- 水泥砂浆砌毛石排水沟施工方法
- XX站既有雨棚拆除及新建雨棚安装施工专项方案
- 内镜室护理组长竞聘演讲
- 酒店如何做年度经营分析
- 《一本书读懂Web3.0区块链、NFT、元宇宙和DAO》读书笔记
- 客服线上运营方案
- 项目管理班子人员岗位职责及分工
- 《物控培训资料》课件
评论
0/150
提交评论