版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ICS03.120.30GB/T28043—2019/ISO13528:2015利用实验室间比对进行能力验证的国家市场监督管理总局国家标准化管理委员会苦北京市朝阳区和平里西街甲2号(100029)北京市西城区三里河北街16号(100045)服务热线:400-168-00102019年12月第一版著书号:155066·1-63992版权专有侵权必究IGB/T28043—2019/ISO13528:2015 Ⅲ V 12规范性引用文件 13术语和定义 14通则 44.1统计方法的通用要求 44.2基本模型 44.3能力评定的通用方法 45能力验证计划的统计设计指南 55.1能力验证计划的统计设计 55.2统计设计的基础 55.3考虑结果的统计分布 65.4参加者数量较少时的考虑因素 65.5报告格式的指导原则 76能力验证样品和结果的初审 86.1能力验证样品的均匀性和稳定性 86.2考虑的不同测量方法 96.3删除错误数据 96.4数据的直观检查 96.5稳健统计方法 96.6离群值检验 7指定值及其标准不确定度的确定 7.1指定值的确定方法 7.2指定值不确定度的确定 7.3由配方法确定 7.4由有证标准样品确定 7.5由单一实验室的结果确定 7.6由专家实验室的公议值确定 7.7由参加者的公议值确定 7.8指定值与独立参照值的比较 8能力评定标准差的确定 8.1确定评定准则的方法 ⅡGB/T28043—2019/ISO13528:20158.2由专家意见确定 8.3由以往能力验证计划的经验确定 8.4由一般模型确定 8.5由测量方法精密度的协同研究得到的重复性和再现性标准差确定 8.6由同一轮能力验证计划所得数据确定 8.7能力评定标准差的监测 9能力评定统计量的计算 9.1能力评定的通用原则 9.2对指定值不确定度的限定 9.3测量误差的估计 9.6Zeta值(5) 9.8能力验证中参加者不确定度的评定 9.9组合能力评分 10应用图示法描述能力评分 10.1图示法的应用 10.2参加者结果或能力评分的直方图 10.3核密度图 10.4标准化能力评分的条形图 10.5尧敦图 10.6重复性标准差图 10.7分割样品 10.8组合多轮能力验证计划中能力评分的图示法 11定性能力验证计划的设计与分析(包括名义和有序特性) 11.1定性数据的类型 11.2统计设计 11.3定性能力验证计划的指定值 11.4定性能力验证计划的能力评定和评分方法 附录A(规范性附录)符号 附录B(规范性附录)能力验证样品的均匀性和稳定性 附录C(规范性附录)稳健分析 附录D(资料性附录)统计方法附加指南 47附录E(资料性附录)示例 Ⅲ本标准按照GB/T1.1—2009给出的规则起草。本标准代替GB/T28043—2011《利用实验室间比对进行能力验证的统计方法》。本标准与GB/T28043—2011相比,主要技术变化如下:——增加了定性能力验证统计方法的内容(见第11章);——增加了计算密集型稳健估计方法的内容(见C.5)。本标准使用翻译法等同采用ISO13528:2015《利用实验室间比对进行能力验证的统计方法》。与本标准中规范性引用的国际文件有一致性对应关系的我国文件如下: —GB/T3358.2—2009 统计学词汇及符号第1部分:一般统计术语与用于概率的术语统计学词汇及符号第2部分:应用统计(ISO3534-2:2006,IDT)测量方法与结果的准确度(正确度与精密度)第1部分:总则与定义 -GB/T15000.2—1994标准样品工作导则(2)标准样品常用术语及定义(ISO指南30:1991,NEQ)———GB/T27043—2012合格评定能力验证的通用要求(ISO/IEC17043:2010,IDT)本标准做了下列编辑性修改:——将6.5.2末尾“(参见附录D)”更正为“(参见附录C)”;—将9.8.2注“参见E.3”更正为“参见E.4”;——将表B.1中“gm”更正为“g”; —————将式(?”更正 —将C.5.4中两处“C.5.3.2”更正为“C.5.2.2”。本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口。本标准起草单位:中国标准化研究院、中国合格评定国家认可中心、北京海关技术中心、北京工业大学。本标准所代替标准的历次版本发布情况为:—GB/T28043—2011。NVGB/T28043—2019/ISO13528:20150.1能力验证的目的能力验证是通过实验室间比对来确定参加者(可以是实验室、检验机构或其他部门)对与特定监测或测量的能力,也可用于监测实验室的持续能力。ISO/IEC析技术要适用于声称的目的。0.2能力验证计划中能力评分的基本原理能力验证中有很多可用的评分策略。尽管不同评分策略的计算方式有所差异,但大部分能力验证计划中都会比较参加者结果与指定值的差异,并价差异的准则是否独立于参加者结果,或由参加需要注意第7章和第8章中给出的选择指定值或评价差异准则不是由参加者结果得出时的优缺点。一的准则(如能力评定标准差或允许的测量误差)要适用于测量结果的最终用途才是有意义的。0.3本标准和ISO/IEC17043本标准对ISO/IEC17043中关于统计设计、能力验证样品验证、结果审核和汇总统计量报告等内容提供了支持。ISO/IEC17043的附录B简要描述了能力验证计划的一般统计方法。本标准是ISO/本标准重复了ISO/IEC17043中关于能力验证的定义,并且包含了其中描述能力验证类别和设计新建立的能力验证计划。可以预期对一个特定的能力验证计划其使用的统计技术会随着计划的成熟而需求。本标准包含了已发布的分析化学实验室能力验证指南,但额外包含了允许其他有效的测量方法和定性鉴定使用的更广范围的程序。本标准的本次修订包含了第一版中大部分的统计方法和指南,增加了之前的参考文献更新和ISO/IEC17043扩展的范围所包含的内容。ISO/IEC17043包含了对个人和本标准中统计技术与其他标准保持一致,特别是ISO5725系列。这些技术也反映了其他标准中的技术内容,同时也与ISO/IEC指南98-3(GUM)和ISO/IEC指南99(VIM)保持一致。1GB/T28043—2019/ISO13528:2015利用实验室间比对进行能力验证的统计方法注:本标准中的方法也适用于评估专家观点,专家观点或判断是通过与独立参照值或公议值比较获得。例如,通过检验对能力验证样品进行分类,或通过检验确定能力验证样品是否制备成功,或是否是同一来源,并且对分类结果进行客观比较,本标准的条款也适用于分类(定性)特性的分析。ISO3534-1统计学词汇及符号第1部分:一般统计术语与用于概率的术语(Statistics—Vo-cabularyandsymbols—Part1:Generalstatisticaltermsandtermsusedinprobability)ISO3534-2统计学词汇及符号第2部分:应用统计(Statistics—Vocabularyandsymbols—ISO5725-1测量方法与结果的准确度(正确度与精密度)第1部分:总则与定义[Accuracy(truenessandprecision)ofmeasurementmethodsandresults—Part1:Generalprinciplesanddefini-tions]ISO/IEC17043:2010合格评定能力验证的通用要求(Conformityassessment—Generalre-quirementsforproficiencytesting)ISO指南30标准样品常用术语和定义(Referencematerials—Selectedtermsanddefinitions)ISO/IEC指南99国际计量学词汇基础通用概念和相关术语[internationalVocabularyofme-trology—Basicandgeneralconceptsandassociatedterms(VIM)]ISO3534-1、ISO3534-2、ISO5725-1、ISO/IEC17043、及下列术语和定义适用于本文件。当以上引用文件的术语和定义有差别时,应以ISO3534-1和ISO3534-2为准。附录A给出了符号。2GB/T28043—2019/ISO13528:2015 3.3[ISO/IEC指南99:2007,2.16,修改———删除注]对给定的测量、测量仪器或测量系统,由规范或规程所允许的,相对于已知参照值的测量误差的极注2;有时也称为z比分数。3GB/T28043—2019/ISO13528:2015与允许极限值的比例proportionofallowedlimitscore根据能力验证结果产生的需要行动的指示。公议值consensusvalue由实验室间比对的一组结果得到的值。[ISO5725-1:1994,修改——添加注]参加者participant能力验证样品proficiencytestitem对能力验证计划建立和运作中的所有任务承担责任的组织。标准样品referencematerial;RM[ISO指南30:2015,修改——删除注4]有证标准样品certifiedreferencematerial;CRM采用计量学上有效程序测定的一种或多种规定特性的标准样品(RM),并附有证书提供规定特性4GB/T28043—2019/ISO13528:2015[ISO指南30:2015,修改——删除注2、注3和注4]4.1统计方法的通用要求4.2基本模型x,=μ十e;……(1)μ——被测量的真值;过oμ。注3:该模型不同于GB/T6379中的基本模型,这里不包括实验室偏倚项B。这是因为,仅报告一次观测结果时,4.3能力评定的通用方法4.3.1能力验证计划中有三种不同的能力评定方法,用来满足能力验证计划的不同目的。这些方法a)通过与预先设定准则比较进行能力评定;b)通过与其他参加者比较进行能力评定;5GB/T28043—2019/ISO13528:2015ồg/3;同样,在某些情况下,指定值可以是参照值,但σm可以是参加者测量结果的稳健标准差。在5能力验证计划的统计设计指南倚或精密度进行估计。参加者的能力评定是基于其对能力验证样品测量结果的统计分析,或对能力验证样品的解释得到的。实验室能力通常是以能力评定统计量的形式来表示,利用能力评定统计量可对一系列被测量进行一致的分析,并且能在相同的基础上对不同被测量的能力验证结果进行比较。能力评定统计量通常是测量结果和指定值之间的差异与允许偏差进行比较,或与该差异的测量不确定度进行比较。通过对多轮能力验证计划所得能力评定统计量进行评估,可评估某一实验室是否存在一致的系统性影响(偏倚)或长期存在精密度较差的情况。第5章~第10章针对定量能力验证计划的设计、结果的统计处理以及各种能力评定统计量的计算和解释提供了指南。第11章介绍了定性能力验证计划(包括定序能力验证计划)。5.2.1根据ISO/IEC17043:2010中的规定“统计设计应以数据特性(定量或定性,包括有序和——示例1:若能力验证计划是将参加者的测量结果与预先设定的参照值进行比较,并且参加者的测量结果不超出能力验证计划开始之前所规定的限定值,那么这种能力验证计划的设计需要—示例2:若能力验证计划是将参加者的测量结果与结合了同一轮能力验证计划的结果和在能力验证计划之前规定的限定值的综合结果进行比较,那么这种能力验证计划的设计需要考虑—示例3:若能力验证计划是将参加者的测量结果,与结合了来自同一轮能力验证计划的一组结果和由所有参加者结果所得变异确定的限定值的综合结果进行比较,那么这种能力验证计划——示例4:若能力验证计划利用参加者自身的测量不确定度将参加者的测量结果与指定值进行测量不确定度应用于能力评定;——示例5:若能力验证计划的目标是比较不同测量方法的性能,其设计需要考虑相关的汇总统计量及其计算程序。结果可能表示为定距尺度或比率尺度。对于某些定量值的测量,也有可能只能获得若干离散和不连续注1:对于定量值,定距尺度的间隔是有意义的,但比例没有意义,比如摄氏温标,但比率尺度的间隔和比例均有意6GB/T28043—2019/ISO13528:2015注2:对于定性值,分类尺度中顺序是无意义的,比如细菌种类的名称。有序尺度强调顺序,但其差值是没有意义验证计划的设计应适合声明的所有用途。5.3考虑结果的统计分布5.3.1ISO/IEC17043:2010中规定,对数据的统计分析技术应与统计假设相一致。最常用的的可靠的数据和可能产生离群值的错误数据组成。通常能力评定的解释基于正态分布假定,但只需合格参加者的结果满足正态分布即可。上呈现为对称的。如果不能确认测量结果对称,能力验证提供者宜使用适用于不对称结果的稳健技术(见附录C)。如果能力验证计划结果的预期分布不够对称(存在离群值的影响),能力验证提供者宜选择考参加者测量结果的预期分布。这可能包括:—适当变换以实现近似对称;换可以作为数据分析的第一个步骤。示例2:少量微粒的计数服从泊松分布,因此,可以根据一组参加者的平均计数,使用泊松概率表确定能力评定准则。形分布),方案中宜考虑到这些确定的分布。5.3.2根据ISO/IEC17043:2010中,能力验证提供者应阐明任何统计假设的基础,并证明这些假设的合理性。该证明可以以诸如观测数据、先前轮次能力验证计划的结果或相关技术文件为依据。5.4参加者数量较少时的考虑因素5.4.1能力验证计划的设计应考虑到满足设计目标所需要的参加者的最小数量,并说明如果不能达到该最小数量时应使用的替代方法[ISO/IEC17043:2010中b]]。参加者数量很大时的统计方法可能不适用于参加者数量有限的情况。由于从少量参加者测量结果获得的统计数据可能不够可靠,因而可能会依据不适当的对照组对参加者进行评估。常用能力验证计划》给出了参加者数量较少时的能力验证计划指南。报告建议基于可靠的独立测量给出指定5.4.2各种统计方法所需的最小数量参加者取决于下列情况:7GB/T28043—2019/ISO13528:2015有关少量参加者进行能力验证的更多技术指南参见附录D的D.1。5.5报告格式的指导原则5.5.1按照ISO/IEC17043:2010中的要求,能力验证提供者要指导参加者使用常规测量方法在某些情况下,该要求可能会使准确评估参加者测量结果的精密度和正确度或测量程序的优劣变数参加者所熟悉的计量单位,选择的报告格式能够最大限度地避免转录错误和其他错误。这可以包括当参加者使用的计量单位不符合能力验证计划要求时能够自动警告。注1:对于一些能力验证计划,其中一个目的是评估参加者使用标准方法的能力,其中可能包括特定计量单位或有注2:采用允许参加者直接输入结果的电子报告系统可大幅减少或消除转录错误。5.5.2如果能力验证计划要求对能力验证样品进行重复测量,参加者宜报告所有的重复测量值。这种个观测结果时。在这些情况下,能力验证提供者还需要参加者结果的均值(或其他均值的估计值)和不能力验证提供者应采用能处理删失数据的数据处理方法和评分程序(参见附录E的E.1),或要求参加者报告替代传统测量值的结果或其他补充结果。注1:对于删失数据,评分程序可以选择不予评分。注2:参加者报告超出常规测量范围以外的数值(比如低于参加者的定量限),可以使用数值统计方法,但评分结果可能不反映参加者对客户的常规服务水平。若删失结果的数目足以影响稳健方法,应使用存在删失数据时可以进行无偏估计的统计方法评估结果[21],或不对结果进行能力评定。若对所选择程序的效果存在质疑,能力验证提供者应考虑注:在某些情况下,正确报告是参加者能力评定的一部分,而且,有效数字位数和小数点后保留的位数可以有所如果在常规测量条件下,报告的有效数字位数对能力验证提供者进行数据处理存在明显的不利影响(比如测量程序要求的有效数字位数较少),能力验证提供者可以对报告的有效数字位数予以示例:测量程序规定报告精度为0.1g,有可能导致出现较大比例(>50%)的相同结果,并影响稳健均值和标准差的8GB/T28043—2019/ISO13528:2015如果允许不同参加者使用不同的有效数字位数报告结果,能力验证提供者应考虑计算公议统计量(比如指定值和能力评定标准差)的方法。6能力验证样品和结果的初审6.1能力验证样品的均匀性和稳定性6.1.1能力验证提供者应确保能力验证样品批有足够均匀性和稳定性,适合能力验证计划的目的。能力验证提供者应使用适当标准对能力验证样品的均匀性和稳定性进行评估,确保其不会对能力评定造成不利影响。均匀性和稳定性评估应使用以下一种或多种方法:a)附录B所述的实验研究方法,或能够提供同等的或更高均匀性和稳定性保证的替代实验b)根据先前轮次能力验证计划使用相似能力验证样品的经验,在本轮能力验证中使用相同的方法进行均匀性和稳定性检验;c)评估本轮能力验证计划的参加者数据,确认其与以往轮时间或生产程序是否变化,或是否存在由于不均匀性或不稳定性导致的任何意外波动。注1:以上方法的使用需要具体问题具体分析,并使用适当的统计方法和技术理由。在能力验证计划的实施过程注2:依赖经验的评估方法(如以上b)所述]仅适用于以下情形:——生产能力验证样品批的过程不会发生任何可能影响均匀性的改变;——不存在依据均匀性检验或参加者结果无法判6.1.2对于多个参加者使用相同能力验证样品的校准能力验证计划,能力验证提供者应确保本轮能力验证计划中样品的稳定性,或制定适当的程序,以便识别和解释本轮能力验证计划过程中的不稳定性。输对稳定性的影响。6.1.3通常应检查所有被测量(或特性)的均匀性和稳定性。然而,如果在一轮能力验证计划中部分特性的均匀性和/或稳定性能够说明所有特性的均匀性和/或稳定性,可以仅对这部分特性使用6.1.1中的评估方法。在能力验证样品的处理过程中,所检查的被测量应对能力验证样品加工过程中的不均匀和不稳定来源反应敏感。包括以下重要情形:b)如果对能力验证样品进行加热处理,则选择一个对不均c)如果被测特性在能力验证样品的制备过程中可能受到凝结、沉淀或其他时间依赖效应的影响,应依照顺序对该属性进行检查。示例:在涉及土壤有毒金属含量的能力验证计划中,测定的金属含量主要受到湿度影响。需要考虑对湿度的持续9GB/T28043—2019/ISO13528:20156.3删除错误数据误只影响后续统计分析的准确性。6.4数据的直观检查注1:直方图被广泛应用于检查统计数据是否呈单峰或对称分布,以及识别异常离群值(见10.2)。然而,直方图的度图往往效果更佳(见10.3)。注2:可使用诸如累积分布图或茎叶图等其他检查方法。可用于数据检查的图示法参见E,3和E.4。6.5稳健统计方法6.5.2可以使用中位数、中位绝对离差(MADe)和标准化四分位距(nIQR)作为简单估计量。算法AGB/T28043—2019/ISO13528:2015值比例低于20%时,该方法最为有效。当离群值比例较大(>20%)或不能由专家通过可靠方法检查数据分布时,用Q。算法和Q算法(见附录C)估计标准差特别有效。若预期极端值比例超过20%,附录C描述的其他方法也能给出好的估计(见附录C)。6.5.3能力验证提供者负责给出合适的统计方法。稳健均值和标准差可应用于各种目的,能力评定只是其中之一。稳健均值和标准差也可以作为不同组别参加者或特定统计方法的汇总统计量。6.6离群值检验6.6.1离群值检验通过数据的直观检查,或与剔除离群值方法结合,来消除离群值对汇总统计量的影响。若采用剔除离群值法,则应证明检验中的假设能够适用于能力验证计划的目的,尤其是很多离群值检验在正态性假设下进行的。6.6.2如果稳健统计方法不适用,则允许以高置信水平的离群值检验为基础来剔除离群值,再计算均a)记录剔除离群值的检验过程和置信水平;b)如果连续使用离群值检验,设定剔除离群值比例的上限;c)证明对于能力验证计划的目标,剔除离群值后的均值和方差足够满足能力评定的要求(包括效率和偏倚)。注:GB/T6379.2给出了在确定检测方法精密度的实验室间研究中剔除离群值时的置信水平。特别地,应按照适用于所有参加者的标准对相关参加者进行能力评定。7指定值及其标准不确定度的确定7.1指定值的确定方法~7.7描述了五种确定指定值x的方法。能力验证提供者负责这些方法的选择。7.1.2只要有可靠的统计学基础,也可以使用其他方法确定指定值及其不确定度,并且在能力验证计验证计划指定值的有效性进行检验,具体方法见定性指定值的确定方法见11.3。GB/T28043—2019/ISO13528:20157.1.4指定值的确定方法及其不确定度应在每次报告中告知参加者,或在所有参加者均可获得的能力验证计划协议中给出明确描述。7.2指定值不确定度的确定7.2.1GB/T274181给出了测量不确定度的评定指南。GB/T15000.3给出了根据有证特性值确定指定值不确定度的方法,可广泛应用于能力验证计划的设计中。7.2.2指定值及其不确定度的通用模型如式(2)和式(3)所示。指定值的模型如下:xp=xthr+Ồhom+0rn+δsta……(2)式中:xch——从定值过程得到的特性值;Ohom——由于能力验证样品之间的差异而产生的误差项;0nn,——由于运输过程的不稳定性而产生的误差项;0ga——由于能力验证期间的不稳定性而产生的误差项。指定值不确定度的模型如下:u(xm)=√u²+unom²+uum²+u……(3)式中:u(xp)——指定值的标准不确定度;Mchar——由定值引入的标准不确定度;ubom——由于能力验证样品之间的差异而引入的标准不确定度;Mtrans——由于能力验证样品的运输过程而引入的标准不确定度;Ustab——由于能力验证期间的不稳定性而引入的标准不确定度。注1:不同来源的不确定度间的协方差或可忽略来源的不确定度间的协方差可能会导致计算不确定度的不同模型。在一些情况下,任何不确定度分量均可为零或忽略不计。7.2.3在指定值中可能存在上述表达式未包含的偏倚,应尽可能考虑在能力验证计划的设计过程中。如果对指定值中的偏倚进行了调整,那么在指定值的不确定度评定中应包括该调整的不确定度。7.3.1能力验证样品可由已知不同水平的材料按一定比例混合而成,或是在基质中添加一定比例的某种物质得到。指定值xm根据相应特性的材料用量计算所得。当能力验证样品用该方法制备时,配方法是非常有用的,只需计算特性的比例即可得到指定值。宜采取适当措施确保;a)基质不受添加成分的影响,或添加物质在基质中的比例是准确已知的;b)所有成分混合均匀(如果有此要求时);c)已识别所有显著误差来源(比如,人们往往意识不到玻璃吸收含汞化合物,实际上含汞化合物水溶液的浓度能因容器材质而改变);d)添加成分和基质之间没有不良反应;e)包含添加材料的能力验证样品在性能上与客户常规测试的样本类似。例如,在自然基质中添加的纯物质往往比自然形成的相同物质更容易萃取。如果考虑到这种情况,能力验证提供者宜保证能力验证样品适合所使用的测试方法。配方法制备的能力验证样品时,如果相对于常规测试样品,添加物以更加松散的方式结合,或以不同形式结合,则最好使用其他方法制备能力验证样品。利用配方法确定指定值是GB/T15000.3中有证标准样品的定值方法之一,即在单一实验室使用基准测量方法确定指定值。单一实验室也可使用其他基准方法确定能力验证的指定值(见7.5)。7.3.2如果通过配方法计算能力验证的指定值,定值引入的标准不确定度(ucd)由适当模型中的不确定度分量合成得到。例如:在化学测量能力验证中,不确定度通常与质量和容积测量以及配方法中所使用材料的纯度有关。应根据式(3)计算指定值的标准不确定度u(xp)。7.4由有证标准样品确定7.4.1如果能力验证样品是有证标准样品(CRM),则其有证特性值xckM可作为指定值xm。该方法的局限性包括:———为每一个参加者提供一份有证标准样品可能会很昂贵;——为了确保长期稳定,有证标准样品通常经过复杂而严格的加工,这可能会影响能力验证样品的可替代性;——参加者可能熟悉有证标准样品,因此隐藏该能力验证样品的特征很重要。7.4.2若用有证标准样品作为能力验证样品,指定值的标准不确定度由证书给出。证书信息应包含式(3)中的各分量,并适合能力验证计划的预期用途。7.5由单一实验室的结果确定7.5.1可由单一实验室使用参照方法,比如基准测量方法,来确定指定值。应充分描述和理解所使用的参照方法,提供完整的不确定度说明,并记录适用于能力验证计划的计量溯源性。参照方法应可以替换参加者使用的所有测量方法。指定值应是使用多个能力验证样品或多种测量条件,在多次重复测量的实验中得到的平均值。指定值的不确定度是来源于参照方法和特定实验条件下不确定度的适当估计。7.5.2能力验证样品的指定值xm,可由单一实验室,使用合适的测量方法,对照高度相似的有证标准样品的有证参照值校准得到。该方法假定有证标准样品适用于参加者使用的所有测量方法。该方法需要在同一个实验室中使用相同的测量方法,并在重复性条件下对能力验证样品和有证标准样品进行一系列测试。当:xm是能力验证样品的指定值;d,是第i个能力验证样品和第i个有证标准样品平均测量结果之间的差值;d是差值d,的平均值。xm=YckM+d……(4)注:rcxm和d是独立的,除非在极特殊情况下,该专家实验室也生产该有证标准样品。依据定值所使用的测量方法的不确定度,确定udar。该方法可将指定值计量溯源到有证标准样品的有证参照值,并用式(5)计算标准不确定度。udur=√uckw²+ua²……(5)GB/T28043—2019/ISO13528:2015E.5中的示例说明了当用能力验证样品与单一有证标准样品的直接比对而得到其指定值时,如何计算不确定度的方法。7.5.3如果在一轮按顺序实施的能力验证计划开始前已指定了一个参照值,然后,使用相同的测量系统对该参照值进行检验,则参照值与检验值之差应小于该差值不确定度的两倍(即结果应有计量兼容性)。这种情况下,能力验证提供者可将测量结果平均值作为指定值,并适当计算其不确定度。如果结7.6.1可通过与专家实验室进行实验室间比对确定指定值,参见GB/T15000.3有关有证标准样品实专家实验室均应报告其测量结果及其标准不确定度。7.6.2如果测量协议只要求专家实验室报告一项结果,不要求提供充分的关于结果的不确定度信息,或报告的结果中有证据表明或存在其他证据表明所报告的不确定度不够可靠,通常应将7.7方法应用于专家实验室结果。如果每个专家实验室报告多项结果(比如,包括重复测量值),能力验证提供者应给出确定指定值及其不确定度的其他可替代方法,该方法应统计有效(见4.1.1),并允许出现离群值或其他偏离结果预期分布的数据。7.6.3当专家实验室报告结果及其不确定度,对结果公议值的估计是个复杂的问题且有多种方法可供b)使用适用于所报告不确定度的尺度和可靠性的加权程序,如果所报告的不确定度相似或可靠在过度离散;d)允许报告的结果或不确定度可能存在意外的离群值;e)具备良好的理论基础;f)宜证明其性能(比如测试数据或模拟)足够满足能力验证计划目标的要求。7.7由参加者的公议值确定7.7.1一轮能力验证计划的指定值xp是根据能力验证计划设定的程序,根据参加者报告结果所做的位置估计(如稳健均值、中位数或算术平均值),见附录C。在计算公议值之前,要使用6.2~6.6中的方法确认参加者的一致性。可以使用其他方法替代附录C中的方法,只要该方法具有良好的统计学基础并且已经在报告该方法的优势包括:a)不需要进行额外测量来获得指定值;GB/T28043—2019/ISO13528:2015b)如果被测量是标准化的且由操作步骤定义,该方法可能是非常有效的,因为通常没有更可靠的方法来获取相同结果。该方法的局限性包括:a)参加者之间的一致性可能不够充分;b)当普遍使用了错误方法时,公议值可能包括未知偏倚,而且该偏倚不会反映在指定值的标准不确定度中;c)确定指定值的方法偏倚可能导致公议值产生偏倚;d)可能很难确定公议值的计量溯源性;虽然单个实验室的结果总是可以溯源的,但只有在能力验证提供者掌握所有参加者使用的校准标准的全部信息及有效控制该方法其他相关条件时,才能做出清晰的溯源性声明。7.7.2指定值的标准不确定度取决于所使用的程序。如果需要一个完整的通用方法,能力验证提供者应考虑使用重复抽样技术(“自助法”)估计指定值的标准误。有关自助法的详细描述见参考文献17-18注:E.6给出自助法抽样技术示例。7.7.3如果使用C.2、C.3或C.5中的程序,以稳健均值作为指定值,则指定值x,的标准不确定度可以估计为:……式中:s·——能力验证结果的稳健标准差(这里的“结果”是指参加者对能力验证样品进行测量获得的全部数据的平均值)。注1:在该模型中,依据参加者结果确定指定值和稳健标准差,可认为指定值的不确定度来源于非均匀性、运输过程和不稳定性带来的影响。注3:E.3给出了由参加者结果得到指定值的示例。7.8指定值与独立参照值的比较7.8.1如果使用7.7中的方法确定指定值(xm),并且可以获得一个可靠独立估计值(表示为xmf),例如根据相关经验或参照值获得,此时应比较公议值xm与可靠独立估计值x。如果使用7.3~7.6中的方法确定指定值,在每一轮能力验证计划之后,应比较本轮结果的稳健均值x*与指定值。计算差值xa=(xm-xp)或(x*-xp),其标准不确定度估计为:u=√u²(xm?)+u²(xm)…(7)式中:u(xnr)——参照值的不确定度;u(xp)——指定值的不确定度。注:E.7给出了比较参照值与公议值的示例。7.8.2如果差值大于标准不确定度的两倍,则应查找原因。可能的原因如下:——参照测量方法存在偏倚;GB/T28043—2019/ISO13528:2015——使用7.5或7.6的方法时专家实验室的结果存在偏倚; 8.2由专家意见确定GB/T28043—2019/ISO13528:2015受随机变化的影响,如较小规模计划,或某特定轮次计划特有因素所导致的变化。可对以往能力验证计划结果的一致性进行主观核查,也可根据平均值或被测量值的回归模型进行客观核查。回归方程可能为直线或曲线[31。建立回归模型时,应考虑标准差和相对标准差,选择在适当的被测量水平范围内更一致者。通过该方式也可获得合适的最大允许误差。8.3.3当能力评定准则基于以往能力验证计划的公议统计量时,应使用标准差的稳健估计值。注2:E.8给出了根据以往能力验证计划的经验得到估计值的示例。8.4由一般模型确定8.4.1能力评定标准差可由测量方法再现性的一般模型得出。这种方法的优点是所有被测量具有客观性和一致性,且以经验为基础。依据所使用的模型,可认为是目标适用性原则的一种特殊情况。8.4.2根据一般模型选择的任何预期标准差应合理。如果获得行动信号或警戒信号的参加者比例太大或太小,能力验证提供者应确保这与能力验证计划的目标相一致。8.4.3对于一般模型评定方法,通常优先考虑特殊测量问题。因此,在使用一般模型之前,应研究使用8.2、8.3和8.5方法的可能性。……注1:霍维茨模型是经验模型,基于由许多参数的长期协同试验的观测结果。如果协同试验未出现严重问题,σx是多个实验室间的波动性的预期上限。因此,在能力验证计划中,or可能不适合为能力评定的标准。8.5由测量方法精密度的协同研究得到的重复性和再现性标准差确定8.5.1当能力验证计划中使用已标准化的测量方法,且该方法的重复性(o,)和再现性(or)可获得时,能力评定标准差(om)可以按式(9))计算:m——在一轮能力验证计划中各参加者的重复测量次数。注:该式来自GB/T6379.2的基本随机效应模型。8.5.2当重复性标准差和再现性标准差依赖于测试结果的平均值时,它们之间的函数关系宜用GB/T6379.2中的方法确定,然后利用这些关系对能力验证的指定值计算重复性标准差和再现性标准差。8.5.3只有当协同研究在GB/T6379.2条件或等效程序的要求下进行时,上述方法方能有效。8.6由同一轮能力验证计划所得数据确定8.6.1在该方法中,能力评定标准差om由同一轮能力验证计划参加者报告的结果得出。当使用这种方GB/T28043—2019/ISO13528:20158.6.2使用参加者测量结果可能会导致不适当的能力评定准则。能力验证提供者应确保所使用的σ若稳健标准差很小,能力验证提供者应规定o最小值的临界值。该临界值的选择应保证,在用om=1.3线/cm。警戒或行动信号)的临界值。该临界值的选择应保证与不符合目标要求的结果将会收到行动信号。8.6.3这种方法的主要优点是简单易行,而且由于在很多情况下得到成功应用而易被接受。(某些情况下)这可能是唯一可行的方法。能的趋势时会有一定困难。如,若p=20,从一轮能力验证计划到下一轮,正态分布数据的标准差可能在其真值的±30%c)使用由数据得到的分散性度量,可能导致固定比例的可接受的能力评分。普遍能力较差的参加者无法通过能力评分体现,而普遍能力较好的参加者也会得到较差的能力评分。d)不能提供对结果的最终用途适用性的有用解释。8.7能力评定标准差的监测8.7.1为了检验参加者能力,并评估能力验证计划对参加者的益处,能力验证提供者应用程序来监测8.7.2应使用附录C中的稳健方法,利用各轮能力验证计划获得的结果,计算测量方法的再现性标准差(以及重复性标准差,如有可能)。如果使用8.2~8.4中的方法,应将这些估计值按空间顺序或时间顺序描点绘图,如有可能,图中也应标出通过GB/T6379.2中的精密度实验获得的重复性标准差和再现性标准差和/或σp。8.7.3能力验证提供者应检查这些图表。如果图表显示,从某一轮的能力验证计划获得的精密度比由以往的数据或经验预期值大两倍或以上,则能力验证提供者应调查该轮能力验证计划中数据一致性较GB/T28043—2019/ISO13528:20159能力评定统计量的计算9.2对指定值不确定度的限定9.2.1当指定值的标准不确定度u(xm)远大于能力验证中使用的能力评定标准差时,会存在一种风如果符合以下准则,则可认为指定值的不确定度可以忽略不计,不需要在该轮能力验证结果中予以解释。u(rm)<0.3σp或u(xp)<0.1δe……(10)b)在能力验证计划结果的解释中使用指定值的不确定度c)如果指定值来源于参加者结果,并且参加者中可识别子总体之间的差异导致较大的不确定度,应分别报告适用于每一个子总体(例如,使用不同测量方法的参加者)的指定值和不确定度;如果a)~d)皆未应用,则应告知参加者,不能确定可靠的指定值,也不能提供能力评定统计量。9.3测量误差的估计 (11)当认为指定值是一个约定值或参照值,则D,可解释为结果的测量误差。差值D,可以用与指定值相同的计量单位来表示,或表示为百分相对差: (12)达式,相同的准则也可应用于D%)。根据目标适用性原则或以往能力验证计划结果确定,则ồg与z值所使用的σm密切相关(见9.4)。这种关系由z值的评定准则来确定。例如,若z≥3产生一个行动信号,则ồg=3om,或等价地om=δg/3。δε经常应用于医学方面的能力验证与测量方法和产品的能力评定规范中。9.3.4D作为能力评定统计量和δε作为能力评定准则的优势在于,这些统计量与测量误差直接相关,因而参加者对它们有直观的理解。D%的优势在于,可以直观理解,它是标准化的被测量水平,并且它与产生误差的常见原因(例如,错误校准或稀释导致的偏倚)相关。具有多个分析项或目标适用性准则随被测量水平变化的能力验证计划中,仅能检测是否有行动信号。的使用通常假设参加者结果呈对称分布。为此,对每一结果计算“允许偏差百分比”(PA):PA=(D,/ồg)×100%……(13)因此,PA≥100%或PA≤-100%表示一个行动信号(或“不可接受”)。注1:Pa值可在不同水平和不同轮次能力验证计划之间比较,或在图表中跟踪。该统计量在使用与解释上类似于以≤-3或z≥3为行动信号的:值。注2:该统计量的变化形式得到普遍应用,尤其应用于通常存在更高频率的能力验证计划和大量分析项的医学领域。注3:PA的绝对值可用于反映相对于指定值的一致可接受或不可接受程度。z值)x——指定值:σm——能力评定标准差。9.4.2z值的传统解释如下(见ISO/IEC17043:2010中的B.4.1.1): 当z||≤2.0时,结果可接受:参加者宜根据警戒信号对其测量程序进行检查,以防止新生问题或复发问题的出现。注1:在某些应用中.能力验证提供者使用2.0作为z值的行动信号。注2:通常宜选择符合上述评价准则的o,该准则广泛应用于能力评定,并且非常接近于控制图的控制限。注3;:使用2.0和3.0作为:值临界值的理由如下。假设有能力的实验室进行正确操作所得测量结果服从均值为x。和标准差为om的正态分布(必要时需经过变换)。那么≈值将服从均值为0,标准差为1.0的正态分布。此时,预期只有大约0.3%的值会超出-3.0≤t≤3.0的范围,只有大约5%的值会超出-2.0≤c≤2.0的范围。因为z值超出±3.0的概率非常低,如果不是真正存在问题,行动信号不太可能偶然出现,所以当给出一个行动信号时,很可能存在引发异常的可辨别原因。注4:该评价准则所基于的假设仅适用于有能力实验室的分布假设,而不适用关于观测结果分布的任何假设。对于观测结果本身,无需进行任何假设。注5:如果真实的实验室间波动性小于。μ,则错误评价的概率降低。±2.0和±3.0的结果比例很可能不是5%和0.3%9.4.3能力验证提供者应基于结果的有效数字位数,确定适用于所报告的z值、指定值和能力评定标准差的适当圆整规则。并应向参加者提供圆整规则的有关信息。注:对于:值,通常保留小数点后两位数字。9.4.4如果能力验证计划涉及非常大量的参加者,并且参加者结果的标准差作为σm,能力验证提供者可能希望使用实际结果或z值来检验分布的正态性。在另一种极端情况下,即只有少量参加者时,可能不会给出行动信号。在这种情况下,结合多轮的能力评定统计量的图示法,可以比单轮能力验证计划结果更有效地显示参加者能力。9.5.1如果关注指定值的不确定度u(xm),例如u(xm)>0.3om时,则可将不确定度加入能力评定统计量的分母中计算。该统计量称为z'值,计算如下(应用9.4中的符号):oe=√oi+U¹(xm)………………(16)式中:U(xp)——包含因子k=2时指定值x,的扩展不确定度。9.5.3根据能力验证计划的设计,c'值与:值可有相同的解释(见9.4),并使用相同临界值2.0和3.0。类似地,可以将D和D%与δe进行比较(见99.5.4比较9.4和9.5中z'值与:值的公式可知,在一轮能力验证计划中c’值将小于相应的z值,且相差一个常数因子:当9.2.1中的指定值不确定度的条件满足时,这个因子将落入以下范围内:因此,这种情况下,z'值几乎与z值相同,并且可以推断出指定值的不确定度对于能力评定而言是可忽略的。当9.2.1中的指定值不确定度条件不满足时,z'值与z值数量上的差异可能会导致:一些z值超过了2.0或3.0的临界值,因而发出“警戒信号”或“行动信号”,然而相对应的z'值并没有超过这些临界一般而言,在不根据参加者结果确定指定值和/或能力评定标准差的情形下,可以首选z',因为当符合9.2.1中的条件时,z和z'之间的差别是可忽略的。9.6Zeta值(5)9.6.1如果能力验证计划的目的是评定某一参加者在其声称的不确定度水平内得到接近指定值的结GB/T28043—2019/ISO13528:2015沿用9.4中的符号,5值定义为:式中:u(x)参加者自身对其结果x,的标准不确定度的估计值;u(xm)——指定值xm的标准不确定度。此式(17)可与未对相关性进行调整的公议统计量一起使用。使用5值进行直接评定。可以用关于z值的相同临界值2.0和3.0,或用估计扩展不确定度时使用的包含因子来解释5值。然而,较差5值可能表明x,与xm的差异过大,或低估了参加者的不确定度,或两者兼而有之。次超过临界值3.0,则有必要逐步检查其测量程序,并对该程序进行不确定度评定。不确定度评定过程将识别产生最大不确定度分量的步骤,使参加者能够发现并实施改进。如果参加者的5值同样多次超过临界值3.0,这意味着参加者的不确定度评定未包括所有重要的不确定度来源(如遗漏了某个重要因值≥3,但5值<2,这表明参加者对其结果的不确定度进行了精确采取行动。适用性原则。确认是否满足目标适用性原则,可以由例如参加者或认可机构这样的组织,分别通过检查偏差(x—xm)或比较合成标准不确定度与目标不确定度来完成。9.7.1如果能力验证计划的目的是评定某一参加者在其声称的扩展不确定度水平内得到接近指定值的能力验证。式中:U(xm)——指定值xμ的扩展不确定度;22GB/T28043—2019/ISO13528:2015U(x)———参加者结果x,的扩展不确定度。注:扩展不确定度的直接合成不符合GB/T27418的要求,并不等价于合成扩展不确定度的计算,除非U(x₁)和U(xm)的包含因子和有效自由度均相等。9.8.1GB/T27025的广泛应用有助于更好地理解测量不确定度。将不确定度中的5值和9.7中的E。值是应用声称不确定度来评价实验室结果的可选方法。9.8.2一些能力验证提供者已经意识到在能力验证中要求实验室报告结果不确定度的益处。即使评c)能力验证可用于确认参加者声明的不确定度,当不确定度和结果一起报告时,最容易进行注:报告不确定度时的数据分析示例参见E.4。9.8.3若使用7.3~7.6中的程序确定xm,并且u(xp)符合9.2.1的条件,则不太可能出现参加者结果确定指定值(见7.7),能力验证提供者注:如果由10个或更多结果得到公议标准差,1.5是标准差波动倍数的上限值(基于F分布百分位点的平方根得加者以及任何利益相关方应检查测量结果或不确定度估计值。同样地,所报告的不确定度即使大于——所报告不确定度的特殊分位点(例如,所报告标准不确定度或扩展不确定度的5%分位点以下和95%分位点以上); 23GB/T28043—2019/ISO13528:20159.9组合能力评分9.9.1在单轮能力验证计划中,通常会测得多个能力验证样品或多个被测量的结果。在这种情况下,每个能力验证样品或被测量的结果应按9.3~9.7中的方法分别进行解释;例如,应对每个能力验证样品或被测量的结果分别进行评定。9.9.2当能力验证计划对特定设计水平的两个或多个能力验证样品进行测量时,可以获得其他方面的尧敦图处理,见10.5。在这种情况下,能力验证提供者应向参加者提供统计设计和所用程序的完整9.9.3当对多个能力验证样品或同一能力验证样品的多个被测量进行测试并得到多个结果时,推荐使用第10章中的图示法。该方法将结合能力评分而不隐藏单个能力评分中的较高值,并能显示出在能力9.9.5应谨慎使用组合能力评分或奖励或惩罚得分,因为很难描述这些分值符合的统计假设。尽管不或不同能力验证样品、不同被测量的均值或/和可能掩盖单个被测量的结果中的偏倚。因此,应向参加10应用图示法描述能力评分10.1图示法的应用通常,能力验证提供者应使用每一轮能力验证能辨认其他参加者的结果。图示还可以方便能力验证提供者或认可机构,使其能判断整个能力验证计10.2参加者结果或能力评分的直方图10.2.1直方图是一种常用的统计工具,在能力验证结果的分析中可应用于两个不同的阶段。在初步例的离群值或有未预期的异常的斜分布。在能力验证计划的报告中也可使用直方图展示能力评分,或比较来自不同测量方法或不同能力验证样品的结果。对于中(参加者小于100)、小(参加者小于50)规模的能力验证计划,直方图允许参加者将自身能力与其他参加者进行比较,例如,在直方图中高亮显示一个条块以代表一个参加者的测量结10.2.2可使用参加者实际测量结果或能力评分绘制直方图。利用参加者结果的优点是可以直接应用GB/T28043—2019/ISO13用能力评分,应在图中标记根据能力评定标准差计算的表示警戒信号和行动信号的分界线。10.2.3选择的绘图范围和组距应保证能对双峰性(若存在)进行有效检测,而且,不会由于测量结果的分辨率过低或能力验证结果的数量过少而产生虚假警戒信号。注1:直方图组距和组界对其外观有显著影响,若使用恒定的直方图组距,其外观主要取决于起点。如果直方图组距太窄,直方图会呈现许多局部众数,而如果直方图组距太宽,则接近数据分布状态的众数可能会不够明显。直方图起始位置或组距可以明显改变其外观以及相邻矩形的高度,特别是如果数据集较小或呈现某种簇状分注2:直方图示例参见E.3。10.3核密度图10.3.1核密度图,通常简称“密度图”,它以一条光滑的曲线来描述数据分布的一般形状,核密度估计的思想是每一点处的密度由以它为中心,标准差为σ。的特定分布(通常为正态分布)来估计,其中σ又称为窗宽。将这些分布加起来并归一化就得到密度函数估计,其图像画出来即为一条光滑曲线。10.3.2可以按照如下步骤绘制核密度图。假设在该图中包含由p个值x₁,x₂,…,x,组成的数据集X。这些数据通常是参加者的测量结果,也可以是从能力验证结果推导出的能力评分:a)选择合适的带宽σ。一般应用下面两种方法进行选择:1)对于一般检验,则σ=0.9s*/p⁰2,式中,s*是用C.2或C.3中的程序,计算出x₁,…,x,的稳健标准差;2)检查数据集的众数,它与能力评定准则相比更为重要,若使用z或ζ,则σ=0.75op,或者,若使用D和D%,则σ,=0.28g。注1:上述选项1)是依照西尔弗曼方法],该方法基于正态分布的四分位距(nlQR)测定s。可提供类似结果的其他带宽选择方法包括斯科特细提出的方法,该方法以1.06替代了系数0.9。参考文献描述了一种近似最佳,但更加复杂的带宽选择方法。实际上,直观检查的差异微乎其微,带宽的选择往往取决于应用软件。注2:上述选项2)依照IUPAC指南*]。b)设定绘图区间[qmm·qm.],其中qmm≤min(x₁,…,x,)-3o。且qmx≥max(x₁,…,x,)+3o。c)选择绘制曲线上的点数为n,。通常,n,=200即可满足需要,除非绘图区间内存在极端离群值。d)计算绘图位置q:到qm:e)计算n.个密度h」到h:式中:f)在图中绘出q,,h。注1:在核密度图上加上所有观测点的位置是有益的。注2:最好使用软件绘制密度图。对于适度规模的数据集,可通过电子表格程序进行上述各步的计算。商业和免费统计软件通常都包含核密度图的功能,其中默认的带宽选择是类似的。高级软件可以使用该算法或基于卷积的更快算法来绘制密度图。注3:核密度图的示例参见E.3、E.4和E.6。10.3.3曲线形状表明了数据的分布情况,多个不同的众数会形成分离的峰。边缘值也会形成与数据主体显著分离的峰。GB/T28043—2019/ISO13528:2015注2:如同直方图,核密度图最好使用中到大规模数据集,因为小数据集(10个或更少)有可能包含轻微离群的值或10.4标准化能力评分的条形图10.4.1条形图适合于将一些相似特性的z值展示在同一画面中,它可以显示某个参加者的所有z值是否存在一些共同特征。例如若某个参加者得到一些较高的z值则表明其能力较差,即该参加者可能存在正偏倚。10.4.2绘制条形图应收集如图E.10所示的标准化能力评分,并对各参加者的能力评分进行分组。也10.4.3当一轮能力验证计划中对被测量进行了重复测量,其结果可用于计算k统计量并绘图,如10.5尧敦图10.5.1当两种相似物质的样品已在一轮能力验证计划中进行了检测,尧敦图提供了研究这些结果非常有效的图示法。该方法可用于展示不同能力验证样品结果的相关性,并指导调查出现行动信号的10.5.2尧敦图的X轴为一个能力验证样品的参加者结果或z值,Y轴为另一个能力验证样品的参加者结果时,以指定值或两组能力验证结果分布的中位数为基准画出垂直线和水平线,当图中为z值时,以原点为基准画出垂直线和水平线。b)观察图中是否有证据表明两种物质的测试结果存在某种关系(比如,数据点是否近似沿斜线分布)。若存在,则表明有以类似方式影响不同能力验证样品参加者的偏倚。若能力验证结果之间不存在明显的关联(即数据点在一个圆形区域内近似均匀分布,且通常越接近中心密度越高),则两个能力验证样品的测量误差基本上各自独立。若直观检查不能得出结论,可通过秩相关统计量进行检验。可能意味着不同测量方法之间的差异。方法规范不够详细。检查测试方法一般可以改善方10.6重复性标准差图10.6.1在一轮能力验证计划中,参加者获得m个重复测试结果时,利用这些结果的图示可识别均值和标准差异常的实验室。10.6.2该图是由每个实验室的实验室内标准差和实验室均值分别描点得到。也可使用重复测量结果的极差代替标准差。令:r'为用算法A计算的x₁、x₂,….x,的稳健平均值;———w*为用算法S计算的s₁、8₂,…,s,的稳健联合值。并假定数据服从正态分布。在原假设“各实验室的均值与实验室内标准差没有差异”成立时,统计量:近似服从自由度为2的X²分布。因此,在以标准差s为纵轴、平均值x为横轴的坐标系中显著性水平为1%时的临界区域由下式确定: (22)式中: (23)10.6.3如给出参加者重复性标准差,则该图可用于识别偏倚异常大的参加者。若存在大量重复测量,该图也可用于识别重复性非常小的参加者。然而,由于通常只有少量重复测量,解释较为困难。注:重复性标准差图的示例参见E.13。10.7.1当有必要对两个实验室进行详细比对时,或无法进行能力验证需要外部验证时,可使用分割样品。实验室将得到多种水平待测特性的样品,将每个样品分割为两份,并且每个实验室对每份分割样品进行若干次(至少两次)重复测定。应再与其比对。注2:不能将这种分割样品设计与GB/T6379.2使用的“分割水平”设计相混淆,后者向所有参加者提供水平略微不同的两个样品。10.7.2由分割样品实验所得数据,可得到反映两个实验室重复测量的变异和每份样品平均结果差值的图示。使用参加者结果的双变量图可能难以显示参加者之间的重要差异,因此,参加者的能力验证结果的差值或百分相对差更有效。可依据图示做进一步分析推断。10.8组合多轮能力验证计划中能力评分的图示法10.8.1当要组合多轮计划的标准化能力评分时,协调者可以考虑如10.8.2和10.8.3的图示法。这些图示法组合了多轮计划的能力评分,可识别实验结果的趋势和其他特征,而这些特征在每轮计划得分的27GB/T28043—2019/ISO13528:2015单独分析中是不明显的。表示。运行值以发出行动和警戒信号的次数表示。由于实验室可能在某一轮计划中对某种物质的测试中出现10.8.2常规控制图是一种能识别z值出现较大变异的有效方法。常规控制图的绘制方法和行动限规则见ISO7870-2[6]。戒限与能力验证计划设计相一致。当一轮计划中需测量多个特性时,不同特性的≈值可以在同一图中绘出,但不同特性的点应使用不同的记号和/或颜色来表示。当在一轮能力验证计划中常规控制图中,在下列情况下给出失控信号:a)有1个点落在行动限(z值为±3.0,PA值为100%)外;b)连续3个点中有两个落在同侧警戒限(z值为士2.0,PA值为70%)外;c)连续6点结果为正值或负值。10.8.3当每轮能力验证计划的特性水平变化范围较大时,标准化能力评分(如z值和PA值)关于指定值的图将显示实验室偏倚是否随特性水平而变化。当在一轮能力验证计划中使用多个能力验证样品,可单独描绘每个样品的能力评分。注1:可使用不同符号或颜色标记当前能力验证计划所得结果,以区别于以往结果。注2;使用Pa值的统计图示例参见E.14。仅需改变纵坐标,该统计图即可适用于z值。11定性能力验证计划的设计与分析(包括名义和有序特性)11.1定性数据的类型大量的能力验证计划是以定性尺度对相关特性进行测量或识别。这包括:——需要报告类别属性的能力验证计划,其特性值没有量级。比如物质或生物的一个种类。——需要报告顺序结果的能力验证计划,可根据量级定序,但不同结果之间不存在算术关系。比——指定值通常是基于专家意见。——为连续值和计数数据设计的统计处理方法并不适用于定性数据。比如,在顺序结果中计算均值和标准差是没有意义的。11.2统计设计11.2.1如果能力验证计划的指定值或对参加者报告的评估主要取决于专家意见,通常需要召集有资28GB/T28043—2019/ISO13528:2015示例1:对于一个检测污染物是否存在的能力验证计划,若能力验证样品包含一系列水平的污染物,能力验证提供者便能够以某种污染物水平的成功检测次数得到关于该污染物水平的函数。比如,这可以提供参加者所选检测方法的匹配。评价准则基于目标适用性或挑战难度确定。a)由专家判断;致意见,能力验证提供者可以考虑采用11.3.1中其他确定指定值的方法。如果这样仍然无法确定适当29GB/T28043—2019/ISO13528:201511.3.5众数(最常见的观测值)可用作分类或有序尺度能力验证结果的指定值,而中位数仅可用作有低)。对于“不确定”或“不明确”水平的被测量,则可能需要对其不确定度进行统计计算。 在可能的情况下.作出适当规定,使参加者可以针对个别的专家意见提出申诉,或者,对接近任应向参加者提供每个能力验证样品的具体能力评分。如果进行重复测量,可以提供每个结果的汇GB/T28043—2019/ISO13528:2015 取值范围为0~1的值相加,总和除以所用变量的数量GB/T28043—2019/ISO13528:2015(规范性附录)d能力验证样品的测量值与CRM的指定值之差a测量值与CRM的指定值之差的均值D参加者测量结果与指定值的差(x-xm)参加者测量结果与指定值百分相对差,以xa的百分数表示BE最大允许误差Ohom能力验证样品之间的差异所导致的误差0能力验证期间的不稳定性所导致的误差运输条件的不稳定性所导致的误差“标准化误差”值,包括参加者测量结果的不确定度和指定值的不确定度g均匀性检验中测试的样本量m每个能力验证样品的重复测量次数p一轮能力验证计划中参加者的数量允许误差(D/δg)的比例,以百分数表示3重复性标准差再现性标准差样本间标准差s稳健标准差5样本均值的标准差5样本内或实验室内标准差o用于核密度图的带宽标准差L实验室间标准差0能力评定标准差重复性标准差0再现性标准差Mhm能力验证样品之间的差异所导致的标准不确定度能力验证期间的不稳定性所导致的标准不确定度Mmm运输条件的不稳定性所导致的标准不确定度u(r)参加者i的测量结果的标准不确定度w(xp)指定值的标准不确定度u(xm)参照值的标准不确定度U(x₁)参加者i所报告结果的扩展不确定度U(r)指定值的扩展不确定度GB/T28043—2019/ISO13528:2015(续)U(xm)参照值的扩展不确定度w,测试份样间极差w*参加者重复性的稳健估计值x测量结果(通用)确定指定值时获得的特性值rckMCRM的指定值r参加者i的测量结果指定值参照值x稳健均值x一组测量结果的算术平均值用于能力评定的统计量值经过修正的z值,包括指定值的不确定度5Zeta值——经过修正的z值,包括参加者测量结果的不确定度和指定值的不确定度GB/T28043—2019/ISO13528:2015B.1均匀性检验一般程序b)选择执行均匀性检验的实验室和使用的测量方法。测量方法的重复性标准差(s,)应足够小,以便能够检验出任何显著的非均匀性。IUPAC《数据协调议定书》推荐,测量方法的重复性标准差与能力评定标准差的比应小于0.5(或δe/6)。然而该比率要求并非总能达到,这种情况下,能力验证提供者应增加重复测量次数。c)为一轮能力验证计划制备并包装样品,应保证为该轮能力验证计划的参加者以及均匀性检验提供充足的样品。d)在最终完成包装的样品中随机抽取g份(g≥10)进行均匀性检验。若可从前期对相似样品、利用相同程序进行的均匀性检验中得到适合的数据,则可以减少均匀性检验的样本量。g)计算总平均值云、样本内标准差s。、样本B.1.2若不能进行重复测量,比如破坏性测试,则测量结果的标准差可用作s,。这种情况下,使用具有足够低的重复性标准差s,的方法是非常重要的。B.2均匀性检验的评估准则B.2.1使用如下三种检验方法,以确保均匀性测试数据符合数据分析的要求:a)在数据分析中依照测量顺序检验每个测试份量的测量结果,确认是否存在某种趋势(或漂移),若存在明显趋势,应对测量方法采取适当的纠正措施b)根据生产指令,检查能力验证样品测量结果的标准差,若存在导致能力验证样品超出B.2.2要求的明显趋势或已妨碍能力验证样品的使用,则(i)对每个能力验证样品分别赋值;或(ii)剔除受到显著影响的能力验证样品,并对其余样品的均匀性进行重新检测;或(iii)若该趋势影响所有能力验证样品,采取B.2.4中的措施。c)比较重复测量值之间的差(或极差,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年临海市头门港中心幼儿园招聘备考题库参考答案详解
- 2026年厦门市金鸡亭小学补充非在编人员招聘备考题库带答案详解
- 2026年崇左市江州区消防救援大队政府专职消防员公开招聘备考题库带答案详解
- 2026年古城区疾病预防控制中心临聘人员招聘备考题库及参考答案详解一套
- 2026年大连商品交易所招聘备考题库及完整答案详解一套
- 2026年屏南县总医院(屏南县医院)招聘编外药剂人员备考题库及参考答案详解一套
- 2026年弋江区招聘警民联调室专职人民调解员备考题库及一套答案详解
- 2026年中国联通甘孜州分公司招聘备考题库有答案详解
- 2026年三亚市立才学校临聘教师招聘备考题库有答案详解
- 2026年广州大学教育学院(师范学院)科研秘书招聘备考题库及1套参考答案详解
- 风险金管理办法
- 烟花爆竹安全生产会议
- 绿化养护中病虫害重点难点及防治措施
- 学堂在线 雨课堂 学堂云 工程伦理2.0 章节测试答案
- 生态旅游区建设场地地质灾害危险性评估报告
- 网络传播法规(自考14339)复习题库(含答案)
- 民办学校退费管理制度
- T/CIE 115-2021电子元器件失效机理、模式及影响分析(FMMEA)通用方法和程序
- KubeBlocks把所有数据库运行到K8s上
- 广东省江门市蓬江区2025年七年级上学期语文期末考试试卷及答案
- 苏州市施工图无障碍设计专篇参考样式(试行)2025
评论
0/150
提交评论