版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据的统计处理和解释数据的统计处理和解释 正态样本离群值的判断和处理正态样本离群值的判断和处理1、 Grubbs检验法检验法2、 Dixon检验法检验法 数据的统计处理和解释数据的统计处理和解释数据的统计处理和解释(包括12个国标)正态样本离群值的判断和处理正态样本离群值的判断和处理已知标准差未知标准差Nair检测法离群值1GrubbsDixon偏度-峰度法Dixon1. 主要内容出自GB/T 4883-2008 数据的统计处理和分析 正态样本离群值的判断和处理2. 一部分文件引用自GB/T 4882-2001 数据的统计处理和解释 正态性检验 范围范围:适用于来自正态分布的样本适用于来自正态
2、分布的样本数据的统计处理和解释数据的统计处理和解释 说明:这两个方法及引用术语均来自国家标准说明:这两个方法及引用术语均来自国家标准 一:术语和定义一:术语和定义 离群值离群值 outlier 样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体样本中的一个或几个观测值,他们离开其它观测值较远,暗示他们可能来自不同的总体 检出水平检出水平 detection level 为检出离群值而指定的统计检验的为检出离群值而指定的统计检验的显著性水平显著性水平,用,用表示。表示。除非约定,除非约定,值应为值应为0.050.05 注1:用统计的方法检验测定值之间是否存在显著性差异,
3、从而判定结果或分析方法的可靠性,这一过程称为显著 性检验。 注2:在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率(小概率)称为显著性水平(水准)用表示,即这些测定值位于一定置信度所对应的随机误差界限之外。 注3:在置信区间内包含真值的概率称为置信度(置信水平)用P表示。注4:置信度和显著性水平的关系:P=1-数据的统计处理和解释数据的统计处理和解释统计离群值统计离群值 statistical outlier在剔除水平下统计检验为显著的离群值在剔除水平下统计检验为显著的离群值剔除水平剔除水平 deletion level为检出离群值是否高度离群而指定的统计检验的显著性水平,用
4、为检出离群值是否高度离群而指定的统计检验的显著性水平,用*表示,除表示,除非约定,非约定,*值应为值应为0.01歧离值歧离值 straggler在检出水平下显著,但在剔除水平下不显著的离群值在检出水平下显著,但在剔除水平下不显著的离群值数据的统计处理和解释数据的统计处理和解释二:符号和缩略语 n 样本量样本量 样本平均值样本平均值检验离群值所使用的显著水平,简称检出水平检验离群值所使用的显著水平,简称检出水平 * *检验统计离群值所使用的显著水平,简称剔除水平检验统计离群值所使用的显著水平,简称剔除水平( (* G1- (n)时,判定时,判定xixi为离群值,否则判未发现为离群值,否则判未发现
5、xixi是离群值。是离群值。 b: b:下侧判断下侧判断 当当GnG1-(n)时,判定时,判定x x1 1为离群值,否则判未发现为离群值,否则判未发现x x1 1是离群值。是离群值。 c:c:双侧判断双侧判断 当当GnGn且且GnG1-/2(n) )时时, ,判定判定xi为离群值为离群值; 当当GnGn且且GnG1-/2(n)时时,判定判定x1为离群值为离群值; 否则判断未发现离群值。否则判断未发现离群值。数据的统计处理和解释数据的统计处理和解释数据的统计处理和解释数据的统计处理和解释4、统计离群值的判断(单侧)A、当检出、当检出Xi或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平*B
6、、查附表、查附表1,G1-*(n)当当GnG1-*(n)时时上侧上侧判断判断Xi为统计离群值为统计离群值否则否则Xi为歧离值为歧离值判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值数据的统计处理和解释数据的统计处理和解释当当GnG1-*(n)时时否则否则下侧下侧数据的统计处理和解释数据的统计处理和解释5、统计离群值的判断(双侧)A、当检出、当检出Xi或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平*B、查附表、查附表1,G1-*/2(n)当当GnG1-/2*(n)时时双侧双侧1判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值判断判断Xi为统计离群值为统计
7、离群值否则否则Xi为歧离值为歧离值数据的统计处理和解释数据的统计处理和解释当当GnG1-/2*(n)时时否则否则双侧双侧2数据的统计处理和解释数据的统计处理和解释 使用Grubbs法检验的实例.临时文件soybean meal - November 2007.xls数据的统计处理和解释数据的统计处理和解释样本量(n)检验高端离群值检验低端离群值37 x(n)-x(n-1) x(n)-x(1) x(2)-x(1) x(n)- x(1)810 x(n)-x(n-1) x(n)-x(2) x(2)-x(1) x(n-1)-x(1)1113 x(n)-x(n-2) x(n)-x(2) x(3)-x(1
8、) x(n-1)-x(1)1430 x(n)-x(n-2) x(n)-x(3) x(3)-x(1) x(n-2)-x(1)Dixon检验法:检验法:Dn=r10=Dn=r10=Dn=r11=Dn=r21=Dn=r22=Dn=r11=Dn=r21=Dn=r22=数据的统计处理和解释数据的统计处理和解释Dixon检验法确认检出水平确认检出水平,在,在附表附表2 2中查出临界值中查出临界值D D1 1- -(n)(n)。当当Dn D1-(n)时,判定时,判定Xn为离群值为离群值当当Dn D1-(n)时,判定时,判定X1为离群值为离群值否则二者都判未发现离群值。否则二者都判未发现离群值。附表附表2 2
9、相见相见GB/T4883-2008GB/T4883-2008 单侧单侧DixonDixon检验的临界值表,这检验的临界值表,这里将不再列举。里将不再列举。数据的统计处理和解释数据的统计处理和解释 Dixon检验法:统计离群值的判断(单侧)A、当检出、当检出Xn或或X1为离群值时,确定剔除水平为离群值时,确定剔除水平*B、查附表、查附表3,D1-*(n)Dixon检验法:统计离群值的判断(双侧)略当当DnD1-*(n)时时低端低端判断判断X1为统计离群值为统计离群值否则否则X1为歧离值为歧离值判断判断Xn为统计离群值为统计离群值否则否则Xn为歧离值为歧离值数据的统计处理和解释数据的统计处理和解释
10、当当DnD1-*(n)时时否则否则高端高端数据的统计处理和解释数据的统计处理和解释 附表附表1 Grubbs1 Grubbs检验的临界值表检验的临界值表n0.90 0.950.9750.990.99531.1481.1531.1551.1551.15541.4251.4631.4811.4921.49651.6021.6721.7151.7491.76461.7291.8221.8871.9441.97371.8281.9382.022.0972.13981.9092.0322.1262.2212.27491.9772.112.2152.3232.387102.0362.1762.292.41
11、2.482112.0882.2342.3552.4852.564122.1342.2852.4122.552.636132.1752.3312.4622.6072.699142.2132.3712.5072.6592.755152.2472.4092.5492.7052.806162.2792.4432.5852.7472.852172.3092.4752.622.7852.894182.3352.5042.6512.8212.932192.3612.5322.6812.8542.968202.3852.5572.7092.8843.001数据的统计处理和解释数据的统计处理和解释附表附表1 Grubbs1 Grubbs检验的临界值表检验的临界值表n0.90 0.950.9750.990.995212.4082.582.7332.9123.031222.4292.6032.7582.9393.06232.4482.6242.7812.9633.087242.4672.6442.8022.9873.112252.4862.6632.8223.0093.135262.5022.6812.8413.0293.157272.5192.6982.8593.0493.178282.5342.7142.8763.0683.199292.5492.732.8933.0853.218302.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年广东省肇庆市单招职业倾向性考试题库附参考答案详解(突破训练)
- 2026年常州机电职业技术学院单招职业倾向性考试题库附答案详解(满分必刷)
- 2026跨境电商供应链金融创新模式及风险管理策略报告
- 2026年广东茂名幼儿师范专科学校单招职业适应性考试题库完整参考答案详解
- 2026节能材料市场发展分析及建筑应用与投资潜力研究报告
- 2026航空复合材料维修检测技术发展现状评估报告
- 2026年广西工业职业技术学院单招职业倾向性测试题库及答案详解一套
- 2026年广东省汕尾市单招职业倾向性测试题库及答案详解(夺冠)
- 2026脑机接口设备行业市场深度分析及临床进展与商业前景报告
- 2026年广元中核职业技术学院单招职业适应性测试题库及一套参考答案详解
- 【中小学】【语文】2026春季下开学第一课:骐骥驰聘势不可挡
- 【新教材】人美版(2024)小学4年级劳动下册项目一+任务二+蒜蓉西蓝花(教学课件)
- 小学元宵节主题班会 课件(希沃版 )
- 2025年江西电力职业技术学院单招职业技能考试题库附答案解析
- 2025-2026学年北京市平谷区九年级(上)期末英语试卷
- pp板施工项方案
- 2026湖北武汉东风延锋汽车座椅有限公司招聘备考题库及一套完整答案详解
- 河北省“五个一”名校联盟2025-2026学年高一上学期期末语文试题(含答案)
- 易制毒、易制爆化学品安全管理制度
- 2026年CGTN招聘考试试题
- 2026年江苏卫生健康职业学院单招职业技能考试题库参考答案详解
评论
0/150
提交评论