




已阅读5页,还剩11页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
正态性检验方法简介一、 Anderson-Darling 检验AndersonDarling检验(简称A-D检验)是一种拟合检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进行比较,如果差异足够大,该检验将否定总体呈正态分布的原假设。样本数据的经验累积分布函数与理论累积分布函数之间的差异可通过两种分布之间的二次AD距离进行衡量,若二次AD距离小于置信水平下的临界值,则可认为样本数据来源于正态分布。Anderson-Darling 检验的计算步骤如下:1. 提出假设:; ;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为; 其次进行样本数据的标准化,计算公式如下: (式1-1)其中,为所有样本数据的平均值,为所有样本数据的标准差。 接着计算,计算公式为 (式1-2)其中,其中为标准正态分布函数,可查表获得。 最后A2值,计算公式如下: (式1-3)其中,N为样本总个数,为样本序号 3. 计算判定统计量,计算公式为: (式1-4)4. 查找临界值:根据给定的显著性水平,查Anderson-Darling临界值表,得到临界值;5. 作出判定:若,则在水平上,拒绝,即认为样本数据不服从正态分布;若,则不能拒绝,即认为样本数据服从正态分布。例1. 采用Anderson-Darling判断表1中的数据是否符合正态分布。表1 A-D检测样本数据序号数据序号数据序号数据18.14 1810.38 35 9.62 28.30 1910.38 36 9.72 38.44 2010.43 37 9.74 48.45 2110.48 38 9.78 58.62 2210.50 39 9.92 68.77 2310.56 40 9.94 78.82 2410.58 41 9.98 88.82 2510.69 42 9.99 98.90 2610.77 43 10.02 108.97 2710.80 44 10.04 119.01 2811.25 45 10.06 129.28 2911.44 46 10.16 139.34 3011.68 47 10.22 149.41 3111.84 48 10.32 159.44 3212.04 49 10.36 169.51 3312.12 50 10.37 179.54 3412.51 检验步骤如下:1. 提出假设:;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为,如表2中的第2列所示; 按照式1-1进行样本数据的标准化,如: , 其余依次类推,计算结果如表2中的第3列所示。 按照式1-2计算,如:,其余依次类推,计算结果如表2中的第4列所示。 计算和,如:,其余依次类推,计算结果如表2中的第5列和第6列所示。 计算,如:当=1时,当=2时,其余依次类推,计算结果如表2中的第7列所示。 计算,如:当=1时,当=2时,其余依次类推,计算结果如表2中的第8列所示。 最后计算:表2 A-D检测计算过程表序号数据标准化18.14-1.8230.034-3.376-0.035-8.281-8.28128.30-1.6670.048-3.041-0.049-6.960-20.87938.44-1.5300.063-2.765-0.065-6.497-32.48748.45-1.5200.064-2.746-0.066-6.036-42.25358.62-1.3550.088-2.433-0.092-5.394-48.54468.77-1.2090.113-2.177-0.120-4.681-51.49678.82-1.1600.123-2.095-0.131-4.272-55.53488.82-1.1600.123-2.095-0.131-3.606-54.09498.90-1.0820.140-1.969-0.150-3.441-58.493108.97-1.0140.155-1.862-0.169-3.233-61.434119.01-0.9750.165-1.803-0.180-3.043-63.904129.28-0.7120.238-1.434-0.272-2.651-60.982139.34-0.6530.257-1.359-0.297-2.510-62.742149.41-0.5850.279-1.275-0.328-2.404-64.909159.44-0.5560.289-1.240-0.341-2.316-67.161169.51-0.4870.313-1.162-0.375-2.185-67.748179.54-0.4580.323-1.129-0.391-2.153-71.037189.62-0.3800.352-1.044-0.434-2.058-72.034199.72-0.2830.389-0.945-0.492-1.949-72.100209.74-0.2630.396-0.926-0.505-1.890-73.712219.78-0.2240.411-0.888-0.530-1.758-72.098229.92-0.0880.465-0.766-0.626-1.582-68.040239.94-0.0680.473-0.749-0.640-1.482-66.684249.98-0.0290.488-0.717-0.670-1.434-67.375259.99-0.0190.492-0.709-0.678-1.410-69.0792610.020.0100.504-0.685-0.701-1.363-69.5192710.040.0290.512-0.670-0.717-1.340-71.0292810.060.0490.519-0.655-0.733-1.295-71.2362910.160.1460.558-0.583-0.817-1.209-68.9003010.220.2050.581-0.543-0.870-1.073-63.2903110.320.3020.619-0.480-0.964-0.985-60.0623210.360.3410.633-0.456-1.004-0.949-59.7683310.370.3510.637-0.451-1.014-0.884-57.4923410.380.3610.641-0.445-1.024-0.836-55.9963510.380.3610.641-0.445-1.024-0.820-56.6123610.430.4090.659-0.417-1.075-0.759-53.8673710.480.4580.677-0.391-1.129-0.718-52.4383810.500.4780.684-0.380-1.151-0.677-50.8033910.560.5360.704-0.351-1.218-0.623-47.9894010.580.5560.711-0.341-1.240-0.522-41.2074110.690.6630.746-0.293-1.371-0.462-37.3854210.770.7410.771-0.261-1.472-0.411-34.1164310.800.7700.779-0.249-1.511-0.381-32.3524411.251.2090.887-0.120-2.177-0.252-21.8974511.441.3940.918-0.085-2.505-0.206-18.2984611.681.6280.948-0.053-2.960-0.145-13.1974711.841.7840.963-0.038-3.290-0.104-9.7004812.041.9790.976-0.024-3.733-0.089-8.4814912.122.0570.980-0.020-3.919-0.069-6.6965012.512.4370.993-0.007-4.905-0.042-4.1803. 计算判定统计量, 4. 查找临界值:根据给定的显著性水平=0.05,查附件中Anderson-Darling临界值表,得到临界值;5. 作出判定:因为,则不能拒绝,即认为样本数据服从正态分布。二、 Ryan-Joiner检验此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布的原假设。此检验类似于 Shapiro-Wilk 正态性检验。Ryan-Joiner检验的步骤为:1. 提出假设:;2. 计算相关系数,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序,排在第位的数据为; 其次进行样本数据的标准化,计算公式如下: (式2-1)其中,为所有样本数据的平均值,为所有样本数据的标准差。 然后值,计算公式如下: (式2-2)其中,N为样本总个数,为样本序号 3. 查找临界值:根据给定的显著性水平,查Ryan-Joiner检测临界值表,得到临界值;4. 作出判定:若,则在水平上,不能拒绝,即认为样本数据服从正态分布;若,则拒绝,即认为样本数据不服从正态分布。例2. 采用Ryan-Joiner方法判断表3中的数据是否符合正态分布。表3 Ryan-Joiner检测样本数据序号数据序号数据序号数据18.14 1810.38 35 9.62 28.30 1910.38 36 9.72 38.44 2010.43 37 9.74 48.45 2110.48 38 9.78 58.62 2210.50 39 9.92 68.77 2310.56 40 9.94 78.82 2410.58 41 9.98 88.82 2510.69 42 9.99 98.90 2610.77 43 10.02 108.97 2710.80 44 10.04 119.01 2811.25 45 10.06 129.28 2911.44 46 10.16 139.34 3011.68 47 10.22 149.41 3111.84 48 10.32 159.44 3212.04 49 10.36 169.51 3312.12 50 10.37 179.54 3412.51 检测过程如下:1. 提出假设:;2. 计算统计量,其计算步骤为: 首先将样本数据按照从小到大的顺序进行排序并编号,排在第位的数据为,如表4中的第2列所示; 按照式2-1进行样本数据的标准化,如: , 其余依次类推,计算结果如表2中的第3列所示。 计算,如:,其余依次类推,计算结果如表4中的第4列所示。 计算,如:,其余依次类推,计算结果如表4中的第5列所示。 计算,如:表4 RyanJoiner检测过程计算表序号18.14-1.823-14.8363.32228.30-1.667-13.8332.77838.44-1.530-12.9152.34248.45-1.520-12.8482.31258.62-1.355-11.6781.83568.77-1.209-10.5991.46178.82-1.160-10.2301.34588.82-1.160-10.2301.34598.90-1.082-9.6291.170108.97-1.014-9.0921.027119.01-0.975-8.7820.950129.28-0.712-6.6030.506139.34-0.653-6.0990.426149.41-0.585-5.5030.342159.44-0.556-5.2440.309169.51-0.487-4.6350.237179.54-0.458-4.3700.210189.62-0.380-3.6570.144199.72-0.283-2.7470.080209.74-0.263-2.5630.069219.78-0.224-2.1920.050229.92-0.088-0.8700.008239.94-0.068-0.6780.005249.98-0.029-0.2920.001259.99-0.019-0.1950.0002610.020.0100.0980.0002710.040.0290.2940.0012810.060.0490.4900.0022910.160.1461.4850.0213010.220.2052.0920.0423110.320.3023.1180.0913210.360.3413.5340.1163310.370.3513.6390.1233410.380.3613.7430.1303510.380.3613.7430.1303610.430.4094.2700.1683710.480.4584.8010.2103810.500.4785.0150.2283910.560.5365.6610.2874010.580.5565.8780.3094110.690.6637.0850.4394210.770.7417.9780.5494310.800.7708.3160.5934411.251.20913.5961.4614511.441.39415.9451.9434611.681.62819.0112.6494711.841.78421.1183.1814812.041.97923.8223.9154912.122.05724.9254.2295012.512.43730.4825.937合计49.81849.0315. 查找临界值:根据给定的显著性水平=0.05,查Ryan-Joiner检测临界值表,得到临界值;6. 作出判定:因为,则在水平上,不能拒绝,即认为样本数据服从正态分布。三、 K-S检验K-S(KolmogorovSmirnov)检验是以两位苏联数学家柯尔莫哥(Kolmogorov)和斯米诺夫(Smirnov)命名的。K-S检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。设是一个n次观察的随机样本观察值的累积概率分布函数,即经验分布函数;是一个特定的累积概率分布函数,即理论分布函数。定义,显然若对每一个x值来说,与十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。K-S检验主要考察的是绝对差数中那个最大的偏差,即利用下面的统计量作出判断。 (式3-1)K-S检验的步骤为:1. 提出假设:,2. 计算各个D,找出统计量3. 查找临界值:根据给定的显著性水平和样本数据个数n,查单样本K-S检验临界值表可以得到临界值4. 作出判定:若,则在水平上,拒绝,即认为样本数据不服从正态分布;若,则不能拒绝,即认为样本数据服从正态分布。例2:35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自正态分布:87, 77, 92, 68, 80, 78, 84, 77, 81, 80, 80, 77, 92 ,86 ,76 ,80 ,81 ,75 ,77, 72 ,81, 72, 84 ,86, 80 ,68 ,77, 87, 76, 77, 78, 92, 75, 80, 78 解:检验过程如下:1. 首先计算样本均值和标准差,经计算样本均值=79.7429,标准差=5.93763,故做出如下假设: H0:健康成人男性血糖浓度服均值为79.7429,标准差为5.93763的正态分布;H1: 健康成人男性血糖浓度不服均值为79.7429,标准差为5.93763的正态分布;2. 计算检验统计量D值表5 K-S检验中D统计量计算表血糖浓度次数(f)累计次数(F)经验分布函数Fn(x)=F/n标准化值Z=(xu)/s理论分布函数F0(x)=(Z)Di=| F0(x)- Fn(x)|68220.0571 -1.98 0.0240 0.0332 72240.1143 -1.30 0.0961 0.0182 75260.1714 -0.80 0.2122 0.0408 76280.2286 -0.63 0.2642 0.0357 776140.4000 -0.46 0.3221 0.0779 783170.4857 -0.29 0.3846 0.1012 806230.6571 0.04 0.5173 0.1399 813260.7429 0.21 0.5838 0.1590 842280.8000 0.72 0.7633 0.0367 862300.8571 1.05 0.8540 0.0031 872320.9143 1.22 0.8892 0.0251 923351.0000 2.06 0.9805 0.0195 首先将样本数据按照从小到大的顺序进行排列,并计算每个样本数据出现的次数和累计次数,如表5中的第1、2、3列所示; 其次计算样本数据的经验分布函数,计算公式为:。其中为样本数据的累计次数,为样本总数,如:,其余依次类推,计算结果如表5中的第4列所示; 然后进行样本数据的标准化,标准化计算公式为:,其中为所有样本数据的平均值,为所有样本数据的标准差,如: ,其余依次类推,计算结果如表5中的第5列所示; 接着计算样本数据的理论分布函数,计算公式为:,其中为标准正态分布函数,可通 过查找正态分布表获得,如:,其余依次类推,计算结果如表5中的第6列所示; 计算K-S的D统计量,计算公式为:,例如:依次类推,计算结果如表5中的第7列所示。 最后找出统计量3. 查找临界值:根据给定的显著性水平和样本数据个数n,查单样本K-S检验临界值表可以得到临界值。取当n=35时,4. 做出判定:由于= 0.1590,所以,不能拒绝,即测试数据服从正态分布。四、 关于Johnson转换中Z值选取的说明在Johnson转换中,需要根据正态性检验的结果进行Z值的选取,根据所选取的正态性检验方法的不同,Z值的选取方法也有所不同:(1)Anderson-Darling 检验若选用Anderson-Darling 检验,则应计算转换后数据的A2值和相应的值,从中选取最小的A2 值,如果该A2 值所对应的小于值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。(2)Ryan-Joiner检验若选用Ryan-Joiner检验,则应计算转换后数据的值,从中选取最大的 值,如果该值大于临界值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。(3)K-S检验检验若选用K-S检验,则应计算转换后数据的值,从中选取最小的 值,如果该小于临界值,则相应的Z值即为最优的Z值,且所对应的转换形式就是最优的 Johnson 转换形式。若无法找到这样的z值,则说明样本数据不适合进行Johnson变换。附表一:Anderson-Darling临界值表0.10.050.0250.010.0050.6310.7520.8731.0351.159附表二:Ryan-Joiner检验临界值表样本数50.90260.87930.82660.91060.88860.837970.91770.89740.849780.9240.90520.860590.92940.9120.8701100.9340.91790.8786110.93810.9230.8861120.94170.92760.8928130.94490.93160.8987140.94770.93520.904150.95030.93840.9088160.95260.94130.9132170.95470.94390.9171180.95660.94630.9207190.95830.94840.924200.95990.95040.927210.96140.95230.9297220.96270.9540.9323230.9640.95560.9347240.96520.95710.9369250.96630.95840.939260.96730.95970.9409270.96830.96090.9427280.96920.9620.9444290.970.96310.946300.97080.96410.9475310.97160.96510.9489320.97230.9660.9503330.9730.96680.9516340.97360.96760.9528350.97420.96840.9539360.97480.96910.955370.97540.96980.9563
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国烟草总公司吉林省公司招聘87人笔试题库历年考点版附带答案详解
- 2025年上半年甘肃陇南文县教师资证认定模拟试卷附答案详解(黄金题型)
- 2025年5月四川雅安市公益性岗位安置计划4人考前自测高频考点模拟试题附答案详解(典型题)
- 2025广东湛江市霞山区司法局招聘司法协理员拟聘用人员(第一批)考前自测高频考点模拟试题有完整答案详解
- 2025山东省科创集团有限公司管理储备人才校园招聘20人笔试题库历年考点版附带答案详解
- 2025河南工程学院招聘高层次人才160人模拟试卷及答案详解(全优)
- 2025内蒙古职业技术学院招聘引进专任教师13人考前自测高频考点模拟试题及答案详解(必刷)
- 2025北京大学医学部总务处房地产管理中心宿舍管理员招聘1人模拟试卷及答案详解(名校卷)
- 2025黑龙江齐齐哈尔市富裕县富海镇招聘公益性岗位人员2人考前自测高频考点模拟试题及答案详解(各地真题)
- 2025湖南省职业病防治院高层次人才公开招聘9人模拟试卷及完整答案详解一套
- 几何公差培训课件
- 腾讯公司培训管理制度
- 徒步队安全管理制度
- 2025公需课《人工智能赋能制造业高质量发展》试题及答案
- 店铺转让分期协议书
- 呼吸机撤离与拔管流程标准化指南
- 国家职业技能标准 保育师
- 消防法律知识培训课件
- 小学生防电信诈骗课件
- 《玻璃纤维湿法制品》课件
- 朝花夕拾中父亲的病
评论
0/150
提交评论