




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、正态性检验的一般方法姓名:蓝何忠学号:1101200203 班号:1012201正态性检验的一般方法【摘要】:正态分布是自然界中一种最常见的也是最重要的一种分布 因此,人们在实际使用统计分析时,总是乐于正态假定,但该假定是否 成立,牵涉到正态性检验.在一般性的概率统计教科书中,只是把这个 问题放在一般性的分布拟合下作简短处理,而这种"万精油"式的检验 方法,对正态性检验不具有特效.鉴于此,该文从不同角度出发介绍正 态性检验的几种常见的方法,并且就各种方法作了优劣比较,【引言】一般实际获得的数据,其分布往往未知。在数据分析中,经 常要判断一组数据的分布是否来自某一特定的分布,
2、比如对于连续性分布,常判断数据是否来自正态分布,而对于离散分布来说,常判断 是否来自二项分布.泊松分布,或判断实际观测与期望数是否一致, 然后才运用相应的统计方法进行分析。几种正态性检验方法的比较。一、2拟合优度检验:(1)当总体分布未知,由样本检验总体分布是否与某一理论分 布一致。H0:总体X的分布列为pX= = ,i=1,2,H1:总体X的分布不为”构造统计量Z厲一昭)2t=lI npi4=1其中j为样本中£发生的实际频数,聊为ho为真时£发生的理论频数。(2)检验原理若厂=0,则fj=n*意味着对于片,观测频数与期望频数完全一致,即完全拟合。观察频数与期望频数越接近,
3、则2值越小。当原假设为真时,有大数定理,4与不应有较大差异,即 彳值应较小。若2值过大,则怀疑原假设。拒绝域为R= 2 d,判断统计量是否落入拒绝域,得出结论。二、Kolmogorov-Smirnov 正态性检验:Kolmogorov-Smirnov检验法是检验单一样本是否来自某一特定分布。比如检验一组数据是否为正态分布。它的检验方法是以样本数 据的累积频数分布与特定理论分布比较, 若两者间的差距很小,则推论该样本取自某特定分布族。即对于假设检验问题:H0:样本所来自的总体分布服从某特定分布H1:样本所来自的总体分布不服从某特定分布统计原理:Fo( x)表示分布的分布函数,Fn (x)表示一组
4、随机 样本的累计概率函数。Fn(X)#X 岂 X, i =1,2,IH,nn设D为Fo(x)与Fn(x)差距的最大值,定义如下式D=max|F n(x)-Fo(x)|对于给定的a, PDn>d二a.例如:35位健康男性在未进食前的血糖浓度如表所示,试测验这组数据是否来自均值a =80,标准差(T =6的正态分布 87 77 92 68 80 78 84 77 81 80 80 77 92 86 76 80 81 75 77 72 8190 84 86 80 68 77 87 76 77 78 92 75 80 78 n=35检验过程如下:假设H0:健康成人男性血糖浓度服从正态分布计算过程
5、如表:浓度(f)累计次数Fn(x)-F a标准化值理陀甘布FQ <x)D0.0571-2-0C0.022£0.02-4r40.1 i4S-1J330.4»349175fi0 1714-Q.S3020330.02r Ar$0.2286-0.6 ?0.251409776140.4(X)041500.308?0.035170.4®5?-0.J30.3707旧帥6230.«7100.50000.02£1rJ26074290.170iMT52864r Ar2S0.80Q00 670J4SS0.09丽1弭C.S571too0.341 j1587
6、63;32091431.17D.S79Don贮51.0M02.00500.1571o.r540.0514o.oi550.03530.022S结论:上表中的理论值/(x)是根据标准化值z查表得到,实际上D=max |Fn (x)-0.23查D值表,故不能拒绝HO即健康成年男人血糖浓度服从正态分布,当样本容量n大时可以用 Da, n=1.36/求得结果,如上述 D0.55,35=1.36/=0.2299=0.23结论:当实际观测D>Dn则接受H1,反之则不拒绝H0假设。72拟合优度检验与K-S正态检验的比较:72拟合优度检验与 K-S正态检验都采用实际频数与期望频数进行检验。它们之间最大的不
7、同在于前者主要用于类别数据,而后者主要用于有计量单位的连续和定量数据,拟合优度检验虽然也可以用于 定量数据,但必须先将数据分组得到实际观测频数,并要求多变量之间独立,而K-S正态检验法可以不分组直接把原始数据的n个观测值进行检验,所以它对数据的利用较完整。三、Lilliefor正态分布检验该检验是对Kolmogorov-Smirnov检验的修正,当总体均值和方差未知时,Lilliefor 提出用样本均值和标准差代替总体的期望和标 准差,然后使用 Kolmogorov-Smirnov正态性检验法,它定义了一个 D统计量;D=max Fn ( x)- Fo( x)|参数未知,由直二監 孑二F计算得
8、到统计量,查表得Lilliefor检验的临界值,确定拒绝域,得出结论。四、偏度峰度检验法:(一)偏度检验:设随机变量X具有数学期望卩i £和方差:产勺;”,为X的 偏度,所谓偏度检验就是检验如下假设:=0亂奏竝注意到,拒绝原假设F ,则可以认为样本不是来自正态总体。接受原假设,并不等价于接受原假设“样本来自正态总体”。这是因为任一对称分布的偏度都为0,无法排除样本来自非正态的对称分布的可 能。因此,偏度检验只能检验数据分布的对称性。由于总体分布未知,无法直接得到总体的偏度,故可以利用样本 偏度作为检验上述假设的检验统计量,记定义1设打初严崗为随机变量X的n个相互独立的样本,偏度检验的
9、检验统计量为(*)常被用于双尾检验,因为非正态分布可能出现左偏,也可能出 现右偏。在原假设成立时, 何侶0,在显著性水平 a e w F取定 分位点一,若卜订|:'卫,则拒绝原假设。事实上,一的分布是对 称的,因此采取双尾检验的做法是合理的。定理1设,,为(*)式中定义的偏度检验统计量,则.渐进服从均 值为0,方差为6的正态分布,即t M(Qj6) (N t oo)样本容量有限的情形,使用渐进情形下的结论就会导致较高的出 错率,这也是偏度检验的一个缺陷。需要指出的是,只有在确定对称 性是唯一影响分布的形态时,偏度检验才是合适的选择,否则应该避 免使用偏度检验。(二)峰度检验设随机变量X
10、具有数学期望 |1ER 和方差- ,一 为X的峰度,所谓峰度检验,实际上是将正态性检验转化为检验如下假设:判2=3:伤 *3如同偏度检验一样,峰度为3的非正态分布也是存在的。所以, 接受原假设匚并不能表明X 一定服从正态分布,这一事实也导致对数据的正态性检验会有一定的出错率。定义2设y Y v; 一为随机变量X的n个相互独立的样本,峰度(*2)检验的检验统计量为b2 =定理2设为(*2)式中定义的峰度统计量,则丽曲 一 3) T N©24) Tl T 00同偏度统计量一样,一-的收敛速度也是比较慢的五、小样本场合(3<n<50)的W检验w检验是检验样本容量 n <
11、50时,样本是否符合正态分布的一种方法。其检验步骤如下:将数据按数值大小重新排列,使x1 <x2xn;计算n、(Xi -X)2i A计算 式中:当n为偶数时,i=n/2 ; n为奇数时,i= (n 1) /2 ;值可查表得出;计算检验统计量n 2ai(X(n“)-X(i)2W 二i珀n' (Xi -X)2i =1若W值小于判断界限值W a (可通过查表求得),按表上行 写明的显著性水平 a舍弃正态性假设;若W >W a ,接受正态性假六、大样本场合(50<n<100)的D检验检验统计量:)X(i)n(ii丄(.n)vjx(i)_X)再令v_(D 0.28209479)丽Y =0.2998598则在显著性水平时,拒绝域为 y<WY>M 。其中沁分别为丫的1/2和-必/2分位数。总结在各种正态性检验方法中,一般通用的方法有2检验以及K检验,但 检验精度较低。偏度检验对非对称、长尾分布较敏感;峰度检验对对称分布较敏感;W检验对各种分布(特别对非对称分布
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源行业大数据报告:技术创新与环保节能
- 数字化技术赋能2025年零售门店智能化数据分析与消费者洞察案例研究报告
- 聚焦2025年制造业数字化转型数据治理与智能制造数据分析报告
- 2025云南华电金沙江中游水电开发有限公司LP建设分公司面向华电系统内外招聘5人备考考试题库附答案解析
- 2025江苏徐州沛县新华中学招聘33人备考考试题库附答案解析
- 2025年安徽某省属国有企业本部招聘驾驶员1名考试参考题库及答案解析
- 2025年淮北濉溪县龙华学校教师招聘考试模拟试题及答案解析
- 2025年菏泽学院公开招聘人员(5名)考试参考题库及答案解析
- 2022届广东省六校高三下学期第四次联考化学试题(含解析)
- 2025年河北沧州市中心医院招聘工作人员备考考试题库附答案解析
- 635MPa级热轧带肋高强钢筋应用技术规程
- 2024译林英语七年级上册单词
- 历年全国普通话考试真题50套
- 第三单元小数除法(单元复习讲义)教师版-2024-2025学年五年级上册(人教版)
- 人教版(2024新版)七年级上册英语Starter Unit1单元测试卷(含答案)
- 中学篮球社团教案全套
- 电焊、气焊、电渣焊作业预防措施及应急预案
- 幼儿园的食品安全工作计划
- (新教科版)科学五年级上册全册教学反思
- 职业技术学院《老年常见疾病预防与照护》课程标准
- 2025年高考语文备考之语言文字运用汇编(2)含答案
评论
0/150
提交评论