资料的正态性检验汇总.doc_第1页
资料的正态性检验汇总.doc_第2页
资料的正态性检验汇总.doc_第3页
资料的正态性检验汇总.doc_第4页
资料的正态性检验汇总.doc_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

资料的正态性检验汇总S PSS和SAS常用正态检验方法一、图示法1、P-P图以样本的累计频率作为横坐标,以安装正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系中的散点。如果资料服从整体分布,则样本点应围绕第一象限的对角线分布。2、Q-Q图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作为纵坐标,把样本表现为指教坐标系的散点。如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。以上两种方法以Q-Q图为佳,效率较高。3、直方图判断方法:是否以钟形分布,同时可以选择输出正态性曲线。4、箱式图判断方法:观测离群值和中位数。5、茎叶图类似与直方图,但实质不同。二、计算法1、偏度系数(Skewness)和峰度系数(Kurtosis)计算公式:g1表示偏度,g2表示峰度,通过计算g1和g2及其标准误g1及g2然后作U检验。两种检验同时得出U0.05的结论时,才可以认为该组资料服从正态分布。由公式可见,部分文献中所说的“偏度和峰度都接近0可以认为近似服从正态分布”并不严谨。2、非参数检验方法非参数检验方法包括Kolmogorov-Smirnov检验(D检验)和Shapiro- Wilk (W 检验)。SAS中规定:当样本含量n 2000时,结果以Shapiro Wilk(W 检验)为准,当样本含量n 2000 时,结果以Kolmogorov Smirnov(D 检验)为准。SPSS中则这样规定:(1)如果指定的是非整数权重,则在加权样本大小位于3和50之间时,计算 Shapiro-Wilk 统计量。对于无权重或整数权重,在加权样本大小位于3 和 5000 之间时,计算该统计量。由此可见,部分SPSS教材里面关于“Shapiro Wilk适用于样本量3-50之间的数据”的说法实在是理解片面,误人子弟。(2)单样本 Kolmogorov-Smirnov 检验可用于检验变量(例如income)是否为正态分布。对于此两种检验,如果P值大于0.05,表明资料服从正态分布。三、SPSS操作示例SPSS中有很多操作可以进行正态检验,在此只介绍最主要和最全面最方便的操作:1、工具栏-分析描述性统计探索性2、选择要分析的变量,选入因变量框内,然后点选图表,设置输出茎叶图和直方图,选择输出正态性检验图表,注意显示(Display)要选择双项(Both)。3、Output结果(1)Descriptives:描述中有峰度系数和偏度系数,根据上述判断标准,数据不符合正态分布。Sk=0,Ku=0时,分布呈正态,Sk0时,分布呈正偏态,Sk0曲线比较陡峭,Ku 0 时, 分布呈正偏态,S k 0 时, 分布呈负偏态。适用条件:样本含量应大于2002、用夏皮罗-威尔克(Shapiro-Wilk)法检验数据正态性即W检验,1965 年提出,适用于样本含量n 50 时的正态性检验;。3、用达戈斯提诺(DAgostino)法检验数据正态性即D检验,1971提出,正态性D检验该方法效率高,是比较精确的正态检验法。4、Shapiro-Francia 法即W检验,于1972 年提出,适用于50 n 5000 结果以Kolmogorov - Smirnov 为准。而SAS 规定:当样本含量n 2000 时,结果以Shapiro - Wilk (W 检验) 为准,当样本含量n 2000 时,结果以Kolmogorov - Smirnov (D 检验) 为准问:对照组和病例组都是20例,拟对某指标进行正态性检验,是用Kolmogorov-Smirnov检验(简称K-S检验),还是Shapiro-Wilk检验?已用K-S检验不能认为该指标不是正态分布,但是Shapiro-Wilk检验表明其为非正态分布,我该相信哪个检验结果?答:Kolmogorov-Smirnov检验:检验频数分布的正态性检验,适合大样本。Shapiro-Wilk检验:小样本数据的正态性检验。矩法正态性检验: 不限样本。问:用SPSS中analysze/discriptive statistics/explore法和用analyze/nonparametric tests/1-sample K-S法评价正态性,结果不完全相同,为什么?答:以第二个为准,第一种方法是参数检验,而第二种是非参数检验,第一种是在知道总体分布的情况下做的,第二种是在不知道总体分布的情况进行的检验,而且大多数的检验,我们都是不知道总体分布到底是什么才做的K-S检验。因此在做分析的时候一般用第二种,标准的检验单样本分布的方法。不过一般推荐用上面的,并且和SAS的结果比较吻合。同时样本量小的时候选S-W的结果,至于结果的不同,应该是不同的方法算出的值不同,这很正常,因为这几个方法的数学表达式就不一样,中间对数据的处理也不一样,会有信息损失等原因的,在正态检验中,尤其是接近水准时,往往容易出现问题,所以要根据资料的性质判断用什么方法进行检验更合适。不是把所有的方法都做一遍。对于到底P取多少才有意义,说法有好多种,常用的是0.1 吧,SPSS自带的是0.2的界值。其实还是得结合QQ,PP图之类的来观察会好些。小样本最好不要看Kolmogorov-Smirnov的结果,常常会有问题,Shapiro-Wilk 的结果会好些。补充:如果根据国标,其偏态和峰态算法,其值为多少时符合正态别有规定呢?K-S检验记得在资料上见过8=n5000结果以Kolmogorm Smimov(D检验)为准。SAS规定:当样本含量n2000时,结果以ShapimWilk(W 检验)为准,当样本含量n2000时,结果以KolmogorovSmimov(D检验)为准。在SPSS和SAS等统计分析软件中,通常用统计描述模块中的Shapiro-Wilk检验、经过Lilliefors显著水平修正的KolmogorovSmirnov检验和非参数检验模块中的单一样本KolmogorovSmirnov检验进行正态性判定。但是这几种检验方法存在以下几方面的问题。(1)在实际应用中常出现检验结果与直方图、正态性概率图不一致,甚至几种假设检验方法结果完全不同的情况。(2)ShapiroWilk检验( 检验)和经过Lilliefors显著水平修正的KolmogorovSmirnov检验(D检验)是用一个综合指标(顺序统计量 或D)来判定资料的正态性由于两种方法都是用一个指标反映资料的正态性,所以当资料的正态峰和对称性两个特征有一个不满足正态性要求时,两种方法出现假阴性错误的机率均较大;而且两种方法的检验统计量都是进行大小排序后得到,所以易受异常值的影响。(3)KolmogorovSmirnov单一样本检验是根据实际的累计频数分布和理论的累计频数分布的最大差异来检验资料的正态性,可对正态分布进行拟合优度检验。但它并非检验正态性的专用方法,因此它的检验效率是最低的,最容易受样本量和异常值等因素的影响。没有修正的K-S检验的原始公式里面,检验的既是标化后的数据是否服从理论的分布。正态性检验(上)2008-04-25 10:451. 样本量较大时的结果:运用的数据是SPSS13.0Data里面的diameter_sub.sav,样本含量是216对数据分别支用SAS和SPSS进行正态性检验:1.1 SAS中用Proc univariate normal;命令结果如下:Tests for NormalityTest -Statistic- -p Value-Shapiro-Wilk W 0.993604 Pr D 0.0789其中SAS中SAS 规定:当样本含量n 2000 时,结果以Shapiro - Wilk (W 检验) 为准,当样本含量n 2000 时,结果以Kolmogorov - Smirnov (D 检验) 为准。1.2 SPSS里面用Explor过程Plots选项中Normality Plots with tests结果如下:Tests of NormalityKolmogorov-Smirnov(a)Shapiro-WilkStatisticdfSig.StatisticdfSig.AP diameter(mm).058216.070.994216.476a Lilliefors Significance Correction对于SPSS结果选用哪个方法,我看的资料并不一致:在SPSS13.0书上以样本量50,选Shapiro - Wilk 检验,(而有文献SPSS说样本含量3 n 5000 时,结果以Shapiro - Wilk (W 检验) 为准,有出入)1.3 在SPSS13.0中单样本的K-S拟合优度检验讲到:可以用来检验样本的分布是否服从某种理论分布可以是正态、均匀等。用上述例子选Normal分布进行计算结果如下:One-Sample Kolmogorov-Smirnov TestAP diameter(mm)N216Normal Parameters(a,b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论