正态分布检验教案_第1页
正态分布检验教案_第2页
正态分布检验教案_第3页
正态分布检验教案_第4页
正态分布检验教案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Shapiro-Wilk 检验含义:Shapiro Wilk 检验法是 S.S.Shapiro 与 M.B.Wilk提出用顺序统计量 W来检验分布的正态性,对研究的对象总体 先提出假设认为总体服从正态分布,再将样本量为n的样本按大小顺序 排列编秩,然后由确定的显著性水平口,以及根据样本量为 n时所对应的 系数批根据特定公式计算出检验统计量 W.最后查特定的正态性 W检验 临界值表,比较它们的大小,满足条件则接受假设,认为总体服从正态分 布,否则拒绝假设,认为总体不服从正态分布.W检验全称Shapiro-Wilk检验,是一种基于相关性的算法。计算可 得到一个相关系数,它越接近1就越表明数据和正态

2、分布拟合得越好。w检验是检验样本容量8司 痣0时,样本是否符合正态分布的一种 方法。计算式为:卬叫1X1 出 F其检验步骤如下:将数据按数值大小重新排列,使 x1政2 0Wn ;计算上式分母;计算a值,可查表得出;计算检验统计量W;若W值小于判断界限值W a (可通过查表求得),按表上行写明 的显著性水平a舍弃正态性假设;若 W>W%接受正态性假设。正态分布是许多检验的基础,比如F检验,I检验,卡方检验等在 总体不是正太分布是没有任何意义.因此,对一个样本是否来自正态 总体的检验是至关重要的.当然,我们无法证明某个数据的确来自正 态总体,但如果使用效率高的检验还无法否认总体是正太的检验,

3、我 【门就没有理由否认那些和正太分布TT关的检监有意义,卜面我就对正 咎性检验方法进行简单的加纳和比较.图示法LP-P 图以样本的累计频率作为橙坐标,以按照正态分布计算的相应累计 率作为纵坐标,以样本值表现为直角坐标系的散点&如果数据服从 正态分布,则样本点应围绕第一象限的对角线分布,2, Q-Q 图以样本的分位数作为横坐标,以按照正态分布计算的相应分位点作 为纵坐标,把样本表现为直角坐标系的散点。如果数据服从正太分布, 则样本点应闱绕第一象限的对角线分布.以上两种方法以Q-Q图为佳,效率较高。3直方图判断方法:是否以钟型分布,同时可以选择输出正态性曲线.4 .箱线图判断方法:观察矩形

4、位置和中位数,若矩形位于中间位置且中位数位于矩形的中间位置,则分布较为对称,否则是偏态分布.5 .茎叶图判断方法:观察图形的分布状态,是否是对称分布.二.偏度、峰度检验法:1. S,K的极限分布样本偏度系数$=上该系数用于检验对称性,S0时,分布呈正偏态,S<0时,分布呈 负偏态样本峰度系数该系数用于检验峰态,K>0时为尖峰分布,S<0时为扁平分布;当 S=0, K=0时分布呈正态分布。小:F(x)服从正态分布F不服从正态分布当原假设为真时,检验统计量ck1.1) )-=NfO)V6/m'/24/n对于给定的<LR= |>九3|>X)其中入=U 32

5、. Jarque-Bera检验(偏度和峰度的联合分布检验法)检验统计量为JB=平卜+;芯)-/(2)JB过大或过小时,拒绝原假设.三.非参数检验方法L Kolmogorov-Smirnov正态性检验(基于经验分布函数(ECDF)的检验)D = nFn(x)-F0(x)月表示一组随机样本的累计概率函数,月表示分布的分布函 矩当原假设为真时,D的值应较小,若过大,则怀疑原假设,从而,拒绝域为R = D>d对于给定的4p=PD>ci=a 乂产二PR之力力2.Lilliefor正态性检验该检验是对Ko 1 mogorov-Smirnov检验的修正,参数未知时,山R =匕方之=郃可计算得检验

6、统计量瓦的值。3.ShHpim-Wilk 期检验)检验统计量:点(g-则尸)吟星7L制)於(厂打当原假设为真时,Mr的值应接近于1,若值过小,则怀疑原假 设,从而拒绝域为R = <c在给定的值水平下P 四以二以4. /拟合优度检验(也是某于经验分布函数(ECDF)的检验)检验统计量为/=比2也-吟2=诈_)r是被估参数的个数若原假设为真时,/应较小,否则就怀疑原假设,从而拒绝域为 出=/之一,对于给定的值P2 >d = a 又=仪/之£*四.方法的比较1. 图示法相对于其他方法而言,比较直观,方法简单,从图中可以直 接判断,无需计算,但这种方法效率不是很高,它所提供的信息

7、只是 正态性检验的重要补充.2. 经常使用的/拟合优度检验和Kolmogorov-Smirnov检验的检验功 效较低,在许多计算机软件的KoImogarov-Smirnov检验无论是大小样 本都用大样本近似的公式,很不精准,一般使用SimpirQ-Wilk检验和 Lil lief"检验。3. Ko 1 uiogorov-Smirnov检验只能检验是否一个样本来自于一个已知 样本,而Lilliefor检验可以检验是否来自未知总体。4. Shapiro-Wilk检验和Lilliefor检验都是进行大小排序后得到的, 所以易受异常侑的影响。5. Shapiro-Wilk检验只适用于小样本场

8、合(3«n<50),其他方法的 检验功效一般随样本容量的增大而增大。6. /拟合优度检验和Kolmogorov-Smirnov检验都采用实际频数和期望频数进行检验,前者既可用于连续总体,又可用于离散总体,而 Ko 1 mogorov-Smirnov检验只适用于连续和定量:数据,7. /拟合优度检验的检验结果依赖于分组,而其他方法的检验结果与区间划分无关。&偏度和峰度检验易受异常值的影响,检验功效就会降低。9.假设检验的目的是拒绝原假设,当p值不是很大时,应根据数据背景再作讨论.参考文献:王星:非参数统计20052吴喜之:非参敏统计19993贾俊平、何晓群、金勇进:统计学

9、2008【41茄诗松、周纪尊:概率论与数理统计20085吴喜之、赵博姐:非参数统计200961资料的正态性检验汇总2009【转】常用的相关系数(Pearson相关、Spearman相关、Kendall 相关)标签:相关系数2013-01-16 16:41 阅读(2063)评论(0)常用的相关系数Pearson相关系数亦称积差相关系数(coefficient of product-moment correlation ),用r表示样本相关系数, P表示总 体相关系数。它是说明有直线关系的两变量间,相关关系密切程度和相关方向的统计指标。计算公式:注意事项:U变量是正态分布,没有奇异值噪音。所以做相

10、关性分析之前要去除可能的奇异值,而且如果不是正态分布,可以通过取对数来近似获得。U另外,对于某些数据样本,考查两个变量之间的相关性,按照某类属性将样本分割,分别考查,或许会获取更有价值的知识。Spearman 相关系数又 称秩相关系数、等级相关系数,或顺序相关系数,是利用两变量的秩次大小作线性相关分析,具体是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。Spearman 对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。计算等级相关系数,可以将数据变换成等级以后用原有的相关系数公式计算,也可以将算出每一对样本的等级之差di ,然后用下

11、列公式计算,所以又称为“等级差数法” 。Kendall 相关系数:肯 德尔系数又称和谐系数(the Kendall coefficient of concordance) 是表示多列等级变量相关程度的一种方法。这种资料的获得一般采用等级评定的方法,即让K 个被试(或称评价者)对 N 件事物或N种作 品进行等级评定,每个评价者都能对N 件事物 (或作品 )好坏、优劣、喜好、大小、高低等排出一个等级顺序。因此,最小的等级序数为1,最大的为N,这样,K个评价者便可得到K列从1至N的等级变量资料, 这是一种情况。另一种情况是一个评价者先后K 次评价 N 件事物或N 件作品, 也是采用等级评定的方法,这样也可得到K 列从 1 至 N 的等级变量资料。这类 K 列 等级变量资料综合起来求相关,可用肯德尔系数。如欲考察几位老师对多篇作文的评分标准是否一致(又称评分者信度),就应该使用肯德尔系数。德尔和谐系数常用符号W 表示。其公式为:Ri 为每一件被评价事物的K 个等级之和,N 为被评价事物的件数即等级数,K 为评价者的数目或等级变量的列数。W 值介于 0 与 1 之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。这种方法的原理是基于这样一种思想:如果各列变量完全一致,那么各被评价的事物(或人), 其各评价者所评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论