非参数统计论文 非参数统计方法与实例_第1页
非参数统计论文 非参数统计方法与实例_第2页
非参数统计论文 非参数统计方法与实例_第3页
非参数统计论文 非参数统计方法与实例_第4页
非参数统计论文 非参数统计方法与实例_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非参数统计方法与实例在统计学中,最基本的概念是总体、样本、随机变量、分布、估计和假设检验等,其中很大一部分食与正态理论相关的。在我们已经学过的知识里,总体的分布形式往往是给定的或已经假定了的,我们只需要在总体分布已知的基础上对参数进行估值或者进行检验。但是实际上,对总体的分布的假定并不是能随便做出的,数据可能并不是来自假定的总体分布,或者根本不是来自同一个总体。在这种假定下进行推断就可能产生错误的结论。于是,人们希望能在不假定总体分布的情况下,尽量从数据本身来获得所需的信息,这就是非参数统计的宗旨。在统计学的方法中,参数方法与非参数方法没有谁优谁劣之说,有的只是在具体情况下,谁更适用、谁更准确

2、完整表示数据的信息。接下来,我将就参数统计与非参数统计分别分析其适用情形与优缺点,并详细介绍几种非参数统计的方法并有案例分析。1、参数统计与非参数统计非参数统计方法和参数统计方法共同组成统计分析方法,它们都是统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非

3、参数”检验。就上文我们可以看出,参数统计和非参数统计分别针对不同的数据来使用。参数统计方法的适用范围是很好确定的,它适用于数据分布已知或者可以做出比较正确的假定的数据,对这些数据进行检验、估计,得出数据总体的均值、方差等参数来描述数据特征。这样的数据一般都有这三个要求:1、抽样总体为正态分布或近似正态分布;2、各抽样总体为等方差或方差齐性;3、各变量值间是相互独立的。而非参数统计,顾名思义,是不用估计参数来描述数据特征的方法,只通过对数据作一些诸如分布连续、有密度、具有某阶矩等一般性的假定来揭示数据特征,这也就赋予了非参数统计方法特别的适用数据范围,一般总结为以下四种:1、待分析数据不满足参数

4、检验所要求的假定,因而无法应用参数检验;2、仅由一些等级构成的数据,不能应用参数检验。例如,在一些经济数据中,通常是将一个特征数据分级而不是采用具体数据,这样的数据时没办法做参数检验和估计的,因此非参数统计也就适用了;3、所提的问题的数据中并不包含的参数,也不能用参数检验;4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。因为一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来更为方便快捷,因此这种情况下采用非参数统计是一个正确的选择。接下来,将分析参数统计方法与非参数统计的优缺点并进行比较。一般来说,它们两者的优缺点是相对的。非参数统计与参数统计相

5、比具有很多优点,比如说:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。那么这一点相对的也就是参数统计的缺点,参数统计可以适用的数据一定是总体已知或可以知道的,并且一旦需要计算统计量就意味着数据时需要精确测量的,因此,参数统计适用的范围是很窄的;2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。当然,非参数统计方法也有缺点。首先,由于方法简单,用的计

6、量水准较低,使用非参数统计方法时就不如参数统计方法敏感,可能准确度上会有偏差,因为毕竟非参数统计方法只使用了样本的信息,而未使用总体信息。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第u类错误的概率B要大些。这也相对的是参数统计方法的优点,一旦数据可以使用参数统计,那么相比非参数统计得出的结果更精确,更有效。2、非参数统计方法下面,我将介绍非参数统计方法,主要是介绍非参数检验的方法。非参数检验的方法是非常多的,有针对独立样本的检验,也有针对配对样本的检验;有针对单样本的检验,有针对两个样本的检验,也有针对多样本的检验。我选取了两种比较常用的检验方法,即针对两配对

7、样本的Wilcoxon检验和针对两独立样本的曼-惠特尼U检验。2.1 两配对样本的Wilcoxon检验在处理两配对样本的检验中,还有一种检验是符号检验,但因为在符号检验中,只考虑到了差异的符号,而没有考虑到数据包含的信息,因此在符号检验的基础上选取考虑到数据大小的Wilcoxon秩检验。在Wilcoxon秩检验中,它把观测值和零假设的中心位置之差的绝对值的秩分别按照不同的符号相加作为其检验统计量。它适用于t检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(即产生数据的总体是否具有相同的均值)。Wilcoxon秩检验与符号检

8、验相比优点更多,它在符号检验利用了观测值和零假设的中心位置之差的符号进行检验的基础上,利用这些差的大小(体现于差的绝对值大小)所包含的信息来进行检验。这样在符号检验中利用每个观测值点相应的正号或负号仅仅代表了该点在中心位置的哪一边的基础上,用绝对值差的大小来表示该点距离中心的远近。这样加入了各观测值距离中心远近的信息的Wilcoxon秩检验自然比仅仅利用符号要更有效。这也是wilcoxon秩检验的中心思想。2.2 两独立样本的曼-惠特尼U检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。曼-惠特尼U检验又称

9、“曼-惠特尼秩和检验”,是由H.B.Mann和D.R.Whitney于1947年提出的。它假设两个样本分别来自除了总体均值以外完全相同的两个总体,目的是检验这两个总体的均值是否有显著的差别。曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样本中各测定值所排的秩,它比符号检验法使用了更多的信息。它的主要思想是假定要检验两组数据之间有没有差异。首先,不管分组把所有数据排序。按照数值大小给定一个值叫做秩。最小的值秩为1,最大的为N(假定两个样本总共有N个观察值)。如果有相同的值,就得到相同的秩。相同的值的秩是他们的

10、秩的平均值。如果两组的秩的和差距比较大,就会得出较小的p值,认为这两组间有显著差异。根据曼-惠特尼U检验的公式可以看出它比较的是两个样本中位数,并且曼-惠特尼U检验只用于两组数据的比较。如果要比较多组数据,可以用Kruskal-Wallis检验。用几次Mann-Whitney检验来比较多个组间的差异是不适合的,就如同ANOV年能用多次t检验代替一样。因此,曼-惠特尼U检验只适用于两独立样本的检验。3、实例3.1 目的及意义在进行实例分析时,我选取了股票市场的数据。选取了40个st上市公司的每股收益和40个非st上市公司的每股收益指标,对它们进行分析,看每股收益指标是否存在显著性的差异。我们都知

11、道st表示被特别处理的上市公司,由于其财务状况出现问题,交易所要对投资者的投资进行提醒,因此会在公司前加上st表示警惕。但是企业出现st并不是意味着企业的财务状况永久出现问题,它可能在st之后变好,也可能在st之后变坏。而未被st的企业也不是不可能出现问题。那么在这种情况下,综合全盘的对st企业和非st企业财务状况进行分析,看它们是否存在显著差异是有意义的。基于此,我在中国经济与发展统计数据库中中国证券业年鉴中找到2012年深圳主板年度财务指标,其中有净利润、每股净收益和每股净资产等财务指标。由于每股净收益是测定股票投资价值的重要指标之一,也是分析每股价值的一个基础性指标,它综合反映公司的11

12、11I1111I1获利能力。因此,我选取了每股净收益作为进行分析的财务指标。在报表中我选取了40个st上市公司的数据,由于st企业数明显比非st企业数量少,因此我从中随机抽取了40个非st企业进行分析。希望分析结果能够对投资者的投资决策有一定的参考价值。3.2 选取的方法及该方法的优缺点由于st企业和非st企业本质上来说没什么联系,因此可以将它们看成两独立样本的参数检验,因此选取了曼-惠特尼U检验。曼-惠特尼U检验的目的是检验这两个总体的均值是否有显著的差别。曼-惠特尼秩和检验可以看作是对两均值之差的参数检验方式的t检验或相应的大样本正态检验的代用品。由于曼-惠特尼秩和检验明确地考虑了每一个样

13、本中各测定值所排的秩,所以该检验具有比符号检验更优的特性,并且其计算比较简便,能够很快的得出检验结果但它也有不足,因为曼-惠特尼U检验比较的是两样本的中位数,所以它其实漏掉了一些信息,这可能导致检验的不准确,可能会得出错误的结论。3.3 SPSS分析过程数据:每段收益1-0.100D2-0.001530.3000A?.030050.01006-3.370070.0500-0.3八0090.0200100.0700111.0500壅型小秋值致值84无分组减值的40P激企业每;曼-惠特尼U检验:3两个姓宜样本检验可以看出,st值为44.66,秩和为Mann-Whitney检验忖捷按收益由按收益40

14、36.341453.50非$向再殿收益4044.66178ti.5O总数80企业每股收益的秩均值为36.34,秩和为1453.5;非st企业每股收益的秩均1786.5。这样看来,st和非st的每股收益似乎是有明显差异,下面用检验表来确定是否存在差异。检验铳计窜3Mann-WhitneyU&33.500WilcoxonW1453.500Z-1.603前近显若性U又玄侧)109著性(W精确显着性.110(*?j>55.001可以看出渐进显著性和精确显著性差距并不大,这里的80个数据可以将它看成大样本,这样我们就可以得出结论。由于渐进显著性(双侧)值为0.110>0.05,所以不能拒绝原假设,而原假设为st和非st上市公司的每股净收益无差异,因此得出结论,st和非st的每股收益可以看做无差异的。3.4结论在对st和非st上市企业的每股收益做曼-惠特尼检验后,我们得出了一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论