贝叶斯统计与经典统计的区别_第1页
贝叶斯统计与经典统计的区别_第2页
贝叶斯统计与经典统计的区别_第3页
贝叶斯统计与经典统计的区别_第4页
贝叶斯统计与经典统计的区别_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上贝叶斯统计与经典统计的区别 摘 要:21世纪,贝叶斯统计打破经典统计独树一帜的局面,已经开始应用到各个领域,但是两个学派存在着很多争论。本文从经典统计和贝叶斯统计在基础理论方面是否利用先验信息,在基本性质方面是否把参数当做随机变量、是否重视未出现的样本信息、对概率的理解的不同以及在点估计、区间估计等方面等来分析它们的区别,并比较分析了他们在统计推断中的优缺点。 关键词:贝叶斯统计,经典统计,先验信息,点估计,区间估计,假设检验 一、贝叶斯统计和经典统计基本理论的区别 统计推断所依据的信息不同: 经典统计,即基于总体信息、样本信息所进行的统计推断。它的基本观点是:把数据

2、看成是来自具有一定概率分布的总体,所研究的对象是这个总体而不局限于数据本身。而贝叶斯统计是基于总体信息、样本信息、先验信息进行的统计推断。它最基本的观点是:任一个未知量?%a 都可以看做是一个随机变量,应用一个概率分布去描述对 ?%a的未知状况。这个概率分布是在抽样前就有的关于?%a的先验信息的概率陈述。 经典统计和贝叶斯统计最主要的区别就是在于是否利用了先验信息。贝叶斯推断是基于总体信息、样本信息、先验信息,而经典统计推断只依赖于总体信息和样本信息。 二、贝叶斯统计和经典统计的基本性质不同: 1.对概率的理解不同 经典统计学派认为经典统计学是用大量实验来确定概率、是客观的、是符合科学要求的,

3、认为贝叶斯统计的确定的概率是主观的,因此至多只对个人决策有用。 贝叶斯学派认为引入主观概率及由此确定的先验分布,首先至少可以把概率与数理统计的研究与应用的范围扩大到大量不能重复的随机现象中来,其次,主观概率的确定也不是随意的,而是要求当事人对所考查的时间有比较透彻的了解,甚至是这一行的专家,在这个基础上确定的主观概率就能符合实际。 2.使用样本信息上也有差异 贝叶斯学派重视已出现的样本观察值,而对尚未发生的样本观察值不予考虑,贝叶斯学派很重视先验信息的收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的质量。而忽视先验信息的利用,有时是一种浪费,有时还会导致不合理的

4、结果。 经典统计学派还考虑未出现的样本信息,虽然在实际中样本空间中绝大多数样本可能未出现过,甚至重复数百次也不会出现。这个观点是不被贝叶斯学派所接受的。 3.对总体参数认识不同 依赖于参数?%a的密度函数在经典统计中记为p(x; ?%a)或者p?%a(x) ,他表示在参数空间?%A=?%a中不同的?%a对应不同的分布。这里?%a 是一个未知的常量,不存在着分布。可在贝叶斯统计中,依赖于参数 ?%a的密度函数为p(x?%a) ,它表示在随机变量 ?%a给定某个值是,总体指标X的条件分布。这里?%a 是一个随机变量,给定一个 ?%a的值,便有一个对应的分布。 4.应用领域不同 由于经典统计学实用大

5、量重复试验的频率来确定概率的,所以它的应用领域局限于能够大量重复的随机现象。但是很多经济现象都是不能重复或者大量重复的,在这类事件中用频率的方法去确定有关事件的概率常常是不可能的或者很难实现的。贝叶斯由于引入主观概率及由此确定的先验分布把概率与数理统计的研究与应用的范围扩大到大量不能重复的随机现象中来。 三、贝叶斯统计和经典统计在统计推断上的差异 1.点估计差异 经典统计学认为参数 的无偏估计为E ?%a(x) = ?%a(x)p(x?%a)dx=?%a ,其中的平均是对空间中所有出现的样本而求的,实际中可能这些样本尚未出现过或者说重复几百次也不会出现,但是它们也要在评价估计量?%a的好坏中占

6、有一席之地。这叫无偏估计,但是在贝叶斯推断中不用无偏性而是用易于被实际工作者理解和接受的条件方法。最大似然估计值是指固定样本观察值x1,x2,.,xn ,在?%a的取值范围内挑选使似然函数L(x1,x2,.,xn; ?%a) 达到最大的参数值 ,即 使得 L(x1,x2,.,xn; )=maxL(x1,x2,.,xn; ?%a);?%a?%A 经典统计中评定估计量好坏的标准为无偏性、一致性、有效性。 在没有充分的样本信息时,用贝叶斯点估计,往往能够达到更好的精度,因为它充分利用了先验信息。在二项分布的场合, ?%a的最大后验估计就是经典统计中的极大似然估计。 2.区间估计差异 区间估计问题,贝

7、叶斯方法处理方便、含义清除,而经典统计方法寻求的置信区间常常受到批评。贝叶斯方法中叫可信水平、求得到的区间叫可信区间,而在经典统计中叫置信水平、求得到的区间叫置信区间。这两组概念是同类的概念,但是两者有本质的差别:首先,在条件方法下,给定了样本x和可信水平1-?HQ 后通过后验分布可以求得具体的可信区间 (L,U),我们可以说 ?%a落在这个区间的概率为1-?HQ ,也可以说这个区间包含 ?%a的概率为 1-?HQ。但是如果是用经典统计方法求得的置信区间,我们不能这样表述,因为在经典统计中, ?%a是一个常量,要么在求得的置信区间(L,U)内,要么不在区间(L,U)内,不能说落在这个区间的概率

8、为1-?HQ ,只能说在100次试验中,该区间大约100( 1-?HQ)盖住了?%a 。这种频率的解释对于仅仅使用一次或者二次的人来说是毫无意义的。在实际情况中就有很多人把求得的置信区间按照可信区间去理解。其次,在经典统计中寻求置信区间有时是困难的,因为需要构造一个枢轴统计量(含有被估参数的随机变量),使它的分布不含有位置参数,这是一项技术性很强的工作,不熟悉 ?%a?%A0分布是很难完成的,而寻求可信区间只需要利用后验分布,不需要再去寻求另外的分布,两种方法相比,可信区间的寻求简单的多。 3.假设检验差异. (1)两种检验思想 经典统计假设检验的思想: 建立原假设 H0与被择假设H1 : H0:?%a?%A0 H1:?%a?%A1 其中 ?%A0和?%A1是参数空间?%A 中不想交的二个非空子集。 选择统计量,使其在原假设为真时的概率分布已知,这在经典统计方法中是最困难的一步。 对给定的显著性水平?HQ(0?HQ1) ,确定拒绝域W,使犯第一类错误的概率不超过?HQ。 .当样本观察值x落入拒绝域W时,就拒绝原假设,接受被择假设,否则就拒绝原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论