《SAS和统计计算》PPT课件.ppt_第1页
《SAS和统计计算》PPT课件.ppt_第2页
《SAS和统计计算》PPT课件.ppt_第3页
《SAS和统计计算》PPT课件.ppt_第4页
《SAS和统计计算》PPT课件.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1,第九章 SAS 和 统计计算,2,3,4,5,6,7,8,9,10,11,事实上,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,例1。产生10个0,1上均匀分布随机数。 data a; retain seed1 seed2 161321804; do i=1 to 5; x1=ranuni(seed1); x2=ranuni(seed2); output; end; proc print; run; 将 ranuni 改为 normal 产生标准正态分布随机数。,29,OBS SEED1 SEED2 I X1 X2 1 1613218

2、04 161321804 1 0.43617 0.64888 2 161321804 161321804 2 0.34138 0.42729 3 161321804 161321804 3 0.43237 0.63834 4 161321804 161321804 4 0.74690 0.89710 5 161321804 161321804 5 0.13630 0.19031,30,用如下程序产生0,1上的10个随机数,结果更好。 data; retain seed1 161321804; retain seed2 135279821; do i=1 to 5; call ranuni(se

3、ed1,x1); call ranuni(seed2,x2); output; end; proc print; run;,31,OBS SEED1 SEED2 I X1 X2 1 936674311 724196333 1 0.43617 0.33723 2 1393460745 1733883844 2 0.64888 0.80740 3 733112270 1200908019 3 0.34138 0.55922 4 917607517 674688435 4 0.42729 0.31418 5 928513130 1646762308 5 0.43237 0.76683,32,将 ca

4、ll ranuni(seed1,x1); 替换后可产生其它分布的随机数。 call ranbin(seed1,n,p,x1);二项分布 call ranexp(seed1,x1); 均值1的指数分布 call rangam(seed1,a,x1); a0,b=1的伽马分布 call rannor(seed1,x1);标准正态分布 call ranpoi(seed1,x1);泊松分布 call rantbl(seed1,p1,p2,pk,x1);离散分布 call rantri(seed1,h,x1);0h1,三角分布 call rancau(seed1,x1);柯西分布,33,在统计领域,主要

5、有两大类计算问题:一类是极大似然估计的计算,另一类是Bayes计算。,从计算方法来看,极大似然估计的计算类似Bayes的后验众数的计算,因此这里主要讨论Bayes计算。,34,另一类算法总称为数据添加算法。它不是直接对复杂的后验分布进行极大化或进行模拟,而是在观测数据基础上加上一些“潜在数据”,从而简化计算,并完成一系列简单的极大化或模拟。,原理如下:设我们能观测到的数据是Y, 关于Y的后验分布很复杂,难以直接进行各种统计计算。假定一些没有能观测到的潜在数据Z已知(如Y为某变量的截尾观测值,而Z为变量的真值),则可以得到一个关于的添加后验分布 (形式很简单),利用 的简单性可进行各种统计计算,

6、如极大化、抽样等,然后回过头来,再对Z的假定作检查和改进。如此进行,就将一个复杂的极大化或抽样问题转化为一系列简单的极大化或抽样。,35,EM算法是一种迭代方法,它的每一次迭代由两步组成:E步(求期望)和M步(极大化)。,一般地,以 表示的基于观测数据的后验密度函数,称为观测后验分布;,表示添加数据Z后得到的关于的后验分布密度(添加后验分布);,表示在给定和观测数据Y下潜在数据Z 的条件分布密度;,目的是计算观测后验分布 的众数。,36,37,38,39,40,从初始值 =0.5开始,经四次迭代,EM算法收敛到后验众数0.6268。,41,其中 是因变量的观测值组成的向量。,假设数据出现丢失现

7、象,即Y中的某些元素未观测到。,为Y中已观测到的数据组成的向量。即Y:完全数据,Z:不完全数据。,目的:在得到Z的情况下用极大似然准则估计回归函数,42,可以证明,在很宽的条件下,由EM算法产生的迭代序列 收敛到 的极值点,因此用EM算法可以求解 。,M步等价于求 ,使,43,44,45,46,47,参数,超参数,缺损数据,Markov chain Monto Carlo(MCMC方法),48,(MCMC主要用于多变量非标准形式,且各变量间相互不独立时分布的模拟),49,50,51,52,53,54,55,56,(3)若对某个m,认为此时的分布已是平稳分布,则对比m大很多的n,,57,Gibbs抽样,最简单、应用最广泛的MCMC方法是Gibbs抽样。,转移核的构造,58,具体步骤如下:,59,60,61,62,63,64,65,66,67,68,69,M

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论