




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 摘要 本文针对广义指数族a r m a 模型,分为连续型指数族和离散型指数族两种 情况讨论模型的参数估计,并运用不同的b o o t s t r a p 方法构造参数的置信区间和 置信带两种情况均采用s c o r i n g 算法进行模型的参数估计,并分别得到s c o r i n g 算法中两个模型方向向量的计算公式对于连续型情况,运用w i l db o o t s t r a p 构 造参数的置信区间和置信带,并将其结果与传统的残差b o o t s t r a p 进行比较,得 到w i l db o o t s t r a p 更决更精确的结论;对于离散型情况,运用分块移动b o o t s t r a p 构造参数的置信区间,这种方法更加实用,收敛速度快,并得到较为满意的 结果 关键词:广义指数族a r m a 模型;s c o r i n g 算法;w i l db o o t s t r a p ;分块 移动b o o t s t r a p 英文摘要 a b s t r a c t t h eo b j e c t i v eo ft h i sp a p e ri st oe s t i m a t et h ep a r a m e t e r so fg e n e r a l i z e d e x p o n e n t i a lf a m i l ya r m a m o d e l sa n dc o n s t r u c tt h ec o n f i d e n c ei n t e r v a l so ft h e p a r a m e t e r s i nt h i sp a p e rw ed i v i d e dt h ep r o b l e mi n t oc o n t i n u o u st y p es i t u a - t i o na n dd i s c r e t et , y p es i t u a t i o n u n d e rb o t hs i t u a t i o n s ,w eu s ef i s h e rs c o r i n g a l g o r i t h mt oe s t i m a t et h ep a r a m e t e r sa n dg a i nt h ef o r m u l ao fd i r e c t i o nv e c t o r si nt h ea l g o r i t h m ,u n d e rt h ec o n t i n u o u ss i t u a t i o nw eu s ew i l db o o t s t r a p t oc o n s t r u c tt h ec o n f i d e n c ei n t e r v a l so ft h ep a r a m e t e r s ,t h e nc o m p a r et h es i m u - l a t i o nr e s u l t st ot h er e m a i nb o o t s t r a p ,t h e ng e tt h ec o n c l u s i o nt h a tt h ew i l d b o o t s t r a pi sm o r eq u i c k l ya n dm o r ea c c u l a t e ;u n d e rt h ed i s c r e t es i t u a t i o nt h e m e t h o do fm o v i n gb l o c k sb o o t s t r a pg i v e ss a t i s f i e dr e s u l t sf o rb o t hs i m u l a t i v e a n dt r u ed a t a k e y w o r d s :g e n e r a l i z e de x p o n e n t i a lf a m i l ya r m am o d e l s ;s c o r i n ga l g o - r i t h m ;w i l db o o t s t r a p ;m o v i n gb l o c k sb o o t s t r a p 厦门大学学位论文原创性声明 兹呈交的学位论文,是本人在导师指导下独立完成的研 究成果。本人在论文写作中参考的其他个人或集体的研究 成果,均在文中以明确方式标明。本人依法享有和承担由 此论文而产生的责任。 声明人( 签名) :隙萄钧 泐洱j 月2 ,日 厦门大学学位论文著作权使用声明 本人完全了解厦| 、1 大学有关保留、使用学位论文的规定。厦门大 学有权保留并向国家主管部门或其指定机构送交论文的纸质版和电 子版,有权将学位论文用于非赢利目的的少量复制并允许论文进入 学校图书馆被查阅,有权将学位论文的内容编入有关数据库进行检 索,有权将学位论文的标题和摘要汇编出版。保密的学位论文在解 密后适用本规定。 本学位论文属于 1 、保密( ) 在年解密后适用本授权书。 2 、不保密。v ( 请在以上相应括号内打” ”) 作者签名:i 埒、焰翰 导师签名: 劢g 年f 月) 7 日 年月日 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 第一章绪论 1 1 背景知识 1 1 + 1a c d 模型的背景 近年来,计算工具与计算方法的发展,极大地降低了数据记录和存储的成本, 使得对大规模数据库的分析成为可能所以,许多科学领域的数据都开始以越来 越精细的时间亥4 度来收集,这样的数据称为高频数据( h i 曲f r e q u e n c yd a t a ) ,金 融市场中,逐笔交易数据( t r a n s a c t i o nb yt r a n s a c t i o nd a t a ) 或逐秒记录数据( t i c k b yt i c kd a t a ) 就是高频数据的例子 金融高频数据的类重要分支是关于金融高频数据分析中所使用的计量模型 的研究随着金融高频数据的不断增加,如何使用模型来恰当地描述这些数据就 成为一个重要的问题从计量经济学角度来看,金融高频数据的一个最显著特征 是观测值以变动的、随机的时间间隔取得,即金融高频数据是个动态的时间序 列在过去的实证研究中,我们采用的是固定时间间隔的计量模型( 如关于波动 性研究的g a r c h 模型和s v 模型等) 的方法,忽略了交易数据之间存在的固有 的时间间隔然而,就象金融市场微观结构理论模型所描述的那样,不同交易之 间的时间间隔蕴含着大量交易者行为的信息因此,如果采用固定时间间隔的计 量模型方法,实证结果将有可能丢失大量的高频交易中所包含的信息成分 e n g l e & r u s s e l l ( 1 9 9 8 ) 1 针对这个问题使用了与分析波动i 生的a r c h 模型相 似的概念提出了a c d ( a u t o r e g r e s s i v ec o n d i t i o n a ld u r a t i o n ) 模型来描述( 交易 活跃的) 股票交易间隔的发展过程e n g l e & r u s s e l l 把交易之间的时间间隔当作 随机变量并建立计量模型,这些随机变量遵循个点过程( p o i n tp r o c e s s ) 交易 数据可以用两个随机变量来描述:第一个是交易发生的时间;第二个是在交易发 生时间上所观察到的一个向量,这个向量被称为记号( m a r k s ) ,用来确定所研究 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 2 的事件( e v e n t s ) 是否发生了通俗地说,就是在时问这个尺度上用所研究的事件 当作刻度来进行标 己这个标记可以是交易量、成交价格或买卖价差等反映投资 者交易情况的事件,而这些正是目前金融市场微观结构理论研究的重点 e n g l e 在a c d 模型的研究中所起作用等同于他对a r c h 模型发展的贡献 更确切地说,e n g l e ( 2 0 0 0 ) 2 1 可以看作是对高频数据计量分析的宣言书a c d 模型完善于e n g l e & r u s e l l ( 1 9 9 8 ) 1 】在e c o n o m e t r i c a 上发表的文章他们的思想 是在原有的a r c h 模型的框架下,用个标记点过程( m a r k e dp o i n tp r o c e s s ) 去 刻画随机交易的时间间隔,不同的点过程假设自然就得到了不同的a c d 模型 e n g l e & r u s e l l ( 1 9 9 6 ) a 用a c d 模型成功地完成对交易频率等实时交易变量的预 测并将类似门限的思想引入后,提出了一种非线形的a c d 模型他们的模型后 来在z h a n ge ta 1 ( 1 9 9 9 ) 4 l 中进一步得到了拓展 1 1 2a c d 模型的定义 a c d 模型是在过去事件的基础上为分析研究交易持续期( d u r a t i o n ) 的条件 分布而创建的,这个模型把交易的持续期( 时间间隔) 转化为个随时间间隔变 动的动态的点过程 为了进一步说明这个问题,我们考虑交易的抵达时间序列f t o ,o ”一,t 。, 其中t o t 1 q 时,岛= 0 ,上式只需对( 1 4 ) 式两边 同时取期望即可得到 这类模型中最简单的是e a c d ( 1 ,1 ) 模型,其中e 表示式( 1 3 ) 中的误差项 s 。) 为指数分布: 妒。= d o + o l l x i 一1 + 卢l 咖一1 n e eo l ,卢1 0 ,o o 0 ,v i 这个模型中她的条件方差是蟛,而无条件方差为 拈矿( 禹端) 与g a r c h 模型相似,模型( 1 4 ) 也有a r m a 表达形式令碾三一也 为一个鞅差序列,则持续期过程可以表示为: m a x ( p ,口)g 岛= o o + ( + 脲) “一风叩 一。+ r h m 二1n = l 上式为具有非高斯创新的a r m a 表达形式因此模型的预测问题可以通过a r m a 方法完成 1 1 3a c d 模型的扩展 过去几年中,对a c d ( p ,q ) 模型的研究取得了大量的成果其中最普遍的是 假设公式( 1 3 ) 中的跎为w e i b u l l 分布,另一趋势是假设蹰为广义g a m m a 、对 数l o g i s t i c 以及对数正态分布由于指数族包含许多重要的分布,如正态分布、 伽玛分布、泊松分布、二项分布等,本文针对指数族的情形进行讨论 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 5 当x 为连续型随机变量时,采用原有的a c d 模型,并假设误差项 矗) 的分布瓣为连续型指数族分布,本文称此种情况下的模型为广义连续型指数族 a r m a 模型 然而现实中由于 肖费者的持续购买力各不相同,e 述持续期x i 可能是数月甚 至数年,从而在实证分析中该类数据的取样会出现离散的情况故本文就奶为离 散型随机变量的情况将模型改进如下: 假设一维随机变量蜀,令最一l = 口( 。,。t ,蛾“,妒1 ) 为过去第 i 一1 个交易过程提供的信息生成的盯代数,其中也为她的条件期望,条件密 度f ( x t l 只一) 为非负离散型指数族,条件期望蛾= e ( x i l 只一t ) 的形式为 p、 q 慨= h lo o + e 。一。) + 岛。哦。 ( 1 5 ) m = in = l 其中 ( ) 为关联( 1 i n k ) 函数本文称上述模型为广义离散型指数族a r m a ( p ,q ) 模型 1 2 文章结构 本文分别对连续型和离散型两种情况讨论模型的参数估计,运用不同的b o o t s t r a p 方法构造参数的置信区间和置信带本文结构如下:第二章介绍模型的参数 估计方法( f i s h e rs c o r i n g 算法) 和b o o t s t r a p 分位数置信区间的构造方法;第三 章讨论广义连续型指数族a r m a 模型的参数估计,得到s c o r i n g 算法中该模型 方向向量的计算公式,并运用w i h tb o o t s t r a p 方法构造置信区间和置信带,数 据模拟部分将其结果与传统的残差b o o t s t r a p 做比较,得到w i l db o o t s t r a p 方 法更陕更精确的结论;第四章讨论广义离散型指数族a r m a 模型的参数估计, 亦得到s c o r i n g 算法中该模型方向向量的计算公式,并运用分块移动b o o t s t r a p 方法构造置信区间,然后进行数据模拟和真实数据分析;最后第五章为结论 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区问 6 第二章模型的参数估计及其置信区间的构造 2 1 f i s h e rs c o r i n g 算法 本文采用极大似然估计法和f i s h e rs c o r i n g 算法进行模型的参数估计f i s h e r s c o r i n g 算法与n e w t o n r a p h s o n 算法类似,其区别在于f i s h e rs c o r i n g 算法 采用的是模型的二阶微分矩阵的期望值其具体步骤如下: f i s h e rs c o r i n g 算法 第一步:对待估参数向量赋予初值u 【o ) ; 第二步:进行国( 。) 的迭代计算,参数u 的第i + 1 步迭代的估计值为 o ( 件1 ) =d ( i ) + a 。j ( 西( ) ) 一1 9 ( 白( 。) ) - e ( 薹品) r 嚣筒 其中k 为对数似然函数, 一e ( 量黠) 1 耋凳l :甜,为第i 步方向 向量,) 为信息矩阵,9 ( 西) 为s c o r e 向量,a 。第z 步的搜索步长,一 般取使在该搜索方向上对数似然函数极大化的步长; 第三步:重复第二步,直到所得参数的估计结果满足一定条件,如收敛性、迭代 次数等 2 2b o o t s t r a p 方法 2 2 1b o o t s t r a p 方法的介绍 b o o t s t r a p 是近代才发展起来的用于处理某类统计推断的新方法这是由于 它必须依赖现代计算机技术对传统理论中过于复杂的计算作为支撑 b o o t s t r a p 方法和其他些以计算机为基础的方法一样其基本思想没有改变,只是执行计算 的方法改变了b o o t s t r a p 已经广泛应用于模型选择、平滑参数数据适应陛选择 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 7 ( 如带宽选择) 、检验问题以及置信区间和置信带的构造等问题, b o o t s t r a p 方法最初是由e f r o n ( 1 9 7 9 ) 5 】【6 】发明的,随后进行了两次重要的发 展e f r o n ( 1 9 8 2 ) 7 的专论拓展了1 9 7 9 年的议题,并提出了一些新的思想统计 观点上的b o o t s t r a p 的说明可以参见e f r o n & g o n g ( 1 9 8 3 ) s 、e f r o n & t i b s h i r a n i ( 1 9 8 6 ) 9 】以及h i n k l e y ( 1 9 8 8 ) b e r a n & d u c h a r m e ( 1 9 9 1 ) 儿1 的讲义以及h a l l 的专论中给出了关于b o o t s t r a p 数学上的随机处理在e f f o n ( 1 9 8 3 ) “】、l u n - n e b o r g ( 1 9 8 5 ) t 1 、r a s m u s s e n ( 1 9 8 7 ) 1 4 以及e f r o n & t i b s h i r a n i ( 1 9 9 1 ) ”】的 文献中可以查到b o o t s t r a p 的非技术j 生的描述 当e f t o n 的1 9 7 9 年的论文正式提出了b o o t s t r a p 时,类似的思想也出现在 不同的文章中,其中包括b a r n a r d ( 1 9 6 3 ) ”】和h o p e ( 1 9 6 8 ) 1 提出的蒙特卡罗 假设检验方法尤为值得一提的是h a r t i g a n ( 1 9 6 9 18 | ,1 9 7 1 1 ,1 9 7 5 2 0 ) 建立的置 信区间的理论 2 2 2b o o t s t r a p 方法的基本思想 b o o t s t r a p 是一种以计算机为基础的统计推断方法,它可以衡量统计估计的 准确性,其最大优势是可以不依赖公式直接给出方差、标准差、偏差、覆盖概率 和置信区间等统计问题的结果利用b o o t s t r a p 估计标准差是b o o t s t r a p 应用中 最重要的方面之一下面就以b o o t s t r a p 标准差为例,介绍b o o t s t r a p 的基本思 想 图2 1 是b o o t s t r a p 过程的个简图假设观察到独立的样本数据集z = ( z 、,x 一,z 。) ,待估计的统计量为样本的一个函数,记为s ( x ) ,我们感兴趣的 是s ( z ) 的标准差的估计b o o t s t r a p 算法开始先产生大量独立的b o o t s t r a p 样 本x “,x “,z ”,这b 个b o o t s t r a p 样本是占l 原始数据集中做有放回的抽 样产生得到的,其中每个样本又有n 个元素为了得到标准差估计,b o o t s t r a p 样本的个数b 通常取5 0 到2 0 0 相应于每个b o o t s t r a p 样本都可以得到s ( x ) 的一个b o o t s t r a p 复制,记为s ( x 拈) 例如,s ( x ) 为样本中位数,则s ( x + ) 即为 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 8 图2 1 :b o o t s t r a p 示意图 b o o t s t r a p ) r e p l i c a t i o n s b o o t s t r a p s a m p l e s b o o t s t r a p 样本的中位数标准差的b o o t s t r a p 估计是b o o t s t r a p 复制的标准偏 差,即 f b 一1 ) ; s ( 矿6 ) 其中s ( ) = 堕百一 由上述过程易见,b o o t s t r a p 的基本思想包括两个步骤:首先得到样本x 的 分布q 的估计量囝,再利用替代原则将其估计值代入待估的统计量s ( ) 以得到 s ( q ) 的估计量s ( 国) b o o t s t r a p 在1 9 7 9 年借助计算机运用于标准差的估计, 其优点在于能够自动地完成计算,而不需要理论上的计算,且不管统计量s ( x ) 的 数学形式有多复杂,它都可以运用 2 2 3b o o t s t r a p 置信区间 b o o t s t r a p 标准差常用来近似参数0 的置信区间利用b o o t s t r a p 构造参数 的置信区间的方法很多常见的有: 1 标准正态置信区问 0 的1 2 0 的标准正态置信区间为阿一z l 一菇,舀一z n 蠢1 ,其中谷 为参数0 的估计,磊为标准差估计( 可以用上一节讨论的b o o t s t r a p 标准 亡墨i 墅遂a m 4 a 模型的参数估计及其b o o t s t r a p 置信区间 9 差代替) ,垆为标准正态分布n ( 0 ,1 ) 的第1 0 0 a 个百分位点 2t 一区问 0 的1 2 n 的t 一区间为阿一t := 蠢,萨一t :一。庇1 ,其中万和蠢定 义如上,t :一,表示自由度为n 一1 的t 分布的第1 0 0 a 个百分位点 3 b o o t s t r a p - t 区间 0 的1 2 a 的b o o t s t r a p - t 区间为阿一p _ 。蠡,万一扣露1 ,其中舀和 嘉定义如上,定义如下;根据上一节中b o o t s t r a p 方法的基本思想,产生b 个b o o t s t r a p 样本x * 1z “,矿8 对于每个样本,计算。+ ( 6 ) = ! 基等, 其中驴( b ) 是用b o o t s t r a p 样本z + 6 计算得到的萨的估计,磊+ ( 6 ) 是沪的 标准方差的估计 z + ( 6 ) 的第1 0 0 a 个百分位点是通过的值来估计的,如 下式所示: 坚婆堕:。n 例如:当b = 1 0 0 0 且o = 0 0 5 时,为z + ( 6 ) 从小到大排列后的第 b “= 5 0 个点 本文采用另一种b o o t s t r a p 置信区问:基于统计量的b o o t s t r a p 分位数置信 区间,假设由原始数据集z 产生的b o o t s t r a p 数据集为。+ ,计算得到b o o t s t r a p 复制驴= s ( x + ) 令0 为萨的累积分布函数,则1 2 a 分位数区间定义由0 的a 和1 一“分位数构成: 酝1 f d ,酝,。】= o 一1 ( n ) ,o1 ( 1 一。) ( 2 1 ) 由于定义b o o t s t r a p 分布的第1 0 0 a 个百分位点为0 1 似) = 伊( “,故分位数 区间也可写为 陆。,觋。 _ 眇,驴( 。) ( 2 2 ) 表达式( 2 1 ) 和( 2 2 ) 是理想b o o t s t r a p 的情形,即b o o t s t r a p 复制数量无穷的情 形在实际中,只能产生有限个( b 个) 复制假设产生了b 个独立的b o o t s t r a p 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 0 数据集x + 1 ,z “,z + b ,计算b o o t s t r a p 复制口+ ( 6 ) = s ( z 柚) ,b = 1 ,2 ,b , 令礤。是驴( 6 ) 值的第1 0 0 c r 个经验分位点,即b 个伊复制从小到大排列后 第b o l 个点如果b = 2 0 0 0 且a = o 0 5 ,则p 就是b 个复制从小到大排 列后第1 0 0 + f f 同样地,令醪。是第l o o ( 1 一o ) 个经验分位点则1 2 0 l 分位数区间近似为 陬如,酝卿 z 露,甜卜i 如果扩的b o o t s t r a p 分布接近正态分布,其标准正态区间和分位数区间就 会基本一致由中心极限定理,当n _ 。时,b o o t s t r a p 直方图的形状将为 正态,但对于小样本,看起来就不是正态了,即标准正态区间和分位数区间将不 同哪一种方法更好呢? b r a d l e ye f r o n & r o b e r tt i t ) s h i r a n i 2 1 l 通过模拟的样本 来检验这个问题,并给出下面的结论 根据上述方法得到参数口的分位数区间与用0 的适当变化得到的标准正态 区间再变换回在口下的区间几乎一致改进正态方法的难点在于必须知道对每个 参数目的变换,如对数变换等分位数的方法可以认为是自动合并了这种变换的 一种算法下面的引理说明分位数方法总能“知道”适当的变换 分位数区间引理 假设变换咖= m ( p ) 对于某个标准差c ,使得0 的分布成正态分布,即 $ 一( 砂,c 2 ) ,则万的分位数区间等于 t o , 一1 z ( 。0 ,m 一1 ( 乒一。( 。) c ) 因此分位数方法可以看作是延伸了标准区间的效率范围的种算法其优点 在于无需知道相应的变换,而仅仅是假设变换存在而已 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 l l 第三章广义连续型指数族a r m a 模型 3 1 模型的定义 广义连续型指数族a r m a ( p ,q ) 模型是假定模型( 1 3 ) 的误差项 毛) 服从 连续型指数族,即仁。 的概率密度为; 舷限加) 咖 学( 删) ( 3 ) 其中0 为自然参数,为附加的尺度参数或散度参数,6 ( ) 和c ( - ) 为相应于某 个连续型指数族的特定函数,w 为权( 对于无分组数据m = 1 ) 本文假定咖和 口为已知的 令“,= ( “o ,a ,唧,p h ,岛) ,召= ( 1 ,x i “,茹,也- i i ,哦一口) , 则广义连续型指数族a a m a ( p ,q ) 模型可表示为 荔冀。, 慨2 , 其中 旬) i i d ,连续型指数族蹰( p ) 3 2 模型的参数估计 整个模型的参数分为两个部分,一部分是连续型指数族的自然参数p ,一旦 i 昃3 3 = 项确定就很容易得到。的极大似然估计或是矩估计伊,在参数估计过程中视 其为多余参数;另部分是真正关心的参数u ,本文采用极大似然估计法并通过 第二章介绍的f i s h e rs c o r i n g 算法来估计它, 定理1 广义连续型指数族a r m a ( p ,q ) 模型应用f i s h e rs c o r i n g 算法进行参数 估计的第i 步方向向量中s c o r e 向量9 ) 和信息阵j ) 的计算公式为 舢,= ;| ;卜( + 薏彬署) 百1 甜 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 2 m ,= 耋 ( 1 。叫谤1 警券+ ( ,+ c ,) 去黠 其中d = 帮且 f 警= 1 , 【砂o = z t + 叁j 8 。警o f l l - n五+ 风百 n = i 1 一o t o 口1 - 证明; 由广义连续型指数族a r m a ( p ,q ) 模型的定义( 3 1 ) 和( 3 2 ) ,可以得到样本数 为的对数似然函数为 v f 。( u ,两 i = 1 “( 轨;叫,功= - l o g ( 也) + 坠互! 竽+ c ( 荔,。) 上式关于“进行一阶微分,有 出) = 耋筹 = 卦( ,+ - 荔) - 去斟 m ,一e ( 薹急) = 一e 薹( 并+ c ,莠) 去石a 妒i 别 e 酐+ x i 蓑) 去筹别 十e 耋( ,+ 詈舀西x i + c 荔) 去西0 。2 。妒。i , = 一姜 1 + 2 e ( 荔) 剧- f 1 i 警- 盟o w + 羹旧叫署) + c ,e ( 荔) 怯嘉 = 圭i = l ( 一。唰) 去磬券 + 娄( ,+ c ,) 去黯 其中c = 紫 由于蛾= 召t u = 并定义4 0 = 1 一c t o 口。 故等= 磊+ 墨风篱产 3 。3 w i l db o o t s t r a p 及模型参数的置信区间 1 3 3 3 1w i l db o o t s t r a p 为了构造模型参数的置信区间,本节对模型的误差项忙i ) 进行w i l db o o t s t , r a p 这种抽样过程只适用于e ( “) = 0 的情况,其基本思想是先将误差项中心 化且令掩) = 岛一日,其中手= e n 毛,然后构造分布豆,霆满足 l ,y2 o ; 2 e 矗y 2 = 孝; 3e ;y 3 = 薯 这里考虑如下两种丘的构造方法 【a ) 最为两点分布:在k = 尘噬2处概率为笔等;在= 型! 盟2 超处概率 为1 一面- 污5 + 可1 ( b ) 令k = 磊“,其中巩,u k 为i i d 样本且满足 e 阢;0 ;e 碑= 1 ;e 明= 1 可以取巩= ( 1 2 2 0 一i ) 5 隈+ 2 0 一;( 孵一1 ) ,其中m 为n ( o ,1 ) 分布 最的其它构造洋见l i u l 2 2 1 和m a m i n e n 2 条件1 、2 是w u 2 4 1 为了解决带 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 4 异方差的线性模型的方差估计时提出的,这种抽样方法称为w i l db o o t s t r a p 或 e x t e r n a lb o o t s t r a p 条件3 是l i u 及h a r d 】e & m 锄m e n l 2 5 】为了提高w i l d b o o t s t r a p 估计的收敛速度而提出的 l i n ( 1 9 8 8 ) 2 6 j 证明了w i l db o o t s t r a p 在某些模型中运用的一致性h a r - d l e & m a m m e n ( 1 9 9 0 ) 2 7 】提出w i l db o o t s t r a p 亦可用于非参数回归数据,他们 给出了一个比较参数拟合与非参数回归曲线问题的例子,在这个例子中e f r o n 的 b o o t s t r a p 并不适用,而w i l db o o t s t r a p 能够给出一致的结论w i l db o o t s t r a p 在非参数回归的其它运用详见h a r d l e & m a r r o n ( 1 9 9 1 ) 【、c a o - a b a d ( 1 9 9 1 ) 2 9 】 和c a o - a b a d & g o n z a l e s - m a n t e i g a ( 1 9 9 0 ) 3 0 的文献 3 3 2 构造模型参数的置信区间 这一部分仅考虑广义连续型指数族a r ,m a ( 1 ,1 ) 模型,假设观察到一组数据 f o 】,z ) ,其模型为 令u = ( o t o ,a 1 ,风) ,现要构造参数d o 、n ,和卢l 的置信因可,步骤如下 第一步:利用数据 z ,x n ) 和s c o r i n g 算法估计参数o = ( a 0 ,a 1 ,卢- ) ,并 将。代入模型计算如和磊= z 。也; 第二步:对 磊,i = 1 ,) 进行b 次w i l db o o t s t r a p 得到b 组误差项 仁) ,代入模型计算相应的b 组 z 1 ,其中b = 1 ,b ; 第三步:对于每一组 岳 ,再利用s c o r i n g 算法估计其参数,从而得到b 组 参数值o + ( 6 ) = f 磷乩,茸,厨6 1 ,其中b = 1 ,b ; 第四步:利用b 组参数0 4 = f 矗,笛嘞,院6 ) 及其经验分位点分别构造三 个分量a i 】、0 1 和卢- 的分位数置信区间 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 5 若要得到残差b o o t s t r a p 结果,只需将第二步中的w i l db o o t s t r a p 改为残 差b o o t s t r a p 即可,即对模型残差( 磊,i = 1 ,) 进行有放回地抽样 3 4 数据模拟 这部分程序是通过c 语言以及统计软件s - p l u s 实现的 例1 考虑广义连续型指数族a n m * ( 1 ,1 ) 模型,且假设其误差项服从于g a m m a 分布运用第二章的f i s h e rs c o r i n g 算法得到模型的参数估计,并采用w i l db o o t s t r a p ( w b ) 和残差b o o t s t r a p ( 残差b ) 两种方法构造模型参数的9 0 置信区间 ( c i ) ,取抽样次数b = 1 0 0 0 ,n = 1 0 0 ,表3 1 给出了数值模拟结果 表3 1 :g a m m a 分布的模拟结果 观察表3 1 并比较表的最后两列可以得到,对于参数o o 、“】和卢1 由w i l d b o o t s t r a p 得到的9 0 置信区间的长度比由传统的残差b o o t s t r a p 得到的9 0 置信区间的长度小得多,说明利用w i l db o o t s t r a p 方法构造得到的置信区间更 加精确 例2 对例1 中误差项为g a m m a 分布的模型,选取2 0 0 组不同的真值( 铴,t ,廖1 ) , 其中o o 取0 0 1 至0 0 8 的2 0 0 个等分点,n 1 取0 1 0 到0 8 0 的2 0 0 个等分点, 卢l 取o 8 0 到0 1 0 的2 0 0 个等分点运用s c o r i n g 算法得到每组真值( 血o ,1 ,卢1 ) 的估计值,在图中用实线表示,再用w i l db o o t s t r a p 和残差b o o t s t r a p 两种方法 分别构造每个值“o 、q ,和卢。的置信区间,并构成图3 1 一图3 3 中的置信带, 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 6 其中“- ”表示w i l db o o t s t r a p 置信区间的端点值,“o ”表示残差b o o t s t r a p 置信区间的端点值 图3 1 :g a m m a 分布下参数o o 的置信带 由图3 1 一图3 3 可以得到,对于g a m m a 分布情况下模型的参数o o 、。 和卢1 ,总体来看由w i l db o o t s t r a p 得到的置信带的带宽比由残差b o o t s t r a p 得 到置信带的带宽都窄碍多,从而说明由w i l db o o t s t r a p 得到的置信区间更加精 确另外还可以看到对于较大的d o 、1 和较小的卢1 而言,由w i l db o o t s t r a p 得到的置信区间精确得多,所以在此情况下更适宜采用w i l db o o t s t r a p 来构造 置信区间从程序的实现过程还可以得到, w i l db o o t s t r a p 方法的收敛速度比 残差b o o t s t r a p 快得多 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 7 图32 :g a g m _ l a 分布下参数o 1 的置信带 图3 3 :g a m m a 分布下参数p 1 的置信带 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 8 第四章广义离散型指数族a r m a 模型 4 1 模型的定义 广义离散型指数族a r m a ( p ,q ) 模型( 1 5 ) 中条件密度f ( x , 1 只一t ) 的分布为 非负离散型指数族瓣( 口) ,;e g o 式为; f ( x , i 哪,小唧 半巾崩仍) ( 4 1 ) 其中0 为自然参数,为附加的尺度参数或散度参数,6 ( ) 和c ( ) 为相应与某 个非负离散型指数族的特定函数,田为权( 对于无分组数据。= 1 ) ,本文假定 击和 t 2 7 为已知的 在( 1 5 ) 中令o = ( a o ,o l ,) ,卢7 = ( 卢l ,岛) ,召= ( 1 ,戤一1 ,x i p ) 嚷= ( 啦,一,蛾一。) ,则( 1 5 ) 可简写成 妒f = ( 乏o ) + 中:卢 4 2 模型的参数估计 整个模型的参数分为两个部分,一部分是非负离散型指数族的自然参数0 , 旦误差项确定就很容易得到0 的极大似然估计或矩估计0 ,在参数估计过程 中视其为多余参数;另一部分是真正关心的参数u 本文采用极大似然估计法和 s c o r i n g 算法来估计参数 定理2 广义离散型指数族a r i v i a ( p ,q ) 模型应用f i s h e rs c o r i n g 算法进行参数 估计的第i 步方向向量中s c o r e 向量9 ) 和信息阵i ( w ) 的计算公式为: g ( ) = ,) = i = 1 i :1 埘掣- 矧 o p 一1 ( 妒:) a 妒ia 妒。m rl 0 妒i a u a u 7 i 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 1 9 其中:砂i = 6 ,( 矾) = p ( 吼) ,且 馘,t o w ( 蕃) = ( 鬻 五1 + 卢警 证明:由广义离散型指数族a r m a ( p ,q ) 模型的定义( 1 5 ) 和( 4 1 ) ,可以得到 样本数为n 的似然函数为 i n ( x ;0 ) _ l i ( o i ) 2 = l 而对第i 个观察值的对数似然函数为 ( 蹦:l o g f ( 。;l o 。,曰) :型掣钌,( 42 ) 0 上式中由于e ( 敏,九。) 中不含魄,故将其省略,对于指数族存在着如下关系 o i = 目( 砒) , 其中吨= 6 7 ) = 肛( 吼) ,故反函数为0 。= ,t _ 1 ( 也) ,因此关系式( 4 2 ) 可以写成 慨的函数 l i ( 妒d = 型唑半剑钌 e 式关于u 进行一阶微分,有 g ) = 薹 蠼等学叫 i = 1 n i = 1 矿丽0 0 面0 妒i 别既一咖j 瓦面万l 矿灿掣丝o w 爿 些c 砉 a 一 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间 2 0 又因为e ( x i 一咖) = 0 ,故 取,= 一e ( 薹急) = 一e 薹 一嚣- 券箬罟+ c 奶一蝴豢券磬- 别) 一e 斟矿蛾,器黠,珈 :手f 里丝丝里1 鲁l a 如o w 钆妒j = 耋 掣警丝0 w 詈2 刍i 百矿1 面一石l 其中均值结构为哦= ( 乏q ) + 叫p ,u7 = ( n ,卢7 ) ,因此 丝o w = = ( 鬻) + 卢杀 l 丝ji击j 一0 u 卵 o 4 3 分块移动b o o t s t r a p 及构造参数的置信区间 这部分对时间序列 黾,i = 1 ,l 进行分块移动b o o t s t r a p 这种方 法与先选定模型再对残差抽样的方法不同,它类似于单样本问题中采用的方法, 其基本思想见图4 1 ,黑圈表示原始时间序列 瓤 ,为了得到时间序列 毛) 的 b o o t s t r a p 实现( 用白圈表示) ,需要选择个块长度f ( 在图中1 = 3 ) ,然后考虑 所有这种长度的相邻块我们对这些块进行有放回的抽样,并将抽样后的结果放 在一起形成b o o t s t r a p 时间序列选择足够多的块使得序列的长度与原来序列的 长度粗略相同即当块的长度为f 时,则选择块的个数k 使得n kx f 对于时间序列模型我们不能简单地对观测个体进行抽样,这样会破坏数据的 相关性在分块移动b o o t s t r a p 中,最理想的是选择块的长度f 足够大,使得与 其差距大于z 的观测单位近似于独立通过取长度为f 的块以保留氏度小于f 部 广义指数族a r m a 模型的参数估计及其b o o t s t r a p 置信区间2 1 图4 1 :分块移动b o o t s t r a p 示意图 分的观测数据之问的相关陆分块移动b o o t s t r a p 较于残差b o o t s t r a p 其优点是 它较少依赖于模型,其中块的长度f 的选择很重要分块移动b o o t s t r a p 及其相 关的方法有c a r l s t e i n ( 1 9 8 6 ) 3 i ,k u n s c h ( 1 9 8 9 ) 3 2 】和l i u & s i n g h ( 1 9 9 2 ) 1 3 引 4 3 2 构造模型参数的置信区间 这一部分仅考虑广义离散型指数族a r m a ( 1 ,1 ) 模型,假设观察到一组数据 3 j i ,x n ,其模型为 1 f ( x 。1 只一1 ;巩,西,) = e x p 型半m 十c ( 戤,咖,口) , 2 妒;= h ( a o + o z l x i 一1 ) + 卢l 妒 一1 且妒o = ;竺并 令u = ( 。,埘,声。) ,现要构造参数蛳、a t 和廓的置信区间,步骤如下 第一步:利用数据 。圹一,x n 和s c o r i n g 算法估计参数西= ( a o ,a l ,卢1 ) ; 第二步:对 z l ,z - v ) 进行b 次分块移动b o o t s t r a p ,导至1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第三届农作物植保员技能大赛理论考试参考试题库含答案
- 2025年数据库系统工程师考试数据库系统数据库系统设计与试题及答案
- 2025年公司工程师认证考试题题库附答案
- 2025年职业师专业能力测试卷:职业师心理学基础知识试题
- 格列美脲片临床应用考核试题
- 2025年消防安全案例分析及警示教育考试题库
- 氟他胺片临床应用考核试题
- 2025年消防执业资格考试题库:消防设施检测与维护系统设计试题
- 2025年护士执业资格考试题库内科护理学专项试题
- 2025年消防执业资格考试题库:消防应急救援装备操作安全试题
- 梅毒艾滋乙肝三病
- 割灌机安全操作规程培训
- 2024年山西省成考(专升本)大学政治考试真题含解析
- 最高法院第一巡回法庭关于行政审判法律适用若干问题的会议纪要
- 《病历书写基本规范》课件
- 足球场的运营可行性方案
- 重庆市面向西南大学定向选调2024届大学毕业生2024年国家公务员考试考试大纲历年真题3453笔试难、易错历年高频考点荟萃附带答案解析(附后)
- GB/T 2881-2023工业硅
- 小学生电力科普小讲座(课件)-小学常识科普主题班会
- 有限合伙份额质押合同完整版(包含质押登记公证手续)
- GB/T 43299-2023机动车玻璃电加热性能试验方法
评论
0/150
提交评论