(概率论与数理统计专业论文)缺失数据下arp模型的参数估计.pdf_第1页
(概率论与数理统计专业论文)缺失数据下arp模型的参数估计.pdf_第2页
(概率论与数理统计专业论文)缺失数据下arp模型的参数估计.pdf_第3页
(概率论与数理统计专业论文)缺失数据下arp模型的参数估计.pdf_第4页
(概率论与数理统计专业论文)缺失数据下arp模型的参数估计.pdf_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大连理工大学硕十学位论文 摘要 本论文研究在缺失数据条件下,a r ( p ) 模型参数的估计方法 在文献中使用e m 算法或m c m c 方法给出了一个数据和连续两个数据缺失时参数的 估计方法但是由于计算复杂,很难推广到连续多个数据缺失时的估计方法 本文应用回归预测法,运用最小二乘估计,给出了一个数据和连续两个数据缺失时参 数的估计方法,并推广到连续多个数据缺失时参数的估计方法通过实例应用,讨论了更 一般的情况如何处理。最后,对连续一个数据和连续两个数据缺失时参数的估计方法进行 数值模拟 本文主要内容可概括如下:第一部分:a r ( p ) 模型参数的最小二乘估计:第二部分: 数据缺失时参数的估计方法:第三部分:实例应用和数值模拟 关键词:缺失数据;a r ( p ) 模型;参数估计;回归预测法;最小二乘估计 箜叁墼塑! 丛( 旦2 堡型塑至墼堕盐 e s t i m a t i o nm e t h o do fa r ( p ) m o d e lw i t hd a t a m i s s e d a b s t r a c t i nt h i sp a p e r ,w ed e a l sw i t ht h ep a r a m e t e re s t i m a t i o np r o b l e mf o ra r ( p ) m o d e lw i t hd a t a m i s s i n g i nt h el i t e r a t u r e ,e ma l g o r i t h mo rm c m cm e t h o di su s e dt os o l v et h ee s t i m a t i o np r o b l e m f o ro n ed a t ao rt w os u c c e s s i v ed a t am i s s i n g b u ti ti sd i 伍c u l tt od e a l sw i t ht h ee s t i m a t i o n p r o b l e mf o rs e v e r a ls u c c e s s i v ed a t am i s s i n g ,b e c a u s ec o m p u t a t i o n a lc o m p l e x i t y i nt h i sp a p e r ,w eu s er e g r e s s i o nf o r e c a s tm e t h o da n dl e a s t - s q u a r e se s t i m a t i o nt od e a l w i t ht h ep a r a m e t e re s t i m a t i o np r o b l e mw i t ho n ed a t ao rt w os u c c e s s i v ed a t am i s s i n g t h e n w ec o n s i d e rw i t ht h ep a r a m e t e re s t i m a t i o np r o b l e mw i t hs e v e r a ls u c c e s s i v ed a t am i s s i n ga n d p r e s e n tap r a c t i c a lm e t h o d b y t h em e t h o d ,w eh a v eo b t a i n e dt h ee s t i m a t e dv a l u e so fp a r a m e t e r t h e nw ed i s c u s sh o wt os o l v et h eg e n e r a ls i t u a t i o na b o u tt h ep r o b l e mb ya p p l i c a t i o ne x a m p l e s f i n a l l y , n u m e r i c a ls i m u l a t i o na b o u tt h ep a r a m e t e re s t i m a t i o np r o b l e mw i t ho n ed a t ao rt w o s u c c e s s i v ed a t am i s s i n gi sd o n e t h e r ea r et h r e ep a r t si nt h i sp a p e r :s e c t i o n1 ,l e a s t - s q u a r e se s t i m a t i o np r o b l e mf o ra r ( p ) m o d e lp a r a m e t e r ;s e c t i o n2 ,p a r a m e t e re s t i m a t i o nm e t h o d sw i t hd a t am i s s i n g ;s e c t i o n3 ,s a m p l e a p p l i c a t i o na n dn u m e r i c a ls i m u l a t i o n k e yw o r d s :m i s s i n gd a t a ;a r ( p ) m o d e l ;p a r a m e t e re s t i m a t i o n ;r e g r e s s i o nf o r e c a s tm e t h o d ; l e a s ts q u a r e se s t i m a t i o n i i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究工 作所取得的成果尽我所知,除文中已经注明引用内容和致谢的地方外,本论 文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请学位或 其他用途使用过的成果与我一同工作的同志对本研究所做的贡献均已在论 文中做了明确的说明并表示了谢意 若有不实之处,本人愿意承担相关法律责任 学位论文题目:垒鳖工丛盥蓝塾鱼兰盘盘生 作者签名: 搬j 辱嵌 缺失数据t a r ( p ) 模型的参数估训 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题目:垫查墨竺! 竺望垄里鱼堡垒丝业 作者签名:丝塑墨 日期: 鱼i 年 ! 月兰 日 导师签名:j 型兰查丑丕j 期:趁塑季年月孚日 大连理工大学硕士学位论文 引言 历史数据往往以时间序列的形式呈现出来,如过去3 年内中国的c p i 指数走势、最近1 0 0 年 来美国g d p 的增长率情况、某超市在过去一年内的销售额等这些数据都是随着时间的 变化而变化的,反映了事物、现象在时间上的发展变动情况由于这些数据是相同事物或 现象在不同时刻或时期所形成的数据,故称之为时间序列数据,简称时间序列或时间数据 对于时间序列数据,由于受到各种偶然因素的影响,时间数据往往表现出某种随机性,彼 此之间存在着统计上的依赖关系于是,观测靠它们在时间中的位置来彼此区别和联系 我们讨论时间序列数据的分析。主要研究目的是总结过去并预测未来 时间序列数据在实际生活中如此常见,在许多实际问题的研究中,经常有一些数据无 法获得或者缺失例如,在股票交易活动中,各种指数均以时间序列的形式表现出来,而 且各种指数间有很强的关联关系由于各国的法定节假日不同以及突发事件的影响等,在 比较两种指数问的关系( 如计算它们的对数差序列) 时,这个序列就出现了缺失数据再例 如,如果数据是某公司的产品月销售量额,测量的变量是产品的销售额,观测的对象是公 司每个月的运作这些观测可以用月来识别,由于员工的疏忽,某个月的记录意外丢失考 虑上述序列在实际应用中有重要的意义因此对含有缺失数据的时间序列进行建模十分 必要,而在时间序列中,a r ( p ) 模型是十分重要的 在数据处理和数据分析中经常出现缺失数据( m i s s i n gd a t a ) 或不完全数据( i n c o m p l e t e d a t a ) 针对这类问题,通常的处理方法之一是采取一定的方法为每一个缺失数据寻找一个 合理的替补值插补到原缺失数据的位置上,对得到的“完全数据集使用完全数据统计分 析方法分析并进行统计推断时间序列是在连续的等间隔点上的一系列观测值缺失数据 发生于序列内部在时间序列开始之后,结束之前出现的缺失值称为嵌入的缺失值 迄今为止,学术界已提出并发展了几十多种插补方法文献1 1 应用e m 算法解决了 一个数据和连续两个数据缺失时如何插补缺失数据,但是这种方法推广到连续多个数据 缺失时。计算过于复杂,无法求出具体的计算公式文献2 1 提出了应用m c m c 方法插补 缺失数据,当推广到连续多个数据缺失时,计算也过于复杂,无法求出具体的计算公式, 而且先验概率的确认也比较复杂关于e m 算法和m c m c 方法的简单介绍见文献f 3 1 文献 | 4 1 4 、5 1 、f 6 1 给出了缺失数据的插补方法的精简论述,文献7 1 给出了给出了缺失数据的插 补方法的详细论述。其中回归预测法应用广泛,实际应用中也比较好处理这种方法,可以 处理连续多个数缺失时的情况,进而广泛解决缺失数据t a r ( p ) 模型的建模问题,这也是 本文的出发点 本文首先应用经典的最小二乘估计方法,给出完全数据。隋形t a r ( p ) 模型参数的估计 然后,应用回归预测法。对几种含有缺失数据的a r ( p ) 模型进行数据插补最后,对这种插 补后的a r ( p 1 模型重新应用最小二乘法来估计其参数 本论文的结构如下第一部分:我们首先提出完全数据情况下h r ( p ) 模型的参数估计 方法我们运用经典的最d x - 乘估计法第二部分:我们通过对含有一个数据缺失、连续 两个数据缺失、连续多个数据缺失的情形,应用回归预测法插补缺失数据,使得含有缺失 数据m a r ( p ) 模型转变为完全数据时间序列在对缺失数据进行插补的过程中我们分别 1 缺失数据- f a r ( p ) 模型的参数估计 对缺失时刻之前和之后进行讨论,分别对缺失值进行插补,并应用某种加权处理方法最 后,对完全数据时间序列的方法估计参数第三部分:实例应用和数值模拟其中数值模拟 部分应用s a s 系统模拟举了一个数据缺失时和连续两个数据缺失时的例子 2 大连理工大学硕士学位论文 1 a r ( p ) 模型参数的最小二乘估计 考虑时间序列r l ,r p ,研1 ,r r ,其中p 是非负整数,t 充分大,满足a r ( p ) 模型: n = 咖o + 妒1 亿一1 + + 如7 - 1 + e t , ( 1 1 ) 其中t = p + 1 ,p + 2 ,t ,假设 e t ) 是均值为0 ,方差为仃2 的白噪声序列, 即 令 t p - - b l = 咖o + 妒l r p + + r 1 + e p + l , r p + 2 = 如+ 1 吃卜卜1 + + 如您+ 9 舛2 , r t = 加+ l r t 一1 + + 仃一p + e t y = ( i :) ,x = 则 其中圣= ( 加咖。如) 7 前后依赖的关系因此确定西= 假设x 满秩,对a r ( p ) 模型, 兰:! :! 三p ) ,圣= ( 妻) ,e = ( 暮: , y = x 圣+ e 和盯2 是待估参数,前者反映t a r ( p ) 时f t - 序列中各变量 ( 加咖1 咖) 的估计值对模型至关重要 常用最小二乘法来估计其参数: 蚤= f 如参1 西) 7 = ( x 7 x ) 一1 x 7 如近拦窑型 0 2 证明见文献8 1 、f 9 1 9 、l o 若时间序列r 1 ,印,r 叶1 ,竹没有缺失数据,即时间序列r 1 ,r p ,r p + 1 ,f t 是完全的对这种完全数据时间序列我们可以直接应用上述的最小二乘法来估计其参数 若时间序列r 1 ,r p ,+ 1 ,叼含有缺失数据,我们首先应用缺失数据的插补方法 对缺失数据进行插补,用插补值代替缺失值,得到完全数据时间序列,再应用上述的最小 二乘法来估计其参数 3 缺失数据下a r ( p ) 模型的参数估计 2 数据缺失时参数的估计方法 下面首先讨论一个或者连续两个数据缺失时参数的估计问题,最后再讨论连续多个 数据缺失时参数的估计问题 2 1 一个数据缺失时 当k :1 时,a r ( p ) 时间序列0 1 ,唧,唧+ l ,a j ,b l ,e l ,勺,钳1 ,c l 其中b l 为缺失值 第一步,利用n 1 ,0 p ,a p + 1 ,a j 预测b l : b l = 如+ 1 0 j + + n j 一( p 一1 ) + e 2 , 由( 3 ) 得,b 1 = 钾,西= 扣,e 芭2 ,即 6 = 稚+ q a a ,+ + 鸳o ,一( p 一1 ) + 芭i , 其中y n r 砖= ( 子口) 2 b 1 的预测为条件期望 对应的预测误差为 预测误差的方差为 研= e ( b ? l a l ,a 2 ,a j ) = $ 8 + q a a j + + 露o ,一( p 一1 ) , ? =6 n 一蹭 芭2 , v a r a ? = y n r 芭2 = ( 疗n ) 2 第二步,利用c 1 ,勺,c p + 1 ,c l 预测b l : 印= 如+ 咖i c p 一1 + + 如一i c i + c p b l + , 由( 4 ) 得,b l = 6 c ,垂= 毒c ,e ;= 芭;,即 唧= $ 6 + $ i 印一1 + + 露一1 c l + c u c l + 筇, 其中y o r = ( 方。) 2 假设露0 , 6 c = 【勺一( 参6 + $ i 勺一1 + + 露一1 c 1 + 仑;) 】蟊, 4 大连理工大学硕士学位论文 b 1 的预测为条件期望 砖= e ( b i l c l ,c l ) = 【勺一( 参5 + $ i 勺一1 + + 藓一1 c 1 ) 】睥, 对应的预测误差为 i =6 c 一6 i 一赁娣, 预测误差的方差为 v a r a i = y n r 芭;( 露) 2 = ( 子。) 2 ( $ :) 2 第三步,对b ,的两个预测值西和砖按长度或方差加权,得到预测值6 1 按长度加权: 6 = 击砖+ 南砖 ( 2 1 ) 按方差加权: + 珏丽6 n + 而丽v a r a 2 卟 c ( 2 2 ) 第四步,对完全数据a r ( p ) 时间序列a l ,唧,听1 ,a j ,6 1 ,c l ,勺,针1 ,e l 应用最小二乘估计法来估计其参数 2 2连续两个数据缺失时 当k :2 时,a r ( p ) 时间序列口1 ,0 p ,咻1 ,a j ,b 1 ,5 2 ,c l ,勺,针1 ,e l 其中 b 1 ,b 2 为缺失值 第一步,利用a l ,唧,阱1 ,a j 预测b l : b 1 = 如+ 妒l a j + + 咖n ,一( p 一1 ) + e b , 由( 3 ) 得,b 1 = 蜡,圣= 毒a ,e 6 _ 色即 鳍= 函8 + 函2 0 j + + 谭o ,一( p 一1 ) + 芭2 , 其中y o r 乏2 = ( 子n ) 2 b 1 的预测为条件期望 浒= e ( b 2 l a l ,a 2 ,a j ) = $ 8 + q a a ,+ + y a a ,一( p 一1 ) , 对应的预测误差为 2 = 6 0 一浒 = 乏2 , 5 缺失数据下a r ( p ) 模型的参数估计 预测误差的方差为 v a r a 2 = y o r 仑2 = ( 彦a ) 2 利用a 1 ,d p ,a 舛1 ,n ,预测b 2 : 6 2 = + 1 b l + 2 a j + + 讳o ,一( p 一2 ) + e 2 , 由( 3 ) 得,b 2 = 坦,b l = 6 口,圣= 毒口,e 2 = 占2 ,即 6 9 = $ 8 + 9 a l u a l + 。a a j + + 露o ,一( p 一2 ) + 芭2 , 其中y n r 芭2 = ( 铲) 2 b 2 的预测为条件期望 砖= e ( b g l a l ,n ,) = 裆+ 函2 e ( 鳍i 口1 ,。,) + 函g 口t ,+ + 弗。,一。一2 ) = $ 8 + ( ; 砖+ 参g 口,+ + 睇。,一( p 一2 ) , 对应的预测误差为 预测误差的方差为 g = v a r a g = 6 9 一醒 9 a 1l u a l 一i q ) + 苣2 衍2 + 芭2 , ( 衍) 2 y 口r 2 + y n r 芭2 ( 函 ) 2 ( 寺口) 2 + ( 子口) 2 第二步,利用c 1 ,勺,钳1 ,c l 预测6 2 : 勺2 如+ 1 c p 一14 - + 如一1 c 1 + p b 2 + , 由( 4 ) 得,b 2 = 6 5 ,圣= 毒c ,e ;= 即 印= 咖6 + 勺一1 + + 蝣一l c l + 咋 cc ,2 c + , 其中y n r 露= ( 子c ) 2 假设织0 , 崦= 【勺一( 稚+ $ ;勺一1 + + 瘁一1 c ,+ ) 露, 6 2 的预测为条件期望 e ( b l c l ,c l ) 勺一( 参5 + 西勺一1 + + y c 一c 1 ) 1 4 , 6 大连理工大学硕士学位论文 对应的预测误差为 预测误差的方差为 ;= v a r a = 崦一崦 一筇睇, y 口r 筇( 露) 2 ( 争。) 2 ( 瘁) 2 利用c 1 ,印,c v + 1 ,c l 预测b l : c p 一12 加+ 咖1 印一2 + + 咖一2 c i + 一i c b 2 + 如6 1 + e ;一1 , 由( 4 ) 得,b l = 6 c ,5 2 = 咙,西= 毒c ,e 1 = 芭;一1 ,即 爷1 = 穑+ 西勺一2 + + 露一2 c 1 + 霹一1 镌+ c c ,c 1 + 一1 , 其中y o r 色:一1 = ( 子c ) 2 假设托0 , 6 c = b 一一( 稚+ 前勺一2 + + 痒一2 c 1 + 霹一1 6 ;+ 筇一。) j z ;, b l 的预测为条件期望 砖= e ( 6 c i c l ,e l ) = 【勺一1 一( 稚+ 前勺一2 + + q 磋- 2 c l + 露一1 e ( b l c l ,钇) ) 髭 = 【勺一1 一( 稚+ $ i 勺一2 + + 痒一2 c 1 + 露一,镌) j 霹, 对应的预测误差为 预测误差的方差为 i= 6 c 一6 c = 一【群一,( 崦一鸸) + 一。】谭 = 一( 露一+ 一- ) 霉, v a r a i = 【( 瑶1 ) 2 v a r a ;+ y n r 芭;一1 】( 谭) 2 = 【( 睇一1 ) 2 ( a 。) 2 ( 露) 2 + ( 方。) 2 】( 露) 2 第三步,对b l 的两个预测值醣和砖,6 2 的两个预测值趣和砖按长度或方差加权,得 仁需j 嚣 a 需l + i 霎 3 , i 如= 赫鲤+ 尚砖 f 。 缺失数据- f a r ( p ) 模型的参数估计 按方差加权: b l - - - 矗筹钾+ 矗筹蒜砖, 如= 矗筹穗砖+ 矗筹镌镌 第网步,对完全数据a r ( p ) 时间序列 应用最小二乘估计法来估计其参数 2 3连续多个数据缺失时 ( 2 4 ) a l ,a p ,a p + l ,口,6 1 ,b 2 ,c l ,c p ,c p + l ,c l 缺失值可能成堆发生,导致了多个连续的缺失值的情形 a r ( p ) 时l o - 序列a l ,唧,a p + 1 ,a d ,b l ,b k ,b k ,c l ,勺,钳1 ,c l , 其中b 1 ,b 一,b k 为缺失值k 3 ,1 k k 第一步,利用a l ,0 p ,a p + 1 ,a d 预测b k : b k = o + 1 6 七一1 + + 咖p b k p + e 2 , 由( 3 ) 得,b k = 6 n ,b k 一1 = 6 2 1 , 其中y n r 芭2 = ( 含。) 2 b 七的预测为条件期望 醒= ,b k p = 6 2 _ p 西= 蚤。,e 2 = 毙即 6 2 = 声8 + 9 a 1 a 一1 + + a a p + 芭2 , e ( 城i n l ,a d ) 稚+ a 、b a 。一1 l a l ,o ,) + + 咋 a 。l a p a l ,o ,) 媚+ 砂a 1 a 一1 + + 睇6 2 一p , 对应的预测误差为 2 = 预测误差的方差为 v a r a 2 罐一皖 9 a 1l a 一1 一魄一1 ) + + al a p 一阮一p ) + 芭2 $ ? 2 1 + + 霹2 一p + 仑2 , ( ;? ) 2 v a r a 2 1 + + ( 鸳) 2 y a r a 2 一p + y n , 芭2 ( $ 2 ) 2 y a r a i 一1 + + ( 谭) 2 y a r a 2 一p + ( 子g ) 2 8 大连理工大学硕士学位论文 注意,其中 e ( 醒- p l a l , b k p = 蜈一p = 慨b k - p 脚, 慨哪 ,a j ) = 6 口一p 七一p 1 , k p 0 k p 1 , k p 0 = 。1 , a a 。一p = 鹾一p 一醒一p y z - - 步,利用e l ,勺,钳1 , j6 嚣一p 一罐一p ,k p 1 , 1 0 , k p 0 , j 2 _ p ,k p 1 , 10 , k p 0 ,钇预测b k : k + p = 如+ l b k + e , 一1 ) + + 如一1 k + 1 + 奶k + e 是押, 由( 4 ) 得,b k = 蛭,b k + l = 蛭+ 1 ,b k + ( p 一1 ) = b t , + 一1 ) ,b k + p = b l + p ,西= 毒c ,e 2 + p = 芭2 + p ,即 嚷+ p = 稚+ 9 c 1 c + ( p 一1 ) + + 稚一1 嚷+ 1 + c c + 芭2 + p , 其中v a r 芭b + p = ( 铲) 2 假设露0 , 壤= 【6 c + p 一( 稚+ 9 c 1 u 七c + ( p 一1 ) + + 露一1 6 4 1 + 馥+ p ) 】, 坛的预测为条件期望 6 = e ( 嚷l c l ,钆) = 【e ( b + p l c l ,c l ) 一( 妒8 + i e ( 6 + ( p 一1 ) l c l ,c l ) + + 娣一1 e ( b + l l c l ,c l ) ) 】蝣 = 蚝+ p 一( 咖5 + 硝蛭+ 加一1 ) + + 蛎一1 醺+ 1 ) 】蝣, 对应的预测误差为 =嚷一醒 ( 蚝却一壤+ p ) 一 错( 蛭+ ( p 一1 ) 一6 + ( p 一1 ) ) + + 稚一1 ( 嚷+ 1 一壤+ 1 ) + e l + p 露 【+ p 一( 哳+ ( p 一1 ) + + 娣一1 + 1 + 仑+ p ) 蝣, 预测误差的方差为 v a r a = v a r a + p + ( 错) 2 v a 7 玉p 一1 ) + + ( 谭一1 ) 2 v a r a c k + 1 + v a r 芭+ p 】( 露) 2 = y a r + p + ( 错) 2 v a r + ( p 一1 ) + + ( 露一1 ) 2 v a r i c 尤+ 1 + ( 旁。) 2 】( 薛) 2 9 缺失数据- f a r ( p ) 模型的参数估计 注意,其中 k + p = 嚷+ p = e ( b c k + p l c l ,c 工) = 舷b k + pm 笼嚣 娟七十笼嚣: 罐+ p j 嚷却, k + p k , ic ( 七+ p ) 一k ,k + p 芝k + 1 + p = 6 + p 一醣+ p jb c k + p 一6 + p , k + p k , 一n 七+ p k + i j + p , k + p k , 一1 o ,七+ p k + i 第三步,对b k 的两个预测值鲤和壤按长度或方差加权,得到预测值以 按长度加权: 珏两者箫而者潲酲 ( 2 5 ) 按方差加权: 珏而瑰+ 丽v 2 a m r a 2 噬曝 ( 2 6 ) 第四步,对完全数据a r ( p ) 时间序列a l ,0 p ,阱1 ,口,6 1 ,魂,珏,c 1 ,勺,c p + 1 ,c l 应用最小二乘估计法来估计其参数 大连理工大学硕士学位论文 3 实例应用与数值模拟 3 1实例应用 利用上一节的处理方法,可以解决更一般的情况 下面的例3 1 和例3 2 给出处理更一般的含有缺失数据的a r ( p ) 模型参数估计的思 路,将模型转化成为上一节我们能够处理的模型通过缺失数据的插补,使得原来有缺失 数据的数据集成为一个完整数据集,弥补了统计分析的不便 侈4 3 1 a r 以砂时间序歹qa l ,a j ,b l ,6 知,d 1 ,d j ,6 七+ 1 ,b k ,c l ,c l , 其中b l ,b k , b k + 1 ,坛为缺失值,j , i ,l 充分大k 为正整数,1 k k 解:a r ( p ) 时间序列a 1 ,a j ,b 1 ,k ,d 1 ,d 1 ,b 七+ 1 ,坛,c 1 ,c l 无法直接 应用上节介绍的方法,但是可以分成两段:0 1 ,a j ,b 1 ,b k ,d 1 ,d j 和 d 1 ,d l ,b 惫+ 1 ,坛,c 1 ,c l 其中每一段都可以直接应用上一节介绍的方法对缺失数 据进行插补 对a r ( p ) 时间序列a l ,a j ,b l ,b k , d l ,d j 估计缺失值b l ,b k ,得 对a r ( p ) 时间序列d 1 ,d j ,k + 1 ,b g ,c 1 ,钇估计缺失值b k + 1 ,6 k ,得 b k + l ,坛 最后,对a r ( p ) 时间序列0 1 ,a j , 占1 ,如,d 1 ,d i ,魂+ 1 ,珏,c 1 ,屯应用最 小二乘估计法来估计其参数 这种分段考虑问题的思想可以推广到更一般的情况 侈0 3 2 a r f j f 时间序列0 1 ,a j , b 1 ,b k 一2 ,b k 一1 ,b k ,b k + 1 ,b k + 2 ,b g ,c 1 ,e l , 其中b 1 ,b k - 1 , b k ,b k + 1 ,b k 除去若干项外为缺失值,j , l 充分大k 为正整数,1 ksk 解:在本题中,我们无法直接应用上一节介绍的方法对缺失数据进行插补但是可以 应用某种处理方法将问题转化为上一节介绍的情况 举一个特殊的情况,不妨设只有b 知= 比不是缺失值 方法一:把k 舍去,对a r ( p ) 时间序列a 1 ,口,b 1 , 6 七一1 ,6 知+ 1 ,坛,c 1 ,c l 估计缺失值,得 6 1 ,氏一1 ,6 南+ 1 ,k 最后,对a r ( p ) 时间序列0 1 ,a j , 占1 ,以一1 ,虼,如+ 1 ,k ,e l ,e l 应用最小二 乘估计法来估计其参数 缺失数据下a r ( p ) 模型的参数估计 方法二:把b 知当做缺失值,对a r ( p ) 时间序列 a l ,a j ,b l ,b k - 1 , b k ,b + 1 ,b g ,c 1 ,钆估计缺失值,得 6 。,巩扎瓦,巩扎,珏 最后,对a r ( p ) 时间序列0 1 ,o ,6 1 ,玩一1 ,6 :,6 七+ 1 ,k ,c 1 ,c l 应用最i j 、- 乘估计法来估计其参数 再举一个特殊的情况,不妨设只有b k 一1 = 一1 和b k + 1 = 6 :+ 1 不是缺失值 方法一:把b 七一1 和b 七+ 1 舍去 对a r ( p ) 时间序列a l ,口j ,b l ,6 | c 一2 ,k ,b k + 2 ,b k ,e l ,c l 估计缺失值,得 6 1 ,靠一2 ,靠,k + 2 ,6 k 最后,对a r ( p ) 时间序列a l ,a j ,6 1 ,靠一2 ,一1 ,瓦 6 :+ 1 ,6 七十2 ,珏,c l ,c l 应 用最小二乘估计法来估计其参数 方法二:把b 血一1 和b 七+ 1 当做缺失值 对a r ( p ) 时间序列a 1 ,a j ,b 1 ,巩一2 ,k 一1 6 七,b k + 1 ,b 七+ 2 ,b k ,c 1 ,c l 估计缺 失值。得 6 1 ,如- 2 5 k - x , 魂,如+ 1 瓦+ 2 ,坛 最后,对a r ( p ) 时间序列a l ,a j ,8 1 ,轧一2 ,一1 ,轧,+ 1 ,瓦+ 2 ,坛,e l ,c l 应 用最小二乘估计法来估计其参数 3 2 数值模拟 例3 3 模拟数据a r ( 2 ) 模型,一个数据缺失时 解:下面的d a t a 步产生2 0 0 个来自a r ( 2 ) 过程毗= 一毗一1 一o 5 木撕一2 + e t ,其中e 服从 相互独立同分布( o ,1 ) 的伪随机样本 d a t at : u l = 0 ; u l l = o ; d ot i m e = 一5 0t o2 0 0 ; u = - u l - 0 5 车u l l + r a n n o r ( 1 2 3 4 6 ) ; i ft i m e 己0t h e no u t p u t ; u l l = u l ; u l = u ; e n d ; r u n ; p r o cp r i n td a t a = t ; v a tu : 假设第7 1 个数据缺失下面程序给出插补该值的程序 d a t aa : 1 2 大连理工大学硕士学位论文 s e tt ( f i r s t o b s = lo b s = 7 0 ) ; k e e pu : r u n ; p r o cp r i n td a t a = a ; r u n ; p r o ca r i m ad a t a = a ; i d e n t i f yv a r = u ; r u n ; e s t i m a t ep = 2q = o ; r u n ; q u i t ; d a t ac ; s e tt ( f i r s t o b s = 7 2o b s = 2 0 0 ) ; k e e pu : r u n ; p r o cp r i n td a t a = c ; r u n ; p r o ca r i m ad a t a = c ; i d e n t i f yv a t = u ; r u n ; e s t i m a t ep = 2q = 0 ; r u n ; q u i t ; d a t ab : u = ( 7 0 2 0 0 ) 木( - 0 0 3 7 8 4 - 1 1 6 3 7 8 木3 0 8 4 7 0 - 0 4 9 4 7 1 木( - 1 5 5 0 5 5 ) ) + ( 1 2 9 2 0 0 ) 木( o 5 0 4 9 1 0 0 5 3 5 7 + 1 0 5 5 3 6 车0 4 6 4 1 2 ) ( 一0 5 3 3 2 7 ) ; r u n ; p r o cp r i n td a t a = b ; r u n ; 下面程序给出了插补后的完全数据集,并用a r i m a 过程估计参数 d a t at t ; s e tabc ; r u n ; p r o cp r i n td a t a = t t ; r u n ; p r o ca r i m ad a t a = t t ; i d e n t i f yv a r = u ; r u n ; e s t i m a t ep = 2q = 0 ; 缺失数据t a r ( p ) 模型的参数估计 r u n ; q u i t ; 注意本例中参数估计值非常合理地接近用于产生模拟数据的值( 肛= 0 ,口= 0 0 1 9 7 9 ,p 1 = 一1 ,玩= 一1 0 8 3 6 6 ,p 2 = 一0 5 ,如= 一0 5 1 2 3 7 ,盯2 = 1 ,寺2 = 1 1 5 3 2 8 2 ) 例3 4 模拟数据a r ( 1 ) 模型,连续两个数据缺失时 解:下面的d 舰步产生2 0 0 个来自a r ( 1 ) 过程u t = 一0 8 牛乱t 一1 + e t ,其中e t 服从相互独 立同分布n ( 0 ,1 ) 的伪随机样本 d a t at ; u l = o ; d ot i m e = 一5 0t o2 0 0 ; u = 一0 8 木u l + r a i m o r ( 1 2 3 4 6 ) ; i ft i m e 2 , 0t h e no u t p u t ; u l = u ; e n d ; r u n ; p r o cp r i n td a t a = t ; v a ru : 假设第1 2 1 个和地1 2 2 个数据缺失,下面程序给出插补该值的程序 d a t aa : s e tt ( f i r s t o b s = lo b s = 1 2 0 ) ; k e e pu : r u n ; p r o cp r i n td a t a = a ; r u n ; p r o ca r i m ad a t a = a ; i d e n t i f yv a r = u ; r u n ; e s t i m a t ep = lq = o ; r u n ; q u i t ; d a t ac : s e tt ( f i r s t o b s = 1 2 3o b s = 2 0 0 ) ; k e e pu ; r u n ; p r o cp r i n td a t a = c ; r u n ; p r o ca r i m ad a t a = c ; i d e n t i f yv a r = u ; 大连理t 大学硕十学位论文 1 1 u n ; e s t i m a t ep = lq = o ; r u n ; q u i t ; d a t ab : i n p u tu c a r d s ; 1 2 0 2 0 0 ( 0 0 3 1 9 7 - 0 8 4 6 5 1 木( 一1 2 9 1 6 9 ) ) + 7 9 2 0 0 宰( ( 3 9 4 8 9 8 - 0 1 0 2 0 7 ) ( - 0 7 9 5 5 5 ) 一0 1 0 2 0 7 ) ( 一0 7 9 5 5 5 ) 1 2 1 2 0 0 宰( 一0 0 3 1 9 7 - 0 8 4 6 5 1 宰( 一0 0 3 1 9 7 - 0 8 4 6 5 1 木( 一1 2 9 1 6 9 ) ) ) + 7 8 2 0 0 奉( 3 9 4 8 9 8 - 0 1 0 2 0 7 ) ( 0 7 9 5 5 5 ) , r u n ; p r o cp r i n td a t a = b ; r u n ; 下面程序给出了插补后的完全数据集,并用a r i m a 过程估计参数 d a t at t ; s e tabc : r u n ; p r o cp r i n td a t a = t t ; r u n ; p r o ca x i m ad a t a = t t ; i d e n t i f yv a x = u ; r u n ; e s t i m a t ep = lq = 0 ; r u n ; q u i t ; 注意本例中参数估计值较为合理地接近用于产生模拟数据的值( p = 0 ,丘= 0 0 1 1 7 7 ,0 1 = 一o 8 ,卉= 一0 8 2 3 4 4 ,仃2 = 1 ,子2 = 1 1 7 8 9 4 5 ) 结论:由以上数值模拟可知,使用本论文中的方法估计含有缺失数据的a r ( p ) 模型的 参数,其估计的效果很好 缺失数据下a r ( p ) 模型的参数估计 附录 1 例3 3 的模拟数据 2 0 0 个模拟数据如下: o b su11 6 3 5 6 82 0 0 3 4 7 13 0 6 2 0 9 840 9 3 2 8 35 2 2 3 7 6 361 9 3 4 117 0 8 9 0 6 580 8 7 8 6 89 0 6 8 4 1 31 0 2 1 4 4 2 31 12 3 2 9 5 01 2 1 7 0 5 3 41 3 0 8 8 6 6 81 42 1 3 7 9 01 5 1 7 1 8 4 31 62 0 9 0 7 21 7 2 3 9 4 7 91 81 4 3 4 9 91 9 1 3 1 0 8 92 01 4 8 2 9 42 1 2 3 2 3 4 62 20 0 2 4 7 82 31 0 9 4 1 92 4 0 4 7 1 2 62 5 2 3 7 0 4 02 6 3 2 6 0 6 32 72 3 5 2 5 42 8 1 9 4 3 0 02 91 6 5 6 0 53 0 2 8 0 3 6 33 13 1 4 4 1 73 2 2 6 3 8 7 23 3 0 5 0 6 9 13 40 0 8 6 5 83 5 0 6 1 3 1 73 61 2 1 0 0 03 7 2 2 4 8 8 73 82 5 8 1 8 33 9 3 1 8 9 6 84 0 0 3 0 3 9 54 1 3 5 7 5 1 14 2 3 3 4 8 4 44 31 4 5 5 0 54 41 4 1 1 7 44 5 1 1 8 5 0 24 6 0 4 6 3 2 84 71 4 0 3 6 24 8 1 1 8 4 6 24 9 1 4 7 7 4 05 0 1 6 9 2 5 75 11 1 0 3 2 05 2 0 2 5 9 5 25 3 0 2 1 7 9 15 40 1 9 1 9 75 5 0 3 6 7 7 25 62 0 4 7 7 55 7 1 5 7 1 6 35 81 4 0 5 4 05 9 0 8 3 2 2 16 0 0 5 9 8 3 86 10 6 7 3 9 46 2 1 7 6 7 2 66 32 4 0 2 7 86 4 2 8 9 2 6 46 5 1 7 7 8 4 96 6 一1 6 9 6 3 96 70 7 2 2 9 06 8 0 3 8 7 0 76 9 1 5 5 0 5 57 03 0 8 4 7 07 1 1 9 5 5 1 17 20 4 6 4 1 27 3 0 5 0 4 9 17 4 2 2 7 8 2 57 53 2 8 8 8 97 6 1 3 5 1 1 67 7 0 3 1 5 8 97 81 1 5 8 7 67 9 2 4 1 3 7 78 01 4 7 6 6 78 1 0 7 9 3 3 28 2 2 1 4 5 7 78 32 2 0 4 1 08 40 4 3 8 5 78 5 2 1 0 9 6 18 61 6 8 1 3 28 7 1 1 8 5 4 28 80 2 6 7 9 38 9 0 8 9 0 8 09

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论