第三章 模型的初步识别与参数的矩估计1.doc_第1页
第三章 模型的初步识别与参数的矩估计1.doc_第2页
第三章 模型的初步识别与参数的矩估计1.doc_第3页
第三章 模型的初步识别与参数的矩估计1.doc_第4页
第三章 模型的初步识别与参数的矩估计1.doc_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 模型的初步识别与参数的矩估计 前言:第二章,我们讨论了序列的自相关与偏相关函数的性质,及其与模型参数之间的关系,在第二章1又曾指出实际中的大量随机序列,并不能用直接方法(或称物理方法)建立它们的模型,从物理意义上看甚至于它们本身并不是线性模型. 这时,所谓根据它们的样本数据建立线性模型,不如说是寻找一种与它们尽可能“等价”的序列,作为实际序列的近似模型. 原因在于由于序列的谱密度是有理谱密度,它们能逼近任何连续谱密度;由于在实际应用中,这类模型有很多方便之处. 下面三章内容都是围绕这样问题展开的:若是某一未知其模型的序列,现在获得了它的一段样本数据,如何根据这个数值对的模型做出估计,或者说得更具体些,对模型的阶数和参数与做出判断与估计. 模型识别:一般,我们把对的判断称为模型识别,也就是初步确定序列模型的形状;在被判定后,估计相应的和,称为参数估计. 解决这些问题的方法属于时间序列的内容. 一旦做出了序列模型的识别和估计,序列的自相关、偏相关函数及谱密度的估计就可以由这个模型算出. 另外,序列经过某种处理(如差分或“季节型”差分VI章)后,可看作序列,同样用上述手法,并以估计所得的模型作为真实序列的近似描述. 解决上述识别与估计问题,主要依据第二章理论分析结果. 本章将介绍一种初步识别方法和参数的矩估计,它们简单易懂,但是其精度稍差. 为提高精度,可用第四章方法求参数的精估计,再由V章,检验和改进初步识别的结果,但其程序较繁且计算量也大得多.1 样本自相关与样本偏相关函数 假定得到了数据,它们是随机序列的一段样本值,称为样本长度,为要根据这段样本数据估计的模型,先要设法消去的均值项,至于去均值方法,今后讨论(P7982,4 P98102)暂时假定. 这时定义的样本自协方差与样本自相关函数分别为: (I) (II)有时,也采用如下定义: (III) (IV)易知. 因此,与是渐近相等的. 但是是非负定列,则不一定如此. (为证明此,对于或暂记,于是对任意个实数, (或时) 这就证明了序列的非负定性. ) 反例的不为正定性. 设是长度为的样本例,经计算得 若取,则 若取,则 不为正定列. 另证为(正定)非负定列且为正定序列. 若令 它是一个阶矩阵,为任一给定正整数,则显然样本自协方差阵可以表示成:其中第行第列为设是任一非零向量,则由样本值不全为,易证的个分量中,至少有一个不为,于是为正定列. Theorem:设为正态序列,即为方程的正态平稳解,令. 则对固定的正整数,当时,随机变量联合分布为渐近正态,其中,为阶方阵,其行列元素为,是(2.4)(P273)中的主项. 推论1 设为正态平稳白噪声序列,则随机向量的极限分布为,其中. 表阶单位阵. 推论2 设为正态序列,为其自相关函数,为其样本自相关函数,则联合分布渐近于维正态分布,其中,即为(P280)中的主项. 特别为正态白噪声序列,. Theorem:设为正态序列,则 (2.4) 推论3 在Th条件下,对非零整数有:(2.14) 称上式为Bartlett公式. Theorem:正态序列参数的Yule-Walker估计,当样本长度时有性质即:当时其中,是阶方阵,其行列元为,为Toeplitz阵,. Theorem:在上述条件下,则当时 Theorem:在上述条件下的Yule-Walker估计为,则分布渐近正态. . 若是序列(注意若不加特别说明,恒假定随机序列是正态的),那么和作为和的估计量,具有以下性质: 1它们是相容估计和渐近无偏估计,即 (I) (II) (I)式中表示依概率相等. 2它们具有渐近正态性,即存在两个趋于的数列,分别使得: 3它们的误差方差分别渐近为 (III) (IV) (IV)式称为Bartlett公式,这些公式的证明可见安鸿志书附录2,特别由(III)式知,当为白噪声时, (V) 当为序列时, (VI)(时) (时)当为序列时,以此代入(VI)式得 (VII) 从上述式子知,和渐近误差方差都与成正比例,而其比例常数又和真值或有关. 易知当时,诸误差方差都趋于,由此可推出(I)、(II)式. (利用)对于序列,. 和的主项分别为,. 即它们趋于零的速度不会比和更慢. 对于序列,由(VII)式易知,显著地依赖于参数,愈接近它的平稳域边界,趋于零的速度愈慢. 例如当时,;而当时,易知(VII)式找不到与无关的上界. 对序列来说情况类似. 在实际应用中,我们希望通过增加样本长度以提高估计精度. 为保证上述估计量的均方误差达到一定的精度要求(比如要求,或;前者为绝对精度,后者为相对精度)可用(III)(IV)式计算需多大. 但这些公式中的和仍是未知的,并不能准确定出多大的才能满足预定的精度. 确定的精略方法:(采用不断实践改进的方法摸索之)假定开始获得了个数据,由 ,.算出适当长度,直到它们接近于. 为了对的方差做出估计,利用(III)、(IV). 在这两式的右方将和依指数律收敛于,这样的近似可行,若所算出的或达到了预定的精度要求,就认为取样长度是合适的,否则应设法增加取样数据. 比如据现有的或的大小和精度要求,试着增加到,然后再重复做出新的估计,计算出新的和之值,并检查是否满足预定的精度,按这个程序做下去,直到合适为止. 通常只重复一、二次即可,若总定不下来,则序列可能不是序列. 有了样本自相关函数,可按上一章类似定义样本偏相关函数,解方程. (VIII)得到这就是的样本偏相关函数. 亦可按P60递推计算,将换为即可.当为序列时,据附录5结果,具有以下性质: 1是的渐近无偏估计和相容估计,即 特别 2具有渐近正态性质,即存在趋于的数列满足 3当时有下列性质: (IX)对于一般的序列,亦有与此类似的性质,但常用到的是序列的偏相关函数(截尾性).2 模型的初步识别方法 本节讨论如何利用前一节的样本自相关和样本的偏相关函数来判断的模型阶数,即和之值;若是求和模型,还要判断的值. 初步识别方法和要领: 1识别的依据:据第二章中序列自相关与偏相关函数的性质(P69表2.2.1),若其样本自相关函数在后截尾,很自然判断是序列. 类似地,若在以后截尾,则判断是序列. 若都不截尾,又被负指数型的数列所控制(即拖尾的),则应判断其为序列,但其阶数无法确定; 2或截尾性的判断:理论自相关和偏相关函数和的截尾性,是指它们从某个值或以后全为. 由于是和的估计值,它们必然有误差,即使是序列,当后,也不会全为,而只是在零上下起伏. 由1的(VI式)分布渐近性质,若真值在以后截尾,则. 而的分布渐近为,依渐近正态分布律可知:对每个都可检验(在经验上一般取或左右)中满足或的比例是否达到68.3%或95.5%. 若都没达到,而达到了,我们就说在后截尾,因而按要领判断为序列,且称为的初步识别值. 为简便仍用表示. 由于对不同的尚有某些相关,令当不同的之差,超过后才相关(). 这种检验只能作为一种近似手段. 对也类似. 然而,这样的判断方法有时会把序列判断成其它类型,把序列判断成其它类型,有时即使类型判断无误,其阶数也可能有误. 它属于判断精度问题(4节讨论);(季节模型) 3求和阶数的识别:若和依要领的分析不但都不截尾,而且(至少有一个)下降趋势很慢,则可以认为它们不是拖尾的,即不能被负指数列控制. 这时,可重新计算并按要领和分析的样本自相关与偏相关函数,若它们仍都不截尾,而且(至少有一个)下降很慢,则可再考虑直到某一次的样本自相关或偏相关为截尾或都为拖尾为止. 这时即初步判断为的求和阶数. 与真值可能有出入,有时应用中直接提供不必计算之. 4混合模型的定阶: 若经要领已判断属于型,由要领知道,这时还不能定出和的值,只是知道它们都不为. 对于这种混和模型,识别的办法可以从低阶到高阶逐个取为等值尝试,即先认定为某值(如(1.2),再进行下一步的参数估计,并定出估计模型来,然后经过第五章的方法检验这个估计模型是否被接受,即与原序列符合得好不好;若不被接受,就调整尝试值,再重新做参数估计和检验,直到被接受为止. 此法虽烦琐但实用,对序列亦实用. 另外,混和模型在实际应用中的阶数一般较低. 此外,还可用模型逼近真实混合序列,而少用或模型,还有其它定阶手法(P146150). 5去掉的均值项:若我们分析的时间序列含非随机的均值项,则在计算的自协方差函数、偏相关函数以及对它进行模型识别和参数估计(样本)时,一定要设法将均值项去掉,若能用物理方法记录(如绪论中例1,采用经纬仪照相法获得轨道真实值),则可从中直接减去. 否则,常用的办法是从中减去它的样本均值,即用代替进行时间序列分析. 估计量的统计性质(P100102) 下面讨论第一章所举的六个伪随机数列,对这些模型进行初步识别,借此熟悉初步识别的方法. 我们的问题是:假设我们并不知道构造这些数列的模型,如何根据它们的一段样本数据,对它们的模型进行判断,这就是进行模型识别. 图3.2.1(a)曲线,当时非常接近(截尾),图3.2.2(a)则显现出拖尾的趋势(尾部不全为,但又被负指数函数所控制),因此大致可定出,序列,若仔细考察时,按要领所叙述办法,先计算,然后检查()(取)中满足的比例是否达到68.3%,其结果是,经检查上述比例为. 因此这一判断可接受,于是初步识别为序列,这与真实模型相符. 图3.2.1(b)有截尾趋势,而(图3.2.2(b)有拖尾趋势,初看起来,也可定为型,但由第二章P65例2的允许域为,而此处不在允许域内,因此应考虑模型. 注意,由第二章P66的允许域条件检验如下:且. 这说明在此域内,为仔细审查,仍可按要领进行检验,此处略. 当然,也可继续审查用模型是否可行,这是4讨论的识别的多样性问题. 一般在应用时都遵循两点:其一,尽量要用低价模型;其二,尽量使模型系数的估计不要接近平稳可逆域的边界. 于是由上述讨论将数值序列定为序列,与真实情况相符. 图3.2.1(c)明显地拖尾,而近于截尾,因此可暂定,为要仔细考察,利用P77和的渐近正态性,发现中满足的比例为,即可接受上述判断,于是初步识别为序列,与真实情况相符. (近于截尾,时,从而) 图3.2.1(d)明显地拖尾,而近于截尾,若暂定经与上例类似的考虑手续后,发现有70%的满足,因此可以接受. 但是注意到,若认定模型为,则理应为,这样与之差超过了的两倍多,在很大程度上可能,即值得考虑模型. 若改用这一模型再检查的比例时,结果约为74%,同样可接受. 两点启发:初步识别常常出现多样性;在识别取为和都可接受时,特别注意比较与. 若可认为,即断定为序列;若(甚至于)(小概率事件发生了),则应否定,即判断为序列; 若接近,则两种判断均可采用. 第五章将有方法鉴定那一种更合适. 它们亦适合模型,另外,允许域有助于识别. 图3.2.1(e)的和图3.2.2(e)的都有明显的拖尾形状,由要领所述,这时不象截尾那样易于确定阶数. 从原则上说,只有从低阶向高阶逐个试验才做出判断. 利用和渐近性质,及对不同的和的不同性质,也可摸索出一些粗略估计办法. 例本例中由于,可认为在后,近似为之间的常数. 猜想,由P57(2.2.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论