(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf_第1页
(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf_第2页
(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf_第3页
(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf_第4页
(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf_第5页
已阅读5页,还剩54页未读 继续免费阅读

(概率论与数理统计专业论文)计量经济学中统计建模的非参数方法和转变点分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 计量经济学是- i - j 集经济理论、统计学和数学等知识于一体的经济学的分支 学科。而统计建模和灵敏度分析是当今计量经济学研究的重大课题之一。 由于经济问题多半是非线性问题,经济数据的变化是非平稳的,而传统的计 量经济学模型是在假定变量之间存在一种长期的稳定关系中去寻找的。围绕这一 问题,国外兴起了利用非参数、非线性、非平稳等被称为“三非”的研究热潮。 本文所讨论的核估计理论是其中的一种。在我国这方面的研究也日趋受到重视与 关注,但很少作出比较全面系统的阐述。本文较系统地介绍了核估计的相关内容, 特别对回归分析的核估计方法作了较为深入的讨论。从理论上证明了在一定条件 下,核估计的相合性。并通过具体的经济实例,进行实证分析研究,来比较其结 果,显示出非参数方法的优越性。 本文研究的另一内容是转变点分析,这也是在各个领域应用较为广泛的一种 分析方法。鉴于目前所作过的工作,转变点分析已获得极为丰硕的成果,且新结 果不断涌现。本文则从另一角度。在理论上对转变点分析的稳定性作了一定的探 讨,得出相应的结论。并将转变点分析引入到计量经济学相关内容的统计建模, 这种处理方式为计量经济学建模的一种新的尝试,更面向实际。本文较为深入地 研究了计量经济学有关模型转变点的检验、识别问题及其经济含义。并将有关结 果应用于我国外贸安全结构的研究之中,具有一定的理论价值与实际应用价值。 关键词:非参数;核估计:权函数:转变点:稳定性 华中科技大学硕士学位论文 a b s t r a c t e c o n o m e t r i c si so n eo ft h eb r a n c h e so fe c o n o m i c sw h i c hi st h eu n i f i c a t i o no f e c o n o m i ct h e o r y , s t a t i s t i e sa n dm a t h e m a t i c s b u tn o w , i ti ss t a t i s t i c a lm o d e l i n ga n d s e n s i t i v i t ya n a l y s i st h a ti so n eo f t h em o s t i m p o r t a n ts u b j e c t so f e c o n o m e t r i c s s i n c et h ee c o n o m i cp r o b l e m sa r em o s t l yn o n l i n e a r , t h ee c o n o m i cd a t ac h a n g e sa r e n o n s t a t i o n a r y ;t h et r a d i t i o n a le c o n o m e t r i cm o d e l sa r ee s t a b l i s h e du n d e r t h ea s s u m p t i o n o fal o n g r a n g es t e a d yr e l a t i o n s h i pb e t w e e nv a r i a b l e s t os o l v et h ep r o b l e m ,f o r e i g n r e s e a r c h e r st r y t ob s et h em e t h o d so fn o n p a r a m e t r i c ,n o n l i n e a ra n dn o n s t a t i o n a r y a n a l y s i s a n di nc h i n ai ta l s oh a sb e e np a i dm u c ha t t e n t i o nt o t h et h e o r yo f k e r n e l e s t i m a t i o nd i s c u s s e di nt h i sp 印e ri so n eo ft h e s e t h ep a p e rs y s t e m a t i c a l l yi n t r o d u c e s t h ec o n t e n to nk e r n e l e s t i m a t i o n ;e s p e c i a l l y , t h em e t h o d so fk e r n e l e s t i m a t i o no f r e g r e s s i o na n a l y s i sa r ed i s c u s s e dd e e p l y u n d e rs o m ec o n d i t i o n s ,t h ec o n s i s t e n c yo f k e r n e le s t i m a t i o ni ss u m m a r i z e di nt h e o r y , a n dt h ee s t i m a t i o nb e c o m e sm o r es t a b l e ,t h e t r a d i t i o n a lp a r a m e t e rm e t h o dh a sn os u c hm e r i t e m p i r i c a la n a l y s i sh a sb e e nd o n et o c o m p a r e t h er e s u l t sb yt h ec o n c r e t ee c o n o m i cc a s e t h eo t h e rc o n t e n to f t h er e s e a r c hi sc h a n g e p o i n ta n a l y s i s ,w h i c hi sa l s ow i d e l y u s e d i na l lk i n d s o f f i e l d s c o n s i d e r i n g t h ew o r kh a sb e e n d o n e c h a n g ep o i n ta n a l y s i sh a sg o t l o t so fr e s u l t s ,a n dn e wr e s e a r c h e sa r i s ef r e q u e n t l y n l i sp a p e rh a sd o n es o m ed e e p l y t h e o r e t i cr e s e a r c ho ft h es t a b i l i t yo f c h a n g ep o i n ta n a l y s i sf r o ma n o t h e rp o i n to fv i e w , a n dg o tt h er e s u l t sa c c o r d i n g l y c h a n g ep o i n ta n a l y s i si si n t r o d u c e di n t oe c o n o m e t r i c m o d e l i n g i tf a c e su p t op r a c t i c eb e t t e r , e x p l o r i n gt h et e s tp r o b l e mo nc h a n g ei nm o d e l s i ne c o n o m e t r i c s ,i n v e s t i g a t i n gi t se c o n o m i cm e a n i n g t h ea c c o r d i n gc o n c l u s i o n sa r e a p p l i e dt os t u d yt h ee x t e r n a lt r a d ei no u rc o u n t r y , w h i c hh a st h e o r e t i c a la n da p p l i e d v a l u e s k e y w o r d s :n o n p a r a m e t r i c ;k e r n e le s t i m a t i o n ;w e i g h t i n gf u n c t i o n ; c h a n g ep o i n t ;s t a b i l i t y 1 1 独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承 担。 学位论文作者签名:猕去霸 日期:知砷年3 翮日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 保密口,在年解密后适用本授权书。 本论文属于不保密区 ( 请在以上方框内打“”) 学位论文作者签名:强 小1 日期:唯3 月坼日 j 导教师签名:万辽寻 日期;西孵;月z 7 日j 华中科技大学硕士学位论文 1 1 计量经济学概述 1 1 1 计量经济学的概念 1 绪论 计量经济学是在国民经济活动中应用最为广泛的经济学分支学科之一。它自 诞生之日起,就显示了极强的生命力,经过2 0 世纪4 0 年代至5 0 年代的大发展及 6 0 年代的大扩张,已经在经济学科中占据极为重要的地位。随着计算机的广泛普 及使用,大量复杂的计量经济模型得以建立和应用,使这门学科得到了迅速的发 展,正如美国著名经济学家萨缪尔森曾说过的:“二次世界大战后的经济学是计量 经济学时代”。 英文e c o n o m e t r i c s 最早是由挪威经济学家费瑞希( r f i s h ) 在1 9 2 6 年仿照生 物计量学( b i o m e t r i c s ) 一词提出的。其中文译名有两种:计量经济学和经济计量 学。前者试图强调它是一门经济学科:而后者是英文的直译,且强调该学科的主 要内容是经济计量方法。这两种不同的强调正反应了计量经济学有两个主要研究 内容:一是计量经济方法的理论研究,称为理论计量经济学:二是将这些理论广 泛应用于实际的经济活动中,称为应用计量经济学。 费瑞希曾对计量经济学作了一个详细的阐述:“对经济的数量研究有好几个方 面,其中任何一个就其本身来说都不应该和计量经济学混为一谈。因此,计量经 济学与经济统计学决不是一样的。它也不等于我们所说的一般经济理论,即使这 种理论中有很大部分具有确定的数量特征。也不应该把计量经济学的意义与在经 济学中应用数学看成是一样的。经验表明,统计学、经济理论和数学三个方面观 点的每一种都是实际理解现代化经济生活中数量关系的必要条件,但任何一种观 点本身都不是充分条件。这三者的统一才是强有力的工具;正是由于这三者的统 一才构成了计量经济学”。 更确切的说。计量经济学是在定性分析的基础上,专门探讨如何用经济数学 l 华中科技大学硕士。学位论文 模型方法定量描述具有随机性特征的经济变量关系的边缘科学,是数理经济学和 数理统计学的交叉科学,是以经济理论为依据,以数学方法和统计推断为手段研 究经济关系和经济活动规律的数量分析方法及其应用的一门经济学学科,它不同 于数理经济学和经济统计学,是一门独立的经济学分支,并且具有理论性、量化 特征性、综合性和实用性的特点。计量经济学的研究对象,就是经济系统的量变 规律,即研究如何根据经济理论利用经济信息,对经济系统的结构、功能、过程 和环境进行定量分析,并且运用数学模型来进行描述、计算评价,从而为经济系 统决策提供依据。计量经济学的根本任务是建立经济模型和检验经济模型。用数 学模型方法研究客观经济系统的数量关系既是计量经济学的任务,也是计量经济 学的特点。模型是计量经济学的重要组成部分,也是计量经济学致力于研究的中 心问题之,其基本目的就是为了给经济管理、制定政策以及经济决策提供定量 分析的技术和工具。经济计量模型,特别是大型的、非总量化的以及动态模型, 对于制定和评价政策具有极其重要的意义。尤其是随着经济计量模型与电子计算 机相结合的日益发展。迸一步促进了经济计量学理论与实践的不断丰富和完善。 1 1 2 计量经济学的发展概况 在初期发展的十多年中,计量经济学主要用于研究微观经济学。如h 舒尔兹 在消费理论与市场行为方面的研究;p :道格拉斯对边际生产力的研究;t 丁伯根在 景气循环方面的创建,都为计量经济学开拓了新领域。r 费瑞希以统计学和经济理 论为基础来测度需求弹性、边际生产力以及总体经济安全性更有卓著的贡献。四 十年代至七十年代计量经济学的重点是研究宏观经济。四十年点,经济学家致力 于经济理论的模型与数学化研究,如t 哈威勒莫、a 瓦尔德将统计推论应用于经 济计量学,使计量经济学迈进了新的境界。五十年代h 泰尔给出的二阶段最小二 乘法是对计量经济学的一大贡献。六十年代计量经济学得到了迅速的发展,在这 段时间,学者们发表了有关分布滞后的新处理方法。物理学中的光谱分析也被应 用于计量经济学,同时还解决了有关线性模型存在的一些老问题,并且由于电子 计算机的使用,使大量复杂的计量经济模型得以建立和应用,从而促进了计量经 2 华中科技大学硕士学位论文 济学理论与应用的发展。 最近几十年来,计量经济学的发展又进入了一个新的阶段。学者们一方面仍 继续发展计量经济学的理论部分;另一方面则将它更为广泛地应用于实际经济生 活中,利用计量经济模型从事预测与经济分析。拟订经济计划并提出经济政策。 计量经济模型的发展有两种趋势,正如我国学者张守一教授提出的:“一是模型越 来越大,包括一万或两万以上方程,这种模型结构复杂,更换工作量大;二是建 立模型体系,每个模型不大,但数目多,涉及经济生活的各个方面,通过信息交 流和反馈,可以形成完整的,有机的模型系统,无论经济预测还是政策分析都很 全面,可以在决策中发挥更大的作用。”英国学者亨德利提出了协整理论,使计量 经济学进入了一个新的理论体系。现代对策论、贝叶斯理论在计量经济学中的应 用,是目前计量经济学研究的新课题。 当今计量经济学研究的重大课题大致可以包括以下几方面内容: ( 1 ) 贝叶斯方法的应用。贝叶斯方法是与经典的计量经济学模型的估计方法 相对的一种统计学方法。它的基本思路是,认为要估计的模型参数是服从一定分 布的随机变量,根据经验给出待估参数的先验分布。然后根据这些先验信息,并 与样本信息结合,应用贝叶斯理定理,求出待估参数的后验分布,再应用损失函 数,得出先验分布的一些特征值,并把它们作为待估参数的估计量。 ( 2 ) 对策论的应用。人类社会中每一个利益主体从为增进自身利益、最大限 度地满足自身需要的根本愿望出发,同时又必然要在其他众多的利益主体相互交 往的过程中表现为策略相互依赖,博弈论在经济学上的应用,使得人类对自身的 认识程度提高了一大步,从思想方法、认识观念、研究手段等方面都使经济学发 生了一些根本性转变。 ( 3 ) 统计建模及其灵敏度分析。所谓建立模型,就是根据研究对象的样本观 测值,用经济计量的技术和方法,通过估计模型参数,把要研究的经济问题,用 拟合最好的数学表达式表示出来。对已建立的模型,在具体应用前,必须进行各 种理论检验和灵敏度分析,这是判断经济计量模型是否符合实际的主要手段,也 是构造和应用经济计量模型的重要组成部分。 3 华中科技大学硕士学位论文 本文的研究的主要方向确定为第三方面的内容。 1 2 非参数方法 统计模型是统计学家利用数据分析总体的最基本的工具。然而,统计模型只 是对真实的近似,但模型有优劣之分,如何建立一个好的统计模型是统计学家努 力追求的目标。作为统计学家的工具,回归模型一直受到大家的密切关注。从线 性模型、非线性模型到广义线性模型及非参数模型,都是伴随着计算技术和计算 能力提高的情形下,人们对客观总体的复杂描述提出了更高的要求的背景下,而 迅速发展的研究内容。非参数技术已被证明是极好的探索复杂模型的潜在结构并 减少传统参数模型的模型偏差的工具。可以预见,随着信息技术的突飞猛进,越 来越复杂的“数据挖掘”问题的出现,非参数技术及其应用将是今后几年内非常 富有成果的领域。非参数回归分析的目的之一是减少参数回归模型可能存在的模 型偏差。一个错误的参数模型能产生额外的模型偏差,进而导致错误的结论。非 参数回归模型企图通过拟合一个大的统计模型类来减少这种偏差,并容许数据本 身来决定合适的模型结构,同时提供一些有用的参数建模工具和模型诊断方法。 非参数密度估计和非参数回归估计方法是近2 0 多年来现代统计统计学发展的 一个重要方向,并改变了传统统计学发展的格局,对未知分布的数据模型的处理 以及不完全数据的处理等提供了一种新的统计方法。由于实际经济环境中往往存 在一些不确定的因素,有时不能提供可依赖的模型的参数形式,所构成的模型可 能对实际经济趋势产生误导。所以上世纪八十年代后期以来,已有学者开始把非 参数密度估计的方法引入到计量经济学,并已取得一定的成果。非参数回归估计 引入计量经济学中的一般性工作可参见有关文献u l l a h ,v i n o d ( 1 9 9 3 ) t ”,而对实际曲 线形式无定型( 数据参数未知) 的经济模型,如收入分布、恩格尔曲线的理论和 应用研究、资产价格变动的函数分量估计以及微蕊经济需求理论的实证分析有了 一定的结果,这些研究给新古典经济模型的理论研究和实证分析开创了新的发展 局面。 4 华中科技大学硕士学位论文 本文所讨论的非参数密度估计为核估计。本文较系统地介绍了核估计理论 并利用具体的经济实例与传统参数方法进行比较,显示出非参数方法的优越性。 1 3 转变点分析 近来,人们越来越关注转变点的识别与估计,主要是由于转变点在经济、金 融、医药、心理学等方面有着广泛的应用,甚至渗透到我们的日常生活中。在各 个领域的许多实际问题中,我们都可以看到其影响。 例1 股票市场分析:u s 4 的股票市场记录表明,许多公司的股票价格每天 都在波动。虽然根据经济理论,股票价格波动是正常的,但仍存在一些变动是异 常的,引起投资者的特别关注。在此,我们会产生这样一个问题:1 9 9 0 年伊拉 克对科威特的侵略是否会在u s 一的股票市场中产生显著性变化? 例2 质量控制:在某个连续生产过程中,一般认为产品的质量是稳定的, 然而,由于某种原因,可能会产生不同质量的产品。因此,我们有必要查明,当 产品质量开始下降的过程中,是否会存在一个转变点? 例3 交通事故死亡率:1 9 8 7 年,u j a 的许多高速公路上的限制速度从 5 5 m i k s h o u r 增加到6 5 m i l e s h o u r ,这个速度的提高会引起高速交通中的一些问 题吗? 我们会考虑到,当对5 5 m i l e s h o u r 的限制速度放松后,在交通事故中是否 也会存在一个转变点? 从统计学的观点来看,设x ,x :,x 。是一列相互独立的随机向量( 变量) 序列,其分布函数分别为f 。,f :,f 。一般而言,转变点识别问题就是进行如 下假设检验: h o :f l - f2 = - - f 。 h 1 : f l 一- - f 女f 岛+ l = 一f 2 f r :+ 1 一f t 。f 女,+ 1 一一f 。 ( 1 2 1 ) 其中,l k l k2 k g r l ,q 为未知转变点的数目,k 】,k2 ,k 。为待估的转变点 位置。由此可以看出,转变点识别一般包括两方面内容:( 1 ) 判断序列中是否存在 华中科技大学硕士学位论文 转变点:( 2 ) 估计转变点的数量和位置。 早期的转变点研究要追溯到上个世纪五十年代,在随后的相当长一段时间里, 出版了大量的相关文献,其中,大部分讨论正态独立序列的均值的转变点问题, 及讨论在线性回归和自回归等回归模型中一个转变点问题,主要涉及的方法为似 然比检验、非参数方法及贝叶斯方法,很少涉及到其他模型中的转变点问题。 c h e r ta n dg u p t a ( 2 0 0 0 ) 2 1 则作了这部分的工作,详细讨论了元正态模型及多元 正态模型中关于均值( 向量) 、方差( 协方差矩阵) 及二者结合的情形下的转变点 问题。同时,对回归模型、g a m m a 模型、指数模型及离散模型等也作了相关的讨 论。其中所涉及的方法包括,传统的似然比检验、贝叶斯方法及信息准则方法等。 本文从另一角度分析转变点问题,讨论转变检验点的稳定性;并将转变点分 析方法应用于我国外贸安全的研究中,使其更具理论和实际意义。 6 华中科技大学硕士学位论文 2 1 问题的提出 2 核估计理论 假定有了组关于两变量x 和y 的数据 ( x ,y ) ,i = 1 ,n ) ,如果认为这两个 变量有函数关系y = m ( x ,) + 占,i = 1 ,行,这里s ,可看成是随机干扰。如何去估计 函数m ( 功则是我们的目的。对这种问题,大体上有两种方法。一种是参数方法, 也就是假定该函数的形式是已知的,并且可以写成带参数的形式m ( x ,曰) ,这里口为 仅有的未知量( 可以是向量) 。因此,只要估计出0 的值,问题就解决了。经典的 线性或非线性回归就属于这种方法。参数方法有很多优点,特别是其表达式简单 直观,易于分析,使用方便。但是,世界是复杂的。并不是所有的关系都能用一 个有限的数学式子来表达。在许多情况下,即使弓l 入大量的参数,仍不能改善拟 合的结果。这时,人们可用非参数的方法。在非参数方法中,并不假定也不固定 函数m ( x ) 的形式,也不设置参数,函数在每一点x 的值都由数据决定。显然,如 果把原始数据点作图表示出来,由于随机干扰的存在,数据有很大的摆动,极不 光滑,因此要除去干扰,也就是说,需要使图形光滑。最简单的也是最为人知的 就是所谓三点平均。也就是每一点m f x ) 的值都取离x 最近的三个数据点的相应的 y 值的平均。如果用来平均的点越多,所得的曲线越光滑。当然,如果用所有珂个 数据点来平均,则m ( x ) 为常数,虽然这时i 最光滑,但失去了数据中除均值之外 的所有信息,拟合的残差也大。所以说,不仅要除去尽可能多的干扰,还要防止 在除去干扰时把有用的信息也丢掉。可以看出,即使决定了用多少数据进行平均, 也存在如何平均的问题,也就是说,要决定每个数据点在估计m ( x ) 的值时应起何 种作用的问题。显然并不是每个点的作用都应该一样。直观上,和x 点越近的数据 华中科技大学硕士学位论文 对决定m ( x ) 的值应起越大的作用,这就需要加权平均。因此,如何加权( 或如何 选择权函数) 来光滑及光滑到什么程度则成为这个领域的中心问题。下面所讨论 的方法就是光滑法,主要介绍一种密度估计核估计。 2 2 核估计定义 最简单而常用的密度估计方法是直方图方法。这个方法可以追溯到十七世纪, 然而直到十九世纪中叶以前,密度估计问题在统计文献中没有占据什么地位。理 由很简单:在很长一个时期,人们习惯于对总体分布加上正态或其他特定的假定, 因而不感到有将密度估计作为独立问题研究的必要。密度估计的非参数方法的重 要进展始于r o s e n b l a t t ( 1 9 5 6 ) 1 3 1 的工作和p a r z e n ( 1 9 6 2 ) 1 4 1 的工作。他们提出并 研究了一类很重要的密度估计一核估计。从那时以来,有不少学者追随了这个发 展方向的工作。 核估计方法并非建立在某种艰深的概念或数学工具的基础上,而不过是古老 的直方图方法的自然发展。在引进核估计定义之前,首先回忆一下直方图的作法: 它是用点 a 一, q 把全线段分为若干连接的小区间h ,a 。) 。在每个 这样的小区间内,总体概率的估计值为:# ( :l 蔓,s 强4 , - x , 疗。) ) n 。此处# ( 国 表集a 所包含的元素个数,然后以# ( ( ,:l s j 口s x , 0 为任意的,我们可以将积分区间分为两个部分: y :i y 障四和 y :l y i o 均成立,且g 在x 点处连续,上述表达式可任意小。 综合上述,即可证明。 推论2 4 l 令为核估计量,满足核函数足( ) 有界,且j i my k ( j ,) :o 如果 ! 鳃( x ) = o ,则对于厂在一切连续点x ,z 为渐近无偏估计量 证明:将定理2 1 。5 运用到公式( 2 1 5 ) 中即可 上述推论,对 ( 曩,) 。 收敛于0 的速度没有限制,而下面所述结论则表明,如果 ( 巩) 。” 收敛于0 的速度慢于o 一1 ) ,则 :( f :m s e 收敛于0 的意义下是相合的 推论2 4 2 令z ,为核估计量,满足核函数五( ) 有界,且l i m y k ( y ) :0 如果 ! i r a 。吃( x ) = o ,且x 为未知密度厂的一连续点,则有 舰帆哳z ( z ) = 厂( z ) 彤2 ( y ) a y( 2 4 _ 1 ) 证明:( 1 ) 若将定理2 4 1 的条件:核函数世0 ,r :k ( y ) d y :1 ,放松为: i 。l 芷( _ y ) 1 方 o d ,根掘上述方法仍可以得到类似的结论: 一 1 3 华中科技大学硕士1 学位论文 l i r a g 。( x ) = g ( z ) 世( y ) 咖 ( 2 ) 由于世( ) 有界,则k 2 同样满足定理2 4 1 中的条件,由于 嘁( 。赤e 职等抛妒壶 足掣胁川2 帆嗽2 古矾寻抛妒古 e 足( 詈纠 再结合( 1 ) 的结论,即可证明 推论2 4 3 令工为核估计量,满足核函数k ( ) 有界,且l i m y x ( y ) = 0 如果 l v l ! i m h 一( x ) = o ,! 受n h 。( x ) = 。,且x 为未知密度厂的一连续点,则有 ! i m 旌e ( 工) = 0 证明:由推论2 4 2 可知,l i m 惭( ,( x ) ) = 0 ,则由 m s e 。( 夕) = 时( x ) + ( 谚( x ) 一,( x ) ) :,结合推论2 4 1 ,即可证明结论成立 虽然上述定理指出了估计的渐近性质,但在实际应用中并非完全有效,因此 下面我们将用t a y l o r 展开重新提炼 定理2 4 2 令z 为核估计量,其核函数置( ) 有界且对称,d t 3l 置( f ) 西存在且 有限,如果未知密度,存在有界的三阶导数,则有 e l “( x ) = 厂( x ) + 寻霹厂”( 石) e t 2 k ( t ) d t + 。( :) ,心斗0= 厂( x ) + 霹厂”( 石) f :+ d ( :) ,心斗 w r o ( x ) 5 n - 杀f ( 工) k 2 ( ,) 出+ 。去) ,斗。a n d ,z 吃斗。 ( 2 4 2 ) ( 2 4 ,3 ) 慨( 扯n - 去f ( x ) 弘2 硪丢w ”e 衄科+ 0 ( 寺+ o ( 哟 h ,oo ,a n dn h , ,斗( 2 4 4 ) 证明:由公式( 2 3 1 ) 作相应的变换,偏差可以写作如下形式 一 1 4 华中科技大学硕士学位论文 e z ( x ) 一厂( x ) = k ( ) o t h ) 一f ( t ) d t 由剩余项为l a g r a n g e 形式的t a y l o r 定理可知, m 训_ ,( 沪蚶+ 学尸一等八旬 其中考依赖于x ,t 和丸,且满足i x 一手f i t h 1 由于f 。k ( t ) d t = l 可推出 e 抽_ ,( 加酬哦八咖譬脾) _ 等,( 锄出 由于k ( ) 的对称性,有 e 抽川加酬譬广一譬八鳓西 若m 定义为厂”的上界,则有 l e z ( z ) 一厂( x ) 一i 1 2 厂”( x ) f 2 足( r ) 田l 鲁垆世( r ) 厂( 善) l 出m 鲁伊置( 驯办 结合定理条件,当h 。一0 时,( 2 4 2 ) 式显然成立。 由推论2 4 2 即可得出方差的渐近展开,而m s e 的渐近展开由( 2 4 2 ) ( 2 4 3 ) 式也很容易得到。 这些表达式表明,用渐近表达式比前述的具体表达式更易于解释,例如,我 们很容易看出,当h 。变小时,偏差变小,当变大时,方差变大。显然,方差项太 大,意味若不光滑,偏差项太大,则意味着过于光滑。我们要选择一个最优窗宽,使二 者达到平衡。 定理2 4 2 对于我们获得最优窗宽的选择是至关重要的,如果假定广为均 方可积,则由( 2 4 4 ) 可得下式:当吃一0 ,n h 斗。时: 华中科技大学硕士学位论文 m i s e ,( f , i ) - 去肛2 ( f ) 础+ 丢碟( 广) ( 蛐( e m 新+ 0 ( 去) + 0 ( 碟) ( 2 4 5 ) 表 达式面1 肛+ 1 怖) 出( ,2 k ( 啊 ( 2 被称为渐近m i s e ,常简称为a m i s e 注意到( 2 4 6 ) 式比( 2 3 6 ) 式更容易理解 下面我们来看看通过最小化m i s e 来平衡平方偏差和方差之间的关系而得到 lk ( f ) 硪 ! 对h 的选择:厅m 2 二n ( f 竺二一5 2 4 7 式( 2 4 ,7 ) 有一个很大的缺点,就是它依赖于e u ”) 2 ( x ) 出,而其是未知的,然 而,存在一些很好的方法来对这个量进行估计。详见参考文献 s i l v e r m a n ( 1 9 8 6 ) t 7 1 ,w a n da n dj o n e s ( 1 9 9 5 ) 吼 2 5 一个修正的核估计量 在非参数估计中,核估计方法已经成为非参数估计的主流。但这种核估计在 应用中有一个缺陷,当样本大小稍作改动,需重新计算估计量,因此,我们引进 新的估计量 加,= 去喜击k c 竿, 眩s - , 其中 囊) 是一串正数。由式( 2 5 1 ) 可得 五加斋五+ 熹六五c 等, 眨s 因此基于x 。,x :,z 。,x 的估计,可以通过x l ,x 2 ,x 。的估计递推得到,利 用计算机进行重复计算。但在处理式( 2 5 1 ) 时理论上有一个困难之处是其右端 华中科技大学硕士学位论文 不是独立同分布的随机变量之和,下面主要讨论z ( 工) 的相合性及区间估计。 2 5 1 核估计的数字特征 1 ) 无偏性:五( z ) 是渐近无偏的。 由于 置) 的独立同分布,则 或( 护去喜耻水_ ) 】 去喜弘( s ) ,。+ 噍s ) 凼 去喜甄 一) ,( ) 咖 如果啊一0 则得礞( x ) _ 厂( x ) 弘o ) d s = ,( z ) 更进一步讨论z ( x ) 的偏差,为此假设厂c 2 ( 二阶连续可微) ,由泰勒展开得 胍眈( 圳= 吉喜肛,( x + s h ,肛m ) 去喜酬m m 帕) + 孚+ 0 ( 蜘出叫x ) f ( x ) + 芬1 台n _ 2 朋咖:( m 吉喜州h ( x ) 注意因为k 关于0 点对称,则 s k ( s ) h i ( x ) a s = o 。最后得 b 沁 z ( 瑚= 磊1 。白n 一2 ) 厂舡) z ( k ) + 去善。( ? ) 其中:( k ) 是k 的2 阶原点矩。如果要减少偏差,可选取较小h 2 ) 离散性 胁( z ( z ) ) n - 2 v a r ( y ”, k o x 。) ) :”一:( 主妇,k ( x x ,) ) ,一l ,一l ( 2 5 3 ) 7 华中科技大学硕士学位论文 = 一2 e 【甄2 ( x - x 朋一( e l k ( x x ,) 】) 2 = i = 一2 主 j k 2 ( 三) m ) 幽一( 厂( 曲+ 。( ,) ) 2 ) l io :”一z 宝 j - li k 2 ( j ) 厂( x + s h ) d s 一( ,( x ) + 。( ,) ) 2 ) ,。l = ”一2 i i 酬;( ,( x ) o ( ,) ) 一( ,( x ) + o ( 。) ) 2 j | l n = n 。酽| | k 1 12 2 f ( x ) + 。( n 。2 厅一) t = l# i 且n 。2 酊1 0 ( 2 5 4 ) 从上面讨论看出,无偏性时取 ,小。稳定时则希望 大。在兼顾偏差性( 有 偏或无偏) 与离散性( t y 差n * d 、) 的原则下来建立估计量为“最优”的准则 为此引入相合性计算,估计量的均方误差( m e a ns q u a r ee r r o r ) m s e 。 锄 z ( z ) 】= e 允( x ) 一,( x ) 2 = e 【五( x ) 一谚,+ l 宄( x ) 一,( x ) 】2 = 脚眈( 万) + 豌( x ) 一,( 工) 】2 以( f ) 厂( x ) i i k i i ; n 。( 喜) 厂( 驯ik 悒+ 嘉( 喜砰) 2 ( 广( 功:( 臣) ) 2 + 。( 一。喜町1 ) + 。( 砰) h ,斗0 , 1 1 - 2 町斗0 = i ( 2 5 5 ) 由上面的讨l , z 1 4 下面的定理 定理2 s 1 【”】k ( x ) 为核估计,满足前述条件,户,( 石) = 去喜去足( 兰亭) ,曩满足 n 一2 ( 窆 一) 斗。对应的z ( z ) 是相合的,即户( x ) 乌,( x ) 华中科技大学硕士学位论文 2 5 2 最优窗宽 前面指出a ( x ) 由两个参数啊和k ( x ) 决定,现在来求啊取何值时m s e 达到最 小,i n h = 哗m s e d ( z ) 蛾( 加去m ) 1 1k 1 1 i + 了h 4 ( 广( x ) 段( 枷2 十0 ( 蚴“+ 口( 4 ) “( 1 c + 去矗4 c : 一。,砌斗o( 2 5 6 ) 式

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论