(应用数学专业论文)长程相依下函数型数据的稳健估计探讨.pdf_第1页
(应用数学专业论文)长程相依下函数型数据的稳健估计探讨.pdf_第2页
(应用数学专业论文)长程相依下函数型数据的稳健估计探讨.pdf_第3页
(应用数学专业论文)长程相依下函数型数据的稳健估计探讨.pdf_第4页
(应用数学专业论文)长程相依下函数型数据的稳健估计探讨.pdf_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

长程相依下函数型数据的稳健估计探讨 摘要 函数型数据,是以函数为表现形式的一种数据,它最大的特点就是数据具 有函数性。在目前的数据分析和处理过程中,如果观测的时间点十分紧密时, 这些数据在数据空间中就会呈现出一种函数性的特征。正因如此,函数型数据 广泛应用于犯罪学,经济学,考古学,和神经生理学等,也致使今天有更多的 学者投身到函数型数据邻域的研究中。非参数估计是数理统计学的一个重要分 支,对统计模型要求很宽,能利用数据的一般信息,其方法适用面广,有较好 的稳健性和良好的大样本性质,而核估计方法是非参数回归估计的核心,可它 对于异常值相当的敏感,不具备一定的抗干扰性,稳健估计正是为了解决传统 核估计抗干扰性差而提出的。弱相依过程虽然能广泛的应用,却不能包含所有 的平稳型数据,而长程相依过程在时间序列邻域有其广泛的应用价值,因此这 篇文章探讨长城相依下的函数型数据的稳健估计具有一定的现实意义。 本文所做的工作主要有两部分构成,第一部分,主要介绍了在长记忆的条 件下,探讨回归函数的非参数m 估计,得到了其依概率收敛的结果,以及依概 率收敛的速度;第二部分,主要探讨分布函数的非参数m 估计,同样也得到了 依概率收敛的结果,以及相应速度。 关键词:长程相依;函数型数据:稳健核估计;m 一估计: 4 i n v e s t i g a t i n gi nr o b u s te s t i m a t ef o rl o n g d e p e n d e n t f u n c t i o n a ld a t a f u n c t i o n a ld a t ai saf u n c t i o nf o r mo ft h ed a t a i t sg r e a t e s tf e a t u r ei saf u n c t i o no f t h ed a t a i nt h ec u r r e n td a t aa n a l y s i sa n dp r o c e s s i n g ,i ft h eo b s e r v a t i o np o i n ti nt i m e w h e nv e r yc l o s e ,t h ed a t aw i l lb ep r e s e n t e di nt h ed a t as p a c e ,ak i n do ff u n c t i o n a l c h a r a c t e r i s t i c s f o rt h i sr e a s o n ,t h ef u n c t i o n a ld a t ai sw i d e l yu s e di nc r i m i n o l o g y , e c o n o m i c s ,a r c h e o l o g y ,a n dn e u r o p h y s i o l o g y ,e t c ,h a sl e dm o r es c h o l a r st oj o i n t o d a yt ot h ef u n c t i o n a ld a t ai nt h ef i e l do fs t u d y n o n p a r a m e t r i ce s t i m a t i o ni sa n i m p o r t a n tm a t h e m a t i c a lb r a n c ho fs t a t i s t i c s ,t h es t a t i s t i c a lm o d e lr e q u i r e sab r o a d , c a nu s et h eg e n e r a li n f o r m a t i o no fd a t a t h em e t h o di ss u i t a b l ef o raw i d er a n g e , g o o ds t a b i l i t ya n dg o o dl a r g es a m p l ep r o p e r t i e s w h i l et h em e t h o do fk e r n e l e s t i m a t i o ni st h ec o r eo ft h er e g r e s s i o no fn o n p a r a m e t r i ce s t i m a t i o n ,i tc a nv e r y s e n s i t i v et oo u t l i e r s ,d o e sn o th a v eac e r t a i nd e g r e eo fi n t e r f e r e n c ei m m u n i t y r o b u s te s t i m a t i o ni st os o l v et h et r a d i t i o n a lk e r n e le s t i m a t o rp r o p o s e db yp o o r a n t i i n t e r f e r e n c e w e a k l yd e p e n d e n tp r o c e s st h a tc a nb ew i d e l yu s e d ,b u tm a yn o t c o n t a i na l lo ft h es t a t i o n a r yd a t a ,a n dt h e s eo c c a s i o n so fl o n g r a n g ed e p e n d e n th a v e t h e i rw i d ea p p l i c a t i o n si nt i m es e r i e s ,s ot h i sa r t i c l ei n v e s t i g a t i n gi nr o b u s te s t i m a t e f o rl o n g - d e p e n d e n tf u n c t i o n a lh a sap r a c t i c a ls i g n i f i c a n c e t h i sw o r kh a st w op a r t s ,f i r s tp a r ti n t r o d u c e st h el o n gm e m o r yo ft h ec o n d i t i o n s o ft h en o n p a r a m e t r i cr e g r e s s i o nf u n c t i o nm - e s t i m a t i o n ,h a sb e e nt h er e s u l to fi t s c o n v e r g e n c ei np r o b a b i l i t y ,a n dt h es p e e do fc o n v e r g e n c ei np r o b a b i l i t y ;t h e s e c o n dp a r tf o c u s e so nt h ed i s t r i b u t i o nf u n c t i o no ft h en o n - p a r a m e t r i cm e s t i m a t i o n , a sh a sa l s ob e e nt h er e s u l to fc o n v e r g e n c ei np r o b a b i l i t y ,a n dt h ec o r r e s p o n d i n g s p e e d k e y w o r d s :l o n g - d e p e n d e n t ;f u n c t i o n a ld a t a ;r o b u s te s t i m a t e ;m e s t i m a t e 5 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得 金月曼王些太堂 或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究 所做的任何贡献均已在论文中作了明确的说明并表示谢意。 躲蜘可 唰月愿目 学位论文版权使用授权书 本学位论文作者完全了解金目墨王些太堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被 查阅和借阅。本人授权金g 垦王些太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位 论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:考象婀 签字日期:刃d 年砷月) g 日 学位论文作者毕业后去向: 工作单位: 通讯地址: 跏虢和强 签字日期:湖。年月哆伺7 电话: 邮编: 致谢 首先,感谢合肥工业大学数学学院为我提供了难得的学习机会和良好的学 习、生活环境。这篇毕业论文是在我的导师凌能祥教授的支持、鼓励和精心指 导下完成的。在我研究生三年的学习中,凌老师严谨的治学态度、深厚的学术 造诣,平易近人的崇高品质,对我产生了深刻影响,导师三年对我的教诲使我 受益终生。 其次,我要向读研期间教授我知识的杜雪樵教授,惠军教授等表示深深的 谢意,是你们谆谆教导和辛勤培育使我顺利完成硕士阶段的学习。 感谢合肥工业大学0 7 级数学学院的所有同学的帮助,你们使我进步,和你 们一起度过的三年美好时光我永远不能忘怀。特别要感谢程伟,赵云云,臧智 军同学对我文章的帮助,给了我很多建设性的建议。 感谢我的家人,你们无私地给予了我物质的资助和精神的鼓励。 最后,感谢并祝福所有给予我帮助关怀的人! 作者:朱东河 2 0 10 年3 月2 0 日 6 第一章绪论 本章作为全文的开篇,将对函数型数据近年来的发展以及本论文所研究的 内容作一个简明而直观的介绍。 1 1 本文背景 随着现代化仪器和设备的使用,我们观察到的几乎是连续的函数曲线,直 观上称之为函数型数据在医学、经济学、生物学、气象学等邻域有广泛应用 最近十年来,随着计算机的快速发展,在经济、金融、生物、医学、气象、环 境等邻域,我们能发现大量密集的资料,常常称之为函数型数据。例如以前我 们只能获得间隔每天的数据,而如今能够捕捉间隔每秒甚至时间更短的数据, 虽然我们还是不能看到连续的数据,就像我们也看不到正态的随机变量,但是 如果我们把数据假设为时间的函数,这就是我们要研究的函数型数据。如何理 解函数型数据x 具有真正的函数形式呢? 这并不是说在每个观测点上都要有记 录值,那显然是不可能的。而且说,我们假设数据的产生过程是一个连续过程, 这样在理论上我们可估计任意f 上的函数值x ( t 1 及其各界导数值。实际操作中 我们只可能获得离散型的数据记录,且观测到的数据大多带有噪声成分。因此 要将观测到的离散的样本点进行函数拟合。常用的拟合方法是平滑法和插值 法。如果观测到的离散值是精确值,没有观测误差,就用插值拟合;如果观测 到的离散值具有观测误差,且需要消除这些观测误差,那么就用平滑的方法来 拟合。通常我们观测到的数据大多是有观测误差的,所以一般用平滑法。具体 定义为:取值于无限维空间的函数型随机变量丁的观测值r 称为函数型数据,记 为f = t ( s ) :s s 特别地若scr ,则观测值f ( s ) 为一条随机曲线,可表示为一条 函数曲线加上随机噪声。从而要求我们建立新的统计推断方法,从新的角度建 立新的理论。关于函数型数据的详细背景及前期研究工作,见r a m s y & s i l v e r m a n ( 2 0 0 2 ) 【i 】的专著。那么到底什么是函数型数据呢,下面看两个实际 的例子: 例1 ( 计量化学曲线,f e r r a t y v i e u ,2 0 0 6 【2 】)对物质化学成份的分析, 谱是一个有用的工具下图是1 5 个随机选择的肉块,其波长在8 5 0 1 0 5 0 n m 的吸 收光谱曲线,显示在食品红外分析仪上把离散化的点连续化,得到谱曲线,可 以看作是吸收谱对波长的函数 从图中可以看出,谱曲线比较光滑, 很多的实例可参见f e r r a t y & v i e u ,2 0 0 6 , 动了数学的发展。 图形相似,如有明显的垂直改变还有 这里就不一一例举了,总之科技也带 例2 ( 身高曲线,r a m s a y & s i l v e r m a n ,2 0 0 6 ) 下图提供了研究中涉及的数据 原型,图中显示了1 0 个女孩从出生至l8 岁在不同生长时期所测得的升高。 身 高 厘 米 v r 一 年龄( 年) 从图中可以看到,测量的间隔时间不等:当孩子一岁时有4 次测量;2 岁到8 岁 时,每年测量一次;接下来每年测量2 次,每个小孩对应3 1 个离散点,反映了其身 高的变化情况,称之为身高函数用一条光滑曲线拟合。于是获得了1 0 个身高函数 e ( f ) ,i = 1 ,2 ,1 0 ,构成了所需的样本曲线,对这些数据,虽然曲线之间的变化不甚 蛆嘶果研究期速变化的黼黔即) = 帮 变 化 蛊 2 因此,曲线与曲线之间的细微差别可由其身高函数日( f ) 的( 高阶) 导数变化反 映这样,我们需要有函数曲线的记录而不记录一些离散点。 1 2函数型数据的发展现状 函数型数据的概念首先由加拿大学者r a m s a y 3 】于1 9 8 2 年提出的,他提出 在现代的精密仪器下收集到的数据,不能再看成静止的数据,而是一些动态的 数据,于是他在文献中提出了函数型数据的概念,并指出用传统的数据分析方 法会带来信息丢失或者模型失真等问题,因此扩展传统的数据分析方法十分必 要。于是在1 9 9 7 年他和s l i v e r m a n 总结了函数型数据分析的理论和方法,出 版了专门研究函数型数据的著作f u n c t i o nd a t aa n a l y s is 4 1 ,书中全面阐 述了函数型数据的基本特征以及参数统计分析思想,极大的推动了函数型数据 分析的发展。 基于r a m s a y 的工作,f e r r a t y & v i e u ( 2 0 0 4 ) 5 1 提出了基于函数型数据的 非参数统计方法。众所周知,非参数统计是数理统计学的一个重要分支,对统 计模型要求很宽,能利用数据的一般信息,其方法适用面广,有较好的稳健性 和良好的大样本性质,因此,近二三十年来,国内外非参数统计方向发展很快, 提出了许多新方法:如秩方法、u 统计量法、密度估计方法、非参数回归估计 中的核估计、最近邻估计、分割估计、局部多项式估计、样条和小波估计等。 在2 0 0 6 年,他们又出版了n o n p a r a m e t r icf u n c t i o n a l d a t aa n a l y s is 一 书,在非参数统计邻域中,对函数型数据进行了全面的分析研究,并获得了在 独立同分布场合下回归函数、分布函数、密度函数、条件分位数、条件中位数 的几乎完全收敛的结果,以及它们相应的收敛速度,并在此基础上研究了它们 在o f 混合条件下的情况,同样获得了几乎完全收敛的结果以及它们相应的收敛 速度。 核估计方法是非参数回归估计的核心,由于核估计可以看成局部最小二乘 估计,但最小二乘估计法对异常值相当敏感,不具备一定的抗干扰性。稳健核 估计正是为了解决传统核估计抗误差干扰性提出的。稳健性的概念萌芽于上世 纪初,但其发展则主要是上世纪五十年代后期以来,经过t u k e y ,h u b e r ,h a m p e l 等一批学者的工作,h u b e r 在19 8 1 年出版了这方面的专著【6 j 。a z z e d i n e 和 o u l d - s a i d ( 2 0 0 8 ) 【7 】运用稳健的方法,基于独立同分布函数型样本下,获得了 非参数回归函数稳健核估计的几乎完全的收敛速度。c h e nj i a 和z h a n gl i x i n ( 2 0 0 9 ) 【9 】在倪混合条件下,研究了非参数回归的m 估计,并获得了依概率收 敛的结果和几乎处处收敛的结果以及渐近正态性。 长记忆结构第一次有m a n d e l b r o t 和v a nn e s s 为分数布朗运动而提出 的,h i d a l g o 1 0 】为经济模型写的和t r u c o o t e 1 1j 为环境或气候研究写的文章对长 记忆在连续时间上的应用做了更详细的讨论。e s t e v e z 和v ie u 1 2 j 就研究了在 有限维的长记忆函数型数据模型下的分布函数,密度函数及风险函数的估计问 题,并得到了它们的依概率收敛的结果以及相应的收敛速度。b e n h e n n i 和 h e d l i g r i c h e ( 2 0 0 7 ) 1 3 1 研究了在长记忆场合下函数型数据的非参数回归估计, 获得了依概率收敛和依概率一致收敛的结果。 本文基于前面的介绍,致力于研究长记忆场合下,函数型数据回归函数的 非参数m 估计和分布函数的非参数m 估计。 1 3 本文结构 本学位论文所做的工作有五个部分:第一,介绍函数型数据的发展背景以 及发展现状;第二,基础知识及概念的介绍;第三,在长记忆过程的条件下, 研究函数型回归算子的非参数m 一估计,并得到了依概率有界的结果;第四,在 长记忆和一定的条件下,研究条件累积分布函数的非参数m 一估计,并得到了依 概率有界的结果。第五,对已完成工作的总结以及对未来工作的设想。 4 第二章预备知识 2 1 函数型数据相关概念 2 1 1 函数型变量和函数型数据 若随机变量x 取值于一个无限维空间( 函数空间) ,称x 为一函数型变量; x 的观测值x 称之为函数型数据( f u n c t i o n a ld a t a ) 。 有时记:x = x ( t ,缈) ,tcr ;墨,x 2 ,艺 相应的观测值:x = x ( t ,c o ) ,t tcr ; 当f tcr 2 时,x = x ( t ,国) 表示一随机曲面。 与x 同分布的n 个函数型随机变量五,置,以的观测值_ ,x 2 ,称之为 函数型数据集( f u n c t i o n a ld a t a s e t ) 。 2 1 2 函数型数据所在的空间 我们知道,函数型数据取值的无限维空间日越大,数据越分散。其实,分 散性的大小与数据之间接近的度量方法有密切的关系。为此,在函数型数据所 在的空间日中,我们引入半度量。 定义:设,为一无限维空间,d :h xh 一只,满足: 1 d ( x ,y ) o ,d ( x ,x ) = 0 ,v x h ,y 日; 2 d ( x ,y ) = d ( y ,x ) ; 3 v x ,y ,z 日,d ( x ,y ) d ( x ,z ) + d ( z ,y ) 称d 为h 上的半度量函数;( h ,d ) 为半度量空间。 当d ( x ,y ) = 0 ,得出x = y ,称( 日,d ) 为度量空间。 2 1 3 长程相依 长程相依平稳过程的定义 在经典的长记忆结构定义中,设 z ) 洲为弱平稳时间序列,假设置有有限方差, 样本均值j = ( 1 ”) :,置的方差满足: 断( 元) - v a r ( z 一, :l x i ) = 专c 疗:。砌“五c o v ( 置,一) j = 吉二v a r x , + 三1 2y 二- , t 舻i = 1 1 f ,玎一f ) c d v ( k ,置) = 吉汐( 。) + 吾:( 一吉) t 9 ( z ) , 其中s ( o ) = v a r x o ,而s ( o = c o v ( x o ,z ) ,f n ,若a ( i ) - c i 吖时,其中 ,【o ,l 】,c 为正常数,则称 置) 删为长记忆过程。 也有些学者把x l a ( o i = 称为长记忆平稳过程。 由于我们研究的( z ,z ) 是取值于h xr 的随机序列,其中h 是有半度量d 的无限 维函数空间,很难直接定义类似于有限维场合下的长记忆过程,于是我们引入 对任意b o r e l 可测函数f ( x ,y ) ,若 z ,( f ) - - c o y ( 厂( 五,z ) ,厂( ,) ) 只与r 圭j - i :f f 关,且有 z ,( f ) = o 。, f = - o o 称 ( z ,巧) ) 为长记忆过程。 喜k ( 掣) z “力2 蒋 y k ( 型) 厶一、z 7 6 合下,获得了估计量的渐近特性,并且给出了在曲线识别、时间序列预测等方 面的应用;m a s r y ( 2 0 0 5 ) u 4 1 在f e r r a t y v i e u ( 2 0 0 4 ) 的基础上,在较高阶矩 存在的条件下,获得了基于相依函数型数据回归函数非参数n - w 型核估计量的 渐近分布。 2 1 5 核函数k 的定义以及小球概率。 定义:在r 上的函数k ,取值在r + 上,且e k = i 在紧集 - 1 ,1 】上,v u ( 0 ,1 ) , k ( u ) 0 ,则称此时的k 为0 型核函数。 取x 。,x :,咒是玎个取值在空间日上的函数型随机变量。x 为空间日上的 固定元素。将x 。,x :,鼍这拧个函数型随机变量利用多元核局部加权的思想拓 展为以下玎个量: 瓦1 川k ( 蚴h ) y ) 7 这里的d 是空间h 上的半度量,k 是核函数,y ( 办) 表示b ( x ,h ) 的体积 b ( x ,h ) = t ,d ( x ,一) h ) 是一个以x 为中心,h 为半径的球。 根据函数型随机变量概率分布将函数型核局部加权变量定义为: 姒加意溉赫 将局部加权和小球概率的概念联系起来。取x 为取值在半度量函数空间日上的 函数型随机变量( 厂 1 ,) ,x 是日上的固定元素,则有 e ( 1 f o ,l l ( 竿) ) = e ( 1 即瓜删叫x 叫啪) ) 当”取值非常大的时候,h 是趋于0 的,b ( x ,h ) 可以被看成是小球而p ( x b ( x ,办) ) 可以看做是小球概率,对所有的x h 和正实数h 有 纯( 办) = p ( x b ( x ,办) ) 2 2 随机变量列的相关定义 2 2 1 几乎完全收敛及速度 定义:如果 v s o ,p ( 1 x - x l 占) 0 ,尸( i x 。一x i s 。“。) o ,1 i m 尸( i 鼍- x l g ) = o i- - + o o 、。 称( e ) ,。依概率收敛于x 。记:骢以= x 依概率。 定义:如果数列 以,n 1 ) l i m 。l i m 。s u pp ( i x 。l m ) = 0 mn 呻呻 。 ”l 咒,聆1 ) 概率有界( 一致紧) ,记托= q ( 1 ) 。 于是益u n = q ( 1 ) 表示以速度依概率有界,记为k = q ( ) 。 8 第三章长记忆下函数型数据非参数回归的m 一估计 3 1 引言 函数型数据广泛应用于犯罪学、经济学、考古学和神经生理学等,于是今 天有更多的学者投身到函数型数据邻域的研究。因此这篇文章选择函数型数据 来研究既适应了潮流又有其现实意义。函数型数据在长程相依场合下的文章, 在国内并不多,而长程相依场合在时间序列邻域有其广泛的应用价值,如经济 学,金融学,环境和气候学等。于是这篇文章能为函数型数据能在时间序列邻 域的应用提供一定的理论依据。 长记忆结构第一次有m a n d e l b r o t 和v a nn e s s 为分数布朗运动而提出 的,h i d a l g o 为经济模型写的和t r u c o o t e 为环境或气候研究写的文章对长记忆 在连续时间上的应用做了更详细的讨论。然而,稳健估计首次由h u b e r 写的“局 部参数的稳健估计一文中提出,并给出了经典的m 估计。 e s t e v e z 和v i e u 就研究了有限维函数型数据在长记忆下的分布函数,密度 函数及风险函数的估计问题,并得到了它们的依概率收敛以及收敛速度。还有 f e r r a t y 和v i e u 考虑了在一些强混合条件下非参数回归函数的估计问题,也得 到了函数型数据核估计的收敛速度。在他们的2 0 0 6 年出的非参数函数型数据 分析一书中,给出了函数型数据在独立和o f 混合条件下的几乎完全收敛以及 相应的收敛速度。当然还有其它人做的贡献,如程佳写的口混合条件下函数型 数据的m 估计,并得到了m 估计的依概率收敛和几乎处处收敛及渐近正态的 结果。 3 2 模型和假设 ( x ,y ) 是h x r 中的随机矢量且e l f l 2 时我们有e l f ( r , 一s 1 7 。如果记 g 。( z ,s ) :e l y ( k s ) 1 2ix i :z j g :( z ,s ) = e l 化一s ) | 7l 五= z j 其中g l ( z ,s ) ,g :( z ,s ) 在x 的邻域内连续,z 在x 的邻域内,并且有 m 觚扛眇g 。+ 扰) 一b ) ) 2i 墨:z j e 眇g + “) 一g 。) ) r ix i = z j 如) 其中五0 ) 在甜= 0 点连续,且如( o ) = 0 。 ( i i i ) s 在m ( x ) 的邻域内有,对于任意的常数c ,都有 4 n c p ( h 3 l s m g ) i c 3 。 h 5 存在一些常数0 g ) 掣_ o 1 3 ( 3 8 ) ( 3 9 ) ( 3 1 0 ) ( 3 1 1 ) ( 3 1 2 ) ( 3 1 3 ) ( 3 1 4 ) 由此利用( 3 4 ) 和( 3 1 4 ) 完成了( 3 2 ) 的证明,于是也就完成了整个定理的 证明。 定理3 2 :在上述模型( 3 1 ) 下,满足条件h 1 h 6 ,有 枷) 讪m b 南 证明:首先 。蝎啪脚h 硼1 = d ( 赢 另一方面 ,z ( c 4 h p + c 3 m 脚= 南+ 巳南 2 f h p1 1 2c 4 丽托3 丽j ( 3 1 5 ) = ( c 4 簖+ 巳南 2 2 r 丽蚂了丽j 再利用条件h 3 的( i ) 和h 5 ( i i ) 得到 刀( c 4 h p + c 3 m 州一。 帅( c 4 h p + c 3 啪脚b ( 碉1 ) = d ( 吉) ( 3 1 7 ) ( 3 1 8 ) 在( 3 1 3 ) 和( 3 1 5 ) 、( 3 1 8 ) 下有 e ) 一魄:如妒 = 嘶s ) 南+ c 2 ) 去+ 。睁碉1 简单的应用马尔科夫不等式就得到 ) 一畹:b ) | = o ,( _ + 1 丽1 最后利用y ( - ) 的单调连续性就完成了定理3 2 。 3 4 小结 本文在长记忆的条件下,获得了函数型数据非参数回归函数的m 一估计, 以及证明依概率收敛的结果,并获得相应的收敛速度,这对现有文献中在有限 维长记忆场合下回归函数的非参数估计的一个扩展,也是献 9 中在口一混合下获 得函数型数据非参数回归函数的m 估计及依概率收敛的补充。 文章对于无限维场合长记忆的定义,有一定的理论意义,对未来研究函数 型数据在长记忆场合下的各种估计也是一个很好的借鉴。 第四章长记忆下函数型数据分布函数的非参数m 估计 本章主要介绍累计分布函数的m 估计,求出依概率收敛的结果,这是上一 章内容的继续,也为以后研究中位数的m 估计,条件分位数的m 估计,条件 众数的m 估计提供思路。本章分一下三个部分:第一部分,建立分布函数非参 数m 估计的模型;第二部分,提供一些假设条件;第三部分,给出依概率收敛 的结果和收敛速度以及相应的证明。 4 1 模型的建立 在( f e r r a t y & v i e u2 0 0 6 ) 中是这样建立分布函数的非参数估计的: 对条件累积分布函数的估计。设估计量黟是条件累积分布函数矽的估计,首 先解释下怎样用核回归估计构建估计量。显然,矽( x ,y ) = p ( y y lx = x ) 可以 用它的条件期望来表达, ( x ,y ) = e ( 1 ( 。川( 】,) ix = x ) 通过对比函数型回归内容,一个原条件累积分布核函数估计可以定义如下: k ( h 。1 d ( x ,置) ) 1 ( w 】( ) 形( x ,y ) = 型了一 k ( h d ( x ,墨) ) 取为一般的对称核函数。定义圩函数为: v , u r , 日( ) = 厂r o ( v ) d v d - o o 这样就可以将条件累积分布核函数估计定义如下: k ( h d ( x ,置) ) h ( g 。1 ( y - y j ) ) 舻( x ,少) = 旦下一 k ( h d ( x ,z ) ) 这里的g 是一个依赖于,z 的严格增实数列。取为0 型核函数即 在r 上的函数k ,取值在r + 上,且e 足= 1 在紧集【_ 7 1 上,v u ( o ,1 ) ,k ( “) o , 这样,就是一个累积分布函数,而h ( g 一( 少一z ) ) 就是一个局部加权, - l ,、f0 营y z g 以g 一 _ ”2 1 l y i + g 这里的参数g 相当于窗宽h ,而函数帮( x ,) 的平滑性是由平滑参数g 和累积分 布函数的正则性决定的。 1 6 删郦实这个估计是喜k ( 竿炯y ) 叫2 对s 的局部卧二乘估计, 于是用m 一估计吃( x ,s ) ( 为了区别于前一章中的符号) 就是求s r , 使得 斟竿如叫鼬,或栅使得满足等式 喜文竿沁叫一o o 这里r f ( 小h ( 孚) 足矗上章一样,以) 是个凸函数,而它的导函数就是 y ( ) 。 4 2 假设条件 c 1 我们假设k ( ) 在( 0 ,1 ) 严格递减并且存在一些正常数c 。,c :且满足 q ) ( t ) ( f ) 乞锄) ( ) t e a r 。 c 3 ( i ) 记口= 矗g ,五) ,f 瓴,x ) 车p 慨魂) = 文玩) g ) 当捍- - o o 时。l i r a 。( o ( h ) = 0 , l i m n 0 2o 。- 0 0 ,伊q 。) 定义在r 上的i f 函数且在0 的邻域内绝对连续,并且 a :h 专r 上的一个非负函数; ( i i ) s u p 埘p 慨吃,q ) 妒瓴冼g 肖一0 ,其中( ) 是定义在r 上的 非负函数当辛。时 。) 斗o ,并且等锚有界。以g ) 是日上的非负函数。 矽l 见j ( i i i ) 当i = 1 ,2 ,眠) _ 南f k p 砀7 眠v ) 咖一k 当”专,其中k - ,如是两 个正常数。 c 4 ( i ) 存在h 上的一个非零连续函数五) 使得当h 一0 时有 e 眇( s 。+ “) lx l = z 】= ( z + d 0 ) 。 ( i i ) 当r 2 时我们有e 眵( r l s ) 7 。如果我们记 g 。( z ,s ) :e 0 少( r l s ) 1 2lx ,:z j g :( z ,s ) = e 0 吵( r l 一占) 1 7ix 。= z j 其中g l ( z ,j ) ,g :( z ,s ) 在x 的邻域内连续,z 在x 的邻域内,并且有 m a x e v ( 8 , + “) 一y p 。妒ix i = z j e 眇g + 材) 一y g 。) ) ,i 五= z b 0 “1 ) 其中如0 ) 在“= o 点连续,且如( o ) = 0 。 ( i i i ) s 在f ) 的邻域内有,对于任意的常数岛都有 。网卜耳) i c 5 存在一些常数0 占) 掣专o ( 4 “) 由此利用( 4 4 ) 和( 4 1 4 ) 完成了( 4 2 ) 的证明,于是也就完成了整个定理的 证明。 拍力一耳”q l 击+ 南j 证明:首先 。( c 6 h a + c 7 9 p + c s m 炉) 2 b ( 赢 = d ( 高) 另一方面 ,z ( c 6 h e + c 7 9 p + c 5 鼬胪) 2 = 南均 白南 2 = ( c s 揣均南坞丽1j = ( c h p n l 7 4 6 g 伊2 g ) y 蝎爵+ c s 南 2 托5 而丽j - 门( c 6 h p + c 7 9 p + c 5 0 砷胪) 2 一o a s 即。( c 6 h p + c t g p + c 5 m ”州2 以硼1 = 0 ( 吉) 在( 4 1 3 ) 和( 4 1 5 ) 、( 4 1 8 ) 下有 e ) 一e h ”) ) 2 】= c 3 ) 南+ c 4 ) 去+ 。睁南) 2 l ( 4 1 7 ) ( 4 1 8 ) ( 4 1 9 ) 氟:) 峨如糊p 岛+ 丽1 最后利用少( ) 的单调连续性就完成了定理4 2 。 本章小结:文章继续沿用的上一章的思想方法,获得了长记忆模型下函数型数 据分布函数的m 估计依概率收敛的结果,以及相应的依概率收敛速度。 第五章总结 本文从函数型数据的历史背景和现实意义,对国内外的发展状况做了一定 的介绍,并且完成了长记忆下函数型数据的非参数回归的m 一估计和分布函数的 非参数m 一估计,并获得了它们依概率收敛的速度,为函数型数据未来的发展提 供了一定的参考。 文章还有未完成的工作,如长记忆下函数型数据的条件中位数,条件分位 数,条件众数以及

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论