已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于相依函数型数据的稳健估计研究 摘要 函数型数据的理论与应用研究开始于生长曲线分析、分类学、生物力学、医学等 领域,并在最近十年发展起来的。由于相关学科领域中都存在大量的函数型数据,因 此在理论上有新的问题亟待解决。 本学位论文所做的工作有以下两点:首先研究了基于相依函数型数据非参数回归 函数稳健核估计。利用稳健的方法,在一定的条件下获得了与i i d 场合下类似的估 计量的几乎完全收敛速度,推广了现有文献中的相关结论;其次文章基于相依函数型 数据,利用稳健的方法,研究了函数型数据条件分位数核估计,避免了采用双核方法 中存在的问题,并在一定的条件下建立了估计量的几乎完全收敛的速度,推广了现有 文献的结果。 关键词:相依函数型数据:稳健核估计;条件分位数估计:几乎完全收敛速度 a s t u d y o nr o b u s te s t i m a t ef o rd e p e n d e n tf u n c t i o n a l d a t a a b s t r a c t o v e rt h ep a s td e c a d e s ,t h ef u n c t i o n a ld a t a ,a r i s i n gf r o mc r o 州hc u r v ea n a l y s i s , t a x o n o m y , b i o m e c h a n i c s ,m e d i c i n ea n de t c ,h a sb e e nd e v e l o p i n go n t oah i g h l yn e w l e v e l h o w e v e r , d u et oi t sa b u n d a n c ei nr e l a t e dd i s c i p l i n e s ,t h et h e o r yo ff u n c t i o n a ld a t as t i l l n e e d st ob ee x p l o r e df u r t h e rt os o l v et h en e w p r o b l e m s t h i sd i s s e r t a t i o na i m sa ts o l v i n gt w op r o b l e m sa sf o l l o w s f i r s t l y , w ei n v e s t i g a t et h e n o n p a r a m e t r i ck e r n e le s t i m a t o r sf o rar e g r e s s i o nf u n c t i o nw h e nr e s p o n s ev a r i a b l et a k e v a l u e si nra n de x p l a n a t o r yv a r i a b l ei sv a l u e di ns o m ea b s t r a c tf u n c t i o ns p a c ef b yt h e r o b u s tm e t h o d ,w ee s t a b l i s ht h ea l m o s tc o m p l e t ec o n v e r g e n c er a t eo ft h ee s t i m a t o r sf o r d e p e n d e n tf u n c t i o n a ld a t aw h i c he x t e n dt h ee x i s t i n gl i t e r a t u r er e l a t e dr e s u l t si ni i d c a s e s e c o n d l y ,w ei n v e s t i g a t ea k e r n e le s t i m a t i o no fc o n d i t i o n a lq u a n t i l ew i t hr o b u s tp r o p e r t y , a n da v o i ds o m ep r o b l e m so c c u r r i n gi nt h ed o u b l e k e r n e lm e t h o dw h e nr e s p o n s ev a r i a b l e t a k ev a l u e si nra n de x p l a n a t o r yv a r i a b l ei sv a l u e di ns o m ea b s t r a c ts p a c efw i t ht h e a s s o c i a t e ds e m i m e t r i cd e n o t e db yd ( ,) ,w h i c hi sc a l l e df u n c t i o nr a n d o mv a r i a b l e s w h e n t h eo b s e r v a t i o n sa r ed e p e n d e n t ,w ee s t a b l i s ht h ea l m o s tc o m p l e t ec o n v e r g e n c er a t eo ft h e e s t i m a t o r su n d e rs o m ec o n d i t i o n s a l lw eh a v ed o n ei nt h i sd i s s e r t a t i o ne x t e n dt h ee x i s t i n g l i t e r a t u r er e la t e dr e s u l t s k e y w o r d s :d e p e n d e n t f u n c t i o n a ld a t a ;r o b u s tk e r n e le s t i m a t o r ;c o n d i t i o n a lq u a n t i l e e s t i m a t e ;a l m o s tc o m p l e t ec o n v e r g e n c er a t e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得金日巴王些太堂 或其他教育机构的学位或证书 而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意。 学位论文作者签名: 签字日期:b i 。年¥月形日 学位论文版权使用授权书 本学位论文作者完全了解金目垦王些太堂有关保留、使用学位论文的规定,有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授 权金罡王些盔堂可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 签字日期:2 0 1 0 年 学位论文作者毕业后去向: 工作单位: 通讯地址: 日 电话: 邮编: 0九1l 、玎 日 令j 1 口j 翻 r 、 手 沙 名期签日师字导签 致谢 首先,感谢合肥工业大学数学学院为我提供了难得的学习机会和良好的学 习、生活环境。这篇毕业论文是在我的导师凌能祥教授的支持、鼓励和精心指 导下完成的。在我研究生三年的学习中,凌老师严谨的治学态度、深厚的学术 造诣,平易近人的崇高品质,对我产生了深刻影响,导师三年对我的教诲使我 受益终生。 其次,我要向读研期间教授我知识的杜雪樵教授,惠军副教授等表示深深 的谢意,是你们谆谆教导和辛勤培育使我j j i 娇u 完成硕士阶段的学习。 感谢合肥工业大学0 7 级应用数学的所有同学的帮助,你们使我进步,和你 们一起度过的三年美好时光我永远不能忘怀。 感谢我的家人,你们无私地给予了我物质的资助和精神的鼓励。 最后,感谢并祝福所有给予我帮助关怀的人! 作者:程伟 2 0 1 0 年4 月9 日 第一章绪论 本章作为全文的开篇,将对函数型数据近年来的发展以及本论文所研究的 内容作一个简明而直观的介绍。 1 1 本文背景 最近十年来,随着计算机的快速发展,在经济、金融、生物、医学、气象、 环境等领域,我们能发现大量密集的资料,常常称之为函数型数据。例如以前 我们只能获得间隔每天的数据,而如今能够捕捉间隔每秒甚至时间更短的数据, 直观上,这就是我们要研究的函数型数据,具体定义为:取值于无限维空间的 函数型随机变量丁的观测值f 称为函数型数据,记为r = f ( j ) :5 s 特别地若 scr ,则观测值f ( s ) 为一条随机曲线,可表示为一条函数曲线加上随机噪音; 当scr 2 时,则观测值f ( s ) 表示一随机曲面。从而要求我们建立新的统计推断 方法,从新的角度建立新的理论。关于函数型数据的详细背景及前期研究工作, 见r a m s y s i l v e r m a n ( 2 0 0 2 ) 【1 】的专著。 基于r a m s y & s i l v e r m a n ( 2 0 0 2 ) 【1 1 的工作,f e r r a t y v i e u ( 2 0 0 4 ) 【2 】提出 了基于函数型数据的非参数统计方法。众所周知,非参数统计是数理统计学的一 个重要分支,对统计模型要求很宽,能利用数据的一般信息,其方法适用亩广, 有较好的稳健性和良好的大样本性质,因此,近几十年来,基于有限维数据的非 参数统计推断,国内外很多学者提出了许多新的方法:如秩方法、u 统计量法、 密度估计方法、非参数回归估计中的核估计、最近邻估计、分割估计、局部多项 式估计、样条和小波估计等。而核估计方法是非参数回归估计的核心。由于核估 计可以看成局部最d - - - 乘估计,但最小二乘估计法对异常值相当敏感,不具备一 定的抗干扰性。稳健核估计正是为了解决传统核估计抗误差干扰性提出的。稳健 性的概念萌芽于上世纪初,但其发展则主要是上世纪五十年代后期以来,经过 t u k e y ,h u b e r ,h a m p e l 等一批学者的工作,h u b e r 在1 9 8 1 3 1 年出版了这方面的专 著。在有限维数据场合下,基于独立或相依数据非参数回归函数稳健估计见文献: r o b i n s o n ( 1 9 8 4 ) 【4 1 ,b o e n t e 和f r a i m a n ( 1 9 8 9 ) 【5 1 ,l a i d 和o u l d s a i d ( 2 0 0 0 ) 1 【6 】以及b o e n t e 和r o d r i g u e z ( 2 0 0 6 ) 7 1 等。 近年来,函数型数据的统计推断理论及应用研究受到了众多学者的关注, 特别是基于函数型数据的非参数回归模型的研究。f e r r a t y 和v i e u ( 2 0 0 2 ) s l 提出了利用函数型数据进行时间序列预测的非参数回归模型,获得了模型中非 参数回归算子估计量的渐近性质:随后f e r r a t y 和v i e u ( 2 0 0 5 ) 9 1 迸一步研究 了基于相依场合下函数型数据的回归函数估计,并获得了估计量的几乎必然收 敛速度;在此基础上,m a s r y ( 2 0 0 5 ) 1 0 1 获得了基于口混合函数型数据的非参数 回归算子核估计的渐近正态性。最近a z z e d i n e 和o u l d - s a f d ( 2 0 0 8 ) 1 l 】运用稳 健的方法,基于独立同分布函数型样本下,获得了非参数回归函数稳健核估计 的几乎完全的收敛速度。 众所周知,分位数或者条件分位数在金融中的广泛应用引起许多学者对分 位数或者条件分位数估计研究的兴趣。在有限维数据场合下,基于独立和相依 已获得了估计量的一系列大样本的性质,参见:s a m a u t a ( 1 9 8 9 ) d 2 】,z h o u ( 2 0 0 0 ) 【13 1 ,g a n n o u n ( 2 0 0 3 ) 1 4 1 等。近年来,由于函数型数据在经济、金融、生物、医 学、气象、环境等领域的广泛应用,更加引起人们对基于函数型数据条件分位 数估计的关注。当解释变量定义在具有半度量d ( ,) 的无限维函数空间,响应变 量定义在r 上,f e r r a t y 和v i e u ( 2 0 0 6 ) 1 5 1 用双核的方法,分别在独立同分布 和口混合相依场合下,获得了条件分位数估计的几乎完全收敛速度;随后 e z z a h a r i o u i 和o u l d s a d ( 2 0 0 8 ) 1 6 】在f e r r a t y 和v i e u ( 2 0 0 6 ) 15 1 基础上进 一步研究了条件分位数估计的渐近分布,在独立同分布和口混合相依场合下分 别得到其渐近正态性;最近通过运用稳健的方法,l a k s a c i 、l e m d a n i 和o u l d s a i d ( 2 0 0 9 ) 【l7 】在独立分布函数型数据场合下,获得了条件分为数估计的几乎完全 收敛速度和渐近正态性。 近年来作者的导师凌能祥老师一直致力于函数型数据非参数、半参数模型 的统计推断的研究。在有限维数据场合,建立了基于负相关序列样本分位数的 b a h a d u r 表示 4 6 1 、回归函数的分割估计渐近特性【4 7 1 ;对基于函数型数据的统计 推断,获得了改良核回归估计几乎完全收敛及其收敛速度【4 引,以及基于函数型 数据半参数回归模型的误差估计的收敛速度及渐近分布【4 9 1 等一系列有价值的结 2 果。这些结果不仅进一步完善了函数型数据非参数统计推断的理论内容,还为 函数型数据在实际中的应用提供理论支撑。 基于函数型数据统计推断的一个重要应用是对涉及连续时间的随机过程的 分析,基本思想是把一个随机过程分割成几个不同的时间段,从而允许我们构 造函数型数据集。把每段看作是一函数型数据( 曲线) ,这种重要数据的主要特 征是涉及到不同段之间的相依性,这使我们不能直接利用在独立同分布场合下 的统计分析方法和结果,要发展新的基于相依函数型数据的非参数统计推断方 法。在导师的指导下,作者基于口混合函数型数据,运用稳健的方法分别对非 参数回归函数的核估计和条件分位数估计加以研究分别得到了与独立同分布场 合下类似的估计量的几乎完全收敛速度,见【5 0 州】。 1 2 本文研究内容 本论文在以上背景下首先研究了基于相依函数型数据非参数回归函数稳健 核估计。利用稳健的方法,在一定的条件下获得了与独立同分布场合下类似的估 计量的几乎完全收敛速度,推广了现有文献中的相关结论;其次文章基于相依函 数型数据,利用稳健的方法,研究了函数型数据条件分位数估计,避免了采用双 核方法中存在的问题,并在一定的条件下建立了估计量的几乎完全收敛的速度, 推广了现有文献的结果。 电 盏 消 费 第二章预备知识 2 1 函数型数据相关概念 2 1 1 函数型变量和函数型数据 若随机变量x 取值于一个无限维空间( 函数空间) ,称x 为一函数型变量;x 的观测值x 称之为函数型数据( f u n c t i o n a ld a t a ) 。 有时记:x = x ( t ,o j ) ,tc r ; 相应的观测值:x = x ( t ,c o ) ,f t c r ; 当t tc 犬2 时,x = x ( t ,缈) 表示一随机曲面。 与x 有相同分布的n 个函数型随机变量五,五,k 的观测值_ ,x 2 ,吒称 之为函数型数据集( f u n c t i o n a ld a t a s e t ) 。 例( 电力消费数据曲线,数据见f e r r a t y v i e u ,2 0 0 6 15 】) :下图是美国 1 9 7 3 年1 月一2 0 0 1 年2 月( 3 3 8 个月) 内居民和商业部门每月消费的用电量( 2 8 年+ 2 个月) 月份 从数据可以看出,一方面,数据显示了线性变化趋势;另一方面具有异方 4 差性 塾 分 消 费 为消除这种线性变化趋势及异方差性,对用电量取对数,作差分: 墨= l 0 9 1 。( 在( 1 9 7 3 + t 刍g ) 消费的用电量) ,t = l ,2 ,2 8 娃t = x t x t - 、 一个重要的应用是预测将来消费。通常的统计模型是基于有限个过去的值; 然而,更合理的方式应该是把解释变量看作一段时间上的连续函数,即意味着被 包含的解释变量集是由2 8 条曲线数据: 总之,随着现代化仪器和设备的使用,我们观察到的几乎是连续的函数曲 线,直观上称之为函数型数据在医学、经济学、生物学、气象学等领域有出现 并有广泛的应用。 2 1 2 函数型数据所在的空间 我们知道,函数型数据取值的无限维空间f 越大,数据越分散。其实,分 散性的大小与数据之间接近的度量方法有密切的关系。为此,在函数型数据所 在的空间f 中,我们引入半度量。 定义:设f 为一无限维空间,d :f f 专r ,满足: 1 d ( x ,y ) 0 ,d ( x ,x ) = 0 ,v x f ,y f : 2 d ( x ,y ) = d ( y ,x ) ; 3 v 勺,y ,z f ,d ( x ,y ) d ( x ,z ) + d ( z ,y ) 称d 为f 上的半度量函数;( f ,d ) 为半度量空间。 注:若d ( x ,y ) = 0jx = y 称d 为度量。 下面介绍半度量的选取方法( 三种) ( f e r r a t y 和v i e u ( 2 0 0 6 ) 15 1 ) 。 ( i ) 函数型的主成分分析( f u n c t i o n a lp r i n c i p a lc o m p o n e n t sa n a l y s i sf p c a ) ( i i ) 基于导数的半度量( b a s e do nd e r i v a t i v e s ) ( i i i ) 基于偏最小二乘方法( b a s e do np a r t i a ll e a s ts q u a r e s ) 现以( i i ) 为例: 考虑两观测曲线( f ) 和( f ) ,取半度量: 屯( 薯,_ ) 2 = j ( 薯( m ( f ) 一x j ( f ) ) 2 d t ,聊= 1 ,2 设 局,岛,岛) 为b 一样条基;第f 条曲线一( f ) 的离散化为一有限维向量: 6 t = ( 一( ) ,一( 岛) ,t ( o ) ) r ; a r g i n f 耄f 一( 。) 一壹境( 。) 2 :屋:( 屋。,矗:,庞) ;( 吼,占) r 8 n f l 一( o ) 一境( o ) l = 屋= ( 屋。,矗:,庞) ;( 吼,) r 8 ,= l b = l j 毫( 。) :壹麂岛( ) ; 于是,m ( ) :b 矗。砖m ( ) 因此,对两个离散化的曲线薯( f ) 和_ ( ,) 之间的半度量为: d m ( x j ,_ ) = 2 1 3 函数型数据的非参数统计 定义:设z 为一随机变量,取值于无限维空间f 上,矽( ) 是定义在f 上依赖 于z 的分布的映射,对矽( ) 的限制为c ,若c 由f 中有限个元素确定,称之为函 数型的参数模型;否则称之为函数型的非参数模型。 因此,“非参数 意指模型限制( 约束) 集合的形式;“函数型”是与数据 的特征相联系,有时,称函数型的非参数统计模型具有“双无限维”特征。 2 1 4 函数型数据非参数回归模型 所谓函数型数据非参数回归模型,即响应变量y 是实值随机变量,解释变量 丁具有函数特征,取值于某一个有半度量d ( ,) 的抽象的无限维函数空间q ,即 】,= r ( t ) + 占, 其中s 为随机误差,( ) 为未知的回归函数算子。f e r r a t y v i e u ( 2 0 0 4 ) 【2 1 研 7 究了此模型的统计特征,构造了未知回归函数算子,( ) 的n a d a r a y a w a s t o n ( n - w ) 核估计量: ) = 羔k(掣卜i=1 “ 喜k ( 竿,= i 7 其中k ( ) 0 为非对称的核,h = o 为光滑的参数。在独立样本或某些相依场 粕= 一 yk l 坐生型l 喜k ( ( x z ) ) ( z 一,) 2 = 咖 y g ( x 1 的估计是下述极小问题解: 善k ( 向1 ( x 一置) h ( i 一归卿 当成( ) 可微时,记虬( ) 为其导函数,则上述极小问题的解等价于下述方程解: z k ( h 卅( x 一置) k ( y - t ) = o i = l 称此估计t o ( x ) 为核- m 估计。 2 2 随机变量列的相关定义 2 2 1 几乎完全收敛性及其收敛速度 若随机变量列 鼍,n 1 ) ,随机变量x 满足:对v s 0 ,有 尸( j 以- x s ) l 几乎完全收敛( a l m o s tc o m p l e t ec o n v e r g e n c e ) 于随机变 量x 。记:l i m = 疋 打 若随机变量列 k ,力1 ) ,随机变量x 满足:3 s o o ,有 尸( 1 以一x l 氏) o ,使口o ) o ,则称序列 z ,r :。是算术a 混合的。 如果3 c 0 ,3 t ( o ,1 ) ,a ( n ) c t ”,则称序列是几何口混合的。 2 3 重要不等式f u k - n a g a v e v 不等式 假设同分布序列( 矿。) 。满足速率口 1 的算术口混合: ( 1 )如果存在p 2s f l lm o ,对于任意的f m ,p ( 1 w , l f ) s 厂p ,这 时对任意的,1 和s 0 ,当c s ( 了 ( + ;8 。2 ,) - r 1 2 + 玎,一1 ( 三) 口+ 1 ) p ( 口+ p ) ( 2 ) 如果存在膨 0 ,“( o ,1 ) ; 则称k o ( ) 为0 型核。此时h ( u ) 则为: 日( 甜) = o ( v ) d ( v ) 1 再引入参数g = ,其中g 。专0 o ,v f r ( a 2 ) k 为l i p s c h i z 连续的核函数,支撑集为 0 ,1 ,0 c 2 k ( f ) o ,对于弘,x 2 虬,v t r ,一( f ,x i ) - 甲( t ,x 2 ) l sc 4 d ( x l ,x 2 ) ( a 4 ) 响应变量】,满足动2 ,e l y p o ,p ( x g ( x ,办) ) = 以( 办) o ,且烛吮( 办) = 0 ( a 6 ) 窗宽满足! 骢吃= o , ! i m l o g n n # x ( k ) = o ( a 7 ) 3 c o ,3 a 1 ,口0 ) c n ( a 8 ) 3 0 2 ,西p 州1 2 删1 = o ( n 一口) 注3 2 :条件a 1 是文献中关于非参数估计中常用的假设,参见 4 3 :a 2 a 6 是研究基于函数型数据和非参数回归模型的常用假设,参见 6 , 8 - 1 5 ;a 7 - _ a 8 则是混合序列的混合系数及序列的协方差结构满足的条件,可参加文献 1 5 。 3 3 结论和证明 下面给出本文的主要结论: 定理i 在条件( a 1 ) ,( a 2 ) ,( a 8 ) 下我们有: 皖一p ;:o ( 办? ) + o ( 坐坐旦) a 肋。 证明前先介绍几个有用的引理: 引理1 在条件( a 2 ) ,( a 3 ) ,( a 5 ) 和( a 8 ) ,则: y ( f ,x ) 一e ( 甲2 ( t ,x ) ) = o ( j i z 夕) 证明:利用前面记号我们有: ) - e 卜 = 南e ( 1 k 删呲垆e 【峭- f ) 弘墨】 由条件( a 3 ) 可得: k l i b ( ,k ) ( 五) l v ( t ,x 1 ) 一w ( t ,x ) l c 4 h 这时就得到: l 甲o ,x ) 一e 举:o ,x ) l sc 。群即证。 1 4 引理2 设条件( a 4 ) ,( a 6 ) 成立,则对v r 1 ,占 0 ,0 1 ,应用此不等式: 尸司举:p ,x ,一e 举:。,x , f s ) = 尸 即证。 占,z 赤喜( 喇坝舡) ) c ”灯制筹) 引理3 在条件m ) ,( a 3 ) ,( a 8 ) 下,得到: v “2 ( t , x ) - e 卜 = o 证明:由引理2 ,取,= ( 1 0 9n ) 2 时,则对v s 0 有: c 尸毗矿e 卜 甲2 ( ,x ) 一l 甲2 ( ,z ) l 1 + s 2 n ( 1 0 9 n ) 2 最 占 ( i o g n ) 2 2 厂 + ,z ( 1 0 9 厅) tl l c i ( 1 + 毒厂+ ( 1 0 9 n ) 2 加唧广 糟 ) ia c o 1 ( 1 0 9 n ) 2 h p ( a + 1 ) f a + p ) j 卓 ,。一 2 由于当x o 时,有1 0 9 ( 1 h ) 习一手+ 。( ) 成立, 故我们得到: ia “m 毗小巫n c t p2 + n ( 1 0 9 n ) 2 4 + 尸。2 4 + p s 。+ p j 有条件( a 8 ) ,3 r 0 ,上式可写为: p 舻2t , x - e 卜降匝nh t m 卸) 取s 压时上式记可写成: p 忙蛳 咄卟擘) c ni - r + n n - 2 - r t ) 即证。 引理4 若条件( a 2 ) ,( a 3 ) ,( a 8 ) 成立,则: 州a 书 = o 擘 a c 。 证明:此证明过程同上,只要把上面证明过程第一步中的r ,( x ) 改为,( x ) 即可。 下面对本章的定理进行证明 定理证明:由( a 1 ) : 甲( 哦,x ) = 甲( 包,x ) + ( 戗一见) 甲( 六一x ) 其中幺。为最和以之间的值。 3 c 0 ,v e o 0 , p 陋卢+ 擘,m 弧p 啪+ 擘,丁 1 6 定理的证明就转化为下列式子的证明: 牟( 最,x ) 一甲( 戗,x ) :0 r k p + 亚 f t c o 甲( 最,x ) 一甲( 戗,x ) = lk p + 1 2 = 1 l ,z 而v t r ,w ( t ,x ) - w ( t ,x ) = 赤陋船m 呶, - q ( t , x ) - e 呶) ) 鬻卜) - e 卜, 显然拿( ,x ) :! 鍪盟,e ip 。o ) l :1 ,由引理1 ,3 ,4 ,定理即证。 甲l ( x ) lj 3 4 小结 本章用稳健的方法从理论上研究了基于a 混合相依函数型数据非参数回归 函数的核估计。在一定条件下获得了与i i d 场合下类似的估计量的几乎完全收敛 的速度,推广了现有文献中的相关结论。 第四章基于相依函数型数据条件分位数的稳健核估计 4 1 引言 函数型数据的研究是近年来很新的领域,令( x ,y ) 为f x r 上一对随机变量。 其中f 是定义在半度量d ( ,) 上的无限维函数空间,彳为函数型随机变量。对 v x f ,令m 为x 的邻域。v x m ,f 。是当x = x 时y 的条件分布函数,具体 定义为:v y r ,f 。( x ,y ) = p ( r y l x = x ) 并假设f 。具有连续的密度函数f 。 在文献 1l 】中f 。的p 分位数定义为:o ( x ) - - i n f t r :f 。( f ) p ) ,g 百t p ( x ) 的估 “( 垆i n f 川:参p ,其中 讯壁豢掣, k 为对称核,h 为积分核,办= 和g = 岛都为非负的平滑参数,且嚏专o , 一0 用这种估计的方法文献 1 5 】分别在独立同分布和口混合的场合下得到 t p ( x ) 的几乎完全收敛的速度。显然在这种估计中由于采用双核的方法,就要考 虑两个平滑参数办和g 。 现在取、壬,p ( x ,f ) = e 缈,( 1 ,一r ) l x = x ,其中y p ( r ) = ( 2 p 一1 ) f + ,则分位数 f p ( x ) 就可看成是关于f 的最值问题:呀甲p ( x ,f ) ,则r p ( x ) = a r gm 砌i n 甲p ( x ,f ) 。 这时如果对甲,( x ,f ) 运用经典的n w 核估计,完全就可以消除以上讨论所出现 的问题。本章采用这种具有稳健性质的核估计的方法,在口混合的场合下,建立 了适当的条件,获得了条件分位数的几乎完全收敛的速度,推广了文献 1 7 仅在 独立同分布场合下结果。 4 2 模型和假设 设有成对数据( 五,i ) ,( 五,e ) ,( 以,e ) ,与( 爿,y ) 同分布并满足强混合条 件,其中( x ,y ) 为f x r 上一对随机变量。f 是定义在半度量d ( ,) 上抽象的无限 维函数空间,x 为函数型随机变量。基于这门样本,给出甲p ( x ,f ) 下列的核估计 定义 : 童p ( x ,f ) = :。呒。( x ) ( z r ) ,v f r,其中, 形,( x ) = k ( h 。1 ( x ,z ) ) 夏可丽 k 为核函数,办- 吃为正实数序列,且。l i m 。h , , = 0 。 则t p ( x ) 的估计就可以写成:t p ( x ) = a r g m 砌i n 甲p ( x ,f ) 由文献【1 1 】知 i f p ( x ) = f ,( x ) := i n f t r :f 。( r ) p ,其中f 。( ) = :。r v ,( x 圾骚 ,q 为示性 函数。 为了叙述方便,把本章中的记号将统一如下: b ( x ,) 表示以x 为中心,为半径的小球; 蟛。蕊1 而狲x ) ,其中荆= 咿饥置) ) ; 删2 面1 而撕珊其中f ) = m 诹置帆g ; 驰,= 窆i = l 扣c 器k a , ,嚣,| ,l l l 一“1- “1 “,1 啪,= 搿j = l 。v 掣x s t a i ,鬻,l : l - li ,l 凸1l ,i 最= m a x ( & 。i ( x ) ,最,2 ( x ) ) 给出结论刖先建立假设如f : h 1x , - - 于v , o ,p ( x b ( x ,r ) ) = 以( ,) o 成立,并且舰丸( ,) = 0 h 2j 艿 0 ,v ( ,l ,2 ) k ( z ) 一万,o ( z ) + 万 2 ,v ( x l ,而) m 2 有 l f ( ) 一,t ( 岛) l o ,k 0 h 3 k 为l i p s c h i z 连续的核函数,支撑集为 o ,1 ,0 c 2 k ( ,) 1 ,口( ,z ) c n 一 1 9 h 5j 秒 2 ,p 川眺唧= o ( n 一口) h 6l i m 一- - - i 0 0 = 0 其中,h 1 ,h 3 ,h 6 为经典的函数型数据非参数统计中的假设,参见文献【1 5 】;h 2 则是对分布函数的假设;h 4 ,h 5 是对相依序列的假设。 4 3 主要结论和证明 定理1 在假设h 1 - h 6 下有: ,。 f ,。,卜s u j p ,。,+ 万 l 。( ,) 一j 7 。( r ) l = ( ) ( 厅6 ) + ( ) ( a c o 证明 研叫垆黔叫钏小一伽 - 掣h 房 显然# x ( f ) :掣,e _ 忘 :1 。证明可由下面的引理1 3 完成。 f o lj 引理1 由假设h 1 ,h 3 - , h 6 ,可得。 ,。,s u 占p i e t ,。,卜艿 l 7 。( ,) 一e j ;( ,) l = 。( 乃6 ) a c 。,( x ) 吨o ( x m l l ”j i 、7 证明 在h 3 的条件下,1 ( x ) = - ( x ) 厶( 蚰) ( 五) , f ( ,) 一e 鸯。) = 酾1 e 。( x ) c 础,( 墨) ( f 。o ) 一,局( r ) ) 由h 2 :b ( x , h ) ( 五) 旷( t ) - f ( t ) l - 0 ,v r 1 ,应用f u k - n a g a v e v 不等式: 吖 厂 露一e i 昂 l 取,- - ( 1 0 9 ) 2 , p c s :尸f j【 f “;- e h i 昂l 1 + 占2 咒2 f r 占 ( 1 0 9 n ) 2 最 2 一坐进 2 q + ; 三 p 4 + 1 4 + , r + 玎o o g 玎) i l ( 1 0 9 n ) 2 邓+ 甜掣州嵫矿黯r 肌训 由于x 寸。,有l 。g ( 1 + x ) = x 一手+ 。( x 2 ) 成立, 故得到: 尸 厂 鹾一e i 露i lj s c _ e 2 i o g n - 2 + 黼s 一端s 一篇 由h 5 ,j 7 7 0 ,( 1 ) 式可写成: 2 1 、p ( 口+ 1 ) ( a + p ) j ( 1 ) x ,l e一 、, x ,l ,l 。商 r 一2 下j 丝峨 +l p 峥卧s) c n 一譬+ 咒甩一2 一” 故当g 虿时( 2 ) 式可写成: p 肛阡s c n - l - t + n n - 2 - t 靴。 引理3 由假设h 1 ,h 3 - h 6 ,可得: 砷小孙占,脚a 一抵l , l = o ( ,e f p ( 工) 一j ,p ( 工) + 占 l ” j li a c 0 ( 2 ) 证明 集合l ( x ) 一万,。( x ) + 万 可以写成心( x ) 一瓯。( x ) + 艿 c0 乃一乇,巧十乇 ( 3 ) = l 其中乇m n - i l k ,d n = o ( 门1 他) 。对1 ,吃,有: e 届( 乃一厶) s u p ,e f ;( t ) e 届( y j + 厶) 1 y s 一,y s + t j 矸( 乃一厶) o 有, f a c o 尸l m a x 爿“m a ”x 扣叫钏卜巫1 1 鳃脚即如m叱ax川1砖一e胁卜巫rlelmax鳃脚叫棚刈io 卜e 【铱力p 业竺j 现在只需对不等式最后一部分运用f u k - n a g a v e v 不等式,方法同引理2 的证明, 即证。 定理2 在定理1 假设条件下,如果厂。( o ( x ) ) o ,有: 陪h 伽小o ( 擘 a - c 。 证明 由f 。( f ) 连续可微,且厂。( t p ( x ) ) 0 ,对v g 0 ,有 ;p ( ;p ( x ) 。( x ) + g ;( f e 似s 如u 小p 扣 i 声( r ) 一f 。( ,) l 占厂。( 缶( s ) ) c 7 , 和 ;p ( 文小“小g ) 乳m 十s u p 州,阻) p 啪) 成立。其中螽( 占) ( o ( x ) ,r p ( x ) + 占 ) ,彘( 占) o - t p ( x ) 一s ,( x ) ) 。 此夕 、j f 毛 o ,万) , ,。 ,( ,) 一s 昂u p ,。( ,) + 晶 。( f ) ( 1 4 o 。 联合( 7 ) ,( 8 ) ,取s :f ,办6 + 3 匝 , 当足够大时,有: 磊p ( 陪,一l s ) 丕p ( f 嘣帕s u p 以小岛,阻,l 抑卜 故定理由定理1 即证。 5 1 全文总结 第五章总结 随着现代化仪器和设备的使用,我们观察到的几乎是连续的函数曲线,直 观上称之为函数型数据。函数型数据在医学、经济学、生物学、气象学等领域 有广泛应用。因此函数型数据的统计推断的研究不仅在理论而且在实际中都有 极高的价值。 基于函数型数据统计推断的一个重要应用是对涉及连续时间的随机过程的 分析,基本思想是把一个随机过程分割成几个不同的时间段,从而允许我们构造 函数型数据集。把每段看作是一函数型数据( 曲线) ,这种重要数据的主要特征 是涉及到不同段之间的相依性,这使我们不能直接利用在基于i i d 场合下的 统计分析方法和结果,要发展新的基于相依函数型数据的非参数统计推断方法。 本学位论文研究了基于相依函数型数据非参数回归函数的稳健核估计以及 基于相依函数型数据条件分位数的稳健核估计。利用稳健的方法分别得到了估 计量的几乎完全收敛的速度。 5 2 进一步研究 ( i ) 本文基于相依函数型数据只研究了基于相依函数型数据非参数回归函 数的稳健核估计以及基于相依函数型数据条件分位数的稳健核估计,分别得到 了与i - i d 场合下类似的估计量的几乎完全收敛的速度,对于估计量的渐近分布 形式还有待进一步的去研究。另外本文也仅仅从理论上对函数型数据的非参数 回归函数核估计、条件分位数核估计的收敛性以及收敛速度的研究。对于如何 用r 软件进行数值模拟的研究还有待进一步的研究。 ( 2 ) 本文也仅仅用稳健的方法研究估计量的收敛速度,如果利用函数空间 中熵的方法去研究基于相依函数型数据时响应变量】,的条件分布、条件密度、条 件分位数、条件众数、条件风险率函数的一致完全收敛性及速度等,能否推广 并改进现有文献中的相应结果? 2 4 ( 3 ) 由于函数型数据的研究是个很新的领域,对函数型数据的多变量非参 数、多变量半参数回归模型在尽可能弱的条件下的内在性质等有关问题的研究 都很有理论和实际的价值。 2 5 参考文献 【1 】r a m s a yj ,s i l v e r m a nb a p p l i e df u n c t i o n a ld a t aa n a l y s i s :m e t h o d sa n dc a s e s t u d i e s m n e wy o r k :s p r i n g e r ,2 0 0 2 【2 】f e r r a t yf ,v i e up n o n p a r a m e t r i cm o d e l sf o rf u n c t i o nd a t a ,w i t ha p p l i c a t i o n si n r e g r e s s i o n ,t i m es e r i e sp r e d i c t i o na n dc u r v e sd i s c r i m i n a t i o n j 】jo fn o n p a r a m e t r i c s t a t i s t i c s ,2 0 0 4 ,1 6 :11l 一1 2 7 3 】h u b e rp r o b u s ts t a t i s t i c s m 】w i l e y ,19 81 4 】r o b i n s o np m r o b u s tn o n p a r a m e t r i ca u t o r e g r e s s i o n m 】l e c t u r en o t e si n s t a t i s t i c s 2 6 ,n e wy o r k :s p r i n g e r - v e r l a g ,19 8 4 ,2 4 7 2 5 5 5 】b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 福建省三明市2026届高三二模语文试题(图片版含答案)
- 2026 学龄前自闭症情绪情境模拟课件
- 2026 学龄前自闭症家校共育课件
- 2025年个性化医疗产品开发与市场前景
- 同分子分数大小比较
- 工地应急预案14篇
- 施工安全草原生态失量子熵筛选安全为量子熵筛选安全管理制度
- (完整版)冷却塔施工方案(完整版)
- 2026年资产评估师《资产评估实务二》真题回忆版
- 食品安全培训方案
- 影视导演基础完整整套教学课件
- 毕业设计(论文)-小型打磨机结构设计
- 中级社会工作综合能力总复习笔记
- 物业公司保洁承包合同协议书
- 药店雇佣店员合同(2篇)
- 4.2+实现中华民族伟大复兴的中国梦+课件高中政治统编版必修一中国特色社会主义
- 2024年四川嘉州金石能源有限公司招聘笔试参考题库附带答案详解
- 825合金20钢双金属复合管焊接工艺
- (正式版)JBT 106-2024 阀门的标志和涂装
- 超声消融术在肿瘤治疗中的应用
- 公寓保洁服务方案
评论
0/150
提交评论