(应用数学专业论文)函数型非参数回归模型异方差检验.pdf_第1页
(应用数学专业论文)函数型非参数回归模型异方差检验.pdf_第2页
(应用数学专业论文)函数型非参数回归模型异方差检验.pdf_第3页
(应用数学专业论文)函数型非参数回归模型异方差检验.pdf_第4页
(应用数学专业论文)函数型非参数回归模型异方差检验.pdf_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

函数型非参数回归模型异方差检验 摘要 在许多实际问题中,检验观察数据是否出现异方差性是一个相当感兴趣的 问题。函数型数据是最近几年使用非常多的统计数据,它的主要特点是记录信 息全面。当函数型数据应用到实际中时,首先需要解决的就是异方差检验问题。 本文研究了函数型数据回归模型的异方差检验问题。基于非参数蒙特卡罗 模拟检验的方法,构造出相应的经验分布函数并且得到相应的非参数蒙特卡罗 检验的条件统计量。最后通过大量的实例模拟说明了该方法在大样本的情况下, 检验效果显著。 非参数蒙特卡罗模拟检验算法简单、直观、易于编程。函数型数据理论发 展不够全面,很难使用传统的方法构造检验统计量。本文尝试用非参数蒙特卡 罗模拟检验的方法解决了该问题。 关键词:异方差;函数型数据;非参数蒙特卡罗检验;模拟 t e s to nh e t e r o s c e d a s t i c i t yi nf u n c t i o n a l n o n p a r a m e t r i cr e g r e s s i o nm o d e l a b s t r a c t i ti so fc o n s i d e r a b l ei n t e r e s ti nt e s t i n gf o rh e t e r o s c e d a s t i c i t yi nm a n yp r a c t i c a l s t u d i e s i nr e c e n ty e a r s ,f u n c t i o n a ld a t ai sv e r yu s e f u ld a t a ,w h i c hi sc o m p r e h e n s i v e w h e nf u n c t i o n a ld a t ai su s e di np r a c t i c e ,t h ef i r s ts t e pi sh e t e r o s c e d a s t i c i t yt e s t i n t h i sp a p e r ,t h ea u t h o r sd i s c u s st h i st y p eo fp r o b l e mi nf r a m e w o r ko f f u n c t i o n a ld a t ar e g r e s s i o nm o d e l s ac o n d i t i o n a lt e s to fn o n p a r a m e t r i cm o n t ec a r l o t e s ti sp r o p o s e da n dt h ee m p i r i c a ld i s t r i b u t i o nf u n c t i o ni sc o n s t r u c t e d t h et e s ti s b a s e do nt h ea p p r o a c h e so fn o n p a r a m e t r i cm o n t ec a r l ot e s t a tl a s t ,t h ea u t h o r s s i m u l a t i o nt h et e s tm e t h o db yal a r g en u m b e ro fe x a m p l e s ,a n ds h o wt h i sm e t h o di n t h ec a s eo fl a r g es a m p l et ot e s tt h er e s u l t sa r eo b v i o u s t h ea d v a n t a g e so fn o n p a r a m e t r i cm o n t ec a r l ot e s ta r es i m p l e ,i n t u i t i o na n d p r o g r a m m i n ge a s y t h e o r yo ff u n c t i o n a ld a t ai sn o tc o m p r e h e n s i v ee n o u g h a n di t i sd i f f i c u l tt ou s et r a d i t i o n a lm e t h o d st oc o n s t r u c tt e s ts t a t i s t i c s i nt h i sp a p e r , w es o l v et h ep r o b l e mb yn o n p a r a m e t r i cm o n t ec a r l ot e s t k e yw o r d s :h e t e r o s c e d a s t i c i t y ;f u n c t i o n a ld a t a ;n o n p a r a m e t r i cm o n t ec a r l ot e s t ; s i m u l a t i o n 插图清单 图1 样本数为5 0 ,q ( z ( f ) ) = 1 的直方图2 2 图2 样本数为8 0 ,q ( z ( ,) ) = 1 的直方图2 2 图3 样本数为5 0 ,吒( z ( f ) ) = c z ( t ) d t 的直方图2 3 图4 样本数为8 0 ,吒( z ( f ) ) = ez ( t ) d t 的直方图2 3 图5 样本数为5 0 ,q ( z ( f ) ) = 4 ( e z ( t ) d t 一0 2 5 ) 2 的直方图2 4 图6 样本数为8 0 ,巳( z ( f ) ) = 4 ( e z ( f ) a t 一0 2 5 ) 2 的直方图2 4 图7 样本数为5 0 ,q o ( f ) ) = o 2 5 e x p ( e z ( t ) d t i n ( s ) ) 的直方图2 5 图8 样本数为8 0 ,气( z ( f ) ) = o 2 5 e x p ( e z ( t ) d t h a ( 5 ) ) 的直方图2 5 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所 知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得金目巴王些太堂或其他教育机构的学位或证书而使用过的材料。与我一同 工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:签字日期:? ,年y 月) 夕日 学位论文版权使用授权书 本学位论文作者完全了解金墼王些太堂有关保留、使用学位论文的规定,有权保留并向国 家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权金壁王业太堂可 以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手 段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 一躲彳卒函 签字日期:2 p 乒年y 月z 歹日 学位论文作者毕业后去向: 工作单位: 通讯地址: 导师签名: 嘭铲 签字日期:夕纠年v 月猡日 电话: 邮编: 致谢 光阴似箭,两年半的研究生生活即将结束,在这三年的日子里,有幸结识 了的老师和同学,使我不仅收获了知识,也收获了友谊。在这里我想对他们表 示真挚的感谢。 感谢我的导师惠军老师,感谢惠老师在学习上对我无微不至的关怀。惠老 师严谨的科研态度、认真的治学作风给我留下了很深的印象。两年半的研究生 学习生活中,在惠老师的谆谆教导和循循善诱下,我不仅掌握了很多统计知识, 学会了思考问题和解决问题的方法,而且积果了宝贵的人生经验,这些都使我 终身受益。 感谢凌能祥老师、焦贤发老师、杜雪樵老师等,感谢他们两年半来对我知 识的传授以及生活的照顾和关怀,我将在他们认真负责、无私奉献的人格魅力 熏陶下继续努力! 感谢我的师兄师姐、师弟师妹以及我的同班同学,两年半来的相处给我留 下了许多美好的回忆,愿他们都有美丽的人生! 感谢在完成本硕士论文期间所有无偿提供珍贵资料的专家、教授和同行们。 最后,把最深的感激送给给予我充分理解和关心的爱我的亲人,情同手足 的朋友们。在清苦的学习路上,家人、朋友为我构筑了一个充满爱与和谐的氛 围,让我们快乐前行。他们为我学业的顺利完成作出了无私的奉献,是我不断 进步的力量源泉。 在此,诚挚地感谢培育我的数学学院,是她给予我深造的机会,祝愿她桃 李满天下! 把所有的感谢感念于心,化作动力,助我在这个领域内继续探索前行。 作者:季韬 2 0 1 0 3 1 0 第一章绪论 1 1 背景 由于在不同的科学应用领域可以收集到的数据在不断地增加,并且随着计 算机计算存储功能的不断增强,让我们在短时间内可以记录下大量的数据。并 且对于一个单一的现象,我们可以通过不同的变量进行观察。比如,在通常情 况下对于一些随机变量可以在一段时间 ,一) 内被观察许多次,并且每一次观察都可以看成是一个随机变量族 x ( t a ,;l ,州 在现代的统计中记录的数据与数据之间的间隔越来越短,这样它们之间显得越 来越密集,看上去像是连续的,这时我们将这些数据理解成是连续的随机变量 族 x ( 晚f ( 。,f 一) , 在这种情况下,变量的测度很小但是数据在函数结构下显得非常的清晰。这时, 在近代的统计学中出现了一种新的记录数据的方式,即将数据看成是一条条的 连续的曲线,称为函数型数据【1 】,并且形成了一个专门的概率统计分支,它的 处理方式和实变量有很大的区别。本文将在第二章中重点阐述。 收集数据的应用主要用于统计建模处理实际问题,函数型数据的主要作用 也是在实际的应用中。由于回归分析是数理统计的重要分支之一,并且在实际 中得到广泛的应用。所以研究函数型数据在回归模型中的作有非常重要的意义。 一般来说统计模型只是对客观情况的一个近似,一个好的模型能够比较好 的解释数据、预测未来。如何建立一个更加接近现实的模型,一直是一些统计 工作者不断追求的目标。从线性回归到一般的参数模型,从非参数回归到部分 线性模型,从可加模型到投影追踪,为了寻找一个能够更好地描述并解释实际 现象的模型,大量的统计工作者做出了许多不懈的努力,取得了许多成果。函 数型变量统计模型堪称现代回归分析中的一个新进展。 随着当今计算技术和计算能力的飞速发展,许许多多的复杂计算得以实 现,人们对客观的总的描述则提出更高的要求。为了减少回归模型的偏差,统 计学家提出了假设更宽松更自由的模型一一非参数回归模型【2 】,即假定回归函 数为 y = 矽( x ) + g ( 1 1 ) 其中矽( ) 为未知函数具有一定的光滑性,6 ( e e = o ,e 9 2 = 仃2 ) 为随机误差非参数回 归一般假定回归函数属于某一个函数类,如,常常假定回归函数是一个光滑的 函数,因此非参数回归对模型的假设很少,最主要的优点就是模型具有稳健性。 非参数回归作为现代统计分析的主要方法之一。为了估计矽( ) 一般使用核估计 的方法进行估计。 在实变量的情况下对上述模型的研究已经比较的完善,无论是在理论还是 实际的应用中都有了比较成熟的理论和方法,但生活中并不是所有的情况都可 以利用实变量进行描述,并且随着维数的不断增大会出现维数灾难,这时需要 一种新型的数据去描述实际生活中的变量,那就是函数型数据。 利用函数型数据建立非参数回归模型( 1 1 ) 时,其中,x 为函数型变量它是 关于,的函数。但在建立该模型时,首先需要解决的是检验模型的异方差性。 对于模型异方差的检验问题在实变量变量情况下研究的比较完善 3 。 最常见的是残差图的检验,这种检验法的特点是可清楚直观的看出是否存 在异方差,但是当维数增加的时候通过关系图只能知道数据中存在异方差,但却 不知道异方差是由哪些变量引起的,因此这种方法有一定的局限。 戈德菲尔德一夸特检验、怀特检验、主要是检验含参数的线性模型,对于函 数型的非参数回归模型不适用。 帕克检验、戈罩瑟检验需要对自变量进行相应的变换,而对于函数型数据 无法完成这些变换。 斯皮尔曼( s p e a r m a n ) 秩相关系数检验,需要对函数型变量进行相应的排 序,但对与函数型数据本身来讲,是无法排序的。 所以,以上所有的经典的方法都无法很好的解决函数型数据模型的异方差 问题。 而对于不同条件下的异方差检验,则有许多新的方法,如误差是正态分布 时e u b a n k 和t h o m a s 4 构造得分统计量,d i b l a s i 和b o w m a ne 5 在正态误差 和线性模型情况下,在对残差做变换后,基于非参数光滑法构造检验统计量, d e t t e 和m u n k 6 对固定设计的非参数回归模型构造统计量,检验具有比较好 的性质,它不要求直接估计回归函数,也不依赖光滑参数的选择。 但是在函数型数据情况下,构造的统计量在原假设下的精确分布或者极限 分布很难得到,因此无法确定是否接受原假设的临界值点,这时可以借助于蒙 特卡罗逼近的方法。b a r t l e t t 7 首次描述了蒙特卡罗检验( m c t ) 的思想,下 面举个例子简单介绍一下参数蒙特卡罗检验的方法: 考虑具有分布f ( ) 的独立同分布随机变量五,x 。,假设要检验 f ( ) = g ( ,目) 是否成立,其中口是未知参数,g ( ) 为已知函数。对这个问题的任 何检验统计量,如r ( 五,x o ) ,参数蒙特卡罗方法就是从分布g ( ,痧) 中独立产生 参考数据硝,计算相应统计量的值丁( 爿,x :) 作为参考值。其中秒为9 的估 计值。如果r 的值较大则拒绝原假设;对于双边检验可以作出相应的调整。记 t ( x i ,) = t o ,互,乙表示蒙特卡罗得到的m 个参考值。p 的估计值为 p = k ( 聊+ 1 ) ( 1 2 ) 其中,后是石,t m 中大于t o 的个数。给定水平口,只要p 口,拒绝原假设。 h o p e 8 证明在参数情况下,如果没有讨厌参数,蒙特卡罗可以达到精确 的置信水平,s c h i c k 和r o o t 9 把m c t 应用在随机变量中有讨厌参数的情况。 2 e n g e n 1 0 用m c t 逼近统计量的分布,在具有讨厌参数的某些特定情况下,m c t 仍然可达到精确的显著水平。 但对于非参数和半参数情况下,很难在原假设下模拟参考数据计算统计量 对应的m c t 的条件统计量。朱力行和许王莉 11 提出另一种蒙特卡罗方法即非 参数蒙特卡罗检验( n m c t ) ,克服了上述缺点。 以上分别提到了函数型数据在建立模型时遇到的困难,以及非参数蒙特卡 罗方法可以有效的解决该问题,本文就是想利用非参数蒙特卡罗方法处理数据 的特点去处理函数型数据异方差的检验问题,下面,我们看看关于函数型数据 以及非参数蒙特卡罗方法的研究现状。 1 2 函数型数据的研究现状 在很多情况下,我们需要研究两个变量之间的关系,并且通过一个变量去 预测另一个变量。在有限的空间中该方法已经比较完善了。当问题发生在函数 型数据空间中的时候,一般让解释变量为函数型变量而让因变量为实变量。 利用参数的方法研究函数型数据主要的成果为: d a b o 1 2 将加拿大的气温数据作为函数型数据建立模型: t e m p k g ( t ) = p ) + 畋( t ) + 6 k g ( t ) ( 1 3 ) 其中函数z 是总平均函数,是指加拿大的平均气温,而口。是指对气温影响较大 的地区气温,靠为一般误差。并且将该模型一般化得到 t e m p t g ( t ) = 瓠g ) ,岛( f ) + ( f ) ( 1 4 ) j 利用最小二乘估计出相应的参数值,并且通过实际的例子说明建立的函数型数 据模型非常的符合实际。 r a m s a y 1 3 进一步完善了相关的理论,从一般的线性模型 y i = q + 芝二p j x q 七l j 出发,提出函数型数据的一般线性模型: 咒= 口+ 【x f ( s ) p ( s ) d s + b 并且根据最小二乘法得出参变量的一般估计值。 r a m s a y 1 4 进一步将相应变量儿看成函数型数据,得出 以o ) = 口o ) + i 葺( s ) ( s ,f 灿 开 同时也得出参数的一般估计方法。 b o s q 1 5 】将主成分分析的方法应用到函数型数据中, 据作了实证分析。 ( 1 5 ) ( 1 6 ) ( 1 7 ) 并且对加拿大气温数 在统计学的另一个分支是非参数的研究,并且在有限维空间中取得了好的 成就。在函数型数据空间中【1 】介绍了函数型条件分布, b 少r j 歹( x ,y ) = e ( r _ y l x = x ) ( 1 8 ) 其中,x 为函数型数据,接着介绍了函数型条件密度, a v y r ( x ,y ) = f ( x ,y ) ( 1 9 ) 哕 和般的非线性预测一样,利用解释变量的条件期望 ,( x ) = e ( y i x = x ) ( 】1 0 ) 进行预测,紧接着又定义了函数型数据的条件中位数,以及条件众数。 聊( x ) = i n f y r ,f ( x ,y ) 1 2 ) 臼( 功= a r gs u p ( x ,y ) j ,e j 有了以上的定义,【1 】中使用n a d a r a y a - w a s t o n 核函数 1 6 】进行估计,估计了户( x ) 。 接着又估计了, j ( x ,y ) ,以及,;l ( x ) ,p ( x ) 有了以上一些基本函数型数据估计量之后,n a d a r a y a 1 7 】进一步对非参数 的模型在同方差的情况下进行了研究,并且证明了估计量的渐近正态性。 【18 】对函数型数据的生成、处理、应用作了大量的研究说明。在 h t t p :s p u p s t l s e f r s t a p h n p f d a 上可以下载关于一些处理函数型数据的一些常用 算法比如,变窗宽估计、k 近邻估计等。 利用函数型数据进行统计分析最好的环境应该是在连续时间的随机过程 中,将一个过程按不同的时间段,分成一组一组的数据,这时可以将其看成一 个函数型数据集。每一个时间段内的数据可以看成一个函数型数据。以前我们 在处理数据的时候,都将其看成是独立同分布的,但无论是理论上还是在实际 上都认为数据间有某种联系。c a r d o t 【19 提供了一种在函数型数据中选择相依 参数的方法。 在对于概率上的混合问题可以参见【2 0 】、【2 1 】、和 2 2 深入讨论了非参数 统计中的混合结构。 设( 彘) 。z 是概率空间( q ,a ,尸) 的一联串的随机变量。则强混合系数可以表 达成, 口( 刀) = s u ps u ps u pj p ( ar ib ) 一户( 彳) p ( b ) i a e a :, 口e 锟 其中,彳;为随机变量( 六,j s k ) 构成的一个盯代数,( - - - o o j k + ) 并同时 证明了关于混合的一些渐近问题。 b o s q 2 3 将混合问题放入函数型空间中研究,并且进一步对混合条件下的 条件分布、条件密度、条件中位数以及条件众数进行估计,并且证明了其渐近 性质。 当解决了关于函数型数据建模的问题后,那么就可以将连续的随机过程中 的每段看成是一个一个相关的数据。这样就可以建立简单的时间序列模型。在 2 4 】、 2 5 】、【2 6 中具体介绍了一般模型的建立方法和求解方法。 r o b i n s o n 2 7 将函数型数据看成: 4 置= z ( f ) ,o - 1 ) r , 。在这种情况下,函数的特性可以直接从观察值中反映出来。在 这种情况下曲线型随机变量是与无限维集合tcr 相联系的,这种将变量看成 函数的形式在很多领域都可以利用比如对于比较复杂的无限维空间的数学对 象。 为了更好的了解函数型数据的性质,下面介绍一下函数型数据集合: 定义2 :如果五,以是独立同分布的函数型随机变量,那么它们的观察值 五,x 。为一个函数型数据集合。 以上的定义可以用在许多领域,最通常的是用在曲线数据集中。我们不需 要去管这些函数型数据是如何被收集的。对于这一类的数据在某种意义下可看 成是一种特殊的过程。 在利用函数型数据进行建模的时候,首先需要的是了解数据的空间结构, 以及数据空间中的测度问题。对于两个数学体最近距离测量问题在统计分析中 有非常重要的意义。在通常的情况下,经典的模度量经常用来度量两个数学元 素之间的距离,所以在有限的欧拉空间中所有的模都有等价的意义。比如在尺p 欧拉空间中x = 而,扳是r p 中的向量,那么传统的欧拉距离可以定义成如下形 式: i i x l l 2 = ( _ ) 2 ( 2 1 ) j 皇l 当然,我们也可以根据此定义推出另一种模的形式,使用有限维矩阵m : l x l l :, = x 7 1 m x ( 2 2 ) 只要选择好恰当的矩阵m ,就可以计算出相应的模。 那么对于无限维空间中的变量,前面使用的度量方法将无法计算出相应 的模,所以,对于函数型数据空间如何选择度量模将非常的重要,在这种情况 下使用半度量空间比使用度量空间更适合数据的需要。 定义3 :是一个在函数型数据空间f 中的半度量: ( 1 ) v ( 允,x ) r x f ,1 1 名x 0 - - i 允lx 0 ( 2 ) v ( x ,y ) ef x f ,i x + y l l - l l x l + l l y l i 事实上,对于度量中的三个条件,i i x l i = 0 时无法推导出z = 0 去掉就是半度 量的定义,如果用距离d 去定义,则是d ( x ,y ) = 0 无法推出x = y 。 定义4 :如果d 表示一个在函数空间f 半度量距离: 7 ( 1 ) 垤f ,d ( x ,x ) = 0 ( 2 ) v ( x ,y ,z ) f x f x f ,d ( x ,y ) d ( x ,z ) + d ( z ,y ) 以上定义了函数型数据间的距离,关于距离的具体形式根据不同的要求可 以定义不同的形式,例如利用主成份分析去反映两个数据间的接近程度,对于 i 6 + i 函数型数据而,有 ( 2 3 ) 同样也可以定义基于二阶导数的距离公式,对于两个函数型数据五,x ,有 、j ( 1 2 ( f ) 一x 双f ) ) 2 d t ( 2 4 ) 以及基于m 阶导数的距离公式,对于两个函数型数据五,x ,有 、脉帕( ,) 一 x ( j ,m ) ( f ) ) 2 d t ( 2 5 ) 对于函数型变量具体的测度问题,这里是建立在核函数的基础上进行说明 的,比如假设五,吒是属于函数空间f 的刀条函数型数据,x 为一个f 中固定 的元素,对与核函数的局部加权量: 上k ( 型) ( 2 6 ) v ( 厅) 。h 其中,d 表示f 中的半度量距离,k 是一个核函数,而v o ) 则表示成一个“小 球” b ( x ,h ) = x f ,d ( x ,x ) 乃) ( 2 7 ) 这个“小球 可以看成是以x 为中心,h 为半径构成的 2 】。同时就能定义 函数型核局部加权变量: k ( 型) 妒雨h q 盘 e ( k ( 型孚型) ) 对于函数型核函数k 一般情况下是对称的,下面我们看两个关于核函数的说明 定义5 : ( 1 ) 对于一个核函数k 有f k = 1 ,如果存在两个常数0 c l c 2 0 0 满足: c 1 1 【o ,l 】k c 2 1 ( 2 9 ) 则称该核函数为第一类核函数。 ( 2 ) 对于一个核函数k 有l 。k = 1 ,如果存在两个常数 c l c 2 o ,3 e o ,v 6 c 3 锻( 占) 则存在两个常数c i ,c 2 ,当h 充分小时有: c l 纹( 办) 胀( 亟每塑) c 2 纹( 办) 以上简单的介绍了关于函数型数据的一些基本概念和性质。 2 2 非参数蒙特卡罗方法的介绍 首先对非参数蒙特卡罗检验的做详细的介绍: n m c t 最初的动机来自检验几类重要的多元分布,现在已经发展成_ 般的 方法论。n m c t 方法分为可独立分解随机变量的n m c t 法和随机加权的n m c t 法。 下面分别介绍这两种方法。 2 2 1 可独立分解随机变量的n m c t 法: 定义6 随机变量x 称可独立分解,如果x = y z 依分布成立,这里,】,和 z 独立,】,z 表示】,和z 点乘,也就是:如果】,和z 是d 维向量, y z = ( y c l z n ,f d z d ) :如果z 是一维的,j ,z = ( y o ) z ,】,d z ) ;如果】,是一 维的,】,z = ( y z ( n ,y z ( d ) 。 如果已知】,或z 的分布,记x i ,表示样本i 的f f d 随机变量,如果薯在原假 设下可独立分解为= m 刁,则检验统计量t ( x i ,) 等于t ( y l g i ,此乙) 。 n m c t 方法为:给定7 , l ,乙,从】,的分布中独立产生一组参考数据爿,z , 则可得相应统计量的值t ( y 1 f z l ,以磊) 。假设如果丁值较大,原假设被拒绝;对 双边检验问题不难作出相应的调整。记由原始数据得到丁为乃,通过蒙特卡罗 产生m 组参考数据,相应得到m 个值,分别记为互,乙。统计量丁的p 值的估 9 计为 p = k ( r e + 1 ) , 其中,k 是巧,乙中大于r o 的个数。给定水平口,只要p 口,拒绝原假设。 由于r ( x 。,) 和丁( “z l ,一,z z n ) 同分布,而且给定z l ,一,乙,它们有相同的 条件分布,检验的可能精确有效。下面的命题说明这个性质。 命题1 在原假设下,向量x 可独立分解为】,z ,那么,对任何0 口 o ,厂( g ( x ) ) 0 ) s u p p ( k 2 ) = x :g ( 薯) 一g ( x ) o 由于 e ( 墅坐掣) = l p 肭) k ( 羔三立云盟) 厂( g ( 一) ) 如( 薯) + 点印p ( 钔k ( 巫兰l i 警盟) 厂( g ( 薯) ) 以( 薯) = l p 鹏) k ( q 1 ) ( g ( x ) + h q , ) a q , 一i u p 鹏) k ( q 2 ) f ( g ( x ) 一h q 2 ) d q 2 = l ,p ( h ) k ( g ) 厂( g ( x ) ) + 。( 1 ) 】蝈一l ,p ( 如) k ( q ) 【厂( g o ) ) + 。( 1 ) d q 2 = 厂( g ( x ) ) + d ( 1 ) 并日 1 4 砌,( k ( h - 1i g ( x _ ) - g ( x ) 1 ) ) 叫k ( h - i g ( x 。i ) - g ( x ) ) z 书( 坐塑掣) 】2 = h - f ( g ( x ”【l 。p ( 毛) 【k ( q 1 ) 】2 】鸩+ l ,p ( 屯) 【k ( q 2 ) 】2 】媲+ 。n - 办一1 ) + o ( 船一1 ) 所以引瑚得钎 引埋4 : 去喜础。1 - g ( 刮) 鬻( g ( 咿贴) ) - 删2 鬻鬻叫确 证明:由于 f l 眠! - 窆一,k ( h 。1 ) 一酬i 培( 誓) 一删 趔堕鳖鼍幽心盯吼坐丝鼍幽) ) 所以分成两部分, e ( 茎! 垒:! ! 量! 兰! 二墨! 兰! 垒! 墨! 兰! 二墨! 兰塑) 一、型业盟型坐丝掣似_ ) ) 如( 一) kpp(el、h 、“7 一j f 型业盟型迹亟掣厂( g ( 薯) ) 幽( 薯) supp(ki)h 。77 。、7 2 至u p p ( k i ) k ( q ) 厂( g ( x ) + h q - ) d q , 一l p p ( k 2 ) k ( q 2 ) f ( g ( x ) 一办q ) d q 根据文献【3 8 】,可得 以墅:堕兰! 二坐业盟二坐骂 新雕) 鬻+ d ( 确 而对应的 胁 墅盐盟掣娑塑幽业】 叫坐塑业雩崆坠型) 2 - ( e ( 墅坐盐萼崆幽) ) 2 = j l z 2 点叩,( 向) k ( q 1 ) 2 厂( g ) ) 研蝈一办2l ,p ( 屯) k ( q 2 ) 】2 厂( g ( x ) ) g 坦+ 。( 厅2 ) 再根据 3 s 引理5 1 ( 3 ) 可知 胁【墅业盟型婆堕幽】_ o ( h z ) 力 从而引理得证。 引理5 : 去喜砌。1 _ g ( x ) i ) 鬻( 她) g ( 砌2 川删肿) h 2 + o p ) 证明:同引理3 可得证。 引理6 :记r ( 觅) = r k ( “) ) 2 d u ,v a ,( e i ) = o r 2 ( g ( x ) ) 则 k ( h 1i g ( 葺) 一g ( x ) 1 ) q 哳 聍。1 丛1 证明: 】= ( n h ) 一r ( k ) a 2 ( g ( x ) ) 厂( g ( x ) ) + d ( ( 刀办) 1 ) k ( h i g ( x ,) - g ( x ) 1 ) s j h 。 k ( h 。1l g ( 为) 一g ( x ) i ) 毛 = 行一助 且1 y l - i u p p ( k i ) k ( q ) 】2 盯2 ( g ( x ) + h q l ) f ( g ( x ) + h q z ) d q l _ h - 1l p p ( k ( q ) 】2 c r 2 ( g ( x ) + h q e ) f ( g ( x ) + 坦坦 = ( ,2 办) 一1r ( 忌) 仃2 ( g ( x ) ) 厂( g ( x ) ) + d ( ( ,2 办) - 1 ) 定理3 - 矽( x ) 估计的渐近均方误差为 彳m s e 却厅2 鬻器厂( 删+ j 1 而0 2 簪t ( x ) ) 2 + 帮也 1 ) 证明:由以上的引理可知 e ( 乒( x ) 一矽( x ) ) 叫啪2 【鬻器广似砌+ j 1 而0 2 # ( x ) 】+ d 舯2 ) 并目, 1 6 刀。2 喜( 竺墨竺二学) 2 仃2 ( g ( 薯) ) 毫亚军面r 由于,z 。1 喜( ! 璺丝二上掣) 2 仃2 ( g ( 誓) ) = 厅1 r ( 后) 仃2 ( g ( x ) ) + 。p ( 办。1 ) 所以r a t i o ( x ) = n 一1 h 一1 r ( k ) o - 2 ( g ( x ) ) + 咋 一1 h 一1 ) 。 定理4 :假设g ( x ) 的分布f 连续,g ( x ) 和s 的四阶矩有限,且g ( x ) 的协方差 矩阵s 正定,则在原假设风下,jb ,其中”j ”表示弱收敛,b 是中心化得高 斯过程。 证明:首先将( 2 2 3 ) 式分解,有 乙2 了1 甩百 ,2 ( 1 g ( x 3 酬) - f ( 刺) ) ,n 一等勺( ( ) 一矽( ) ) ( ( , g ( 薯) g ( x ) ) 一f ( g ( x ) ) ) ) 、,n ,;l 1 n 1 + 了( ( _ ) 一( o ) ) 2 ( ( , g ( 一) g ( x ) 卜f ( g ( x ) ) ) ) + o ,( 1 ) v n ,;1 圭+ 厶+ 厶+ ( 1 ) 接下来只要证明乞和厶依概率收敛于零。 关于厶,有 s u p 兰( 参( _ ) 一矽( _ ) ) z 上式等于i 乘以矽的均方误差。根据定理3 ,可知击喜( ( 一) 一( _ ) ) 2 依概率 收敛于零。 关于厶,可以将矽( x ) 分解成, 1 7 缸h = 舞一器 = 驾铲叫x ,斧彳( x ) 一7 石( x ) ( 星! ( 型二鱼( 兰1 2 1 幺( 型二( 兰塑+ 丝! 型! 姜( 型二( 型2 : 彳( x ) 石( x )z ( 石) 石( x ) 类似与计算多( x ) 的均方误差,根据条件可得, ( 磊( x ) 一蜀( x ) ) 2 = d ,( ,z 。1 h 。1 )j _ 一一r 假设彳 ) 有界则, 窆( 幺( x ) 一石( x ) ) :咋n - i h 一- ) = l 厶= 去芸。( 警粼班删州删) 一击蔷n 喇( _ ) 警肌( 咖) g m ( 删) + d p ( 玎一h ) 全以( x ) 一以( x ) + d p ( 甩1 h 一) 接着证明以和以依概率关于x 一致收敛。 对于: ( 乃k ( 坦掣) 一蜀( 葺) ) 矽( _ ) 。 吲= l _ 而二( ( 咿贴) ) 叩( 贴) ) ) 以( x ) = 丢嘉善以+ 吲+ 。p ( 去) = 啪) 坞哓) = 办( 叫( 仍,协,x ) + 叼( 乃,研,x ) ) 一而( e ( 吲( 7 7 ,砚,z ) i 乃) + e ( 吲( 仍,刁,x ) i 仍) ) 其中,e ( 叼( 7 7 ,矶,z ) i 仍是给定乃,吲的条件期望。定义 石= 丢嘉若( 仍,仉,x ) 则以为u 过程 3 9 ,由于示性函数构成的函数族属于陀族,则对任意x ,函数 吲( ,x ) 可以看作中心化的示性函数( ,( x ) 一f ( z ) ) 与独立x 的给定函数的乘积, 对任意固定刀,函数族岛= ( ,j f ) :x r 1 ) 为函数型数据空间。由于, e ( ( 编,仍,x ) ) = 0 那么对于元的包迹为, 根据 3 9 可知, 其中, 对任意函数g , 乞( 7 7 1 ,r h ) + f 、1v fg ( x o g ( x 2 )、一n | 、一,r ,v 、石,1 一、o k 夕1 a l h j g l l x 2 ) ) - g t x 2 ,l x 2 ,6 2 z ( ) f 、。l ,fg ( x 1 ) 一g ( x 2 )、一,r 1 一、一n ,v 、石,、o l y 2 a l 办 广g t ( x t ) ) - g t x i 肜l 工2 ,6 1 石( ) e s u p l 莓c 仍,乃,x ) l 饱c + 以以c 皖n 以( s ) = r l n 2 咖 以= ( 乇刚2 ,铲1 斗鳓s u p ( t 9 2 ) 瓦g 圭e 9 2 ( r h f ,1 2 j ) + 9 2 ( t h l _ l ,r 2 ,) + 9 2 ( r h h ,r 2 一1 ) 其中,n 2 表示瓦的测度。根据 4 0 引理i f 2 2 5 ,可知存在独立,z 和瓦的正数c 和 w l ,下式依概率成立: 1 9 丁仃: ,r ( 只k ( 掣) 一g ( _ ) ) ( _ ) 勺、: 瓦盟蔷t = l 丽1 丁竺) 2 ,= l , ,。( 眈儿) ,。( 1 4 ) = 疗2 上( 4 n 2 ) h 1 ( 2 胁 :一c ,z 2c ,( 4 矿h l 砌 句 = c i n n 以及, 力= 瓦研= o ( h n 2i n 2 刀) 口j 所以,对足够大的刀,e s u p ,i “呢( 仍,现,x ) c 而l i l 船,那么可知, 彳= 击喜e ( 吲( 吼棚抄咀l n 聆厮) = 击驷h c 嗍坦型) q k ( x j ) ( i ( g ( x j ) g ( x ) ) - f ( x ) 从c 划j , + d j 口( h l 刀鬲) 根据条件,对任意x j , e ( v - g ( 擞鲤掣) _ d ( 厅 和, v a r ( e ( ( y - g ( x j ) ) k ( 坦型删c 删咖脚,志坳 = o ( h 2 川) 根据e 4 1 定理3 1 可得,以依概率收敛于零,同理可证, 1 2 依

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论