(应用数学专业论文)基于nqd样本密度函数估计的渐近性质研究.pdf_第1页
(应用数学专业论文)基于nqd样本密度函数估计的渐近性质研究.pdf_第2页
(应用数学专业论文)基于nqd样本密度函数估计的渐近性质研究.pdf_第3页
(应用数学专业论文)基于nqd样本密度函数估计的渐近性质研究.pdf_第4页
(应用数学专业论文)基于nqd样本密度函数估计的渐近性质研究.pdf_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于n o d 样本密度函数估计的渐近性质研究 摘要 本文主要研究了基于两两n q d 样本的密度函数估计问题,得到了两两n q d 样本下 最近邻估计和核估计的大样本性质,如相合性、渐近正态性及收敛速度等从而推 广了独立同分布和其它相依情形下相关的结果 全文共分四部分 第一部分介绍了密度函数估计的背景、意义、方法及本文的主要成果 第二部分介绍了基于两两n q d 样本最近邻密度估计的相合性并讨论了它们的 收敛速度 第三部分重点讨论了基于两两n o d 样本密度函数核估计的强相合、一致强相合 及,一阶矩相合 第四部分讨论了基于两两n q d 样本密度函数核估计的渐近正态性 关键词n q d 样本最近邻估计核估计相合性收敛速度渐近正态性 4 o nt h er e s e a r c ho ft h ea s y m p t o t i cp r o p e r t yo ft h e d e n s i t yf u n c t i o ne s t i m a t i o nu n d e r p a i r w i s e s n e g a t i v eq u a d r a n td e p e n d e n ts a m p l e s a b s t r a c t t h i sp a p e ri sm a i n l yc o n c e m e dw i t ht h ed e n s i t yf u n c t i o ne s t i m a t i o np r o b l e m s u n d e rp a i r w i s e sn q ds a m p l e s ,b a s e do nw h i c hw eg o tt h ec o n s i s t e n c y ,a s y m p t o t i c p r o p e r t ya sw e l la st h ec o n s i s t e n c yr a t e sa n d o t h e rl a r g es a m p l ep r o p e r t i e so ft h en e a r e s t n e i g h b o re s t i m a t i o na n dk e m e le s t i m a t i o n a ut h es t u d i e st o g e t h e rh a v ep r o m o t e dt h e c o n c e m e dr e s u l t si ni i dc a s ea n do t h e ra s s o c i a t i o n s t h i sp a p e rc o n s i s t so ff o u rp a r t s i nt h ef i r s ts e c t i o n ,w ei n t r o d u c e ds o m eb a c k g r o u n di n f o r m a t i o n ,s i g n i f i c a n c e , t h ew a yo fd e n s i t yf u n c t i o ne s t i m a t i o na n dt h ec h i e fr e s u l t so ft h i sp a p e r i nt h es e c o n ds e c t i o n w ei n t r o d u c e dt h ec o n s i s t e n c yo fn e a r e s tn e i g h b o rd e n s i t y e s t i m a t i o nu n d e rp a i r w i s e sn q ds a m p l e s i na d d i t i o n , w ea l s od i s c u s s e di t sc o n s i s t e n c y r a t e s i nt h et h i r ds e c t i o n , w ef o c u s e do u ra t t e n t i o no nt h ed e n s i t yk e r n e le s t i m a t i o n u n d e rp a i r w i s e sn q ds a m p l e sa n dm a i n l yt a l k e da b o u ti t ss t r o n gc o n s i s t e n c y ,u n i f o r m l y s t r o n gc o n s i s t e n c ya n dt h ec o n s i s t e n c yi nr - t ho r d e rm e a n i nt h el a s ts e c t i o n 。w ei n v e s t i g a t e dt h ea s y m p t o t i cn o r m a l i t yo fd e n s i t yf u n c t i o n k e m e le s t i m a t i o nu n d e rp a i r w i s e sn q d s a m p l e s k e yw o r d sn q ds a m p l e s ,n e a r e s tn e i g h b o re s t i m a t i o n ,k e r n e le s t i m a t i o n , c o n s i s t e n c y , c o n s i s t e n tr a t e ,a s y m p t o t i cn o r m a l i t y 5 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我 所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究 成果,也不包含为获得 金胆王些盔堂 或其他教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:请马蔼签字日期:沙肛钿,6 日 学位论文版权使用授权书 本学位论文作者完全了解金月曼工些太堂有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权金胆工些太 当生可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等 复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 浒岛尚 签字日期:乙- 基石月z 名 学位论文作者毕业后去向: 工作单位: 通讯地址: 3 导师签名: 洲争 签字日期:d 降b 月【,毛e l 电话: 邮编: 致谢 首先,感谢合肥工业大学数学系为我提供了难得的学习机会和良好的学习、生活 环境。 本论文是在导师凌能祥教授的支持、鼓励和精心指导下完成的在我研究生三年 的学习过程中,导师渊博的知识、深厚的学术造诣、忘我的工作精神深深的感染着 我,给了我深刻的启发和教诲,使我受益终生。 三年的学习期间,杜雪樵教授和惠军副教授等老师的教育培养也对我的成长起 到了很重要的作用。在此,我要向诸位老师深深地鞠上一躬。 感谢数学系2 0 0 5 级应用概率统计方向的研究生同学和你们相处的三年中,我们 在学业上共同进步,在生活上互相关心,度过了很多快乐的时光特别感谢和我同一 个导师的同学彭小智、何伟和李雯,还有武志辉同学,和你们共同的学习和讨论帮助 我在学习中克服了很多困难 最后,感谢我的家人多年来给予我的关心、鼓励和支持。他们无微不至的照顾 使我能够顺利完成学业,实现自己的理想 再次衷心感谢所有关心和帮助我的家人、我的老师和同学们1 6 作者:许昌满 2 0 0 8 年5 月 第一章综述 1 1 密度函数研究的背景及意义 概率密度函数,是概率论、数理统计中的最重要概念之一。概率密度函数估计 问题也一直是数理统计学中讨论的热门问题。所谓密度函数估计,就是要通过从总 体中抽得的样本去估计其概率密度函数。在统计中,总体分布常常是未知的,当总 体x 为连续型随机变量时,总体分布便可以用总体密度函数f ( x ) 来刻画。而f ( x ) 是 未知的,这就需要我们用样本来对它进行推断,这就提出了密度估计问题。即设 五,五,以是从未知概率密度函数( x ) 的总体中抽出的随机样本,根据这些样本 去做f ( x ) 的估计,也就是说,要对指定的工的值去估计f ( x ) 的值。 密度函数估计的方法很多,直方图( h i s t o g r a m ) 法是其中最简单而常用的密度 估计方法。此法是基于概率密度的一个基本性质:即随机变量x 如有密度厂,则x 取值在区间 口,6 】的概率尸( 口x 6 ) 等于 厂 边,若有样本五,五,以,则 尸( 口x b ) 可用 # ( f :1 f n ,口五6 ) 肛去估计, 因此, p ( 口x b ) l ( b - a ) 即i 。f ( x ) d x l ( b 一口) 即可用 # ( f :l f 甩,口置b i ) n ( b 一口) 去估计 当b - a 充分小时, f ( x ) d x l ( b - a ) 可近似代表f ( x ) 在区间【口,b 】上之值,这样 就得到了厂的一个估计。基于上述原理,这方法可描述如下: 选择一个适当的正数吃,把全直线分为一些长为死的区间,任取这些区间之 一,记为,对x i ,以 # ( f :l fsr l , 五i ) n h ( 1 1 ) 作为f ( x ) 的估计,这个估计的图形是一个长为吃的阶梯型。若从每一端点向底边作 垂线以构成矩形,则它由一些直立的矩形排在一起而成的。此处,# ( 彳) 表示集合彳 所包含的元素的个数。 直方图估计的优点在于简单易行,且在行较大因而容许吃较小的情况下,所得 图形尚能显示密度的基本性质。但也有明显的缺点,它不是连续函数,且从统计的 角度来看一般说效率较低。例如,在这一方法下,对区间中心部分密度估计比较精 确,而对边缘部分则较差。 为克服直方图估计方法的缺点,r o s e n b l a t t 【1 11 9 5 5 年提出了一个简单的改进。 指定一个正数吃如前,对每个x ,以,。记以x 为中心,长为吃的区间,即 h 冬,工+ 冬】,用代替( 1 1 ) 式中的,算出的值作为厂在点z 处之值厂( x ) 的估 计,这就是r o s e n b l a t t 估计。我们用o ) = 五协x l ,以) 表示这个估计,则有 五( x ) = 撑( f :l f 刀,五l ) 厶 ( 1 2 ) r o s e n b l a t t 估计与直方图法不同之处仅在于,它事先不把分割区间定下来,而 让区间随着要估计点x 跑,使x 始终处在区间的中心位置,而获得较好的效果。理 论上可以证明:从估计量与被估计量接近的数量级上看,r o s e n b l a t t 估计法确实优于 直方图。 但r o s e n b l a t t 估计仍为一阶梯函数,只不过与直方图估计比起来,各阶梯的长 不一定相同而已,仍为非连续曲线。从r o s e n b l a t t 估计的定义可以看出,为估计厂在 点x 之值f ( x ) ,对与x 在一定距离( 确切地说,是吃2 ) 内的样本,所起得的作用 是一样的,而除此之外毫不起作用。显然,为估计厂( x ) ,与x 靠近的样本,所起得 作用应比远离的样本要大些。 为此,p a r z e n l 2 1 在此基础上做了如下的改进: 引进函数k ( 工) :五- l ,2 m ,o ) : 1 当一主x 工气i , ( 1 3 ) 1 0 ,其它x 则估计( i 2 ) 可改写为 胁,= 去“等 4 , ( 1 3 ) 中定义的密度函数是一种特殊的密度函数,即区间卜去,匀上的均匀密度。 基于此考虑,p a r z e n 又做了推广,去掉了k ( ) 为均匀密度这一特殊性,而容 许k ( ) 可以为一般的密度函数。于是提出了另一类很重要的密度估计,即核估计 它的定义如下:设k ( 。) 为( - o o ,佃) 上的b o r e l 可测的概率密度函数,吃 0 是一个同 r l 有关的常数,定义 胎,= 去喜k ( 等 5 , 称以为总体未知密度厂的一个核估计,其中k ( ) 为核函数,为窗宽。 这一定义考虑的是x 为一维的情况。若x 为d 维,只须将( 1 5 ) 式中分母帆改 为玎彰,可见,r o s e n b l a t t 估计( 1 2 ) 是核估计( 1 5 ) 的一个特例,其中k ( ) 由( 1 3 ) 式所确定。 从以上定义我们可以看出,核估计既同核函数k ( ) 的选择有关,又与窗宽吃的 选取有关。在给定样本之后,一个核估计性能的好坏,取决于核及窗宽的选取是否 2 见的一种密度估计方法。这是l o f i s g a r d e n 和1q u e s e n b e r r y l 3 l 在1 9 6 5 年提出的。此法较 设五,五,咒是从未知概率密度函数f ( x ) 的总体中抽出的随机样本,先固定 一个介于1 和刀的自然数乞,对任何z ,以q ( x ) = ( x ,五,以) 记最小的a ,使 【x - a ,x + a 】中至少包含五,五中的屯个,然后以 作为总体密度f ( x ) 的估计。显然,与核估计相反,此处区间长度2 o ) 是随机的, 徘) :脚x i 引 ( 1 7 ) x i 1 椭。而1 喜k ( 茜) 献 4 3 4 4 ) 、随机数的模拟、多峰性检验、各种密度泛函估计( 见文献 4 5 - 4 6 ) 等等。 1 2 密度函数研究已有结果 在非参数密度估计中,对f ( x ) 只作些很一般的假定,比如连续、有界、有直 到某一阶的导数,这都不足以导出比较深人的小样本性质。可以说密度估计的理论 几乎都是大样本方面的,对固定的刀黜,我们甚至不能要求f a x ) 是无偏的。所以 我们一般讨论它们的大样本性质。关于估计m l ( x ) 的极限性质,人们感兴趣的主要 是: ( 1 ) 渐近无偏性; ( 2 ) 弱相合性; ( 3 ) 强相合性; ( 4 ) 一致相合性: ( 5 ) 渐近正态性: 进一步考虑收敛速度。 关于最近邻密度估计( 其定义同( 1 6 ) ) 的渐近性质,人们最初是从独立同分 布情形下开始研究的,o u e s e n b e r r y1 9 6 5 年在 3 中给出了近邻密度估计的弱相合 性,w a g n e r1 9 7 3 年在 4 中给出了以o ) 的强相合性和一致强相合性,陈希孺1 9 8 0 年在 5 中对此估计的渐近正态性给予了证明。这些结果如下: 1 ( 弱相合) 设 以;刀l 是抽自总体分布x 的独立同分布样本,x 有密度函数 f ( x ) ,设吒满足条件屯专,旦一0 ,则当总体分布函数f ( x ) 在点x 连续,有 以( x ) ( z ) ,当刀 0 0 时 2 ( 强相合) 设 以;刀l 是抽自总体分布x 的独立同分布样本,x 有密度函数 厂( x ) ,设吒满足条件吒一,笠一o ,! l j ,则当总体分布函数厂( 石) 在点x 连 续时,则有 五( x ) 专厂( x ) ,0 , 3 当刀专0 0 时 3 ( 一致强相合) 设 以;疗1 ) 是抽自总体分布x 的独立同分布样本,x 有密度函 数f ( x ) ,若f ( x ) 在( - o o ,+ 。o ) 一致连续,且乞满足条件吒斗, 益专0 ,1 些寸,则有 刀4 n l o g 疗 舰h u p 抽州1 ) = o 跳 4 4 ( 渐近正态性) 设 以;刀1 是抽自总体分布x 的独立同分布样本,彳有密度函 数f ( x ) ,设f ( x ) o 且存在自然数,2 使厂n o ) 存在,而 厂2 ( z ) = f o ) ( x ) = = f ( r - i ) ( x ) = o 且乞专,毛= o ( n 2 7 ,( 2 川) ,则有 屯( 厶( x ) 一f ( x ) ) f ( x ) - - n ( o ,1 ) 除讨论相合性及渐近正态性外,杨善朝在 6 还研究了独立同分布下强相合的 收敛速度可达o ( n 。1 佑( 1 0 9n ) 3 ) , 具体结论如下: 5 ( 收敛速度) 设存在正数列 ;刀l ,使得吒和气满足,且在点x 处满足吒- - o o , l 专o ,五斗o ,三一a o ,i e l f ( x ) 在x # k 满足:l i r a s u p l f ( x - - 厅) 一厂( x ) i m h r 1 0 9 ”h-+o 。 。 则当n 专o o 时,有 | i l f a x ) 一( x ) i = d ( l ) ,口j 1i 特别坤,若取一- - 2 仃 l z ( 工) 一厂( x ) l = o ( n 1 ( 1 0 9n ) “3 ) ,口j 但在很多情况下样本都不是独立的,所以很多学者在相依的情形下讨论了最近 邻密度估计的大样本性质。b o e n t eg 和r a i r n a n r1 9 8 8 年在 7 中讨论i 旷混合样本 下最近邻密度估计的相合性,柴根象1 9 8 9 年在 8 中对b o e n t eg 和f r a i m a nr 的结果 进行了改进。之后,柴根象又在 9 中讨论了口一混合样本下的最近邻密度估计的相 合性及它们的收敛速度,弱化了在 8 中结论的条件。在n a 样本下,杨善朝2 0 0 3 年在 1 0 中讨论了它们的相合性及收敛速度,同时还得到了失效函数的一致强相合性。 对于两两n o d 序列情形下,刘妍岩则在 1 1 中讨论了密度函数最近邻估计的弱相合、 强相合及一致强相合性。 以上都是关于密度函数最近邻估计的研究,而由于密度函数核估计方法( 其定 义同( 1 5 ) ) 的种种优良性,且便于理论分析,所以在很多文献中,核估计也成为密 度函数估计的主要研究方法核估计最先是由p a r z e n 乜1 在1 9 6 2 年提出的,之 后,p a r k a s a 、陈希孺畸1 及熊丹n 2 1 等对独立同分布下的随机变量序列的概率密度函数 的核方法及其大样本性质进行了卓有成效的研究,得到了如下的结论: 1 ( 逐点相合) 设k ( ) 是定义在( 一o d ,+ ) 的概率密度函数,满足条件: ( 1 ) k ( ) 有界, ( 2 ) f 1 k ( ”) 融 0 之后,其他学者对于密度函数核估计的研究,在不同的情形下也取得了一些结 果:在缈一混合下,林正炎1 9 8 3 年在文献 1 3 中讨论了它的均方相合性和渐近正态 性。李军则在 1 4 中讨论了一混合下密度函数核估计强相合性的条件。韦来生2 0 0 1 年在 1 5 中讨论了限制在区间 口,6 】上核估计的强相合、一致强相合性和r 阶矩相合 以及它们的收敛速度。而杨善朝2 0 0 2 年在文献 1 6 中,取消了文献 1 5 中在区间 【口,纠上的限制,对n a 样本下密度函数核估计进行了进一步的讨论,得出了相应的结 果,并使条件得以弱化;同时对p a 样本下的密度估计也进行了讨论,取得了相应的 结果。此后,2 0 0 5 年在文献 1 7 中杨善朝进一步研究| n a 相依样本下经验分布函数估 计和密度函数核估计的一致强相合性:在线性过程误差下,凌能祥2 0 0 4 年在文献 1 8 讨论了它的均方相合性。对于密度函数估计的渐近正态性的研究,杨善朝1 9 9 6 年在 6 文献 1 9 中对旷混合样本密度核估计的渐近正态性做了证明,后来,潘建敏啪1 建立 t n a 序列中心极限定理的收敛速度。c a m p o s 乜妇给出了i a d 样本下一般形式的密度函 数的渐近正态性;2 0 0 0 年r o u s s a s 在文献 2 2 中对n a 样本下密度函数核估计的渐近正 态性做了详细的证明在此基础上,李永明,杨善朝先后在在文献 2 3 】和 2 4 1 中又得 到了n a 样本递归密度函数核估计的渐近正态性和密度函数核估计的一致渐近正态 性,同时给出了其收敛速度。此外,对于渐近正态性的研究,孙志宾在文献 2 5 中 讨论了口一混合及p 一混合情形下一类概率密度函数估计的渐近正态性。综合上述 文献,我们发现,在两两n q d 序列下密度函数核估计的大样本性质至今还很少有文献 对其进行讨论。 两两n q d ( n e g a t i v eq u a d r a n td e p e n d e n t ) 序列是l e h m a n n l 9 6 6 年在 2 6 中 提出的,其定义如下: 称随机变量j 和j ,是n q d 的,若对任意丘y r ,有 p ( x x ,y y ) p ( x 0 在定理1 中若取吒= i n 3 h ( 1 0 9 n ) “4 】,则当r l 专时,有 l l ( x ) 一厂( x ) i = o ( n h ( 1 0 9 n ) 4l o g l o g n ) ,她v x c ( 力 定理2 ( 一致强相合收敛速度) 设 置,l f 疗) 为同分布的两两n q d 的,协序列,存在正数列 吼:疗1 ) 使得乞和吼满 足吒- - o o , q - - 0 , 篙jo 了鲁j ,有共同的密度函数厂( 石) ,且厂( x ) 在f 上满足局部l i p s c h i t z 条件,则当刀专时,有 s u p l f ( x ) 一( z ) l = o ( q 。) ,0 8 v x c ( 力 推论2 设 置,1 5 ,疗 为同分布的两两n q df k j r v 序列,有共同的密度函数 ) ,厂( x ) 在r 1 上 满足局部l i p s c h i t z 条件,在定理2 中若取毛= i n 2 仃( 1 0 9 n ) “3 】,则当疗_ 时有 s u p l ( 工) 一( x ) | - d ( 刀。1 旭( 1 0 9 n ) 6l o g l o gn ) ,口j v x c ( 门 1 3 2n q d 样本下密度函数核估计的相合性 定理3 ( 强相合) 8 设 置,1 is 捍) 为同分布的两两n q d 的r 序列,有共同的密度函数f ( x ) 设k ( u ) 为 ( ,佃) 上的有界变差概率密度,若舰死= o ,e i x ( “) 阻 o , e x p - 2 玎瑶 ,则有 n = l ( x ) 一( x ) 0 ,a , sv x c ( 门 定理4 ( 一致强相合) 设 置,1 f 疗) 为同分布的两两n q d 的厂肌序列, 致连 续设k ( 掰) 为( 棚,悃) 上的有界变差概率密度, l i m 粤:佃,则有 有共同的密度函数f ( x ) 且f ( x ) 一 若! 骢= o ,e i k ( 掰) 觇 佃, l 曲s u p l f , ( x ) - f ( x ) i - o ,口j v x c ( 力 月”j 定理5 ( ,一阶矩相合) 设 置,1 f 刀 为同分布的两两n q d 的,序列,有共同的密度函数f ( x ) 且对任意 ,1 ,e a r , = 0 ,设k ( u ) 为( 一,+ ) 上的有界变差概率密度,若 limh。:0,fflk(1im 0 甜) 伽 佃,l i m n h 2 :佃,则有o = ,甜) 觇 0 为与玎有关的一个常数 9 第二章基于n q d 样本密度函数最近邻估计的强收敛速度 2 1 引言 设置,五9 lj ,以是从未知概率密度函数f ( x ) 的总体中抽出的随机样本,固定 一个介于l 和n 之间的自然数吒,对任何x ,以( x ;五,k ) 记最小的a 使 b a ,x + 口】中至少包含五,以中的屯个,然后以 。( x ) = 吒2 n a ( x ) 作为总体密度函数厂( x ) 的估计,区间长度2 ( x ) 为随机的,而区间内所含的 样本点的个数为固定的。我们称这样的估计为“最近邻密度估计 ( n e a r e s tn e i g h b o r e s t i m a t e ) ,简称n n 估计,这里离每一个x 最近的屯个数据都用来估计厂( x ) 。 称随机变量j 和j ,是n o d 的,若对任意x , y r ,有 尸( r z ,y y ) 尸( x ) ) 吃= i o ) 一( x ) f 吼 ,形,= e + u a x ) ) 一e o 一心( z ) ) 益 l 月j r、 ,= c + 屹( 工) ) 一c o 一( x ) ) 蔓,( 工) g 吼 哌= i l ( x ) - f ( x ) i 占吼 = 五( 石) 厂o ) + u z ( 石) ( 功+ 叼。) u z ( x ) 占吼) c e o + ( z ) ) 一e o 一( x ) ) 益 l n j u e o + ( z ) ) 一c o 一屹( x ) ) s 墨立 l刀j = :彬,u , 类似于命题2 2 2 中的证明有 e ( x + ( x ) ) 一c ( x 一( x ) ) 一f ( x + ( x ) ) + f ( x 一( x ) ) 、吒厂( z ) 一厂( q ) + g 吼 n f ( x ) + 占吼 e ( x + 1 j i ( x ) ) 一e ( x 一( x ) ) 一f ( x + 屹( z ) ) + ,( x 一1 0 ( x ) ) 0 ,以及吼j 0 且_ o 知, n q 当7 1 充分大时,有 川鼠) 阳x ) 卜o , 1 5 东 生盟三一 刀 f ( x ) + 占g 。 疗 f ( x ) + e q 刀4 m k f ( x ) - f ( o 2 ) - 8 q 2 u 慨( ( 啡等 = :g ,uq 2 , 同理 ,c c ( x + 屹( x ”一m + 屹( 瑚盟, u 彳c ( x - v ( 枷一f ( x - v ( 砌盟 = :g 。uq 4 。 1 2 故有 吸cq ,uq 2 ,uq 3 ,uq 4 j 类似于命题2 2 1 中的证明过程,有 尸c q j ,) p c 哪善4 啤唧 一警) , 由b o r e l - c a n t l e lli 引理得 l z ( x ) 一( 工) l = 。( 9 。) ,口j 推论2 3 1 设 置,l i ” 为同分布的两两n o d 的,v 序列,有共同的密度函数f ( x ) :若f ( x ) 在 石处满足局部l i p s c h i t z 条件_ rf ( x ) o 若取乞= 【j l , 3 4 ( 1 0 9 n ) 4 1 ,则当r l - - ) o o 时,有 i ( x ) 一( x ) i = o ( n 以h ( 1 0 9n ) “4l o gl o g n ) ,a 8 1l 证明:由条件容易验证定理2 3 1 的条件成立证毕 定理2 3 2 设 正,l f 刀 为同分布的两两n o d 的,以序列,有共同的密度函数厂( x ) ,存在正数 列 g ,:腔l 髑椭她枷以训,寺硼惫郴r f ( 曲桃让龊 聆口一。 f 以i o 口腔 局部l i p s c h i t z 条件,则当疗寸o o 时,有 s u p l z ( 小似) l - d ( m 觚 证明:由定理2 3 1 的证明过程可知 只需证明:当玎充分大时,( 牛1 ) 、( 水2 ) 式关于x 一致成立即可由f ( x ) 在r 1 上满足 局部l i p s c h i t z 条件知,( 木1 ) 、( ,l c 2 ) 式中的( x ) 可取为与x 无关的正常数,记为三, 由嘉一溉存在 l ,使当刀时,有嘉 ;2 ,n q :s n q 二 从而 m 川q ) i 丽雨l k 面羔 0 ,当n 充分大时,有 三 邮尸( 。搿。i e ( 一f ( x n ) i 譬) ( 1 e ( h ,) 一,( 矗,) l 譬) = 秘匠现i 警) 此处 q i = i 嶙i x n j e i 媾i x 。i 一 易见 切,i 1 ) 是关于五非增的, 则由引理3 2 1 可知 仇,刁2 ,巩仍为两两n o d 序列 且 = o ,i r k 云l o 双甩) 从而 飙陆研l 警) 2 ( ) e x p ( - 3 1 唧) 6 ) o o 故由b o r e l - c a n t l e l l i 引理得 s u p f , , ( x ) - f ( x ) l i = d ( ,) ,口j 证毕 引理3 2 设k ( ) 为定义在( 棚,佃) 上的有界核密度函数,则当:受吃= o 时,有 l i m 职( 石) = 厂( 工) ,v x c ( 门,其中c ( 厂) 缈的连续点集;又若厂( x ) 一致连续, 则有 l i m s u p l e f ( x ) 一厂( 刮= 0 证见文献 3 6 引理3 2 6 ( 推广的k o l m o g o r o v 型不等式) 设 五,l f 聍 是两两n q d 列,e x = o ,础 - 2 ,q 是仅与p 有关的常数。 证见文献 3 7 3 3 3n q d 样本下密度函数核估计的相合性 定理3 2 1 ( 强相合) 设 z ,1 i 刀 为同分布i 懒n q d 序列,有共同的密度函数f ( x ) 设k ( u ) 为 ( 咱,佃) 上的有界变差概率密度,如果1 1 巴吃= 0 ,口k ) 阻 0 ,有e x p 五刀瑶 o ,使k ( x ) i m 。两螂m h 半n 聃斟m ,方 懈e 印 一希小2 唧t 一葛甄f 纭即 一嘉卜冲 - 喇) e x p - 2 n h ;) 二。以 二。以: n 。- - - - 。p c i l ( x ) - e f ( x ) i 占) i ( x ) 一既( 石) i 一0 ,a a ( n 斗) i l ( x ) - f ( x ) l 阮( x ) 一矾( x ) i + i 矾( 功一厂( x ) i 1 9 足理3 2 2 ( 一致强相合) 设 工,l f 刀 为同分布的两两n q d 序列,有共同的密度函数厂( 工) 且厂( x ) 一 致连续设k ( u ) 为( 啦,佃) 上的有界变差概率密度,如果j i m = 0 , 肌“枷 l i r a 嵩2 佃,则有 l i m s u p l f ( x ) - f ( x ) l = o ,口j 一- o o 证明: 由k ( ) 为有界变差,使用分部积分可知 s u p j 厶( x ) 一矾( 刮2s u p 砖亡k ( 等) 以( ,) 一击亡k ) 印( ,) l - s u p 皓亡k ( 等) d 亿( d 一,) i s u p 陡肌旷脚( k ( 等) ) | 玄s u p 。f ( 矿即) 眦) 其中y ( k ) 为k ) 的有界全变差 由题设条件及引理3 2 4 得 s u p l f 。( x ) 一f ( x ) i 矿( k ) 一o ,们 ,i 工 所以 l i m s u ,p l f ( x ) 一既( x ) 1 2 0 ,觚 又由引理3 2 5 知 l i m s u p e f n ( x ) - f ( x ) i = 0 , n 而 s u p l f ( x ) 一厂( x ) i s u p l l ( x ) - e f ( x ) l + s u p l e f ( x ) 一厂( x ) i 故 j ! i r a s u p l f ( x ) - f ( x ) i = o ,口j 一- ,- 证毕 定理3 2 3 ( ,一阶矩相合) 设 置,l f 力 为同分布的两两n q d 序列,且对任意,l ,瓯= o ,设k ( u ) 为 ( 一,+ ) 上的有界变差概率密度,如果臼k ) 阻 2 时,由c ,不等式得 e l l ( x ) 一f ( x ) 1 7 c :l i ( x ) - z s ( x ) l + g l z i u o f ( x ) 1 7 = :以+ 以 由引理3 2 5 ,易知 l e l ( x ) 一f ( x ) 1 7 专o ( n 斗) , 即 以一o ( n 呻) 故只需证明 以专o ( n j ) 由定理1 的证明,有 以= c l e 胁) 一职( x ) 1 7 2 袅e i s 一乙卜南( e m + e 阶 由引理3 2 7 得 e i 瓯1 7 c 喜i r | ,+ ( 喜e r 2 ) j c ( 刀+ 刀;) m n ; lf = l j i一, i 埘c ,胁7 + 陲1 = 1 盟烨i 赢m n ; l ,= i , i 2 l 故 因为 所以 故 证毕 以相稚轰川w 乒 l i m n h 0 = + , 一- + l i m e i z ( x ) 一f ( x ) 1 7 = 0 打 第四章基于n q d 样本密度函数核估计的渐近正态性 4 1 一些假设条件及记号 ( a ) z ,1 i 甩 是严平稳序列,有共同的密度函数( x ) 且毯2 o o ,:。i c d v ( 五,+ 。) i o o ( b ) 如果彳。,是, ,j 墨,x ,+ l 的联合概率密度,对f v u ,1 ,r ,1 ,都有 h ( “,v ) - f ( u ) f ( v ) i c ( c ) k ) 为( 一,+ ) 上的有界变差概率密度,且,! i m ( 1 u l k ( u ) ) = 0 对v u r ,k ( 甜) c ,k ) 存在且有界即l k 。 ) l b ( d ) 正数列见、q 。满足1 1 罂见吒n = 1 1 i r a ,p a = o ,! i 巴见2 n h = o 一 疗+ 打 其中七= 胁从p + g ) 】,七= 吒- - o o ,【x 】为椭整数部分,七( p + g ) 以,丛趔_ 1 0 o e t i c o v ( 五,+ 。) l - , o 注:由此可推出l i r a 吼屯n = 0 记号: ( x ) - g ( 气,乙2 击( 一e ) ,z ( 石) = 去1 喜k ( 等)( x 1 p ,乙2 赤一e ) ,z ( 石) 2 面善k ( 气p ( 一) 瓯= 厮( 删一既( x ) ) = 生丽一 疗 = 乙 善l 0 - 2 = 0 2 ( x ) = ( x ) 工k 2 ( 材) 妣x c ( 力 则利用大( p 一) 小( q - ) 分块原理,s 。可分解为 瓯= 砖+ + 其中 最= ,鼠。= 屯,鼠。= 比小 k = ( m 1 ) ( p + g ) + l ,乙= ( 历一1 ) ( p + g ) + p + l ,m = l ,k 4 2 几个引理 引理4 2 1 若随机变量和y 是n q d 的,若可2 ( x ) 0 0 ,如2 ( 】,) o o ,且八x ) 、g ( 聊均非 乙 m 。 = 批乙 m = 乙 心 = 增,则有 c o y ( f ( x ) ,g ( 即) 0 证明: 令t t ( x ,y ) = p ( x x ,y y ) - p ( x x ) p ( y y ) , h q n q d 定义p ( x z

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论