(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf_第1页
(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf_第2页
(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf_第3页
(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf_第4页
(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(概率论与数理统计专业论文)不同数据下半变系数模型的统计分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

原创性声明 本人声明,所呈交的学位论文是本人在导师指导下进行的研究 工作及取得的研究成果。尽我所知,除了论文中特别加以标注和致谢 的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不 包含为获得中南大学或其他单位的学位或证书而使用过的材料。与我 共同工作的同志对本研究所作的贡献均已在论文中作了明确的说明。 作者签名:褴日期: 埠年丛月笠日 学位论文版权使用授权书 本人了解中南大学有关保留、使用学位论文的规定,即:学校 有权保留学位论文并根据国家或湖南省有关部门规定送交学位论文, 允许学位论文被查阅和借阅;学校可以公布学位论文的全部或部分内 容,可以采用复印、缩印或其它手段保存学位论文。同时授权中国科 学技术信息研究所将本学位论文收录到中国学位论文全文数据库, 并通过网络向社会公众提供信息服务。 作者签名:之幽导师签名互,一客二匕日期:三盟年卫月盥 摘要 半变系数模型,又称为半参数变系数部分线性模型,是由 f a n & z h a n g ( 2 0 0 2 ) 在检验变系数模型的系数函数是否真正变化时提出 来的一个新模型。它涵盖了许多通常的参数、非参数以及半参数回归 模型。由于该模型不但结合了线性模型易于解释的优点以及非参数模 型稳健的特性,而且能动态地描述协变量与响应变量之间的关系,同 时也避免了许多“维数祸根 问题,所以,这个模型自提出以来就得 到了很多的关注和研究,并广泛应用于工业、农业、金融、地理等领 域。 在经典的回归模型中,一般假定所得到的数据都是完全的、可靠 的,并且误差项是相互独立的。而在实际应用中,由于人为或者系统 的原因,这个假定是很难满足的,至少度量误差总是存在的。所以, 研究存在度量误差的半变系数模型就更具有实际意义。为此,本文先 讨论了完全数据下误差独立与误差相关的半变系数模型的统计推断 问题,然后系统研究了协变量x 与z 同时存在加性度量误差的半变 系数模型的估计问题。 本文主要结果之一是对完全数据下的半变系数模型分误差独立 和误差相关进行了讨论,得到了相应的估计方法和处理办法。 主要结果之二是研究了协变量x 与z 同时存在度量误差的半变 系数模型的估计问题,提出了一种基于核函数法的非参数部分的估计 方法以及参数部分的估计,并证明了估计的相合性。 主要结果之三是针对不同数据集下的半变系数模型所得的不同 估计方法进行了数值模拟,探讨了方法的有效性。 关键词 半变系数模型,度量误差,剖面( p r o f i l e ) 最小二乘估计,核 估计,广义最小二乘法 a b s t r a c t s e m i v a r y i n g c o e f f i c i e n t m o d e l , w h i c hi sa l s o c a l l e da s s e m i p a r a m e t r i cv a r y i n g - c o e f f i c i e n tp a r t i a l l yl i n e a rm o d e l ,w a sf i r s t i n t r o d u c e db yf a n ga n dz h a n g ( 2 0 0 2 ) t ot e s tw h e t h e rt h ec o e f f i c i e n t f u n c t i o n so ft h ev a r y i n gc o e f f i c i e n tm o d e lw i l lt r u l yc h a n g e i ti n c l u d e s m a n yu s u a lp a r a m e t r i c ,n o n p a r a m e t r i ca n ds e m i p a r a m e t r i cr e g r e s s i o n m o d e l s t h en e wm o d e lh a v et h em e r i t so ft h el i n e a rm o d e lw h i c ha r e p r o n e t o e a s i l yi n t e r p r e t a t i o na n dc a nd i s p l a yr o b u s t v i r t u ea sf o r n o n p a r a m e t r i cm o d e l s b e s i d e s ,i tc a nd y n a m i c a l l yd e s c r i b et h er e l a t i o n b e t w e e nt h ec o v a r i a t e sa n dt h er e s p o n s ev a r i a t e sa n da l s oc a na v o i dm a n y “c u r s eo fd i m e n s i o n a l i t y p r o b l e m s t h e r e f o r e t h i sm o d e lh a sr e c e i v e d m u c ha t t e n t i o ns i n c ei t sb i r t h ,a n di th a sb e e nw i d e l ya p p l i e di ni n d u s t r y , a g r i c u l t u r e ,f i n a n c e ,g e o g r a p h ya n ds o m eo t h e rf i e l d s i nt h ec o n t e x to fc l a s s i cr e g r e s s i o nm o d e l s ,w eg e n e r a l l ya s s u m et h a t t h es a m p l ed a t aa r e c o m p l e t e ,r e l i a b l e ,a n dt h ee r r o r s a r e m u t u a l l y i n d e p e n d e n t b u ti nm a n ya p p li c a t i o n s ,t h ea s s u m p t i o n sa r eh a r dt o s a t i s f yb e c a u s eo ft h en a t u r eo fm e a s u r e m e n tm e c h a n i s mo rm a n m a d e f a c t o r a tl e a s t ,t h e r ea l w a y se x i s tm e a s u r e m e n te r r o r s s oi ti sm o r e p r a c t i c a lt oi n v e s t i g a t et h es e m i v a r y i n gc o e f f i c i e n te r r o r s - i n v a r i a b l e s m o d e l i nt h i s p a p e r , f i r s t w ed i s c u s s e dt h es t a t i s t i c a li n f e r e n c eo f s e m i v a r y i n gc o e f f i c i e n tm o d e lw i t hc o m p l e t ed a t a ,t h e nw es y s t e m a t i c a l l y i n v e s t i g a t e dt h ee s t i m a t i o np r o c e d u r eo ft h i sm o d e lf o rt h e i rp a r a m e t r i c a n dn o n p a r a m e t r i cv a r y i n g c o e f f i c i e n tp a r tu n d e rt h ec a s ew h e r et h e c o v a r i a t e sa r em e a s u r e dw i t ha d d i t i v ee r r o r s o n eo ft h em a i nr e s u l t so ft h ep a p e rw a st h a tw ed i s c u s s e dt h e s t a t i s t i c a l i n f e r e n c eo f s e m i v a r y i n g c o e f f i c i e n tm o d e lw i t ht h e i n d e p e n d e n to rt h ec o r r e l a t e dr a n d o me r r o r s t h es e c o n dr e s u l tw a st h a tw ep r o p o s e dan e wm e t h o dt oe s t i m a t e t h ep a r a m e t e r sa n dc o e f j f i c i e n tf u n c t i o n so ft h es e m i v a r y i n gc o e f f i c i e n t e r r o r s - i n v a r i a b l e sm o d e lb a s e do nt h ek e r n e le s t i m a t i o n t h el a s tr e s u l tw a st h a tw ed i dan u m e r i c a ls i m u l a t i o nt ot e s tt h e e f f i c i e n c yo ft h ee s t i m a t o r so ft h es e m i v a r y i n gc o e f f i c i e n tm o d e lw i t h d i f f e r e n td a t as e t s i i k e yw o r d s s e m i v a r y i n gc o e f f i c i e n tm o d e l s ,e r r o r s i n - v a r i a b l e s , p r o f i l el e a s ts q u a r ee s t i m a t i o n ,k e r n e le s t i m a t i o n ,t h eg e n e r a l i z e d l e a s t s q u a r em e t h o d i l l 目录 摘要i a b s t r a c t i i 第一章综述1 1 1 引言1 1 2 半变系数模型及其研究现状1 1 3 有度量误差的数据的研究历史与现状3 1 4 本文的主要工作以及文章结构4 第二章完全数据下半变系数模型的统计分析5 2 1 前言5 2 2 独立场合下半变系数模型的估计及其性质5 2 3 误差相关的半变系数模型的估计方法8 2 4 定理证明9 第三章协变量x 与z 均存在加性度量误差的半变系数模型的统计分析1 7 3 1 前言17 3 2 参数部分、非参数部分的估计1 7 3 3 估计的性质2 2 3 4 定理的证明2 3 第四章模拟分析3 2 4 1 前言3 2 4 2 完全数据下半变系数模型的模拟分析3 2 4 3 协变量x 与z 同时存在加性度量误差的半变系数模型的模拟分析3 5 4 4 总结3 8 参考文献3 9 致i 射4 3 攻读学位期间主要的研究成果4 4 硕士学位论文第一章综述 1 1 引言 第一章综述 在统计学研究中,数据集和模型是必不可少的两个部分,它们具有同等重要 的地位,所以研究者对它们给予了很多的关注。统计研究往往通过数据集来研究 现实中的实际问题,它的通常的做法是将数据集纳入到一个统计模型中进行研 究。数据集指的是人们在实际中逐渐积累起来的比较可靠的历史资料,或者是通 过对按照某一特定目标而收集的数据进行加工整理而得到的资料。值得注意的 是,统计模型本身只是对变量问复杂关系的一种近似的描述,其出发点是一些大 家都能够接受假定,或者有时候这种数量关系本身也是研究者基于一些假定所做 出的尝试性的判断。那么,研究者所选择的统计模型到底能不能反映研究者所想 要研究的统计问题,它们是否与数据集中所包含的绝大多数的数据相一致,由于 数据采集过程中由于测量误差、人为误差和其他一些因素所出现的一些错误或者 由于一些不可抗拒的因素所导致而产生的不完全数据是否会对所用模型的统计 推断产生影响等都是值得研究的问题。近代统计中,高维数据的回归分析也是个 热门话题,半变系数模型作为变系数模型的一个推广模型,由于具有易于解释、 稳健等特点,近年来已成为一个新的发展方向,并广泛应用于工业、农业、经济、 生物医药等领域。本文主要就是针对半变系数模型,在不同数据情况下对其进行 统计分析,研究其相关的统计推断问题。这一章主要是对相关文献进行综述。1 2 节主要介绍了半变系数模型以及这类模型的研究现状;1 3 节主要介绍了有度量 误差的数据研究历史与现状;1 4 节介绍了本文所做的主要工作以及文章的结构。 1 2 半变系数模型及其研究现状 半变系数模型是f a n 和z h a n g 于2 0 0 2 年在检验变系数模型的函数系数是否 真正变化时提出来的,其一般形式如下 y = x 7 口o ) + z 1 + g( 1 一1 ) 其中y 是响应变量,x = ( 五,x p ) r 和z = ( z l 一,z 。) 7 分别为p 维和q 维 协变向量,口( ) = ( q ( ) ,口,( ) ) 7 是p 维函数系数向量,= ( 届,展) r 是g 维常 系数向量,占为随机误差,t 为协变量。为了避免维数祸根,我们一般简单假设t 是单变量。 硕士学位论文 第一章综述 显然,模型( 1 1 ) 与其它模型不同,它的特点是有一部分回归元是线性的,而 变系数部分是非线性的。因此,它既具有普通线性模型的所有优点,又具有非参 数回归模型稳健的特性,同时它还能动态地解释协变量对响应变量的影响以及协 变量交互作用对响应变量的影响。 事实上,半变系数模型是一个非常一般的模型,很多模型都可以看作是它的 一种特殊情形。如: ( 1 ) 当c e ( t ) = 口为一个常数向量时,模型( 1 1 ) 就变成了常见的线性回归模型, 它的所有系数都是常数; ( 2 ) 当= 0 时,模型( 1 1 ) 就成为了h a s t i e 和t i b s h i r a n i ( 1 9 9 3 ) 提出的变系数模 型: ( 3 ) 当= o ,p = l ,x = l 时,模型( 1 1 ) 就是一般的非参数回归模型; ( 4 ) 当0 , p = 1 ,x = 1 时,模型( 1 1 ) 对应的模型就是e n g l e ( 1 9 8 6 ) 提出的著名 的部分线性模型。 对于半变系数模型,目前已有不少学者对其进行了广泛的研究。z h a n ge t a 1 ( 2 0 0 2 ) 提出了估计模型( 1 1 1 参数部分和非参数部分的方法并且证明了该方法 下的估计量均可达到最优收敛速度。l ie ta 1 ( 2 0 0 2 ) 禾j j 用加权核函数的思想对模型 提出了一种局部最d , - 乘法的估计方法。之后,z h o u & y o u ( 2 0 0 4 ) 结合最小二乘 与小波方法对模型的线性部分和非线性部分进行了估计。而f a n & h u a n g ( 2 0 0 5 ) 对该模型的参数部分给出了剖面( p r o f i l e ) 最小二乘估计,并证明了所得到的估计 是咒相合的,该估计方法也是目前用得最多的。除此之外,他们还应用非参数 模型广义似然比的思想,对参数部分检验提出了剖面( p r o f i l e ) 似然比的检验统计 量,并证明了该统计量在零假设下是服从z 2 分布的。z h o ue ta 1 ( 2 0 0 7 ) 贝1 进一步 证明了f a n & h u a n g ( 2 0 0 5 ) q b 参数和非参数部分估计量的强收敛速度。而当模型具 有异方差时,a h m a d ,l e e l a h a n o n & l i ( 2 0 0 5 ) 考虑了广义类方法( ag e n e r a l s e r i e s m e t h o d ) 来估计半变系数,建立了模型有限维估计的相合性和正态性。 y o u & z h o u ( 2 0 0 6 ) 贝1 应用经验似然到模型中,建立了参数部分的具有渐近正确覆 盖率的经验似然置信区间。 除了在理论上对半变系数模型有了较多的关注与研究外,在实际中,该模型 也在各个领域得到了广泛的应用。如:l ie ta 1 ( 2 0 0 2 ) 用模型( 1 1 ) 分析了中国的非 金属矿业的生产函数;f a n & h u a n g ( 2 0 0 5 ) 用模型( 1 1 ) 分析了波士顿的住房供给数 据。 2 硕士学位论文第一章综述 1 3 有度量误差的数据的研究历史与现状 在实际应用中,由于人为的或者系统的原因,度量误差是普遍存在的。存在 度量误差的数据的特点是当我们想要观测的数据是x 时,而却只能观测到它的 一个替代变量,这两者之间是存在着度量误差的。如果我们忽略这种误差,直 接用矿来替换x 来拟合回归模型的话,通常会使得估计产生较大的偏差,并且 这种偏差不会随着样本的增加而消失,这种现象被称为“a t t e n u a t i o n 那么, 如何利用这些有度量误差的数据来建立模型,通过间接的方法来得到原回归模型 的参数估计就是值得研究的了。这罩,我们所要建立的模型即是度量误差模型, 下面我们给出两种常见的度量误差模型: 假设协变量有x 有度量误差亭,实际观测变量是形,样本个数为n ,那么 ( 1 ) 加性度量误差模型,满足 彬= 墨+ 缶,b 1 ,n ,且e ( 孝l x ) = 0 ( 2 ) b e r k s o n 度量误差模型,满足 置= 彬+ 莓,f _ 1 ,以,且e ( 孝l 形) = 0 从形式上看,这两类度量误差模型非常类似,但是这两类度量误差是存在本 质区别的,这里通过两个实例来说明。比如,我们测量一群人的心电数据,这些 数据针对个体单独测量且可以进行重复测量,这种度量产生的误差就是加性度量 误差。而化工厂的工人在同样的化学物质污染的环境中工作,他们会有相同的整 体实验数据,而对于个体来说真实的受污染程度其实是不一样的,也就是说,它 们的真实值应该是不相同的,那么,这种度量产生的误差就是b e r k s o n 误差了。 对于度量误差模型已经有很长的研究历史,并被广泛应用于各个领域,如医 学、金融学、生物测定学等等。早在上个世纪五十年代,r e i e r s 0 1 o ( 1 9 5 0 ) 就研究 了自变量存在加性度量误差的模型,并指出通常的最d , - - 乘估计不是相合估计。 而b e r k s o n 型测量误差模型是由b e r k s o n j ( 1 9 5 0 ) 首次提出并讨论了线性情况。 f e d o r o v ( 1 9 7 4 ) 研究了一般的b e r k s o n 模型并且利用一种渐近技术和迭代加权最小 二乘法对其中的参数进行了估计。f u l l e r ( 1 9 8 7 ) 的专著主要讨论了线性模型存在度 量误差的处理方法,c a r r o l le ta 1 ( 1 9 9 5 ) 对于非线性情况进行了相关研究并得到了 一些最新结果。随后,c h e n g 和n e s s ( 1 9 9 9 ) 在他们的专著中研究了 e v ( e r r o r - i n v a r i a b l e s ) 多项式模型。l o n g c h e e n ,h u w a n g 和y h s t e v eh u a n g ( 2 0 0 0 ) 研究了具有b e r k s o n 度量误差的多项式回归模型。l i q u nw a n g ( 2 0 0 4 ) 研究了非线 性b e r k s o n 型度量误差模型的估计问题。近年来,国内不少学者也对度量误差模 型进行了相关的研究,可参见文献 7 】 8 2 7 】 3 3 3 5 】 5 1 6 0 3 硕士学位论文 第一章综述 1 4 本文的主要工作以及文章结构 本文主要针对不同的数据集给出了半变系数模型的参数和非参数部分系数 函数的估计方法,并在一些较为基本的正则条件下,证明了所得估计量的相合性 以及渐近正态性,最后通过数值模拟说明了估计方法的有效性。 本文结构如下: 第二章主要讨论了完全数据下半变系数模型的估计问题,首先我们考虑了误 差独立的情况,得到了系数的剖面最小二乘估计以及它们的性质,然后对误差相 关的情况进行了研究,将模型经过相应处理之后转变为了误差独立的情形,从而 解决了相关的估计问题。 第三章主要研究了协变量x 与z 同时存在度量误差的半变系数模型的估计 问题,提出了一种基于核函数法的非参数部分的估计方法,利用广义最小二乘也 得到了参数部分的估计,并在一些较为基本的正则条件下,证明了所得估计的相 合性。 第四章主要是对前面两章所讨论的模型及其估计方法进行了模拟研究,通过 模拟结果说明了方法的有效性。 4 硕+ 学位论文 第二章完全数据下半变系数模型的统计分析 第二章完全数据下半变系数模型的统计分析 2 1 前言 半变系数模型是近几年才提出来的新模型,该模型不但涵盖了通常的参数、 非参数以及半参数回归模型,而且它有更加灵活的函数形式。这类模型不仅具有 线性模型易于解释的优点,还具有非参数模型稳健的特性,同时也避免了许多“维 数祸根 的问题。因此,这类模型白提出以来就在工业、农业、金融、地理等领 域得到了广泛的应用,成为了一类有效的数据分析工具。对于该模型的估计问题, z h a n g ( 2 0 0 2 ) 提出了线性部分和非参数部分的估计,并证明了参数估计和非参数 估计都具有最优的收敛速度;l ie ta 1 ( 2 0 0 2 ) 提出使用核函数作为加权函数的局部 最小二乘法;z h o u & y o u ( 2 0 0 4 ) 禾l j 用最小二乘和小波方法来估计模型的参数部分 和非参数部分;f a n & h u a n g ( 2 0 0 5 ) 提出了参数部分的剖面( p r o f i l e ) 最小二乘估计, 而且证明了该估计是甩相合的。本章就是基于剖面( p r o f i l e ) 最d , - - 乘方法讨论了 数据观测完全的时候误差独立与误差相关两种情形下半变系数模型参数部分和 非参数部分的估计问题。2 2 节介绍了误差独立的情况下半变系数模型的剖面 ( p r o f i l e ) 最小二乘估计以及它们的性质:2 3 节研究了误差相关的情况下半变系数 模型参数和系数函数的估计问题;2 4 节给出了相关定理的证明。 2 2 独立场合下半变系数模型的估计及其性质 这一节,我们将对完全数据下误差独立的半变系数模型进行估计,那么所考 虑的模型如下 y = x 口( 丁) + z + 占 ( 2 - 1 ) 其中, y = ( z ,k ) 7 ,x = ( x l 一,k ) r ,z = ( z l ,一,乙) r ,置= ( 五l 一,瓦) r , z f = ( 互,z f 。) r ,f = 1 ,l, 口( ) = ( 口。( ) ,口卢( ) ) 7 , = ( 届,p q ) 7 , 占= ( 毛,巳) 7 ,巳是独立同分布的随机误差项,且乞n ( 0 ,盯2 ) 前面我们提过已有很多方法来估计该模型线性部分的未知参数和变系数部 分的系数函数,这里我们采用剖面( p r o f i l e ) 最小二乘估计来估计参数 硕士学位论文第二章完全数据下半变系数模型的统计分析 即: 首先,对任何给定的,模型( 2 - 1 ) 可以写成: y z f l = x 口( r ) + g( 2 - 2 ) r 一羔房乙:圭吩弛) + 乞,f :1 ,2 ,以( 2 - 3 ) j = t j = t 记z :i 一兰岛乙,则模型( 2 2 ) 转化为了如下变系数模型: j f l f :兰q ( z ) + q ,扣1 ,2 ,以 ( 2 4 ) 产i 接下来,我们用局部线性回归的方法来估计模型( 2 4 ) 的变系数函数 哆( ) ,f - 1 ,p ) 假设f 属于“的一含小邻域,利用泰勒展开式,在这个局部区 域内,o t i ( t ) 可以用下面的线性函数来逼近 口,( f ) a ( 气) + 口;( 乇) o t o ) 三乃+ b j ( t t o ) ,j = 1 ,p ( 2 5 ) 其中,口j ( 气) = 坐字i 嘞这样,问题就转化为了求下面的加权局部最小二乘问 题的解了,即:找到 ( 吩,岛) ,= 1 ,p 的估计使得其能最小化 窆i = 1 f 一喜i 吩+ 岛c 一, 义r :f , 2 c 一气, c 2 6 , ,一i 其中,k h ( ) = k ( ,h ) h ,k ( ) 表示核函数,h 表示窗宽。 通过求解问题( 2 6 ) ,我们得到: 心- ( f ) ,口p ( f ) ,肋- - ( f ) ,h b p ( f ) ) r = ( 彰彬口) 叫d f t 形( 】,一z ) , ( 2 7 ) 其中, z = 茎 = 多:i 耋 二= 篓 = :i 乏 ,p = l 薹茎二 y = ( x ,艺) 7 ,彬= d i a g ( k ,( 一f ) ,瓦( 乙一f ) ) 显然,( 2 7 ) 式中前p 个元素就是a f t ) 的估计,也即: 6 硕士学位论文第二章完全数据下半变系数模型的统计分析 口( f ) = ( o p 。p ) ( 讲形口) 一d t w , ( y z f l ) ( 2 8 ) 然而,( 2 - 8 ) 式中是未知的向量,于是为了得到a ( t ) ,我们必须先估计出下 面利用得到的( 2 8 ) 来对进行估计。 由( 2 - 8 ) 可知, x a ( t ) = ( x p o p 。p ) ( 彬d f ) d :w , ( y - z f l ) - s ( y - z f l ) , ( 2 - 9 ) 其中,s = 得到: 移项得: ( 五o ) ( 磁彬。d f i ) o 。t k ( 以o ) ( 磁彬。d f 。) o b t w i n 再将( 2 - 9 ) 作为x a ( t ) 的估计代入到( 2 1 ) 式, y = s ( y - z f l 、) + z p + s ( ,一s ) y = ( j s ) z + s ( 2 1 0 ) ( 2 - 1 1 ) 于是,令( i s ) y = y ,( ,一s ) z = z ,贝l j ( 2 1 1 ) 就变成了我们熟知的线性模型, 利用一般的最4 , - - - 乘法,便可得到的估计为: 即: 方:( 三7 乞) 一t 乞7 f ( 2 - 1 2 ) 分= z r ( ,一s ) 7 ( ,一s ) z - lz 7 ( ,一s ) r ( ,一s ) y ( 2 - 1 3 ) 在叙述估计( 2 8 ) 和( 2 1 3 ) 的性质之前,我们先给出所需要的条件: ( 1 ) 系数函数( ) ( 江l ,2 ,n ) 有连续的二阶导数; ( 2 ) 随机变量f 有有界的紧支撑q ,其密度函数厂( ) 是l i p s e h i t z 连续的; ( 3 ) e ( x , x jl 丁= f ) ,e ( 置义歹木置x ,tl r = f ) 和e ( ( ) ( 五) 止i r = f ) ( 0 2 时, e i i x i l 2 5 o o 矛ueh zh o ,i = 1 ,一是的特征根。 记。1 ”= ,d i a g ( ;h 。1 胆,以。1 7 2 ) 尸,有( 一坦) 2 = 一,用一4 2 左乘模型( 2 1 4 ) ,得 y - i 2 y = 叫2 x a ( t ) + 叫2 z + 叫2 f ( 2 16 ) 令萝:z - 1 , , 2 y ,叉= 叫2 x ,z 一= e - l , 2 z ,;:叫2 占, 易知e ( z - ) = e ( z u 2 占) = o ,c o v ( ;) = c 。,( 。1 2 s ) = 盯2 l 。,则模型( 2 1 4 ) 可以改写 为: 口删力+ ? ( 2 - 1 7 ) 【s n ( 0 ,仃2 l 。) 很显然,模型( 2 1 7 ) 与( 2 1 ) 实质上是完全一致的。那么类似2 2 节的推导, 我们同样可以得到模型( 2 。1 4 ) 参数部分和非参数部分的估计及其性质,这里不再 赘述。 2 4 定理证明 在后面的证明中,我们将采取以f 记号: o ( t ) = e ( ( x x7 ) 木( 朋7 ) i 丁= f ) ,o ( f ) = e ( x z ri t = f ) ,t ( t ) = e ( ( x z r ) 枣( 腥7 ) i 丁= f ) , 巳= 掣卜i 2 圮表示维数为且第f 个元素为1 觯位歹| j 向量。 在证明定理之前,先给出以下几个引理。 引理2 4 1 :假设( ,x ) ,( 以,k ) 是独立同分布的随机变量,r 是一维随机变量, 是( x ,y ) 的联合密度函数,k ( ) 为正的有界紧支撑的核函数,且是l i p s c h i t z 9 硕十学位论文 第二章完全数据下半变系数模型的统计分析 连续的。对于给定刀:州 专o o 和占 l s ,e i y l 5 和s u ps l y l y ( x ,y ) d y o o , 则: s u p 睁础叫和嘲 卜警卜 证明:参见m a c k 和s i l i v e r m a n t 3 7 1 引理2 4 2 :令s = ! n 窆i = 1 置f ( ( 巧一t o ) h ) 2 吒( 巧一岛) ,若条件( 2 ) - ( 6 ) 成立,则: e ( 最,五) = i t a f ( t o ) f ( t o ) ( 1 + q ( | z 2 ) ) , h c o v ( s i ) = ( ,z ) 。1 五f ( t o ) d p ( t o ) ( 1 + q ( j i l 2 ) ) 从而, 最。量= p a f ( t 。) 1 1 ( f 0 ) ( 1 + q ( ,砌) 一2 ) 其中,h c o v ( w ) = e ( w 木) 一e ( 形) 宰e ( w ) = d ( w o ) ,w = ( 坳) 证明:令u = h - ( t - - t o ) ,则: e ( 墨五) = e ( e ( x x7 i 丁) ) ( 办叫( z 一气) ) 2 蚝( 巧一t o ) = f 1 1 0 ) ( 矗一1 0 一气) ) 2 k 。( r t o ) f ( t ) d t = f f ( , o + h u ) u 五k ( u ) f ( t o + h u ) d u k q t :r ( t o + ”) 有连续的一阶导数,f ( t o + j l l “) 在岛处是l i p s c h i t z 连续的,以及条 件( 2 ) ( 5 ) 成立,有: e ( 瓯a ) = t 五f ( t o ) f ( t o ) ( 1 + q ( j i l 2 ) ) h c o v ( s 2 ) = ( 以 ) 。1l ,2 五f ( t o ) o ( t o ) ( 1 + q ( j i l 2 ) ) 从而可得: 鼠,。= e ( ,。) + g ( 扣元而) = 心厂( f o ) r ( ) ( 1 + q ( ,z 办) 1 2 ) 引理2 4 3 :令 。= 去喜珊- ( 1 训暇互一t o ) ( x 7 吣) - d f 0 ( ”炜脚一鸲n , 当条件( 1 ) 一( 6 ) 成立时,有: l o 硕士学位论文 第二章完全数据下半变系数模型的统计分析 e ( 见,丑) = i 1 心+ 2 f ( t o ) f ( t o ) a 。( t o ) ( 1 + o p ( h 2 ) ) h c o v ( d ,丑) = ( 4 n h ) - 1 h 4 屹z + 。f ( t o ) e ( x x7 口”( 气) 掌( x x r 口。( 气) ) i 丁= f ) ( 1 + d ,( 2 ) ) 从而, 乜。2 = 寺j i l 2 z + 2 f ( t o ) f ( t o ) a ”( 气) ( 1 + q ( 甩j j l ) 1 胆) 证明:类似引理2 4 2 的证明方法即得结论。 引理2 4 4 :令鸠,五= 去喜五( j l l 。1 ( z f o ) ) 五蚝( 写一f o ) 毛,当条件( 1 ) 一( 6 ) 成立时,有: e ( m 。,五) = o ,d ( m 以) = ( 行j i z ) 。1 仃2 r ( t o ) v 2 名( 1 + o 。( j i l 2 ) ) 从而, m 以= q ( ( 砌) 一,2 ) i i e 明易知,e ( m 以) = o 令r = x ( j i i 。( t - t o ) ) 2 k ( t - t o ) 6 ,则有: d ( m 以) :! e ( 7 7 2 ) = 寺喜e ( x x 7 ) ( j l z 一( 丁一t o ) ) k h ( r 一气) 盯2 = ( ,z ) 一1 盯2 r ( t 0 ) v 2 丑( 1 + a l 口( 五2 ) ) 从而可得, 鸠,五= e ( m 以) + q ( d ( m 以) ) = q ( ( 玎矗) 一2 ) 引理2 4 5 :令e ,五= ! n 窆i = 1 置( 矗一1 ( 巧一) ) 2 ( 巧一岛) 刁( 分一) ,当条件( 2 ) - ( 6 ) 成立 时,有: g 名= q ( ,z 一2 ) 证明:由条件( 3 ) 知,e ( 置衫i t = f ) ,e ( 置衫木置z ,ti t = f ) 有连续的一阶导数,所 以, e ,五= 吉置( j i z 叫( 巧一岛) ) 2 k ( z t o ) z 扩( p j 一乃,) ,f = i ,= i 硕士学位论文 第二章完全数据下半变系数模型的统计分析 2 嘉( 历一万,) 三,6 窆i = 1 置( ( 巧一岛矿蚝( z 一气) 彳勺 令f = x z r ( 五一1 ( 丁一岛) ) 五k | i l ( t - t o ) ,贝i j : e 去喜置c c 巧一矿毛c z 一岛,彳 = e c f ,= 段厂c 岛,。c 气+ q c 矗2 , 日。v ( 三喜五( ( 互一岛矿蚝( z 一岛) 刁) = 去们。v ( f ) = 磊i 吃五f ( t o ) v ( 气) ( 1 + q ( j l l 2 ) ) 去置( 川z 一k h ( t ,一t o ) z := 胁低) o ( 枷+ q ( 胛矿2 ) “f = l 再加上引理2 4 i ,可得: g 五= q ( ,z 叫坦) 引理2 4 6 :在条件( 1 ) - ( 6 ) 成立的情况卜,有: 乏一q e ( z z7 m e ( g x r 眦( x x 协1e ( x z rm 三艺r ( ,一s ) ( ,一s ) 7 乞7 q e ( z z7 ) 一e e ( z x r t ) e ( x x ri 丁) 一1 e ( x z ri 丁) ; ,2 ! 艺( ,一s ) m :d 。( e ) n 证明:冈为 d 1 w t d t = 工f 如( 乃一r ) 善n 五掣( 厂t ) 毛( 互一d 荟_ _ ( 7 t ) 蚝( 巧一即 窆i = i 置f ( 罕) 2 粥叼 根据引理2 4 1 和引理2 4 2 知, 。f 彬d r = c 丁,r c 丁,。( 三三 ,+ q c 巳, , 对t q 一致成立,其中 表示k r o n e c k e r 积。 同理可得: d _ w t z = ,矿( 丁) o ( 丁) ( 1 ,o ) r ( 1 + q ( 巳) ) , 1 2 硕士学位论文 x r , o 形d f - ld r , 彬z = x7 r ( 丁) q o ( 丁) l + q ( 巳) ) f 矸r ( 五) 。1 0 ( 石) 1 s z = i j i l + q ( 巳) 【群i ( 乙) 。1 0 ( 乙) j 去艺7 艺= 丢喜 互一。( 巧) 7 1 1 ( z ) - l _ 军一f r ( 互) - l 。( 巧) 1 + q ( 巳) ) 三乞r ( 一s ) ( ,一s ) r 乞:! 乞7 乞一以一以+ 以, 其中,:三乞r ,以:! 乞7 s ,乞,以:! 艺rv iis2 s s r 乞 记乞= ( 艺。,艺。) 7 ,则: = ! l l 窆i = l 乞r f ,。 嘭岷口,) - l 彤彬,一z 彰彬乞= 矿( 丁) ( 7 ) o ( 1 ,o ) 7 q ( 巳) , x7 ,o 讲彬p ) - ld ;w , 2 = x7 r ( 丁) 叫o ( 7 1 ) q ( q ) = 去喜 互一。( z ) 7 r ( z ) _ l 置 1 + q ( 巳) x _ r ( 互) - l 。( z ) q ( 巳) 再利用大数定理和中心极限定理知,j l = o 。( ) 类似地,我们有 以= d ,( ) ,以= d ,( ) 硕士学位论文第二章完全数据下半变系数模型的统计分析 首先注意到, 去- z ( i - s = i 缶b - - 么r f 口( 巧) _ f ,。 珥岷0 。1 嘭m 同样,根据前面我们有: x r ,o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论