




已阅读5页,还剩46页未读, 继续免费阅读
(概率论与数理统计专业论文)协变量修正部分线性回归模型的估计.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i f f i f f i | j 川i | i f f j f j i 舢 y 17 8 8 6 7 6 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的 研究成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育 机构的学位或证书而使用过的材料与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示了谢意 签名:堡:耋蠢日期:2 竺l 皇:翌皇:多l 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有 权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全都 或部分内容,可以采用影印、缩印或其他复制手段保存论文 ( 保密的论文在解密后应遵守此规定) 。一一 摘要 本论文主要研究协变量修正部分线性回归模型的估计问题在协变量修正 回归模型中,响应变量和解释变量都不可直接观测,但是能观测到他们被一可 观测的协变量以乘积的形式扭曲之后的数据为研究方便,本论文考虑只有参 数部分的解释变量存在扭曲,其真实的值不可观测的情形第一部分讨论完全 数据的情形:将协变量修正部分线性回归模型转换成一个变系数部分线性回归 模型,利用局部多项式展开同时得到该变系数模型的初估计,再将初估计代入 该变系数模型得到调整后的估计,最后利用加权平均的方法得到协变量修正 部分线性回归模型中参数部分和非参数部分的估计,并给出了估计的渐近性 质第二部分讨论了响应变量随机缺失仅有参数部分的解释变量扭曲情形下的 协变量修正部分线性回归模型的估计问题首先用回归借补的方法将相应缺失 的响应变量借补完整,再利用与完全数据情形下类似的估计方法和证明方法 给出参数部分和非参数部分的估计及其渐近性质最后一部分是数值模拟 本文的特色主要体现在以下两个方面: ( 1 ) 对于协变量修正模型,现有文献大都是研究的线性回归模型,而本论 文研究了协变量修正部分线性回归模型 ( 2 ) 在协变量修正部分线性回归模型中,本论文还考虑了响应变量是随机 缺失的情形 关键词:部分线性回归模型;变系数模型;协变量修正 北京工业大学理学硕士学位论文 a bs t r a c t i nt h i sp a p e r , t h ee s t i m a t i o ni nc o v a r i a t e - a d j u s t e dp a r t i a l l yl i n e a rr e g r e s s i o n m o d e li si n v e s t i g a t e d i nc o v a r i a t e - a d j u s t e dr e g r e s s i o nm o d e l ,b o t hp r e d i c t o r sa n d r e s p o n s ea r en o td i r e c t l yo b s e r v a b l e ,b u ta r ec o n t a m i n a t e dw i t ham u l t i p l i c a t i v e f a c t o rt h a ti sd e t e r m i n e db yt h ev a l u eo fa nu n k n o w nf u n c t i o no fa no b s e r v a b l ec o v a r i a t e f o rs i m p l i f y , o n l yt h ep r e d i c t o r sa r ec o n t a m i n a t e da n dn o tb eo b s e r v a b l e f i r s t l y , c o m p l e t ed a t ai sc o n s i d e r e d :t h ec o v a r i a t e - a d j u s t e dp a r t i a l l yl i n e a rr e g r e s s i o nm o d e lc a nb et r a n s f o r m e di n t oav a r y i n g c o e f f i c i e n tp a r t i a l l yl i n e a rr e g r e s s i o n m o d e l ,l o c a ll i n e a rp o l y n o m i a lt e c h n i q u ea n dw e i g h t e da v e r a g em e t h o di su s e dt o g e tt h ep a r a m e t e re s t i m a t o r sa n dn o n - - p a r a m e t e re s t i m a t o r si nc o v a f i a t e a d j u s t e d p a r t i a l l yl i n e a rr e g r e s s i o nm o d e l ,a n de s t a b l i s ht h ea s y m p t o t i cp r o p e r t y s e c o n d l y , t h er e s p o n s e sa r er a n d o m l ym i s s i n gi nc o v a r i a t e a d j u s t e dp a r t i a l l yl i n e a rr e g r e s s i o n m o d e l ,w ef i l lu pt h em i s s i n gd a t ab yr e g r e s s i o ni m p u t a t i o n ,a n do b t a i nt h ep a r a m - e t e re s t i m a t o r sa n dn o n - - p a r a m e t e re s t i m a t o r si nc o v a r i a t e - a d j u s t e dp a r t i a l l yl i n e a r r e g r e s s i o nm o d e l ,a n de s t a b l i s ht h ea s y m p t o t i cp r o p e r t yb yt h es i m i l a rm c h n i q u e s o fe s t i m a t i n ga n dp r o v i n gt oc o m p l e t ed a t a t h el a s tp a r ti st h es i m u l a t i o ns t u d y t w o d i s t i n g u i s h e df e a t u r e si nt h i sp a p e r f i r g l y ,c o v a r i a t e - a d j u s t e dr e g r e s s i o n m o d e li sc o n s i d e r e di nt h el i t e r a t u r e sc u r r e n t l y , b u tc o v a r i a t e a d j u s t e dp a r t i a l l yl i n - - e a rr e g r e s s i o nm o d e li si n v e s t i g a t e di nt h i sp a p e r s e c o n d l y ,w es t u d yt h ef o l l o w i n g s i t u a t i o n :t h er e s p o n s e sa r er a n d o m l ym i s s i n gi nc o v a r i a t e a d j u s t e dp a r t i a l l yl i n e a r r e g r e s s i o nm o d e l k e y w o r d s :p a r t i a l l y l i n e a rr e g r e s s i o nm o d e l ;v a r y i n g - c o e f f i c i e n tm o d e l ;c o v a r i a t e - a d j u s t e d i i 目录 目录 摘要 i a b s t r a c t 第1 章绪论( 1 ) 1 1 引言( 1 ) 1 2 预备知识( 2 ) 1 3 本文主要解决的问题及论文结构- - ( 6 ) 第2 章基于完全数据的估计( 9 ) 2 1 模型介绍( 9 ) 2 2 估计方法- - 0 0 ) 第3 章完全数据下估计的渐近性质( 1 4 ) 3 1 预备知识( 1 4 ) 3 2 主要定理与证明 ( 1 5 ) 第4 章基于缺失数据的估计( 2 4 ) 4 1 估计方法- - ( 2 4 ) 4 2 缺失数据下估计的渐近性质( 2 5 ) 4 3 本章小结- - ( 3 5 ) 第5 章数值模拟- - ( 3 6 ) 5 1 完全数据下的估计效果( 3 6 ) 5 2 缺失数据下的估计效果( 3 7 ) 主要结论- ( 3 9 ) 参考文献( 4 0 ) 致谢- - ( 4 4 ) 一i 一 _ 。 第1 章绪论 第1 章绪论 1 1 引言 协变量修正回归模型是最近提出的在许多实际问题中,准确测量感 兴趣的变量很困难,或者花费时间较长,或者成本较高,因此通常用一 些容易观测的变量来替代很自然,这些替代变量的观测值是不准确的, 一般说来总会受到一些难以控制的,而进入试验的伴随变量的干扰影响, 往往掩盖响应变量与解释变量之间的真实关系,从而歪曲事实而协变 量修正模型正是通过一定的统计方法,消除协变量的影响,达到揭示响 应变量与解释变量之间真实关系的目标因此协变量修正模型有许多应 用领域:如经济金融数据分析、信用分析、市场调查、智能控制的数据 挖掘等在这个模型中预测变量和响应变量都是不可观测的,但是可以 观测到它们被污染后的数据污染形式是一个可观测的协变量的函数以 乘积的形式实现的这里以两个感兴趣的变量为例,给出如下的具体描 述形式:y = 妒( u ) kx = ( u ) x ,其中y 和x 不可观测,y 和x 是可观 测的被污染的数据,u 是可观测的协变量,u ,y 和x 相互独立,l ,o ( t r ) 和 ( u ) 是关于u 的未知光滑污染函数,满足e ( 妒( u ) ) = 1 和e ( ( v ) ) = 1 部分线性回归模型是统计学中重要的模型之一,在医学、经济、管 理、地质、气象、农业、工业、工程技术等领域的研究中都可以用到部 分线性模型是一个半参数模型,它包含参数和非参数两部分,比标准的 线性模型更灵活,响应变量以线性关系依赖于一些变量,又与其他独立 的变量,有非线性的关系,能比较容易的解释每个变量的影响,并且由 于“维数灾祸”问题,他更优于完全的非参数回归模型,但是非参数函 数的估计精度却会随着非线性变量的增加而降低自从部分线性模型被 提出来以后,已经有很多人研究过有关的技术和方法,比如,在参考文 北京工业大学理学硕士学位论文 献中提到的华良等【2 1 的研究,有较好的理论基础,有益于本文的研究 基于上述原因,本文研究协变量修正部分线性回归模型是有一定理 论意义和实用价值的 1 2 预备知识 1 2 1 协变量修正回归模型的介绍 协变量修正回归模型中解释变量和响应变量都是不可观测的,但是 可以观测到这两变量被污染之后的数据,污染形式是一个可观测的协变 量的函数以乘积的形式实现的模型如下: y = 7 0 + 7 1 x + e( 1 1 ) 其中y 是响应变量,x 是解释变量,均不可观测,但可以观测到受污染 的数据 y ,x ,并且 y = 妒( u ) y ,x = ( u ) x , 是可观测的协变量,u ,y 和x 相互独立,妒( u ) 和( u ) 是关于u 的 未知光滑污染函数,满足e ( 垆( u ) ) = 1 ,e ( ( u ) ) = 1 e 是误差项,满足 e ( e ) = 0 ,v a r ( e ) = 盯2 7 0 ,7 1 是感兴趣的未知参数 协变量修正回归模型的特色之处是可以考虑任何不确定的扭曲形 式协变量回归模型与加和误差模型的主要不同是污染形式不同,对污 染函数的识别条件不同如果用加和扭曲形式替代乘积扭曲形式,则有 y = y + 妒n ( u ) 和x = x + 。( u ) ,e 钆( u ) = e 妒口( u ) = 0 ,识别条件对于 u 的平均扭曲效应为0 加性形式的污染及识别条件是协变量修正回归模 型的一种特殊形式,另外,尽管协变量修正回归模型同测量误差模型很 相似,但在协变量修正回归模型当中,影响解释变量和响应变量的误差 可以是协变量的非线性的函数 2 第1 章绪论 协变量修正在生物医学方面应用非常广泛,最早在1 9 4 8 年就提出了 协变量修正思想,而且关于这方面的研究也不少s e n t i i r k 和m i i l l e r 等n 2 0 0 5 年提出了协变量修正回归模型,并对此做了大量研究他们在研究中首次 明确提出了协变量修正回归模型,并将原模型与一个变系数模型联系起 来,但是这个变系数模型的解释变量和响应变量都依赖于协变量,根据 这一特征,首先用装箱方法获得变系数模型的估计,再通过加权平均获 得协变量修正回归模型中回归系数的估计,并获得了这一估计的收敛速 度这篇论文奠定了协变量修正回归模型的基础;2 0 0 6 年改进了对变系数 模型的系数的估计,采用了等距装箱、局部多项式方法和近邻装箱方法; 这三种方法下估计的均方误差都比较小,特别是近邻装箱方法;2 0 0 6 年 通过建立估计同变系数模型的关系得到了估计的渐近正态性质,并构造 了回归系数的渐近置信区间;从2 0 0 8 年开始对模型进行改进:首先研究 了多协变量修正回归模型和协变量修正的线性混合效应模型在纵向数据 中的应用;2 0 0 9 年提出了多协变量修正回归模型和协变量修正的广义线 性模型,同年,还研究了带有相关误差的协变量回归的渐近正态性质等 崔霞、朱力行等【1 2 】研究了协变量修正的非线性回归模型及其性质他们 的研究中参数的估计避开了变系数模型,估计分两步,首先通过观察到 的响应变量和解释变量对协变量的非参数回归得到相应估计的响应变量 和解释变量,再用估计值替代不可观测的解释变量和响应变量,得到模 型参数的最小二乘估计,开辟新的研究思路 1 2 2 变系数部分线性回归模型 变系数模型保留了非参数回归稳健性的特点,又具有结构简单,易于 解释等特点,能广泛用于生物、医药、环境、金融等研究领域 3 北京工业大学理学硕士学位论文 变系数模型一般形式是 y = 口o ( u 0 ) x 0 + o q ( u 1 ) x l + q 2 ( u 2 ) z 2 + + q ,p ( 乱p ) 却+ e ,( 1 2 ) 其中y 是响应变量,z = ( z o ,z 1 ,x 2 ,z p ) 丁和u = ( u o ,u l ,u 2 ,) t 为 回归变量,e 为随机误差,e ( e ) = 0 ,v a r ( e ) = 盯2 ,( ) ,j = 0 ,1 ,p 是未知光滑函数u 0 ,u l ,u 2 ,坳通过未知函数( ) ,j = 0 ,1 ,p 来 改变x o ,x l ,x 2 ,唧的系数,可能互不相同,也可能相同特别地,当 u o ,u 1 ,u 2 ,u p 都相同日寸,不妨记为乱,则模型( 1 2 ) 变为 p y = fq 既+ e ( 1 3 ) 与一般的多元非参数回归模型相比较,变系数模型对回归系数的结构提 出了一些限制但实际上,它是一个一般的模型,许多模型如部分线性模 型,线性模型等都可视作变系数模型的特殊情形例如,在模型( 1 2 ) 中,若 q j ( u j ) = 岛,j = 0 ,1 ,p ,则模型( 1 2 ) 就是线性模型;若o l j ( u j ) = 岛,j = 1 ,p ,黝= c ( c = 1 ) ,则模型( 1 2 ) 就是部分线性模型 上述模型中要求u o = k ,o c j ( u j ) = 阢,j = ,1 ,p 这就是张日权 2 6 1 提出了变系数部分线性模型 口 m = 。( x ) + 哟( 阢) + 岛 j = l ( 1 4 ) m 是响应变量,x i r ,阢r ,z = ( z l ,乙) t r p 张日权【2 6 】使用局部线性估计方法得到该模型中的常数系数的估计, 在将该估计代入模型,利用两阶段估计方法,得到函数系数部分的估计, 并在数据独立同分布与口混合相依情况下,分别给出了常数项函数估计 的弱相合性,渐近正态性,又在文献 2 6 中使用局部线性方法和平均方 4 第1 章绪论 法同时给出常系数函数和函数系数两部分估计,并给出了这两个估计下 的渐近正态性质 1 2 3 缺失数据的研究现状 在各种数据的统计分析中,例如抽样调查、临床试验等中,经常会遇 到数据缺失的问题,因此,有关缺失数据的统计分析是一个重要的研究热 点 缺失数据的形式主要分五类:( 1 ) 缺失仅限于单个变量,称之为单一变 量缺失( 2 ) 调查中单元或项目的不响应,全部观测或缺失都在同样的个体 集合上( 3 ) 纵向研究中的单调型缺失数据,纵向研究中收集数据时,在研究 结束前有个体离开并不再返回,这时适当排列变量,在任一j = 1 ,k 一1 , 玢缺失时,巧+ 1 ,坛全都缺失( 4 ) 两个变量之间从未一起观测到过,叫 做变量数据的无交集缺失( 5 ) 无特殊结构的数据缺失 有关缺失数据的另一重要问题是缺失机制问题,因为处理缺失数据 方法的性质依赖于这些机制中相依关系的特征 这些带有缺失的数据样本从缺失机制上分可分为随机缺失、完全随 机缺失和非随机缺失定义完全数据y = ( 物) ,缺失指示矩阵m = ( 慨) , 缺失数据机制由给定y 时m 的条件分布刻划,记为f ( m iy ) ,其中是未 知参数令记y 的已观测部分,y m 妇记y 的缺失部分 1 完全随机缺失缺失不依赖于数据y 的值( 缺失的或观测的) ,即 ,( mk ) = f ( mi 妒) ,对一切k ( 1 5 ) 它是缺失数据问题中最简单的一种情形在分析中,如果将含有缺失的记 录删除,估计的结果也不会有偏差或偏差很小,因为其检验功效只与样本 量有关,但实际问题符合完全随机缺失的情形非常少见 5 北京工业大学理学硕士学位论文 2 随机缺失缺失仅依赖于y 的观测部分,不依赖于y 的缺失部分,即 ,( my ,) = f ( mi 。,) ,对一切咖( 1 6 ) 3 非随机缺失如果m 的分布依赖于y 的缺失值,这样的机制称为非 随机缺失这是处理起来最复杂的一种缺失数据 因为实际问题( 如药品追踪试验和市场调查) 中产生大量缺失数据,所 以缺失数据问题倍受关注, 其中有相当一部分是随机缺失的情形,因此研究随机缺失数据具有 很重要的现实意义随机缺失数据常考虑如下不完全随机样本 ( x ,m ,民) ,i = 1 ,礼) , ( 1 7 ) 其中五都可观测到,若k 缺失,则魂= o ,否则民= 1 ,且假设y 满足随机缺 失的条件 p ( 6 = 1 i x ,y ) = p ( 5 = 1 l x ) = p ( x ) ( 1 8 ) ( 1 8 ) 式表明y 是否缺失与y 的取值无关,仅与相应的解释变量有关 处理缺失数据的方法很多,如基于完全记录单元的方法、加权方法、 基于借补的方法、基于模型的方法等每个方法都有自己的优缺点,需依 据实际问题去选择 1 3 本文主要解决的问题及论文结构 本文研究的模型是协变量修正部分线性回归模型模型如下: p k = 夕( 正) + * 磁,+ i = l ,2 ,n , ( 1 9 ) r - - - - - 1 其中误差项龟满足e ( e ) = o ,v a r ( e i ) = o r 2 饥,忱,7 3 ,饰是未知的兴 趣参数夕( 正) ( i = 1 ,2 ,n ) 是从r _ r 的光滑可测函数,是感兴趣的非 6 第1 章绪论 参数部分为研究方便,假定m 可观测解释变量置,是观测不到的,但可 以观测到它被扭曲之后的变量五,扭曲的形式如下: x ,( 以) = 如( 阢) k ,i = 1 ,n ;r = 1 ,p ,( 1 1 0 ) 其中阢是可观测的协变量,办( ) 是阢的光滑可测但未知的函数识别 条件是 e 办( 玩) ) = 1 , i = 1 ,佗;r = 1 ,p ( 1 1 1 ) 本论文主要目的就是在给定协变量u 的观测值、扭曲观测值五,和 观测值k 后,得到模型( 1 9 ) 中参数部分系数和非参数部分的相合估计 所以拟解决的关键问题:( 1 ) 因为部分线性回归模型既有线性部分,又有 非参数部分,现有的线性和非线性的协变量修正模型中的参数的估计方 法并不可以直接应用于部分线性回归模型,所以针对所研究的协变量修 正部分线性回归模型中的参数部分和非参数部分,找到一个行之有效的 估计方法,将是本文的关键之一;( 2 ) 在较弱的条件下,得到估计的相合 性和渐近正态性 为实现上述目标,首先将模型( 1 9 ) 转换成函数系数的部分线性回归 模型,转换过程如下: 假定( e i ,阢,五,) ( i = 1 ,n ,7 = 1 ,p ) 是相互独立的m 关于 x i ,) p _ ,和9 ( 正) 的回归形式可以解释为 e ( 眠酬正) ) = e 刚( 以肌讳( 以) 墨,酬正) ) ( 1 1 2 ) 兰夕( 死) + 屏( 巩) x i , 其中 屏( 以) 2 赢, 7 北京工业大学理学硕士学位论文 因此模型( 1 9 ) 改写成; p m = 9 ( 正) + 屏( 巩) 寇,+ ( 1 1 3 ) r = l 这实质上是一个函数系数的部分线性回归模型张日权等【2 6 】对该模型做 了大量的研究本文借鉴文献【2 6 】的证明方法用局部多项式展开和回归 拟合方法得到模型( 1 1 3 ) 的估计,最后通过加权平均获得竹( r = 1 ,p ) 的相合估计 另外,为进一步加深研究,讨论了仅假定响应变量y 是随机缺失的 情形采用回归借补的方法借补数据,估计方法及估计的渐近性质类似 于完全数据的情形 本文研究的特色之处是:一在模型上的改进,研究了协变量修正部 分线性回归模型二研究了响应变量是随机缺失的情形 本文分五章第一章绪论,主要介绍一些相关的预备知识;第二章和 第三章着重讨论了基于完整数据下的协变量修正部分线性回归模型的估 计问题及估计的渐近性质;第四章介绍了缺失数据下的协变量修正部分 线性回归模型的估计方法及估计的渐近性质;第五章数值模拟 8 第2 章基于完全数据的估计 2 1 模型介绍 第2 章基于完全数据的估计 部分线性回归模型包含参数和非参数两部分,能比较容易的解释每 个变量的影响,比标准线性模型更灵活所以本文的研究协变量修正部 分线性回归模型是有一定意义的模型如下: p k = 9 ( 正) + 竹五,+ 龟, i = 1 ,2 ,n , ( 2 1 ) r = l 其中( 1 ) 误差项e 满足e ( e i ) = 0 ,v a t ( e i ) = 仃2 ; ( 2 ) 7 1 ,7 2 ,舶,是未知的兴趣参数; ( 3 ) 夕( 乃) ( i = 1 ,2 ,n ) 是从冗_ r 的光滑可测函数,是感兴趣的非 参数部分; ( 4 ) m 可观测解释变量托,是观测不到的,但可以观测到它被扭曲 之后的变量咒,扭曲的形式如下: 砧( 阢) = 办( 以) x i ,i = 1 ,凡,r = 1 ,p ,( 2 2 ) 其中既是可观测的协变量,机( ) 是关于阢的光滑可测但未知的函数 ( 5 ) 识别条件是 e ( 咖,( 阢) ) = 1 ,i = 1 ,n ,r = 1 ,p ( 2 3 ) 本论文主要目的就是在给定协变量既的观测值、扭曲观测值置,i = 1 ,n 和响应变量k 后,得到模型( 2 1 ) 中回归系数和非参数部分的相 合估计为实现上述目标,首先将模型( 2 1 ) 转换成函数系数的部分线性回 归模型, 转换过程如下: 9 北京工业大学理学硕士学位论文 假定( 龟,巩,兄,) ( i = 1 ,n ,r = 1 ,p ) 是相互独立的k 关于 寇,) 笔1 和9 ( 正) 的回归形式可以解释为 e ( m i 寇,阢,夕( 互) ) = e y d - ( 阢) x ,锦( 阢) 砗,阢,9 ( 死) 】, = e 夕( 正) + 竹x i ,+ e t i 1 ( 以) 五1 , 如( u d x i p ,巩,夕( 正) ) = e + 圭簪砷- ( 啪” 如( u o x 印,氓,夕( 乃) 三夕( 正) + 屏( 配) x i , ( 2 4 ) 其中 屏( 既) 2 赢, 因此模型( 2 1 ) 改写成: p m = 9 ( 乃) + 羼( 既) 寇,+ ( 2 5 ) r = l 这实质上是一个函数系数的部分线性回归模型张日权等【2 6 】对该模型做 了大量的研究本文借鉴文献【2 6 】的证明方法首先用局部多项式将模型 ( 2 5 ) 中的所有函数系数展开,平均之后得到所有函数系数的初步估计再 采用回归拟合方法得到所有函数的精确估计,最后通过加权平均获得 竹( r = 1 ,p ) 的相合估计 2 2 估计方法 假定 ( m ,互,阢,五) 】- 警1 是来自模型( 2 5 ) 的i i d 的样本记,h 。( ) = 玩,h 。h a ,其中( ) 是非负有界的,有关于0 的对称紧支撑,满足利普希 1 0 第2 章基于完全数据的估计 茨连续的密度函数,并且h 口 o ( q = 1 ,2 ,3 ,4 ) 是窗宽,并假定屏( ) ( r = 1 ,p ) 和9 ( ) 都有满足利普希茨连续的二阶偏导,记( 乃,死) t 为 正) 鍪, 2 2 1 初估计 注意到可以用线性函数局部逼近屏( ) ,r = 1 ,p 和9 ( ) 于是在t 的 紧支撑内有一点t o 处有 a ( t ) 9 ( t o ) + g t ( t o ) ( t t o ) 记 a o = g ( t o ) ,b o = 9 1 ( o ) 在t t 的紧支撑内一点u o 处有 屏( u ) 屏( 让o ) + 群( u o ) ( 缸一札o ) 记 a ,= 屏( u o ) ,6 r = 群( 乱o ) 最小化 np p 、2 ( k 一口。一劬矗一b o ( t i t o ) 一6 ,( 以一u 。) 寇,) i = llr = lr = l xk 1 加( 正一o ) 鲍,九。( 阢一u o ) ( 2 6 ) 利用最小二乘理论,可得 a r ( t o ,u o ) = e + 2 ( y t w v ) - 1 k 所m ( 正一t o ) k 2 加( 以一u o ) y , , i = 1 ( 2 7 ) 其中r = 0 ,1 ,p 计2 是只有第7 + 1 个位置是1 的( 印+ 2 ) x1 维的单 位向量,v = v ( t o ,1 t o ) 是仇x ( 2 p + 2 ) 矩阵,第i 行是 伊= ( 1 ,又,( 死一t o ) h ,又( 阢一u 。) h 。) , 北京工业大学理学硕士学位论文 w = w ( t o ,乱o ) = d i a g ( k 1 , 1 ( 噩一t o ) k 2 , 。( 既一u o ) l 1 ) 通过平均,可以定义 酢0 ) _ 去喜训圮吣 = 丢擎( 酬,一廖 2 2 2 非参数部分的改进估计 注意到模型( 2 5 ) 可以改写成 ( 2 8 ) ( 2 9 ) p m 一屏( 既) 宠,= 9 ( 正) + i = 1 柚 ( 2 1 0 ) r = l 用初估计 厨( 阢) ) 名1 代替 屏( v d l 1 ,对t 的紧支撑内每个固定的t o ,g ( t o ) 改善后的估计可以定义为9 ( t o ) 最小化( 2 1 1 ) 式 np、2 一孱( 阢) 寇,- - 0 ) 。一n o ( t t t o ) ) k a , h 3 ( 正一t o ) ( 2 1 1 ) i = l r = l 通过最d x - 乘理论,可得 9 ( t o ) = e t l ,2 ( 于丁嘶于) 一1 元蚝加( 正一幻) 或, ( 2 1 2 ) i = 1 其中e 1 。2 = ( 1 ,0 ) t ,于是n 2 维的矩阵,第i 行 壶t :( 1 ,( 五一t o ) h 3 ) , p 肌= d i a g ( k 3 加( 死一t o ) l 1 ) ,或= k e 屏( 以) 寇, r = l 因此,9 ( t o ) 即为g ( t ) 的估计 1 2 第2 章基于完全数据的估计 2 2 3 参数部分的改进估计 注意到模型( 2 5 ) 可以改写成 p k 一9 ( 正) = 屏( 阢) 磊+ i = 1 ,n ( 2 1 3 ) r = l 最小化 妻( m 一蚕c 正,一喜c q ,一再c 阢一u 。,兄,、1 2 心,kc 阢一u 。,c 2 1 4 ) i - - - - 1 ( m 一蚕( 正) 一( q ,一再( 阢一u 。) ) 兄,l 心( 阢一u 。) ( 2 r = 1 通过最小二乘的理论可得 ( 2 1 5 ) 其中r = l ,p e r ,2 p 是只有第r 个位置是l 的印1 维的单位向量0 是 礼印的矩阵,其第i 行是 蜉= ( 霹,砰( 阢一u 。) 。) , w j = d i a g ( k 4 凡( 以一咖) ) 坠1 ) , : k = k 一雪( 五) 所以模型( 2 1 ) 中回归系数的估计是 怫= 圭喜去屏( 阢) 忍, 其中毫= 元1 夤- 2 蚋 1 3 ( 2 1 6 ) :k 曲 u一 巩 k 心 u 4 u 丁 一u 印 t “ e 。汹 | l 0 u 胁 北京工业大学理学硕士学位论文 第3 章完全数据下估计的渐近性质 sct,u,=(e。贾lt。,u:u,ee。(更2贾ttitlt=:t,。,uu=:uu),) 令 = ( 文。a 。) 0 a 1 p ,0 入2 p 它的逆记为 s 一1 ( t ,u ) = ( s m a 2 ) ,0 入1sp ,0 入2sp 纵( k ) = t 1 k ( t ) 砒叭( 心) = t a 砖( ) 批 引理3 1 在条件c 1 和c 2 下,当n h 3 一0 0 ,h 3 0 时,有 蹦= 三( 于t 于) = 州剐( 1 + 0 p ( 1 ) ) 1 4 第3 章完全数据下估计的渐近性质 s 2 ( t o ) = p f l ( o ) 矸1 ( o ) ( 1 + d p ( 1 ) ) 其中& = d i a g ( 1 ,p 2 ( 风) ) 引理3 2 在条件c 1 和c 2 下,并且当n h 4 _ 0 0 ,h 4 _ 0 时,有 & 。( u 。) = 三( d t 痧) = p 2 ( u 。) ( 伽) ( 1 + d p ( 1 ) ) , 踺( u o ) = p i l ( u o ) s 1 ( 乱o ) ( 1 + d p ( 1 ) ) , 其中 岛( u o ) = d i a g ( ) ( u o ) ,p 2 ( 尬) q ( u o ) ) q ( u o ) = e ( 贾贾t i u = u o ) = ( q 。a :) ,f t 一1 ( 札o ) = ( q a - a :) 引理的证明比较复杂,类似于文献 3 2 中( 3 5 4 ) 式的证明 3 2 主要定理与证明 定理3 1 在条件c l 和c 2 下,并且n h l h 2 一。,h i h a _ 0 ,h 2 h z _ 0 和h 3 = c 3 n - 1 5 ,其中c 3 是正的常数,有 瓜( 孙。h ) 7 1 。( 础,( t 0 ) h ;) 三( 。,掣) ( 3 ,) 证明由式子( 2 1 2 ) 和引理3 1 可知,雪( o ) 可以写为: 参( o ) = g l ( t o ) + 彘( t o ) ( 3 2 ) 其中 训= 三喜高。( 死刮k 一三p 风( 阢风) ( 1 + d p ( 1 ) ) 奶 o ) 2 去;石b 蚝加m o ) 弋三p 风) 寇a 一三p 厦) 寇a ) o + 唧( 1 ” 1 n 1、 北京工业大学理学硕士学位论文 g ( t o ) 可以写成z g ( t o ) = e 2 ( 于t m 于) 一1 ( 于丁m 于) 0 ( t o ) ,9 7 ( t o ) h 3 ) 丁 = 去喜志。( 正“m ,( 0 ) ( 毫刮( 1 + d p ( 1 ) ) 经过推导可得 其中 g l ( t o ) 一g ( t o ) = ( t 1 + t 2 ) ( 1 + d p ( 1 ) ) ,( 3 3 ) t 1 _ 去喜志。( 乃刮船h h 印0 ) ( 死训 址去喜高酬州班t 通过引用与引理3 1 相似的结论,可以得到 t l = 丢肛2 ( 虬) 夕( 幻) ;( 1 + d p ( 1 ) ) 很明显t 2 是渐近正态的e ( t 2 ) = 0 ,且 ( t 2 ) = 渊( 1 + d ( 1 ) ) 因此 佤t 2 三( 。,篱) ( 3 4 , 再结合( 3 2 ) ,( 3 3 ) 和( 3 4 ) 式,有 瓜( 献刊叫1z ( 础m 渺;) 三( 。,掣) ( 3 5 ) 第3 章完全数据下估计的渐近性质 另外,注意到 屏( 阢) = 所以 其中 磊若n e ; t 籼( y t ( r k w ( 死啉广 x ( v t ( 死,以) ( 死,阢) y ( 死,矾) ) x ( g ( t k ) ,历( 巩) ,纬( 阢) ,h 1 9 7 ( 死) , 2 厮( 巩) , 2 瑶( 阢) ) r = 去e ,t ,2 p + z ( y t ( 死,u , ) w ( t k ,以) y ( 死,以) ) - 1 。k = l n j = l n 虬山( 乃一t k ) k 2 加( 码一以) ( 死,以) j = 1 x k 1 j = l ( t t j - t k ) 。( t j 一死) 鲍,_ l 。( 一巩) ( 瓦,阢) 所, 。( 乃一死) 鲍,_ l 。( 一以) ( 瓦,巩) j 孓= :厂幽h 2) 岛k 加( 乃一死) 鲍九( 一( 死,既) = 去喜喜赢( 争c 础成) 蛳妈吲 鲍, :( u j u , ) w a t k ,阢) ( 1 + d p ( 1 ) ) 屏( 阢) 一屏( 阢) = ( a ,1 + a ,2 ) ( 1 + d p ( 1 ) ) ,r = 1 ,2 ,p h = 嘉砉骞赢廊) k l , h , ( t j - t k ) 酬圳 ( 夕( 乃) + 风( 码) 髟口一w j ( t k ,阢) ) 人r 2 = 磊1 - 2 亡k = l j = l 1 厂a = op ( 死,以) 岛口) 札“乃一死) 施加( 一以b 。 1 7 北京工业大学理学硕士学位论文 进一步 其中 9 2 ( t o ) = ( 皿1 + 皿2 ) ( 1 + d p ( 1 ) ) ( 3 6 ) 卧去喜高 蜘去喜高 k ,寇nl j 人。2 五口l 注意到,对于l ,交换求和符号可得; 蚝, 。( 乃一t o ) , 蚝, 。( 正一t o ) 三喜高筐一毗a ) k l , h , ( t j - - t k ) 酬圳 进一步 ) + 三p 风( u a x 一w ,( t k 、) = 叫m 孰 ( 9 ( 乃) + 风 。口一 ,阢) ) = d p ( 九;+ 九1 ) a = 1 另外,对于皿2 ,注意到 妒,( t j ) 三 另外 瓦皿。= o p ( 1 ) 去喜志( 争c 础成卜c 乃圳 = 躺( 争蜀。) ( 1 + 删 ( 3 7 ) ( 耋s m c 乃,阢,岛。岛,) m c 一巩,蚝mc 死一瑚 吣元1 刍 p 丽l ( t j ) p 州珊,= 嘶_ 1 2 ) , 1 8 p耐pfl,f、,一 第3 章完全数据下估计的渐近性质 得 x n h 3 p 2 = o p ( 1 ) ( 3 8 ) 结合( 3 7 ) 和( 3 8 ) ,有 、n 3 多2 ( 幻) = o p ( 1 ) ( 3 9 ) 定理证毕 定理3 2 在条件c 1 一c 5 下,并且n l 九2 _ 。,h i h 4 _ 0 ,h 2 h 4 _ 0 , 4 : c 4 n _ 1 5 ,其中c 4 是一个正常数,则有 r = 竹+ o p ( 九i ) + o p ( n 一1 2 ) 证明由( 2 1 5 ) 式和引理3 2 ,屏( u o ) 可以表示成 a ( u o ) = 厦1 ( u o ) + 厦2 ( u o ) ,r = 1 ,p ( 3 1 0 ) 其中 ) = 去砉错u i - u o 鹏刊珈州1 ) ) , ) = 去喜喘学驯u i u 0 ( 驴俐( 1 + d p ( 1 ) ) 这里q _ 1 ( u ) 是q 一1 ( u ) 的第r 行 同样,屏( u o ) 可以改写成 屏( 乱o ) = e ( 矽r 驴) 一1 ( 痧t 痧) ( 风( “。) ,岛( u o ) , 屏( 牡o ) 4 ,尾( u o ) 4 ) r = 三喜紫驯u - i t 0 , ( 耋础腓0 ) + 髀o ) ( 以咱) ) ) ( 1 + 0 p ( 1 ) ) ( 寇。( 风( 加) + 风( 乱o ) ( 以一钍。) ) ) ( 1 + 0 p ( 1 ) ) 口= 1 1 9 北京工业大学理学硕士学位论文 可以推得 其中 z ,1 ( u o ) 一屏( u o ) = ( r 1 + r 2 ) ( 1 + d p ( 1 ) ) ,( 3 1 1 ) ( 弘c 觚,- z 。( u o m m ,门 ( 贾t 。( 风( 既) 一成( u o ) ( 以一乱o ) ) ) 口= l 忌= 去喜学驯u - u o k 利用与引理3 2 同样的结论,可得 r 1 = 三p 2 ( 心) 群( u 。) 危i ( 1 + 唧( 1 ) ) ( 3 1 2 ) 至于r 2 ,很明显r 2 是渐近正态的,并且有 因此, 即有 e ( 恳) = 。,u 。r ( r z ) = 芝兰删 瓜r z 三( 。,0 2 v o ( 矿k , ) f r ( u o ) ) ( 3 1 3 ) 忌= o p ( ( n h 4 ) 一1 2 ) 结合( 3 11 ) ,( 3 1 2 ) 和( 3 1 3 ) 式,有 瓜( m ) 叫1 。( 甄胤域) 三( 。,掣篙型) ( 3 1 4 ) 2 0 第3 章完全数据下估计的渐近性质 下面讨论屏2 ( u o ) ,注意到 夕( 正) = 则有 其中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025中国石油大学(北京)网络与继续教育学院招聘1人备考练习题库及答案解析
- 2025上海市农业科技服务中心招聘博士研究生1人备考练习试题及答案解析
- 2025年口腔颌面外科手术器械使用与消毒模拟考试卷答案及解析
- 2025年下半年黑龙江工程学院公开招聘博士教师55人备考练习题库及答案解析
- 2025年传染病学病原体鉴定试题答案及解析
- 2025年内科学综合理论考试答案及解析
- 2025年放射科医学影像解读技能考察答案及解析
- 2025年降脂茶行业研究报告及未来行业发展趋势预测
- 2025年MVR蒸发器行业研究报告及未来行业发展趋势预测
- 2025年高端合金材料行业研究报告及未来行业发展趋势预测
- 项目质量保证措施及进度保证措施
- 2024公路水运工程工地建设标准化指南
- 打架斗殴安全教育
- 档案数字化工作实施方案
- 短视频在互联网媒体与在线游戏行业的应用研究
- 中国脑小血管病诊治指南2023版
- 已充氧的医用氧气瓶产品供应链分析
- 新版加油站全员安全生产责任制
- 数字人课程设计培训
- GB/T 44669-2024残疾人服务机构服务规范
- 水质-氯化物的测定验证报告
评论
0/150
提交评论