(应用数学专业论文)经验似然统计推断及其应用.pdf_第1页
(应用数学专业论文)经验似然统计推断及其应用.pdf_第2页
(应用数学专业论文)经验似然统计推断及其应用.pdf_第3页
(应用数学专业论文)经验似然统计推断及其应用.pdf_第4页
(应用数学专业论文)经验似然统计推断及其应用.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 经验似然比方法是一种非参数统计方法,本文介绍了经验似然比的 历史发展及现状,并主要推广经验似然比方法到部分线性反映变量含误 差及部分线性反映变量随机缺失模型,对经验似然比在其它模型中的应 用作了简单介绍。 首先,本文对经验似然方法的定义及其在总体均值、m 一估计、非参 数回归及不完全数据模型中的应用作了简单介绍,使我们能对经验似然 方法有一个初步的了解,便于理解经验似然的本质。 其次,发展经验似然方法到部分线性反映变量含误差模型。变量含 误差模型己被应用到很多领域,如:经济、生物等,反映变量含误差也 是一个现实问题,本文在反映变量含误差的情况下得到了w 们s 定理的 非参数形式,定理用来构造参数向量的渐近置信区域,参数向量的置信 区域也可由其它方法来构建,但经验似然方法在实践中更直接和简单。 最后,研究了经验似然方法在部分线性反映变量随机缺失模型中的 应用。事实上,反应的缺失经常发生于民意测验、市场调查、社会经济 研究、医学研究等领域,本文在部分线性模型反映变量随机缺失的情 况下,考虑关于y 的均值9 的统计推断,特别的,我们考虑样本容量为n 的l ,随机缺失( m a r ) ,本文给出在一定的辅助信息下关于反映变量y 的 均值目的经验似然统计推断。 关键词:经验似然比,部分线性模型,反映变量含误差,随机缺失,渐 近置信区域。 e m p i r i c a ll i k e l i h o o ds t a t i s t i c a li n f b r e n c ea n d a p p l i c a t i o n a b s t r a c t t e m p i r i c a ll i l c e l i h o o di san o n p a r a 如e t r i cm e t h o do f t a t i s t i c a li n f e r e n c e ,t h i s p a p e ri n t r o d u c e dh i s t o r i c a ld e v e l o p m e n ta n dp r e s e t $ i t u a t i o no fe m p i r i c a l l i k e l 0 h o o dm e t h o d ,w em a i n l yd e v e l o pt h ee m p i r i c a ll i k e l i h o o di i l e t h o dt op a r t i a l l y1 i n e a r e r r o r i n r e s p o n s e sm o d e l sa n dp 8 r t i a l l y1 i n e a rr e g r 曙s i o nm o d e lm i s s i n g r e s p o n s e sa t r a n d o m ,f 撕a p p l ye m p i r i c a ll i k e l i h o o dm e t h o dt oo t h e rm o d e l s ,w eo n l yi n t r o d u c e s i m p l 矿 f i r s t ,t h i sp a p e ri n t r o d u c e dt h ed e 矗n e so fe m p i r i c a ll i k e l i h 0 0 da n di ta p p l i c a _ i o ni nf u n c t i o n 8o fm e a s ,m e s t i m a t e s ,n o n p a r 啪e t r 主cr e g r 明s i o 8 n du i l c o m p l e t e d a t a ,t h l l 8l e tu sh 8 v ea ni n i t i a lk n o 而ga b o u te m 脚r i c a ll i k e l i h o o da d dh d pu s u n d e r s t 蛐dt h e 船舱n c e0 fe m p i r i c 缸1 i k e l i h o o d s e c o n d ,d e v d 印t h ee m p i r i c 柚l i k e l i h o o dm e t h o da n da p p l yi tt op ”t i a l l yl i n e a r e r r o r - i n _ r e s i o n s e sm o d e l s e r r o r _ i n _ v a r i a b l eh a db e e na p p l i e di m a n ya r e a s ,f o r e x a m p l ee c o n o i i l y b i o l q g y 删s oo n ,e r r o r i n - r e 8 p o i l s e si 吕ar e a l i s t i cs i t u a t i o nt o o i nt h i sp 印e r ,a 0 n p 8 r 锄e t r i cv e r s i o no fw i l k st h e 叫e mi sd e r i v e d ,t h er e s u l ti st h e n u s e dt oc o 璐t r u c tc o n 矗d e n c er e g i o n so ft h ep a r a m e t e rv e c t o r c 锄d e n c er e g i o n s f b rpc a 血8 1 s 0b ec o n s t r u c t e d 埘n go t h e rm e t h o d s ,b u tt h ee m p m c a l1 i k e l i h o o d i n e t h o di 8v e r ye 硝yt oi m p l e i n e n ti np r a c t i c e f i n a l l y 】e ) c t e n dt h ee m p i r i c 8 ll i k e h h o o dm e t h o dt op a r t i a l l yh n e a rr e g r e s s i o n m o d dl l l i s s i n g 糟印o n 8 e 8a tr a d o m i nf h c t ,m i 8 s i n gr e s p o n s e sa 鹏c 0 i m n o ni n o p i n i o np o l l s ,m b r l c e tr e 8 e 8 r c hs u e y 吕,s o c i o e c o n o m i ci n v e s t i g a t i o n 8 ,m e d i c a ls t u d - i e s 蛆d0 t h e r8 c i e n t i 6 ce 冲e r i m e n t 8 t h em a i np l l r p eo ft h i sa r t i c l ej st oe x t e n d t h ee m p i r i c a ll i k e l i l l o o dm e t h o dt ot h em i s 8 i n gr 髑p o i l s ep r o b l e mm a k es t a t i s t i c a l i n f e r e n c e s 口o n t h ei r 坨a no fr e s p o i l 8 ey ,e 8 p e d 出l yw ec o 璐i d e rt 硷c 8 8 ew h e r e8 0 m e yv a l u e si nas 锄p l eo fb i z enm a yb em i 8 s i n ga tr a n d o m ( m a r ) ,i nt h i 8a r t i c l e , s t a t i s t i c a li n f e r e n c e s 目o nt h e l e a no fr e 8 p o n s eyw i t h8 0 l ea u 菇l i a r yi n f o r m a t i o n i sa m 缸l a b l e o u t 。r z h 姐gt a o( a 卯f t e dm o t e m o t c s ) 6 9 出r e d e d g u op e n g j i a n g p r o ,e s s o r k e y 、阳r d s :e m p i r i c a ll i k e l i h o o d ,p a r t i a l l yl i n e a rm o d e l s ,e r r o r i n r e s p o n s e s m i 8 s i n ga tr a n d o m ,a s y m p t o t i c a l l yc o n 6 d e n c er e 舀o n s 1 1 西北大学学位论文知识产权声明书 本人完全了解学校有关保护知识产权的规定,即:研究生在校攻 读学位期间论文工作的知识产权单位属于西北大学。学校有权保留并 向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被 查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学 位论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文 章一律注明作者单位为西北大学。 保密论文待解密后适用本声明。0 7 。 学位论文作者签名:盗! 叠指导教师签名:缇丛竖! :学位论文作者签名:硷f 堑指导教师签名:倦! ! 塑! , 伽口占年月乡日伽一绰月f 日 西北大学学位论文独创性声明 本人声明:所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,本论文不包含其他人已经发表或撰写过的研究成果,也不包含 为获得西北大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的 说明并表示谢意。 学位论文作者签名:貉鸣 伽年g 月f 口伽6 年6 月5 口 1 1 历史背景 第一章绪论 经验似然的研究是个崭新的领域,它的思想至少可追溯道文 献【2 7 l ,在这篇文章中,作者在随机删失下笈展非参数似然比方法构造生存 概率的置信区间也就是说经验似然的思想实际上起源于随机删失数据分 析然而经验似然的正式提出却是在1 9 8 8 年,文献将这一思想方法应用 到完全独立同分布样本下总体均值这一简单而重要情形的统计推断,进而 提出了经验似然比方法,这一方法一经提出就引起许多计量经济学、生物 统计学研究者的兴趣他们已将经验似然方法应用到各种领域,如简单的 单变量均值的置信区间、光滑函数的均值、同归模型、广义线性模型、 估汁方程、核光滑及非参数数据问题,值得注意的是,虽然经验似然的 思想起源于不完全数据,但是经验似然在不完全数据中的应用却直到本 世纪初才有所触及,如何将经验似然方法推广到不完全数据的统计分析 是一项重要而困难的仟务,尽管经验似然方法有很多优点,但它很难应 用到一些比较复杂数据的分析,近几年,北京大学王启华及其合作者存 不完全数据的经验似然统计分析方面作了一些有益的探索,找到了不完 全数据应用经验似然的途径。在实践中,数据通常是不完全的,主要表 现在数据被随机截断、数据测量有误差、数据缺失。经验似然方法的本 质是在约束条件r 极大化非参数似然比,感兴趣的参数由约束条件带入 极大似然比中,文献基于这样的思想在提出经验似然并将其应用于总 体均值的统计推断时使用了线性约束条件,从而表明了这方法有非常 一般的应用,因为统计中许多方程关于我们感兴趣的参数或参数的某已 知函数是线性的或许多统计模型的参数可由关于该参数的菜已知函数的 1 线性方程决定,正是基于这一特点王启华及其合作者推广经验似然方法 到上面提到的三种不完全数据的统计推断。 经验似然为我们提供了一种建造置信区域及假设检验的方法,它是 参数与非参数方法的结合,为我们提供了一个独特的实践工具,它的提 出与发展使很多统计领域联系起来,经验似然方法的应用将会得到更广 泛和深入的发展。 1 2 经验似然方法简介 设x l ,尥,五。r 4 独立且具有相同的分布函数,经验分布函数 使得f 的非参数似然 工( f ) = f ( 硷) 一f ( 确一) i = 1 达到极大,这里如( a ) = j 4 ) 类似于参数推断中人们利用参数似然比进行假设检验与区间估计,我们 定义经验似然比函数 即) = 器 ( 1 2 1 ) 不象参数似然比,非参数似然比中不包含未知参数。一个自然的问题是 如何使用它对参数做统计推断,注意到一些参数p 是总体分布的泛函, 即8 = t ( f ) r p ,其中t ( ) 是分布f 的某泛函,f 属于某分布类,如总 体均值及分位点等就是上述形式泛函的例子为了对t ( f ) = 目做检验,文 献f 19 定义了如下的经验似然比检验统计量 7 已( p ) = 8 u p r ( f ) i 丁( f ) = 8 ,f ,( 122 ) 2 奴 。澍 | | r 很显然,经验似然比实际上要求f 在满足约束条件丁( f ) = 目下,使非 参数似然比达到极大( 在无约束条件时,极大非参数似然比是1 ) ,而参 数目由这一约束条件引入这一极大似然比中,从而得到关于参数p 的非参 数似然比函数。用这一非参数似然比作假设检验,区间估计或进行其他 统计推断,这一方法就是所谓的经验似然比方法。如果霓( 口o ) o ) o 4 m 钉 。澍 | | p 一 r 引理1 2 保证了分布的均值终留于样本凸包的内部。 引理1 3 :设k 0 为独立同分布的随机变量,定义 如果e ( 砰) a 礼) = 0 ( 竹一 ) 1 5 经验似然的推广 1 5 1 约束经验似然 如果我们知道t ( 昂) ,则很自然的,进行统计推断时我们仅考 虑t ( f ) = 丁( 蜀) 的那些f ,这样一个信息加强了我们对其它函数的统 计推断,文献【2 l 】中给出了当两个函数都是均值函数时的约束经验似然。 5 引理1 5 :设z l ,面,磊为钟十q 中独立同分布的随机变量,这早 五= ( ,) ,五钟,k 印,p ,q o v n r c z ,= 。:= ( 三二三二) e ( z 1 ) = 肛。= ( “:。,卢;,o ) , 觋删= 型黜稀端豢裂等型 这里r 为五的经验分布函数,如果 则 这卑 = + q ( n 一 ) 如= + q ( n 一 ) 一2 l o g 佗l ,x ( b 肛z ) 2 n ( ( f 一坳) 一岛z ( 又一) ) 五 ( ( 矿一蜥) 一岛。( 膏一) ) + 0 p ( 礼一) 掣肛= 可掣一掣。= 。”国。= 掣。嘉 所以当n o 。时 证明见文献 2 1 2 1 0 9 冗y x ( p 伽p 。) x 2 ( 口) 6 5 1 5 2 三角阵列经验似然 在经验似然提出及文献【2 0 】中均要求考察对象独立同分布,但在处理 回归问题的非随机回归量时,同分布的要求一般是不成立的,这一部分 我们放松对同分布的要求。 设m o z e 匆) ,m i 他e 匆( v ) 分别为对称阵y 的最大最小特征 值,c ( a ) 为集合a 舻的凸包。 引理1 6 :设磊。俨,1 茎i 茎礼,psn 。,为一随机向量集 族,z l 一,z 。对任一礼独立,假定 e ( 邑。) = m 。,y n r ( 磊。) = k 。 令 :三产 ”鲁 盯l 。= m 口z e i g ( ) = m 伽e 国( k ) 假定当凡一o 。时 p ( m 。c ( 历。,磊。 ) ) - + 1 n 2 e ( | | 毛。一m 。1 1 4 盯舞) 一o z j ” o = l 且对某些c 0 及所有n p 垒 c 仃l n 则 2 l o g 冗( m 。) x 2 ) 这罩 冗( m ) = 8 u p 他咄l 咄o ,地= 1 ,历。= m 证明见文献f 2 l j 7 第二章经验似然的一些主要应用 2 1引言 本章主要在上一章的基础上着重介绍经验似然方法在统计推断中 的一些具体应用,经验似然方法是文献【1 9 】在完全独立同分布样本的 总体均值的统计推断中提出的,文献【2 q 将经验似然方法推广到线性模 型的统计推断,文献【1 5 】应用经验似然于广义线性模型,文献 3 7 】研究部 分线性模型的经验似然,文献【6 】研究了非参数回归的经验似然,文 献【3 7 】给出了带有讨厌参数的经验似然置信区域,文献应用经验似然 于分位回归及m 一泛函的统计推断,文献f 2 8 】【2 9 】【3 1 3 2 】侧【3 4 】【3 5 j 【4 6 】【5 0 】 应用经验似然于不完全数据模型。本章我们具体介绍经验似然方法在 总体均值、m 估计、非参数回归及不完全数据模型中的应用,关于线 性模型、分位数及估计方程的经验似然文献 4 8 j 已作简单介绍,详见文 献【3 】【2 l 】【2 5 】【4 l 】。 2 2 总体均值及其函数的经验似然 经验似然方法是对最重要的总体均值的推断提出的,下面我们就这 一简单形式的讨论来理解经验似然的本质。 设t ( f ) 表示总体均值,即 7 ( f ) = z d f ( 。) 由f 1 3 1 ) 式,总体均值的经验似然函数为 nnn 冗( 肛) = s u p ( 啪) i 船= l ,舭严“) ( 2 2 1 ) i = l i=l:=l 8 由拉格朗日乘子法,计算得 肌= 币瓢乇丽i - 1 z ,m ( 2 2 2 ) 其中a 是下列方程的解 f _ 毒生:o 刍1 + a 丁( 甄一肛) “ 将( 2 1 2 ) 代入( 2 1 1 ) ,则“的经验对数似然函数为 = 一2 1 0 9 咒( p ) = 2 l o g ( 1 + a t ( 戤一) ) 设墨,尥,为中独立同分布的随机向量,均值为p o ,协方差阵 有限且秩为口 0 ,由文献f 19 】的讨论可知 f ( p ) x 2 ( q ) 由此可知“的水平为1 一a 的置信域为 p :f ( “) ) ( :( 口) ) 很多统计量与样本均值有关,下面我们考虑参数为样本均值的函数 的经验似然统计推断。 定义:设j 为兄中的闭区间,d ( ,) 是,上的实函数集合且右连续、左极限 存在,定义范数 i i 川= s u pi ,( z ) i 如果存在巧:d ( j ) 一r 使得统计函数t :d ( d r 满足当| if 一昂i i ,o 时 盟与譬产一l if 一昂| | “ 其中f 0 d ( ,) 则称丁在娲可导,线性变换矗叫做t 在娲的f r e c e t 导数 设z l ,历,为彤中独立同分布的随机变量,有均值卢及秩为p 的 有限协方差,日:f 矽一r q ,且在弘点存在f r e c e t 导数g o 即 日( z ) = 日( p ) + g ( z 一卢) + 。( i iz pl i ) ,| | z 一卢i l _ o 考虑参数日( “) ,定义 = - z 删列f f n ,r ( f ) r ) g ,。= 日( z ) i z 磊,。) 嘭。= 日( 芦) + g ( z p ) 1 z 磊,。 由文献1 2 1 l 定理2 可知 p ( h ( p ) 。) + p ( ) ( 2 ( d ) 一2 l o g r ) ,咒,o 。 这里 d = m i n ,r n 礼( g ) ) s u p0 日( z ) 一日( p ) 一g ( z 一肛) i f = o - ( 一 ) z z n “ 2 3m 一估计的经验似然 文献 1 9 】在提出经验似然方法时已提及经验似然方法可用来构建m 一 估计的置信区域,并给出m 一估计的置信区域。文献【2 0 j 推广文献【1 9 】的结 果到多元m 一估计,文献【4 1 1 给出了具有辅助信息的m 一估计的经验似然统 计推断。下面我们将这些结果作一简单介绍。设x 1 尥,为分布 函数为f 的独立同分布的随机变量,m 估计目( f ) 定义为下列方程的根 e 妒( z ,) = 砂扛,) d f ( z ) = 。 ( 2 矗1 ) 1 n 这里x fx ,砂( 。,口o ) r 由文献【1 9 】m 一估计的经验似然函数定义 为 冗( ) = s u p n 鼽b 芝o 肌= 1 ,胁妒( ,) = o ) ( 23 2 ) 由简单的计算可得 鼽= 可币杀厕i 2 ,礼 ( 2 删 鼽2 币了面厕 ”1 2 ,忆。 其中口是下列方程的解 去砉蔫= 。 皿。固 礼鲁1 + p 砂( 黝,) 。 叫 由文献 捌,若口o = p ( f ) 满足( 2 3 1 ) 存在唯一,e 妒2 ( z ,口o ) o ,e 妒( 茁,) i ( 礼l 。g n ) 一;) = 。( n 一 ) j = l 山:燃| | 呦( 如) 训= 。( 1 ) j = l a 5 :9 ( - ) 满足厶咖s c 甜。条件 a 6 :礼- 1 甄玎一 o i = 1 a 7 :令”l 。, 。分别为的最大最小特征值,且存在正数c l ,c 2 ,使得 c 1 茎t 切1 l n c 2 n 一2 o 历咿一o j = 1 这里| | l i 表示欧几里德范数 定理3 1 : 若风为参数芦的真实值,则在条件a 1 一a 7 下,一2 2 ( 肺) 服从 自由度为p 的卡方分布x 2 ( p ) ,即 一2 f ( 岛) ) ( 2 ( p ) 由定理可赢接得到下列推论 推论:口的置信水平为1 一n 的置信域为 卢:一2 f ( 卢) ) ( 。( p ) 1 8 3 3 定理证明 在证明定理之前先给出下列一些引理。 引理3 1 :在条件a l a 7 下,以下三式成立: ( j ) :怕州h i 击薹磊( 9 ( 如) 一若( 咖( 圳忙0 ( 1 ) ( 2 ) :| 1 | | :| i 去薹( ;西和。扣川卜o p ( ”t ( 3 ) :| | | | = | | 赤萎善蛳o 。圳2 d p ( ”t 让明: ( 1 ) 由a l ,a 3 ,a 5 | | 去若列“如卜善。g 渤”| | 击丢| | 训i 蚤) | 卜引 。击萎惦| | ;h 一勺i ( 州o g 旷幻 + 击若| | 引| 吾呦 。“_ 怪伽1 0 缈r 幻_ o ( 1 ) ( 2 ) :注意到e ( e j ) = o ,y o r ( 5 f ) = 盯2 ,由a 4 引l 赤著( 吾釉“如”引卜。 驯去善( ;跏和。b | | 2 i l ( 磊( 如) ) | 1 2e 弓= 。( 1 ) 这就暗含了命题。类似于( 2 ) 可证( 3 ) 。 1 9 引理3 2 : 在条件a l ,a 2 ,a 5 下,令矿一 磊磊r 铲一 :e 。,则 ( 1 ) :月l = e 。( 蜘面( 屯) ( 勺+ ) ) 2 = o p ( 1 ) 怔l = l nn ( 2 ) :r 2 = e l ( ( 屯) ( g ( 如) + 9 ( o ) ) 2 = 。( 1 ) 忙1 = 1 一 n n ( 3 ) :月3 = e ( 勺+ ) ( 嘶( 屯) ( 勺+ ) ) = o p ( 1 ) 诘1 j = l nn ( 4 ) :r 4 = e 。( 勺+ ) ( 叫可( 赴) 国( 如) + g ( o ) ) ) = 唧( 1 ) = 1 j = 1 ,nnn ( 5 ) :风= ;:e i ( 呦( 如) ( 勺+ q ) ) ( ( 屯) ( 9 ( 如) + 9 ( o ) ) ) = ( 1 ) 一仁l j = 1j = 1 证明: ( 1 ) 由a 2 ,a 6 ,对任意p 维向量o o e 憎兄,呦f _ 寺a 轴。( 喝( 如) ) e ( 弓+ 嵋) = 。( 1 ) j = jj = l 这就暗含了r l = 唧( 1 ) ( 2 ) 由a 5 ,a 6 兄2 | | s ”耐( 屯) ( 9 ( 如) 一9 ( 0 ) ) 1 1 2 叫可( t 。) ,( i 如一如j ( n l o g 礼) 一 ) ( 屯) 川如一oi s ( 礼1 0 9 扎) 一种= o ( 1 ) j = 1 ( 3 ) 由a 1 ,a 2 e o 手月3 q oi 。触。触 e e 。甜。斟 1 一n 1 一 0勺 札 。赳 目fs 1 2 ge 7 0 血 。嘲 1 一n s 昙口z 妻n 如。( 妻叫孔) ) k 。( 1 ) # 1 j 2 l ( 4 ) 由a 5 ,a 6 ,类似的可证:r 4 = 0 p ( 1 ) ( 5 ) 对任意的p 维向量a o q 吾r 5 n of s ia 手r 1 a ol + ia 手r 2 0 0 由( 1 ) ( 2 ) 可得r 5 = ( 1 ) 引理3 3 :在条件a l a 6 下 去娄磊上( 。,z 盯2 ) 证明 +k2 ( r 。1 一r 。2 一j k 3 ) 由a 6 ,引理3 1 ,及中心极限定理有 击宝磊三( o ,2 盯2 厶)、n 鲁 引理3 4 : 在条件a 1 ,a 2 ,a 5 下 证明 ;壹磊刁三z 盯。 = 1 昙宝讶 甄弥m 炉 2 1 十 以 。趟 一 上瓶 i | 磊 。斟 土何 翠 磊 。谢 l n + r l + 只2 2 r 3 + 2 r 4 一民 注意到 e ( 去喜订 嘲针2 ) _ 2 以 由山类似于文献【3 7 ,对任意的p 维向量n o ,有 由引理3 2 。砖娄订 稍针嘲2 ) 0 0 叫砖喜铲嘲针好h ) 三。 :喜群三z 引理3 5 :记= 四眵 i 五l i ,则在条件a 7 下 i 气l 气n ( 1 ) 一唧( n ) ( 2 ) ;塾址巾幻 ( 3 ) 1 i 圳= o p ( n 一 ) , 证明:类似于文献【2 0 】可证结论 证明定理:由( 3 2 1 ) 式,令n = t 磊,则由引理3 5 ( 1 ) ,引理3 5 ( 3 ) 及a 7 怒h i = o p ( 礼一 ) 唧( n ) = 叫1 )( 3 3 1 ) o 一昙娄焘2j 喜邵一t + 南”等1 + a t 磊”智” 。1 + n 2 2 f 3 3 2 1 o o n叠h 。斟 1 一仲 n磊魂 。斟 l n 五 。嘲 1 一 | | 由引理3 3 ,引理3 4 击喜磊叫札啕 :喜群叫,) ( 3 3 2 ) 式最后一项取范数,由a 7 及引理3 5 ( 2 ) 所以 = 吾挈硼一旷1 = o ( n ) g l p ( n 一1 ) o 刍( 1 ) = c 协( 竹一 ) a = ( 去磊磊丁) ( 3 3 2 ) 式两端同乘a t ,由引理3 5 ( 3 ) 又由( 3 3 1 ) 式 ,o g ( 1 川邓一萼+ 哺 这里仇满足对有限的b o 尸 l 忱i bn1 3 ,l isn ) ,l n 一。 根据( 3 3 3 ) ,( 3 3 4 ) ,( 3 3 5 ) 式 一2 f ( 口0 ) = 2 l o g ( 1 + r ) i = l :2 f n 2 3 ( 3 3 3 ) ( 3 3 4 ) ( 3 3 5 ) + 邑 。僦 1 一他 一 筹 。:l 1 一n n + 磊 。澍 上何 + 懂, 磊 r 协 。:l 一 磊 f 。埘 | | 0 仇 。耐 2+ 饽 。筒 由引理3 3 ,引理3 4 及 可得 :妻? ;+ 2 妻吼+ o p ( 1 ) = ( 击喜磊九;喜磊磊t ) - 1 ( 击;磊) + 2 善哺+ 唧( 1 ) s2 b 忪l 3 | | 易1 1 2 = l 2 孔b g p ( 礼一;) o ( 礼 ) 削1 。 ( 1 ) 2 4 第四章部分线性反映变量随机缺失模型的经 验似然统计推断 4 1引言 在很多科学领域中,一个基本的任务就是来估计很多因素对我 们所关心的量的影响,回归模型为我们提供了一个强有力的框架, 根据参数、半参数及非参数的影响,各种统计方法己被建立,如文 献【2 】【4 】f l3 】【1 5 】【19 】【删【3 7 】【4 3 l 【4 4 】,在实践中,由于信息的丢失、数据 的错误获得及不可控因索的影响等,数据缺失经常发生,事实上,响应 的缺失经常发生于民意测验、市场调查、社会经济研究、医学研究等领 域在这种情况下通常的完全数据统计推断不能直接应用,一种常见的方 法是给出缺失响应的一个估计值,使得能够使用完全数据的统计推断 设y 是d 维的解释变量,掣为由x 影响的响应变量,在实践中我们可 获得一个随机的不完全数据 ( 咒,m ,鳓忙l ,2 ,礼 这里所有墨可观测,如果k 缺失,魂= 0 ,否则也;1 ,我们的目 的是估计鲈的均值,记作8 ,文献【2 9 】1 3 1 】1 3 5 】利用核回归估计可的均值日, 设m ( z ) = e ( y | x = z ) ,k ( ) 是核函数,h 为窗宽序列且当几一o 。时 减少为0 ,则m ( z ) 可由下式估计 酬= 逛黼磁 因为f m ( 五) = e m ,缺失的k 可由俞。( 托) 估计,则目可由 反t = : ( 蠡k + ( 1 一鳓氟( 五) 2 5 估计,在假定一些值随机缺失( m a r ) 的情况下,文献【3 l 】中建立 了儿的修正形式的渐近正态性,并给出了渐近方差的一致估计,这个结 果可被用来生成估计量的置信区间及假设检验。然而由文献【1 9 】介绍的 经验似然方法构造目的置信区域更为简单和直接,对于完全数据,经验 似然方法已被很多作者推广,如文献f 2 】f 4 1 【5 】【1 5 】【2 5 】 考虑部分线性模型 k = 耐。卢+ 9 ( 正) + 岛t = 1 ,2 ,一,n( 4 1 1 ) 其中p 剧为未知回! 磅参数,9 ( ) 为 o ,1 】上的未知函数, 五,正 为 o ,1 】上的随机设计或常数序列,模型误差湘互独立且条件均值为零, 方差给定,很明显线性模型是部分线性模型的特殊情况。本文在部分线 性模型( 4 1 1 ) 反映变量随机缺失的情况下,考虑关于y 的均值口的统计推 断,特别的,我们考虑样本容量为n 的y 随机缺失,但x ,t 可完全观测, 这样我们可由模型( 4 1 1 ) 获得下列的不完全观测: ( m ,晚,k ,霸) i = 1 ,2 ,他 这里k ,冗可观测,当m 缺失时,也= o ,否则也= l 。在本文中假定y 是随 机缺失f m a r 】的,m a r 假定暗含了6 和y 在给定x ,t 下是条件独立的,即 p ( 8 = 1 l f x ,) = p ( p = 1 1 x ,t ) m a r 假定在缺失数据的统计分析中是普通的,在实践中也是合理的。本 文的主要目的是推广经验似然方法到部分线性反映变量随机缺失模型, 给出在一定的辅助信息下关于反映变量y 的均值日的统计推断。 4 2 估计及调节经验似然 4 2 1 未知函数及参数卢的估计 我们建立一些文中将会分析的估计量,并给出未知函数及参数口的 估计 根据文献【2 9 】,对模型( 4 1 1 ) 乘以彘有 彘k = 瓯x 手口+ 也9 ( 正) + 氓矗 对上式取给定t 下的条件期望有 由上式 这里 因此 e ( 盈m i 互= ) = e ( 魂霹i 噩= t ) 卢+ e ( 也l 五= t ) 9 ( t ) 9 ( t ) = 夕2 ( t ) 一9 ( ) 卢( 4 2 ,1 ) 以归鬻引垆器 文( m 一虫( 乃) ) = 瓯( 五一g l ( 霸) ) 丁p + 民毛( 4 2 2 ) 基于蠡= 1 时的观测值及仇( ) ,i = 1 ,2 的估计,利用最小二乘法,可给 出卢的一个估计量设( ) 是一个核函数,k 为窗宽,扎一。时k o , 定义 呲,= 骺襻 则由文献【4 2 】 弧( t ) = 国( t ) 玛 = l 2 7 弧( t ) = 白( t ) 巧 = 1 分别为9 1 ( t ) ,9 2 ( ) 的相合估计由( 4 2 2 ) 式,p 的估计满足下式 哮n 魂( ( k 一弧( 正) ) 一( 墨一弧( 互) 口) ) 2 ( 42 3 ) 由( 4 2 3 ) 很容易得到卢的基于观测值( 五,正,k )i i :晚= 1 ) 的估计 磊= 盈 ( 五一矾。( 霸) ) ( 砥一茆。( 五) ) t ) - 1 = l & ( ( 五一莼。( 五) ) ( m 一彘。( 五) ) ) 】 由方程( 4 2 1 ) 可知g ( t ) 的估计量可被定义为在( 4 2 1 ) 中分别 用屎,磊。( t ) ,磊。( t ) 代替p ,g l ( t ) ,9 2 ( t ) 即 矗( t ) = 弧( 一蔬( t ) 磊 下面我们考虑9 的估计量,由上面的讨论,口的估计量由下式给出 瓦= 去砉( 最k + ( 1 吲( 群赢吲驯 定义 “( 。,t ) = 。一9 1 ( ) m ( 。,t ) = z t 卢+ 9 ( t ) p l ( t ) = p ( 6 = 1 l t = t ) p ( z ,t ) = p p = 1 x = z ,t = t ) = e 尸( x ,t ) u ( x ,丁) “( x ,t ) r 盯2 ( z ,t ) = e ( y x r 卢) 2 f x = 。,r = 铂 下面的引理给出了瓦的渐进正态性,在此之前先给出下列一些假定条 件。 a l :s u p e 川xij 2l t = 却 。 a 2 :t 的密度函数r ( ) 存在且满足o i n fr o a 7 :( 。) 为有界核函数且j ( z ) i 如 o 。 a 8 :礼危。o o ,n i o a g :e | | 咖( z ) 庐( z ) tj j p = p 。嘲 p = 一k p 。澍 p 甙 o 。嘲 r l p s2一 由引理4 7 ( 2 ) 1 哦 日 燃 以概率1 成立 运用拉格朗日乘子法 t ( p ) = 2 l 。g ( 1 + a ( 或。一日) ) ( 4 2 7 ) a 为下式的解 丢耋熹南= 。 。固 礼智1 + a k 。一目 、7 由手t ( 目) 中的豫不是独立的,故t ( p ) 不服从渐进的标准的卡方分布。文 献1 2 9 】中的定理4 1 给出了t ( 目) 的分布我们以引理的形式写出来。 引理4 3 : 假定除4 3 外a l a 9 均成立,则 砜) 三器娥1 ) 证明见文献【2 9 1 由引理4 3 ,我们有 r ( 8 ) 己( 三x 2 ( 1 )( 4 2 9 ) 这里 “忙器 如果可定义一个r ( p ) 的相合估计记作( 口) ,则一个调节的经验对数似然比 可定义为 ;。,。d ( 日) = r 。( p ) l 。( 挣)( 4 2 1 0 ) r 。( 口) 为调节系数,由( 4 2 9 ) 式 己,。d ( ) 匕) ( 2 ( 1 ) 文献f 2 9 】定义相合估计( 口) 为 这里 ( p ) :型 7 翻= 去喜( 珏咿 ( 4 z1 1 ) 引理4 4 : 在条件a l a 3 ,a 一山下,如果口是参数的真实值,则有 三喜( 豫叫2 三印) 这里 矿印) = e ( p ( x ,t ) 口2 ( x ,丁) ) + y n r ( x t 卢+ g ( t ) ) 证明: 击妻( 觅叫。 l = 1= :喜( 也k + ( 1 圳( 砰菇吲啪叫) 2 = 三静k 一砰阳) ) + ( 1 一蠡) ( 叉丁( 赢一p ) + ( 巍( 如) 一g ( 如) ) ) + ( 砰卢一9 ( 如) 一目) ) 2 = :醪( k 一砰p 一删) 2 -n + 去( 肆p 一一目) 2 1 n + 砉( 卜诮霹( 菇一卢) + ( 讹) 一酬) ) 2 n + 云氓( k 一砰卢一9 ( 屯) ) ( f 卢一9 ( 如) 一目) n n + 昙也( 1 一也) ( m 材口一9 ( 屯) ) ( 砰( 磊。一j ) + ( 磊( 屯) 一9 ( 屯 3 由大数定律及m a 刷段定 根据文献1 2 9 r 1 二_ 冗2 二_ + e ( p ( x ,丁) 口2 ( x ,t ) ) v o r ( x t p + 9 ( 丁) ) 赢一p = 咋( 礼) 赢( f ) 一9 ( f ) = 唧( n j ) 结合a l 凡a 7 我们有 r 三0 ,i = 3 ,4 ,5 ,6 由此引理得证 引理4 5 :在引理4 3 的条件下 己州( 目o ) x 2 ( 1 ) 证明:由引理4 2 、引理4 4 可直接推出引理4 5 4 3 具有辅助信息的经验似然 我们假定x 的辅助信息具有形式e 咖( x ) = o ,这里 ( ) = ( 咖1 ( ) ,- ,( - ) ) r ,r 1 ( 4 2 1 2 ) ( 4 2 1 3 ) 是已知的向量函数,比如向量x 均值或中位数,为了使用辅助信息,首 先我们求解下式 o )( 4 3 1 ) 如 一 0 + 功 一 一慨砑州 一 如 + 阳 饯 孵 帆 低凄m + r = z j 。汹 l l | 珧 。瑚 珧 。曲 “ 肌 假定原点位于妒( x 1 ) ,( x 1 ) 的凸包中,由拉格朗日乘子法有 仇2 n l + a 咖( 五) 这里a l 是下列方程的解 去喜蔫= 。 则p 的基于经验似然的估计可被定义为 珏丢砉业鬻挚趔 定理4 1 : 在条件a 1 一a o 下,如果目为参数的真实值,则 、,伍( 瓦。一口) 生( o ,k 。( 日) ) 这里 f 4 3 2 ) f 4 3 3 1 f 434 1 k 。) = y ( 日) 一y 7 ( 日) v ( 口) = e ( ( x t p 十g ( ) 一日) ,( z ) ) 7 ( e 西如) 7 ( 茁) ) 一1 e ( ( x t 卢+ 9 ( ) 一日) ,咖( z ) ) 矿( p ) 由( 4 2 4 ) 给出 下面我们将提出一种调节的经验似然方法,在给定辅助信息的条件 下给出口的置信区间 极大化 夙f - = 1 ,风妒( ) = o ,死( 或。一目) 二o ) = l2 = lz = l4 = l 设磊 ( 口) = ( 矿( 戤) ,承。一目) 丁,则由引理4 7 可知原点位 于磊l ( 口) ,磊2 ( 口) ,磊i ( 目) 的凸包中,出拉格朗日乘子法,计算得 l 弘2 币i 丽 咒4 这里 2 是 ;喜煮勃= 。 的解所以经验对数似然比为 t 。( 目) = 一2 1 0 9 ( 幅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论