(概率论与数理统计专业论文)单指标模型的几个统计推断问题的研究.pdf_第1页
(概率论与数理统计专业论文)单指标模型的几个统计推断问题的研究.pdf_第2页
(概率论与数理统计专业论文)单指标模型的几个统计推断问题的研究.pdf_第3页
(概率论与数理统计专业论文)单指标模型的几个统计推断问题的研究.pdf_第4页
(概率论与数理统计专业论文)单指标模型的几个统计推断问题的研究.pdf_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文摘要 摘要 单指标模型是一种重要的半参数模型,它是处理多元非参数回归问题的有力工具 由于它将一个多元向量转化为一个单指标参数,具有降维的作用,不仅回避了多元非参 数回归中的。维数魔鬼( c u r s eo f d i m e n s i o n a l i t y ) 一,而且抓住了高维数据的重要特征统 计推断是统计学研究的核心,此外统计诊断也是统计学研究必须考虑的问题本文采用 一些不同于单指标模型既有文献的研究方法,研究单指标模型的统计推断问题和统计诊 断的四个问题本文研究的第一个问题是单指标模型的统计诊断,考虑到单指标模型的 复杂性,我们仅研究模型的微小扰动对惩罚样条最小二乘估计的局部影响,提出了诊断 统计量,研究了各种可能的微小扰动对估计的具体影响,并考察了一个具体实例其次, 我们研究的第二个问题是单指标模型的m 估计,这一部分我们从三个方面研究单指标模 型的m 估计,第一个方面是利用b 样条近似未知回归函数的方法提出了获得单指标模型 的m 估计的方法,在一些较弱的条件下,证明了其大样本性质;第二个方面为考虑部分线 性单指标模型的基于b 一样条的m 估计问题,提出了获得m 一估计的方法,并在一些条件 下证明了大样本性质;第三个方面是利用局部线性近似方法提出了获得部分线性单指标 模型基于局部线性近似的两步m 估计程序,并研究了其大样本性质再次,我们研究的第 三个问题是单指标模型中未知参数的置信区域问题,基于o w e n 经验似然方法与b 样条近 似逼近方法,得到了估计经验对数似然比,在一些正则条件下,证明了估计的经验对数似 然比的渐近分布是标准的x 2 - 分布,并根据这一结果构造了单指标模型的未知参数的b 样 条经验似然置信区域,研究了其大样本性质最后,我们研究的第四个问题是分层非线 性随机混合效应模型的相关性与异方差性检验问题,依据对数拟积分似然的l a p l a c e 近似 展开提出了检验统计量,在一些正则条件下,得到了检验统计量的渐近分布是一个标准 的妒分布,通 过t m o n t ec a r l o 模拟研究了其小样本的表现,实例验证了其实际应用 关键词:单指标模型,局部影响分析,部分线性,b 一样条,m 估计,渐近分布,局部线性近 似,经验似然,置信区域,假设检验 第i v 页,共1 0 8 页 英文摘要 一ii i i - _ _ _ _ _ _ - _ - _ - _ _ _ ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 曼! _ 鼍! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! 竺! 竺! ! ! ! ! ! ! ! ! ! ! ! ! 竺! a b s t r a c t t h es i n g l e i n d e xm o d e l ,w h i c hi sap o t e n t i a l l yt o o lf o rd e a l i n gw i t ht h em u l t i v a r i a t en o n - p a r a m e t r i cr e g r e s s i o n , i sa l li m p o r t a n ts e m i p a r a m e t r i cm o d e l b yr e d u c i n gt h ed i m e n s i o n a l i t y f r o mm u l t i v a r i a t ep r e d i c t o r st oa l lu n i v a r i a t ei n d e xp a r a m e t e r s , t h es i n g l e i n d e xm o d e la v o i d s t h es o - c a l l e d c u r s eo fd i m e n s i o n a l i t y i nm u l t i v a r i a t en o n p a r a m e t d cr e g r e s s i o na n dc a p t u r e s t h ei m p o r t a n tf e a t u r e si nh i g h - d i m e n s i o n a ld a t a t h es t a t i s t i c a li n f e r e n c ei sac o r eo fs t a t i s t i c a l r e s e a r c h t h es t a t i s t i c a ld i a g n o s t i c sh a v eb e c o m ea ni m p o r t a n tp a r tw h i c ho n em u s tc o n s i d e r i na n ys e r i o u ss t a t i s t i c a la n a l y s i s i nt h i sp a p e r , w ee m p l o ys o m ea p p r o a c h e s 。w h i c ha md i f f e r - e n tw i t ht h ee x i s t i n gm e t h o d si ns o m el i t e r a t u r e s ,t os t u d ys o m es t a t i s t i c a li n f e r e n c ei s s u e sa n d s t a t i s t i c a ld i a g n o s t i c sf o rs i n g l e - i n d e xm o d e l s f i r s t l y , w ec o n s i d e rs t u d y i n gt h es t a t i s t i c a ld i a g n o s t i c si ns i n g l e - i n d e xm o d e l s d u et oc o m p l e x i t yo fs i n g l e - i n d e xm o d e l s ,w eo n l yi n v e s t i g a t e t h el o c a li n f l u e n c ea g a i n s ts o m em i n o rp e r t u r b a t i o n si nm o d e lf o rp e n a l i z e dg a u s s i a nl i k e l i h o o d e s t i m a t i o n so fp a r a m e t e r si np a r t i a u yl i n e a rs i n g l e - i n d e xm o d e l s o m ed i a g n o s t i cs t a t i s t i c sa r e p r o p o s e da n dt h es u b s t a n t i a la f f e c tr e s u l t i n gf r o ma l lp o s s i b l ep e r t u r b a t i o ns c h e m e si m p o s e d o nt h em o d e li si n v e s t i g a t e df o rp a r a m e t e re s t i m a t i o n s ar e a li l l u s t r a t i v ee x a m p l ei se x p l o r e d s e c o n d l y , w es t u d yt h em 电p e e s t i m a t o r so fs i n g l e i n d e xm o d e lf r o mt h r e ev i e w - p o i n t s o n e i st h a tw el l s eb s p l i n eb a s i st oa p p r o x i m a t et h eu n k n o w nr e g r e s s i o nf u n c t i o na n dd e v e l o pt h e a p p r o a c ho b t a i n i n gt h em - e s t i m a t o r so fp a r a m e t e r si ns i n g l e i n d e xm o d e l s u n d e rs o m em i l d 喇撕t yc o n d i t i o n s ,t h el a r g es a m p l ep r o p e r t i e so ft h e m - e s t i m a t o ra r ei n v e s t i g a t e d a n o t h e r i st h a tw ec o n s i d e rt h em - t y p ee s t i m a t o r sb a s e do nb - s p l i n ea p p r o x i m a t i o nf o rp a r t i a l l yl i n - e a rs i n g l e i n d e xm o d e l s w ed e v e l o pt h ep r o c e d u r et oo b t a i nt h em e s t i m a t o r sa n ds t u d yt h e l a r g es a m p l ep r o p e r t i e so ft h e s ee s t i m a t o r su n d e rs o m em i l dc o n d i t i o n t h eo t h e ri st h a tw e u s et h el o c a ll i n e a rm e t h o d sa n dt w o - s t e pe s t i m a t e st e c h n i q u et oo b t a i nt h em - e s t i m a t o r so f p a r a m e t e r si np a r t i a l l yl i n e a rs i n g l e i n d e xm o d e l s w ep r o p o s ea ne s t i m a t e sp r o c e d u r ea n d p r o v et h ea s y m p t o t i cp r o p e r t i e su n d e rs o m ec o n d i t i o n s t h i r d , w ec o n s i d e rt h e c o n s t r u c t i o no f c o n f i d e n c er e g i o no fu n k n o w np a r a m e t e ri ns i n g l e - i n d e xm o d e l s b a s e do no w e n se m p i r i c a l l i k e l i h o o da n db s p l i n ea p p r o x i m a t i o nm e t h o d ,t h ee s t i m a t e de m p i r i c a ll o g l i k e l i h o o dr a t i oi s o b t a i n e d u n d e rs o m em i l dr e g u l a r i t yc o n d i t i o n s ,w es h o w nt h a tt h ea s y m p m t i cd i s t r i b u t i o no f e s t i m a t e de m p i r i c a ll o g l i k e l i h o o dr a t i oi sas t a n d a r d 妒- d i s t r i b u t i o n a c c o r d i n gt ot h er e s u l t , t h ec o n f i d e n c er e g i o no fu n k n o w np a r a m e t e r si ns i n g l e - i n d e xm o d e l si sc o n s t r u c t e d f i n a l l y , w e c o n s i d e rt h et e s to fc o r r e l a t i o na n dh e t e r o g e n e i t yf o rh i e r a r c h i c a ln o n l i n e a rm i x e d - e f f e c t sm o d - e l s a c c o r d i n gt ol a p l a c ea p p r o x i m a t i o ne x p a n s i o no fi n t e g r a t e dl o g q u a s i l i k e l i h o o d , ac l a s s 第v 页,共1 0 8 页 英文摘要 o fs c o r et e s ts t a t i s t i c si sp r o p o s e d u n d e rs o m ev e r ym i l dc o n d i t i o n s ,w ep r o v et h ea s y m p t o t i c d i s t r i b u t i o no ft h et e s ts t a t i s t i c si sas t a n d a r dx 2 - d i s t r i b u t i o n m o u g ham o n t ec a r l os i m u l a t i o n s t u d y , t h ef i n i t es a m p l ep e r f o r m a n c ei se x a m i n e d ar e a li l l u s t r a t i v ee x a m p l ei se x p l o r e d k e yw o r d s :a s y m p t o t i cd i s t r i b u t i o n ,b s p l i n e ,c o n f i d e n c er e g i o n ,e m p i r i c a ll i k e l i h o o d , h y p o t h e s i st e s t , l o c a li n f l u e n c e ,l o c a ll i n e a ra p p r o x i m a t i o n ,m - e s t i m a t o r , p a r t i a l l yl i n e a r , s i n g l e - i n d e xm o d e l 第v i 页,共1 0 8 页 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究 成果。据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经 发表或撰写过的研究成果。对本文的研究做出重要贡献的个人和集体,均已在 文中作了明确说明并表示谢意。 作者签名:犏 日 学位论文使用授权的说明 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保 留学位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权 将学位论文用于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有 权将学位论文的内容编入有关数据库进行检索。有权将学位论文的标题和摘要 汇编出版。保密的学位论文在解密后适用本规定。 作者签名:缉i 象掣 日期:碰牟毕 导师签名: 日期:份气臼 i 第一章序言 10 1 单指标模型 第一章序言弟一早j 予苗 描述响应变量与协变量之间的关系为y = 夕( 簖x ) + e 的统计模型,其中g ( ) 是未知 函数,o t o 是未知参数,e 是随机i 吴9 差n f l e ( e l x ) = 0 ,称为单指标模型单指标模型首先 由f r i e d m a ne ta 1 ( 1 9 8 1 ) 在研究投影追踪回归问题时,为了降低数据的维数而提出来的,它 是一种重要而又广泛的半参数模型,是处理多元非参数回归问题的有效工具在多元非 参数回归研究中。一个较难处理的问题是随着变量维数的增加统计推断的精度会越来 越低,即出现多元非参数回归问题中所谓的“维数魔鬼”因此,用非参数回归拟合高维 数据时,如何降低数据的维数,以克服多元非参数回归中所谓的“维数魔鬼 ,提高统 计推断的精度,是多元非参数回归研究中必须考虑的问题单指标模型的独特之处就是 能降低变量的维数,且又能抓住高维数据的重要特征,回避了多元非参数回归中的“维 数魔鬼一。提高了统计推断的精度 单指标模型推广了线性模型,它将线性模型中的线性组合簖x 用一个非参数 分量g ( a 6 x ) 取代,而且将一个多元变量x 变为一个单指标参数a 石x ,降低了数据的维 数在单指标模型中,一个非线性联系函数作用于单指标参数a 石x ,变量之间的交互 作用可以用模型反映出来,因此,单指标模型也是可加模型的一个有益补充可加 模型也具有降维的效果,但不能反映变量之间的交互作用此外。部分线性单指标模 型y = 夕( 簖x ) + 魔z + e 推广了广义线性模型与广义线性模型中缺失联系函数问题特 别地,当o l o = 1 时,部分线性单指标模型就变成了部分线性模型,所以部分线性模型可以 看成是部分线性单指标模型的特例 由于单指标模型的灵活性与降维的特性,单指标模型的性质及其应用引起了统计 学家与计量经济学家的关注研究者将其广泛应用于各个领域,如计量经济学中的离 散选择分析与生物计量学中的剂量反应模型研究等c a n o ue ta 1 ( 1 9 9 7 ) 根据l i ( 1 9 9 1 ) 的观 点从单指标模型的出发点、重要性及其广泛的应用等方面对单指标模型进行了归纳总 结:( 1 ) 在实践中,拟合数据前,降低数据维数是重要的,而且在许多情形下,为了进一步 的数据分析降低数据维数甚至是关键的( 2 ) 如果夕( ) 是单调的,那么a o 就有一般线性模 型中“效应 参数完全一样的解释( 3 ) 假定一个估计的“方向”蜘,那么多元模型就退 化为一个更可控的低维模型问题正因为单指标模型独特的降维作用及其应用的广泛性, 所以对其统计推断及性质的研究就具有很好的理论与实际意义 第1 页,共1 0 8 页 1 2 单指标模型的统计推断研究简述 1 2 单指标模型的统计推断研究简述 统计推断是统计学研究的核心内容,它主要涉及到模型中未知参数与未知回归函数 的估计、未知参数的假设检验及其置信区域的构造统计推断是统计理论应用到实际中 的必要环节,统计推断的结果直接影响统计理论的应用对模型的统计推断大致可以分 为两大类:非参数统计推断与参数统计推断非参数统计推断适用于信息较少但又较灵 活的情形,但有推断精度不够高的缺陷参数统计推断适用于掌握了较多的相关信息的 情形,参数统计推断由于掌握了较多已知信息,其推断精度较高但是它也面临一个挑战, 即如果模型假设与实际情况不符时,将导致非常差的推断结果此外。为获得较多信息需 要大量的时间与人力、物力 单指标模型是介于参数模型与非参数模型之间的半参数模型中一种半参数模型在 需要大量额外信息的参数模型与灵活但推断精度不高的非参数模型之间取得了某种平 衡,半参数模型的统计推断在近十几年来一直是统计学家关注的焦点由于单指标模型 的未知函数中含有未知参数,导致了模型的复杂程度增加,对其进行统计推断的难度也 就增加了为了克服这个困难,统计学家与计量经济学家提出了许多富有创意、行之有 效的方法 单指标模型的估计问题有两个主要部分,即模型中未知参数的估计与未知函数的估 计,特别是未知参数的估计更是吸引了许多研究者的兴趣对未知参数的估计主要有两 条途径:一是利用平均导数法,借助于核光滑技术直接探求参数的估计:二是利用半参数 最小二乘方法,借助于核光滑和样条光滑等方法逼近未知函数,然后求未知函数的非线 性最小二乘估计 p o w e l le ta 1 ( 1 9 8 9 ) 注意到当x 是连续变量时,条件均值e ( y i x ) 的平均导数与参 数a o 成比例,因此,可以通过估计平均导数e ( 塑鬟阻) 得到咖的估计,记为: 吣= 丢喜掣 这就是著名的平均导数法估计在核函数是可微的假设下,可用豆( k l 五) = 乓豢粤, k ,= k ( ( 五一再) 口) ,a 是一个光滑参数而得到a o ,批使用平均导数法有一个较难处 理的问题是随机分母的出现导致分母在某些点趋于o ,所以,研究者采取了一些诸如对 函数截尾或对函数的支撑加以某些限制的方法,从而回避了随机分母可能为0 的情形, 如r i l s t o n e ( 1 9 9 1 ) 建议利用一个截尾函数规避“小分母问题 ,从而建立蓟刖。的渐近正 态性估计平均导数的方法有许多种,p o w e l le ta 1 ( 1 9 8 9 ) 使用了加权平均导数估计且 利用了局部常数核估计得到参数的条件均值的估计,从而得到未知参数的估计h 五r d l e e ta 1 ( 1 9 8 9 ) 使用未加权的的平均导数得到咖的估计,l ie ta 1 ( 2 0 0 3 ) 利用局部多项式方法 第2 页,共1 0 8 页 第一章序言 估计丝等型此外,研究者从多个方面对平均导数法进行改进与推广,如h r i s t a c h ee t a l ( 2 0 0 1 a ) 用迭代的方法改进了原来的没有迭代的平均导数法,获得指标参数锄的估计, h r i s t a c h ee ta l ( 2 0 0 1 b ) 将平均导数推广到多指标模型,研究了多指标模型的平均导数,获 得了多指标模型的指标参数的估计,h o r o w i t ze ta l ( 1 9 9 6 ) 将平均导数方法推广到变 量中有部分变量是离散的情形,其他相关的文献可以参看h i r d l ee ta 1 ( 1 9 8 9 ) h i i r d l ee t a 1 ( 1 9 9 3 ) 。h 6 x d l ee ta i ( 1 9 9 2 ) 和s a m a r o v ( 1 9 9 3 ) i c h i m u r a ( 1 9 9 3 ) 注意到如果夕( ) 已知,则单指标模型就是一个标准非线性回归问 题,因此可以用最小二乘方法估计咖,即求 缳一夕( 弼五) ) 2 = l 关于q o 的最小值在9 ( ) 未知时,就必须首先估计9 ( x ) 由于9 ( ) 幕n a o 都是未知的,因 此就不能直接利用核方法估计9 ( 口5 五) 然而,对任意给定的口,我们可以利用核方法估计 c ( a r k ) = e ( y i l a r x i ) ( e ( g ( a ;x i ) l a r x ) 注意到当q = 咖时,g ( 嵋x ) = 9 ( 五) ,而一般情况下有口o t o ,g ( 口5 五) g ( w d x j 因 为这样,我们就用删除一个元素的非参数核估计 “q r 五) = 轧( k i 矿五) = ( n h ) - ix 弓 茹e 蠢k t 产a x j - , :x ( 1 2 ) 作为g ( 矿x ) 的估计,其中】;一i ( 矿五) = ( 孔 ) 1 l ,商k ( 坚学) i c h i m u r a ( 1 9 9 3 ) 建议用g 一( 簖x ) 代替( 1 1 ) 式中的9 ( q r x ) 并求其关于口的最小值这就 是i c h i m u r a ( 1 9 9 3 ) 的半参数非线性最小二乘估计法这种方法同样遇到随机分母可能 为0 的问题,i c h i m u r a ( 1 9 9 3 ) 利用截尾函数的方法进行处理 上述两种获得指标参数估计的方法,其共同的思想就是用随机样本去近似逼近未 知函数的值在非参数统计中,用核样条逼近未知函数是非常普遍的方法,除此之外,还 有诸如级数逼近、局部多项式逼近、光滑样条与回归样条等方法g a oe ta l ( 1 9 9 7 ) 利用 有限级数逼近未知函数的方法研究了单指标模型未知参数的估计:c a r r o l le ta 1 ( 1 9 9 7 ) 利 用局部线性逼近及两步估计方法,得到了广义线性单指标模型未知参数的估计;y ue t a 1 ( 2 0 0 2 ,2 0 0 7 ) 用惩罚样条方法研究了部分线性单指标模型与广义部分线性单指标模型中 未知参数的估计其他有关单指标模型指标参数估计的文献还有k l e i ne ta 1 ( 1 9 9 3 ) x i ae t a 1 ( 1 9 9 9 ,2 0 0 2 ,2 0 0 6 ) ,n a i ke ta l ( 2 0 0 0 ) ,l e w b e l ( 2 0 0 0 ) 等 至于非参数分量的估计,只要我们能得到指标参数的估计,我们就可以利用非参数 第3 页,共1 0 8 页 1 3b 一样条与m 估计 估计方法进行估计在估计过程中,由于参数估计收敛到真值的速度要快于非参数分量, 所以我们就能用参数估计值代替真实值,因此,在获得参数估计之后估计非参数分量不 是一件困难的事情 对单指标模型的统计推断除了估计问题,其他感兴趣的问题就是参数的假设检验与 置信区域未知参数的置信区域当然可以利用估计的渐近正态性由其渐近方差去构造 然而,渐近方差的估计往往是一个困难的问题一些统计研究者利用b o o t s t r a p 等方法估 计渐近方差,但往往有估计精度不够高及计算复杂等缺陷o w e n ( 1 9 8 8 ,1 9 9 0 ) 提出的经验 似然避免了渐近方差的估计,提高了置信区域的精度,因此。受到了统计学家的关注, 已广泛应用于各种统计模型如k o l a c z k ( 1 9 9 4 ) ,w a n g 和j i n g ( 1 9 9 9 ) ,s h i 和l a u ( 2 0 0 0 ) 等 z h ue ta 1 ( 2 0 0 6 ) ,x u ec a 1 ( 2 0 0 6 ) 利用局部线性近似与经验似然构造了单指标模型未知参 数的置信区域而对模型未知参数的检验问题,s i m o n o f f e ta l ( 2 0 0 2 ) 考虑了模型的s c o r e 检 验;x i ae ta 1 ( 2 0 0 4 ) 研究了部分线性单指标模型的拟合优度检验,s t u e t z l ee ta l ( 2 0 0 5 ) 单 指标模型非参数部分的检验问题,l i ne ta i ( 2 0 0 5 ) 研究了两个模型的等价性检验至于 单指标模型的其他统计推断问题比如估计的效率与变量的选择等,可以参考n e w e y e t a l ( 1 9 9 3 ) ,c h i o ue ta 1 ( 1 9 9 8 ) ,d e l e c r o i xe ta 1 ( 2 0 0 3 ) ,k o n gc ta 1 ( 2 0 0 7 ) ,n a i ke ta 1 ( 2 0 0 1 ,2 0 0 4 ) , a n e s f i se ta i ( 2 0 0 4 ) 1 3 b 样条与m 一估计 在非参数统计推断问题中,首先考虑的是如何用随机样本的值近似逼近未知函数 值,非常普遍的方法有两种:核光滑与样条光滑核函数法由于具有较好的分析性质与 统计意义,一直受到统计学家的关注,形成了较完备的方法体系,而样条因其良好的分 析性质与近似效果,样条光滑在统计学上的应用也引起了统计学家的注意 样条就是分段多项式,这些多项式在段与段之间满足某些光滑条件,样条空间由多 项式的阶数与节点的位置决定样条具有许多良好的分析性质,s c h u m a k e r ( 1 9 8 1 ) 详细 地论述了样条的这些性质在统计学中,比较常用的样条有回归样条与光滑样条b 样 条是回归样条中的一种,b 样条有两个突出的优点:一是基函数的支撑是局部的。因此 样条可以很好地反映需要近似的函数的局部行为;二是用较少数目的样条节点获得较 好的近似结果此外b 样条在计算中效率较高而且较稳定,因此,它广泛应用于曲线与曲 面拟合d e b o o r ( 1 9 7 8 ) ,s c h u m a k e r ( 1 9 8 1 ) ,s u 和l i u ( 1 9 8 9 ) 在非随机环境中详细讨论了b 样 条在曲线与曲面近似的应用在随机环境中,利用b 样条近似未知函数以便进行统计推 断也得到了统计学家的关注a g a r w a l 和s t u d d e n ( 1 9 8 0 ) 对与响应变量是线性关系的回归 函数进行了样条估计,特别包括最小二乘估计与偏差最小估计,推导了渐近偏差与方 差a t i l i g a ne ta l ( 1 9 9 2 ) 利用b 样条估计密度函数,研究了极大似然估计的收敛性质及渐近 置信区间s t o n e ( 1 9 9 1 ) 用回归样条对对数样条模型研究了渐近性质e i l e r se ta 1 ( 1 9 9 6 ) 系 第4 页,共1 0 8 页 第一章序言 统地论述了b 样条在统计学中的广泛应用h ee ta ! ( 1 9 9 4 ) 利用b 样条研究了条件分位数 函数的稳健估计其他有关b 样条的统计文献有h ee ta 1 ( 1 9 9 6 ) ,h ee ta 1 ( 2 0 0 2 ,2 0 0 5 ) ,s i f te t a l ( 1 9 9 5 ) s h i ( 1 9 9 4 ) ,g a oe ta 1 ( 1 9 9 7 ) ,h u a n g ( 2 0 0 2 ) ,a n e s t i se ta 1 ( 2 0 0 4 ) 和m a s r i ae ta 1 ( 2 0 0 5 ) 等 众所周知,在非参数统计中,对于回归函数的一些经常使用的估计如核估 计( g a s s e r 和m i l l e r ( 1 9 7 9 ) ) 、光滑样条估计( e u b a n k ( 1 9 8 8 ) ) 、回归样条估计( f r i 仪l m a n 和s i l v e r m a n ( 1 9 8 9 ) ,f r i e d m a n ( 1 9 9 1 ) ) 等虽然在拟合模型方面显示了较好的结果,然而,这 些估计的一个显著缺陷是缺乏稳健性我们知道:最d x - - 乘估计的一个优点是易于计算, 而且当随机误差是独立正态变量时具有很好的性质,因而,受到了普遍重视但是,在实 际中,随机变量有可能是厚尾分布而且观测值中可能含有异常点,那么用最小二乘或极 大似然估计方法获得的参数估计表现就很差而对于半参数模型,不管是用核光滑还是 样条光滑,如果是利用最小二乘与极大似然估计方法获得参数估计,那么这些参数估计 就对异常点非常敏感因此,寻找稳健的估计方法以弥补上述估计的不稳健性是非常有 必要的h u b e r ( 1 9 8 1 ) ,c o x ( 1 9 8 3 ) ,h i r d l e ( 1 9 8 4 ) ,h a m p l ee ta 1 ( 1 9 8 6 ) 等统计学家建议利 用m 估计克服上述估计的缺陷 m 估计是通过求一个与未知参数有关的函数的最小值而获得参数的估计,最小二 乘估计与极大似然估计可以看成是其两个特殊情形m 估计有许多良好的性质,比 如只要选择目标函数的s c o r e 函数是非降的,m 估计就对异常点非常稳定而且有较高 的估计效率在m 估计中,一个较重要的问题是目标函数的选取,一般选择目标函数 的s c o r e 函数是有界的,如绝对值函数,其对应的估计就是最小一乘估计众所周知,最 小一乘估计具有较好的稳健性由于m 估计具有良好的稳健性,统计学家研究了各种 模型的m 估计,如c l e v e l a n d ( 1 9 7 9 ) ,t s y b a k o v ( 1 9 8 6 ) ,f a ne ta l ( 1 9 9 a ) 和w e l s h ( 1 9 9 6 ) 利用局 部多项式技术研究了非参数回归的m 估计c o x ( 1 9 8 3 ) 和c u n n i n g h a me t8 1 ( 1 9 9 1 ) 利用光 滑样条方法得到了非参数回归的m 估计其它文献可以参看h a r d l e ,g a s s r ( 1 9 8 4 ) ,h 舀r d l e , t s y b a k o v ( 1 9 8 8 ) ,h a l le ta 1 ( 1 9 9 0 ) ,a k d t a s ( 1 9 9 1 ) ,z h o u ( 1 9 9 2 ) ,k o l t c h i n s k i i ( 1 9 9 7 ) ,b a n gc ta l ( 2 0 0 2 ) k o z e k ( 2 0 0 3 ) 等及其引用的文献对于单指标模型,其m 估计的研究也得到了注 意,d e l e c r o i xe ta 1 ( 2 0 0 6 ) 利用核函数近似未知函数,得到了模型中参数的m 估计并在一 些较严格的条件下研究了估计的大样本性质 由于b 样条是一种较好的近似函数的方法,而m 估计是一种较稳健的估计,因此 将b 一样条近似方法与m 估计结合,研究模型中未知参数的b 样条的m 估计,将是非 常有意义的一些统计学家已经将其二者结合起来,获得了一些较好的结果如h e e ta 1 ( 2 0 0 2 ) 利用b 样条研究了纵向数据部分线性模型的m 估计,其他的一些文献有s h i ( 1 9 9 4 ) ,s h ie ta 1 ( 1 9 9 5 ) ,h ee ta 1 ( 1 9 9 4 ,1 9 9 6 ) ,g a o ( 1 9 9 7 ) 等而对单指标模型,将m 估计 与b 样条结合,研究模型的稳健性估计还未见诸于文献本文试图将其二者结合,研究 单指标模型的一些统计推断问题 第5 页,共1 0 8 页 1 4 局部影响分析与异方差检验 1 4 局部影响分析与异方差检验 在统计学的研究中,研究的出发点是一个通过各种途径收集起来的数据集,目的是 通过这个数据集研究、解决实际问题通常的做法是把它纳入某一方便有效的统计模型 进行研究我们知道:任何模型只能是对客观复杂过程的一种近似描述不可避免地包含 某些假定,因此,这些假定能否反映实际问题? 是否与所收集的数据点相符? 所收集的数 据点是否来自同一模型? 是否每一个数据对统计推断的影响大致相仿? 这些是在统计分 析时必须慎重考虑的问题统计诊断就是对从实际问题收集起来的数据与提炼出来的模 型与假设以及由此出发所做的统计推断方法的合理性进行深入细致的分析,并通过一些 诊断统计量来检查数据、模型及推断方法可能存在的”毛病”,进而提出”治疗”方案经过 不断的理论研究与应用实践,人们对统计诊断的必要性有了肯定而明确的认识目前,统 计诊断已成为统计分析中的重要一环 统计诊断,包括异常点和强影响点的探测及模型对偏离基本假设的灵敏度研究针 对不同的统计诊断问题,统计学家提出了不同的统计诊断方法。如探测数据中的异常点 的数据删除法与均值漂移法,用于诊断模型中随机误差是否正确的残差分析与诊断图 等这些方法已广泛用于各种统计模型的诊断分析,如w i l l a m s ( 1 9 8 7 ) 利用数据删除法研 究了广义线性模型的异常点探测及观测值对估计的影响,c o o ke ta 1 ( 1 9 8 3 ) 利用s c o r e 检验 研究了线性模型的异方差性诊断,其他相关的文献还有许多,如e u b a n k ( 1 9 8 5 ) ,p r e i s s e re t a 1 ( 1 9 9 6 ) z h a n ge ta l ( 2 0 0 0 ) 等c o o k ( 1 9 7 7 ) 基于数据删除方法引进了c 0 0 l 潭离用于评估单 个观测值对估计的影响c o o k 距离有着清晰的统计意义而且已被统计学界广泛接受然 而,c o o l 湮离需要重复计算参数的估计,且不能反映模型的微小扰动对估计的影响因此, 为了弥补其不足,根据对数似然函数对模型的微小扰动的灵敏度反应,c o o k ( 1 9 8 6 ) 提出了 局部影响分析法局部影响分析法可以评估模型的各种扰动对估计的影响,所以,它可以 为我们提供更多的有关数据对统计推断的影响的信息,而且局部影响分析计算也相对简 单 自从c o o k ( 1 9 8 6 ) 提出局部影响分析,一些统计学者根据c o o k 的思想,利用局部影 响分析方法对各种各样的统计方法与统计模型进行了诊断分析b e c k m a ne ta 1 ( 1 9 8 7 ) 研 究了混合模型的方差分析的诊断与影响评估,l a w r a n c e 必1 9 8 8 ) 研究了回归变换的影响 诊断问题,s h i ( 1 9 9 7 ) 研究了主成分分析的影响诊断,t h o m a s 和c o o k ( 1 9 8 9 ) 将局部影响 分析应用于广义线性模型,得到了诊断统计量,k w a n 和f u n g ( 1 9 9 8 ) 将其应用到带约束 的似然估计模型,s t l a u r e n t 和c o o k ( 1 9 9 3 ) 对非线性模型考虑了局部影响分析,l e s a f f r e 和v e r b e k e ( 1 9 9 8 ) 对局部影响分析做了比较完备的研究,o u w e n sc ta l ( 2 0 0 1 ) 研究了广义 线性混合效应模型的局部影响分析,t h o m a s ( 1 9 9 1 ) 对光滑样条中的光滑参数构造了局 部影响分析诊断统计量,l ue ta 1 ( 1 9 9 7 ) 研究了与c o o k 局部影响分析密切相关的标准化 影响矩阵,w a n g 和l e e ( 1 9 9 6 ) 研究了具有泛函等式约束的结构方程模型的灵敏度分析。 第6 页,共1 0 8 页 第一章序言 其它与局部影响分析相关的文献还有许多,比如s h i 和w a n g ( 1 9 9 9 ) ,z h ue ta 1 ( 2 0 0 3 ) ,l e e 和x u ( 2 0 0 4 ) 等 在经典的回归分析中,观测值的方差齐性是一个很基本的假定,在此基础上,才可进 行常规的统计推断如果违背这一假定,则在统计推断中遇到许多问题,甚至导出错误的 推断结果,所以。在统计诊断中,判断数据中是否存在方差齐性是十分重要的问题,是处 理回归问题的第一步 统计模型的方差齐性可以分为两种:一是由于随机效应的存在而产生的异方差, z h a n g e ta 1 ( 2 0 0 0 ) 将其称为不可解释的非齐性,而另一种就是方差是某一协变量函数的 情形,称为可解释的非齐性对可解释的方差齐性的检验一直受到关注,如g l e j s e r ( 1 9 6 9 ) , c a r r o l l r u p p e r t ( 1 9 8 1 ) 等c o o ke ta 1 ( 1 9 8 3 ) 在s c o r e 统计量的基础上建立了诊断异方差 的s c o r e 检验自此以后。利用s c o r e 统计量方法研究异方差的检验引起了人们的重视, 并被推广到许多模型s i m o n o f f 和t s a i ( 1 9 9 4 ) 研究了经典线性模型的s c 啦验c a ie t a l ( 1 9 9 8 ) ,e u b a n k 和t h o m a s ( 1 9 9 3 ) ,o y e t 和s u t r a d h a r ( 2 0 0 3 ) 研究了非参数回归模型的异方差 的s c o r e 检验其他可解释性非齐性的检验可参看m j l l e re ta l ( 1 9 9 5 ) ,v e r b y l a ( 1 9 9 3 ) 等及其 参考文献而对不可解释的异方差性的检验也受到关注,l i a n g ( 1 9 8 7 ) 应用s c o r e 检验研究 了多层数据的同方差性问题j a c q m i n g a d d a 和c o m m e n g e s ( 1 9 9 5 ) 将l i a n g 的工作推广到带 有随机效应的标准广义线性模型( g l m s ) 和具有一个相关参数的g e e ,研究了随机效应的 检验问题及相关性问题l i n ( 1 9 9 7 ) 利用积分对数拟似然的l a p l a c e 展开,提出了检验带有 随机效应的g l m s 的相关性与异方差性的同一理论z h u 和f u n g ( 2 0 0 4 ) 将l i a ( 1 9 9 7 ) 的工作 推广到半参数混合模型其他的可参看韦博成等( 2 0 0 3 ) 的综述及其参考文献 1 5 本文的主要工作 经过许多研究者的持续努力,对单指标模型的研究取得了许多成果然而,对单指标 模型的统计推断与诊断研究中还是有一些有趣的问题值得考虑,如如何利用样条逼近回 归函数对模型进行统计推断,如何确定影响参数估计的强影响点等本文主要围绕这些 问题展开研究 本文第二章研究部分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论