




已阅读5页,还剩25页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
朱奋f # :b o x c o x 变换下1 f 线性模型的统计诊断 中文摘要 随着现代科学技术的迅猛发展,统计分析理论也在不断发展和完善在统计分析过程 中,建立数学模型是十分重要的研究课题,如炼钢厂的工程师们希望有一个炼钢过程的数 学模型,以实现计算机自动控制;气象研究工作者要根据气压、雨量、风速的数学模型来 预报天气;从事城市规划工作的专家们更需要建立一个包括人口、交通、能源、污染大系 统的数学模型,为领导者做出城市发展规划决策提供科学依据在复杂系统中,具有很多 不确定性的因素,建立数学模型时经常需使用概率统计模型;从而统计推断方法成为系统 分析中极其重要的分析方法通常人们习惯应用回归分析的手段来处理这类问题回归分 析的理论及方法发展得非常快,它不仅已成为统计学的一个重要分支,而且也被人们广泛 地应用于各个领域随着回归分析理论的不断发展,非线性回归模型已成为目前重要的研 究课题 本文在第二章对b o x - c o x 变换下的非线性模型中的参数进行了估计,并给出了参数的 性质,最后还给出了相应的两种算法:g a u s s - n e w t o n 迭代算法以及改进后的g a u s s n e w t o n 迭代算法 第三章是在第二章的基础上,系统地研究了带右删失数据的非线性模型的统计诊断 研究了模型的影响分析,并推导出了数据删除模型( c a s ed e l e t i o nm o d e l ,c o m ) 一阶近似 的参数估计公式同时,给出了数据删除模型( c d m ) 与均值漂移模型( m s o m ) 的等价性 第四章研究了b o x - c o x 变换下非线性模型的几何方法,给出了其几何结构,和置信域 的曲率表示 关键词:b o x c o x 变换;非线性模型;诊断;参数估计 扬州人学硕l :学位论文 s t a t i s t i cd i a g n o s t i c so fn o n l i n e a rm o d e l su n d e rb o x - - c o x r n 一 o l r a n s l o r m a t l o n 2 一 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fs c i e n c ea n dt e c h n o l o g y ,t h et h e o r ya n dm e t h o do fs t a t i s t i c a l a n a l y s i sa r ec o n t i n u o u s l yd e v e l o p e da n di m p r o v e d i nt h ep r o c e s so fs t a t i s t i c a la n a l y s i s ,i ti sa v e r yi m p o r t a n tr e s e a r c ht o p i ct oe s t a b l i s ham a t h e m a t i c a lm o d e l f o re x a m p l e ,t h ee n g i n e e r so f s t e e l w o r k sw a n tt oh a v eam a t h e m a t i c a lm o d e la b o u tt h ep r o c e s so fs t e e l m a k i n gt oi m p l e m e n t c o m p u t e ra u t o m a t i cc o n t r o l ;w e a t h e rr e s e a r c h e r sw a n tt oh a v eam a t h e m a t i c a lm o d e la b o u t p n e u m a t i c ,r a i n f a l la n dw i n d st of o r e c a s tw e a t h e r ;t h ee x p e r t so nu r b a np l a n n i n gw a n tt oh a v ea m a t h e m a t i c a lm o d e la b o u tal a r g es y s t e mi n c l u d i n gp o p u l a t i o n ,t r a f f i c ,e n e r g ya n dp o l l u t i o nt o p r o v i d et h es c i e n t i f i cb a s i st oh e l pl e a d e r s h i pt o m a k eu r b a nd e v e l o p m e n tp l a n n i n ga n d d e c i s i o n m a k i n g m a n yc o m p l e xs y s t e m su s u a l l yc o n t a i nu n c e r t a i n t y , t h e np r o b a b i l i s t i ca n d s t a t i s t i c a lm o d e l sa r ec o m m o n l y - u s e di nt h es c i e n c ef i e l d ,s ot h em e t h o d so fs t a t i s t i c a li n f e r e n c e b e c o m et h e i m p o r t a n ta n a l y s i sm e t h o d si ns y s t e m sa n a l y s i s u s u a l l yp e o p l eu s e d t ou s e r e g r e s s i o na n a l y s i st od e a lw i t ht h e s ep r o b l e m s t h et h e o r ya n dm e t h o d so fr e g r e s s i o na n a l y s i s d e v e l o pr a p i d l y i ti sn o to n l ya ni m p o r t a n tb r a n c ho fs t a t i s t i c s ,b u ta l s ow i d e l yu s e di na l lf i e l d s w i t ht h ed e v e l o p m e n to fr e g r e s s i o na n a l y s i st h e o r y , n o n l i n e a rm o d e lb e c o m e st ob ea ni m p o r t a n t t o p i cn o w t h em a i ni d e a so ft h ep a p e ra r ea sf o l l o w : c h a p t e r2g i v e st h ee s t i m a t i o np a r a m e t e r si nt h en o n l i n e a rm o d e l ,m e a n w h i l et w ok i n d so f c o r r e s p o n d i n ga l g o r i t h m sa r eo b t a i n e d :g a u s s - n e w t o ni t e r a t i v ea l g o r i t h m sa n dt h ei m p r o v e d g a u s s - n e w t o ni t e r a t i v ea l g o r i t h m s c h a p t e r3s y s t e m a t i c a l l yd i s c u s s e ss t a t i s t i c a ld i a g n o s t i c so fn o n l i n e a rs t a t i s t i c a lm o d e lo f b o x - c o xt r a n s f o r m a t i o n t h ei n f l u e n c ea n a l y s i so ft h em o d e la n dt h ec a s e - d e l e t i o nm o d e la r e d i s c u s s e d a t t h es a m et i m e ,t h ee q u i v a l e n c eo fc d ma n dm s o mi so b t a i n e d c h a p t e r4c o v e r st h em e t h o d so fg e o m e t r yo ft h e n o n l i n e a rm o d e l su n d e rb o x c o x t r a n s f o r m a t i o n ,a n d ,t h es t r u c t u r eo fg e o m e t r yi ss t u d i e dc a r e f u l l y a tl a s t 。w es h o wc u r v a t u r e e x p r e s s i o n so fc o n f i d e n c er e g i o n k e y w o r d s :n o n l i n e a rm o d e ;s t a t i s t i cd i a g n o s i s ;p a r a m e t e re s t i m a t i o n ;b o x - c o x t r a n s f o r m a t i o n 扬州人学硕l j 学位论文 扬州大学学位论文原创性声明和版权使用授权书 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下独立进行研究工作所取得的研究成果 除文中已经标明引用的内容外,本论文不包含其他个人或集体已经发表的研究成果对本文 的研究做出贡献的个人和集体,均已在文中以明确方式标明本声明的法律结果由本人承 担 学位论文作者虢誊冶智 签字日期: 。弋年1 1 月( 日 学位论文版权使用授权书 本人完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关 部门或机构送交学位论文的复印件和电子文档,允许论文被查阅和借阅本人授权扬州大学 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文同时授权中国科学技术信息研究所将本学位论文收录到 中国学位论文全文数据库,并通过网络向社会公众提供信息服务 暮痞珲 f卜一 b 月心日 导师签名: 签字日期: 朱备华b o x c o x 变换下的非线性模型的统计诊断 第一章绪论帚一早珀下匕 随着现代科学技术的迅猛发展,统计分析理论也在不断的发展和完善在统计分析过程 当中,建立数学模型是一个十分重要的研究课题,如炼钢厂的工程师希望有一个炼钢过程 的数学模型,以实现计算机自动控制;气象研究工作者要根据气压、雨量、风速的数学模 型来预报天气;从事城市规划工作的专家们更需要建立一个包括人口、交通、能源、污染 大系统的数学模型,为领导者做出城市发展规划决策提供可靠的科学依据在复杂系统中, 具有很多不确定的因素,建立数学模型时经常使用概率统计模型;从而统计推断方法成为 系统分析中极其重要的分析方法通常人们习惯应用回归分析的手段来处理这类问题回归 分析的理论及方法发展得非常快,它不仅已成为统计学的一个重要分支,而且也被人们广 泛地应用于各个领域随着回归分析理论的不断发展,非线性回归模型己成为目前重要的研 究课题其中对数据的处理方法尤其显得重要本章第一节主要阐述数据处理的方法及背 景;第二节则简要介绍关于上述数据处理方法下的模型的研究现状 1 1 问题的提出 统计诊断就是对从实际问题中收集起来的数据和提炼出来的模型以及由此出发所作 的推断方法的合理性进行深入细致的分析,并通过一些诊断统计量来检查数据、模型及推 断方法中可能存在的“毛病”,进而提出“治疗 方案在几乎所有的统计诊断问题中,都 将涉及到两个基本概念:异常点和强影响点面对诊断后的数据,我们应当采取有效的“治 疗”措施近年来的实践证明,数据变换是处理有问题数据的一种好方法,它对许多数据 都是行之有效的,特别是对异常点较多的模型,其效果更佳 给定一组数据( ”,_ 7 ) ,f _ 1 ,z ,若用模型y = x p + 占进行拟合,则要求数据满足以下 条件: ( i ) 线性条件,即因变量的数学期望和为之参数之间具有线性关系:e ( 】,) = x p ; ( i i ) 方差齐性,即误差项s ( o ,盯2 i ) : ( i ii ) 正态性,在某些情况下要求s 服从正态分布n ( o ,盯2 i ) : 其中y = ( m ,) 7 1 ,s = ( q ,岛) 7 1 ,= ( p o ,尾一1 ) 7 x 为n xp 阶满之矩阵,其第f 行为 ( 1 ,l ,x , p 1 ) 如果某些数据不全部满足上述三个条件,它们之中就可能出现异常点如果异常点较 多,就不能坚定地加以删除,必须对数据和模型本身进行研究实践证明,通过数据变换 扬州人学硕1 :学位论文 4 一 能找出更合适的新的回归模型,在该回归模型中,原来的异常点( 或至少大部分异常点) 将 变为正常点 数据变换的方法有很多种,但它们大致可划分为两大类,一类为方差稳定化变换和线 性变换它们的共同特点是,通过数据的实际背景或残差分析等方法,可以大致确定因变 量的方差或期望与自变量的函数关系,对于一些特殊的函数关系,可以对因变量或自变量 进行相应的变换,使得变换后的数据能满足上述的三个条件另一类为数据的b o x c o x 变 换其特点在于引入一个新的变换参数允,通过数据本身估计出该参数,从而确定所应该采 取的数据变换形式实践证明,b o x - c o x 变换对许多实际数据都是行之有效的,它可以明显 地改进数据的异方差性、非对称性和非正态性该变换在各方面得到广泛的应用,至今仍 是许多统计学家十分关心的课题 1 2国内外研究现状 统计诊断是七十年代中期才发展起来的一门统计新分支它以强烈的应用背景、新颖 的统计思想、广泛的研究内容和丰富的实际成果在广大统计工作者面前展现出一个理论与 应用结合的崭新领域统计学的出发点是一个数据集,该数据集往往是根据在实际工作中 逐步积累起来的历史资料或围绕某一特定目标收集起来的数据,经初步加工整理而成为 了通过数据集研究实际问题,通常的做法是把它纳入某一方便有效的统计模型进行研究 但是,全体统计模型都只能是对客观过程的一种近似描述,它不可避免地包含某些假定, 甚至模型本身也是一种假定人们自然有理由要问:我们选择的模型能不能大体上反映所 要研究的实际问题? 它是否与数据集中集大多数的数据相一致? 我们所得到的数据集中 会不会有个别数据由于收集或整理过程中的疏忽和失误或其他种种原因而出现较大的误 差? 另外,数据集中各个数据点对我们进行统计推断的影响是否大体相仿,会不会有某些 点的影响特别大等等在使用统计方法解决具体问题的过程中,人们必须慎重地回答上述 问题,才能作出更加符合实际的结论统计诊断就是针对上述种种问题而发展起来的一种 分析方法 在过去的近二十年中,对于线性回归诊断,c o o ka n dw e i s b e r g ( 1 9 8 2 ) ,韦博成等( 1 9 9 1 ) 已经作了全面而综合的讨论其他模型( 例如非线性回归模型、广义线性模型和指数族非 线性模型) 的统计诊断也得到了较大的发展例如m c c u l l a g ha n dn e l d e r ( 1 9 8 9 ) ,w e i ( 1 9 9 8 ) 作了详细的讨论其中对线性模型的数据变换在w e i ( 1 9 9 8 ) 中作了详细的讨论p e n g f e i l i ( 2 0 0 5 ) 也在 b o x - c o xt r a n s f o r m a t i o n s :a no v e r v i e w 中对b o x c o x 变换下线性模型 朱奋华b o x c o x 变换下的1 r 线性模型的统计诊断 的性质作了总的概括薛跃、盛党红( 2 0 0 5 ) 在 b o x c o x 变换原理及其在财务比率正态分布 中的作用中分析了b o x c o x 变换在经济学上面的应用k o i c h im i y a z a k i x ( 2 0 0 5 ) 在 b o x c o xt r a n s f o r m a t i o na n do p t i o np r i c i n g 中阐述了b o x c o x 变换在期权定价模 型中的应用但对于数据变换下的非线性模型则很少有所研究 1 3 本文的主要工作 如上述所说,数据变换对有问题数据处理是一种好方法,它能有效的减少异常点,改 进数据的异方差性、非对称性和非正态性国内外对于在b o x c o x 变换下的线性回归模型的 研究较多,而对于在b o x c o x 变换下的非线性回归模型的研究则很少 本文在第二章对b o x c o x 变换下的非线性回归模型中的参数进行了估计,并给出了相 应的算法 第三章是在第二章的基础上,系统地研究了b o x c o x 变换下的非线性回归模型的统计 诊断研究了该模型的影响分析,并推导出了数据删除模型( c a s ed e l e t i o nm o d e l ,c d m ) 的一 阶近似参数估计公式在第四章中又讨论了b o x c o x 变换下非线性模型的几何方法 扬州人学硕i j 学位论文 6 一 第二章b o x - c o x 变换下非线性模型的参数估计 2 1 b o x - c o x 变换 本章首先介绍下b o x - c o x 变换,然后研究b o x c o x 变换下的非线性回归模型的参数的 估计及其算法 首先考虑某个变量y 的变换,然后再推广到与非线性模型有关的数据集 ( 咒,薯,) ,i = 1 ,2 ,今假设y 为正值无界变量t u k e y 于1 9 5 7 年首先提出一个新思想,即在数 据变换中引入一个新参数旯,且由数据集本身来估计这个参数他提出的变换为: y ( 五) = 【1 1 1 ( y j ,a ) , ,兄2 :o 。, 其中力为待定参数 由上式定义的y ( 2 ) 关于参数兄不连续,b o x 和c o x 于1 9 6 4 年又提出了修正的幂变换 y ( 肛掣加o ( 2 1 1 )j ,( 力) = 兄( 2 1 1 ) 【l n ( y ) ,兄= 0 上式就是著名的b o x c o x 变换,是一族幂变换,它包括了许多常见变换,诸如对数变 换( 力= 0 ) 、倒数变换( 五= 一1 ) 和平方根变换( 名= 1 2 ) 等等 对于数据集( 咒,7 1 ) ,i = 1 ,刀,记因变量】,= ( 只) 的数据变换为】,( 旯) ,它表示对每一个 分量只进行变换,即 】,( 无) = ( m ( 五) ) ,只( 兄) = 办( m ,旯) ,f = 1 ,甩 ( 2 1 2 ) 如果办( m ,见) 如( 2 1 1 ) 式右端所示,则称为b o x c o x 变换 现在我们假定经过幂变换以后】,( 兄) 形成非线性模型且满足正态性条件: j ,( 名) = f ( x ,) + s ,占n ( o ,仃2 i ) , ( 2 1 3 ) 其中名与和仃2 一样可视为未知参数,称为变换参数 在求得兄的估计后,将其代入上式,可用非线性回归模型的方法对它进行统计分析 所以,数据变换的主要任务就是要寻找变换参数五的合适估计下面主要对名的最大似然估 计进行求解,并给出算法 朱春华b o x c o x 变换下的1 f 线性模型的统计诊断 2 2 变换参数的最大似然估计及算法 7 一 对于数据集( m ,誓r ) ,i = 1 ,, ,考虑一般的变换( 2 1 2 ) ,通常假定h ( y ,a ) 关于y 和五具 有连续的偏导数对于b o x - c o x 变换,h ( y ,五) 如( 2 1 1 ) 所示假定数据集经过变换后满足条件 ( 2 1 3 ) 式,要讨论的问题就是根据条件( 2 1 2 ) 式和( 2 1 3 ) 式寻找允的合适估计 假设变量】,( 旯) = ( ( a ) ) 和】,= ( 以) 之间的变换j a c o b i 行列式为,( 旯) ,则有 ,= 鼻i 掣1 对于b o x - c o x 变换,由于o h ( y ,;0 砂= y 扣1 ,因此有 ,( 兄) = 兀订一= g ( 】,) p 一 i = 1 g ( 】,) = ( n ) , 其中g ( 】,) 为y = ( y l ,儿) 7 1 的各分量的几何平均值 引理2 2 1 对于正态非线性模型( 2 1 3 ) 似然函数,( ,0 2 旯;】,) 关于参数的s c o r e 函 数与观察信息矩阵分别是: f(,盯2,旯;】,)=里学=仃。2y7(,允)e(,允), 7 ( 夕) = 三【- y r ( 】,( 互) 一厂( x ,) ) i p 二= o , 盯。 j(,仃2,a;l,)=里警_,0-2(矿71(,五)矿(,见)一p 7 1 ( ,旯) 形( ,五) ) , 其坝肋) 2 警“肌m 叫聊) 川肼) = 等为n x p xp 立髓 证明:对于模型( 2 1 3 ) ,由于】,( 兄) n ( f ( x ,) ,仃2 ,) ,因此可得到y 的密度函数为: f ( f l , t 7 2 , 无功“) ( 2 ) 1 e x p - 寺( m ) 一f ( x ,砌v ( 五) 一f ( x ,励) , 其对数似然函数为: l ( p ,盯2 力;y ) = h l ( ,( 兄) ) 一nl n ( 2 n o - 2 ) 一i 三7 ( 】,( 五) 一f ( x ,) ) 7 1 ( 】厂( 五) 一f ( x ,) ) _ z c ,- 。 = h l ( ,( 兄) ) 一1 n ( 2 刀仃2 ) 一2 - 专s ( p ,旯) , 其中s ( p ,五) = i | 】,( 旯) 一f ( x ,) 1 1 2 啜l i 扬州人学硕l :学位论文 8 一 翌! 丝! ! :垄i 兰2 :一l 箜! 壁:墨2 8 p 2 矿 6 | b :一去( 】,( 旯) 一d ( x ,刚掣) g o p = 盯- 2 v7 1 ( ,a ) e ( f l ,a ) , 0 2 l ( f l , c r 2 , , a , ;y ) :一( 2 r r 2 ) - l 皇塑壁:型 a 盼6a , a a , a :仃一z 望! 竺! ! 壁:墨! ! ! 生:垄塑 己 = 仃之( 形7 ( ,2 ) e ( f l ,五) + v7 ( ,旯) ( 一y ( ,旯) ) ) = 一仃- 2 ( y7 ( ,五) 矿( ,兄) 一瞳7 1 ( ,兄) 形( ,允) ) , 由上可知模型( 2 1 3 ) 关于的f i s h e r 信息阵为: ,( ,见) = 仃- 2 v7 1 ( ,x ) v ( 8 ,兄) 下面对五的最大似然估计进行求解 设夕为的最大似然估计,则夕应该满足: o l ( , b , c r 2 , 2 ;y ) :o 或箜( 笆:型:0 宅pb p 即 矿7 1 ( ,2 ) e ( f l ,五) = 0 ( 2 1 5 ) 引理2 2 2计算矽的g a u s s n e w t o n 公式 把j ( 夕) = o 在某一点属处进行一阶展开可得: j ( 夕) = i ( p o ) + j - ( 夕一属) + i 1 ( ) 7 7 ( 善) ( ) = 0 , 其中= 夕一p o ,孝为p o 和夕之间的一点,略去高阶项可得: = 屁+ 卜z ( 鼠) 】- l i ( ,o ) 若把屁看成初值,反复进行计算,则得到最大似然估计的g - n 迭代公式如下: m = + 一j ( ,) 一1 7 ( ) ,f = 1 ,2 , 以上公式中亦可用f i s h e r 信息阵a ( 8 ,五) 代替观察信息阵一f ( f 1 ) 从而得到: 件1 = 。+ 一( ,旯) 】一j ( ) ,i = 1 ,2 , 可以证明,在一定f 则条件下,7 收敛到夕( 当f 专+ ) 具体计算时,可指定一个很小 的j 下数万 0 ,当i | h 1 一i l 0 ( 即正定) ,( ) 0 ,d ( f 1 ) = 一j ( ) 一,( ) ,则必存在y 0 ,使 得当矽= f l + r d ( f 1 ) 时,有,( 矽) = ,( + 7 d ( ) ) ,( ) 证明:令q ( r ) = ,( + r d ( f 1 ) ) ,则由微分公式可得: ,( 矽) 一,( ) = g ( y ) 一g ( o ) = q ( o ) y + a y = 口( o ) + 口】7 , 其中当7 _ 0 时,有口专0 ,为求q ( r ) 的导数,把向量+ r d ( f 1 ) 和d ( f 1 ) 的第r 个分量用 其下标表示,则口( 0 ) 可表示为: 们,= 喜t 荔半,脚 =葛=i8 0 i d ( = ,( ) rd ( f 1 ) : 7 ( 矽) r _ j ( ) 】一1 7 ( ) 0 因此当7 充分小的时候必然有茸( 0 ) + 口 0 ,由( 2 1 5 ) 式可得: ,( 矽) 一,( ) = 口( o ) + 口 0 , 即 ,( 矽) = l ( f l + r d ( f 1 ) ) ,( ) 口 定理2 2 3 给定数据集( 誓,厂( 五,) r ) ,f _ 1 ,刀进行数据变换( 2 1 3 ) 式,则力的最大似 然估计互使下列似然函数达到最大值: k 越( 允) = l n ( ,( 旯) ) 一n ,1 n ( 堡) 一昙l n ( s ( 虏,兄) ) 一詈, z刀zz 其中s ( ,五) = | f 】,( 咒) 一f ( x ,) f f 2 ,( 兄) 为变量y ( a ) = ( 只( 兄) ) 和y = ( 彤) 之间的变换j a c o b i 行列式,历为的最大似然估计 扬州人学硕l :学位论文 1 0 证明:由非线性模型的性质知:彦2 = ,z 一1 s ( 虏,兄) ( 其中彦2 为盯2 的最大似然估计) ,将虏 和子2 代入引理2 2 1 证明中的模型( 2 1 3 ) 的对数似然函数得: k 。( 五) = h 1 ( 朋) ) 一2 1 n ( 2 刀6 2 ) 一击l n ( s ( 虏,锄 = h l ( ,( 五) ) 一三i n ( 2 z i ls ( 虏,名) ) 一互否乙差i 五了s ( 虏,旯) :l n ( j ( 允) ) 一n l n ( 丝s ( 虏,名) ) 一昙 刀么 :l n ( ,( 名) ) 一n l n ( 丝) 一n 11 n ( s ( 虏,兄) ) 一昙, 甩z z 通常我们可用的一步近似代替虏 由引理2 2 1 和2 2 2 知 7 ( ,仃2 ,名;】,) :o l ( f l , - = 盯五2 - , a 一;y ) = o - - 2 v 7 ( ,旯) p ( ,允) , d 。“= + 【一j ( f l 。,五) 】一1 i ( p ) ,i = 1 ,2 , 上式代入下式得: 件1 = + y7 ( 。,名) y ( ,兄) 】y7 ( 7 ,a ) e ( f l ,兄) 即为模型( 2 1 3 ) 关于的g - n 迭代公式 另外,由于似然函数渐近于z 2 分布即: 2 ( 厶。缸( 互) 一厶。弘( 五) ) 专z 2 ( 1 ) , 由此易得力的一个水平为( 1 - a ) 的大样本置信域: i t :2 ( k 戤( 五) 一k 。( 兄) ) z 2 ( 1 ,1 - o r ) 总结上述内容,我们得到关于互的算法: 步骤1首先给出参数的初值o ,代入g n 迭代公式,得到的一步近似式: = o + y7 ( o ,允) y ( o ,a ) 】矿7 ( o ,旯) p ( o ,旯) 步骤2 用代替历代入k 。( 旯) 得到关于旯的最大似然估计函数 多骤3 利用离散方法估算互 2 3数值实例 下表给出了某地区1 9 7 1 2 0 0 0 年的人口数据( 表1 ) 用m a t l a b ,对该地区的入口变 化进行曲线拟合 朱春华b o x c o x 变换下的1 f 线性模型的统计诊断 年份 时间变量t = 年份一1 9 7 0人口人 1 9 7 113 38 1 5 1 9 7 2 2 3 39 8 1 1 9 7 3 3 3 40 0 4 1 9 7 44 3 41 6 5 1 9 7 5 53 42 1 2 1 9 7 663 43 2 7 1 9 7 773 43 4 4 1 9 7 883 44 5 8 1 9 7 993 44 9 8 1 9 8 01 03 44 7 6 1 9 8 1113 44 8 3 1 9 8 21 23 44 8 8 1 9 8 31 33 45 1 3 1 9 8 41 43 44 9 7 1 9 8 51 53 45 1 1 1 9 8 61 63 45 2 0 1 9 8 71 73 45 0 7 1 9 8 8 1 83 45 0 9 1 9 8 9 1 9 3 45 2 l 1 9 9 02 03 45 1 3 1 9 9 12 13 45 15 1 9 9 22 23 45 1 7 1 9 9 32 33 45 1 9 1 9 9 42 43 45 1 9 1 9 9 52 53 45 2 1 1 9 9 62 63 45 2 1 1 9 9 72 73 45 2 3 1 9 9 82 83 45 2 5 1 9 9 92 93 45 2 5 2 0 0 03 03 45 2 7 表l某地区人口变化数据 根据上表中的数据,做出散点图,见图1 扬州人学硕 :学位论文 3 4 6 0 0 3 4 5 0 0 3 4 4 0 0 3 4 3 0 0 3 4 2 0 0 一 o ,其中b = ( p7 ( ) ) 【彳7 】,且在夕处记值,z 2 ( p ,口) 是z 2 分布的分位数 证明:似然比统计量可表示为: l r ( f 1 ) = l r ( 4 ) = 一2 ,( f ) 一z p ( 0 ) ) , ( 4 2 8 ) 把( 4 2 8 ) 式在孝= 0 处进行二阶t a y l o r 展开可得 l r ( p ) 一孝7 ( ) ,”( 0 ) 孝( ) 一2 ( 17 ( 0 ) ) 7 孝( ) , ( 4 2 9 ) 其中,( o ) = 刮( f ) 鸳,”( o ) = a 2 ,( 孝) a 笋f7 1 在孝= 0 ( 即= 夕) 处记值 由于等= c 等厂警鬻= c 等八等,c 等川c 警广等, 由( 4 1 1 ) 可得 ,( o ) = r 1 ,( 夕) = o ,”( o ) = ,”( 夕) 三, 因此由( 4 2 9 ) ,有 l r ( p ) 孝7 ( ) 一,”( o ) ) 善( ) = 孝7 ( ) r 一,”( 夕) ) 三孝( ) , ( 4 2 10 ) 由d = o r ,则d 7 q d = r7 r ,由此可得 一钗夕) 27 1 ( 夕) q 一1 d ( 夕) _ 一( 觚( 伽 扬州人学硕i j 学位论文 = 1 - - 了 r r ( ,口一 e t ( 夕) 【u ( 夕) ) 尺) , u 、p 尸jl 。尸,j , e 1 ( 夕) d ( 夕) :e t ( f 1 ) q r = 0 ,贝, l je7 ( f 1 ) q = 0 由此可得 【e 。( ) 】【u ( ) 】 = 【p7 ( 夕) 7 1 q 一1 + q q7 q 一1 ) u 】= p 7 ( f 1 ) n n7 1 q 一1 】 u 】 因此有 ( 4 2 1 1 ) 由于 = p 7 ( 夕) 】 彳7 】- b , ( 夕) = 吉 尺7 1 ( 一b ) 趴 ( 4 2 1 2 ) 把( 4 2 1 2 ) 式代入( 4 2 1 0 ) 式即可得到( 4 2 9 ) 式由于夕是极大似然估计,因此一,”( 夕) 0 ,由 此可得,p - b 0 ,( 4 2 7 ) 式表示,似然置信域在切空间投影的二阶近似是一个在坐标孝下的 椭球并且这个椭球只与固有曲率有关,与参数效应曲率无关矩阵b 称为有效残差曲率阵 4 2 2 子集参数的置信域 给定模型( 2 1 3 ) ,今考虑模型的某个子集参数的置信域,h a m i l t o n ( 1 9 8 6 ) 最早研究了自 己参数的置信域,不失一般性,可设r = ( 群,屏) 7 ,其中届为多余参数,厦为有兴趣参 数,维数分别为胼叩由于多余参数届的存在,寻求参数殷的置信域要比一般情况增加一 些困难分两步:第一、找出参数:的某些置信域;第二、映射到切空间并进行二阶近似 为此,我们首先把一些量按的维数划分进行划分: 善7 ( ) = ( 孝,( ) ,舅( ) ) 7 ,v ( f 1 ) = ( k ( ) ,( ) ) r = ( r ,) b = ( 色) f ,j = 1 , 2 , 在下面,我们也会用到其它一些量的类似分块划分 与( 4 2 2 ) 式类似,殷的似然置信域可表示成 c ,( 】厂) = 屈:l r ,( 厦) p 。2 ( 口) , ( 4 2 1 3 ) 其中 三r s = 2 ( f 1 ) ,( ) ) ( 4 2 1 4 ) 这里矽= ( 屏( 屈) ,:) r ;矽( 履) 是固定殷时,届关于,( 届,屈) 的极大似然估计; 虞 ) = z 2 ( g ,口) 是置信水平 为获得子集参数殷的近似似然置信域,我们仍使用变换( 4 2 4 ) 式,在这种情况下,( 4 2 4 ) 式可表示成: 朱春华b o x - c o x 变换下的1 f 线件模型的统计诊断 f = 孝( ) = q r 厂( ) - f ( f 1 ) ) ,( 4 2 1 5 ) 其中手= 孝( 夕) 是:的函数,利用( 4 2 1 4 ) 和( 4 2 1 5 ) 两式,我们有如下定理 定理4 2 条件同定理3 1 ,则子集参数及的似然置信域在切空间的二阶近似可表示 为 k ( y ) = 屐:易( 屈) ( 厶一丁) 芋( 屈) 仃2 麒2 ) ) ,( 4 2 1 6 ) 其中t = b :+ 垦。( 厶- 8 , 。) - 1 昼:,k = p g ,手r = ( 手7 1 ,芋7 ) 7 证明: 由( 4 2 1 0 ) 、( 4 2 1 2 ) 及( 4 2 1 5 ) 式可知,以下表达式在= 夕处仍然成立 三足( 殷) 孝7 ( ) ) ( ,口一b ) 孝( ) ) , ( 4 2 1 7 ) 盯。 为了化简该等式,我们现将舌和戛的近似关系式事实上,1 :t :1 ( 4 2 4 ) 式和( 4 2 15 ) 式可得 孝= q7 1 ( 厂( ) 一厂( 夕) ) q7 1 v ( p 一夕) = r ( p 一夕) , 手= q 7 ( ( 矽) 一s ( b ) p r 矿( 矽一夕) = 尺( 矽一夕) , 由于j i c 是上三角矩阵,把e 述两等式分块 由此口j 得 邑色r 2 :( 厦一度) 另一方面,把,( 矽) 在夕处进行一阶t a r y l o r 展开并利用( 4 2 1 2 ) 式可得 ,( ) ,”( ) ( 一p ) = 一 r7 ( ,一b ) 尺) ( 矽一夕) 盯。 :一去渺( i p - - p 聊手, = 一一 n h - , 仃2 l “ “,j j 因此 。以矽) 一吉( 删孑 ( 4 2 1 8 ) 由于矽是极大子集参数似然估计,即对任意夙有 、i-、lj l 2 屈屈届履 一 一 一 一 层履一届履 ,。l,。一 、ll, 、,i, 2 2 ,- 2 骱砌 跏勋 蜀o r 0 ,l,一 一、,、i 点磊戛彘,。,。,。l 扬州人学硕l j 学位论文 刮( ) i 可i 雾2 a l ( p ) 粥 a t ( p ) 8 | b 2 似, 2 4 _ 一 眺。懈 ro l 却挑侧 由此可得( 厶一蜀,) 鲁一蜀:邑o ,因而有 善= ( 厶一z l , 。) 。1 骂:戛,戛参( 4 2 1 9 ) 蚴糍 ( 譬1 盎蚓 2 言彰( 屐) ( 一丁) 岛( 厦) 。 由此可知( 4 2 16 ) 式成立 定理3 2 的表达式和几何意义是h a m i l t o n ( 1 9 8 6 ) 关于非线性回归模型和w e i ( 1 9 9 8 ) 关于指数族非线性模型中的相应结果在指数非线性随机效应模型中的进一步推广 根据韦博成( 2 0 0 6 ,2 7 6 ) 上册的结果,子集参数历的置信域可表示为 s c 娟静) ,2 ( 毒k 矽,( 4 2 2 0 ) 其中j 2 2 是矩阵,的逆矩阵,= ( ,驴) 的左下角分块阵,f ,= 1 , 2 ,j = - 了1d7 d 对每一个及, s c 有渐近z 2 ( g ) 分布 引理4 2 条件同定理4 1 ,令 j p = v ( v7 1 y ) 1 v r , 最= k ( k r k ) 一1 巧7 , 则对模型( 2 1 3 ) ,( 4 2 2 0 ) 式的s c 能表示成 s c :去p r ( 矽) ( 尸一日) p ( 矽) , ( 4 2 2 1 ) 盯 朱春华b o x c o x 变换下的非线性模型的统计诊断 其中p ,只在处记值 证明:由于子集参数似然函数,( ) 及,( ) 的定义可知 o z ( p ) 1 fk 7e ( f 1 ) 1 可一7 p ( ) j 一躬毳豺 有 ,2 2 = 盯2 ( 7 1 # 砭) ,舅= l 一只, 因此由( 4 2 2 0 ) 式,s c 能表示成 s c = 7 1 p7 o ) v :( v l 职) 一1 哆p ( 矽) , s c = 去p 7 1 ( 矽) 圪( 曙# 心) 卅哆p ( 矽) , 仃一 由于刮( ) 筇i 雪= o 对任意厦成立,则有 p 。e o ) = k ( 矽) ( k r k ) 叫k7 p ( 矽) = 0 ,只p ( 矽) = p ( 矽) , 由于p ,日和暑。是投影矩阵 s c 2 7 l p t ( 矽) ( 耵k ( 曙职) 。1 咖夕) = 去e t ( 矽) ( 尸一日) p ( 矽) 莎 “一 ”。 此即( 4 2 2 1 ) 式 由引理4 2 转们有如下帝王单 定理4 3 条件同定理4 2 ,则参数:的似然置信域在切空f u j 的二阶近似为 妊,( 】,) = 扇:舅( 屈) ( 厶一丁) 2 戛( 屈) 仃2 房( 口) ) , ( 4 2 2 3 ) 其中t 与邑的意义与定理4 2 相同 证明:利用引理4 1 和4 2 ,我们首先计算p7 1 ( f 1 ) p e ( f 1 ) ,由上述分析,容易得到 e t ( f 1 ) p e ( f 1 ) = p7 1 ( 矽) y ( y7 y ) 一1v7 p ( 矽)( 4 2 2 4 ) 其中临孑( 即= 万) 处记值,为计算e7 ( 万) 哪( v7 1 y ) ,( 4 2 2 4 ) 经化简可得 e t ( f 1 ) p e ( f 1 ) = ( r v7 p ( 矽) ) 7 1 y7 e ( f 1 ) , 2 , z 2 z 2 牝 2 扬州大学硕l j 学位论文 2 6 t 王t ( 4 2 18 ) 式得 l r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年自考专业(计算机信息管理)考前冲刺测试卷【含答案详解】
- 执业药师资格证之《西药学专业二》题库(得分题)打印含答案详解(综合题)
- 2025年自考专业(护理)考试彩蛋押题(综合题)附答案详解
- 2025年自考专业(工商企业管理)复习提分资料及参考答案详解(基础题)
- 2025土木工程建筑施工试题预测试卷及参考答案详解(B卷)
- 2025年注册核安全工程师考试历年机考真题集附参考答案详解【预热题】
- 2024-2025学年医学检验(士)试卷及参考答案详解1套
- 2024反射疗法师大赛理论考前冲刺练习题及答案详解【易错题】
- 2024咨询工程师真题带答案详解(基础题)
- 2025年医学检验(士)题库含完整答案详解【典优】
- UL实用标准电子线常用规格表
- 大学预算绩效管理办法(试行)模板
- 西方音乐史全套完整教学课件
- 血液净化治疗临床应用
- 年产12000吨水合肼(100%)项目环评报告书
- 建设工程施工合同(GF-2017-0201) 专用条款模板
- 国家电网有限公司十八项电网重大反事故措施(修订版)
- 二年级健康成长上册教案
- 医院环境微生物 (3)
- 第七届全国中小学信息技术创新与实践活动
- 结构实体检测方案综合楼
评论
0/150
提交评论