(概率论与数理统计专业论文)广义线性模型的理论及其应用.pdf_第1页
(概率论与数理统计专业论文)广义线性模型的理论及其应用.pdf_第2页
(概率论与数理统计专业论文)广义线性模型的理论及其应用.pdf_第3页
(概率论与数理统计专业论文)广义线性模型的理论及其应用.pdf_第4页
(概率论与数理统计专业论文)广义线性模型的理论及其应用.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

渊 广西大学学位论文原创性声明和学位论文使用授权说明 学位论文原创性声明 本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取得的成果和相关 知识产权属广西大学所有除已注明部分外,论文中不包含其他人已经发表过的研究成果, 也不包含本人为获得其它学位而使用过的内容对本文的研究工作提供过重要帮助的个 人和集体,均已在论文中明确说明并致谢 论文作者签名:罗p 看壳 晰月捌日 学位论文使用授权说明 本人完全了解广西大学关于收集、保存、使用学位论文的规定,即: 本人保证不以其它单位为第一署名单位发表或使用本论文的研究内容; 按照学校要求提交学位论文的印刷本和电子版本; 学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务; 学校可以采用影印、缩印、数字化或其它复制手段保存论文; 学校可以公布论文的部分或全部内容 请选择发布时间: 囱即时发布口解密后发布 ( 保密论文需注明,并在解密后遵守此规定) 论文作者签名:椭花 导师签名: 砷年6 月) 日 广义线性模型的理论及其应用 摘要 广义线性模型是经典线性模型的自然推广,它是一类应用广泛的统计模型本文在 很弱的条件下证明了一般联系函数广义线性模型的极大拟似然估计的弱相合性,改进了 文献中的结果:并通过数值模拟的方法验证了广义线性模型的极大似然估计的弱相合性 另一方面将广义线性模型的理论用于广西南宁各高校大学生视力影响的统计分析中,考 虑大学生平均每天的上网时间、学习时间、睡眠时间等十个可能的影响因素,对广西南 宁大学生的近视情况进行统计建模与分析,为广大学生近视的预防及保护提供理论参考, 也为评估广西南宁大学生的近视状况提供参考 关键词:广义线性模型;极大拟似然估计;弱相合性p r o b i t 模型; l o g i s t i c 模型;回归诊断;假设检验 t h e o r ya n da p p l ic a tlo nf o rg e n e r a l iz e d lin e a rm o d e l s a b s t r a c t g e n e r a l i z e dl i n e a rm o d e l sa r en a t u r a le x t e n s i o no ft h ec l s s s i c a ll i n e a rm o d e l s u n d e r w e a kc o n d i t i o n s ,w ep r o v e dt h e w e a kc o n s i s t e n c yo fm a x i m u mq u a s i - l i k e l i h o o d o f g e n 耐i z e dl i n e a rm o d e l sw i t hn o n c a n o n i c a ll i n kf u n c t i o n ,w h i c hi m p r o v e dt h er e s u l t sm l i t e r a t l 】f e b e s i d e s ,t h r o u g h n u m e r i c a ls i m u l a t i o n ,c o n s i s t e n c yo fm a x i m u ml i k e l i h o o d o f g e i l e r a l i z e dl i n e a rm o d e l sw a sv e r i f i e d o n t h eo t h e rh a n d ,w ea p p l i e dt h et h e o r yo f 2 e n c 】a l i z e dl i n e a rm o d e l st oc o l l e g es t u d e n t s v i s i o ni m p a c ts t a t i s t i c a la n a l y s i s i l ln a n n i n g e i t vo fg u a n 殍i w ec o n s i d e r e d10f a c t o r s ,i n c l u d i n gt i m eo fo nl i n e ,t i m eo f s l e e p i n g ,t i m eo f s t u d v ,t i m eo fe x c i s e ,v i e wd i s t a n c e ,t h ec i r c u m s t a n c eo fd o i n gt h ee y eh e a l t hc a r eh o l d , n o u i i s e 1 1 tc o n d i t i o n ,m es i t u a t i o no fe a t i n gs w e e ta n df r u i t a n de r e ,w h i c hc a ni n f u l e n t m y o p i ap r o b a b l y t h e n ,w ee s t a b l i s h e ds t a t i s t i c a lm o d e l so nt h ec o l l e g es t u d e n t s m y o p l a s i 恤a t i o na n da n a l y s e de a c hf a c t o r t h r o u g ha n a l y s i sw ep r o v i d e dt h e o r e t i c a lm e t h o d sa n d r e f e 崩l c i a b l es u g g e s t i o nf o rm y o p i ap r e v e n t i o na n dp r o t e c t i o nt os t u d i e n t s ,a n da l s oo t t e r e d r e f e r e n c et oa s s e s st h em y o p i ao fn a n n i n gc o l l e g es t u d e n t s k e y w o r d s :g e n e r a l i z e dl i n e a rm o d e l s ;m a x i m u mq u a s i - l i k e l i h o o d e s t i m a t i o n ; w e a kc o n s i s t e n c y ;p r o b i tm o d e s ;l o g i s t i cm o d e l ;r e g r e s s i o nd i a g n o s t i c s ; h y p o t h e s i st e s t i n g 目录 第一章绪论1 1 1 研究的背景。1 1 2 国内外研究发展综述。2 1 3 本文的基本内容及创新之处4 第二章广义线性模型的介绍5 2 1 广义线性模型的相关概念及基本内容:5 2 2 广义线性模型的性质8 2 2 1 弱相合性8 2 2 2 强相合性8 2 2 3 渐近正态性8 2 3 本章小结8 第三章广义线性模型极大拟似然估计的弱相合性9 3 1 引言与主要结果9 3 2 定理3 1 1 的证明1 0 3 3 基于m a t l a b 的广义线性模型弱相合性的数值模拟1 4 3 3 1 模型的选取1 4 3 3 2 模拟的方法1 5 3 3 3 模拟的过程和结果1 5 3 4 本章小结17 第四章广义线性模型的特例叫。o g i s t l c 回归模型1 8 4 1l o g i s t i c 回归模型1 8 4 2 参数估计18 4 3 回归诊断2 l 4 3 1 条件指数2 2 4 3 2 方差比2 2 4 3 3 方差膨胀因子2 2 4 4 假设检验2 3 4 4 1w a l d 检验2 3 4 4 2 约束检验2 3 4 4 3 似然比检验2 4 4 5 本章小结2 4 第五章基于l o g i s t i c 回归模型的大学生视力影响分析。2 5 5 1 研究背景2 5 5 2 资料来源与调查方法2 5 5 3 调查结果2 6 5 4 研究方法2 7 5 5 回归诊断2 7 5 6 模型的建立与结果2 8 5 7 模型的修正与结果3 0 5 8 影响因素分析3 1 5 9 本章小结3 3 本文总结与展望3 4 参考文献:3 5 附录3 8 致谢4 3 研究生期间发表论文情况4 4 广西大掌硕士掌位论文广义线性模型的理论及应用 1 1 研究背景 第一章绪论 广义线性模型( g l m ) 是常见的正态线性模型的直接推广它的个别特例的出现到现 在已有很长的历史了早在1 9 1 9 年f i s h e r 就有这方面的研究其中l o g i s t i c 模型是最为著 名的一种模型2 0 世纪四五十年代就有b e r s o n ,d y k e 和p a t t e r s o n 等学者用l o g i s t i c 回归 模型进行统计建模广义线性模型最初是针对属性数据问题提出的,这类数据的分布既 非线性又非正态,引起了统计届对各种非正态模型和非线性模型的研究1 9 7 2 年,n e l d e r 和w e d d e r b u m 在其文献 1 中统一把用于非标准层面的回归分析、因变量不服从正态分 布情形的一类模型称为广义线性模型,就这样广义线性模型一词被首次提了出来他们 在响应变量服从非正态分布的回归分析中,就是把广义线性模型作为一族统一的模型应 用于其中,还给出了计算极大似然估计的统一方法后来他们对经典的线性统计模型做 进一步推广,使得广义线性模型的应用领域更加广泛,建立了相关理论及计算方法这一 发展对统计模型理论在统计学中的应用影响非常深远再后来人们将这一模型推广到更 为一般的情形就这样广义线性模型的研究得到了进一步的发展,但是研究不再像以前 一样只局限于响应变量服从指数型分布的情形w e d d e r b u m 晗1 在1 9 7 4 年首次提出了拟似 然函数的概念及极大拟似然估计的思想,提出响应变量的分布不一定要求为指数型分布, 只需正确设定响应变量的期望函数和方差函数就可以进行统计建模后来的研究表明, 在正确假定期望函数,而方差函数可不确知的情况下,这种方法仍然适用,被称为拟似然 方法由其得到的参数估计,就称为拟似然估计拟似然方程和极大拟似然估计的思想的 提出,极大的影响着这类模型和纵向( 1 0 n g i t u d i n a l ) 数据模型的发展l i a n g 和z e g e r 在 1 9 8 6 年就在广义线性模型的基础上提出了可用于纵向数据的广义估计方程( g e e ) 的方 法m c c u l l a g h 和n e l d e r 在1 9 8 3 年在文献 3 中系统的论述了广义线性模型从那以后, 关于此领域的研究文献数以千计,但大部分没有严格的数学推导 自建立了广义线性模型后,以统计方法为基础的各类学科获得了极大的发展在对 称正态分布的基础上建立起来的经典线性模型,其方差一般被假设为一常数值然而,有 些实际问题中获得的数据,其方差并不显示为常数值,因变量也不再局限于对解释变量 的线性依赖:在这种情况下,经典线性模型将不再适用,这时广义线性模型的出现为此类 广西大掌硕士掌位论文广义线性模型的理论及应用 问题的研究提供了有力的理论支持,拓宽了线性模型的研究领域 从形式上看,广义线性模型可以认为是一般正态线性模型的一种推广,它对因变量 的假设条件比线性模型要宽松得多,经典线性模型中因变量的假设须为正态假设,而广 义线性模型中响应变量的假设放宽为具有散布参数的指数型分布,使其实用性极大的扩 展开来模型分布假设的放宽,使得广义线性模型对连续型变量和离散型变量都可以进 行拟合,还可以对对称型变量进行拟合,除此之外,还可对具有较大偏度分布的变量进行 拟合例如对医学中的常见变量,如某病的发生率:种群生态学中的常见变量,如种群的 增长率等都可以用广义线性模型来进行拟合,还可以对其进行预测和估计广义线性模 型中,通过联系函数可将原来因变量和解释变量之间的非线性关系变换为线性关系换 句话说,联系函数的存在,可以把因变量与解释变量之间的关系设定为非线性关系,这就 方便于对属性变量或取值为特定区间的变量,如事件发生的概率进行拟合,因而也更加 符合实际应用广义线性模型应用上可以处理因变量与解释因素间复杂的非线性关系的 特性,大大的克服了经典线性模型的局限性再从实用角度看,它比标准的迭代模型在应 用中更具有效率其所提供的统计推断功能,对重要变量的筛选很有帮助,且模型的假设 条件也可得到确认总之,广义线性模型作为线性模型的推广,其中含有很多具有实用价 值的模型及其优良的性质,且在这个科学技术发展迅速的时代,计算机软件的使用具有 方便性和快捷性,决定了其在各门类学科实际应用中的广泛性随着广义线性模型理论 的不断向前发展和成熟完善,其必定迎来十分广阔的应用前景 1 2 国内外研究发展综述 广义线性模型的相关理论的研究,在文献中已有不少讨论,从相关文献来看,大部 分研究者都集中在对其极大似然估计或极大拟似然估计的渐近性质的研究上,例如可参 见文献 1 2 6 h a b e r m a n ( 1 9 7 7 ) ,a n d e r s o n ( 1 9 8 0 ) ,n o r d b e r g ( 1 9 8 0 ) 和m o n f o n t ( 1 9 8 1 ) 给出了 在自然联系情形下极大似然估计弱相合和渐进正态的条件f a h r m e i r l 和k a u f i r m n n h t 5 】 ( 1 9 8 5 ) 研究了( 响应变量是g 维) 在自然联系与非自然联系情况下的极大似然估计满足强 弱相合性及渐近正态性的更为一般的条件,他们证明了在 置,f 1 ) 有界,墨。 c 2 :, 旯。一0 0 的前提下,在自然联系函数情形下对口 1 2 ,在一般联系函数情形下对口= 1 及 满足其他一些正则条件下,则极大似然估计是强相合的,他们还在实际应用中对常见的 2 广西大掌硕士掌位论文广义线性模型的理论及应用 两种特殊情况进行了讨论自陈希孺( 2 0 0 2 ) 对广义线性模型做了系统的介绍后,引起越来 越多国内研究者的兴趣陈希孺,赵林城,尹长明,岳丽,高启兵等在这方面做出了较深刻 的研究并得到了重要的结论对g 1 维响应变量和般联系函数,岳丽,陈希孺【1 1 】在条件 s u p l x ,,对某个口,1 】,丑。 c n 口,s u p 怫栌 l 了以概率为1 ,当行充分大时,拟似然方程( 2 1 9 ) 有一解危,且 舀n l | 3 3 = o ( n - c n 口等条件下证明了回归参数向量的极大似然估计的强相合 性,以及序贯l o g i t ,分组c o x 和极值模型的极大似然估计的渐近正态性c h e l l 【1 4 1 首次在只 要求旯。- - + o o 条件下证明了拟似然估计的强相合性高启兵,吴耀华【1 5 】在自然联系的情 况下,对文献 1 4 】的条件进行减弱,证明了拟似然估计的强相合性,且得到了结论 一一! 尾一属= d ( ( 旯一l o g l 0 9 2 , 一) 2 丑。) a s , 并在常见的情况互。n = 0 ( 1 ) ,有 一三 成一屁= d ( ( 聆2l o g l o g a 一) 2 ) a s , 达到了独立和重对数律的收敛速度丁洁丽,陈希孺【1 6 】对文献 5 一般联系函数下的条件 五。= d 。) ,墨。_ 改进为( 旯。) v 2 ”= d ( 丑。) ,使其与自然联系情形下的条件一致张三 国,廖源【1 7 。1 8 1 等在假定误差方差有界而不假定误差分布,分别在误差不相关和独立的条 件下研究了拟似然估计的弱相合性,但他们只讨论了自然联系情形下的弱相合性,然而 很多情况下,自然联系的假定往往不符合实际,常会遇到非自然联系的情形,因此近年来 非自然联系情形下广义线性模型参数估计的渐近性质越来越引起广大研究者的关注 1 3 本文基本内容和创新之处 鉴于广义线性模型在连续数据和离散数据方面都有着广泛的应用,特别是离散数据, 广西大掌硕士学位论文广义线性模型的理论及应用 如属性数据、计数数据等,尤其是在生物、生态、医学、经济及社会数据等的统计分析 上,有着重要的意义本文主要介绍广义线性模型的一般理论,研究了广义线性模型拟似 然估计的弱相合性及其在实际问题中的统计建模,关于统计建模的有关论述,主要参考 了陈希孺教授的广义线性模型t 2 2 - 2 6 及f a h r m e i n l 的专著5 1 ,我们将在第二章和第 四章详细加以介绍全文共分为五章内容,本文的主要工作在第三章和第五章,其中创新 之处主要在第三章 第一章简单介绍了广义线性模型的研究背景和国内外研究进展,以及本文的研究内容, 并指出本文的创新之处 第二章介绍了广义线性模型的概念、性质及相关的基本内容 第三章讨论了广义线性模型拟似然估计的弱相合性,给出了证明并选择了p r o b i t 模型 借助计算机和m a t l a b 软件编程分别产生1 0 0 ,2 0 0 ,3 0 0 个3 x 3 维的设计阵,以数值模拟的 形式验证了广义线性模型极大似然估计的弱相合性,这也是本文的主要工作 第四章给出了广义线性模型的特殊情况l o g i s t i c 模型,然后通过分析模型的特点及性 质陈述了s t i e 模型的基本内容,包括模型参数估计,模型诊断,和假设检验等 第五章利用随机抽样调查得到的关于广西南宁部分高校大学生视力情况的数据,在广 义线性模型的基础上对广西南宁市部分高校近视情况进行了整体分析,这里主要考虑了 十个可能影响视力的因素( 学生每天的上网时间,作息时间,学习时间,及运动时间,读书 时的视线距离,做眼保健操的情况,吃甜食,水果的情况,还有他们的营养状况,父母亲的 近视情况等) 进行分析并给出相关的建议,分析结果可为广大学生近视的预防和视力的 保护况提供参考依据 最后是对本文研究的内容和理论方法进行了概括总结和展望 4 广西大学硕士学位论文 广义线性模型的理论及应用 2 1 模型介绍 第二章广义线性模型的介绍 为方便下文的讨论,本章我们先叙述广义线性模型中的一些定义、假设和性质,并引 入若干记号 定义2 1 1 2 1 1 设g 维随机变量y ,有如下分布密度 f ( y i p ) = e x p ( 0 。y - b ( o ) ) d v ( y ) ,p 0 。c r 户 ( 2 1 1 ) 其中v 为仃一有限测度,o = 口l0 o ,占 0 ,存在( 万,占) 0 ,若 尸( i 磊l 1 一占, 则称随机变量序列 己,f 1 是依概率收敛的 引理3 1 1 t 1 2 】设a ( t ) 是定义在r p 的一个子集t 上的p x p 对称矩阵值的连续函数, 且a ( f ) 乃( f ) 九( f ) 为a ( t ) 的特征根,则每个乃( f ) 都是t 的连续函数特别地,当 丁为紧集时,对任意f r ,彳( f ) o ,有孵a o ,霉乃 - 厂, 那么对任意的y ,i y - y o l l r ,存在x ,l i x - x o l l - o 和相应的闭区间- 厂满足 :0 或陀( f l 一屈) i l 万) c ,: a 3 :残差巳,f 1 ,不相关,e ( q ) = o ,s u p 层i q | 2 l 对任意给定的万 0 。当,z _ 0 0 时,有 n0 簖2 置1 1 2 - - t r eq ;“2 墨簖2 = 护簖2 最簖1 彪 l 由条件( a 4 ) 知f ( t ) := h ( t ) a ( t ) h 。( f ) 在紧集上一致连续又由( 3 2 6 ) 及( 3 2 7 ) 式知 然,1 ( ) 怍踩,0 鳞1 佗q ( ) g - i 2 一饼“2 q 研“2 0 2 肚m 巩a 。x 。,9 善簖2 墨( r ( z ) - r ( x i 属o ) ) x :q ;20 m a x s u p i ( x ) 了) 一r ( x 届o ) l 芝8 簖2 墨1 1 2 e “【dj 2 if i ” ” c pm 唧u p l r ( x ;p ) - r ( x ;p o ) i 一0 ( 3 2 8 ) 开c 曰, 、f l 广西大学硕士学位论文 广义线性模型的理论及应用 为证明当”一0 0 时, k 8 山o 因对任意p 1 维向量乃( 第s 个元素为1 ,其余元素为o ) ,显然有e ( 名4 2 丑) = 0 , 由m a r k o v 不等式知 p ( 憎丑l 邮学= 学 所以对任意s ,f ( = 1 ,2 ,p ) ,只要证 令砰暑v a t ( e , ) ,由条件( a 3 ) 知 c 兰协簖1 ,2 置1 1 2 可窆 i = l 且当,z 专o o 时, 故( 3 2 9 ) 式成立 i = 1 玩,( 疋4 2 以) 一0 s u p 砰 l 簖2 五簖2 丑= 驴簖“2 最簖1 佗丑 l e i 1 2 窆0 簖1 ,2 五1 1 2 寸o , 2 乙 p妣眨 知、l , ,ia ,l和钔 a ,件条由 。闽 驭渤m k 广西大学硕士学位论文广义线性模型的理论及应用 于是,当刀- - - ) o 。时, 觚m a x ( 硎山o 同理,并注意到 s u pi 互( 声) l 0 ,存在艿 0 ,对足够大的n ,有 对任意万 0 ,记 ( 3 2 1 1 ) ( 3 2 1 2 ) 尸( 存在厄吃( 万) ,使得胛( 应) = o ) 1 - s 一 ( 3 2 1 3 ) 蛾( 万) 基 铡残坨( 一风) 6 = 万 ( 3 2 1 4 ) 注意当强( 万) 时,l l 残坦( p - p o ) l l s - - 1 f l j ( 3 2 1 4 ) 式及引理3 1 3 知对任意万 0 ,有 声哦i n f 。占,( 一p o ) 或( ) 研1 e ( ) ( 一p o ) 卢骠刃万2 ( 一p o ) d :( ) ( 一p o ) 1 8 2 ) 2 ( 3 2 1 5 ) 由( 3 2 2 ) 式知,对任意占 0 ,存在万 0 ,存在c o ( o ,1 ) ( 不依赖万) ,当,z 足够大时,有 p ( ,珊j ,五簖“2 【成( ) 】- 簖1 他a c o ) 1 一三 f l j ( 3 2 1 ) 、( 3 2 1 5 ) 、( 3 2 1 6 ) 式知,对任意万 0 ,当n 足够大时,有 p ( 觚i n f 簖m ( ,z ( ) 一三,z ( 属) ) 岛万) 1 一三 由条件( a 1 ) ( a 4 ) 知 c l e 人,砰人:耳 c 2 , c 3 簖1 心e 簖“2 1 一要 二 ( 3 2 2 1 ) ( 3 2 2 2 ) 由引理3 1 2 ,当( d ee 时簖“2 l n ( f 1 ) 是自变量为属于凸集或( 6 ) 的单射,由引理3 1 4 , 若缈en e ,存在厦e ( 万) ,使得 l n ( f l 。1 = 0 3 3 基于m a t l a b 的广义线性模型弱相合性的数值模拟 口 广义线性模型作为一般线性模型的推广,有很多很好的性质,其极大似然或拟似然 估计厦的相合性就是其中一种很好的性质这里用m a t l a b 软件来对大样本的p r o b i t 模型 极大似然估计的弱相合性进行模拟 3 3 1 模型的选取 本章的数值模拟,我们选取广义线性模型的特例p r o b i t 模型( 响应变量为二值,0 或 1 ) 进行模拟 我们为验证广义线性模型似然方程 咒( ) = 墨日( z ) - 1 ( z ) ( 咒一i z ( z ) ) = o ( 3 3 1 ) 解庭的弱相合性其中,x 为p g 阶设计矩阵,为p 维列向量= ( 届,辟) 这里考 虑p r o b i t 模型,因而联系函数g ( t ) = _ 1 ( f ) ,则逆联系函数为h ( t ) = o ( t ) ,o ( t ) 为标准正态 分布累积溅驰( f ) = 击l e x p ( - 互1 “2 胁琊么即) = 掣= 去e x p ( 抄1 1 4 广义线性模型的理论及应用 3 3 2 模拟的方法 由于广义线性模型的似然方程是非线性的,求取极大似然估计通常选用午顿迭代法 n e w t o n r a p h s o n 2 3 1 此迭代法通过变换与迭代的加权最小二乘法( i r l s ) 相等同这里只 给出二值的p r o b i t 回归模型的牛顿迭代公式,见文献 2 4 假设从初始值出发已经算到k 一1 步,那么第k 步有 定。= 房卜1 + f 一( 庭卜1 ) l n ( f l :“1 ) ( 3 3 2 ) 其中,( 虞) 为模型的信息阵,r ( l ) - - - 0 2 z n ( p ) a p a p i 肛戌= a t - ,( x l ) w 一1 h ( z l ) x , l n ( f 1 ) 是p r o b i t 模型的似然函数矿= d f a g ( w , l ,。) ,w i i = t 3 1 ( 1 - 3 1 ) ,形也称加权矩 阵反的方差玩,( 虎) = f ( a ) 而在具体的应用过程中为加快迭代的收敛速度,常用一种修正的牛顿迭代法, 庶) - 度h + a f 一( 庭扣1 ) 三,z ( 庭卜1 ) ( 3 3 3 ) 应用中,常可用( 3 3 3 ) 代替( 3 3 2 ) 式进行迭代,其中力常取1 2 ,( 1 2 ) 2 , 迭代收敛的条件,也即迭代停止的条件为 钟= 矽一伊i i i 扉“卜 其中占为设定的很小的正数,可取0 1 ,0 0 1 ,0 0 0 1 ,甚至可以更小,占越小,迭代次数越 多,所花的的时间就越长,有时遇到大样本的计算甚至有可能要花上好几天的时间 3 3 3 模拟的过程和结果 这里取定设计阵维数p = g = 3 ,取旯= ( 1 2 ) 4 ,用修正的牛顿迭代法进行模拟,算法实 现如下: 1 ) 对参数真值o 赋初始值p o = 1 ,l ,- 1 : 2 ) 随机产生刀个服从标准正态分布的3 x 3 维矩阵置,( 这里n = 1 0 0 ,2 0 0 ,3 0 0 ) : 3 ) i :t - ,g h ( x l p o ) ,u p , 求p ,并计算日( z o ) : 4 ) 对应的产生,z 个随机的取值为0 或者1 且期望为h ( x p o ) 的3 维列向量只: 广西大学硕士学位论文广义线性模型的理论及应用 5 ) 求模型砌( ) :窆五日( ) 一1 ( z 声) ( 办一j i l ( z ) ) :o 的极大似然估计矽一; i ) 分别对n = 1 0 0 ,2 0 0 ,3 0 0 进行模拟,并计算其极大似然估计m l e ; i i ) 预先取定一个大于o 的数占= 0 0 1 : i i i ) 取a = ( 1 2 ) 4 ,计算迭代公式 的值: 庭) = 矽n ( i - d + 允,一( 度卜i ) 三万( 度卜l ) ,p = 0 扉n 一庭卜l i i 1 1 定卜l 8 , 若l 度n 一扉卜i u i i 庭卜1 1 _ o 0 1 ,继续迭代:若i l 度n 一扉卜l m 陋卜l i l 0 0 1 ,迭代过程结 束,输出迭代次数y 和解具体程序见附录x v jn = 1 0 0 ,2 0 0 ,3 0 0 分别求得5 0 组估计庭, 具体迭代结果见附录表3 3 1 ,表3 3 2 和表3 3 3 ,迭代收敛条件为 胛= 渺一矽i i 1 1 庭h 0 0 0 1 分别对求得的5 0 组估计求平均值、方差和区间估计, 当n = 1 0 0 时, 厦0 0 = ( - 1 0 3 1 9 ,1 0 4 2 8 ,一0 9 3 6 4 ) ,v a r ( 厦0 0 - , a o ) = ( o 0 0 1 3 ,0 0 0 2 1 ,0 0 0 2 8 ) , 9 5 的置信区间为 ( 一1 0 4 1 9 ,- 1 0 2 1 9 , 1 0 3 0 1 ,1 0 5 5 5 , - 0 9 5 1 1 ,一o 9 2 1 7 ) 当n = 2 0 0 时, 厦0 0 = ( 一1 0 0 5 7 ,0 9 8 3 2 ,一0 。9 7 5 0 ) ,v a r ( 反o o - , a o ) = ( o 0 0 0 2 ,0 0 0 0 2 ,0 0 0 2 5 ) , 9 5 的置信区间为 ( 一1 0 0 9 6 ,一1 0 0 18 , 0 9 7 9 2 ,0 9 8 7 0 , - 0 9 8 8 9 ,一0 9 6 11 ) 当n = 3 0 0 时, 风= ( - 1 0 1 0 1 ,1 0 0 6 5 ,一0 9 9 5 3 ) ,v a r ( 反0 0 - p o ) = ( o 0 0 0 2 ,0 0 0 0 6 ,0 0 0 0 1 ) , 9 5 的置信区间为 ( 一1 0 1 4 0 ,一1 0 0 6 2 , 0 9 9 9 7 ,1 0 1 3 3 , 一0 9 9 8 1 ,一0 9 9 2 5 ) 1 6 广义线性模型的理论及应用 表3 3 4 模拟的组数m = 5 0 n = 1 0 0n = 2 0 0 n = 3 0 0 i 反一。 3 0 的“和甜谊都大于0 5 ,那么有两个或更多的系数尻,岛都被包含在同一 个较强的共线性关系中 4 3 3 方差膨胀因子 陋= 去 1 一彤 它是用来诊断多重共线性严重程度的常用指标之一其中r ,是已通过加权后置与 其余解释变量线性回归关系的相关系数若五与其余自变量无线性相关,即有r ? = 0 ,则 v f = 1 :反之v f 大于1 一般情况下,当v f 5 或v f 1 0 ,认为自变量间存在严重的 共线性 广义线性模型的理论及应用 4 4 假设检验 在广义线性模型中,实际应用中最常见的假设检验问题仍是线性假设原假设 h o :c p o = 口,备择假设q :c p o 口其中p o 为p 维的参数真值,c 为已知的r xp 行满 秩常数矩阵( r p ) 4 - 4 1w a l d 检验 检验统计量为: 屯= ( c l 一口) ( c 久:1 c ) 一( c l 一口) 其中危为成的极大似然估计,天。:为c o v ( s 。( 风) ) 的估计 当原假设风成立时,将c 属= a 代入龟得: 屯= ( c ( 度一屁) ) ( 以:1 c ) 一1 ( c ( 庶一屁) ) 可证明:当原假设成立时,屯与z 2 ( ,) 若给定检验水平口( o ,1 ) ,当原假设风不成立时,e ( c - a ) c 届o - a o ,屯倾于 取大值所以当屯 z ( r ) 时,拒绝原假设h o 4 4 2 约束检验 记厄为原假设在约束条件c 声= 口下的极大似然估计 检验统计量为 = s 。( 孱) 人:1 ( 尾) ( 厦) 当u 。 c o n s t 时,拒绝原假设 原假设成立时,虞和孱同为真值风的相合估计且相当接近,有( 厄) ( 危) = o , 此时“取很小当原假设不成立时,虎和厄之间的差距较大,0 s n ( 厦) 0 与零有一定距离, u 将取较大值可以证明:当原假设成立且满足一定条件时,有“。山z 2 ( r ) ,n o o 广义线性模型的理论及应用 若给定检验水平a ( o ,1 ) ,于是上面的c o n s t 可取为z ( ,) 4 4 3 似然比检验 用众和厦分别表示参数真值风在不受任何约束条件下的极大似然估计及受到原假 设约束的极大似然估计,l n ( 7 ) 是对数似然函数 检验的统计量为 = 2 ( 1 n ( p ) 一1 n ( 夙) ) 因l n ( 众) 为l n ( f 1 ) 的最大值,总有以0 当原假设成立时,a 和厄同为真值风的相合估 计,庶和反相当接近,而以则很小当a o 不满足原假设时,度和厦之间的差距较大,旯。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论