(概率论与数理统计专业论文)多分类logistic回归及其统计推断.pdf_第1页
(概率论与数理统计专业论文)多分类logistic回归及其统计推断.pdf_第2页
(概率论与数理统计专业论文)多分类logistic回归及其统计推断.pdf_第3页
(概率论与数理统计专业论文)多分类logistic回归及其统计推断.pdf_第4页
(概率论与数理统计专业论文)多分类logistic回归及其统计推断.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

r l r 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构的学 位或证书而使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在 论文中作了明确的说明并表示了谢意 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权保 留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分 内容,可以采用影印、缩印或其他复制手段保存论文 ( 保密的论文在解密后应遵守此规定) 一 i 摘要 本文主要用剔除异常数据方法研究多分类l o g i s t i c 回归模型的回归诊断问题 及其应用 二分类l o g i s t i c 回归模型已经有丰富的理论,然而对多分类l o g i s t i c 回归模型 的理论,尤其是回归诊断问题的成果还不多本文讨论了多分类l o g i s t i c 回归模型 的一些理论并给出多分类l o g i s t i c 回归模型的应用案例 本文首先讨论二分类l o g i s t i c 回归模型的f i s h e r 信息阵和剔除第j 个观测值之 后的极大似然估计算法;然后,采用偏差的方法考虑了二分类l o g i s t i c 回归模型的 回归诊断问题,为将该理论推广到多分类的情况作基础;再后讨论多分类l o g i s t i c 回归模型的形式,借助于第一章的预备知识把研究内容推广到了多分类l o g i s t i c 回 归模型论文重点讨论多分类l o g i s t i c 回归模型参数的最t j 、- - 乘估计、极大似然估 计的算法;采用偏差的方法考查了多分类l o g i s t i c 回归模型的回归诊断问题,并给 出案例分析最后,讨论多分类l o g i s t i c 回归模型的拟合优度检验问题,介绍了三 种拟合优度检验的方法,通过模拟比较检验的功效 本文的特色之处在于使用剔除异常数据的方法来研究多分类l o g i s t i c 回归模 型的回归诊断问题,意义在于,每次剔除后回归计算不必完全重新运行,节省了运 算时间 关键词:多分类l o g i s t i c 回归;极大似然估计;拟合优度检验;回归诊断 北京工业大学理学硕士学位论文 a bs t r a c t i nt h i sp a p e r , w es t u d yt h ed i a g n o s t i c so fm u l t i n o m i a ll o g i s t i cr e g r e s s i o nm o d e l s a n di t sa p p l i c a t i o nb yu s i n gt h ed e l e t i o no fa b n o r m a ld a t a b i n a r yl o g i s t i cr e g r e s s i o nm o d e l sh a v ep l e n t yo ft h e o r i e s ,h o w e v e r , f o rt h e o r i e s o fm u l t i n o m i a ll o g i s t i cr e g r e s s i o nm o d e l s ,e s p e c i a l l yr e s u l t so fr e g r e s s i o nd i a g n o s - t i c s p r o b l e ma r es t i l lr e l a t i v e l yf e w w ed i s c u s ss o m et h e o r i e so fm u l t i n o m i a ll o g i s t i c r e g r e s s i o nm o d e l sa n dg i v ei t sa p p l i c a t i o n i nt h i sp a p e r , f i r s t l y , w ec o n s i d e rt h ef i s h e ri n f o r m a t i o nm a t r i xo fb i n a r yl o g i s - t i cr e g r e s s i o nm o d e l sa n dt h em a x i m u ml i k e l i h o o de s t i m a t i o na l g o r i t h ma f t e rt h ej t h o b s e r v a t i o nv a l u ed e l e t e d s e c o n d l y , w ec o n s i d e rt h ed i a g n o s t i c so fb i n a r yl o g i s t i c r e g r e s s i o nm o d e l sb yu s i n gd e v i a n c e i tm a k e sas o l i df o u n d a t i o nf o rm u l t i n o m i a ll o - g i s t i cr e g r e s s i o n t h i r d l y , w ei n t r o d u c et h ef o r mo fm u l t i n o m i a ll o g i s t i cr e g r e s s i o n b ym e a n so fp r e l i m i n a r yk n o w l e d g eo ft h ef i r s tc h a p t e r , w ee x t e n dr e s e a r c hc o n t e n tt o m u l t i n o m i a ll o g i s t i cr e g r e s s i o n w ef o c u so ni n t r o d u c i n gt h ea l g o r i t h mo fl e a s ts q u a r e e s t i m a t i o na n dm a x i m u ml i k e l i h o o de s t i m a t i o na b o u tp a r a m e t e ro f m u l t i n o m i a ll o g i s t i c r e g r e s s i o nm o d e l s ,a n dt h e nu s i n gd e v i a n c ec o n s i d e r e st h ed i a g n o s t i c so fm u l t i n o m i a l l o g i s t i cr e g r e s s i o nm o d e l s ,a n dg i v ei t sa p p l i c a t i o n i nt h ee n d ,w ed i s c u s st h eg o o d - n e s so f f i tt e s to fm u l t i n o m i a ll o g i s t i cr e g r e s s i o nm o d e l s ,w h i c hd e s c r i b et h r e em e t h o d s o fg o o d n e s so ff i tt e s t , a n dc o m p a r et h e i rp o w e rb ys i m u l a t i o n t h i sf e a t u r el i e si nt h a tw es t u d yt h ed i a g n o s t i c so fm u l t i n o m i a ll o g i s t i cr e g r e s s i o n m o d e l sb yu s i n gt h ed e l e t i o no f a b n o r m a ld a t a t h es i g n i f i c a n c ei st h a ti ti sn o tn e c e s s a r y t or e - r u nt h er e g r e s s i o na f t e re a c hd e l e t i o n , s a v i n gt h ec o m p u t a t i o n a lt i m e k e yw o r d s :m u l t i n o m i a ll o g i s t i cr e g r e s s i o n ;m a x i m u ml i k e l i h o o de s t i m a t i o n ;g o o d - n e s so ff i tt e s t ;r e g r e s s i o nd i a g n o s t i c s 一一 目录 目录 摘要 - - i a b s t r a c t 第1 章绪论l 1 1 引言 - l 1 2 预备知识 3 1 3 本文主要解决的问题及论文结构 9 第2 章多分类l o g i s t i c 回归模型1 0 2 1 模型简介 1 0 2 2 参数估计 1 0 2 3 回归诊断及案例分析1 8 第3 章多分类l o g i s t i c 回归模型的拟合优度检验- 2 3 3 1 检验统计量 2 3 3 2 模拟应用 - 2 5 3 3 本章小结 - - 3 2 主要讨论 3 3 参考文献 3 4 致谢 3 9 一一 第1 章绪论 1 1 引言 第1 章绪论 1 1 1 研究意义 线性回归模型( 1 i n e a rr e g r e s s i o n m o d e l ) 在定量分析的实际研究中是较流行 的统计分析方法然而,在许多情况下,线性回归会受到一定的限制比如, 当因变量是一个分类变量( c a t e g o r i c a lv a r i a b l e ) 而不是一个连续变量( c o n t i n u o u s v a r i a b l e ) 时,线性回归就不再适用实际上,许多社会科学的观察都是分类的 而不是连续的比如,政治学中经常研究的是否选举某候选人;又如,经济 学研究中所设计的是否销售或购买某种商品,是否签订一个合同,等等这 种选择量度通常分为两类,即。是”与。否”此外,有的时候,人们甚至愿意 将连续量度转换为类型划分一种常见的情况就是当分析学生升学考试成绩 的影响因素时,考试分数可以被划分成两类:录取线以上和录取线以下只 要选定一个分界点,连续变量便可以被转换为二分类变量在分析分类变量 时,通常采用的一种统计方法是对数线性模型( 1 0 9 l i n e a r m o d e l ) 而应用最广 的是对数线性模型的一种特殊形式一一l o g i s t i c 回归模型【1 】 自m a l t h u s 提出了生物总量增长定律后,v e r h u l s t ( 1 8 3 8 ) 提出了l o g i s t i c 模 型直到1 9 2 0 年两位美国人口学家p e a r l 和r e e d 重新发现了该模型后,l o g i s t i c 模型的应用才日益广泛例如;在社会科学,诸如社会学、心理学、人口学、 政治学、经济学、生物学、公共卫生学中,l o g i s t i c 回归模型是对二分类因变 量( d i s c h o t o m o u sd e p e n d e n tv a r i a b l e ) ( 且py = l 或y = o ) 进行回归分析时应用最为普 遍的多元量化分析方法根据h o s m e r 及其同事的统计( 1 9 9 1 ) ,在1 9 8 5 1 9 8 9 年 间,国际知名刊物美国公共卫生杂志发表的文章中约有2 0 ( 5 7 9 篇文章 中的1 1 3 篇) 应用了l o g i s t i c 回归模型l o g i s t i c 回归模型在诸多领域得到了广 泛应用可以说l o g i s t i c 回归模型的研究不仅有理论意义,更有实际意义 北京工业大学理学硕士学位论文 1 1 2 国内外研究现状 自v e r h u l s t 2 , a 提出用l o g i s t i c 函数作增长曲线后,利用该曲线进行人口统 计学的研究一直持续到十九世纪末,进入二十世纪,l o g i s t i c 函数与l o g i s t i c 回归模型已经在生物、经济、农业、医疗等方面获得了广泛应用,取得了丰 硕成果p e a r l 和r e a d 4 , 5 】,s c h u l t z 6 ,p e a r l ,r e a d 和k i s h i t 先后用l o g i s t i c 曲线建 立生物机体增长模型s c h u l t z 6 ,o l i v e r i s 用l o g i s t i c 函数建立农产品数量增长 模型许多学者,包括p e a r l 9 ,b e r k s o n 1 0 , 1 1 , 1 2 】,f i n n e y 1 3 , 1 4 】先后讨论了l o g i s t i c 函数在计量经济学上的应用在p l a c k e t t 1 5 】将l o g i s t i c 函数应用到生存分析 后,f i s h 16 又将l o g i s t i c 函数应用到计量经济学c o x 1 7 1 ,d a y 和k e r r i d g e 1 剐, a n d e r s o n 1 9 , 2 0 , 2 1 】等先后又将l o g i s t i c 函数应用到医疗诊断 在l o g i s t i c 函数与l o g i s t i c 分布在各领域内应用的同时,关于l o g i s t i c 分布 的参数估计及其分布的拟合优度检验等方面的理论研究也取得了一系列重 要成果,如a l b e r t 和a n d e r s o n 2 3 提出了l o g i s t i c 回归模型参数极大似然估计的 存在条件,s a n t n e r 和d u 厨 2 4 对上述a l b e r t 和a n d e r s o n 给出的极大似然存在 条件作了补充说明,f i r t h 2 5 】给出了极大似然估计的新方法等,由于极大似 然估计有其自身的缺陷,因此国内外研究学者不断关注回归参数的稳健估 计,t i b s h i r a n i 【2 6 , 2 7 , 2 8 给出了局部似然估计的方法,c a r r o l l 2 9 给出了l o g i s t i c 回归模型参数的稳健估计等在拟合优度检验方面,h o s m e r 和l e m e s h o w 3 0 j 对多元l o g i s t i c 回归模型进行拟合优度检验,随后,他们【3 l 】研究了估计概率 较小时,回归模型拟合优度检验问题;b a l a k r i s h n a n n 等人【3 2 】给出了:基于 完全数据和各类截尾数据的两个参数的最优线性无偏估计,b a l a k r i s h n a n n 等人1 3 3 】考虑了基于型截尾数据的半l o g i s t i c 分布参数的估计问题p a t r i c k g o 删给出了l o g i s t i c 分布参数的近似最佳线性无偏估计,等等 对于多分类l o g i s t i c 回归模型的研究相对晚很多,但是在实际中,并非应 用的只是二分类的模型,也有一些应用的是多分类的模型,因此有必要研究 多分类l o g i s t i c 回归模型为此,首先介绍多元二分类l o g i s t i c 回归模型 2 第1 章绪论 1 2 预备知识 1 2 1 多元二分类l o g i s t i c 回归模型 , 在这里玑仅有两个可能的取值,y i = 1 ( 事件发生) 和玑= o ( 事件不发生) 两种情况,而犰的条件概率如下: 7 r ( x i ) = p ( 犰= 1z l i ,z 2 ,z 埘) = e 伽+ := 1 凤。“( 1 + e 踟+ := 1 凤霉h ) , ( 1 1 ) p ( y i = 0z m z 2 一,z 一) = 1 ( 1 + e f l o + 盛= 1 觚t ) ( 1 2 ) 其中x i = ( x l i ,x 2 i ,z 硝) 是p 维协变量,i = 1 ,2 ,几礼是观测点个数,p 是协变量个数 于是,事件发生概率与事件不发生的概率比为 塑芝三三4 塑:丝三二:竺凄:e 岛+ :;。风 p ( y i = 0z l i ,z 2 i ,) 。 这个比被称为事件的发生比( t h eo d d so f e x p e r i e n c i n ga ne v e n t ) ,简记为o d d s o d d s 为正值,因为0 7 1 0 + 7 r l ;( i i ) y = 1 ,如果u 7 1 0 + 7 r :;( i i i ) y = 0 ,否则 我们产生n 个雪的值和z 去拟合多分类l o g i s t i c 回归模型去获得估计系数p 当正确的模型被拟合的时候,每一个元素都被用来去检验统计量的分 布下面这个模型仅包含一个连续的协变量,有两个l o g i t 函数和四个回归系 2 5 北京工业大学理学硕士学位论文 数,两个l o g i t 函数如下: 和 g l ( x ) = 3 1 0 + 3 1 1 x , 夕2 ( z ) = 阮o + 阮l x 使用五个不同的模型,每个模型的系数在表2 中定义在图1 中,可以看 到表2 中的五个模型所对应的三分类l o g i s t i c 函数的图像,自变量的范围是 2 6 第3 章l o g i s t i c 回归模型的拟合优度检验 图1t 图中实线代表p ( y = o l x ) 的概率密度,阶梯形曲线代表p ( y = 1 i z ) 的概率密度,散点图代表p ( y = 2 l z ) 的概率密度 ( - 6 ,6 ) ,模型代表在实际中可能遇到的情况模型1 ,2 ,4 和5 的三种响应变量的 概率从图像可以看出,不是递增趋势就是递减趋势模型3 ,响应变量0 所对 应的概率足单调减的;响应变量1 所对应的概率是非单调的;响应变量2 所 对应的概率足单调增的 为了检验样本分布和原假设分布的拟合程度,我们使用均值检验通过 计算机模拟1 0 0 0 次得出每一个检验统计量的均值,并在表3 中显示出来从 表中可以看出,统计量g 的假设均值1 2 ,1 6 和2 0 比较接近真实值;z 的均值 均是负值;x 2 的均值比假设值小整体结果还足比较好的在图2 和3 中, 显示了统计量z 和g 进行1 0 0 0 次模拟后的样本分布和真实分布 表2 :给定五个模型的l o g i s t i c 回归系数 m o d e l f l l op 1 1仍。仍1 12 00 31 8o 2 3 21 20 31 50 2 30 1o 91 8 0 4 4 1 5 0 30 20 4 50 40 30 1 90 1 1 2 7 北京工业大学理学硕士学位论文 表3 :均值模拟 n = 1 2 0n = 3 6 0 x 2zgc 1 0 c 1 2 x 2z c s e 1 0c 1 2 u ( 一6 ,6 ) m o d e l12 31 6 0 1 61 2 0 51 6 0 42 0 0 l7 1 7 3 0 0 81 1 9 91 5 7 82 0 0 4 m o d e l22 3 7 4 0 1 21 2 1 l1 6 1 32 0 0 57 1 8 6 0 0 6 1 2 0 41 6 0 8 2 0 0 2 m o d e l32 2 4 4 0 1 3 l1 1 61 5 2 61 9 0 17 2 0 5 0 0 71 2 0 11 5 8 81 9 0 2 m o d e l 42 3 6 8 0 0 812 3 616 3 52 0 0 67 2 0 2 0 0 41 2 1 11 6 1 32 0 1 1 m o d e l52 3 9 4 0 0 21 2 2 51 6 2 12 0 1 37 1 9 9 0 0 l 1 2 1 81 6 2 4 2 0 0 3 n ( 0 ,2 ) m o d e l12 3 4 5 0 1l1 2 2 61 6 2 52 0 2 07 1 8 90 0 51 2 2 01 6 1 52 0 0 5 m o d e l22 3 7 9 0 1 01 2 3 01 6 3 12 0 3 27 1 9 5 0 0 41 2 1 3 1 6 1 22 0 0 3 m o d e l32 3 0 7 0 0 51 1 8 21 5 7 11 9 6 47 l1 3 0 0 31 2 0 71 5 9 21 9 8 2 m o d e l 42 3 9 5 。0 0 7l2 2 3l6 3 22 0 4 37 1 9 9 0 0 41 2 0 91 6 1 42 0 1 3 m o d e l52 3 9 9 0 0 612 4 716 4 92 0 3 27 1 9 60 0 11 2 2 9 1 6 2 52 0 11 x 2 ( 3 ) m o d e l12 1 5 7 5 1 41 1 0 71 4 2 71 7 7 87 0 1 8 0 2 31 1 8 91 5 8 71 9 8 3 m o d e l22 2 2 8 0 2 311 3 81 5 3 71 9 2 27 0 9 9 0 1 71 2 1 71 6 0 92 0 0 1 m o d e l 42 3 3 6 0 1 71 1 8 91 5 8 31 9 7 97 1 3 4 0 1 2 1 2 2 31 6 1 42 0 0 8 m o d e l5 2 3 8 4 0 1 21 2 5 61 6 4 52 0 2 47 1 8 7 0 0 31 2 6 41 6 4 52 0 7 6 3 2 2 功效 我们通过检验q 和z 的功效来检验l o g i s t i c 回归模型的偏离程度,在这 里我们不考虑x 2 的功效,因为它的原分布太差而不能诊断它的使用下面 我们考虑两种情况:( i ) 忽略连续型协变量的二次型( i i ) 忽略连续型和二 分型协变量的交互作用项在这两种情况下,模型l ( 表2 ) 的系数被当做常量 和主要的效应连续项,且使用分布u ( 一6 ,6 ) ,i v ( 0 ,2 ) 和) ( 2 ( 3 ) 得到协变量2 7 二 分的协变量d b ( ) 两种情况我们使用的样本都足1 2 0 和3 6 0 由于计算量 很大,我们使用1 0 0 0 次模拟 ( 1 ) 忽略二次项 当拟合的模型仅仅包含两项( 岛2 = o ) ,响应变量从如下的l o g i t 模型产生 出来; g j ( x ) = 岛o + 岛l z + 岛2 2 2 , j = 1 ,2 2 8 第3 章l o g i s t i c 回归模型的拟合优度检验 与两个模型中增加的差异相对应,令房2 = o 0 1 ,0 1 ,0 2 ,0 3 ,0 4 表4 中汇总了 拒绝域为q = 0 0 5 下的所有情况的功效从表4 可以看出t 当拟合的模型接近 l o g i s t i c 回归模型时,功效是比较低的当拟合的模型逐渐偏离l o g i s t i c 回归 模型时,z 和g 的功效也逐渐增加而对x 2 ( 3 ) 分布来说,所有的统计量都 是不可靠的在统计量g 中,一般来说,g 的功效大于c l o 的功效,a o 的 功效大于c 1 2 的功效当n = 3 6 0 时,功效是比较高的 表4 :忽略二次项;在o 0 5 显著水平下的功效 礼= 1 2 0佗= 3 6 0 8 谊 z gq oc 1 2 z c s c 1 0c 1 2 u ( - 6 ,6 ) 0 0 l9 76 75 85 61 5 17 76 8 6 4 0 1 07 6 37 5 27 1 66 8 7 9 8 5 9 9 79 9 89 9 7 0 2 07 7 89 7 69 7 19 4 89 7 89 9 99 9 89 8 7 o 3 07 1 39 6 59 5 19 3 89 5 79 9 19 8 59 7 9 0 4 06 3 99 5 7 9 4 9 9 2 98 6 11 0 0 09 9 59 9 3 n o ,2 ) o o l7 26 95 65 51 3 67 66 97 9 0 1 06 9 15 7 85 7 45 3 7 9 7 6 9 9 6 9 9 4 9 3 4 o 2 08 0 19 0 78 7 68 6 59 9 89 9 89 9 29 9 6 o 3 07 9 59 4 69 4 59 1 79 9 39 9 79 9 59 9 4 0 4 0 7 8 39 7 9 9 5 79 4 29 9 4 10 0 09 9 79 7 6 x 2 ( 3 ) 0 0 l1 43 73 43 28 56 74 56 3 o 1 08 2 1 2 7 1 1 91 1 54 3 24 5 6 4 2 13 9 6 0 2 00 98 58 57 31 0 34 0 22 7 53 0 5 0 3 00 64 94 24 19 72 0 11 9 41 8 6 0 4 02 o3 63 22 93 31 8 91 4 51 3 4 ( 2 ) 忽略交互项 在所有的数集中,l o g i s t i c 回归模型包含连续变量z 和二分变量d 的二分 项和交互项: g j ( x ) = 岛o4 - 岛1 x + 岛2 d + p j 3 z d ,j = 1 ,2 拟合的模型包含二分项,但是无交互作用项( 伤3 = o ) 令岛2 = 0 2 ,0 5 ,1 0 ,岛3 = 0 2 ,0 4 ,o 7 ,1 0 代表不同的大量的二分项的影响所导致的增加的交互项的 2 9 北京工业大学理学硕士学位论文 水平n = 0 0 5 的拒绝域水平的功效在表5 中显示出来且表5 中用 u ( 一6 ,6 ) ,n ( 0 ,2 ) 和x 2 ( 3 ) 的分布从表5 中可以看出,随着交互作用项水平 的增加,所有统计量的功效也在增加n = 1 2 0 时,功效比较低,特别是) ( 2 ( 3 ) 分布的功效当佗= 3 6 0 时,名和q 有相近的功效 漶 7、 _ _ 嚏 k鬟 图2 t n ( 0 ,1 ) 的密度分布图和统计量z 在3 6 0 个样本和l o g i s t i c 模型1 下进 行1 0 0 0 次模拟后的直方图 耋 喜 1 詈 8 d 、 飞 。l 1 弋 旷 。叉 厂彳 o1 0 2 0 40 y 图3 ;x 2 ( 1 6 ) 的密度分布图和统计量c 1 0 在3 6 0 个样本和l o g i s t i c 模型l 下 进行1 0 0 0 次模拟后的直方图 3 0 第3 章l o g i s t i c 回归模型的拟合优度检验 表5 :忽略交互项:在0 0 5 显著水平下的功效 礼= 1 2 0几= 3 6 0 8 j 28 j 3 zg c l oc 1 2 zg c l oc 1 2 u ( 一6 ,6 ) 0 20 29 65 35 24 91 3 17 37 56 9 o 43 0 61 6 81 4 91 3 86 2 55 7 15 5 45 3 6 o 77 3 25 1 34 0 24 2 19 5 79 6 29 7 59 8 1 1 08 9 28 0 47 7 37 6 89 8 69 8 99 9 69 9 8 0 50 26 24 94 64 72 9 1 3 11 1 39 8 o 42 7 61 7 51 6 11 3 74 4 77 6 97 5 67 2 3 o 76 8 55 4 24 9 34 5 29 5 39 6 49 8 99 9 1 1 08 8 48 4 38 3 78 0 69 7 49 8 29 9 31 0 0 0 1 00 23 95 76 14 7o 72 4 51 8 71 6 5 0 42 5 82 2 61 9 51 7 13 0 89 1 28 8 78 6 5 o 78 2 46 9 76 5 46 7 49 8 59 9 79 9 69 9 5 1 o9 2 69 0 48 9 68 8 79 9 7l0 0 09 9 99 9 7 n ( o ,2 ) o 20 25 84 94 65 39 15 95 75 8 o 42 0 51 1 29 59 14 1 63 3 73 1 42 8 6 0 75 1 23 6 73 2 52 9 88 9 68 3 48 0 17 9 3 1 o6 9 15 5 25 2 34 9 19 9 59 7 89 7 19 6 7 0 50 24 54 94 64 82 99 08 17 4 0 41 7 41 1 51 0 49 13 0 65 8 75 4 65 1 3 0 74 7 12 9 42 6 32 4 78 9 99 2 19 1 39 0 2 1 07 0 86 3 26 0 15 8 39 8 59 8 19 8 39 8 5 1 0o 23 54 24 14 31 21 3 61 2 71 1 8 0 41 4 91 3 81 2 61 1 72 4 67 0 26 7 36 4 7 o 74 8 13 6 33 2 4 2 7 6 8 6 49 0 7 9 0 1 8 9 2 1 07 3 87 0 16 9 46 6 59 7 59 7 69 8 79 9 5 x 2 ( 3 ) 0 2 0 21 3 2 53 52 9 1 77 25 96 5 o 41 5 35 95 45 94 5 73 3 63 2 53 1 4 o 73 8 22 1 52 0 31 8 99 5 38 3 58 2 98 1 3 1 04 4 64 0 33 9 63 7 89 7 49 8 79 9 59 9 7 0 50 21 52 62 42 71 36 26 15 5 o 41 2 95 35 16 14 2 63 2 53 1 72 8 6 o 73 4 91 7 11 7 31 7 28 9 48 3 18 2 68 0 1 1 03 4 2 2 8 72 7 52 5 79 0 1 9 8 2 9 6 59 5 4 1 oo 21 52 62 22 3o 85 25 04 7 o 41 3 46 16 35 93 8 53 1 73 0 42 5 6 o 72 8 51 6 41 6 71 5 68 0 47 9 3 7 5 2 7 3 1 1 02 3 62 2 82 0 51 9 17 1 99 4 39 3 19 1 8 3 1 北京工业大学理学硕士学位论文 3 3 本章小结 我们给出了多分类l o g i s t i c 回归模型的三种拟合优度检验的统计量,并 使用模拟的方法检验了原分布的均值以及统计量的功效结果表明统计量的 均值比较接近于真实值通过检验统计量的功效,可以发现当协变量分布高 度倾斜时,z 比g 受到更大的影响;当拟合模型接近于l o g i s t i c 模型时,z 和 g 的功效比较差正如期望的那样,随着样本的增加,拟合模型和原l o g i s t i c 模型的差异也在增加,导致功效增加当有1 2 0 个样本的时候,功效总是低 的然而当有3 6 0 个样本的时候,z 和g 都有满意的功效通过模拟发现, z 的功效要比g 好 一3 2 主要结论 主要结论 关于二分类l o g i s t i c 回归模型的理论知识已经有了详细的介绍和具体的 表述,本文的目的就是要将二分类l o g i s t i c 回归模型的理论知识推广到多分类 l o g i s t i c 回归模型,尽管在 3 6 中已经给出多分类l o g i s t i c 回归模型的形式。 但是并未涉及到f i s h e r 信息阵、极大似然估计、最小二乘估计、回归诊断的理 论知识本文借助于第一章的预备知识,把相关理论推广到了多分类l o g i s t i c 模型并且给出了回归诊断的理论知识和案例分析并在第三章中对拟合优 度检验的统计量进行了模拟分析,得出了很好的结论 3 3 北京工业大学理学硕士学位论文 参考文献 1 】王济川、郭志刚l o g i s t i c 回归模型方法与应用【m 】北京:高等教育出版 社,2 0 0 1 2 】p j v e r h u l s t n o t i c es u rl al o i sq u el ap o p u l a t i o ns u i td a r t ss o n sa c e r o i s s e n m e n t c o r r m a t t p h y s e tp h y s i q u e 19 3 8 ,10 :113 1 21 3 】p j v e r h u l s t r e c h e r c h e sm a t h e m a t i q u e ss u rl al o ida c c r i s s e m e n td el ap o p u l a t i o n a c a d e m i cd eb r u x e l l e s 1 9 4 5 1 8 :1 3 8 4 r p e a r l ,l j r e a d o nt h er a t eo f g r o w t ho f t h ep o p u l a t i o no f t h eu n i t e ds t a t e ss i n c e1 7 9 0 a n di t sm a t h e m a t i c a lr e p r e s e n t a t i o n p r o c n a t a c a d s c i 19 2 0 ,6 :2 7 5 - - 一2 8 8 5 】r p e a r l ,l j r e a d s t u d i e si nh u m a nb i o l o g y w i l l i a m sa n dw i l k i n s ,b a l t i m o r e ,19 2 4 6 】h s c h u l t z t h es t a n d a r de r r o ro faf o r e c a s tf r o mac u r v e j a m e r s t a t i s t a s s o c 1 9 3 0 , 2 5 :1 3 9 1 8 5 7 】r p e a r l ,l j r e a d , j f k i s h t h el o g i s t i c sc u r v ea n dt h ec e n s u sc o u n to f19 4 0 s c i e n c e 1 9 4 0 ,9 2 :4 8 6 , - 一4 8 8 8 】f r o l i v e r m e t h o d so fe s t i m a t i n gt h el o g i s t i c sg r o w t hf u n c t i o n a p p l s t a t i s t 1 9 6 4 , 1 3 5 7 6 6 9 】r p e a r l m e d i c a lb i o m e t r ya n ds t a t i s t i c s w m s a u n d e r s ,c o p h i l a d e l p h i a , 19 4 0 1 0 】j b e r k s o n a p p l i c a t i o no ft h el o g i s t i c sf u n c t i o nt ob i o a s s a y j a m e r s t a t i s t a s s o c 19 4 4 ,3 7 :3 5 7 3 6 5 11 】j b e r k s o n w h yip r e f e rl o g i t st op r o b i t s b i o m e t r i c s 1 9 5 1 ,7 :3 2 7 3 3 9 1 2 】j b e r k s o n as t a t i s c a l l yp r e c i s ea n dr e l a t i v e l ys i m p l em e t h o do fe s t i m a t i n gt h eb i o - a s s a yw i t hq u a n t a lr e s p o n s e ,b a s e do nt h el o g i s t i c sf u n c t i o n l a m e r s t a t i s t a s s o c 19 5 3 ,4 8 :5 6 5 , , 一5 9 9 3 4 参考文献 【13 】d j f i n n e y t h ep r i n c i p l e so fb i o l o g i c a la s s a y j r o y s t a t i s t s o c s e r b 19 4 7 ,9 :4 6 , , 一91 1 4 】d j f i n n e y s t a t i s t i c a l

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论