(概率论与数理统计专业论文)基于经验似然的部分线性模型的统计诊断.pdf_第1页
(概率论与数理统计专业论文)基于经验似然的部分线性模型的统计诊断.pdf_第2页
(概率论与数理统计专业论文)基于经验似然的部分线性模型的统计诊断.pdf_第3页
(概率论与数理统计专业论文)基于经验似然的部分线性模型的统计诊断.pdf_第4页
(概率论与数理统计专业论文)基于经验似然的部分线性模型的统计诊断.pdf_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

i 东南大学学位论文 独创性声明及使用授权的说明 一,学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果尽我所知,除了文中特别加以标明和致谢的地方外,论文中不包含其他人已经发表或 撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的 材料与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示了谢意 二、关于学位论文使用授权的说明 签名:_ 二l 敞日期:_ 2 吐) 聿酗 i 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的 复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文本人电子文档的内容 和纸质论文的内容相一致除在保密期内的保密论文外,允许论文被查阅和借阅,可以公 布( 包括刊登) 论文的全部或部分内容论文的公布( 包括刊登) 授权东南大学研究生院办 理 日期:芈 摘要 经验似然方法已经被广泛应用于许多模型的统计推断本文基于经验似然对部分线 性模型进行统计诊断首先给出模型的估计方程,进而得到模型参数的极大经验似然估计; 其次,基于经验似然研究了三种不同的影响曲率;最后通过随机模拟和实例分析,说明了 统计诊断方法的有效性 关键词:经验似然;估计方程;极大经验似然估计;影响曲率 a b s t r a c t t h ee m p i r i c a ll i k e l i h o o dm e t h o dh a sb e e ne x t e n s i v e l ya p p l i e dt om a n ym o d e l so f s t a t i s t i c a li n f e r e n c e t h i sp a p e ri sb a s e do i le m p i r i c a ll i k e l i h o o df o rp a r t i a ll i n e a rm o d - e l sf o rs t a t i s t i c a ld i a g n o s i s f i r s t t h ee s t i m a t i n ge q u a t i o n so ft h em o d e la r eg i v e na n d t h em a x i m u me m p i r i c a ll i k e l i h o o de s t i m a t e so ft h ep a r a m e t e r sa r eo b t a i n e d ;t h e n ,b a s e d o i le m p i r i c a ll i k e l i h o o dm e t h o d ,t h et h r e ed i f f e r e n tm e a s u r e so fi n f l u e n c ec u r v a t u r e sa r e s t u d i e d ;l a s t ,s t o c h a s t i cs i m u l a t i o na n dd a t aa n a l y s i sa r eg i v e nt oi l l u s t r a t et h ev a l i d i t yo f s t a t i s t i c a ld i a g n o s t i cm e a s u r e s k e yw o r d s :e m p i r i c a ll i k e l i h o o d ;m a x i m u me m p i r i c a ll i k e l i h o o de s t i m a t e ;e s t i m a t i n g e q u a t i o n s ;i n f l u e n c ec u r v a t u r e s 1 1 摘要 a b s t r a c t 第一章 1 1 1 2 1 3 第二章 2 1 2 2 2 3 2 4 目录 绪言 背景 研究现状 本文工作 部分线性模型的参数估计 引言 经验似然与估计方程。 部分线性模型的估计方程 模型参数p 的极大经验似然估计 第三章部分线性模型的影响分析 3 1 引言 3 2 模型的数据删除度量 3 3 局部影响分析方法介绍 3 4 部分线性模型的局部影响分析 3 5 部分线性模型的伪残差分析 第四章模拟计算和实例分析 4 1 引言 4 2 模型随机模拟数据的影响分析 4 2 1 数据的产生 4 2 2 参数估计 4 2 3 影响分析 4 3 实例分析 4 3 1 参数估计 ; n 1 2 3 3 5 5 5 7 8 9 9 9 n s j m 垢玷坫垢拈m掩坞 4 3 2 影响分析2 1 总结 致谢 参考文献 2 2 2 3 2 4 第一章绪言 统计学的出发点是一个数据集,该数据集往往是对在实际工作中逐步积累起来的历 史资料或围绕某一特定目标收集起来的数据初步加工整理而成为了利用数据集研究实 际问题,通常的方法是把它纳入某一方便有效的统计模型进行分析但是,所有的统计模 型都只能是对客观过程的一种近似描述,它不可避免地包含某些假设,甚至模型本身也是 一种假定下面的问题是不容忽视的:我们所选择的模型能不能大体上反映所要研究的实 际问题? 它能否与数据集中大多数的数据相一致? 我们所得到的数据集中会不会有个别 由于收集或整理过程中的疏忽和失误或其他种种原因而出现较大的误差? 。统计诊断”就 是为了解决上述问题而发展起来的一种统计分析方法统计诊断是数据分析的重要组成 部分,其主要任务是检测已知数据在用既定模型拟合时的合理性 统计诊断是7 0 年代中期迅速发展起来的统计学新分支,是在高速计算机的迅速发展 支持下建立起来的,已经成为统计学中一个非常重要的研究课题在实际应用与理论分析 中,统计诊断已广泛应用于各种统计问题和统计模型,并被编入许多通用统计包,成为近 代统计学的重要分支将统计诊断思想应用于线性回归模型无论在理论还是在应用中都 已比较成熟,已有大量的研究成果发表随着研究的不断深入,统计诊断也被应用于各种 比较复杂的模型,诸如广义线性模型和不完全数据模型韦博成等【l 】编著的统计诊断 引论详细总结了统计诊断的各种研究成果,包括线性回归模型的残差分析、c o o k 距离 和局部影响分析方法以及广义线性模型的影响分析和回归诊断的b a y e s 方法等韦博成、 林金官等阁编著的统计诊断在统计诊断引论的基础上,进一步介绍了近年来在该 领域取得的一些重要成果,包括广义非线性模型的基本统计诊断方法,基于e m 算法的统 计诊断方法等其中基于e m 算法的统计诊断方是近年来统计诊断研究取得的重要成果, 可用于c o o k 等人的经典方法所不能解决的许多复杂数据的统计诊断问题,如非线性随机 效应模型以及泊松逆高斯回归模型的统计诊断z h u ,e ta l 3 1 基于经验似然研究了统计诊 断方法,这是统计诊断在非参数范围内的重要应用,从而拓展了统计诊断的应用范围,是 近期统计诊断的非常重要的研究成果 本章第一节介绍部分线性模型的背景,第二节阐述经验似然诊断的研究现状,第三节 介绍本文的主要工作 1 东南大学硕士学位论文第一章绪宦 2 1 1 背景 给定一组观测数据( 殁,纨) ,i = 1 ,2 ,n ,其中娩= ( x i l ,x i p ) r 为自变量组成 的向量,y i 为因变量线性回归模型可表示为 y i = z p + 毛= x i l 风+ x i 2 f 1 2 + + z 伽伟+ 毛,i = l ,2 ,仡( 1 1 ) 其中卢= ( 尻,岛) t 为未知的回归系数向量,矗为随机误差该模型的矩阵形式可表示 为 y = x p + ,( 1 2 ) 其中y = ( y 1 ,) t ;= ( 1 ,。) t ;x 为n x p 阶矩阵,其第i 行为x t = ( 戤l ,x i p ) 由此即可得到回归系数的最小二乘估计或极大似然估计为了正确地应用这些估计,模型 ( 1 1 ) 或( 1 2 ) 应满足以下通用的标准化假设条件: ( 1 ) 关于模型形式的假设联系因变量y i 和自变量兢= 1 ,) t 之间的模型 关于回归系数( p 1 ,伟) t 呈线性关系,即如( 1 1 ) 式所示这一假设可以区别诸如非线 性模型,广义线性模型等其他常见的模型; ( 2 ) 关于随机误差的假设,通常假设随机误差1 ,。满足以下几个条件: ( a ) e l ,均值相等且为0 ,因为非零部分总可以纳入y i 的均值之中; ( b ) e 1 ,n 相互独立,成为独立性假设,这可区别于随机误差相关的情形; ( c ) l ,。具有相同的方差盯2 ,称为方差齐性假设; ( d ) e l ,服从均值为0 ,方差为口2 ,相互独立的正态分布,称为正态性假设 直观上看,这些假设还是合理的,可以接受的,它们也保证了最z j 、- - 乘估计的存在唯 性和有效性,因此在实用上都认同或部分认同这些假设条件,事实证明,对于线性模型 的最j 、- - 乘估计,不会严重影响分析与推断的合理性因此,数据分析的主要任务之一就 是要检测实际数据是否符合既定模型的标准化条件 本文基于经验似然对部分线性模型进行诊断分析部分线性模型首先由e n g l e ,e t a l 4 为了研究电力需求与天气之间的相互关系而提出来的此模型的一般形式为: y i = z p + 妒( 岛) + 矗,i = 1 ,佗,( 1 3 ) 其中y i 为响应变量,奶为p 1 维向量,如在【0 , 1 】上取值,p 为p 1 维未知参数,妒( ) 为 定义在【0 , 1 】上的未知可测函数,鼠( i = 1 ,死) 为随机统计误差,通常假设岛为独立同分 布的随机变量,期望e ( e i ) = 0 ,方差盯2 = e ( e i ) ,并且民与( x i ,如) 相互独立,i = 1 ,n 东南大学硕士学位论文第一章绪言 3 由于部分线性模型的实用性和有效性,一些学者对此进行了研究,提出了若干关于未 知参数p 和未知函数妒( ) 的估计方法例如,r o b i n s o n l 5 运用n a d a r a y a - w a s t o n 核估计 方法给出了参数p 的最小二乘估计,并且推导了在某些正则条件下参数估计的渐近分布 s p e e k m a n 【6 】用核估计方法得到了参数卢和函数垆( ) 的估计 1 2 研究现状 在回归分析中,模型的诊断问题是非常重要的环节自c o o k ,5 】开始了统计模型的 诊断研究起,许多统计学家在这方面做了大量的研究如t h o m a s 和c o o k 9 l 等发展了局 部影响分析的方法,该方法可以应用于许多统计模型的诊断;f a n g k w a n 【j u 1 考虑了基 于正态曲率的局部影响问题;z h u l e e 【儿】、z h u ,e ta l 【上碉分别研究了基于不完全数据 的局部影响和数据删除诊断;f u n g ,e ta l 【堋、l e e x u 【上4 1 、e ,e ta l i 刎等又在不同的 领域对模型进行了诊断,提出了许多诊断统计量 基于经验似然的统计分析是近年统计学的热点研究课题o w e n 上b ,“,心】介绍并发展 了非参数问题的经验似然方法,提出了经验似然比统计量,并在此基础上对线性模型和广 义线性模型进行了深入的研究由于这种方法适用范围的广泛性和有效性,迅速得到了 许多研究者的推广和发展例如,q i n 【l 切研究了利用经验似然进行纠偏的问题;q i n l a w l e s s 【z u 】接着用经验似然方法来研究广义估计方程,得到了广义估计方程的参数估计 方法,并证明了参数估计的渐近性质;w a n g & j i n g 2 1 】用经验似然方法来研究部分线性 模型中似然比统计量的渐近性质并构造了参数的置信域 z h u ,e ta l 将经验似然和统计诊断方法相结合,提出了三种针对广义估计方程的诊 断方法,即数据删除方法,局部影响分析方法和伪残差方法对数据删除方法,z h u ,e ta l 3 】 引进了经验似然距离和经验c o o k 距离,并证明了它们的渐近一致性;对局部影响分析方 法,他们考虑了对经验似然函数的扰动,并给出了常用的影响度量;对伪残差方法,z h u ,e t a l 【卅介绍了标准化伪残差的计算方法,并给出了具体的诊断标准 1 3 本文工作 本文基于经验似然对部分线性模型的影响分析进行了系统的探讨,具体的安排如下: 在第二章中,我们为进行模型的影响分析做了必要的准备工作首先介绍经验似然与 估计方程,再用核估计方法得到了未知函数妒的估计式,然后基于经验似然比函数求得参 数p 的极大经验似然估计,并给出了具体的求解方法 东南大学硕士学位论文 第一章绪言4 在第三章中,我们对模型进行了数据删除和局部影响分析首先简单介绍了基于经验 似然的数据删除度量,然后介绍了基于经验似然的局部影响分析方法,将z h u ,e ta l 3 的 研究成果进一步推广至部分线性模型,对此模型进行统计诊断,并给出诊断统计量和具体 的计算公式 在第四章中,在前面分析的基础上,利用个实例和一个随机模拟的例子来说明诊断 方法的有效性 综上所述,本文提出了基于经验似然对参数卢的估计和对模型的影响分析,给出了一 系列诊断统计量数值实例和模拟计算说明我们的诊断统计量是有效的研究部分线性模 型时,本文介绍的方法具有相当的实用价值 第二章部分线性模型的参数估计 2 1引言 模型的参数估计一直是统计学研究的重点领域,不管是进行数据点的影响分析还是 局部影响分析,都必须以参数估计为前提最常用的估计方法有矩估计,最小二乘估计,极 大似然估计,以及稳健估计等,其中极大似然估计由于其良好的统计性质,因此被广泛用 于各种统计模型中对于来自未知分布的随机样本,其似然函数没有明确的表达式,因此 很难得到参数的极大似然估计,而极大经验似然估计恰好解决了这一问题,只要找到模型 的估计方程,就可以求解得到参数的极大经验似然估计 本章就是把极大经验似然估计方法用于部分线性模型,得到未知参数卢的极大经验 似然估计第二节介绍经验似然与估计方程第三节运用n a d a r a y a - w a t s o n 核估计给出未 知函数i p ( ) 的估计式,进而得到部分线性模型的估计方程第四节针对部分线性模型,给 出求解参数p 的极大经验似然估计的具体方法 2 2 经验似然与估计方程 不失一般性,假设x l ,z n 为来自未知分布f 的独立样本,口为p 1 维参数, 口= ( e l ,) t 不必假设分布f 的参数形式,我们仍然可以通过r ( p ) 维独立的估计 方程夕( z ,口) = ( g l ( z ,p ) ,缈( z ,p ) ) t 对口进行统计推断,其中估计方程满足: 研佃( 茁,岛) ) = 0 ,0 0 e ( 2 1 ) 其中上表示关于分布函数f 的数学期望,o o 为口的真值方程( 2 1 ) 通常称做估计方程 或矩条件方程( q i n l a w l e s s 2 0 ;o w e n 【1 8 】) 经验似然函数定义为( o w e n 【1 6 】;q i n l a w l e s s 2 0 1 ) : 其中p i = d f ( x i ) = p r ( x = 戤) 在条件( 2 1 ) 下,截面经验似然比函数定义为: nn几 l e ( o ) = s u p n p i p i o ,p i = 1 ,p t g ( z i ,口) = o ) ( 2 2 ) t = 1i = 1 i = 1 5 阢 n :i = z f d n 汹 = 、l t , f ,l l 东南大学硕士学位论文第二章部分线性模型的参数估计6 f 面用l a g r a n g e 乘子法求截面经验似然i l i 垂i 数l e ( o ) 的值首先令 h = l o g p i + a ( 1 一鼽) 一扎p i g ( x ,p ) , 其中入,t = ( t 1 ,0 ) t 为l a g r a n g e 乘子上式关于a 求导数并令其等于零可得: 芸:晏一t 一毗t g ( a驴o ,i 一2 n 五z i ,口j 2 u , 嘞鼽 。 由此可得:鼽筹= n a = o ,于是有a = n ,所以 鼽= ( 熹) 南, 仁3 , 由约束条件p i g ( :r i ,0 ) = 0 可得: 麦喜端1 t r g ( x ;0 = o 偿4 , n 鲁+,) 一 r 一7 由此可以看出t 即为( 2 4 ) 的根,所以当( 2 1 ) 式成立时,截面经验似然比函数l e ( 口) 取 得唯一值: l e ( o ) = i i ( i + t t 9 ( 戤,口) ) ( 2 5 ) 作为非参数方法,经验似然可用于对参数0 的统计推断( 例如,参数估计和假设检验) 参 数0 的极大经验似然估计可由极大化截面经验似然比函数l e ( o ) 得到,即: 歹= a r 以口,= a r 9 0 e m o a x ( 壹i - - - - 1k 舻) ) = a r 舯o e o a x ,因此我 们有如下的结论: g ;= 2 e l d i 1 + d p ( 1 ) ) = 2 e c d i 1 + d p ( 1 ) ) = 一2 n - 1 a 岛2 1 a 1 + o a l ) = 一2 n 。1 蹉1 t 1 + d p ( 1 ) , ( 3 1 1 ) 至此,我们得到了部分线性模型的影响度量,并且说明了数据删除和模型扰动对于影响分 析的效果是一致的,若某个c k 较大,则有理由认为第i 组数据点为强影响点在具体计 算统计量c k 时,需要计算研1 ,研2 ,岛2 ,通过若干计算,可得到针对部分线性模型它们的 近似计算公式: - - = a q 一= 去喜鼍譬 糕i p :序,t :壬; c 3 j 2 , & 1 25 q 1 ,住 = 去喜型堕警鬟筹塑幽b 越, &沈=和qz,n,=去喜堡垒笔芋;笔筹ip:序,t:乏, c 3 1 4 , 东南大学硕士学位论文第三章部分线性模型的影响分析1 4 其中,铂蚕( 戤,卢) = ( 一戤+ 妻( 啪哟) 毫 = 一i i 孟 3 5 部分线性模型的伪残差分析 残差是研究回归诊断最基本、最重要的统计量由于残差中包含了许多关于数据和 模型的信息,残差分析的目的就是通过对残差的统计分析提取这些信息,以便进一步了解 数据和模型的统计性质 在( 2 9 ) 式成立的条件下,每组观测数据的伪残差为: 巩= ( r 1 ,r ,r ) t = 夕( z t ,乃) , i = 1 ,n 显然诉( r ) _ o ,礼_ o o 进- - f ,z h u ,e ta l 【3 】3 研究了标准化伪残差,( 仃 ,砰) = d i a g e f ( g $ 2 ) 】,其估计量为( 2 ,群) ,标准化伪残差为: 啦科= ( 学,学厂 ( 3 1 5 ) 对估计量( 砰,群) ,有下面的近似公式: 毋执( z i ,否) 】一礼一研【岛鲰( z ;) t 嘧,岛。对夕( 兢) ) 一三t r 毋【劈鲰( 兢) ) 蹉。】; 孑2 v a r f 鲰( 戤) 】一2 n 一1 e f 夕七( z i ) 岛鲰( z i ) r s 爱1 岛1 s o g ( 鼢) ) 一n 一1 e - 岛9 七( 1 ) t s 爰1 岛9 ( z 1 ) , 这里,g ( z i ) = g ( z i ,0 0 ) ,鲰( 戤) = g k ( z i ,o o ) ,k = 1 ,r 若对某个j ,i r ji 较大( 比如j 域ji 3 ) ,则可以认为第i 组数据点为异常点 第四章模拟计算和实例分析 4 1引言 在前面几章中,我们针对部分线性模型进行了参数估计和局部影响分析,并且基于经 验似然给出了影响曲率统计量本章的主要工作是通过模拟计算和实际数据分析,进一步 说明诊断统计量的有效性本章分两节进行,第二节我们利用随机模拟来说明诊断统计量 的有效性,首先利用给定的参数来生成数据集,然后改变数据集中的点值,对改变后的数 据集进行局部影响分析,找出数据集中的强影响点第三节,我们利用口腔清洗数据来进 一步说明诊断方法的有效性,首先得到参数的估计值,进而得到影响度量值,从而得到数 据集的强影响点 4 2 模型随机模拟数据的影响分析 我们在模型随机分析中,我们选定妒) = t ,参数p = ( 1 ,4 ,7 ) t ,产生了n = 5 0 组数 据,并通过改变生成的数据,对改变后的数据进行影响分析 4 2 1 数据的产生 根据随机数生成数据集x ,y 的步骤如下: ( 1 ) 我们首先产生 岛,i = 1 ,5 0 ,它们均为取自于n ( 0 ,0 2 2 ) 上的随机数; ( 2 ) 然后产生x ,x 为3 5 0 的矩阵,其中的每一个元素都取自于n ( 0 ,1 ) 上的随机 数,得到了数据集x ; ( 3 ) 再产生 如,i = 1 ,5 0 ,岛均取自于均匀分布u ( o ,1 ) 上的随机数,得到了数据 集t ; ( 4 ) 最后产生 玑,i = 1 ,5 0 ,y i = x r ( 1 ,4 ,7 ) t + 磅+ 反,其中k 表示x 的第i 列元素,得到了数据集l , 为了对模拟数据进行影响分析,我们将得到的数据集y 中的第2 0 号点加2 0 ,第4 0 号点减2 0 ,对调整后的数据集同样用前面介绍的方法进行影响分析,找出强影响点 4 2 2 参数估计 我们在对调整后的数据集进行参数估计时,选定带宽k = 5 ( n l o g n ) 一,核函数七( z ) = 1 5 东南大学硕士学位论文第四章模拟计算和实例分析 1 6 嚣( 1 一护) 2 ,h 1 ,对于给定的歹( 1 j n ) ,对每个i ,先计算t ( & ) 的值,再计算 觋的值,最后计算参数p 的极大经验似然估计值我们在对调整后的数据进行一次模拟 后得到芦= ( 0 8 3 2 4 ,4 0 1 2 2 ,7 2 1 4 6 ) t ,同时,我们对模拟重复了1 0 0 次,得到p 的均值 为;芦= ( 1 0 0 1 1 ,4 0 4 8 2 ,6 9 9 9 0 ) t ,我们有理由认为前面得到的关于参数p 估计的计算方 法是正确的 4 2 3影响分析 我们在前面得到参数估计的基础上,进一步对调整后的数据进行影响分析我们要根 据( 3 1 2 ) 一( 3 1 4 ) 式算出相应的表达式的值,即得到& - ,& 2 ,岛2 的值,在计算e c 觑我 们在进行一次模拟后得到e c d i 的值用散点图表示为图1 ,从图中我们可以看出第2 0 号 点和第4 0 号点明显异于其它点,可以认为这两个点即为强影响点图3 为标准化伪残差 图,从图中我们可以看出第2 0 号点和第4 0 号点也明显异于其它点,进一步说明了这两个 点为强影响点 :壅堕奎:耋堡圭:兰堡垒窒:一:一:;:一:= 一:篁里塞堡丝墼塞塑壅堡坌堡= := = := = 1 7 图1 魄。的散点图 图2 标准化伪残差忍1 东南大学硕士学位论文 第四章模拟计算和实例分析 1 8 我们对上述的诊断继续重复进行了1 0 0 次,并且统计出了能够正确诊断出第2 0 号数 据点和第4 0 号数据点为强影响点的次数诊断出第2 0 号数据点为强影响点的次数为8 8 次,诊断出第4 0 号数据点为强影响点的次数为8 7 次其他不能判定强影响点的情况中, 第2 0 号和第4 0 号数据点所对应的诊断统计量一般都比较大,但是不很明显,无法认定为 强影响点在上述的模拟计算中,没有考虑窗宽的选择对于估计及诊断的影响,但是尝试 了几种不同的窗宽,它们对诊断的影响不大,诊断正确率都在8 0 左右 4 3 实例分析 口腔清洗数据分析 为了确定治疗常见牙床疾病的某种止痛药物的疗效,进行一组医疗实验,把3 0 个患 有不同程度牙床病的病人随机分成两组,控制组和实验组,每组1 5 人在实验前,首先测 定每个病人患病程度的指标s b i ;然后控制组仅用水冲洗口腔,实验组用药物清洗,实验 三周后,重新测定s b i ,具体数据集见下表( s p e c k m a n t i l ) 表4 1 的第一列和第四列表示 实验三周后指标s b i 的数值,第二列和第五列表示实验之前指标s b i 的数值,第三列和 第六列中翰为示性函数,墨= 1 表示实验组,戤= 0 表示控制组 4 3 1 参数估计 我们对数据集进行分析时,选择核函数k ( x ) = 鬃( 1 一z 2 ) 2 ,1 ,选定窗宽k = 0 3 8 ( s p e c k m a n 6 ) ,对于给定的歹( 1 j 3 0 ) ,对每个i ,计算“切( 岛) 的值,再计算毛的 值,最后计算参数p 的极大经验似然估计值 通过计算我们得到参数p 的估计值为p = 0 0 4 ,同时我们将( t ) 和( t ) + p 的图像 表示为图3 ( 实线曲线表示( t ) 的图像,虚线曲线表示( t ) + p 的图像) 从图3 我们可以 看到甄万+ ( t ) 对实验数据的拟合较好,说明了我们得到的参数估计及妒( 亡) 的估计较好 苎:童奎皇堡:圭兰垒垒奎墅墅坠塑墼堕墅型丝些i _ 一1 9 表4 1 口腔清洗数据 :奎堕盎堂堡:兰垒丝窒垒:;:;:量里塞墅墼塑墼墼墅墅墅坠:_ 2 0 i 罢 茜 睾 璺 雳 图3 拟合图 图4e c 觑的散点图 东南大学硕士学位论文第四章模拟计算和实例分析 2 1 4 3 2 影响分析 在前面得到参数估计的基础上,进一步对数据集进行影响分析我们根据( 3 1 2 ) 一( 3 1 4 ) 式算出相应的表达式的值,即得到1 ,最2 ,l ,岛2 的值,然后计算e c 皿我们用散点图 将统计量e c 皿表示为图4 从图4 中我们很容易看出第1 5 号数据点的统计量的值明 显异于其他点,因此,我们有理由认为第1 5 号点为强影响点,这与朱仲义、韦博成【弱】的 分析结果是一致的,进一步说明了诊断统计量的有效性 总结 本文比较深入系统地对部分线性模型进行了探讨,基于经验似然研究了部分线性模 型的参数估计和影响分析,将z h u ,e ta l l 3 的结果推广至部分线性模型,针对部分线性模 型提出了一些有效的诊断统计量,并说明了它们诊断效果的一致性模拟计算和实例分析 表明这些诊断统计量是很有效的,能够较为准确地对数据进行分析,较准确地识别强影响 点 致谢 在论文按时按质按量完成之际,我要特别感谢我的两位导师林金官老师和徐亮老师 悉,t - 指导和鼓励从本文的选题、文献的收集到论文的写作以及最终定稿,无不倾注着两 位导师的,l - 血和汗水我要特别感谢徐亮老师在论文选题以及论文修改的过程中给与我 的大量的支持和鼓励 除了两位导师外,我也衷心地感谢著名的统计学家韦博成教授! 这两年多来,韦老师 渊博的的知识,严谨的治学态度,坦荡的胸襟和平易近人的性格是我耳濡目染,受益终生 在此,向韦老师致以崇高的敬意和诚挚的谢意! 感谢李立宁、李玲这两年多来对我的关心和帮助! 和他们在一起的那些美好的时光 以及他们对我的关爱,都将使我终生难忘 2 3 参考文献 【1 】1 韦博成,鲁国斌,史建清统计诊断引论,1 9 9 1 ,东南大学出版社 2 】韦博成,林金官,谢锋昌统计诊断,2 0 0 9 ,高等教育出版社 【3 】z h u ,h t ,i b r a h i m ,j g ,t a n g ,n s ,e ta 1 d i a g n o s t i cm e a s u r e sf o re m p i r i c a ll i k e l i h o o d o fg e n e r a l i z e de s t i m a t i n ge q u a t i o n s b i o m e t r i k a ,2 0 0 8 ,9 9 :4 8 9 - 5 0 7 【4 】e n g l e ,r ,g r a n g e r ,c ,r i c e ,j ,w e i s s ,a n o n p a r a m e t r i c se s t i m a t e so ft h er e l a t i o n s h i p b e t w e e nw e a t h e ra n de l e c t r i c i t ys a l e s j a i n e r s t a t i s t a s s o c ,1 9 8 6 ,8 1 :3 1 0 - 3 2 0 5 】r o b i n s o n ,p m r o o tn - c o n s i s t e n ts e m i p a r a m e t r i cr e g r e s s i o n e c o n o m e t r i e a , 1 9 8 8 ,5 6 : 9 3 1 9 5 4 【6 】s p e c k m a n ,p k e r n e ls m o o t h i n g i np a r t i a ll i n e a rm o d e l s j r o y s t a t i s t s o c s e r b ,1 9 8 8 , 5 0 :4 1 3 - 4 3 6 【7 】c o o k ,r d d e t e c t i o no fi n f l u e n t i a lo b s e r v a t i o n si nl i n e a rr e g r e s s i o n t e c h n o m e t r i c s ,1 9 7 7 , 1 9 :1 5 1 8 【8 】c o o k ,r d a s s e s s m e n to fl o c a li n f l u e n c ew i t hd i s c u s s i o n j r o y s t a t i s t s o c s e r b , 1 9 8 6 ,4 8 :1 3 3 - 1 6 9 【9 】t h o r n sw ,c o o kr d a s s e e s s i n gi n f l u e n c eo nr e g r e s s i o nc o e f f i c i e n t si ng e n e r a l i z e dl i n e a r m o d e l s b i o m e t r i k a ,1 9 8 9 ,7 6 :7 4 1 - 7 4 9 【l o f t m g ,w k k w a n ,c w an o t eo n l o c a li n f l u e n c eb a s e do nn o r m a lc u r v a t u r e j r o y s t a t i s t s o c s e r b ,1 9 9 7 ,5 9 :8 3 9 - 8 4 3 【11 z h u ,h t ,l e e ,s y l o c a li n f l u e n c ef o ri n c o m p l e t ed a t am o d e l s j r o y s t a t i s t ,s o c s e

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论