广义线性模型与汽车保险费率厘定.doc_第1页
广义线性模型与汽车保险费率厘定.doc_第2页
广义线性模型与汽车保险费率厘定.doc_第3页
广义线性模型与汽车保险费率厘定.doc_第4页
广义线性模型与汽车保险费率厘定.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非寿险精算 精算通讯第六卷第一期广义线性模型与汽车保险费率厘定胡三明西南财经大学保险学院【摘 要】本文回顾了汽车保险费率厘定模型的发展历程,并对广义线性模型从建模、统计分析、模型的选择与诊断等方面进行了比较系统的介绍,最后通过一个汽车保险的实例来介绍其在分类费率厘定过程中具体运用,具有较强的实践意义。【关键词】广义线性模型 分类费率厘定- 33 -一、导论对于传统费率厘定模型,精算师过于依赖简单的单因素分析法和双因素分析法,其中,单因素分析常受到费率因子间相关性的影响而被扭曲,同时也没有考虑到因子间独立性的影响。对此,精算师在六十年代探索出了迭代模型最小偏差法,使其得到重大的改进,但仍然没有形成完整的统计框架。最小偏差法试图通过迭代的方法来求出一系列方程的最优解,但它无法测试一个特定的变量的影响效果,同时也不能提供可靠的参数估计范围。广义线性模型(GLM)是传统线性模型以及许多最常见的最小偏差法的延伸,从技术角度看,比标准的迭代模型更有效率,它提供的统计诊断功能,有助于挑选重要的变量并且确认模型的假设条件。如今,广义线性模型在欧盟和许多其他市场,被公认为是对私家车和其他私人业务以及小额的团体业务进行定价的行业标准模型。广义线性模型的个别特例很早就已出现,早在1919年就曾被Fisher使用过,二十世纪四五十年代,Berkson,Dyke和Patterson等人使用过最著名的Logistic模型,1972年Nelder和Wedderburn在一篇论文中率先使用广义线性模型一词,此后相关研究工作逐渐增加,1983年McCullagh和Nelder出版了系统的论著,并于1989年再版。二、广义线性模型(一)、线性模型一个传统的线性模型具有如下形式:i其中是响应变量的第i次观测,是协变量,表示第 i 次观测数据,未知系数向量通过对数据的最小二乘拟合估计出来。假定i是均值为零,方差为常数的独立正态随机变量。对于一般的线性回归模型(LM)i可以分解为三个要素:LM1:随机要素,即Y服从正态分布,;LM2:系统要素,;LM3:连接要素,;(二)、广义线性模型尽管传统的线性模型广泛地应用于统计数据分析中,但它却不适合处理如下几类问题:(1) 将数据分布假设为正态分布并不合理;(2) 当数据的均值被限制在一定的范围内时,传统的线性模型就不适用了,因为线性预测值可以取任意值;(3) 假定数据的方差对于所有观测都是一个常数并不现实。广义线性模型扩展了传统的线性模型,因此它适用于更广范围的数据分析问题。一个广义线性模型包括以下组成部分:GLM1:随机要素,Y服从比正态分布更一般的分布,即指数族分布; GLM2:系统要素同LM2,即保持线性结构;GLM3:连接要素,其中g为严格单调可微的函数,称为连接函数。GLM的通常表述如下:其中:响应变量向量;:连接函数;:自变量矩阵;:待估计的参数向量;:干扰项向量;:方差函数的散布参数;:方差函数;:信度或权重;、和依赖于对已知数据的处理,和则根据事先设定的模型得出,而或为已知,或为估计值。1、指数族分布设Y为随机变量,若其密度函数为:其中a( )、b( )、c( )为已知函数,称为典型参数,称为散度参数。由Y的对数似然可以计算得:Y的方差是的二阶导数与的积,只依赖于典型参数,因而只依赖于,所以,一般记的二阶导数为,并称为方差函数。此外,一般取,称为权数。对于一个指数族分布,当确定后其分布形式即确定了,所以只要方差函数V确定了,对应的指数族的形式(如果存在)也就确定了。常见的几种分布都属于指数族,如下所示:表一、常见指数族分布参数表分布形式参数Normal1Poisson1GammaBinomialInverse Gaussian2、连接函数连接函数是用来描述系统要素与随机要素期望值之间关系的函数形式。作为连接函数必须严格单调且充分光滑,即有足够阶数的导数。(由于:)当时,上式可以简化为我们称之为自然连接函数,其最重要的优点在于它使广义线性模型下统计推断的大样本理论变得更易于处理。当然,实际处理过程中,连接函数的选取主要取决于问题本身。3、参数估计设, 独立同分布,服从指数族分布:则(,)的对数似然函数为: 由于:则:4、假设检验同一般回归分析一样,广义线性模型的选择以及解释变量的显著性检验问题都可化为线性假设检验:原假设 备择假设 ,其中为P维, C为已知的rp行满秩常数矩阵。 (1)、Wald检验检验统计量为:这里,为的极大似然估计,为的估计。当原假设成立时,即,带入,得:于是,因此,当时,拒绝原假设。(2)、约束检验以记为原假设约束条件下的MLE(极大似然估计)。构建统计量:当大于某个常数时,拒绝原假设。此检验的直观背景如下:因为,若原假设成立,则和均为的估计,理应比较接近,因此,这时取很小的值。反之,取较大的值。可以证明,当原假设成立,且满足一定的条件时,有:,因此,上文所提及的常数可取, 为给定的置信水平。(3)、拟似然比检验以记为对数似然函数,则和分别为的不受任何约束的MLE以及受到原假设约束的MLE。检验统计量为:因为为的最大值,总有0。若原假设成立,则和均为的相合估计,理应比较接近,倾向于小;反之,倾向于大。可以证明,当原假设成立,有:因此,上文所提及的常数可取为检验的否定域。 为给定的置信水平。三、应用探讨1、数据情况说明下表是某保险公司汽车保险的历史理赔资料 数据来源于广义线性模型于保费点数计价系统,统计研究,2002年第6期,毛泽春、刘锦萼,从表中我们不难看出,影响该公司汽车保险费用的因素主要有三类,分别是:被保险人的年龄、车型和车龄。其中被保险人的年龄又细分为1720、2124、2529、3034、3539、4049、5059和60八类;车型具体可分为A、B、C和D四种;车龄同样也分为03、47、89和10四个类别。2、模型选择我们运用SAS的Genmod程序对上述数据构建广义线性模型,分别用正态(Normal)分布、伽码(Gamma)分布和逆高斯(Inverse Gaussian)分布,连接函数均为对数连接(LOG)。不同分布下的拟合优度比较详见下表:表三、不同分布的拟合优度比较自由度总离差平均离差对数似然伽码分布10915.880.15-701.01正态分布114912033.228000.29-749.39逆高斯分布1090.240.00-766.65从上表我们可以看出,正态分布的总离差最大(拟合优度较差),而逆高斯分布的总离差最小(拟合优度较好),伽码分布居中,但是伽码分布的对数似然值却最大(为701.01),因此,仅仅从总离差的角度就可以拒绝正态分布。对于各个参数的显著性检验,我们则通过SAS软件的Genmod程序的type1检验得出。表四表六分别列出了伽码分布、正态分布和逆高斯分布的tpye1分析结果,其中,伽码分布和正态分布中,所有的参数均能通过显著性检验,但是在逆高斯分布中参数车型未能通过显著性检验(统计量为7.79,P值为0.0507),因而,逆高斯分布也被拒绝。综合上述的总离差分析,选择伽码分布作为最终的拟合分布。表四、伽码分布TYPE1分析2倍对数似然自由度Chisquare值P值年龄-1487.9567车型-1465.9255322.03.0001车龄-1402.0105363.92.0001 表五、正态分布TYPE1分析2倍对数似然自由度Chisquare值P值年龄-1592.4905车型-1579.5307312.960.0047车龄-1498.7876380.74.0001表六、逆高斯分布TYPE1分析2倍对数似然自由度Chisquare值P值年龄-1568.0007车型-1560.215237.790.0507车龄-1533.2995326.92.00013、参数估计根据前文的分析,建立广义线性模型,由于选择的连接函数为对数连接(LOG),因此,程序计算出的参数估计值为取对数后的数值,我们通过求取对数函数的反函数即可计算出实际的参数估计值,从下表我们还可以看出,所有的参数均能通过置信水平为1的显著性检验。说明选择的模型能较好的拟和该公司的历史数据,并能据此厘定车险费率。四、总结与其他模型相比,广义线性模型主要应用于不满足正态数据的回归分析。对保险行业而言,该模型既保留了传统正态线性回归的优点,又使得损失分布的建模变得更为简单。因此,广义线性模型在保险中的运用不仅仅局限于汽车保险费率的厘定上,其在非寿险业务准备金,寿险的风险分类以及健康保险中的多状态模型等方面均有广泛的运用。参考文献:1 Brockman, M.J, Wright, T.S., Statistical Motor Rating: Making Effective Use of Your Data, Journal of Institute of Actuaries 119, Vol. III, pages: 457-543, 1992.2 Conning, Insurance Scoring in Private Passenger Automobile Insurance Breaking the Silence, Conning Report (2001).3 Hardin, James, Hilbe, Joseph, Generalized Linear Models and Extensions, Stata Press,20014 McCullagh, J. A. Nelder, Generalized Linear Models, 2nd Ed., Chapman & Hall/CRC, 1989.5 Mildenhall, Stephen, A systematic relationship between minimum bias and generalized lin

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论