已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 进入2 1 世纪以来,我国的保险市场有了迅猛的发展,保费收入连年提升。 这其中,财产险的保费增长幅度又高于整体保费的增长幅度。这凸显了作为财 产险中占比最大的机动车辆保险的重要地位。 与我国车险市场的发展形成鲜明对比的是,我国机动车辆保险费率厘定的 精算技术发展却十分缓慢。目前,我国的一些财产保险公司采用的机动车辆保 险的费率厘定方法,与国外同行业相比,显得十分滞后。风险分类费率厘定方 法是目前国际上常用的车险费率厘定的方法,而基于广义线性模型的费率厘定 方法又显示出了比其他的方法更为优越的特点,为大多数国家所采用。 本文在阐述了各种风险分类的费率厘定方法的基础上,研究了广义线性模 型进行机动车辆保险费率厘定中应用的方法,讨论了应用广义线性模型进行车 险费率厘定的优越性。并结合我国某财产保险公司的实际数据进行了实证分析, 对应用广义线性模型的费率厘定方法和传统的费率厘定方法进行比较,得出了 广义线性模型更适合于我国车险费率厘定的结论。同时对在我国具体实施这种 定价方法,要求车险市场需要进行完善和改进的地方,提出了一些建议。 关键词:机动车辆保险风险分类费率厘定广义线性模型 a b s t r a c t a b s t r a c t s i n c ee n t e r i n gt h e21s tc e n t u r y , c h i n a si n s u r a n c em a r k e th a sb e e nt h er a p i d d e v e l o p m e n ta n dt h ep r e m i u mi n c o m ei si n c r e a s i n gy e a ra f t e ry e a r a n dt h eg r o w t h r a t eo fp r o p e r t yi n s u r a n c ep r e m i u mi s h i g h e rt h a nt h eo v e r a l lp r e m i u m s t h i s h i g h l i g h t st h em o s ti m p o r t a n ts t a t u so fa u t o m o b i l ei n s u r a n c ew h i c hh a sal a r g e p r o p o r t i o no fp r o p e r t yi n s u r a n c e i ns h a r pc o n t r a s tw i t ht h ed e v e l o p m e n to fc h i n a sa u t oi n s u r a n c em a r k e t , h o w e v e r , t h ea c t u a r i a lt e c h n i q u eo fr a t em a k i n gi na u t oi n s u r a n c eh a sb e e nas l o w d e v e l o p m e n t n o w a d a y s ,s o m em e t h o d su s i n gb yo u rp r o p e r t yi n s u r a n c ec o m p a n i e s , c o m p a r e dt ot h es a m et r a d ew i t hf o r e i g nc o u n t r i e s ,i sl a g g i n gb e h i n d r a t em a k i n g m e t h o df o rt h er i s kc l a s s i f i c a t i o ni sc o m m o n l yu s e di n t e r n a t i o n a lm e t h o d o l o g yi n a u t oi n s u r a n c e ,a n dt h er a t em a k i n gm e t h o db a s e do nt h eg e n e r a l i z e dl i n e a rm o d e l s , u s i n gi nm o s tc o u n t r i e s ,s h o w sm o r es u p e r i o rc h a r a c t e r i s t i c st h a nt h eo t h e rm e t h o d s i nt h i sp a p e r , a f t e ri n t r o d u c i n gav a r i e t yo fr i s kc l a s s i f i c a t i o nm e t h o d sf o rr a t e m a k i n g ,a u t h o rr e s e a r c ht h ea p p l i c a t i o no fg e n e r a l i z e dl i n e a rm o d e l sf o rr a t em a k i n g i nm o t o rv e h i c l ei n s u r a n c e ,a n dd i s c u s si t ss u p e r i o r i t y w i t hap r o p e r t yi n s u r a n c e c o m p a n y sd a t ai no u rc o u n t r y , a u t h o rm a k e sa ne m p i r i c a la n a l y s i s c o m p a r i n gw i l t r a d i t i o n a lm e t h o d su s i n go nr a t em a k i n g ,a u t h o rd r a wt h ec o n c l u s i o nt h a tm e t h o d u s i n gt h eg e n e r a l i z e dl i n e a rm o d e l si sm o r es u i t a b l ef o rt h e r a t em a k i n gi no u r c o u n t r y sa u t oi n s u r a n c e a tt h es a m et i m e ,a u t h o rg i v e ss o m es u g g e s t i o n sa b o u th o w t op e r f e c ta n di m p r o v et h ea u t oi n s u r a n c em a r k e t ,i no r d e rt ou s i n gt h i sp r i c i n g m e t h o d k e yw o r d s :a u t o m o b i l ei n s u r a n c e c l a s s i f i c a t i o n r a t em a k i n gg l m s i i 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提供 本学位论文全文或者部分的阅览服务;学校有权按有关规定向国家有 关部门或者机构送交论文的复印件和电子版;在不以赢利为目的的前 提下,学校可以适当复制论文的部分或全部内容用于学术活动。 学位论文作者签名:结撂悴 2 口、,年么月,日 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进行 研究工作所取得的成果。除文中已经注明引用的内容外,本学位论文 的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的 作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集 体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任 由本人承担。 学位论文作者签名:一一彩李穆哗 z 汐口歹年6 月口e l 南开大学学位论文电子版授权使用协议 ( 请将此协议书装订于论文首页) 论文 系本人在 南开大学工作和学习期问创作完成的作品,并已通过论文答辩。 本人系本作品的唯一作者( 第一作者) ,即著作权人。现本人同意将本作品收 录于“南开大学博硕士学位论文全文数据库”。本人承诺:已提交的学位论文电子 版与印刷版论文的内容一致,如因不同而引起学术声誉上的损失由本人自负。 本人完全了解直五太堂图盘缠羞王堡在:焦厦堂焦途塞的筻堡查洼! 同意 南开大学图书馆在下述范围内免费使用本人作品的电子版: 本作品呈交当年,在校园网上提供论文目录检索、文摘浏览以及论文全文部分 浏览服务( 论文前1 6 页) 。公开级学位论文全文电子版于提交1 年后,在校园网上允 许读者浏览并下载全文。 注:本协议书对于“非公开学位论文 在保密期限过后同样适用。 院系所名称: 作者签名: 学号: 日期:年月日 第一章引言 第一章引言 第一节选题背景及意义 目前我国的保险市场呈现出一派勃勃生机。统计显示,2 0 0 7 年我国财产险 保费收入2 0 8 6 5 亿元,同比增长3 2 3 。其中,车机动车辆保险保费收入为1 4 8 4 3 亿元人,同比增长3 4 o ,占整个财产险市场保费收入的7 1 1 ,所占比例比去 年上升了0 9 个百分点,贡献率达到了7 3 9 。2 0 0 8 年我国财产险保费收入2 3 3 6 7 亿元,同比增长1 7 。保监会统计显示,1 月至8 月,机动车辆保险保费收入为 1 1 8 4 1 9 亿元,同比增长1 6 6 3 ,占财产险公司业务的比重为6 8 5 8 l 。 可见在非寿险市场中,作为主力的机动车辆保险,更是随着我国经济的发 展,表现出了良好的增长势头。然而,与非寿险市场的飞速发展不协调的是, 对保险产品的费率厘定所采取的精算方法却没有很大的发展。 百分比 2 0 0 0 年2 0 0 1 年2 0 0 2 年2 0 0 3 年2 0 0 4 年2 0 0 5 年2 0 0 6 年2 0 0 7 年 图1 12 0 0 0 2 0 0 7 年保费收入和增幅对比图 5 0 0 0 4 5 0 0 4 0 o o 3 5 0 0 3 0 0 0 2 5 0 0 2 0 o o 1 5 o o 1 0 0 0 5 0 0 0 。o o 打 o 0 砌 为 柏 ; 加 们 第一章引言 亿元 百分比 2 0 0 0 4 - 2 0 0 1 年0 0 0 2 q i2 0 0 3 f2 0 0 4 年2 0 0 5 年2 0 0 6 年2 0 0 7 年 图122 0 0 0 2 0 g 7 财产保险公司保费收 和增幅对比图 “浆警“、n t 销一 信m 探险,3 4 一一”1 8 ;捻”2 幽i32 0 0 7 年财产保险保费收入结构图 目前在非寿险产品的费率厘定上,通常使用的分类费率厘定方法有:单项 分析法、最小偏差法和传统的线性回归模型的方法。然而,这些方法虽然在非 寿险产品费率厘定中仍然被广泛使用,但是由于保险数据的特殊性,加之这些 传统费率厘定方法在统计学上并不是很精密他们自身存在的一些缺陷正在逐 狮 姗 彻 伽 毳耋 。 第一章引言 渐被人们所重视。l 2 j 随着人们对这些方法存在的问题的深入研究,各种改进的方法也都相继出 现。在这其中,广义线性模型的使用,受到了越来越多的关注。广义线性模型 为费率厘定提供了一个完整的统计学框架,允许对保险数据的性质和其与预测 变量的关系进行精确的假设。这不仅在理论上更加精确而且在实际中更有价值。 而且,前面提到的传统的线性模型以及许多的最小偏差过程,实际上,都是广 义线性模型的特殊形式。 本文的主要目的,一方面是对广义线性模型进行一个简要、系统的介绍, 并和传统的风险分类的费率厘定方法相比较,让读者对广义线性模型的在车险 定价中的优势有所了解。另一方面,通过运用广义线性模型,利用我国保险市 场上一家财产保险公司的车险数据,对其进行相关车险的费率厘定,来检验广 义线性模型是否更具有优越性。 第二节文献综述 广义线性模型的个别例子起源很早:f i s h e r 对它的使用可以追溯到1 9 1 9 年; 最重要的l o g i s t i c 模型,在2 0 世纪四五十年代也曾由b e r k s o n 、d y k e 和p a t e r s o n 等人使用过。但是广义线性模型在保险精算中的真正系统性的应用是在2 0 世纪 8 0 年代早期。1 9 7 2 年n e l d e r 和w e d d e r b u m 在一篇论文中引进了广义线性模型 的概念,从此之后研究工作逐渐增加。19 8 3 年m c c u l l a g h 和n e l d e r 出版了系统 论述此专题的专著( ( g e n e r a l i z e dl i n e a rm o d e l s ) ) ,并于1 9 8 9 年再版 3 】o 在书中他 们给出了许多例子来介绍如何确定广义线性模型用于不同类型的数据。在这之 后相关方向的研究论文数以千计,如雨后春笋般层出不穷。 直到今天,在欧盟和许多其它国家的市场上,广义线性模型作为用于私人 汽车保险和其它私人财产保险以及小型商业保险产品定价的标准方法,得到了 广泛的认可。英国、爱尔兰和法国的很多汽车保险人用广义线性模型来分析他 们的产品组合,而且在意大利、荷兰、斯堪的纳维亚、西班牙、葡萄牙、比利 时、瑞典、南非、以色列和澳大利亚,广义线性模型都得到了普遍的应用。这 种方法在加拿大、日本、韩国、巴西、新加坡、马来西亚和东欧的一些国家也 十分的流行【4 j 。 关于广义线性模型的文章,一般分成两大类,即理论研究和实证检验。相 3 第一章引言 关讨论如下。 1 2 1 理论研究 m c c u l l a g h 和n e l d e r ( 1 9 8 3 ,1 9 8 9 ) 第一次系统的提出了广义线性模型的概 念,他们在专著中给出了广义线性模型的基本形式和相关的解决方法。并且在 书中给出了大量的例子,来说明广义线性模型如何应用于现实中的情况【5 】。 s t e v e nh a b e r m a n 和a r t h u re r e n s h a w ( 19 9 6 ) 在( ( g e n e r a l i z e dl i n e a rm o d e l s a n da c t u a r i a ls c i e n c e ) ) 中,回顾了广义线性模型近年来精算问题中的应用。他们 在文章指出,广义线性模型在寿险和非寿险的精算中运用越来越成功,而且应 用的领域也越来越宽广。文章中就寿险和非寿险中的死亡率、多状态模型、失 效、保险费率厘定和准备金等问题,如何利用广义线性模型来建模求解,给出 了具体的形式【6 j 。 d a v i dr c l a r k 和c h a r l e sa t h a y e r ( 2 0 0 4 ) 在ap r i m e ro nt h ee x p o n e n t i a l f a m i l yo fd i s t r i b u t i o n ) ) 中,对广义线性模型分析中要求的指数分布组进行了系 统的介绍,并重点介绍了适用于财产险总损失模型的方差结构。为广义线性模 型模型的使用者在进行模型分布的假设时,提供了便捷的参考【7 1 。 d u n c a na n d e r s o n 和s h o l o mf e l d b l u m 等人( 2 0 0 7 ) 在c a s 的学习手册a p r a c t i t i o n e r 。sg u i d et og e n e r a l i z e dl i n e a rm o d e l s ) ) 中,分三个部分向使用者介绍 了什么是广义线性模型以及如何用它来进行保险数据的分析。这三个部分分别 阐述了广义模型相关的统计理论,建立模型的各个步骤( 数据准备和前期分析、 模型选择和重复、模型完善以及模型预测) ,和与广义线性模型相关的其他问题。 近年来,国内对广义线性模型的研究也逐渐增多。 张尧庭( 1 9 9 5 ) 在线性模型与广义线性模型中,介绍了线性模型与广 义线性模型的实际统计背景以及处理这类问题的统计思想。文章中还分析了广 义线性模型中关键的一环联系函数的不同形式和特点以及各自的适用情况 【8 】 o 陈希孺( 2 0 0 2 ) 在数理统计与管理上,分十次连续发表了广义线性 模型,对这个题目进行了比较系统的介绍。文章分为建模、统计分析和模型选 择与诊断三个部分。鉴于此领域之前的专著一般都不涉及严格的数学推导,作 者在建模过程及统计方法的导出等方面,给出了较严格的数学证明。 4 第一章引言 卢志义和刘乐平( 2 0 0 7 ) 在广义线性模型在非寿险精算中的应用及其研 究进展中,对广义线性模型在非寿险精算中的应用及其研究进展进行了分析 和总结,并重点分析了费率厘定和准备金评估中广义线性模型的建模思想。同 时,文章还提出一些广义线性模型在非寿险精算的应用中所面临的问题和需要 进一步研究的课题一j 。 孟生旺( 2 0 0 7 ) 则在非寿险分类费率模型及其参数估计中,将非寿险 分类费率厘定中使用的传统模型和广义线性模型,以及参数估计的方法进行了 系统的比较,并揭示了它们之间存在的一些等价关系。文章通过比较指出,广 义线性模型的估计结果在很大程度上取决于损失分布假设的合理性,因此选择 合适的分布假设至关重要。也就是说,在选择精算模型和相应的参数估计方法 时,对实际问题的准确理解尤为重要【l u j 。 1 2 2 实证检验 r o o s e v e s tc m o s l e yj r 在( ( e s t i m a t i n gc l a i ms e t t l e m e n tv a l u e su s i n gg l m ) ) 中论述了广义线性模型在非寿险中的非传统方面的应用,包括生成车辆分类系 统,评估已决赔案值等方面。文章利用i n s u r a n c er e s e a r c hc o u n c i l ( i r c ) 中已结 案赔款的数据验证了广义线性模型是如何被用来识别索赔额的趋势、存在于现 有的费率厘定因子和其他因子之间的索赔额的区别以及这些因子之间的相互影 响。文章在分析的过程中,还重点介绍了在建模之前如何选取解释因子,提出 了三种方法,并进行了优劣的比较【l 。 毛泽春和吕立新( 2 0 0 5 ) 在用双广义线性模型预测非寿险未决赔款准备 金中,应用瑞士汽车保险的赔付次数和平均赔付额数据,检验了双广义线性 模型计算未决赔款准备金的计算过程及预测效果 12 1 。所得到的结果,比之前 m a r i o ( 2 0 0 3 ) 在文献中所使用的各种方法的计算效果都要好【l 引。 孟生旺( 2 0 0 8 ) 在汽车第三者责任保险的索赔频率模型中,结合马来 西亚和中国汽车第三者责任保险的实际数据,应用广义线性模型对汽车第三者 责任保险的索赔频率进行研究。研究结果表明,汽车第三者责任保险的索赔次 数存在过离散特征,混合泊松回归模型的预测效果优于常用的泊松回归模型【1 4 1 。 曾理斌在广义线性模型在非寿险费率厘定中的运用中,通过某保险公 司历史索赔数据,使用广义线性模型,对正态、伽马、逆正态三种分布假设下 5 第一章引言 的拟合优度、离差进行的比较分析,得出了最为适合所选案例的经验损失数据 的分布特征【l 引。 张茵( 2 0 0 7 ) 在硕士论文对加入从人因素的我国车险费率厘定的研究 中,利用广义线性模型,结合国内某保险公司2 0 0 4 年机动车辆保险中非运营车 辆的简单历史理赔资料,分析了从人因素对车险费率厘定的影响,从量化的角 度讨论了从人因素在机动车辆保险费率厘定中的重要性【l6 1 。 第三节论文结构安排 论文共包括五章。 第一章是引言,内容包括选题的背景和意义、文献综述、论文结构安排和 创新及不足。 第二章是关于传统的风险分类费率厘定方法的介绍,这其中包括单项分析 法、最小偏差法和多元线性回归模型。这一章简要介绍了传统方法的基本思想、 所存在的缺陷。同时还指出了最小偏差过程和传统的多元线性回归模型与广义 线性模型之间的联系。 第三章阐明了在理论上介绍了广义线性模型。其中,对广义线性模型的三 条假设:随机成分、系统成分和联系函数中,与传统的线性模型的有所区别的 随机成分和联系函数,进行了重点的介绍。并对利用广义线性模型建模的一些 注意事项以及建模步骤进行了简要介绍。 第四章是本篇的重点,从实际的统计数据出发,运用广义线性模型,分别 对出险次数和案均赔款进行估计,并得出相应的风险分类费率表。然后通过与 传统费率厘定方法的比较,来检验应用广义线性模型进行车险费率厘定是否存 在着优越性。 第五章是本文的结论。综合前文的研究,指出在目前我国车险定价中应用 广义线性模型所具有的优势,以及需要进一步解决的问题。 第四节研究的创新与不足 广义线性模型是当今非寿险精算中比较流行的话题,它在费率厘定、准备 金评估等方面都显示出了优于传统方法的特性。但是国内对于广义线性模型的 6 第一章引言 研究,更多的还只是停留在理论层面,对于其在实际中的应用并不多见。本文 正是希望通过将广义线性模型应用于实际的车险费率厘定,来展现其理论结构 的优越性和实际操作的可行性,为广义线性模型在我国保险精算中早日投入实 际应用做出一份贡献。 当然,本文也存在着一些不足的地方。首先,鉴于我国保险市场上的客观 实际情况,本文在实证分析中只考虑了从车因素,并没有考虑从人因素。这势 必会影响到费率厘定结果的准确程度。其次,数据来源于一家公司,可能存在 一些相关性,不能真实反映整体车险市场的真实情况。 7 第二章传统的风险分类率厘定方法 第二章传统的风险分类费率厘定方法 第一节单项分析法 单项分析法利用单独的费率因子分别来确定该因子对保险产品价格的影 响。在过去,保险业者严重依赖单项分析法来进行定价和行为监管。单项分析 法为每一个解释变量的每一个值总结了像频率或者损失率这样的保险统计数 据,但是并没有考虑其它变量的影响。在单项分析法中,解释变量可以是离散 的或者是连续的。离散变量通常称作“因子”( f a c t o r s ) ,每个因子能够取到的值 称作“等级”( 1 e v e l s ) ,连续变量通常被称作“变量”( v a r i a t e s ) 。在保险模型中, 变量的使用通常是不多见的。 但是,单项分析发可能会被费率因子的相关性所影响。例如,年轻的驾驶 员通常来说可能会驾驶车龄长一些的车。一个对车龄的单项分析也许会显示车 龄长的车有较高的索赔经验数据,然而这种结果可能主要是由于这种老车一般 来说更多的是由高风险的年轻驾驶员驾驶的原因导致的【1 7 】。因此,基于车龄和 驾驶员年龄的单项分析的相关性,将会在分析驾驶员年龄的影响时被重复计算。 用于解决这种问题的传统精算技术,倾向于通过移除有差异的业务混合造成的 被歪曲的影响来将数据标准化,例如只关注一个单项基础上的损失率,抑或标 准化一个或是更多因子的影响。然而,这些方法仅仅是一种近似。 此外,单项分析法还没有考虑因子间的关联性对索赔经验数据的影响。这 些关联性或者交互作用当一个因子的变化依赖于另一个因子的等级的时候,就 会存在。例如,男女驾驶员的保险成本差异通常随着驾驶员年龄的变化而变化, 说明驾驶员的性别和年龄之间存在关联性。但是单项分析法不能够区分关联性 所带来的影响,而是简单地认为男女驾驶员的保险成本差异与年龄无关。 与之相比,像广义线性模型这样的多元方法适应了相关性并允许研究交互 作用的影响。 8 第二章传统的风险分类率厘定方法 第二节最小偏差法 2 0 世纪6 0 年代,精算师们发展了一种称作最小偏差过程的费率厘定技术。 这种方法通过一个方程组,把观测数据、费率变化和一组待定的参数联系在了 一起。然后通过迭代的方法来求得这个方程组的最优解。【l 驯 较之单项分析法,最小偏差法已经有了很大的进步。但是,最优解一旦被 计算出来,最小偏差过程却不能给出一个系统的方法来检验是否一个特定费率 因子产生了统计意义上的显著影响,也没有提供参数估计的置信区间。因此, 最小偏差过程缺少一个可以使得精算师们评估他们建模工作更好质量的统计分 析框架结构。【l 刿 第三节线性模型 线性模型在非寿险分类费率的厘定中有很广泛的应用,同时,广义线性模 型也是线性模型的推广模式。因此,在这里详细介绍一下传统的线性模型对于 我们了解之后的广义线性模型的结构是也是很有帮助的。 2 3 1 一元线性模型 线性模型和广义线性模型的作用都是表达被观察的响应变量y 和一组协变 量( 也叫做预测变量) x 之间的关系。所有模型视观察值z 为随机变量y 的实 现。线性模型定义y 为它的均值和随机变量占的和: y = + s 相关假设如下: 1 、y 的方差可以被写成协变量x 的一个线性组合,即 t = 屈五 其中,屈是预测变量置的参数 2 、误差项s 服从均值为0 ,方差为盯2 的正态分布 9 ( 2 1 ) ( 2 2 ) 第二章传统的风险分类率厘定方法 这样,通过求导使误差平方和( s s e ) 最小化,就能够选出可以最好地解释 观测数据y 的一组参数屈。 对于多元线性模型,定义以上方程的向量形式为: y = x + s ( 2 3 ) 其中,y 、和占分别为响应变量、预测变量参数和随机变量的向量形式, x 为预测变量的设计矩阵。 2 3 2 多元线性模型 在多元线性模型中,目标是找到使得s 各分量的平方和最小的的分量值。 如果模型中有n 个观测值和p 个参数,s 将有n 个分量组成,将有p 个分量组 成( p n ) 。 一个多元线性模型的基本组成部分有如下的两个要素: 1 、关于y 和预测变量关系的一组假设 2 、为了解决问题而被最优化的目标方程。标准统计理论用似然方程来定义 目标方程。在假设是正态误差的传统线性模型的情况下,误差平方和被最小化 的参数就是将似然方程最大化。 2 。3 ,3 传统线性模型的假设 1 、线性模型假设所有的观测值是独立的且每一个观测值都来自于正态分 布。 这个假设与总体的被观测项目无关,而是针对每一个独立的观测值。一个 例子可以帮助说明这个区别:一个以性别区分的平均索赔额的检验也许表明平 均索赔额对于男性和女性来说都是符合正态分布的,并且男性的分布均值是女 性的两倍。而包括所有男性和女性的平均索赔额的总分布并不是正态分布。我 们唯一感兴趣的分布是两个单独的类别。( 在这种情况下,只有两个类别可用来 考虑,但是在一个更加复杂的模型中,每一个被考虑的费率因子都是一个那样 的分类。) 1 0 第二章传统的风险分类率厘定方法 2 、线性模型假设均值是协方差的线性组合,且随机变量的每一个分量都被 假设为有一个共同的方差。 基于以上假设,线性模型能被写成如下模式: y = e l y 】+ s ( 2 4 ) e l y - x ( 2 5 ) m e c u l l a g h 和n e l d e r 在他们关于广义线性模型的专著中,对于传统的线性模 型,列出了如下的详细假设: 1 、随机成分:y 的每一个分量是独立且服从正态分布的。每一个分量的均 值鸬可以不同,但是他们有共同的方差仃2 2 、系统成分:p 个协变量被组合起来给出“线性的预测量”r : r = x ( 2 6 ) 3 、联系函数:随机和系统分量之间的关系通过联系函数来指定。在线性模 型中,联系函数等于恒等函数( i d e n t i t yf u n c t i o n ) ,即: e y 】兰= r i ( 2 7 ) 最后一条假设中的恒等联系函数也许在这里看是多余的,但是当讨论广义 线性模型的时候它将是非常有意义的。 2 3 4 传统线性模型的局限性 线性模型提出了用众所周知的线性代数逼近的方法就可以轻易解决的容易 处理的问题。而且,多元线性模型在非寿险分类费率的厘定中有很广泛的应用。 但是容易看出,线性模型要求的严格假设条件在应用中很难保证: 1 、在现实中,很难维持响应变量的正态性和不变的方差。例如,索赔次数 是离散变量且方差可能随其期望值的增大而增大,而索赔额大小的分布往往是 右偏的。传统的线性回归模型试图通过变换数据形式来保持这些条件。例如,y 也许不满足假设,但是l n ( y ) 可能满足。然而没有理由表明,为什么应该存在 这样一种变换。 第二章传统的风险分类率厘定方法 2 、现实中响应变量的值也许受到约束而必须为正。但是,响应变量是基于 正态分布的假设违反了这一约束。 3 、如果响应变量是严格非负的,那么从直观上看,当y 的均值趋于o 的时 候,y 的方差也应该趋于o 。也就是说,方差是均值的函数。 4 、之前提到的传统线性模型的假设中,第二条假设和第三条假设中隐含的 内容是,解释变量是通过加法关系对响应变量产生影响的。但是,这在广泛的 应用中是不现实的。例如,假设响应变量等于一个蝴蝶翅膀的面积,预测变量 是翅膀的宽度和长度。很显然,这两个变量不是相加的,而是相乘的。与我们 的研究更密切的是,很多保险风险是通过费率因子相乘得出的。 第四节传统的风险分类费率厘定方法与广义线性模型的联系 2 4 1最小偏差法和广义线性模型的联系 s t e p h e nm i l d e n h a l l ( 1 9 9 9 ) 发表过一篇综合性的文章,文中指出许多最小偏 差过程与广义线性模型是相一致的口0 1 。下面的表格总结了许多更加普通的最小 偏差过程的一致性。简而言之,这些方程是一个特定的广义线性模型的关键组 成部分。 表2 1 最小偏差过程和广义线性模型的对照 广义线性模型 最小偏差过程 联系函数误差函数 乘法平衡原理 对数联系函数泊松分布 加法平衡原理自然联系函数正态分布 乘法最小二乘 对数联系函数正态分布 指数密度函数的乘法极大似然 对数联系函数伽马分布 正态密度函数的乘法极大似然对数联系函数 正态分布 正态密度函数的加法极大似然自然联系函数 正态分布 当然,并不是所有的最小偏差过程都有一个类似的广义线性模型,反之亦 然。例如,z 2 加法和乘法最小偏差模型,就没有一个相一致的类似的广义线性 1 2 第二章传统的风险分类率厘定方法 模型。 2 4 2 传统线性模型和广义线性模型的联系 顾名思义,广义线性模型包含了一个更广泛的模型范围,它将线性模型作 为一个特例包括在内。线性模型假设条件中的一些约束:正态性、方差为常数、 因子必须通过加法关系对响应变量产生影响等被去除。取而代之的是一些相对 宽松的假设:响应变量被假设为指数型分布族中的一种,方差也可以随着分布 的均值的变化而变化。最终,协变量对响应变量的影响被假设为其线性组合的 一个函数变换。 1 3 第三章广义线性模型 第三章广义线性模型 第一节广义线性模型的假设 3 1 1 广义线性模型的假设 与之前提到的,m c c u l l a g h 和n e l d e r 关于传统线性模型的假设类似,他们在 书中定义广义线性模型的三条假设如下: 1 、随机成分,即响应变量或误差项的概率分布:y 的每一个分量是独立的 且来自指数型分布族。 2 、系统成分,即白变量的线性组合:p 个协变量被组合用来给出线性的预 测量7 7 : r = x ( 3 1 ) 3 、联系函数:随机成分和系统成分之间的关系通过一个严格单调的联系函 数g 来指定: n y 三= g - 1 ( 劢 ( 3 2 ) 可见,广义线性模型的假设与传统线性模型的假设相比,关于系统成分的 假设是相同的。 所不同之处在于,广义线性模型要求响应变量来自于指数型分布族,并且 要有联系函数将随机成分和系统成分联系起来。 3 ,1 。2 指数型分布族 广义线性模型将传统线性模型中响应变量的正态假设放宽为指数型分布 族,这为其在非寿险精算中的应用,提供了更为广泛的空间。指数型分布族包 括许多常见的分布,如正态分布、泊松分布、逆高斯分布、二项分布和伽马分 布掣2 1 1 。使用这些分布假设,既可以对连续性变量进行拟合,也可以对离散型 1 4 第三章广义线性模型 变量进行拟合;既可以对对称型变量进行拟合,也可以对分布具有较大偏度的 变量进行拟合;对于非寿险精算中的常用变量,如索赔次数、损失额度、损失 率和损失频率等,都可以建立广义线性模型进行拟合并进行预测和估计。 形式上,指数型分布族是一个双参分布族,定义如下: z ( 乃;够,) = e x p 喘+ c ( y i , ) ) ( 3 3 ) 其中a i ( 矽) ,6 ( 谚) 和c ( 乃,矽) 是事先定义的函数;舅是一个与均值有关的参数; 矽是一个与方差有关的尺度参数。基于实际应用的目的,了解指数型分布族中的 成员所具有的如下两个性质是有用的: 1 、分布可以用均值和方差的形式完全定义 2 、z 的方差是它的均值的一个函数 在广义线性模型中,因变量的方差是其均值的函数这一性质,非常适用于 保险数据。譬如,在拟合次均赔款时,如果使用传统的线性回归模型,假设误 差项服从正态分布,那么当拟合值为1 0 0 元时,标准误差为1 0 元,而拟合值为 1 0 0 0 0 元时,标准误差也为1 0 元。但是从直观上看,拟合值越大,其标准差也 应该越大。在广义线性模型中,如果假设因变量的变异系数为常数( 如1 0 ) , 这就意味着假设误差项服从伽马分布。此时,当拟合值为1 0 0 元时,标准误差 为1 0 元,而当拟合值为1 0 0 0 0 元时,标准误差为1 0 0 0 元。这与实际情况是相 吻合的。 与此相关的第二个性质,可以通过将方差表达为如下形式来加以强调: v a 厂( 鬈) :丝垃 ( 3 4 ) q 其中v ( x ) n 做方差函数,是一个已经定义的函数;参数矽用来标度方差;哆 是一个常量,表示观测值i 的一个权重或是信度。这两个参数定义了每个观测值 的方差。 在一些情况下( 如泊松分布) ,尺度参数矽为1 且贯穿广义线性模型的分析 始终。然而,通常情况下,对于其它的指数族分布,矽在事先是不知道的,此时 1 5 第三章广义线性模型 必须通过数据对矽进行估计。常用的估计方法有: 1 、极大似然估计法。这种方法的不足之处是不能得到关于矽的一个明确的 公式,而且进行极大似然估计的过程花费的时间相当长。 2 、矩估计量: 多= 击军等等 5 , 3 、总偏差平方和估计量: 易:旦( 3 6 ) n p 其中,d 为总偏差平方和。 一般被称作优先权重,它允许每一个观测值已知的置信度的信息被包含 在模型中。例如,如果对索赔频率进行建模,一个观测值可能与一个月的潜在 风险相关,而另一个观测值则与一年的潜在风险相关。与更长的风险暴露期相 关的观测值会包含更多的信息和更少的变化性,这可以通过定义 为每一个观 测值的风险暴露而包含在模型中。在这种方法中,有更长的风险暴露的观测值 被认为有着更低的方差,且模型也因此受到这些观测值更深的影响。【2 2 】 在广义线性模型中,根据保险数据的先验知识选择误差项的分布类型,可以 有效地改进模型的拟合效果。如,如果因变量的方差为常数,可以选择正态分 布;如果因变量的方差等于其均值,可以选择泊松分布;如果因变量的方差等 于其均值的平方,可以选择伽马分布;如果因变量的方差等于其均值的三次方, 可以选择逆高斯分布等等。指数型分布族中一些常见分布相应的方差函数形式 总结见表3 1 。 1 6 第三章广义线性模型 表3 1 常见的指数族分布的方差函数形式 分布形式 方差函数v ( x ) 正态分布 l 泊松分布x 伽马分布 x 2 x ( 1 - x ) ( 其中,测试 二项分布 次数= 1 ) 逆高斯分布 0 3 ,1 3 联系函数 在实践中,当使用传统线性回归时,实践者有时试图通过变换数据来满足 正态分布、响应变量的方差为常量以及加法模型的要求。而广义线性模型仅仅 要求有一个联系函数来保证最后的加法模型的条件。传统线性模型的第三条假 设要求y 为协变量的和,而取而代之的是,广义线性模型的第三条假设要求将 y 做一些变换,记作个g ( y ) ,以表示成协变量的和。 定义集合 b 啾= 工y e x p 等m 啪肌。) ( 3 7 ) 即歹的一切期望的集合。联系函数g 是一个定义于b 之上取值为r ”的充分 光滑的函数,满足条件: 朋, u 2jg ( h ) g ( , u 2 ) ( 3 8 ) g ( ) = r = x ( 3 9 ) 有 = e y _ g 。1 ( x ) ( 3 1 0 ) 将肛考虑成线性预测量的函数是很有用的,所以在传统情况下,它是甙x ) 第三章广义线性模型 的逆: 肛= g 。1 ( 仇) ( 3 1 1 ) 理论上可以对于每一个观测值i 使用一个不同的联系函数,但是实际中很少 这么做。联系函数必须满足严格单调的条件( 严格增或严格减) 。以下是一些典 型的联系函数: 1 、自然变换: 蜀o ) = ( 3 1 2 ) 2 、r e c i p r o c a l 变换: 9 2 ( ) :三 ( 3 1 3 ) 3 、l o g 变换: ( ) = h l ( ) ( 3 1 4 ) 4 、l o g l o g 变换: g 。( ) :h a ( h 1 ( ) ) :i n t n l ( 3 1 5 ) 5 、l o g i t 变换: ( 舻i n 南 ( 3 - 1 6 ) 6 、p r o b i t 变换: 9 6 ( ) = 。1 ( ) ( 3 1 7 ) 其中, 吣) = 去驴等如 ( 3 1 8 ) 不难看出,当y 服从正态分布,联系函数取第一个自然变换的时候,所得 到的广义线性模型就是传统的线性模型【2 3 1 。另外要指出的是l o g i t 变换,近年来 由于对1 i l 二这一函数研究较多,相应的性质也较好。因为l o g i t 变换有一个重 l p 1 8 第三章广义线性模型 要的特点,当p 接近0 或接近1 时,i n l 变化较大,换句话说,它可以较细 1 p 致地反映自变量而,矗对于p 在o 或1 附近的变化的影响。这一点往往正是实 际问题所关注的。例如,p 反映灾害性事件发生的概率,这时p 的值不可能大, 而且接近于0 ,从历史记录中去寻找原因,正是希望找出那些x i 对p 的值从0 变 到o 1 ,o 2 有显著的影响,可见l o g i t 变换是适合这一类要求的。同样,当希望 找出对p 值从0 9 9 到0 9 9 9 有显著影响的自变量时,l o g i t 变换也能够切合这一 需要。 还有一种重要的联系函数就是l o g 变换,当我们获得的数据是诸如计数资 料这类的数据时,很显然观测值的期望值是正数。此时对其取对数是完全合适 的,因为取对数后它的变化范围就在( 嘲,+ ) 之内,再用线性函数去研究就不会 发生问题了。除此之外,l o g 变换对于自变量是相乘关系的影响有很好的性质: , u i = g - 1 ( 层西1 + + p ) = e x p ( f l l x i l ) e x p ( f 1 2 x i 2 ) e x p ( f l p x i v ) ( 3 1 9 ) 换言之,当使用l o g 联系函数时,广义线性模型估计的是对数的乘法模型 的影响,而不是估计加法模型的影响阱】。 可见,通过联系函数将响应变量和解释变量之间的关系设定为非线性关系, 这不仅为拟合属性变量和取值为特定区间( 如事件发生的概率) 的变量提供了 可能,同时也更加符合保险精算中响应变量与其影响因素之间的更为复杂的非 线性关系,从而克服了传统线性模型应用上的局限性。 每一种误差结构都和一种典型的联系函数联系在一起,这样可以在解决广 义线性模型分析时简化数学过程。随着计算机科学技术的发展,在用现代计算 机软件解决广义线性模型的问题时,选用典型的联系函数已经变得不是很重要 了。而且使用软件,还可以将联系函数和方差函数任意组合,选择最为恰当的 一组。 3 1 4 偏差形式 在解释变量的影响已知的情况下,就这个变量而言,与其估计参数,倒 不如将这个变量的信息作为模型的已知影响更为恰当。这可以通过将一种“偏 1 9 第三章广义线性模型 差形式”孝加入到线性预测量7 7 的定义中来完成: r = x + 孝 ( 3 2 0 ) 其中给定 e e y 】= = g - 1 ( r 1 ) = g _ 1 ( x 夕+ 孝) ( 3 2 1 ) 应用偏差形式的一个普通例子是在确定乘法广义线性模型的赔案规模和数 量( 与赔案频率相对应) 的时候。每个观测值可能与一个不同期间的保单潜在 风险相关。与一个月的潜在风险相关的观测值明显比与一年的潜在风险相关的 观测值的期望赔案数量要更低( 所有其它因子相同的情况下) 。为了对此进行适 当的补偿,期望赔案数量按观测值的一个比例( 所有其它因子相同的情况下) 增加的假设,可以通过在乘法广义线性模型中将偏差形式善定义为与每个观测值 的潜在风险的对数相等的形式来提出: 研¥ = g - 1 ( 乃岛+ 旬) = e x p ( q 岛+ l n ( e i ) ) = e x p ( o j x v p j ) 白 ( 3 2 2 ) 其中e 是观测值i 的潜在风险。 在泊松乘法广义线性模型这种特殊的形式中,对于具有等于潜在风险( 优 先权重设为1 ) 的对数的偏差形式的赔案数量进行建模,与没有偏差形式但是优先 权重设为每个观测值的潜在风险的赔案频率进行建模,所产生的结果是相同的。 第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026国网数科控股公司(国网雄安金科公司)校园招聘笔试考试备考题库及答案解析
- 2025上海市执法类公务员招考调剂笔试考试备考题库及答案解析
- 2025海南省卫生健康委员会面向全国选调医疗卫生机构领导班子成员14人笔试考试参考题库及答案解析
- 浙江银行招聘-“梦想靠岸”招商银行杭州分行2026校园招聘笔试考试参考试题及答案解析
- 2025年河北邯郸市中西医结合医院急需紧缺医疗人才引进10名笔试考试参考试题及答案解析
- 2025重庆市涪陵区人民政府龙桥街道办事处选聘本土人才1人笔试考试参考试题及答案解析
- 2025宁夏回族自治区机关事务管理局事业单位招聘10人笔试考试备考题库及答案解析
- 员工手册宣贯会
- 2026浙江省烟草专卖局(公司)招聘(59人)笔试考试备考试题及答案解析
- 2025甘肃嘉峪关市地震局招聘公益性岗位1人笔试考试备考试题及答案解析
- 学习投入量表
- 中药药理学PPT完整全套教学课件
- 70岁以上老年换证三力测试模拟题
- 甲状腺结节射频消融课件
- 船机桨的匹配问题
- 《发展汉语(第二版)中级综合(Ⅰ)》第9课+课件
- TCAMDI 083-2022 无托槽正畸矫治器
- GB/T 29024.4-2017粒度分析单颗粒的光学测量方法第4部分:洁净间光散射尘埃粒子计数器
- 地质灾害防治培训课件
- 英语经典电影课件
- 实验一坐骨神经腓肠肌标本的制备骨骼肌收缩
评论
0/150
提交评论