(概率论与数理统计专业论文)gee方法在可信度模型结构参数估计中的应用.pdf_第1页
(概率论与数理统计专业论文)gee方法在可信度模型结构参数估计中的应用.pdf_第2页
(概率论与数理统计专业论文)gee方法在可信度模型结构参数估计中的应用.pdf_第3页
(概率论与数理统计专业论文)gee方法在可信度模型结构参数估计中的应用.pdf_第4页
(概率论与数理统计专业论文)gee方法在可信度模型结构参数估计中的应用.pdf_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文首先概括地讲述了可信度理论在保险实际中的发展史,接下来就几种基本可信 度模型的具体表达式、结构参数的一般矩估计以及应用实例,逐一进行了概括性介绍 然而在保险实际中,依照可信度理论恰当地选择可信度模型后,为根据可信度模型最终 求得可信度保费的估计值,首先需要研究可信度保费中结构参数的估计目前,对于可 信度模型结构参数的估计,已经提出矩方法、极大似然方法、限制性极大似然方法等多 种方法本文主要介绍并比较拟似然、拟最小二乘等广义估计方程方法在可信度模型结 构参数估计中的应用,并且为了更好地应用广义估计方程方法,在探讨估计方法之前, 本文首先给出了基本可信度模型的混合线性模型表示形式( n e e s ,e ta 1 1 9 9 9 ) ,并以带 有独立相关结构的平衡b 曲l m a n n 模型、b 曲l m a n n - s t r a u b 模型和带有m a ( 1 ) 误差结 构的平衡b n h l m a n n 模型、b n h l m a n n _ s t r a u b 模型为侧,给定结构参数产生计算机模拟 数据,然后逐一采用拟似然、拟最小二乘两种广义估计方程方法以及c h ih ol oe ta l ( 2 0 0 6 ) 提出的二阶广义估计方程( g e e 2 ) 方法来估计结构参数,最后依照计算机模拟结 果验证比较这几种广义估计方程方法的有效性 关键词t 可信度理论;可信度模型;结构参数;混合线性模型;拟似然估计方法;拟最 小二乘估计方法;二阶广义估计方程方法 a b s t r a c t i nt h i sp 印e r ,t h ed e v e l o p m e n th i 8 t o r yo fc r e d i b i l i t yt h e o r yw a sd e s c r i b e di nb r i e f a n dt h e ni ti n t r u d u c e dt h ee x p r e 8 s i o na n dm o m e n te s t i m a t i o no fs t r u c t u r ep a r a m e t e r s a n d 印p l i c a t l o ne x a m p l e so fs o m eb a s l cc r e d l b i l i t ym o d e l si ns u m m a r 弘h o w e v e r ,i no r d e r t oo b t a j nt h ee 8 t i m a t eo fc r e d i b i l i t yp r e m i u mi ni n s u r a n c ep r a c t i 8 e ,t h ee 8 t i m a t i o no f t h es t r u c t u r ep a r a m e t e r sh a v et ob e e nd i s c u 8 s e d a tp r e s e n t ,f o rt h ee s t i m a 上i o no fs t r u c t u r ep 甜a m e t e r si nc r e d i b i l i t ym o d e l 8 ,t h e r eh a 憎b e e nm o m e n t m e t h o d ,m u 一m e t h o d , r e m o i n e t h o da n ds oo n h e r e ,t h ep 印e r8 t u d i e dt h ea p p l i c a t i o no fm e 乞h o d 8o fg e n e r a l i z e de s t i m a t i n ge q u a t i o n s ( g e e s ) i ns t r u c t u r ep a r 姐1 e t e r 8e s t i i n a t i o no fc r e d i b i l i t y m o d e l 8 f i r s t ly ,t h ep a p e ri n t r o d u c e ds o m eb a s i cc r e d i b i l i t ym o d e l si nt h ef o r mo fm i x e d l i n e a r 脚d e l s ( n e e s ,e t 础1 9 9 9 ) s e c o n d l y ) t h ea 1 9 0 r i t h m so fq u a s i _ l e a s ts q u a r e s ( q l s ) m e t h o d ,p s e u d o l i k e l i h o o dm e t h o da n dg e e 2m e t h o dw e r e8 t u d i e di nt h ep a p e r t h e 8 e m e t h o d s f e r ea p p l i e dt ot h eb a l a n c e db n h l m a n nm o d e la n db n h l i i l a n n s t r a u bm o d e l w i t hi n d e p e n d e n te r r o rs t r u c n l r ea n dt h e 矗r s t o r d e rm o i n ga _ v e r a g es t r u c t u r e f i n a u 弘 t h ep a p e rv e r i 矗e d 恤ev a l i d i t yo ft h e s eg e n 盯a l i z e de s t i :m a t i o ne q u a 乞i o nm 乩h o d 8b ys i i m l l a t j o n s k e y 、o r d s :c r e d i b i l j t yt h e o r y ;c r e d i b i l i t ym o d e l ;8 t r u c t u r ep a r a m e t e r s ;m i x e dl i n e a r m o d e l ;p s e u d o l i k e l i h o o dm e t h o d ;q l sm e t h o d ;g e e 2m e t h o d 1 l l 学位论文独创性声明 本人所呈交的学位论文是我在导师的指导下进行的研究工作及取得的研究成 果。据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰 写过的研究成果。对本文的研究做出重要贡献的个人和集体均已在文中作了明确 说明并表示谢意。 作者签名:尘盘整日期: 学位论文使用授权的说明 伽6 j 莹诟 本人完全了解华东师范大学有关保留、使用学位论文的规定,学校有权保留学 位论文并向国家主管部门或其指定机构送交论文的电子版和纸质版。有权将学位论 文_ h j 于非赢利目的的少量复制并允许论文进入学校图书馆被查阅。有权将学校论文 的内容编入有关数据库进行检索。有权将学位论文的标题和摘要汇编出版。保留的 学位论文在解密后适用本规定。 作者签名:查查! 整导师签名: 同期:圣箜占! 篁! 型日期 , 第一章引言华东师范大学硕士论文1 第一章引言 在保险业中,保费厘定的准确性无疑是非常重要的通常保险公司在确定保费时,遵 循的基本原则是:如果一个风险实体的风险水平一致优于保险组合中其它风险实体时, 该实体应当减免一定的保费,反之亦然这时,便需要考虑保险实体的经验索赔,即所谓 的经验费率厘定,具体方法是基于保险组合中风险实体过去索赔经验的信息,对该风险 实体将来索赔进行预测实际上,经验费率厘定是可信度理论的重要应用可信度理论 的不断发展中,出现了各种符合保险实际的可信度模型,将统计思想应用到这些模型, 便得到可信度保费的估计其中,最精确可信度理论是在均方误差最小意义下,导出可 信度保费的公式,因此,某种意义上是最接近真实的风险的保费估计值 最精确可信度理论思想最早体现在1 9 6 7 年b 讧h l m a n n 提出的一个结论,他证明了 一个风险实体的可信度保费是个体风险经验和集体风险经验的加权甲均,最优权重由该 实体过去索赔水甲的齐质性和该实体观测数据的性质共同决定,并建立了b 油1 m a n n 模 型随后有一个重要的成果就是1 9 7 0 年b 曲l m 8 n n 和s t r a u b 对原有的b d h l m a i l n 模型的 拓展,得到了b n h l m a n n s t r a u b 模型,它与原模型显著的区别就是允许每个观测值的方差 可不相同,而且每个风险实体的观测次数也可以不相同在b 曲1 m a n n 模型和b 曲l m a n n - s t r a u b 模型中,由于所有投保人的经验索赔数据假定是可以互换的,所以在某种程度上 是齐性的然而在保险实际中,由于观测数据庞大,各风险实体的非齐质性尤为突出,这 就需要将风险实体按照定性分类因子分成相互有区别的几个部分,典型的分类因素有行 业和地理位置这样便得到了j e w e l l ( 1 9 7 5 ) 和t a y l o r ( 1 9 7 9 ) 提出的分层模型对于分层 模型,具体地说,将整个保险组合看作树叉状结构,树根是合同组成的整个保险组合, 上边一层为几个部分,每个部分由有共同特征的合同组成,最顶层是接近齐质的合同, 它们含有与树的层数相同数目的潜在风险特征同是在七十年代,h a _ c h e l e i s t e r ( 1 9 7 5 ) 引入宏观因子作为外生变量解释风险实体索赔水平而提出了回归模型,h a c h e m e i s t e r 最 初的问题是研究时间趋势作为一个外生变量对索赔经验的影响随着可信度理论的不断 发展,可信度模型变得越来越灵活,1 9 9 5 年d a n n e n l u r g 借助方差分量途径,引入两人 交叉分类可信度模型,该模型代表一类满足分类风险因子之间不是相互归属关系而是地 位对等且可以存在交互作用的分层模型 综上所述,根据保险精算中可信度理论的发展,按照时间顺序形成的基本模型可以 概括为以下几种; b i l h l m a n nm o d e l ( 单合同模型) 、b 讧h l m a n n s t r a u b ( 多合同模型) 、 j e w e l l sh i e r a r c h i c a lm o d e l ( 分层模型) 、 h a c h e m e i s t e rr e g r e s s i o nc r e d i b i l i t ym o d e l ( 回 归可信度模型) 以及c r o s s e ( 1c l a s s i n c a t i o nm o d e l ( 交叉分类模型) 等等各个模型之间既 有区别又有联系,多合同模型是单合同模型的推广,分层模型又是多合同模型的拓展; 交叉分类模型和分层模型是根据分类因子有无相互归属的关系而确定的,当分类因子之 第一章引言 华东师范大学硕士论文2 间存在相互归属关系且不存在交互影响时可建立分层模型,否则应考虑交叉分类模型; 对于回归可信度模型又与前边几个模型不同,前边的模型是对数据进行定性分析后建立 模型,而回归可信度模型则是用来研究所要分析的数据依赖于某种定量因子的某种趋势 的因为在保险实际中,关于风险的某些定量数据( 比如可以反映索赔额的大小浮动情 况的时间因素,汽车保险中车辆的重量) 对于保费有宜接的影响,我们便可以建立回归 模型来反映保费依赖于这些定量数据的趋势 接下来本文第二章归纳地介绍几种基本的可信度模型,以及模型中结构参数的计算 公式、模型的应用实例第三章将可信度模型写成一般的混合线性模型的形式,并给出该 形式下协方差矩阵的具体形式,确定需要估计的结构参数,这样几种常见的可信度模型就 成为混合线性模型的特例本文主要针对带有独立相关结构的平衡b n h l m a n n 模型和平衡 b 讧h l m a n n s t r a u b 模型,带有m a ( 1 ) 误差结构的平衡b 汕l m a n n 模型和平衡b 曲l m a n n _ s t r a u b 模型进行说明第四章介绍广义估计方程中几种估计结构参数的方法,以及它们 各自的优缺点的文字说明第五章将前边讲述的几种方法应用到两个基本可信度模型的 结构参数的估计中,并进行了大量的数值模拟第六章通过数值模拟对多种结构参数估 计方法进行了比较 第二章基本可信度模型华东师范大学硕士论文3 第二章基本可信度模型 2 1 平衡b 曲l m a n n 模型( 单合同模型) 在保险实际中,假定所有投保人是投保于一个合同的,并且对于每一个投保人观测 次数为t ,从而t = 1 ,t 考虑投保人j 在第t 年的索赔额x j = l ,t ,首 先,我们假定这个索赔经验值等于m f 加上白噪声,也就是说所有的x ,t 独立同分布 ( m 。s 2 ) ,每个单元均值”f 不同,而方差是常数s 2 我们可以用方差分析来检验所有 是否全部相等原假设:h 0 :m t = m 2 = m 。,如果不能拒绝原假设说明没有足 够证据反驳保险组合是齐质的,所以我们取总体均值作为每一个单元的保费如果原假 设被拒绝,说明每个之间是明显不同的我们可以将m ,看作是固定的,尽管是未知的, 利用附带的数据为这些均值作一个回归我们对索赔经验值进行随机变量分解,便得到 平衡b 洫l m a n n 模型一 玛t = m + 弓+ 马,j = 1 ,t = 1 ,t , ( 2 ,1 ) 其中随机变量弓,弓t 是独立的,e 国 = e 喝d = o ,矿o r 【弓j = n ,y n r 马d = s 2 , 对所有的j ,t 不同组成部分的含义是t ( i ) m 是总体平均,保险组合中任意一个投保人的平均索赔; ( ) 三,是对于某一确定的投保人j 的索赔值与总体均值m 之间的索赔差额三, 的期望是零,它的方差。表示投保人之间的差异,其称为结构参数,其分布称为结构分 布; ( ) 三“表示j ,t 固定时,投保人j 在第t 年的索赔额与投保人j 第1 年至第t 年 的平均索赔之间的差额,弓t 的期望也为零,方差为结构参数s 2 ,反映同一投保人不同 时期索赔额的差异 结构参数n 、s 2 可以用如下矩估计 争= 志喜c 和蝴, a = ;薹c 玛二帮一志喜c 酗瑚 其中毫= 手主玛。,贾= 由塞垂而t t = l。:l l = l ( 2 2 ) ( 2 3 ) 第二章基本可信度模型华东师范大学硕士论文4 2 2b 汕l m a i l m s t r a u b 模型( 多合同模型) 2 2 1b i i h l m a n n s t r a u b 模型的定义 单合同模型是对某种合同而言,由投保该合同的各个投保人的索赔经验数据来预测 该合同未来的索赔额然而在保险实务中,对于一个由多个相类似的合同构成的保险组合 而言,需要适用范围更为广泛的模型1 9 7 0 年b n h l m a n n 和s t r a u b 就给出了b 曲l m a n n - s t r a u b 模型。概括地说,该模型是由多个独立的、具有相同结构的b t l h l m a n n 单合同模 型相嵌而成的反映在模型表达式上,就是对原模型引入了自然权重,玛t 不再是第j 个投保人第t 年的索赔额,而是投保合同j 的u “个投保人t 年的平均索赔额这样玛t 的方差不再完全相同,而是和权重u 。有关原则上,这些权重是已知的,它可以反映每 个合同的总体潜在风险水平 为简便起见,我们还是假定正;t ,并且假定一个保险组合共有j 个保险合同,每 个合同在( = l ,丁) 年投保人数为u f c ,将该保险组合中第j 个合同第t 年的屿。个 投保人索赔额的平均值x n 分解,得到b 曲l m a n n _ s t r a u b 模型z 玛f = m + 昌+ e ,= 1 ,工t = 1 ,丁1 , ( 2 4 ) 其中随机变量已,弓t ( 对所有的j ,t ) 是相互独立的,e 隔】= e 【弓d = o ,v r 岛 = 口, y o r 兰,。1 _ s 2 不同组成部分的含义是t ( i ) m 是总体平均,保险组合中所有合同中所有投保人的甲均索赔 ( ) 兰,是对于固定的合同j 的平均索赔值与总体均值m 之间的索赔差额三,的 期望是零,它的方差。反映合同之间的差异,其称为结构参数,其分布称为结构分布; ( m ) 三“表示j 、t 固定时,合同j 在第t 年u ,。个投保人的平均索赔额与合同j 第 1 年至第t 年的平均索赔均值之间的差额三“的期望也为零,方差为结构参数s 2 加 反映单个合同内部不同时期索赔额的差异 可以看出,模型( 2 4 ) 是模型( 2 1 ) 的推广,当j = 1 时,模型( 2 1 ) 、( 2 4 ) 相同 2 2 2 参数的矩估计 我们分别采用总体加权平均,加权组内甲方和,加权组间平方和来构造参数的无偏 第二章基本可信度模型华东师范大学硕士论文5 流= x 。, 争= 志喜和妒础 。【妻( 码。一x 乞) 一( l ,一1 ) 乒 a = 上l 了一 u 塾一e 唾 j 2 i ( 2 5 ) ( 2 6 ) ( 2 7 ) 其中屿。= 屿t ,u 。:一哆。玛。= 畿玛c 表示合同j 第1 年至第t 年所 2 i,2 lh 。一 有索赔的加权平均,也。= 妻鼍玛。表示整个保险实体中所有投保人的加权甲均根 据上式可以得到参数的无偏估计值,但是当乒很大的时候,a 有可能是负数此时有另 外一种估计方法一一拟估计( p s e d u o - e s t i m 8 t o r s ) 方法来避免产生负值我们定义函数一 9 ( m s 2 ,x - t ,x “) 2 了_ 与 勺( 玛u 一芸玛u ) 2 j ,( 2 8 ) j 3 jj = l “ 其中2 三詈静不难证明,方程n = e m n ,s 2 ,x u ,x ,洲是成立的,从而说明 j3 了拟估计值击 ( 玛。一兰玛。) 2 】的无偏性,方程的解即为。的估计值从而,我 j = l j = i 。 们可以通过隐式方程a ”1 := 9 ( a ,s z ,x t ,b 。) ,采用迭代的方法得到n 的估计值, 但相比前边的估计,此时得到的估计不再是无偏的 2 2 3应用实例 采用上述模型对汽车保险数据的分析我们考虑一个保险组合:对九个队的汽车, 连续观测十年,第j = 1 ,9 队第t = 1 ,l o 年内我们观测汽车u ”辆,其中每一辆 汽车对应一个风险值, x ,。是u ,:辆汽车风险值的平均值这样带有( n a t u r a l ) 权重屿t 的风险x ,。便符合b 讧h l m a n n s t r a u b 模型的假定从而根据索赔经验便可以采用上边介 绍的方法得到结构参数的估计值,然后进一步得到可信度保费的估计如果实际运算中 得到的同一车队不同时期的风险值差异较大( s 2 较大) ,说明同一个队中的汽车司机的 驾驶习惯是明显不同的这种变化情况可以由比b n h l m a n n s t r a u b 模型更复杂的模型体 现出来 第二章 基本可信度模型 华东师范大学硕士论文6 2 3j e w e l l s 的分层模型( h i e r a r c h i c a lm o d e i ) 2 3 1 分层模型的定义 自从b n h l m a n n 于本世纪六十年代末引入了单合同的可信度模型以后,七十年代是 模型的推广阶段,除了b n h l m a n n s r t r a u b 模型外,最重要的两个推广是j e w e l l s 的分层 模型与h a c h e m e i s t e r 的线性回归可信度模型在b n h l m a n n 模型或b 让h l m a n n _ s r t r a u b 模型模型中,由于所有投保人,他们的经验索赔数据是可以交换的,所以在某种程度上 是齐质的然而,在庞大的组合内合同问的非齐质性变得尤为突出,从而影响了费率厘 定的有效性于是,需要根据若干个准则( 如职业、性别、年龄等) 将大的保险组合分 解为若干个子组合,如果这种初步的分类得到的子组合内合同间还是有较显著的非齐质 性,则可根据更细的准则继续分层,最终得到树叉状的分层结构这样可以把分层模型看 作是多水平的可信度模型,是单水平的b t l h l m a n n s r t r a u b 模型的推广我们可以用树状 结构来描述该保险组合,最顶端代表合同组成的整个保险组合,下一层将该组合分为几 个部分,每一个部分由有一个潜在共同特征的合同组成,最底层接近齐质的合同,含有 和树的层数相同数目的潜在风险特征不难看出与b 讧h l m a n n s r t r a u b 模型不同的是, b 曲l m a n n s r t r a u b 模型中将保险组合直接按照最底层的合同分类 将一个保险组合分成p 个子保险组合,每个子组合中又有厶个合同,每个合同观 测砀次,由此将第p 个子保险组合中第j 个合同的第t 年的观测值j 0 ,。分解可以给出 模型t 粕= m + 三p 十三甜十三p j t ,p = l ,p )j = l ,矗,t = l ,砀,( 2 9 ) 上式中三一成分分别表示对总体均值、部分均值、合同均值的索赔差额,用式子表示为 e 瓦州一p 】= m + 量,e 砀ti 三,三】= m + 弓+ 昌三一成分期望均为o ,它们 之间相互独立( 也可以是互不相关) 结构参数的具体含义如下t ( i ) m = 凹【j ,t 】,v j ,t ,这表示整个集体的期望值; ( ) 者未= y n r 【三研。】,参数s 2 表示每个合同内部个体的波动情况,或者数 据随时间变化的非齐质性,u 表示第p 个子保险组合中第j 个合同在t 年观测的保单 的数量; ( ) 。= v 。r 【三, ,v j ,n ,表示在一个部分内部的波动情况,或者说是部分内部的 非齐质性; ( i v ) 6 = y o r 三,】,v - ,这个参数b 刻画不同部分之间的非齐质性 第二章基本可信度模型 华东师范大学硕士论文7 2 3 2 参数的估计 根据观测值的一、二阶矩可以得到下边的恒等方程式( 参考g o o v a e r t s ,1 9 9 6 ) ”l = e 降;= “j , s 2 = e 匹呦t ( 勘t 一。) 2 ( 砀一1 ) + n = e e 锄( 翰。一玛;。) 2 ( 山一1 ) + , 6 = e 知( 玛;。一咒。) 2 ( p 一1 ) , 其中u m2 蓦t ,锄2 奇,却2其中u 岬= t ,锄= 熹, 却= ;l 口,e o 示合同水甲和部分水甲上的可信度因子翰。 ( 2 1 0 ) ( 2 1 1 ) ( 2 1 2 ) ( 2 1 3 ) 菇篓百,强= 壹锄,锄,印分别表 = 薹罐翰c ,玛。= 耋罄翰。, 如w = 壹乏 我们可以利用上述方程式迭代计算各个参数的无偏估计值具体的算法如下t ( i ) 由( 2 1 1 ) 式得到s 2 的无偏估计s 2 = ( 啊t ( f f 一灿) 2 】( 一1 ) + ; p ,j ,ep ,j ( ) 利用( i ) 中得到的s 。,给定n 的一个拟估计值( 初始值) n ( ,可以得到 2 玎( “,玛。( ,由( 2 1 2 ) 式采用n e w t o n r a p h 8 0 n 迭代方法便最终得到。的估计值a ; ( m ) 利用( i ) 、( ) 得到的s 2 ,a 计算锄,进一步得到) 。,给定6 的一个拟估 计值( 初始值) 6 ( ”,由( 2 1 3 ) 式同样采用n e w t o n r a p h s o n 迭代方法便最终得到6 的 估计值6 ; ( i v ) 利用( i ) 、( ) 、( m ) 中得到的s 2 ,a ,6 ,计算x 得到m 的估计胤上 述估计方法在一些情况下,迭代得到的n 的估计值为o 如果事实上口= o ,说明部分 内部的j 个合同之间不存在非齐质性,从而可以选择其他的模型,然而即使。的真实值 不为0 的情况下,若s z 较大,即个体索赔额随时间变化波动较大时,利用此估计方法也 有可能得到a = 0 2 3 3应用实例 考虑火灾保险,将其分类为企业火灾险和个人住户火灾险,然后企业火灾险中又可 以按照不同的企业划分为不同的合同,个人住户火灾险按照不同的个人划分为不同的合 同这样便得到一个两水甲- 的分层模型实际计算该类保险组合的保费时,便可以采用 上述模型及参数估计方法还可以将模型推广到t h y o r 给出的多水平的分层模型,同样 给出一个实例假定将团体失能保单卖给一些公司的员工,并且把这些公司按照企业的 第二章基本可信度模型 华东师范大学硕士论文8 性质分类( 化工,食品,金融等) ,进一步每个公司内部按照员工的职位分类( 比如劳动 力,助理,经理,出纳等) ,我们记企业性质为i 的j 公司拥有k 职位的员工j 在时刻t 的风险t k j n = m + 三 + 岛+ 勖 十三l 剐十三玎胁, ( 2 1 4 ) 这样得到的水平为四的分层模型,根据两水甲的分层模型中的方法类似地可以得到其可 信性保费的估计 在我们具体应用时,可以发现当第一层分类得到各部分的差别不是很大的时候,可 以用简单的b d h l m a n n s t r a u b 模型来代替j e m l l s 模型 2 4交叉分类模型( c r o s s e dc l a s s i f l c a t i o nc r e d i b i l i t ym o d e l ) 2 4 1 交叉分类模型的定义 分层模型将单水平的模型推广到具有树叉状分类结构的多水平模型但是它不适宜 处理风险因子具有交互作用的情形比如,在汽车险的保险组合中,首先按照驾驶员所 在的区域分层,再按照驾驶员的职业分层,由于在分层模型中,不同树叉上的方差组成 部分相互间是独立的,这就需要假定在不同区域有相同职业的投保人之间是不具有共同 特征的,这与事实矛盾同样地,若首先按照驾驶员的职业分层,再按照其所在区域分 层,则需要假定在相同区域里具有不同职业投保人之间也是没有共同特征的,与事实也 是矛盾的为了将因子间的相互影响在模型中能够体现出来,d a n n e z l b u r gd ( 1 9 9 5 ) 借 助方差分量方法( v a r i a n c ec o m p o n e n t sa p p r 0 8 c h ) 引入了交叉分类的可信度模型我们再 举一个简单的两向交叉分类的例子,比如按照投保人的性别,年龄段分类的风险构成的 汽车保险组合,由于性别和年龄两个定性的风险因子的地位是对称的,不存在一种归属 关系,所以我们不能应用j e w e l l s 分层模型来拟合数据,而是给出另外一个模型 两向 交叉分类模型( t h et n m yc r o s s e dc l a s s i 6 c a t i o nm o d e l ) 在两向模型中一个保险组合的风险被两个风险因子分组第一个风险因子( r o w s ) 数 目为i ,第二个风险因子( c o 】u m n s ) 数目为j 在每个小组内部,有乃,个风险观测值 置,t ,可以分解为; x 廿= m 十三;( 1 ) 十弓( 2 十三玎十三幻,= 1 ,正,( 2 1 5 ) 其中三一成分相互独立均值为o 三巧和三班的方差分别为。和蒜,。反映了与个 体风险因子无关的小组与小组之问的变化,s 2 刻画小组内部风险的变化情况随机变 量三,( “,弓2 分别为行、列观测值的主要效应,它们的方差分别为b ( “,b ( ”,反映了不同 行、不同列之间的变化情况。 第二章基本可信度模型华东师范大学硕士论文9 2 4 2 参数的估计 我们将前边简单的模型的估计方法进行推广,得到交叉分类模型结构参数的估计 具体地,m 的估计采用加权平均估计t m = k s 2 的估计采用类似于分层模型中的无偏估计 ( 2 1 6 ) 垂= 呦( t 一函。) 2 ( 码一1 ) + , ( 2 1 7 ) 对于6 ( ”,6 ( ”,的估计可以用利用关系式 e ( j t ,x k 札) = m 2 + 文曲( 1 ) + 如c b ( 2 ) + 文k 屯f n + 6 。b 如l 文。兰二_ , ( 2 1 8 ) w ” 由上述关系式,可以得到下边的期望等式: 渺”坤一毒砉t 静, ( 2 1 9 ) e 弓喜 喜薏c 。一。户一s 2c t ,一- ,儿一 = c 护) + 训,一;喜妻 差一, ( 2 2 0 ) 其中置,。 计方程 ( 2 2 1 ) 堇爨x u 。,x 。一薹憝五扣于是通过上述期望等式,建立下列估 a = ( 6 d + a ) e ;b = ( 6 西) + a ) d ; e = 6 ) f + 6 臼) g + 反盯 x 篆 ,赳 , e e 堂塑奎 第二章 基本可信度模型华东师范大学硕士论文1 0 可以解得a ,b f l ) ,6 f 2 ) 的无偏估计但该估计不一定是最优的 2 4 3 应用实例 考虑带有违约风险的贷款模型中,将债务人的婚姻状况和在目前公司的工作时闻作 为两个分类因素婚姻状况分为单身、离异、其他( 包括结婚,同居,孤寡) ,工作时间 分为少于两年、两年至十年、十年以上三个层次,此时,两种分类因素地位是对等的,不 存在归属关系,所以对债务人的索赔额建立j e w e l l s 的双层模型不再合适,雨应该采用 两向交叉分类模型,并可以利用上述的参数估计方法对保费进行预测 2 5回归可信度模型( r e g r e s s i o nc r e d i b i l i t ym o d e l ) 在b i i h l m a n n s r t r a u b 模型中,我们注意到对于同一合同j 而言,在估计其风险保费 时仅仅依据索赔的经验数据,与索赔发生的时间是没有直接关系的,进一步说,确定的 风险保费m + 童,是时间不变的然而,在保险实务中,许多险种的索赔额是存在某种时 间趋势的于是h a c h e m e i s t e r 针对这一目的,提出了回归可信度模型,并利用其来预测 某一险种在美国五个州随时间变化的索赔数据其实考虑时间因素仅仅是回归可信度模 型中一个特殊的例子,许多情况下,只要是对风险保费有直接影响的定量因素都可以考 虑进去诸如,在汽车险中被保汽车的重量,可将索赔经验数据作为重量的函数建立模 型,来预测某一确定重量的汽车的索赔额 2 5 1 经典的加权回归模型 考虑如下模型t 置= c j + 嘭0 t + 兰,t , j = l ,z 一1 ,乃,( 2 2 2 ) 其中随机变量b t 表示第j 个保险实体t 时期t 个观测值的平均索赔量,q ,由是非随 机的系数,分别表示对总体的截距和斜率,q t 表示某种因素,该模型表示托t 随该因素 变化的一种趋势随机扰动弓t 相互独立,均值为o ,方差为s 2 屿c 叻t 是取值为正 数的权h a c h e m 如t e r 利用此模型来预测某一险种在美国五个州随时间变化的索赔量, 第二章基本可信度模型华东师范大学硕士论文l l 此时的强表示时问t 我们可以利用加权最小二乘得到c j ,嘭的w l s e - c 产= x 讪一d 产r 讪, 乃 屿t ( 砾一玛。) ( r j f _ r ,。) 呜”= 型百一, “。t ( 哳一q 。) 2 f 2 2 3 ) ( 2 2 4 ) l 其中u ,z 2 莩“。t ,r j 。薹豢r j t 可以证明w l 8 e 也是b l u e 另外,由此也可以得到集体模型( c o l k c t i v er n o d e l ) 一一恐t = c + d n + 三j t 的w l s e t 一= x 。一r 。, = 屿t ( 砾一咒。) ( 哳一) 咄( 强 j ,tj , 其中蜀u 3 再老玛t ,3 雾:差勺。- ( 2 2 5 ) ( 2 2 6 ) 2 5 2 回9 暑系数模型 在经典的回归模型中,截距和斜率尽管未知但是是固定的为了引入不同保险因素 ( 比如地区等) 间的相依性,假定截距和斜率均为遵循概率法则的随机变量,期望均为 0 ,并且相互之间是不相关的此时得到关于索赔观测值x “,标准化的回归可信度模 型t 玛t = a j + 皿,毋。+ 弓f ,j 一1 ,zt = l ,7 ) , ( 2 2 7 ) 满足t e ( a ,) = o , e ( 中,) = o , s 2 = 屿v q r ( ;) , y o r ( a ,) = 6 1 ,v n r ( m j ) = 6 2 ,c o ( ,j ) = o 其中随机变量玛t 表示第j 个保险实体t 时期哟。个观测值的甲均索赔量,a j ,奶是随 机的回归系数。分别表示对总体的截距和斜率对不同的j ,毒,t 之间相互独立, 对固定的j ,兰m 弓,j 相互独立劬c 表示某种因素,该模型表示玛t 随该因素变 化的一种趋势u ,。是取值为正数的权,8 2 表示单个保险实体内部随时间变化的情况, 经证明a ,屿的可信度估计a j + ,屿+ 满足方程: a j = 勺l ( b 。一皿,+ 吩。) , ( 2 2 8 ) u 。t 吼( 如一a ,+ ) 虬+ 锄2 上i 面r 犯2 鲫 第二章 基本可信度模型 华东师范大学硕士论文1 2 舯犷忐伸。高 然而在保险实际中,索赔数据往往更适合非标准的回归可信度模型 玛t = a j + m j 毋+ 弓t , j = l ,z = 1 ,弓, ( 2 ,3 0 ) 此模型同标准的回归可信度模型不同的是,截距和斜率之间往往是具有一定相关性的, 即e w ( ,l ,) o ,且,奶的期望不为零详细地,各个成分的一、二阶矩可以表示 为: e ( r ,) = c ,e ( j ) = d ,s 2 一屿c y r ( 己c ) , v o r ( r j ) = o y n r ( j ) = n 2 2 ,e 删( d ,) = 0 1 2 此模型中的参数可以由标准化模型中的参数估计值进行变换得至啦参考g 0 0 v a e r t 8 ,e t8 1 ,1 9 9 6 ) 2 5 3 参数的估计 在保险实际中,我们经常用到的是非标准的回归可信度模型,在此模型中截距和斜 率期望的估计值可以由观测值的加权平均得到,结构参数的估计值则可以从索赔观测值 的一二阶矩出发进行构造详细推导过程可参考相关文献( g o r t 8 ,e ta 1 ,1 9 9 6 ) 2 5 4回归可信度模型与经典加权回归模型对比 为解释回归可信度模型,h a c h a i l l e i s t e r 对美国5 个州一年十二个月的索赔观测数据 采用( 2 3 0 ) 进行建模,并采用上述参数估计方法得到了参数的估计然而经验证,对同样 一组计算机模拟随机产生的数据,采用模型( 2 2 2 ) 和( 2 3 0 ) 得到的回归系数的估计相差 是不多的,但是在利用模型( 2 3 0 ) 时得到没有意义的结构参数的可能性是很大的,比如 得到的方差估计值是负值以及相关系数矩阵是非正定的而且模型( 2 3 0 ) 较模型( 22 2 ) 复杂,也不能反映出可信度理论中个体和集体信息的加权平均这样一种可信度含义,所 以我们不提倡对保险中索赔数据建立回归可信度模型,一般情况下只要采用经典的加权 回归模型就可以了 第二章基本可信度模型华东师范大学硕士论文1 3 2 6 小结 本章主要回顾了保险精算中五种基本的可信度模型,它们可以根据保险实际中保险 组合的特定背景进行运用对于可信度保费的具体估计方法可以参考g o o v a e r t 8m j e t a 1 ( 1 9 9 6 ) ,文章中主要给出了均方误差( m s e ) 最小意义下的可信度保费的估计,估计 值一般均可表示为经验值与集体均值的加权平均由于可信度保费的估计中含有结构参 数,所以在其文章中还给出了参数估计的一些方法,主要是由一、二阶矩得到的估计, 在进行这些估计时,为避免出现负值,通常采用给定一个拟估计值作为初始值进行迭代 的方法最终得到结构参数的估计值,可以看出b 曲l i n a n n s t r a u b 模型以及j e w e l l s 分层 模型中就是采用此方法另外还可以由一、二阶矩得到的期望恒等方程式,解得结构参 数的表达式,最终得到结构参数的估计值,然而这些估计值可能并不具有最优性 综上所述,我们较详细地概括了可信度理论发展过程,并就发展过程中产生的几种 常见的可信度模型给出了具体定义,简单介绍了应用实例,并阐述了它们之间的联系与 区别在保险实务中,可信度模型可以说是用来确定保费的一种工具对于每一种保险 或组合来说,我们首先要选择合适的可信度模型,然后根据模型利用历史经验数据确定 恰当的保费( 也就是费率厘定) 至于可馆度保费的估计,目前已有多种方法,可以通过 b a y e s 后验均值得到,可以利用半参数模型计算( y o u n 昏1 9 9 8 ) ,也可以计算m s e 最小 意义下的齐次、非齐次线性估计,然而无论何种方法,最终的估计形式都是带有可信度因 子的集体保费( 或其估计值) 与经验均值的加权平均的形式然而可信性因子,甚至集体 保费的估计值中常常含有结构参数为最终确定可信度保费,我们需要进一步讨论这些 结构参数的估计具体来说,结构参数的估计方法可因模型的不同而异,对于简单的可 信度模型诸如b n h l m a n n - s t r a u b 模型,d a n n e b u r g ,e ta 1 ( 1 9 9 6 ) 给出的方法是由一、 二阶矩出发得到估计值;对于较复杂的可信度模型诸如j e w e u sh i e r ”c h i c a l 模型( 分层 模型) 等则可以利用拟估计值作为初始值进行迭代直至收敛得到结构参数的估计,此时 的估计值不再是无偏的然而该方法可能会导致在结构参数真实值并不是零的情况下, 得到的估计值却是零,这就会使我们错误地更改模型将可信度模型作为纵向数据模型 的特例,n e e 8e ta 1 ( 1 9 9 9 ) 对结构参数则是采用的极大似然( m l e ) 和限制性极大似然 的方法( r e m l ) ,利用s w a i i l y l sn l e t h o d ( 1 9 7 0 ) 和r a 0 sm i v q u e ( 1 9 7 0 ) 得到的初始 值,然后利用n e w t o n r a p h 8 0 n 或f i s h e rs c o r i n g 算法迭代得到结构参数的估计但是该 方法也有一定的局限性,就是要求事先已知或假定模型的分布函数,然而一般情况下可 信性模型的分布是未知的本文将几种广义估计方程方法,应用于可信度模型来估计结 构参数,其中包括c h ih ol oe ta 1 ( 2 0 0 6 ) 提出的二阶广义估计方程方法( g e e 2 ) ,此 方法要优于c o s s e t t ea i l dl u o n g ( 2 0 0 3 ) 给出的g l s 估计值文章最后通过计算机模拟 对多种方法进行了比较,验证各种方法的有效性 第三章可信度模型的混合线性模型表示华东师范大学硕士论文1 4 第三章可信度模型的混合线性模型表示 在保险实际中,我们对每个保险实体的经验索赔额( 可以是单个投保人的经验索赔 额,也可以是具有相同特征的一组保单的平均值) ,在一段时间内进行重复观测,得到我 们用来分析的经验索赔数据信息记姚为单个保险实体在时间t 的观测值我们将其分 解得到混合线性模型: 玑= z n 卢+ 名n q 。+ m = l ,2 ,n ,= 1 ,2 ,五,( 3 1 ) 其中解释变量。“= ( z ,z 甜2 ,墨“) 是已知的k 维向量,= ( 蕾,。咖) 是已知的l 口维向量,它们都是设计矩阵,对于不同的可信度模型取不同的常数值 卢= ( 历,岛,风) 7 是固定效应( n o n s u b j e c t - s p e c i f i c ) 参数,随机效应( s u b j e c t 一8 p e c 讯c ) 参数是n = ( l ,o 奶,n q ) 是白噪声 模型( 3 1 ) 又可以表示为t 挑= 咒十z i a 。+ e = l ,2 ,n ,( 3 2 ) 其中玑= ( 扯1 ,玑2 ,肌正) 7 是第 个保险实体的丑l 维向量索赔经验观测值类似 地,q = ( e e 2 ,e :瓦) r ,x = ( 。l t ,z 。2 了,z 。正t ) t ,是已知的噩南阶解释变量 矩阵,丕= ( 。磊,奄,。蕞) 7 是已知的正q 阶解释变量矩阵在保险实际中,保险实体 之间的相应观察( 即索赔经验) 之间是相互独立的,但保险实体内部我们允许序列相关 假定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论