




已阅读5页,还剩39页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 保险公司是经营风险的企业。它需要识别和刻画风险、对风险进行定价、对 负债进行评估、从风险中获得利润。如何做到更精确地识别风险以及风险定价成 为保险业亘古不变的研究重点。 文章首先指出我国保险业发展起步晚,保险市场存在诸多混乱现象,费率厘 定的市场化仍需要不断深入。而且随着国内保险市场的不断开放和外资保险公司 进驻的步伐加快,竞争形势加剧,国内保险公司的风险识别和定价技术较为落后, 引入国际先进的保险精算理论并不断创新是当务之急。文章的背景就源于这种实 际需求。 文章回顾了目前保险精算实务中传统风险定价、风险分类技术,并指出这些 传统方法内在的缺陷。然后探索用广义线性模型对风险定价、风险因子分类进行 建模,对三类广义线性模型在保险中的应用进行了描述,有:( 1 ) 双广义线性模型 同时对风险保费( 次均赔款或索赔次数) 以及离散系数同时建模的方法;( 2 ) p o i s s o n n b g a 舢a 广义线性模型分别对索赔次数和次均赔款( s e v e r i t y ) 建模 的方法:( 2 ) l o g i s t i c 回归模型对保单损失率建模并预测的方法。文章还提出当 保险数据库中只有保单组的索赔额信息时,用t w e e d i e 分布拟合风险保费的方 法。随后文章应用某保险公司家庭自用汽车的车辆损失险数据用 p o i s s o n n b g a 咖a 广义线性模型和1 0 9 i s t i c 回归模型进行实证分析并进行相关 解释和论证。 关键词:保险风险定价双广义线性模型t w e e d i e 分布泊松一伽马广义线性模 型1 0 9 i s t i c 回归 a b s t r a c t a b s t r a c t i n s u r a n c ec o m p a n i e sa r eb u s i n e s s e so fo p e r a t i n gr i s k i tn e e d st oi d e n t i 冬, d e s c r i b ea n dp r i c er i s k ,a n da s s e s sl i a b i l i t i e s t h u sp r o n tf o mr i s k h o wi oa c h i e v ea m o r ea c c u r a t er i s kp r i c i n ga n dr i s ki d e m m c a t i o ni s r e s e a r c he m p h a s i so ft h e i n s u r a i l c ei n d u s t r yf o ral o n gt i m e w e6 r s t l yp o i n to u tm a tt h ed e v e l o p m e n to fc h i n e s ei n s u 啪c ei n d u s t 巧s t a r t s l a t ei nt h ea n i c l e t h e r ea r em a n yp r o b l e m sw i t hi n s u 瑚c em a r k e t t h es y s t e mo f r a t e sd e t e r m i n e db yt h em a r k e ts t i l lc o n t i n u e st od e e p e n w i t ht h ed o m e s t i ci n s u r a l l c e m a r k e tc o n t i n u a l l yo p e n i n gu pa i l dm ep a c eo ff o r e i g ni n s u r a n c ec o m p a n i e s a c c e l e r a t i n g ,t h ec o m p e t i t i o ni nt h ed o m e s t i ci n s u r a n c ec o m p a n i e sh a si n t e n s i f i e d s i n c er i s ki d e n t i 匆i n ga 1 1 dp r i c i n gi sam o r e b a c k w a r dt e c i l n o l o g yi nd o m e s t i c i n s u r a l l c em a r k e t t oi m r o d u c ea d v a i l c e di n t e m a t i o n a la c t u 撕a lt h e o r ya 1 1 di n n o v a :t e e n d l e s s l yi si m p e r a t i v e t h eb a c k g r o u n do ft h i s a n i c l es t e m sf b mt l l i sa c 删 d e m a n d t h eg e n e r a lr i s kc l a s s i f i c a t i o na n d 研c i n gm e t h o d su s e di np r a c t i c eb ya c t u 撕e s o fi n s u 瑚c ec o m p a n i e sa r er e v i e 、e d t h e nt h ed e f e c t si n h e r e n t l yi n i ta r ep o i m e d o u t 锄dg e n e r a ll i n e a rm o d e l s ( g l m ) t 0m o d e lt h er i s kp r o f i l ea r ep r o b e d ,t h e a p p l i c a t i o n so ft h r e el ( i n d s o fg l m sa r ed e s c r i b e d ,t 1 1 a ti s :( 1 ) t h em e t h o do f m o d e l i n gr i s kp r e m i u m ( c l a i m so rs e v e r i t y ) a n dd i s p e r s i o ns i m u l t a n e o u s l yw i t h d o u b l eg e n e r a ll i n e a rm o d e l ;( 2 ) t om o d e lc l a i mf r e q u e n c ya i l ds e v e r i t ys e p a n a t e :l y w i t hp o i s s o n g a m m ag l m ;( 2 ) 1 ou s el o g i s t i cr e g r e s s i o nm o d e lt om o d e lt 1 1 el o s s m t i oa n dp r e d i c ti t t h e 砒i c l ea l s or a i s e st i l ea p p r o a c ho ff i t t i n gr i s ki n s u r a n c e 晰t 1 1 t 、 ,e e d i ed i s t r i b u t i o nw h e no n l yk n o w nt i l et o t a lc l a i m 锄o u n t s f i n a l l y ,a 1 1e m p i r i c a ls t u d yo np r i v a t ep a s s e n g e rv e h i c l eo f c h i n e s ei n s u r 趾c e m a r k e tf o rv e h i c l ed a m a g el o s sc o v e r a g ei s d o n ea n di t sr e l a t e dr e s u l t sa r e p r e s e n t e d k e yw o r d s :i n s u 舢c e ,r i s kp r i c i n g ,d o u b l eg e n e r a ll i n e a rm o d e l ,t 讨e e d i ed i s t r i b u t i o n , p o i s s o n g 锄m ag e n e r a l l i n e a rm o d e l ,l o g i s t i cr e g r e s s i o n 中国科学技术大学学位论文相关声明 本人声明所呈交的学位论文,是本人在导师指导下进行研究工作 所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任 何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究 所做的贡献均已在论文中作了明确的说明。 本人授权中国科学技术大学拥有学位论文的部分使用权,即:学 校有权按有关规定向国家有关部门或机构送交论文的复印件和电子 版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 保密的学位论文在解密后也遵守此规定。 作者签名: 傅 第1 章绪论 第l 章绪论 近年来,我国的g d p 快速增长,2 0 0 7 年g d p 增长率已经达到了1 1 9 。社 会主义和谐社会全面推进,资本市场发展进入新时期,这些有利形势为保险行业 提供了前所未有的发展环境和机遇。2 0 0 7 年,保险业务增长速度明显加快,保 险业实力明显增强。全国累积原保险保费收入7 0 3 5 7 6 亿元,同比增长2 5 。 保险业共支付赔款和给付2 2 6 5 2 l 亿元,同比增长5 7 5 6 。近年来,保险公司的 资金管理能力逐步增强,资金运用收益明显提高,资金运用监管不断加强。保险 资金运用在良性发展轨道上健康安全运行,成为推动保险业持续、快速、协调、 健康发展的一个重要“轮子 。随着2 0 0 8 年奥运会的临近,我国保险市场潜力进 一步增大,保险业未来的发展前景非常广阔。经济的发展使国家、企业和居民家 庭的财富r 益增长,社会各界对财产保险的需求越来越强。尤其是汽车进入居民 家庭的步伐逐步加快,作为产险的第一大险种,车险良好的发展前景无疑为财产 保险的发展上了“保险”。外资保险公司陆续进入国内市场,在经历了几年的蛰 伏后,外资保险开始集中发力。2 0 0 7 年,外资保险公司保费收入达到1 2 1 7 3 亿 元,比上年增长了6 2 ,市场份额达到2 5 2 2 。外资保险的集体表现明显胜过了 中资。仅在2 0 0 6 年炙手可热的投资连结险领域,外资人寿保险公司的保费收入 同比增长1 0 4 1 倍,占该险种市场份额的7 3 2 2 。外资财产保险方面,虽然不 能涉足机动车交通事故责任强制险,但其在货运险、责任险上的优势,仍令中资 财产保险难以企及。随着我国保险业的迅猛发展,保险业对外的进一步开放,如 何识别更多风险、精确定价已逐渐成为保险业在激烈的市场竞争中赖以生存和发 展的必要条件。 保险是一种以风险为对象的经营活动,它依据大数法则原理,对被保险人的可 保利益可能出现的损失进行补偿。保险公司向投保人收取的保险费,也叫毛保险 费。保险公司收取的保费必须足以向投保人支付赔款的同时,还应该包括经营过 程中的营业费用和因承担投保人转移风险所收取的合理利润。在保险实务中,营 业费用包括:承保费用,如佣金、营销费用、核保及保单管理费用等。纯保费即 风险保费,是保费中相当与赔款支出的那一部分,应该等于保险期间赔款额随机 变量的期望值。保险公司的一个重要工作就是进行风险评估,从事前的保费设计、 保单设计,到过程中的反保险欺诈,到事后的跟踪评估反馈都需要进行量化风险。 近些年来,数据挖掘技术和优秀的统计软件迅猛发展,为利用这些技术进行风险 分析提供了必要的基础,譬如:预测建模技术、分类回归树技术、神经网络技术等。 许多成功的保险公司已经认识到预测模型可以更好地识别风险和风险分级,从而 第l 章绪论 更有利于保险公司承保、定价和市场决策。预测模型是一种数据挖掘技术,所谓 数据挖掘( d a t am i n i n g ) 是指通过筛选存取在目录库中的大量数据来发现有用 的相互关系、模式和趋势的过程。预测模型利用这些发现并从中推理预测未来。 首先预测模型通过识别错误定价的风险来改善费率厘定策略,比如,当我们考虑 保险赔案和投保人年龄之间的关系以及保险赔案和索赔历史的关系时,毫无疑 问,年轻的驾驶员更有可能出险,以前发生过事故的驾驶员电更有可能出险。也 就是,对于保险公司来说,他们的承保成本更大。如图1 1 所示,这个直观上的 结果并没有考虑到很大比例的年轻驾驶员以前发生过事故这个事实。所以不恰当 的模型很可能使保险公司给有索赔历史的年轻投保人定价过高。其次,预测模型 帮助保险公司建立更加同质性的保单组合。另外,预测模型还可以识别新的风险 分级变量,或是变量问新的关系,从而找到更优的风险分级方法。在国外日益推 崇的“利用信用历史生成保险评分”就是一个生动的例子。随着保险公司的数据 库建设越发完善,能提供的信息也越多,如何利用这些信息挖掘出数据背后所隐 含的重要商业信息将是我们研究的重点。 图1 1 事故发生百分比v s 年龄 在财产保险中,计算保费需要选择一个变量来作为基准,此基准称为“风险单 位”( e x p o s u r e ) 。除“风险单位”外的其余所有变量都当作风险因子来调节纯风 险保费或者费率水平。风险单位的选择标准应以实用方便为主,车辆保险中用每 年每辆汽车作为风险单位。这样得到的索赔频率就是指每辆汽车每年平均发生的 索赔次数。传统的产品定价方法是采用“链梯法”分别对索赔次数和次均赔款进 行分析,得到索赔次数和次均赔款的流量三角形,经过趋势调整后,得到未来该价 格执行区间下的最终的索赔频率和次均赔款,这两者相乘即得到最终的纯风险保 费。在风险识别和定价时,传统方法利用单因素分析得到不刷l x l 险分类变量的相 对风险系数。纯风险保费通过乘以相应的相对风险系数后,就得到反映风险差异 2 第l 章绪论 的差别费率。当有多个风险分类变量时,传统方法中的一个隐含假设就是:各个 因子之间是相互独立的。因为只有假设各因子问相互独立的,各因子之间的关系 才是乘积关系。显然,这种假设跟现实是不吻合的。譬如车辆损失险,从车因子 中车型和车龄就有一定的相关性,老车型对应的车龄一般也高。如果既用车型系 数,又用车龄系数,就会导致重复计算,因此是不合适的。要想知道各个因子对 最终损失的影响,必须联合考虑这些因子的共同效应。另外,传统方法是基于大 数法则原理,我们很难用统计方法估计其信度、显著性水平及置信区间等。而广 义线性模型则能够轻松地实现统计检验。 n e l d e ra n dw e d d e r b 啪( 1 9 7 2 ) 引入广义线性模型( g e n e r a l l i n e a rm o d e l s ) ,用 于分析实验观测数据,这种模型是对经典的线性回归模型进一步的推广,建立了 统一的理论和框架;张尧庭( 1 9 9 5 ) 着重介绍了线性模型和广义线性模型各自的 统计背景和统计思想,并描述了广义线性模型的本质特征;其后,陈希孺( 2 0 0 2 ) 系统地介绍了多元广义线性模型。近年来,广义线性模型在理论和应用上得到了 快速发展。用于g l m 的计算软件也相继问世,s a s 和s p l u s 统计软件中的 g e n m o d 模块也被广泛应用。得益于应用软件的推广,广义线性模型在医学、 农业、交通运输,产品实验以及经济,金融等方面得到了广泛的应用。在英格兰、 法国、葡萄牙等地,广义线性模型已被保险公司广泛用于车辆保险的费率厘定中。 广义线性模型是一种非线性的回归模型,它能反映连续变量、离散变量、属性 变量等信息对因变量的影响,找出我们所关心的风险因子,实现风险分类和差别定 价。这对保险公司风险管理工作有着重要的价值。广义线性模型不仅为深入研究 索赔次数、索赔调节中的程度差异、索赔特征和等级变量( 损伤程度) 等问题提 供了具体可行的方法,而且我们可以用广义线性模型风险建模识别更多的风险 因子,区分优质客户和劣质客户等。经典的线性模型和许多普通的最小偏差法实 际上是广义线性模型的特例。广义线性模型明显放松了模型的假设条件,更符合 保险公司数据以及数据与预测变量间关系的实际情况。广义线性模型的求解方法 也简单易行,比上世纪6 0 年代流行的最小偏差法即标准的迭代方法更加简便。 另外,广义线性模型还可以提供统计检验筛选出显著的风险因子和拟合更优的模 型。鉴于广义线性模型的这些优点,文章将在第四章利用广义线性模型对车辆损 失险数据拟合并进行分析。 第2 章保险概述 第2 章保险概述 2 1 保险的含义及特点 “保险”最初的英文原意是以经常性的缴纳一定费用( 保费) 为代价来换取在 遭受损失时获得补偿。这个定义在一定程度上反映了保险的特性。保险是顺应社 会和经济的进步产生的,已经发展成为一个较为完善的体系,渗透到全社会的每 一个角落,成为社会制度中不可或缺的有机组成部分。现代意义上的保险可以从 经济、法律、社会功能三个角度对其本质进行揭示。首先,从经济角度看,保险 最主要的特征体现在它是一种经济行为。供给方利用大数法则定律,凭借收取保 费对被保险人因危险事故等造成的损失进行补偿并保持了合理的利润。同时,保 险的供给方又利用收取保费聚集的大量资金进行金融投资活动,因此保险组织又 属于金融中介机构。保险的需求方则是通过付出经济代价( 缴纳保费) 换取未来 遭受损失时获得的经济补偿,从而将风险转嫁到保险供给方。其次,从法律角度 上,保险是一种合同行为,明确保障了保险当事人双方的权利义务关系。最后, 从社会角度上看,保险还起到了“社会稳定器”的作用,有助于整个社会的经济 生活稳定运行。 按保险标的分类,一般广义地把商业保险分为财产保险和人身保险。财产保 险,一般也称之为非寿险,其保险标的是财产及与之相关的利益,保险人承担保 险标的因自然灾害和意外事故,如火灾、爆炸、海难、空难等危险损失的经济赔 偿责任。其中机动车辆保险是财产保险中最大的业务险种。机动车辆保险是以机 动车辆本身及其相关经济利益为保险标的的保险。目的在于保障保险车辆在遭受 自然灾害或意外事故造成保险责任范围内的自身损失或第三者人身伤亡、财产损 坏时能够得到合理的经济补偿,保护车辆所有人和受害人的经济利益,确保其生 产和经营的稳定性。它的保险责任包括基本险和附加险两部分。基本险又分为车 辆损失险和第三者责任险。车辆损失险承担的是因保险事故导致保险车辆本身 损毁的损失。本文实证部分即采用了国内某保险公司的六座以下家庭自用车的 车辆损失险的数据。 2 2 我国保险费率市场化的进程 长期以来,我国商业保险的主要险种的基本费率由保险监管部门统一制定和 监管。一方面,这对保护消费者的合法权益和维护市场的正常秩序起到一定的作 用;另一方面这种费率统一化的做法忽略了各地区保额损失率不同的客观事实, 使被保险人的风险与实际交纳的保费不成对价关系,这种情况既不公平又不科 4 第2 章保险概述 学,损害了我国保险业的发展。保险费率即保险产品的价格。合理的费率既反映 价值,又调节供求。风险的不一致性,费率及其风险等级的背离,导致保险公司 多收或少收保费,影响了公司的财务稳定性,扰乱了市场秩序,加大了监管成本。 在这种情况下,我国开始进行车辆保险市场化改革的探索。2 0 0 1 年7 月,保险 会批准深圳车险市场试行费率浮动制度。2 0 0 1 年1 0 月,广州车险市场试点费率 改革。2 0 0 3 年,费率改革推向全国车险市场。2 0 0 5 年1 1 月1 0 日,中国保险监 督管理委员会公布了财产保险公司保险条款和保险费率管理办法,增加了财 产险公司歼发保险产品和费率的自主权。费率市场化后,车险市场的竞争从地下 走到地上,趋于公开透明。财产保险公司可以基于自身的经营绩效调整车险产品 的费率,真f 发挥价格杠杆的调节作用。高额回扣、变相退费等不规范的经营行 为将得到有效的控制。我国已加入wto ,国外保险公司纷纷抢滩国内保险市场。 包括保险监管部门在内的各级政府部门应该转变观念,认真汲取国外的先进管理 经验,并结合我国的实际情况,在车险费率管理体制等方面加快与国际接轨的步 伐。各保险公司亟待提高内部管理水平,加大信息化建设的投入,引入并研究先 进的保险精算制度,增加保险制度的技术含量,这样才能适应我国加入w t o 后 保险业面临的激烈的竞争形势。 第3 章保险产品定价的相关理论 第3 章保险产品定价的相关理论 3 1 风险分级和预测模型 3 1 1 风险分级定义 风险分级,又叫风险分类。当没有充分的信息对一个给定的保单定价时,精 算中通常使用风险分级,即把期望成本相同的投保人分成一组,厘定出这组保单 的价格,并假设这个价格适用于该组的所有成员。这样做有利于减少风险集合的 非同质性,有助于消除被保险人的道德风险和逆向选择,使被保险人缴纳的保费 与其自身的风险水平相匹配。风险分级的思想实际上是保险公司差异化定价策略 的一个表现。风险分级还受到很多因素的制约。如果将风险集合分成了相对同质 的许多子集,可能导致某些子集样本数过少,从而使分析结果失去可靠的统计基 础;此外,风险分级所得结果必须要适合保险市场的现实需求。信息技术的发展 使得许多复杂的成本模型如多元统计模型,神经网络模型等在精算中得到了应 用。这些看起来复杂的模型无一例外地先把具有相同特征的投保人分成一组,再 估计这组的平均成本,而用来分组的这些特征被称作分类变量。在车辆保险中, 分类变量又分为从人因子和从车因子等。其中从人因子包括投保人的性别,年龄, 驾龄,索赔历史等,从车因子包括车的新旧程度等。 3 1 2 分类变量的选择标准 保险产品定价,除了选择适合数据的最优模型外,选择风险分类变量也非常 重要。分类变量的选择标准可分为以下三个标准: ( 1 ) 精算标准。也叫统计标准,包括精确性、一致性、可靠性等方面。其中精度最 为重要。分类变量必须和承保的成本相关。例如,保险公司对3 0 5 0 岁年龄段 的投保人收取等额的保费而不是对每个不同年龄设定不同的保费水平。这是由于 其他分类变量相同时,3 0 5 0 岁这个年龄段的不同年龄带来的成本变化很小。 精确性之所以重要是由于:第一,市场体制。在市场经济中,定价更为精确 的保险公司更成功。例如,a 组投保人的成本是1 0 0 0 元,b 组投保人的成本是 2 0 0 0 元。如果一家保险公司对这两组投保人收取相同的保费1 5 0 0 元,那么a 组 投保人将会选择另一家保险公司,而更多的b 组投保人会选择这家保险公司。由 于b 组投保人的成本大于其交纳的保费,这家保险公司亏损。因此,为了保持竞 争力,保险公司需要更精确地计算成本。且精确性需要更多的分类变量和更完善 的定价机制。第二,公平原则。在上述例子中,一般情况f ,对a 组投保人收取 1 0 0 0 元,b 组收取2 0 0 0 元,对投保人来说也体现了公平性。 6 第3 章保险产品定价的相关理论 一致性,又叫同质性,是指一组中的所有成员具有相同的期望成本,被收取 相同的保费。之所以将投保人分成具同质性的许多组,是因为保险公司缺少充分 的个体投保人的历史索赔信息给每个投保人单独定价。 精算的第三个标准是可靠性或稳定性。一方面,基于给定的一套损失数据, 我们得出的成本差别可能是由于随机波动的影响。另一方面,成本差别可能经过 一段时间后会改变。例如,经验成本数据中性别这个分类变量带来的成本差别也 许随着女性地位的提高而缩小。最后,技术的发展也会影响到相关的成本差别。 ( 2 ) 操作的可行性:首先,分类变量必须有一个明确的定义,不能含糊不清。譬 如:保险公司常提到的年轻投保人“成熟”或“有责任感”不能当作一个分类变 量,因为这两个因素很难客观一致地被定义和应用。其次,还要考虑管理费用, 获得并证实一个分类变量的信息所付出的成本应该小于该变量带来的价值,否则 毫无意义。 ( 3 ) 社会可接受和合法性:不是任何变量都可以在国内当作定价因子来使用,监 管者或行业协会都有一些相关规定。因此,选择变量时要考虑社会、法律的接受 程度。 基于以上选择变量的标准,实践中常将变量分为以下几类:第一类,年龄一 性别一社会地位,例如许多保险公司对未婚男青年这类投保人进行差别定价;第 二类,车辆的用途,如用于游玩、上下班、商务或农用耕作等;第三类,驾驶区 域,通常使用省内范围或全国范围作为变量。另外,还可以选择其他变量分类, 如多辆车同时投保,或单车投保。 7 第3 章保险产品定价的相关理论 3 1 3 预测模型在财产保险中的应用 在财产保险中,预测模型( c h ua n dd u l i n g ,2 0 0 7 ) 可以用束费率厘定和风险分 级。传统的费率厘定方法采用单因素损失率法或纯保费法。它们假设各因子之间 是相互独立的,而现实中保险数据常存在许多分布上的偏差,显然,这个假设不 贴近现实。多元预测模型方法则会考虑到分布上的重叠性和风险因子之问的相关 性,确保费率厘定变量和风险分级变量被恰当使用,进而差别定价。 基于信用历史的保险评分,通常使用广义线性模型中的l o g i s t i c 评分模型 ( k e i i i s o ne ta l ,2 0 0 3 ) 。这个评分通常由客户和保险公司之外的第三方信息 供应商提供。信息供应商建立客户信用历史数据库,通过信用评分模型计算评分。 国外保险公司较普遍地使用这种方法,它的成本低廉、公平合理性使得小至中型 保险公司在市场竞争中有了一席之地。 客户反应模型( c u s t o m e rr e s p o n s em o d e l i n g ) 作为一种预测模型,最近也应 用到保险精算中。一般的保险定价模型着重强调经济学供求双方的供给方,而忽 视了需求方对保险的需求或需求方对市场分割和差别定价的意愿。而客户反应模 型可以识别这种需求或意愿,帮助保险公司挖掘潜在的利润。给定一组风险特征, 从客户反应模型中得到“反应”,比如是否续保,或签订一个新保单的可能性等。 保险公司可以基于这个“反应”信息提供相应的服务,增加其利润。 另外,保险公司还运用预测模型来提取未决赔款准备会等。以下的篇幅主要 介绍预测模型尤其是广义线性模型在财产保险的费率厘定中的应用。 3 2 财产保险费率厘定方法 3 2 1 单因素分析法 单因素分析法根据每个费率因子分别确定其对保险产品价格的影响。单因素 分析法由于不能考虑各个费率因子之间的相互关系,很容易导致保险价格的扭 曲。譬如,在汽车保险中,对车龄的单因素分析结果表明,汽车越旧,其保险成本越 高。但导致这种现象的真f 原因可主要是因为高风险的年轻人驾驶旧车的可能性 较大,才导致了旧车的保险成本较高。因此,如果根据车龄和驾驶员年龄的单因素 分析结果厘定汽车保险费率,将会重复使用驾驶员年龄对汽车保险费率的影响,最 终导致对年轻驾驶员收取了过高的保险费。单因素分析法的另一个缺陷是没有考 虑各个费率因子对费率的交互作用。譬如,男女驾驶员的保险成本差异通常随驾 驶员年龄的变化而变化,这就表明驾驶员的性别和年龄之问存在交互作用,但单因 素分析法难以区分这种差异,而会简单地认为男女驾驶员的保险成本差异与年龄 第3 章保险产品定价的相关理论 无关( 孟生旺,2 0 0 7 ) 。 虽然单因素分析法存在诸多缺陷,鉴于国内保险市场竞争的不充分性和单因 素分析法的简单快捷性,大多数保险公司仍然使用单因素分析法进行费率厘定。 3 2 2 最小偏差法 最小偏差法( f e l d b l 啪e ta 1 2 0 0 2 ) 是在1 9 世纪6 0 年代发展起来的一种分类 费率厘定方法,该方法通过一个方程组建立损失数据和各个费率因子之间的关系, 并通过迭代法求解未知参数的最优解。与单因素分析法相比,最小偏差法有了很 大进步,但最优解一旦确定以后,最小偏差法并不能提供一种统计方法对特定费率 因子的显著性进行检验,也不能确定参数估计的置信区间。因此,最小偏差法的主 要缺陷是缺乏一个完整的统计分析框架对建模结果进行评价。 3 2 3 多元线性模型 在多元线性回归模型( 陆宝群,2 0 0 4 ) 中,因变量( 索赔频率、平均偿付率、 偿付额等) 被表现为自变量( 风险分级变量) 的线性组合,例如,对于保单组合 中的第i 份保单,r = 屁+ 层五,+ 厦鼍,+ + 专 ( 3 1 ) 其中:r 第i 份保单的因变量取值: x 。第j 个随机变量取第i 个值; ,第j 个随机变量对因变量的影响; 专随机误差。 模型参数要使误差的平方和最小,即: 等= 【r 一( 反十屈x ,+ 屐,x :,+ ) 】2 ( 3 2 ) 在实践中,有一些变量是定性变量,如投保人的性别。有些变量看似定量变 量,在模型处理中作为定性变量处理,如通常将投保人的年龄分成各个年龄段, 投保人处于哪个年龄段作为一个定性变量。 我们认为每个保单组中的保单是同质的,所以,在上面的模型中,用各个保 单组的平均偿付额c ,“_ 肛代替每个保单的偿付额,x ,可解释为第j 个 自变量取第i 个值对保单组内保单的平均偿付额的影响。拟合公式为: = 反+ 届,+ 反,+ 】+ ( 气气1 其中: c ,肌子集i j k l 的偿付成本; 肌子集i j k l 的保单数。 多元线性凹归模型在财险分类费率的厘定中有很广泛的应用,但其严格的假 设条件在财产保险中通常难以得到满足: 9 第3 章保险产品定价的相关理论 要求因变量服从萨态分布在很多情况下是不现实的,譬如索赔频率、次均赔款 和续保率等通常不会服从正态分布。 如果因变量是严格非负的,那么从直观上看,当因变量的均值趋于零时,其方差 也应该趋于零,即因变量的方差应该是其均值的函数。但在多元线性回归模型中, 假设因变量的方差是固定的常数,与均值没有任何关系。 多元线性回归模型假设分类因子具有可加性,但实际上保险数掘常存在乘法关 系。 3 2 4 广义线性模型 3 2 4 1 广义线性模型概述 非寿险精算学中面临一个重要问题就是给定已被几个特征分类的一个风险组 合,如何构建或分析一个评级系统。数理经济学家们可能会诉诸于多元线性模型 来识别和调整潜在的数据生成机制。为了恰当地应用线性回归模型,相关变量必 须是可加的,误差项必须是可加的,即要求分布是对称的。另外还要求方差不依 赖于均值( 异方差性) 。但是在保险应用中所使用的模型常常是乘法模型,因此 只在对数形式下是线性的。一般情况下,索赔次数服从泊松分布,方差和均值相 等,或服从过度离散的类泊松分布( 方差均值是一个大于l 的常数) 。这些分 布都是不对称的和异方差的。索赔额的密度函数形式一般形如伽马分布,没有左 拖尾而有显著的右拖尾,因此是非对称的。克服这些问题的最好方法就是利用由 n e l d e r 和w e d d e r b u m 引入的广义线性模型( k a a se ta l ,2 0 0 1 ) 。广义线性模型包容 了应用非常广泛的l o g i s t i c 模型和对数线性模型等。广义线性模型将经典模型 中因变量的正态假设放宽为具有离散参数的指数分布,这大大扩展了其在非寿险 精算中的应用。有了这个分布假设,广义线性模型既可以对连续型变量进行拟合, 也可对离散型变量进行拟合;既可对对称性变量进行拟合,也可对分布具有较大 偏度的变量进行拟合;对财产保险中的常用变量,如索赔次数,损失额度,损失 率,索赔频率等都可以建立广义线性模型进行拟合并进行预测和估计。通过联结 函数将反应变量和解释变量之间的关系设定为非线性关系,这不仅为拟合属性变 量和取值为特定区间( 如事情发生的概率) 的变量提供了可能,从而克服了经典 线性模型应用上的局限性。 广义线性模型主要包括以下三个组成成分: 随机成分: 独立观测值x 匕的密度函数服从指数家族的分布,具备参数“( 表示均 值) 和中( 指离散参数) 。所谓的指数家族是指具有相同形式的密度函数,包括 正念,泊松伽马分命,负二项分布,逆高斯分布,指数分布等 第3 章保险产品定价的相关理论 系统部分:p 个变量共同给出线性预测子7 7 :7 7 = x 。 联结函数:随机成分和系统部分的关系由联结函数g 给出,函数g 是单调可导 的。 e ( y ) = = g 叫( 瑁) ( 3 4 ) 指数家族的密度函数形式为 ,( 只;9 ,矽) :e x p 2 掣+ c ( ,矽) ( 3 。5 ) 口,l 伊j 其中口,( ) ,6 ( 9 ) ,c ( 只,矽) 都是具体的函数,函数的形式决定分布的形式。 p 是与均值相关的参数,矽是与方差相关的形状参数。 哳( y ) :至塑, ( 3 6 ) w 其中v ( x ) 是方差函数,w ,是指代第i 个观测值的权重。在保险数据中,若拟 合索赔频率,则这个权重为风险单位数:若拟合次均赔款,彬则为第i 个保单组 的索赔次数。 从指数家族的密度函数和方差我们可以看出指数家族的两个特征: 指数家族的分布完全取决于均值和方差的大小; r 的方差是均值的函数:哳( z ) :丝笠。 w 当p = o ,l ,2 ,3 时,随机变量r 的分布分别对应为正态分布,泊松分布,伽马分布, 和逆高斯分布。指数家族的特殊一员是t w e e d i e 类分布( a n d e r s o ne ta l ,2 0 0 5 ) 。这 种分布的特点是随机变量有许多零取值和其他取值的分布值较宽且方差函数中 l o ,1 p 0 , 0 ) 的伽马分布的前提下,该保单组合中的任意一份保单单位时间内发生k 次的概率 是 第3 章保险产品定价的相关理论 ( 3 1 4 ) 这就是负二项分饰的概翠分布。即非i 刊质的1 呆单组合中的泊松参数旯服从伽马分 布时,索赔次数服从负二项分布,其显著特点是其方差大于均值。即, 索赔次数的均值 = 吾, 方差2 芳( i + 去) 我们用广义线性模型对索赔次数建模,索赔次数的均值u 是一系列独立变量的指 数函数。即 l o g ( ) 5 l o g 州) + a 十b 1 謇x l + b 2 拳x 2 + + b 。木x 。 ( 3 15 ) 其中n 指每个保单组中的风险单位数。从公式中可以推出,索赔频率的对数 l o g ( n ) ,是一系列独立变量的线性函数。在s a s 中,p r o cg e n m o d 程序可用 来拟合p o i s s o n 回归模型。 统计量d e v i a n c e 和p e a r s o nc h i s q u a r e 除以自由度后可以用来度量p o i s s o n 回 归的离散问题( 过度离散或离散不足) ,如果这个值大于1 表示过度离散,即真实的 方差大于其均值;如果这个值小于1 则表示离散不足,即真实的方差小于其均值。 过度离散或离散不足表明泊松回归模型拟合效果不好。过度离散可以通过基于泊 松和负二项分布的似然比检验出来。这个检验的原理是:泊松分布的均值方差相 等而负二项分布中方差大于均值。负二项分布中,方差= 均值+ k 木均值 2 ( 当 七= o 时,负二项分布变为泊松分布) 。所以检验时原假设:h 。:k = 0 ;对立假 设:h :k 0 这个检验的步骤如下:假定索赔次数服从负二项分布,拟合回归 模型,记录l l 值( 似然比对数) ;假定索赔次数服从泊松分布,拟合回归模 型,记录l l 值:利用似然比检验,计算统计量l r 。 l r - 2 ( l l ( 泊松回归) l l ( 负二项回归) ) ( 3 1 6 ) 在显著性水平仅下,若l r ; ) ,则拒绝原假设,即认为索赔次数服从负二 项分布。 ( 2 ) 次均赔款( s e v e r i t y ) 的广义线性模型 在估计次均赔款时,典型广义线性模型是伽玛乘法模型( r e n s a w ,1 9 9 3 ) 。之所 以选用g a m m a 模型等要因为:第一,若假设次均赔款服从g 姗m a 分布,则模型 认定方差以期望值的二次方指数倍增加,这符合车辆保险次均赔款数据的实际情 况:第二,g 狮m a 分布对货币度量具有不变性,也就是说用美元表示赔款额和 1 4 允 2 以 l m _ m 吣 a 一 一口 产一| 邯 = , 一、 ”w1j i i 一矽 ) 6一- 0 一 悱晦 ,l、, 尸 “ l l p 只 文 第3 章保险产品定价的相芙理论 用人民币表示赔款额结果是相同的,而p o i s s o n 等其他分布就没这种特性。g 锄m a 乘法模型使用对数联结函数和伽玛分布的误差项,并用索赔次数加权,调用 s a s g e n m o d 对次均赔款建模。 假定z 小是第i 个保单组第k 次索赔的索赔额;q 是第i 个保单组的索赔 次数;y 是所观察到的第i 个保单组的平均索赔额。 觎 r = 乙 ( 3 1 7 ) 假定生成索赔次数的随机过程服从伽马分布, e z 溆= m t 哳( 乙) = 伊2 2 索赔次数之间相互独立。因此有: ( 3 1 8 ) ( 3 1 9 ) “= e 【r 】= 吉善e ( 乙) = 去肌,= 2 0 ) 恸= 喜坳c 乙,= 去口2 啊2 = 矿鲁 2 , 将r 作为因变量,采用l o g 联结函数,建立广义线性模型。 弘= ( r ) = e x p ( 口+ 属+ ) ( 3 2 2 ) 这个模型与p o i s s o n 回归在方法上并没有本质的区别。只不过误差项服从g a m m a 分布。 3 2 4 4 l o g i s t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业管理-非宅腾退工作流程 SOP
- 2025年小学六年级科学试卷及答案
- 2025年德语写作题库及答案
- 2025年山东省威海市事业单位工勤技能考试题库(含答案)
- 山区道路施工方案
- CN120110800B 一种基于分布式零知识证明的匿名数据合规性检查方法 (暨南大学)
- CN120107759B 一种视觉识别算法容器动态调度方法、系统、设备和介质 (千巡科技(深圳)有限公司)
- CN120103506A 基于三维激光扫描的半煤岩巷道围岩松动圈动态探测装置 (内蒙古黄陶勒盖煤炭有限责任公司)
- CN114091062B 职业数据处理方法及装置(支付宝(杭州)信息技术有限公司)
- 河北省沧州市任丘市任丘市麻家坞学区2024-2025学年三年级上册期中考试科学试卷(含答案)
- 临床微生物学检验标本的采集和转运试卷
- 佳酿贺喜升学宴金榜题名踏新程热烈庆祝某同学金榜题名模板
- 医学美容技术专业《美容医学咨询与沟通》课程标准
- 营养指导员理论知识考试题库及答案
- 2024生产安全事故隐患排查治理规定(修订征求意见稿)
- 2024年儿童保健考试复习题库(含答案)
- 02J401 钢梯【含03年修改】图集
- 罚款减免申请书范文(19篇)
- 健康管理中的营养监测与干预
- 共同黏膜免疫反应研究进展
- 高等学校英语应用能力考试大纲
评论
0/150
提交评论