两类零膨胀负二项回归模型在汽车保险定价中的应用

上传人：7*** IP属地：湖北上传时间：2022-02-02 格式：DOC 页数：5 大小：27.50KB 积分：15 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、两类零膨胀负二项回归模型在汽车保险定价中的应用第10卷第12期南阳师范学院学报Vol10 No.122011年12月Journal of Nanyang Normal University Dec2011收稿日期:20110728作者简介:徐昕(1979)，河南郑州人，博士，讲师，主要从事风险管理与保险精算研究两类零膨胀负二项回归模型在汽车保险定价中的应用徐昕1，郭念国2(1首都经济贸易大学金融学院，北京100070;2河南工业大学理学院，河南郑州450001)

2、; 摘要:讨论了两种分布形式的零膨胀负二项回归模型，并应用一组实际汽车保险损失数据对两类模型进行了实证比较结果表明，对于具有零膨胀特征的损失数据，零膨胀负二项回归模型的拟合结果优于普通索赔频率回归模型关键词:零膨胀;负二项分布;回归模型;索赔频率中图分类号:F 84065;O29文献标识码:A文章编号:16716132(2011)12001805 0引言汽车保险定价中纯保费的计算一般需要两个过程，即首先计算投保车辆的索赔频率，然后

3、计算投保车辆的索赔额度，二者的乘积即是汽车保险的纯保费由此可以看出，索赔频率是汽车保险定价的基础传统的泊松回归模型是索赔频率预测模型中最常用的模型，具有均值等于方差的特性然而，对于汽车保险的实际损失数据，通常是方差大于均值或者是具有零膨胀特征，即索赔次数在零点处的概率堆积产生零膨胀现象的原因有很多，通常表现为下面三种情况:一则由于许多保单都有免赔额，这样会使投保人对事故损失小于免赔额时，不申请索赔;另外大多数保险公司采用奖惩系统(bo-nus-malus systems，简记BMS)，使得保单持有人发生事故时会权衡利益得失，再决定是否索赔;还有一种是投保人购买了汽车保险之后，因某些原因而不使用

4、投保车辆，也就没有相应的索赔在这些情况下，传统的泊松回归模型不能满足假设条件，继续使用都可能导致在保险定价过程中高估参数的标准误差，低估其显著性水平，从而导致不公平保费对零膨胀现象的研究最早可以追溯到Johnson和Kotz1，两人只是在理论上做了初步研究Lam-ber2首次将零膨胀泊松回归模型应用到实际中，并对制造业中的焊接点的瑕疵数据进行了拟合分析之后，零膨胀模型在精算领域中的应用也逐渐受到学者的关注Yip和Yau3运用不同的零膨胀模型对一组车险数据的索赔频率进行了拟合比较分析，讨论了多种常用的零膨胀回归模型在非寿险精算中的应用Jean-Philippe Boucher等4用几类零膨胀混合

5、泊松和Hurdle模型对一组西班牙车险损失数据进行了研究，并对模型进行了详细比较，得到了较好的拟合效果Jong和Heller5在广义线性模型的框架内对寿险数据的统计分析进行了梳理，并结合实际数据对零膨胀模型进行了应用分析近年来，国内学者对零膨胀模型在精算领域的研究成果也越来越多刘源、徐昕6初步探讨了保险实务中的多零问题徐昕、尹占华、郭念国7研究了零膨胀泊松、零膨胀负二项以及Hurdle模型在非寿险精算中的应用，利用一组实际车险数据对模型进行了拟合验证，拟合效果得到了改善徐昕、袁卫、孟生旺8讨论了一类新的零膨胀广义泊松回归模型ZIGP()模型在非寿险定价中的应用，并利用该模型对Yip和Yau的汽

6、车保险损失数据进行了拟合比较，得到了较好的效果郭念国9对零次索赔现象进行了分析，并提出修正的零膨胀泊松模型孟生旺、王维10利用零膨胀泊松回归、零膨胀负二项回归、零膨胀广义泊松回归和零膨胀模型对一组耳病发生频率的损失数据进行了拟合，结果表明，当实际数据存在零膨胀特点时，零膨胀回归模型可以显著改善对实际损失数据的拟合效果在上述的研究中虽然不同学者讨论了不同的零膨胀回归模型，但对零膨胀模型的研究仍然不够系统全面比如，负二项模型的研究中，理论上讲负二项回归模型有两种不同的分布类型，所以其相应的零膨胀负二项回归模型也有相应的两种分布类型前人的研究中并未讨论两类分布形式的零膨胀第12期徐昕等:两类零膨胀负

7、二项回归模型在汽车保险定价中的应用负二项回归模型，尤其在精算领域本文将讨论两种分布形式的零膨胀负二项回归模型，并利用SASEnterprise Miner中所用数据对模型进行拟合分析，并将拟合结果与传统泊松回归模型进行比较1泊松回归模型为便于讨论，假设共有p个分类变量，将所有保单分为n个风险类别，其中第i个风险类别在p个分类变量上的取值用xi=(xi1，xip)T表示，T表示转置用wi表示第i个类别包含的风险单位数(如汽车保险中的车年数)令Yi表示第i个风险类别的索赔次数随机变量，i=1，2，n如果Yi服从泊松分布，则其概率函数为:Pr (Yi=y)i=exp()iiyiyi!，yi=0，1，

8、(1)泊松分布的均值与方差相等，即E (Y)i=Var (Y)i=i若令i=wiexp xiT()，即可得到泊松回归模型，其中是p×1阶的参数向量容易求得泊松回归模型的对数似然函数为:l=ni=1(lnyi!+yilnii)回归参数的极大似然估计可以通过下述似然方程组求得:lj=ni=1(yi)ixij=0，j=1，2，p为了求得参数估计的标准误差，首先需要计算Hessian矩阵，其中的元素是关于对数似然函数的二阶偏导数，即Hjk=2ljk=ni=1ixijxik，j，k=1，2，p因此信息矩阵的元素为Ijk=E(Hjk)=ni=1ixijxik，j，k=1，2，p对信息矩阵对角线上

9、的元素先求倒数，然后再开方，即可得到参数估计的标准误差2两类零膨胀负二项回归模型的参数估计21零膨胀回归模型的一般分布形式假设索赔次数随机变量Yi是服从一个零膨胀结构的分布函数，为结构零比例参数，Yi的分布函数可以表示为:Pr Yi(=0)=+(1)Pr Ki(=0)，Pr Yi(=y)i=(1)Pr Ki(=y)i，yi=1，2，(2)其中Ki可以是传统的泊松分布或其他形式的离散分布，参数为常数，且01索赔次数Yi的均值和方差分别为:E(Yi)=(1)E (K)i，Var(Yi)=(1)Var (K)i+(EK)i 2

10、22两类零膨胀负二项回归模型参数估计221零膨胀负二项回归模型(zero-inflatednegative binomial，ZINB)一般来讲，根据负二项回归模型的均值与方差关系来确定其属于负二项类分布类型还是负二项类分布类型由于最常见的负二项回归模型属第类型，因其方差可以看做是均值的二次函数，因此这里先讨论ZINB分布函数及其参数估计在泊松回归中，一般假设风险类别是同质的，即均值i在每个风险类别中固定不变如果风险是非同质的，即在每一个风险类别中不同的个体风险具有不同的i，假设i服从均值为E()i=i，方差为Var()i=k2i的伽玛分布，则风险类别的索赔次数将服从下述负二项分布:Pr Ki

11、(=y)i=yi+k11y()ik1k1+()ik1·ik1+()iyi，yi=0，1，(3)上述的负二项分布的均值为E (K)i=i，方差分别为Var (K)i=i (1+k)i，其中k表示散度参数，因方差是均值的二次函数，所以上述负二项分布即为负二项分布当k趋于零时，其极限分布即为泊松分布当k0时，负二项分布的方差大于其均值，即具有过离散特征把上述负二项分布的概率函数代入式子(3)中，因01，不妨令=exp(a)1+exp(a)，即可得到零膨胀负二项分布(ZINB)，其均值和方差分别为E (Y)i=(1)i=i1+ea，Var (Y)i=E (Y)i1+i (1+k)E (Y)i

12、对负二项分布的均值i作回归，使用对数连接函数i=wiexp (XT)，则零膨胀负二项回归的对数似然函数可以表示为lZINB=nln(1+ea)+yi=0ln ea+(1+ki)k1+yi0yi1r=1ln(1+kr)yiln(k)ln(yi!)+yiln(ki)(yi+k1)ln(1+ki)·19·南阳师范学院学报第10卷对于ZINB回归模型的参数估计，可以利用Newton-Raphson迭代方法求解参数的迭代方程可以表示为(m)=(m1)+I(m1)1U(m1)，其得分向量的信息矩阵中的元素Uj，j=1，2，p可以表示为:Uj=lj=yi0(yi)i1+kixijyi=0

13、i(1+k)i1+k1ea+1+kixij，2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12·xijxisyi0i (1+ky)i(1+k)i2xijxis令信息矩阵中的元素为Ijs，j，s=1，2，p，则有Ijs=E2ljs=yi=0(1+k)ik1eai (1)i+i(1+k)i2(1+k)ik1ea+12xijxis+yi0i1+kixijxis求解参数a时，仍然利用迭代方程a(m)=a(m1)GG'，G与G'的表达式分别为G=la=nea1+ea+yi=0eaea+(1+k)ik1，G'=2la2=nea(

14、1+ea )2+yi=0ea(1+k)ik1ea+(1+k)ik1 2离散参数k的估计可以用矩估计，即令Pearson2统计量与其自由度相等而得到参数k的估计值为iyiE (y)i2Var (y)i=np，其中n是观测值个数，p是待估参数个数求解上述方程可以利用Newton-Raphson迭代公式K(m)=K(m1)MM'，其中M和M'的表达式分别为:M=iyii1+e()a2i1+ea1+i (1+k)i1+ea(np)，M'=Mk=iyii1+e()a211+ea1+i (1+k)i1+ea222零膨胀负二项回归模型(zero-inflatednegative bi

15、nomial，ZINB)如果风险类别的索赔次数服从下述ZINB分布:Pr Ki=yi xi=(ik1+yi)(ik1)(yi+1)k11+k()1ik111+k()1yi，yi=0，1，(4)就可以得到ZINB回归模型，其均值和方差为E (Y)i=(1)i=i1+ea，Var (Y)i=E (Y)i1+k+iE (Y)i对ZINB分布的均值i做回归，使用对数连接函数i=wiexp (XT)，则ZINB回归模型的对数似然函数可以表示为lnLZINB=yi=0ln+(1)11()+kik+yi0ln (1)+lnyi+ik(1)lnyi(+1 )lnik(1)+ik1lnk1yi+ik(1 )ln

16、 1+k()1对于ZINB回归模型，求解参数、k、a的迭代过程与ZINB相同，此处不再详述3拟合优度检验对不同模型的拟合优度进行比较的两个常用标准是AIC和BIC统计量AIC统计量定义为(Akaike11):AIC=2l+2p，(5)其中l表示对数似然值，p为参数的个数AIC的值越小，表明模型的拟合越好BIC统计量定义为(Schwartz12):BIC=2l+plog(n)，(6)其中的l也表示对数似然值，p为模型的参数个数，n为观测值的个数，BIC的值越小，模型拟合越好4实证分析41数据描述本文使用的数据来自SAS Enterprise Miner数据库中的汽车保险数据，Yip和Yau在研究

17、非寿险精算中索赔次数模型时也利用了这组数据，他们分别选取了五个费率因子及近一年的索赔数据为了便于比较，本文使用相同的费率因子和损失数据，具体见表142索赔次数拟合结果从表2的结果可以看出，两类ZINB模型的拟合结果对零次索赔的预测比较准确，对其他次数的预测值也比较接近实际观测值再根据对数似然值、AIC、BIC准则，两类零膨胀负二项模型对索赔次数的拟合效果最好·20·第12期徐昕等:两类零膨胀负二项回归模型在汽车保险定价中的应用表1费率因子费率因子因子水平性别女性(基准水平)男性婚姻状况未婚(基准水平)已婚汽车用途私人用途(基准水平)商务用途行驶区域郊区(基准水平)市区收入连

18、续变量43回归模型拟合结果表3为零膨胀回归模型的拟合结果，从结果中可以看出，无论是比较AIC还是BIC，两类ZINB回归模型的值都是最小的，因此可以认为，对于该组数据而言，ZINB回归模型的拟合效果相对较好另外，从两类ZINB回归模型的拟合结果来看，对于每一个费率因子的参数估计值基本相同，两者细微差别在于每个费率因子的标准误差的估计略有不同最后，结构零的比例参数在不同的零膨胀模型中的显著性恰恰说明了给定的索赔数据确实服从零膨胀结构模型表2观测索赔频数与拟合索赔频数次数实际观测到的索赔次数泊松分布负二项()负二项()零膨胀负二项()零膨胀负二项()0 1706 1245 1634 1634 17

19、06 17061 351 1014 620 620 423 4232 408 413 283 283 357 3573 268 112 137 137 201 2014 74 23 68 68 85 855 5 4 34 34 29 29比例参数05177(001130)05177(003624)散度参数K11489 11405 2454×108 1049×107泊松均值08151(001703)*08151(002496)*08151(002496)*16899*16899(003624)*2Loglikelihood75655 70020 70020 66952 669

20、52AIC75675 70060 70060 67012 67012BIC75735 70178 70178 67190 67190注:*表示在水平为5%下是显著的;()表示参数估计值的标准误差表3零膨胀回归模型拟合结果估计参数泊松负二项()负二项()零膨胀负二项()零膨胀负二项()截距12388(008910)*14210(01239)*12187(01045)*05619(004197)*05619(003082)*用途02750(004487)*03100(005835)*02895(006387)*01489(005139)*01489(005013)*婚姻状况01083(004260

21、)*009429(005582)01430(005976)01108(004877)*01107(004557)*行驶区域13919(008367)*16012(01158)*14071(009705)*12298(002655)*12298(007199)*收入002825(0004937)*003305(0006519)*003087(0006731)*001741(0005842)*001740(0005501)*性别01124(004393)*01341(005737)*01187(006147)005042(04468)005102(005063)散度参数K09522(007953)

22、*10309(008473)40427×107*40427×108*比例参数04468(001424)*04468(001408)*2Log-Likelihood 71184 66683 67492 65365 65365AIC 71304 66823 67632 65525 65525BIC 71660 67239 68048 66000 66000注:*表示在水平为5%下是显著的;()表示参数估计值的标准误差·21·南阳师范学院学报第10卷5小结本文讨论了两类不同分布函数类型的零膨胀负二项回归模型的参数估计以及拟合优度检验，并利用一组实际的汽车保险损

23、失数据对两类模型进行了实证分析51当索赔数据存在零膨胀特性时，零膨胀负二项回归模型较一般的索赔频率预测模型如泊松回归模型、负二项回归模型的拟合效果更优52对于该组数据而言，虽然两类零膨胀负二项模型对参数估计的拟合结果较为接近，但对于其他损失数据可能会得到不同的结果因此，利用两种类型的零膨胀负二项回归模型可以为精算人员提供更为丰富的预测工具参考文献1Johnson N L，Kotz SDistribution in Statistics:discretedistributionMNew York:Wiley，19692Lambert DZero-inflated poisson regressi

24、on，with anapplication to defects in manufacturingJTechnomet-ric，1992，34:1143Yip K C H，Yau K K WOn Modeling Claim Frequen-cy Data in General Insurance with Extra ZerosJIn-surance:Mathematics and Economics，2005(36):1531634Jean-Philippe B，Michel D，Montserrat GRisk classifi-cation for claim counts:a com

25、parative analysis of variouszero-inflated mixed poisson and hurdle modelsJNorthAmerican Actuarial Journal，2007(11):1101315Jong P D，Heller G ZGeneralized Linear Models forInsurance DataMCambridge:Cambridge UniversityPress，20086刘源，徐昕保险精算中的多零索赔现象探析J统计与决策，2008(21):21237徐昕，尹占华，郭念国零膨胀模型在非寿险中应用J统计教育，2009(4

26、):31338徐昕，袁卫，孟生旺零膨胀广义泊松回归模型与保险费率厘定J数学的实践与认识，2009(24):991079郭念国零膨胀泊松模型的改进在零次索赔建模中的应用J统计与信息论坛，2010(7):222510孟生旺，王维零膨胀损失次数回归模型及其应用J兰州商学院学报，2011(1):1711Aike HInformation theory and an extension of the maxi-mum likelihood principleproceedings of the 2nd inter-national symposium on information theoryJAka-demiai Kiade Budapest，1

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

两类零膨胀负二项回归模型在汽车保险定价中的应用

文档简介

温馨提示

最新文档

评论

两类零膨胀负二项回归模型在汽车保险定价中的应用

文档简介

温馨提示

最新文档

评论

相关文档