已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 本文以最小二乘理论思想为指导,以金融保险中的数据处理问题为背景,研究了具有 m a ( q ) 误差线性模型的协方差阵参数的估计问题,提出了分步估计方法,并结合b o o t s t r a p 理论、信度理论给出了参数估计的b o o t s t r a p 算法。主要的工作如下: 第一章介绍线性模型中最小二乘法的发展,同时经验估费中的信度理论和本文的主 要工作。 g - _ 章介绍本文所涉及的一些基本理论知识。第一节重点介绍最小二乘理论;第二节 讲述了b o o t s t r a p 理论的基本思想并通过具体的例子说明了实现b o o t s t r a p 方法的过程。 后两节分别介绍了信度理论和m a ( q ) 矩阵的相关知识。 第三章介绍具有m a ( q ) 误差线性模型的协方差阵参数的最小二乘估计。首先引出所 假定的模型,然后根据模型的假设及特点构造出方便应用最小二乘法的线性模型。最后 列出参数的广义最小二乘估计的表达式,并且说明了表达式中权矩阵的选择方法。 第四章在第三章的基础上,进一步发展了上述最小二乘法在所假设模型中的应用, 提出分步估计法。根据模型的特点,我们对待估参数进行分离,并且经过分离后两部分 参数均可以用同样的方法构造线性模型,进行最小二乘估计。通过参数分离有效减少了 在估计过程中由于参数向量的维数过高所带来的不利影响。 第五章结合b o o t s t r a p 理论及最小平方信度理论提出参数估计的b o o t s t r a p 算法。并 且针对具体问题模拟计算了参数的估计值在数据稀少的情况下,任何估计的精度往往 不够理想。而b o o t s t r a p 算法在一定程度上能够克服数据稀少的缺点,对估计的精度有一 定的改善。 关键词:最小二乘估计;分步估计;b o o t s t r a p ;信度理论;最小平方信度;m a ( q ) 赵金良:具有m a ( q ) 误差线性模型协方差阵参数的分步估计与b o o t s t r a p 算法 t w os t e p sm e t h o da n db o o t s t r a pa l g o r i t h mf o r c o v a r i a n c ep a r a m e t e r sf o rc r e d i b i l i t yr e g r e s s i o n m o d e l sw i t hm o v i n ga v e r a g ee r r o r s a b s t r a c t i nt h i sd i s s e r t a t i o n ,u n d e rt h eg u i d a n c eo ft h el e a s ts q u a r ee s t i m a t et h e o r y , l e a s ts q u a r e s e s t i m a t o r sf o rc o v a x i a n c ep a r a m e t e r sf o re r e d i b i n t yr e g r e s s i o nm o d e l sw i t hm o v i n ga v e r a g ee r r o r s a r ed i s c u s s e da n ds o m em e t h o d sf o re s t i m a t i n gt h ep a r a m e t e r sa r ep r e s e n t e da n di m p r o v e d t h e m a i nw o r ki sa sf o l l o w s : c h a p t e r1o ft h i sd i s s e r t a t i o ni sd e v o t e dt or e v i e w i n gt h eh i s t o r ya n dd e v e l o p m e n to ft h e l e a s ts q u a r ee s t i m a t et h e o r ya n dt h ec r e d i b i l i t yt h e o r yi ni n s u r a n c e c h a p t e r2c o n c e r n st h eb a c k g a o u n dk n o w l a g eo ft h i sp a p e r f i r s t ,t h eb a s i ct h e o r yo ft h e l e a s ts q u a r ee s t i m a t em e t h o di sd i s c u s s e d s e c o n d ,s o m ee x a m p l ea r ec h o s e nt oi l l u s t r a t eh o wt o u s et h eb o o t s t r a pp r i n c i p l ea tl a s t ,t h ee r e d i b i l i t ya n dm a ( q ) m a t r i xa r ei n t r o d u c e d t h em o s ti m p o r t a n tt h i n gi nc h a p t e r3i st od i s c u s sh o wt oo b t a i nt h el e a s ts q u a r e se s t i - m a t o r sf o rc o v a r i a n c ep a r a m e t e r sf o rc r e d i b i l i t yr e g r e s s i o nm o d e l sw i t hm a ( q ) e r r o r s b a s e do n t h ep r i m em o d e l w ec o n s t r u c tal j n e a rm o d e l s ow ec a no b t a i nt h eg e n e r a l i z e dl e a s ts q u a r e s e s t i m a t o r se a s i l y a l s o ,s o m em e t h o d sa r eg i v e nt os h o wh o wt oc h o o s ew e i g h tm a t r i xi nt h e f o r m u l ao ft h eg e n e r a f i z e dl e a s ts q u a r e se s t i m a t o r s b a s e do nt h ec h a p t e r3 ,i nc h a p t e r4 ,t h el e a s ts q u a r ee s t i m a t ei sd e v e l o p e da n dt h et w o s t e p sm e t h o di sp r e s e n t e d w i t ht h ec h a r a c t e ro ft h et h ep r i m em o d e l ,w ef i n dt h ep a r a m e t e r v e c t o rc a nb ed i v i d e di n t ot w op a r t s e a c ho ft h e mc a nc o n s t r u c tt h el i n e a rm o d e lw i t ht h e s a m em e t h o di nc h a p t e r3 t h et w os t e p sm e t h o dc a nr e d u c et h ed i m e n t i o no ft h ep a r a m e t e r v e c t o r i nc h a p t e r5 ,t h eb o o t s t r a pm e t h o di su s e dt oe s t i m a t ep a r a m e t e r s t h eb o o t s t r a pm e t h o d o v e r c o m et h el a c ko fd a t a n u m e r i c a le x a m p l ei sa l s oi n c l u d ei nt h i sc h a p t e r k e y w o r d s :l e a s ts q u a r ee s t i m a t e ;t h et w os t e p sm e t h o d ;b o o t s t r a p ;t h ec r e d i b i l i t y t h e o r y ;t h el e a s ts q u a r ec r e d i b i l i t yt h e o r y ;m a ( q ) i i 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的 研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致 谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也 不包含为获得大连理工大学或其他单位的学位或证书所使用过的材 料。与我一同工作的同志对本研究所做的贡献均已在论文中做了明 确的说明并表示了谢意。 作者签名:蛙竺堡日期:塑:! :也 型垒垦:星互丝墨( 虫堡董丛垡堕型堡互重堕茎塑堕坌塑笪笪里里! 堕! ! ! 望兰鲨 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解呔连理工大学硕士、博士学位论文版权使用规 定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子版, 允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内容编 入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论文 作者签名 导师签名 知矗仡, 篓迎 丝年! 主月二竭 大连理工大学硕士学位论文 1 绪论 1 1 线性模型中最t j 、_ - 乘法的发展 线性模型与最小二乘法是数理统计学中的两个重要而又密切联系的主题,虽然最小 二乘法在统计中的应用不仅仅限于线性模型,但无可怀疑,线性模型是最小二乘法( 及 其变种) 在统计中应用最成功的领域,其成果具有理论上的深刻性和应用上的广泛性 从历史上考察,最小二乘法起源于求解线性矛盾方程组的问题,用现在的术语说,后者 则是源于线性模型参数的估计问题。至于线性模型本身,则是起源于天文和测地中的误差 分析问题。其一般模式是这样的:设在一个问题中涉及量钆,唧和卢,岛,前者 是易于或可以直接观测的量,后者是难于或不可直接观测的量根据某种理论,这些量在一 定的近似程度内有关系。o + x l 所+ + 。p 岛= 0 。问题是要依据( x o ,2 :1 ,) 的一些观测 值( 2 ,。一) ,1 5 i 兰,去估计岛,岛按e 述理论关系应有z 铡+ 。1 t 压+ + z p 昂= 0 ,1 i n 由于一般总是n p ,故得到矛盾方程组。包括e u l e ,l a p l a c e 在内的一些 大学者都曾致力于研究这个问题,但未能提出合适的解法最后是法国学者l e g e n d r e 在 1 8 0 5 年提出用最小二乘来解这个问题,得到学界的公认,并在应用上得到推广。从这段 历史可以看出线性模型与最小二乘法两个主体的密切联系。 接着在1 8 0 9 年g a u s s 提出以正态分布作为测量误差的分布,并在这个基础上发展了 最小二乘估计的统计理论。其中包括现在人们所周知的,作为这个方法的基础理论成果 g a u s s m a r k o v 定理有了这已发展,才使最i j 、- - 乘与统计联系起来。以上是这些 发展在统计史上享有极高的评价,被认为是1 9 世纪数理统计学的中心主题 但在1 9 世纪大部分时间,以上的发展被认为纯属误差论的范围,与统计分析不相 干。当时流行的观点认为误差处理的是对个对象多次观测的数据,而统计学处理的是 对一个群体中些不同个体的测量数据,两者有本质的不同但当时也有些学者,主要是 q u e t e l e t ,从经验中注意到统计数据也往往很拟合于g a u s s 的正态分布,而主张l e g e n d r e g a u s s 这套方法也用于统计数据到1 9 世纪后期,g a l t o n ,e d g e w o r t h ,p e a r s o n 和y u l e 等人提出和发展相关回归分析,引进多元正态分布作为描述多位数据的统计模型,特别 是发现了再多维正态中一个变元的条件期望是其他变元的线性函数,从而把相关回归分 析与线性模型联系起来,也为最小二乘法在此领域中的应用敞开了大门。这些发展确立 了线性模型一最i j 、- - _ _ 乘法在统计分析尤其是在回归分析中的中心地位,意义十分重大, 被视为在l e g e n d v e g a u s s 以后线性模型一最小二乘法这个体系发展过程中又一个里程 碑。 下一个重大发展是在2 0 世纪初的2 0 余年,s t u d e n t ,f i s h e r 等导出了正态样本的一 些重要统计量的精确抽样分布,f i s h e r 在2 0 世纪2 0 年代提出方差分析法一一这可是线 性模型的离散化,为线性模型一最小二乘法这个体系找到了一种全新的且十分重要的应 用,使这个体系发展史上第三块有重要意义的里程碑。经过这些发展,线性模型一最小 型垒垦:墨查! ! 丝( 塑堡差垡堂塑型塑立薹堕量墼塑坌芝笪盐兰曼! ! ! ! ! ! 婴蔓鳖 二乘法这个体系最终确立了其在统计方法中的中心地位。虽然在以后许多更复杂的模型 和方法被引进到统计学的研究领域中,但从应用的角度看,这个体系的中心地位并为基 本动摇。 自这以后,这个体系还没有像上述那样的基本意义的成果,但7 0 余年来,在深度和 广度上,还是有不少重要的发展,其中一些很有实用意义。 1 2 经验估费中的信度理论 信度理论萌芽于2 0 世纪2 0 余年代,至今已有8 0 年的历史最早的信度理论被以外 险精算师用于计算劳工赔偿保险费率。 信度理论在非寿险精算中理论与实务中具有重要地位。其在精算科学中的应用可以 分为两种类型第一类是横向应用,第二类是纵向应用信度理论有两种基本方法:有 限波动( l i m i t e df l u c t u a t i o n ) 信度和最大精度( g r e a t e s ta c c u r a c y ) 信度。在最大精度信 度方法中发展最完善的方法是最小平方信度( l e a s ts q u a r e sc r e d i b i l i 缸) ,它试图是估计 误差平方的的期望值最小 如果c 的估计量0 是由先验信息数据m 和最近的观察值t 加权获得,即: d = f l z ) m + z t 有限波动方法的最初含义是指,求使0 与c 的相对误差不超过一定限度的概率足够大的 z 值,也就是要使: b f 等f 0 ,存在n 阶非奇异的 对称阵b ,使g = b 2 ,令y = b _ 。,x = b - 1 x ,则 e p = b 一1 e y = b x y = 童口 8 大连理工大学硕士学位论文 y n r ( p ) = b 一1 y 。r ( y ) b 一1 = 0 - 2 矗 由此,( p ,贾卢,0 - 2 厶) 是一个g a u s s m a r k o v 模型,有该模型得到的l s e 西= ( 盅7 贾) 一1 贾7 p = ( x 7 g 一1 x ) 一1 x 7 g 一1 y( 2 1 4 ) 称为卢的加权最小二乘估计,由定理2 2 ,它是卢的b l u e , 加权最小二乘估计应用很广,尤其是对截尾样本。 考虑一类常用的位置一尺度分布族,其分布函数有形式f ( 2 ) ,密度函数有形式 ;,( 2 ) ,其中p ( 一。 0 ) 对某些f ( 譬如正态分布) ,有众知的一些方法和结果。此处我们考虑这样一类估计,它 们是次序统计量的线陛函数。 设1 】s ,) 为观测到的前r 个次序统计量令x ( i ) = ( ) - 卢) 0 - ,i = 1 ,r , 则置1 ) 兰墨n 相当与抽自f ( 。) 的容量为n 的前r 个次序样本记 e x o ) = 啦, = 1 ,。,r c o v ( x ( o ,x o ) ) = 啊,1 t ,j r 其中啦,只依赖与r 和f 而与卢,a 无关。由于 o = p 十0 - x ( i ) = p + 口啦+ e i 其中矗= 0 - ( x ( o m ) 。记y t = ( k 1 ) ,) ) ,a 7 = ( ,n ,) ,用矩阵表示,有 吖呲n ,( :) v a t ( y ) = a 2 v = o - 2 ( v l d ) , 其中1 ,表示全部有元素1 组成的向量。这是广义g a u s s m a r k o v 模型,利用式( 2 4 ) 可 出芦和口的b l u e 为 ( :) = ( a 耳t y v 一- 1 1 1 1 r ra t v - 1 l r ) 一1 ( ) y 一1 y 圭( ! ;) c 。工s , 其协方差阵为 哳( ;) 一( 貉臻v 叫- 1 1 。2 ) 1 皿瑚, 该估计方法有一个明显的优点:不论n 个样品中被观测到的样品个数是多少( 当然 不能少于2 ) ,上述过程均可类似进行该性质使得它在可靠性中有这广泛应用,譬如, 当s ( v ) 是j 型极值分布1 一e 印 一e 印( ) ) 时,对大量的n 和r ,式中的系数已编制成 表,可直接查用,这使得该估计方法的运用更显方便 6 6 。 9 型垒垦:墨互丝垒i 盟堡垄丝壁蕉型堡复叁堕量塑堕坌生笪盐复望! ! 塑! ! 翌蔓鲨 2 2 b o o t s t r a p 理论介绍 这里所讲的b o o t s t r a p 方法又称自助法,即从已知样本总体中重复抽样产生观察值, 对总体分布作出估计。记样本x = ( 五,瓦) 表示分布函数f 的随机抽样,也即, 噩独立同分布且其共同的分布函数为f 。在非参数问题中,记重复抽样的样本为矿= ( 舛,j 皤) ,其中每个耳随机的从x 中抽取,满足: p ( 弼= x j l x ) = :,1 幻曼n 在参数问题中,当估计出分布函数f 中参数后,再从已知的分布中重复抽样所得的样本 即为矿。不管是在参数或者非参数问题中,我们均用p 表示重复抽样样本矿的的分布 函数为了方便说明b o o t s t r a p 迭代,我们通常用( f 0 ,f 1 ) 表示( 只户) 。对i 1 ,只表示 在分布函数日一中所抽取的样本的分布函数。 给定个泛函五, ,t r ) 我们称 e 饥( 岛,日) m ) = 0( 2 2 i ) 为总体方程。这里蜀表示总体分布函数,f 1 是从总体中抽样所得样本的分布函数。只要 确定t 的一个值t o 便可以解出真实参数的估计值。用( f l ,f 2 ) 代替总体方程中的( f 0 ,毋) 所得的方程称为样本方程这里f 2 为在f 1 的条件下从f 2 中所抽样本的分布函数。由样 本方程可解出t o 的个估计值南,晶是样本的函数。我们称晶和e f t ( f 1 ,局) 旧 分别 是t o 和耳 ( f o ,f 1 ) i f 0 ) 的b o o t s t r a p 估计。用样本方程的解去近似总体方程的解,这一 原理称为b o o t s t r a p 原理。 对一个参数0 的估计d ,为了便于说吼我们把它记做d = 口喇= e ( p ) 。例如,如 果0 = o ( f ) = ,x d f ( x ) 是样本均值,则: n , 口= r t - 1 = p p ) = 砌扫) i = 1 。 下面通过一个例子说明b o o t s t r a p 估计的过程。 例:b o o t s t r a p 纠偏估计 定义泛函 为: ( f 0 ,f 1 ) = 口( f 1 ) 一日( f o ) + t( 2 2 2 ) 则相应的样本方程是: e p ( 马) 一日( f 1 ) 十t f 1 ) = 0 解样本方程得 t = 南= p ( f 1 ) 一e 口( f 2 ) if 1 ) 因此,b o o t s t r a p 纠偏估计为: 0 1 = p + 晶= 2 0 ( f 1 ) 一e 日( f 2 ) if 1 )( 2 2 3 ) 1 n 大连理工大学硕士学位论文 令肛= f z d f o ( z ) 表示样本均值,下面讨论o o = e ( f o ) = 矿的估计问题。 记) ( 1 = x 1 ,五。) 为样本,完= n 一1 噩为均值。在非参数问题中有自= o ( f ) = 贾3 则有: e 0 ( f 1 ) i f o = e 似+ n - 1 隅一p ) ) 3 仁= 1 = p 3 + 7 z - 1 3 h a 2 + n - 2 7( 2 2 4 ) 这里矿= e ( x 1 一p ) 2 ,1 = e ( x l p ) 3 。与式子( 2 2 4 ) 相仿可以得到: e 0 ( f 2 ) e f l = 2 3 + 一1 3 贾子2 + n - 2 , ,( 2 2 5 ) 这里占2 = n 一1 ( 托一贾) 2 ,= n 一1 ( 五一j ) 3 故由式子( 2 2 3 ) 可以得到非参情况下的 b o o t s t r a p 纠偏估计为: 口1 = 2 0 ( f 1 ) e ( o ( f 2 ) 1 日) = 2 2 ) 3 一( 2 3 + ? z - 1 3 r 0 2 + n - 2 二) = 2 3 一n 一1 3 贾子2 一n 一2 寸( 2 2 6 ) 在参数情形下,假设服从正态分布n ( u ,a 2 ) ,则7 = 0 ,从而有: e o ( f 1 ) i f o = 矿+ n - 1 3 # 0 2 ( 2 2 7 ) 我们可以用极大似然估计 = ( 贾,铲) 去估计参数向量a o = ( “a 2 ) 。则f 2 是正态分布 n ( x ,铲) ,仿照式( 2 2 7 ) 可得: z e ( f 2 ) i f l = 贾3 + ? z - - 1 3 贾护( 2 2 8 ) 由式子( 2 2 3 ) 可以得到正态分布情况下的b o o t s t r a p 纠偏估计为: 矗= 2 0 ( f a ) 一e p ( 马) i f l ) = 2 3 一n - 1 3 2 # 2( 2 2 9 ) 若我们采用i = ( 2 ,子2 ) 代替 = ( 2 ,占2 ) ,这里孑2 = 一1 ) 一1 ( 墨一贾) 2 为样本方差的 无偏估计,在这种情况下,参数的b o o t s t r a p 纠偏估计为: 岛= 2 3 一n - - 1 3 贾占2( 2 2 1 0 ) 同理,考虑在指数分布情况下参数的纠偏估计问题。假设指数分布的均值为“,其密度 函数为: 丘( z ) = # - 1 e 一。肛,z 0 相应地,口2 = 卢2 ,7 = 2 芦3 ,则有: z o ( f 1 ) i f o = p 3 ( 1 + 3 n 一1 + 2 n 一2 ) 1 1 赵金良:具有m a ( q ) 误差线性模型协方差阵参数的分步估计与b o o t s t r a p 算法 = 贾是a o = p 的极大似然估计,则毋是均值为i = 霄的指数分布,则 e 0 ( f 2 ) i f , = 贾3 ( 1 + 3 n 一1 + 2 n 一2 ) 此时,参数的b o o t s t r a p 纠偏估计为 巩= 支3 ( 1 3 n 一2 n 一2 )( 2 2 1 1 ) 由式子( 2 , 2 6 ) ,( 2 2 9 ) ,( 2 2 1 0 ) ,( 2 2 ,1 1 ) 所定义的参数p o 的估计口l ,相对与基本的 b o o t s t r 印估计目= 日( f 1 ) 来说,更加接近无偏估计( 在估计口= p ( f 1 ) 有偏的情况下) 。为 了更好的说明这一点,我们假设总体分布的三阶矩存在,有: e ( 2 3 ) = 矿+ t 2 - 1 3 # o r 2 + n - 2 7 e ( 2 3 疗2 ) = 肛仃2 + 托一1 ( 7 一肛玎2 ) 一n - 2 一f 目( ) = 7 ( 1 3 n 一1 十2 n 一2 ) n 一2 3 ( 卢盯2 1 ) + n - 3 6 ,y n - 4 2 7 ,( 1 ) n - 2 3 1 2 0 2 , ( 2 ) 0 , ( 3 ) 一卢3 ( 9 n 2 + 1 2 n 一3 + 4 n 一4 )( 4 ) 其中( 1 ) ,( 2 ) ,( 3 ) ,( 4 ) 分别与( 2 2 6 ) ,( 2 2 9 ) ,( 2 2 1 0 ) ,( 2 2 1 1 ) 相对应由上式我f f 可以看出, b o o t s t r a p 纠偏估计的结果使估计值与真实值之间的误差减小到不高于o ( n 一2 ) 的水平。 2 3 信度理论 2 3 1 引言 非寿险数据的估计可以根据两类数据:一类是根据观察得到的本险种一组报单的近 期损失数据;另一类是同险种报单早期损失数据或类似报单的同期损失数据,它是根据 人们的主观选择得到的数据,所以称为先验信息数据。 单纯根据前一类数据确定的保险费称为经验保险费,记为p 坂;而单纯根据先验信 息数据确定的保险费叫作先验信息保险费,记为p i 如。 所谓信度理论,在这里,就是研究如何合理利用这两类信息,用两类保费的加权平 均: p m l = ( t z ) p m o 十z p 埘。( 2 , 3 1 ) 作为后验保费的估计。其中z ( o z 曼1 ) 称为信度( c r e d i b i l i t y ) 或可靠性因子 1 2 ,l-jfljl【 = 如一 ) 口 ( f 6 大连理工大学硕士学位论文 只有正确选择信度z ,才能调整后的保险费接近于真实风险水平,当z 的值接近于 1 时,表明实际数据提供的信息相当充分,据此足以获得正确的估费;而当z 的值接近于 0 时,则只能基于先验信息估费,得到先验保险沸的估计值。特别的z = 1 时,称为完全信 度( f u l l c r e d i b i l i t y ) 。一般地,当z ( o z k e t ) k e t ) ( 妻+ i ) z t ( 字 或: 只 t s ( i k + i ) e t 1 一字= 字口 如果用t 。表示t 的分布的q 百分位点,则: ( 妻+ 1 ) e t = 。字 ( 2 舢) 从中可以解出所求的z 。 特别地,如果t 的分布是正态分布或近似于正态分布,则 z = 田嶂拓丽 ( 2 3 - 7 ) 这里u ! 笋表示标准正态分布的字百分位点。 2 3 3 最小平方信度 所谓最小平方信度,简单的说,就是求使信度估计误差平方的期望达到最小的信度 因子z 的值。 沿用上节的记号,c 的信度估计0 可以表示为: c = z t + f l z ) m 1 4 大连理工大学硕士学位论文 其中t 为观察值的期望,吖为被估计量的期望。最小平方信度方法就是要找出z ,使 e 【d 一0 j 2 = e z t + ( 1 一z ) m g 2 ( 2 38 ) 达到最小,用这样的z 计算出来的0 称为c 的最小平方信度估计。 可以证明,满足上述条件的z 可以表示为z = i 旱耳,其中n 为样本容量,k 的分 子、分母分别为被估计量的条件方差的期望和条件期望的方差,即: k = 勰 ( 2 。9 ) 我们从一个具有典型意义的问题入手。假设对类风险的损失作n 为的观察,把第i 类风险在第”年的单位损失( 即损失与风险单位之比) 记为墨。假设备类风险的风险单位 数相等,第i 类风险的损失服从某个索赔次数的分布和索赔额的分布,其分布参数用向量 o i 表示。给定巩,托。的条件期望,记为e ( 置。慨) = m t ,条件方差记为v a t ( 强。| 以) = s 。 现在要估计第g 类风险在将来某年的纯保费( 即单位损失) 采用信度方法,很自然 地用第g 类风险在n 年中观察到地平均单位损失作为t ,用所有类风险的期望单位 损失作为m ,即; 这里与:三,x z g + ( 1 一z ) x 为了求使e x ,o 一( z k + ( 1 一z ) 五) 】2 达到最小的z 值,我们假设第i 类风险在第 u 年的单位损失可分解为 x m = m + 砬+ 0 m 其中m 为总体期望,蜀为第i 类风险对总体均值的偏离,而q m 则是第第i 类风险在 第“年的随机波动。这里r 和0 的值未知,均视为随机变量。设对任何i ,e t h = 0 ,同 时对任何t 和“,阳m = 0 ,于是丑x 乱= m 即为总体期望,而e 0 强。i 成) = m + 凰则 为则为第i 类风险的条件期望最后假设所有不同的r 和q 都是相互独立的随机变量, 且对任意i 和u ,v a r 见= t 2 ,v a r q | l 。= s 2 。这样,t 2 如果较大,则表示各风险差别很 大。如果s 2 很小,说明每年各风险的损失数据都接近于均值,如果s 2 很大,则表明年风 险损失经验变动很大。 在以上假设下,托。与置。的些方差为: e w p 。,蕊。,= f 鎏乏i 曼,酝:铲+ ,i 三;:兰: c 。s ,( z ) = e x 目。一( z k + ( 1 一z ) m ) 2 mz n 舀 一一 一 岛挲 赵金良:具有m a ( q ) 误差线性模型协方差阵参数的分步估计与b o o t s t r a p 算法 = e 玛。一m + ( m 一夏g ) z 】2 要使f ( z ) 达到最小,必须:的 z :里! ! ! 墨! 墨1 2 v a r x o 这里分子由( 2 1 6 ) 可得锄( 玛,妇) = t 2 ,而分母为: x g = i ( m 十岛+ q 。u ) 所以: 。 v a t :t 2 + 竺 于是: z :三 n + 管 令k = 喜,则z = 鼎, 2 3 4 最小平方信度与贝叶斯方法 在平方损失函数条件下,用贝叶斯方法得到的信度因子z 的估计,与最小平方信度 是一致的,因此也有人把最小平方信度称为贝叶斯信度应该说,作为一种统计方法, 贝叶斯方法的产生远远早于信度理论。由于贝叶斯方法需要借助于对分布的假设,因而 可以给出估计量的分布情况,从而可以对偏差情况作定量的描述。与信度方法相比,在 估计非线性问题时,贝叶斯方法的误差较小。 非寿险的风险( 即通常所说的净保费、纯保费) 一般是通过估计索赔频率和平均索赔 额来计算的。所谓索赔频率是指每个风险单位在保险责任期内的索赔次数,而乎均索赔 额就是平均每个风险单位的损失额。根据等价原理,风险保费应该为这俩者乘积。下面 以对索赔频率的校正为例来说明最小平方信度与贝叶斯方法的关系。 如果根据先验信息,索赔频率q 服从参数为芦的r 分布,它的密度函数为: ,( 口) = 并j e 叫“( 阳) ”1 ,0 o 1l u , 而在给定q = 0 的条件下,每份报单的索赔次数x 服从参数为0 的泊松分布,即: p ( 。l 口) = e 一9 等,。= o ,1 ,2 , 现在观察n 保单,在责任期内索赔次数分别为置,弱,矗,则样本x 1 ,托,矗 的联合密度函数为: 叠鲈 曲 = 竺矧 9 一e 。渊 埔 j 】 观 。 以 大连理工大学硕士学位论文 十是,很霸姒口1 - 研岔瓦,q 盯后牲苗崖凼效力: 朋旧,训2 若稳溉 e 卅篙南e 卅( 矿1 付”e 。埘篙南一例”1 :生箬一。邓刊9 + 州 叶酽4 n 这是以o + 卢+ n 为参数的r 分布密度的函数。所以,q 的贝叶斯估计为 i = 1 o + 研 妇= e ( qj 钆,z n ) 2 昔 口口n p + 礼卢。卢+ 竹 0 + 这里g = e q 是口的先验分布的数学期望,也就是g 的先验信息:而攀:i 是n 份保单的平均索赔次数,是泊松分布参数q 的极大似然估计。 由于e 旺1 9 ) y d r 僻口) = 口,所以e v a r ( x 1 8 ) = e o = g ,v a r e ( x i s ) = 毒,于是 k = e v a r x 8 = 卢记z = 南,则0 z 1 ,且: 拈= ( 1 一z ) ;+ 。i = ( 1 一。) e g + z 吐 这就是用贝叶斯方法计算的索赔频率的可信性估计,其结果与最小平方信度是一致的。 在实际应用中,功是对索赔频率的先验估计,面:晕是索赔频率的实际观察值,曲 就是利用后者对前者进行校正。 1 7 磬i 笙三兰墨查! ! 生( 盟堡鲞堡:垦堡型塑堡复董睦盟查墼笪盐 3 具有m a ( q ) 误差线性模型的协方差阵的参数估计 3 1 模型假设 在数据分析中,线性模型 y t = 。+ 自 被认为是最基本的模型,这里。;是常值向量,误差向量e 。独立同分布。然而在实际问题 的分析中,我们发现独立性假设往往不成立,误差向量之间总是或多或少的存在些相 关性。在参数向量p 的估计过程中,如果我们充分考虑到这些相关性并能正确的估计出 误差向量之问的协方差矩阵矿,则在此基础上作出的参数的加权最小二乘估计声l 5 比 未考虑到相关性的条件下作出的一般的最小二乘估计如l s 更接近于真实参数值 我们考虑线性模型m = x 展+ 巨,i = 1 ,。满足以下条件: 1 ) m = m ,k ) 是t 维的观察值向量,且m 0 = 1 ,n ) 相互独立。 2 ) 咒。为已知的设计矩阵,这里m 。 3 ) 屈0 = 1 ,n ) 是m 维的独立同分布随机变量,且e 慨) = 展r 慨) = f 4 ) e ( k l 觑) = x 觑,v 。r ( m 慨) = 印k = 4 w v l 2 n w _ 1 2 ,其中权矩阵w - 1 2 为已知常 数矩阵,n 为m a ( q ) 相关矩阵,r f 中参数为p 玎u = 1 ,g ) ,且e ) = r 。 5 ) 随机参数肋,口孙= 1 ,n ) 独立同分布,z ( p 巧) = 序,e ( q 2 ) = 口2 6 ) 对所有i 和j a = 1 ,n ,j = 1 ,q ) ,肋,霹,风相互独立 这时e 瓴慨) = 0 ,c o y 慨,矗) = 0 ,y o r 商l 岛) = 砰k 观察值k 与误差向量旬f 反有相同的相 关结构 3 2 参数估计 3 2 1 构造线性模型 这里的参数估计是指所假设模型中协方差阵中所含参数的估计,并且重点讨论线性 模型的误差向量具有滑动平均结构,其协方差矩阵为m a ( 1 ) ,m a ( q ) 相关矩阵。一个 m a ( 2 ) 相关矩阵为如下形式: 1 成1 风1 1 店2a l 0 + ; 0 - p i 2 0 p np f 2 1 见l 0 p i 2 1 9 ,0 i 0 户船 p i l 成1 l 整鱼墨! 墨童丝墨鱼2 堡差丝:堕篁型鱼宣董堕查塑塑坌兰! 直盐鱼皇! ! 塑! ! 望蔓鲨一 一般地,m a ( q ) 具有如下形式: n = 1 m 1m 2 0 p i l 1 p n 1 p n 1 。 m p l l p i e p i 2m l 1 f=矿。rc风,=(0;1i0:三 屿,2i 兰了k = l ( m p ) ( 矾一p ) 其中p :n 一,壹玑,肘。的各个元素为矩阵k 的各个元素的无偏估计。我们构造如下 t = 1 线性模型: 5 :v e c h m = 日 + u( 3 2 3 ) 日是设计矩阵,u 是误差向量,满足昱( u ) = 0 ,且渐进地有v a r ( u ) = k 。 箜三童墨查! ! 生熊堡董垡竺堡型塑尘立董堕笪查堑直盐 3 2 2 广义最小二乘估计 设权矩阵为矿,则参数向量a 的广义最i j 、- - _ _ 乘估计为: i = f h u h ) - 1 日7 u s ( 3 2 4 ) ( 3 2 4 ) 为a 的无偏估计,其协方差矩阵是: v n r ( i ) = ( 船) 4 h 7 u v 。u h ( h 7 u h ) 。1 当取u = k 一1 时,( 3 2 4 ) 为a 的所有广义最小二乘估计中最有效的估计,这时: 矿 ( ) = ( h 7 u h ) 一1 3 2 3 权矩阵v 的选择 取u = i ,可以的到参数的一般最小二乘估计: i o l s = ( h h ) 一1 s 其协方差阵为: v a r ( i ) = ( h 7 日) 4 h k 日( h ) “ d 。s 作为参数向量a 的估计,效果不是很理想,但是计算起来相对容易,并且可以用这 一估计值去估计k ,进而给出比较好的广义最小二乘估计 。 下面讨论正态假设下权矩阵的选择及参数向量的估计假设驰0 = 1 ,n ) 服从多 元正态分布,则权矩阵u 最优的选择为 u = k 1 这里膏1 是在正态假设下观察值向量s 的协方差阵,晦1 = v a t ( s ) = k 。f u l l e r ( 1 9 8 7 ) 给出了v ,的表达式: v n = 2 一1 ) 。讳( w o h ) 用a 代替w 可以得到b 的一个估计: 嗡= 2 扣一1 ) - 1 ( 坞, 蝎v ) 用b 代替k 可以得到垤的另一个估计: 嗡= 2 一1 ) - 1 幽( 也。吃) 蟛 ( 3 , 2 5 ) ( 3 2 6 ) ( 3 2 6 ) 这里,吃是用a = a d 代替k 中的参数a 丽得到的k 的估计。注意,我们可以用 ( 32 6 ) 重复估计嗡而用迭代的方法得到参数的广义最小二乘估计。 2 1 赵金良:具有m a ( q ) 误差线性模型协方差阵参数的分步估计与b o o t s t r a p 算法 正态假设不总是成立,当观察值的个数n 远远大于观察值的维数t 时,不论饥服从 什么样的分布,只要m 的四阶矩存在,我们均可以用下式估计k n 优= 一2 ) 一1 m 1 ) 一1 ( 玩一哪e 一5 ) 7 ( 3 2 7 ) t = 1 其中b i - y e c 慨一口) ( 轨一鳓7 ) 。取u = 订1 ,则参数的广义最小二乘估计是 估计的协方差阵是: 3 2 4 设计矩阵日的计算 i = ( h 7 吁1 h ) 。日7 口1 s w
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乌鲁木齐银行2025年秋季招聘备考题库及一套答案详解
- 2025-2030中国线性α-烯烃行业供需现状及投资可行性专项调研研究报告
- 2026年首都医科大学国家医疗保障研究院人员招聘备考题库完整参考答案详解
- 机关干部职工培训课件
- 2025至2030中国汽车零部件产业发展现状及未来趋势研究报告
- 2025至2030中国光伏发电产业链成本效益与政策导向深度分析报告
- 老年人住院护理中的患者安全
- 2026年武汉市公安局蔡甸区分局招聘警务辅助人员43人备考题库带答案详解
- 2026年长沙市天心区教育局白沙幼教丽发新城幼儿园教职工招聘备考题库完整参考答案详解
- 2026年西昌市黄联关镇人民政府公开招聘9名综合应急救援队伍人员备考题库及答案详解1套
- 【八年级下册数学北师大版】第三章 图形的平移与旋转(9类压轴题专练)
- 中建项目安全总监竞聘
- 中建给排水施工方案EPC项目
- 公司股权分配方案模板
- 电气工程及自动化基于PLC的皮带集中控制系统设计
- 旧设备拆除方案
- 医学教材 常见输液反应的处理(急性肺水肿)
- FURUNO 电子海图 完整题库
- 急诊科护士长述职报告
- 分子对称性和点群
- 物业前台岗位职责6篇
评论
0/150
提交评论