




已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河南大学硕士学位论文 中文摘要 极值统计学是概率统计理论的一个重要分支,主要研究随机事件极端情况的统 计规律性。巨灾风险从字面上理解就是可能造成巨大财产损失和严重人员伤亡的风 险。应对巨灾国际上通行的做法是建立政府支持下的巨灾保险制度。然而保险并非 承保一切风险,可保风险成了保险的第一要素。作为可保风险一般要求损失程度高, 发生概率小,损失具有确定的概率分布,损失的发生具有相对独立性等条件。本文运 用广义p a r e t o 分布拟合我国地震损失数据,确定了地震损失超出量的分布形式;运 用二元极值理论的独立性检验对区域地震震级发生的独立性进行检验,确定了地震 震级在一个较大范围的发生具有相对独立性。从而为巨灾风险的可保性奠定一个坚 实的数理基础,为定义和划分我国巨灾风险提供参考。 关键词:极值,p 甜e t o 分布,极大似然估计,地震,巨灾 河南大学硕士学位论文 a b s t r a c t e ) ( t r e m es t a t i s t i c si s 缸i m p o r t 锄tb r a n i h0 ft h em a i ne 、,e n t so ne ) 【t r e m ec 船鹤o f r 缸d o ms t a t i s t i c a lr e 叫撕t y c a t 嬲t r o p h er i s ki 8l i t e r a l l yu n d e r s t a 础n gm a yc a u e n o r m o u sp r o p e r 蚵1 0 韶鹤a n dt h er i s ko fs e r i o u sc 鹅u a l t i e 8 c o p e 祈t hc a t 鹪t r o p h eo nt h e i n t e r n a t i o n 蛆c o 删o np r a c t i c ei st o 鹤t a b l i 8 ha9 0 v e m m e n t8 u p p o r t e db yt h ec a t 鹪t r o p h e i 瑚u r a n c e8 y 8 t e m h 删r , i 璐u r a n c ed o 鹤n o tc 钾e ra ur i 8 l 【8 ,i n s l l r a b l e 凼ki 璐u r a n c e h 鹄b e c o m et h ee r s tf 址t o r a sas e c u r j t yr i s kg e n e r a u yr e q m r eal l i g hd e g r e eo f1 0 s s ,t h e p r o b a b i l i t yo f8 m a l l l ,l o s so fa s e to fp r o b a m l i t yd i s t r i b u t i o n ,t h el o 鹃o c c u r r e dw i t hr e l 舢 t i v ei n d e p e n d e n c e ,a n d0 t h e rc o n d i t i o 瑚1 1 1t h i 8p 印e r ,丘t t i n g1 1 s eo fg e n e r a l i z e dp a u r e t o d i s t r i b u t i o nl o s s e si nc h i n ae 跗t h q u m 【ed a t at od e t e r m i n et h ee a r t h q u m 呛1 0 8 s e si ne x c e s so ft h e 出8 t r i b u t i o n0 ff o r m s :e ) 【t r e m eu s eo ft h ed u a lt 髑t so ft h ei n d e p e 玎d e n c eo f r e 舀o n a lm a g i l i t u d ee 砒h q u d k ei nt h ei n d e p e n d e n c et e s tt od e t e r 血n et h em 删t u d e o f t h ee a r t h q u a k ei na l a u r g e rs c o p eo ft h eo c c u r r e n c e0 fr e l a t i v ei n d 印e n d e n c e s o 船t ot h e c a t a s t r o p h i cr i 8 ko fi n s u r a b i h t yl a j das o l i dm a t h 锄a t i c a lf o u n d a t i o n ,f o rt h ed 以1 1 i t i o n a n dc l a u s 8 m c a t i o no fc h i n a sc a t a s t r o p l l i cr i s kr e f e r e n c e k e yw o r d s :e ) 【t r e m e ,p a r e t od i s t r i b u t i o n ,m a 菇d m ml i k e l i h o o de s t i m a t i o n ,e 盯t h - q u 色k e s ,c a t 鹋t r o p h i e i i 关于学位论文独立完成和内容创新的声明 了明确的说明并表髫。姑靓鼍篱黼爹i 8 锄。甍餮i 龟聋l:l p 叫谚 学位母谙绺学位癜作者) ,菇i 缒煎彗 篷露l 斛群篱黥 毳。,戋于学位论文著作权使用授权书露 学住获得者( 学位论文作者) 签名:塑壅萎 2 0o 占年6 月 日 学住论文指导教师签名: 2 0年月 目 第一章绪言 ”麦克里拉”飓风对美国的影响还未完全消散,泰国的洪水就接崇而至;与此同 时,中国也并不平静。从台风”罗莎”、”帕布”到岁末年初的南方大范围雪灾、冰冻, 再到这次汶川大地震。自然灾害越来越强烈与频繁的向人类袭来。 应对台风、暴雨、洪水、地震、海啸等强大自然灾害造成的巨灾有许多途径:国 家救援、社会救助等。国际上通行的做法是建立政府支持下的巨灾保险制度。 现在中国巨灾风险的损失基本上是由政府承担,但政府转移巨灾风险的作用也 是有限的。国家由于拥有充足的社会资源和强制力,在危机管理方面有种种优势, 但按计划制定的财政预算和巨灾风险的随机性之间存在冲突。加之中国政府财政的 基本原则是量入为出,若巨灾风险完全由国家预算承受,势必影响财政的平衡和稳 健。 巨灾的一次次发生都呼唤着巨灾保险的建立。这里面需要政府的支持与干预, 但搞清楚巨灾发生的规律也很重要。据a m b e 8 t 统计,1 9 6 9 年到1 9 9 8 年美国由于巨 灾损失而破产的保险公司占破产保险公司总数的6 ,仅次于由保险准备金不足和 企业增长过快引发的破产。 1 1 风险与巨灾保险 1 1 1 风险与可保性 从一般的意义上讲,风险是指未来结果的不确定性。只要某一事件的发生结果 与预期的不同,就存在风险。风险的不确定性体现为某一事件的发生可能导致三种 结果:损害、无损害或收益,其中损害尤其值得注意。正是因为损害发生的不确定 性可能在将来引起不利结果,才需要对风险进行管理,作为风险管理方式之一的保 险才会产生和发展。因此,保险理论中的风险,通常是指损害发生的不确定性。 河南大学硕士学位论文 风险的存在是保险业产生和发展的自然基础,没有风险就不可能有保险,但保 险人并非承包一切风险。因此,可保风险也就成了保险的第一要素。 作为可保风险,从广义上讲,是指可以利用风险管理技术来分散、减轻或转移 的风险;从狭义上看,则是指可以用保险方式来处理的风险。这种风险应该是不可抗 力的风险,其所致的损害应该是实质损害。换言之,可保风险是保险人愿意并能够 承保的风险,是符合保险人承保条件的特定风险。 m b a 智库中指出可保风险一般具有以下条件: ( 1 ) 损失程度较高 ( 2 ) 损失发生的概率较小 ( 3 ) 损失具有确定的概率分布 ( 4 ) 存在大量具有同质的保险标的 ( 5 ) 损失的发生必须是意外的 ( 6 ) 损失是可以确定和测量的 ( 7 ) 损失不能同时发生,这一条件也就要求单个风险相互独立。 1 1 2巨灾保险 灾害是以自然作用或人为作用为诱因,给地域人类社会生活环境造成损伤和危 害,是危及人类生命的现象,或者说是威胁到人类生命的现象。灾害是以人类活动 的集团即社会生活环境作为受灾对象的现象,个人的灾难不是灾害。 灾害分为以自然作用为基础的自然灾害和以人为作用为主的公害两种。自然灾 害大体分为下面几类:( 1 ) 火山灾害:( 2 ) 地震灾害:( 3 ) 地质地基灾害( 山崩、地表 滑落、地基下沉等) ;( 4 ) 气象灾害( 大雪、暴雨、暴风等) ;( 5 ) 洪水灾害;( 6 ) 海象 灾害( 龙卷风、海啸等) ;( 7 ) 森林火灾。 灾害造成的可以计量的经济损失,概括为以下几项:( 1 ) 人类创造的各种物质 财富的损失;( 2 ) 人的生命与健康损失;( 3 ) 各种自然资源的损失;( 4 ) 精神等其它 方面的损失。本文以下提到的损失均指第( 1 ) 项的直接经济损失。 巨灾风险从字面上理解就是可能造成巨大财产损失和严重人员伤亡的风险。国 2 河南大学硕士学位论文 际保险界对巨灾保险没有统一定义,各个国家根据本国实际情况在不同历史时期对 巨灾风险进行定义和划分。美国保险服务局( i s o ) 财产理赔部按照1 9 9 8 年价格将巨 灾风险定义为,导致财产直接保险损失超过2 千5 百万美元并影响到大范围保险人和 被保险人的事件。 1 2已有研究及本文工作 文献 1 指出理论上,研究巨灾风险的工具是决策论、概率论和数理统计。决策 论侧重于从保险人、被保险人和政府对巨灾风险的偏好入手,研究巨灾风险市场特 征,如巨灾保险需求与供给、合理的定价和转移方式等等;概率论和数理统计侧重 于研究巨灾损失分布的重尾类型、巨灾风险中个体保险损失或理赔之间的相关性、 渐近理论、破产概率等统计性质。利用概率论和数理统计,建立巨灾风险模型、模拟 巨灾风险情景、研究巨灾损失分布的尾部特征、计算保险公司破产概率、比较巨灾 风险的大小、确定巨灾再保险的最优方式等等都是巨灾风险统计问题的具体内容。 由于需要较为深厚的数学、统计和其他自然学科知识,这部分研究逐渐脱离实际保 险原型,被赋予了带有数学色彩的理论研究价值,成为概率论和数理统计一个十分 活跃的应用性学术领域。如文献【2 3 】等。 极值理论作为概率统计的一个重要分支,主要研究随机样本以及随机过程中 极端情况的统计规律性。对极值的研究具有特殊的理论价值:使用极值的一个很大 的优点,是它受到数据可能的残缺影响不大,因为极端值往往是最使人注意的现象, 因而忽略它的可能性比较小,这在使用历史数据时尤其重要另外,关于个别观察值 的总体分布形式通常所知甚少,然而,下面将看到极值分布只有很少几种类型,其 形式与原始数据的总体分布关系不大,便于我们进行理论研究 文献5 】分别对沪深股票收益率及火灾和医疗索赔进行广义p a r e t o 分布拟合, 分析这些极值事件的统计规律性。 独立性检验是二元极值理论及其应用中一个重要的方面例如我们希望检验沪 深两地股市价格的波动是否是独立的,也就是说,希望检验两市股票价格波动的相 3 河南大学硕士学位论文 关性由于我们并不知道两地价格的联合分布形式,因此这时只能基于极值数据研 究二元分量极值的相关性如文献 1 5 】【1 6 】等。 本文运用广义p a r e t o 分布拟合我国地震损失数据,确定了地震损失超出量的分 布形式;运用二元极值理论的独立性检验对区域地震震级发生的独立性进行检验, 确定了地震震级在一个较大范围的发生具有相对独立性。从而为巨灾风险的可保性 奠定一个坚实的数理基础,为定义和划分我国巨灾风险提供参考。在( 4 2 ) 阈值选 取中能更好的看出它的意义。 注:文中所指损失,如无特别说明,均指1 9 9 0 年价,单位:万元。 4 第二章一元极值理论 2 1 极值定义及表达式 2 1 1 次序统计量与极值分布 设墨,是取自分布为f ( z ) 的总体的一个独立同分布样本,将其按大小排 序k ,1 称( 1 ,n ) 为次序统计量,= m 似噩,) ,= x 1 ,) 分别称为样本极小值和样本极大值,统称为样本极值 且n ( z ) = n ( 甄z ,z ) = p ( z ) ,z r p r ( 仇n z ) = 1 一p r ( 仇n z ) = 1 一【1 一f ( z ) 】n ,z r 由以上两式,可以从总体分布得到极值分布但多数情况下,f 往往是未知的,人 们常用的是n 。时所得极值的渐进分布。 2 1 2 标准极值分布的三种形式 极值理论由f i 8 h e r 和t i p p e t ( 1 9 2 0 ) 首先讨论,随后g n n e d e n k o ( 1 9 4 0 ) 进行了进一步 的研究,只有到了1 9 5 0 年对极值的概率模型的统计应用才第一次被g u 1 b e l 讨论和 标准化 6 】 上面提到了极值的渐进分布,但p r ( 死z ) = p ( z ) ,n 。时收敛到。或1 ,并 无多大讨论价值。类似于处理n 个随机变量的中心极限定理,考虑形如警的分布, 有下面的定理: 定理2 1 1 陋九e r - 巧即e 砂 设置,拖,是独立同分布随机变量序列,如果存在常数列 n n o 和 k , 使得对某一非退化分布函数日( z ) : 坚巴p r ( 丝妥二生z ) :日 ) , 。r 竹 a ” 5 河南大学硕士学位论文 则日必属于下列三种类型之一: j : 日1 ( z ) = e 印 一e z ) ,一。o o :日3 ( 删) : 0 do 口 o 【e 印 一( 一z ) 口) ,z o 其中i 型分布称为g u m b e l 分布,i i 型分布称为n e c h e t 分布,i i i 型分布称w b i b u l l 分布。 从模型角度来看,三种极值分布类型日1 ( z ) ,日2 ( z ) 和风( z ) 完全不同,但从数学 角度来看,它们之间却存在非常密切的关系。可以验证:x o 时 x 一日2 兮:叼x a 一日1 车号一x 一1 一日3 因此在某些场合,为方便起见,可以假定其中任意类型的极值分布。 类似可得极小值分布。 2 1 3 广义极值分布 以上三种极值分布类型统一成一种分布,更有利于统计分析。这一工作由v o n m i 8 e ( 1 9 5 4 ) 和j e n l 【i 瑚o n ( 1 9 5 5 ) 【7 】完成。表达成下面定理: 定理2 1 2 设x 1 ,拖,是独立同分布随机变量序列,如果存在常数列 o n o ) 和 k ) ,使得对某一非退化分布函数日( z ) : 墼p r ( 掣z ) :日( z ) ,z r 竹+ o 。 n n, , 成立,则称胰定义在 z :1 + 孚善 o ) 上的盼布: 日( 郇,盯,) = e 印【一( 1 + 等一 f o 为删,f o ) , 6 n ) ,使得: l i mp r ( 竺垫z ) = l i mp ( z + k ) = 日 ) , t 一w u n 一 称日( z ) 为一个极值分布,上述分布f 称为“底分布 ,且称f 属于日| 约吸引场。 底分布属于各型极值分布吸引场的充要条件由g n e d e n l 给出,这里不再累述只 给出一个较易验证的吸引于i 型分布的v o nm i s e 条件: 1 :当z 充分大时,f ”( z ) 存在有限 2 :当z 充分大时,( z ) = f ( z ) o 3 :规丢 锹 = o 则f 属于i 型极值分布吸引场。 文献【8 】又指出v o nm i s e 条件对指数分布,正态分布,w e i b u u 分布及g 8 眦a 分布 等成立。 2 2广义p a r e t o 分布 2 2 1 平均超出量函数 在统计推断中,用最大值模型是低效的,在每一观测组中只取数据最大值而浪 费了大量数据。为此人们考虑超过某个很大值( 称为阈值) 的所有数据,用这些数据 来建立模型。 设魁,独立同分布,分布函数为f ,对某固定大值u 一= s u p 忙:o 让) = ! ! 苎 掣,z o 7 河南大学硕士学位论文 称r ( z ) 为变量x 的超过阈值u 的超出量分布函数,简称超出量分布。 蚺( x 纠x 让) = 鬻,z 独 称为变量x 的超阈值分布函数。 e ( u ) = e 一uix u ) 称为胂平均超出量函数。 2 2 2广义p a r e t o 分布 如果随机变量z 的分布函数 g ( z ;p ,盯,) :1 一( 1 + 型) 一 ,z 肛,1 + f 堡兰 o , 盯盯 则称x 服从广义p 盯e t o 分布,简记为g p d 或g p 分布,其中p 觑为位置参数,盯 o 为 尺度参数,毒r 为形状参数 。 肛= o 时,g ( z ;仃,) = 1 一( 1 + 乎) 一 r i c k a n d s ( 1 9 7 5 ) 证明了如下定理: 定理2 2 1 若存在常数o o 和,使当让_ 矿= s u p 扛:o 乱】,表示在 咒,i = 1 ,2 ,n ) 中比阈值 大的样本点个数这样就可用旦亏争作为f ( 让) 的经验估计,于是上式可变换为: 珊) = 譬( 1 - ( 1 + 吾( 可叫喃) + ( 1 一等) r 河南大学硕士学位论文 即 珊) - 1 一等( 1 + 吾( 耖叫一b 接下来的一个定理指出了广义极值分布与广义p 甜e t o 分布的联系: 定理2 2 2 设置,拖,为独立同分布随机变量,分布函数为f ( z ) 如果存在 规范化数列 口n o , k ,使得对足够大的m 有 p r ( z + 6 扎) 日 ;p ,盯,毒) ,其中日( z ;p ,吼f ) 是广义极值分布;则对于足够大的阈值钍,在x u 的条件下,x 一钍的 分布近似为g 盼本 g ( 咖,f ) = 1 一( 1 + 宰) 一 ,矽 o ,且1 + 譬 o ,其中孑= 口t ( 乱一p ) 详细讨论见文献钞 上面定理表明,如果最大值近似服从g e v 分布日( z ;p ,盯,f ) ,则超出量x u 近 似服从广义p a r e t o 分布g ( z ;子,f ) ,且有相同的形状参数f 2 2 3 阈值的选取 用g p d 拟合超出量时需要选取适当的阈值钍,乱值太大,将只有很少几个超出量, 估计量的方差就较大,钍太小,定理( 2 2 1 ) 条件不满足,超出量分布与广义p a r t e 0 分 布g ( z ;叽毒) 相差较大,估计量成为有偏估计,因此需综合权衡,以选择较合适的钆值。 选择阈值有许多方法,详细讨论可参见文献【10 】文献【1 1 】,这里只给出两种比较 有效的方法: 其一是基于广义p 疵e 0 分布g ( z ;子,f ) 的平均超出量函数e ( u ) , e ( 垆e 僻叫x u ) = 禹= 省,f 咖,相应的有钆= 仃+ 缸,或 乳= o + f ( u 一咖) 令矿= 氏一缸,则矿= 一f 伽即盯+ 与u 无关,称为修正的尺度参数( m o d i 矗e ds c a l e ) 。 因此,如果让。是适当的阈值,相应的超出量服从广义p 盯e t o 分布,则对大于u o 的u ,相 应的估计量毋与拿保持不变。考虑到抽样的随机性,不可能使这些估计量精确的为常 数,但应在允许的抽样误差范围内。由此类似于平均剩余寿命图,作毋及毒关于u 的 图形及相应的置信区间,选择使这两个估计量能保持为常数的最小值u 作为阈值。 2 3 极值分布的参数估计 参数估计有许多方法,但普遍认为极大似然估计法虽计算较繁,但效率较高, 这里只给出本文要用到的两种似然估计。 2 3 1g u i n b e l 分布的极大似然估计 由( 2 1 3 ) 知,此时密度函数 ( 训,盯) = 吾唧( 一半) e x p ( 一e 一孚) 1 0 河南大学硕士学位论文 似然函数 nn 工= ( 昙) n 唧( 一萎e 一半) e x p ( 一吉 一p ) ) 为简化计算,令岛= e 一詈,雪= 丢e 一等,孟= 丢甄则 一 n 巾 n 求解方程组 注意到 得 b g l 叫魄吾一孚一未) 莓兰 掣= 弘誊, n 芒j 解出p ,矿即得所需估计的参数。 2 3 2 广义p a u r e t o 分布的极大似然估计 由广义p 甜e t o 分布函数,在所给定样本 矽1 ,抛,) 时,司得g p d 的对教似然 函数为: 1 0 9 l :一n 1 0 9 口+ ( ;1 ) 壹l 。g ( 1 一警) ( 毒o ) 、 i 一1 一 f 警= 一壶扣1 一和c 却喜毒- o , i - 警= 一州叫娄禹一o f , : 一 一 e j 一五, 竹留翌砖 业, lk,d吃孥岔 河南大学硕士学位论文 f 扣1 一针2 ,砉去一o , 【( 1 - 喀忐砘 珑 毒= o 时,易得a = ! 兰一 2 4极值分布的分位数与q q 图 2 4 1 极值分布的分位数 设 是定义在r 上的不减函数,称危一1 ) = i n f 0 r : ( z ) p 】( 规定空集的下 确界是) 为函数 的广义函数。 称分布函数f ( z ) 的广义函数f 一1 p ) = i n f 和r :f ( 。) p ( o p o ,也竹( i = 1 ,2 ) 使当n _ o 。时,有 p r 鬯g 警鲥印( c 1 卅螂) _ 聊 其中x ( n ) = m a x 噩,) ,k n ) = m 觚 m ,碥) ,h 为一分布函数,且边际分布非 退化,则称日( z ,秒) 为二元极值分布。 显然,由上式和定理2 1 1 可看出,二元极值分布的边际分布必为一元极值分布。 由于极值分布三种形式之间可以通过变量变换而相互转换,所以不失一般性,可以 假设边际是同分布的,而且边际分布可任意选择。下面均以g 啪b e l 分布作边际分 布。 文献 1 2 1 3 证明了不存在有限参数族来描述多元极值分布,因此只能在某个模 型下进行讨论 1 4 】总结并证明了许多参数模型,认为l o 舀s t i c 模型是最有用也最简单 的一个在此模型下,二元极值分布函数可表示为 日( 删) = 卿h 1 一f ( 孚) ) 南+ ( 1 一叩( 罕) ) 钠 其中,弘,为位置参数;盯,丁为刻度参数;,卵为形状参数;o 口1 称为相关参数。 在边际分布为g 珊n b e l 分布的l o 舀8 t i c 模型下的二元极值分布函数为 日( 训) = 唧 - ( e 印( 一半) ) + ( e 印( 一半) ) 钠 相关参数p 用来描述x 。y 之间的相关程度特别当p _ 1 时表示x ,y 相互独立, 即。日( z ,可) = 巩( z ) 日2 ( g ,) , 其中 日1 ( z ) = e 印( 一e 印( 一乞芋) ,日2 ( 秒) = e 印( 一e 印( 一与;) 河南大学硕士学位论文 均为一元g 砌b e l 分布口_ o 时,表示x 与y 完全相关 独立性检验是二元极值理论及其应用中的一个重要内容。例如希望检验沪深两 地股市价格的波动是否独立,由于不知道两地价格的联合分布形式,因此这时只能 基于极值数据研究二元极值分量的相关性。下面检验区域地震震级的独立性也是如 此 此时要做的独立性假设检验为:日o :p = 1 ;日1 :口 1 则 3 2 检验统计量 文献 1 5 】【1 6 】比较了几种独立性检验统计量,均认为似然比检验统计量效果最好。 记 s = e 印( 一半) ,亡= 唧( 一半) 日( z ,秒) = e 印【_ ( s 吾+ t ;) p 】 ,沪譬p 柑) 弘2 【( s ;柑) p 一1 + 丢蛔【_ ( s 柏n 设( 鼢,玑) ,z = 1 ,n 为取自该二元极值分布的一个样本。则由似然比统计量 文献【1 3 指出: p ( 一2 z d 夕入 1 一。分位点,就拒绝零假设凰 1 5 盟麓 坠雕 盟咖曩 | l 第四章地震损失的广义p a r e t o 分布拟合 对于巨灾这类保险中的极端事件,发生概率很小,然而一旦发生,往往超出单 个保险公司的承受力,对保险业造成重大影响( 有时是毁灭性的) 。 文献 17 】 1 8 】以国外火灾保险数据为例,利用g p d 模型对索赔数据进行拟合,分 析这些极值事件的统计规律。本章将这一方法运用于地震损失数据,以期对我国的 巨灾保险提供参考。 4 1 数据来源及整理 4 1 1 数据来源 本章数据来源于中国地震灾害损失记录库元数据库( 1 9 4 9 2 0 0 4 ) ,是由科技部 国家计委国家经贸委灾害综和研究组编制。网上发行地址:h t t p :d i s a e q - i 9 1 a u c c n 该库数据来源于中国地震局出版的中国地震年鉴,三部委灾害综合研究组 出版的中国重大自然灾害与减灾对策( 年表) 和民政部出版的中国灾情报告, 数据源权威可靠。 4 1 2 数据整理 。 数据整理主要分以下步骤进行: 1 提取出损失值( 大于1 0 万元) 及发生时间,震级,震源深度,发生地点五方面 数据。其中有些无损失值记录的地震事件( 仅有倒塌房屋,破坏公共设施等描述性 叙述) 及损失值小于1 0 万元的数据舍弃。共从1 3 0 0 多条中筛选出6 0 0 余条。 2 在提取数据中发现一些事件有重复记录,比如唐山大地震( 时间1 9 7 6 年7 月2 8 日, 震级7 8 ,震源深度2 2 k m ) 共有三条记录。剔除掉重复事件后共有数据记录5 0 1 条 3 由于该库数据损失值1 9 9 0 年前为1 9 9 0 年价,以后为当年价。因此从国家统计局 网站查询到消费价格指数,统一将数据转化为1 9 9 0 年价。 1 6 河南大学硕士学位论文 4 1 3 数据整理过程中的不足 剔除重复事件时当发生时间,地点相同时主要以震级为依据,震级相同一般认 为同一事件,否则认为不同,这样有可能有所漏误。严格的考证应参照原始文献仔 细进行。 4 2 阈值选取 4 2 1 地震损失数据的初步描述 地震损失数据描述 均值 1 7 1 9 8标准差1 9 0 4 9 0 2 5 分位数5 8最小值 1 0 5 0 分位数 3 1 4最大值3 6 8 5 1 5 9 7 5 分位数 2 5 3 0偏度系数2 6 1 4 4 地震损失数据的散点图地震损失数据对数散点图 由数据的基本描述及散点图可看到数据相差非常大,7 5 分位数是2 5 分位数 的4 0 多倍,均值是7 5 分位数的6 倍多,最大值是最小值的3 0 多万倍。数据严重右偏, 偏度系数高达2 6 1 4 4 ,因此作出对数散点图以利于更好的观察。 1 7 河南大学硕士学位论文 4 2 2阈值选取 首先给出损失数据样本及其对数的经验平均超出函数( e m e f ) 图和指数q q 图 地震损失经验平均超出函数图地震损失对数经验平均超出函数图 地震损失指数q q 图地震损失对数的指数q q 图 1 8 墨霉6,薯至占4击 河南大学硕士学位论文 从指数q q 图及对数的指数q q 图看出数据的尾特别重,连数据的对数值都有 比指数分布更重的尾。平均超出函数接近一条直线,表示底分布可能是p a 托t o 型的 分布函数。 由e m e f 图看出大约2 5 0 0 0 0 以后图形急剧下降,较好的近似线性;由对数e m e f 图 也可看出在e 1 2 4 = 2 4 2 8 0 2 以后有类似现象。这表明应取仳= 2 5 0 0 0 0 然而当u = 2 5 0 0 0 0 , 只有3 个数据超过阈值可用于推断,数据太少,很难得到有意义的推断。 观察对数e m e f 图可见:从u = o 到乱e 9 9 = 1 9 9 3 0 2 0 0 0 0 图形为曲线,从u = 2 0 0 0 0 到乱2 5 0 0 0 图形近似线性。初步决定选择让= 2 0 0 0 0 作为阈值。 下面再结合修正尺度参数盯+ 及形状参数来选阈值。 旦 8 o 哥 暑 弓 z t h r e s h o l d + 一+ + 一+ 一十一 i 一,一 、, 05 0 0 010 0 0 015 0 0 02 0 0 0 02 5 0 0 03 0 0 0 0 t h r e s h o i d 地震损失数据关于不同阈值的参数估计图 结合修正尺度参数矿及形状参数估计图来看:在1 5 0 0 0 以后估计量保持为常 数,矿在2 0 0 0 0 以后其估计量近似常数。由2 2 3 阈值选取方法,取让= 2 0 0 0 0 是合适 1 9 o 8 8 丫 河南大学硕士学位论文 的。 4 2 3 估计效果检验 为了说明g p d 估计的效果,进一步用超出分布的g p d 拟合图和残差的指数q q 图 来拟合检验。 超出分布g p d 拟合图残差指数q q 图 与文献 1 7 j 拟合d a s h 火灾保险和医疗保险数据相比,本章拟合地震损失数据的 效果不太理想。这主要因为来自保险索赔的数据由于设定免赔额及每单最高赔付额 等技术条件的限定,已不是真实火灾损失或其简单的倍数关系。从地震损失数据的 粗略p a u r e t o 拟合到地震索赔的比较理想的拟合正是保险实践所不断追求的过程 4 2 4 阈值选取意义 1 可保性条件要求损失具有确定概率,而只有适当的阈值才可使相应的超出量 服从广义p 缸e t o 分布,从而为巨灾风险的可保性奠定一个坚实的数理基础。 2 彳艮多发达国家都有本国巨灾的损失定义。如美国按1 9 9 8 年价格将超过2 5 0 0 万 美元的财产直接保险损失定义为巨灾。在综合考察各类巨灾风险的域值后,应选一 2 0 誊一琶晕6 i 薯毫s 9 国 河南大学硕士学位论文 个较大的阈值,以使绝大多数的超出量服从广义p a r e t o 分布。从文献【1 9 】中可以看出 地震每次发生的损失值在各类巨灾损失中都是较大的。相应其阈值也是较大的,从 而为定义我国巨灾风险提供重要参考。 4 3高分位数与可能最大损失估计 4 3 1 高分位数估计 极值分析的主要目的之一是估计分位数z 口,在保险精算中即是估计t 年初始备用 金( i n i t i 址r 够e r v e ) 一般的分位数可以通过相应的经验分布得到,但是当要估计高分 位数时,如果再用这种方法,由于大的观测值很少,估计出来的高分位数就很不精 确,这时该方法就失效了。此时可以借助于g p d 来估计高分位数。由( 2 2 2 ) 及( 2 4 1 ) 可 得g p d 分位数: 唧= + ;( ( 兰与孚) 一毒一1 ) 利用此公式,可得地震损失高分位数点估计值: 地震损失高分位数点估计值 阈值u帆 q z 0 9 5z 0 9 9z 0 9 9 9 2 0 0 0 02 91 2 4 3 52 4 5 11 0 8 5 1 2 3 9 3 6 3 1 7 5 2 5 0 3 0 6 5 4 0 0 从分位数的统计含义可看出:地震损失小于等于2 3 9 3 6 3 万元的可能性为9 5 ,损 失小于等于1 7 5 2 5 0 万元的可能性为9 9 ,损失小于等于3 0 6 5 4 0 0 万元的可能性为9 9 9 4 3 2可能最大损失( p r o b a b l em a x i i 肌ml o s s ,简记p m l ) 估计 可能最大损失,顾名思义就是可能发生的最坏的结果和损失。实际上就是一段 时间内的最大损失分布的分位数。仇r 撕i 6 n ( 2 0 0 3 ) 得出了p m l 的估计式为: 尸肌。= 牡州一斋与,l1 蟮 其中入= 驯帆 利用上式,可得地震损失数据p m l 点估计值。 2 1 河南大学硕士学位论文 地震损失p m l 点估计值 p m 三o 9 5p m l 0 9 9 p m l o 9 9 9阈值u帆 o 2 0 0 0 02 91 2 4 3 52 4 5 1 1 0 81 5 0 8 6 0 01 1 4 4 8 0 0 02 0 1 6 8 0 0 0 0 由上表看出:地震最大损失额为1 5 0 8 6 0 0 万元的可能性为5 ,地震最大损失额 为1 1 4 4 8 0 0 0 万元的可能性为1 ,地震最大损失额为2 0 1 6 8 0 0 0 0 万元的可能性为o 1 关于我国巨灾保险的一点思考:引言中已提到应对巨灾国际上通行的做法是 建立政府支持下的巨灾保险制度。具体到我国的地震,损失小于2 3 9 3 6 万元可主要 有保险公司承担,纳入常规理赔,适当的再保险及国家扶持;损失介于2 3 9 3 6 万元 与1 7 5 2 5 0 万元之间的主要有再保险承担;大于1 7 5 2 5 0 万元,甚至大于3 0 6 5 4 0 0 万元的 主要有国家承担,此时往往伴随着公共基础设施的大范围损毁,没有国家的介入, 单纯的保险及再保险难以为继。正是在这种情况下,1 9 9 5 年财产保险基本条款中删 除了地震保险责任,2 0 0 0 和2 0 0 1 年,保监会连续下发了关于地震保险的通知,指出 “地震险只能作为企业财产保险的附加险,不得作为主险单独承保。看来地震险作 为主险种出现还需要国家的政策扶持与制度保障。 第五章地震震级发生的区域独立性检验 可保性要求损失不能同时发生,即风险的发生具有相互独立性。可以主要从两 方面来理解这一独立性:一是指同一风险在不同地域的发生具有独立性,二是指不 同风险的发生具有独立性。 。, 文献 1 5 】 1 6 】运用二元极值分布的独立性检验分析了沪深股市日收盘价的对数收 益率及与其中个股的独立性。受此启发本章对于中国及美国月最大地震震级的变化 量进行区域独立性检验,为巨灾风险的可保性奠定基础。 5 1 数据处理 本章数据取自国家地震科学数据共享中心中国台网地震目录( 1 9 7 0 2 0 0 7 ) 首先从中筛选出震级5 o 的事件,其中中国的2 2 3 9 个,美国的1 0 4 5 个;其次选 取出月最大值数据。五,k ,舌= 1 ,2 ,4 4 4 分别表示中国和美国第t 月月最大震级,考 虑( 五,k ) ,t = 1 ,2 ,3 2 4 两个分量都大于5 o 的数据,共有3 2 4 组。 原始数据五,k 的散点图 河南大学硕士学位论文 5 2 对数差的独立性检验 我们尝试采用二元l o 舀s t i c 模型对五,k 的对数差的独立性进行检验 令墨= 2 叼咒+ 1 一z 凹五,w = z 凹k + 1 一z 凹k ,t = 1 ,2 ,3 2 3 作墨,巧的散点图: 对数差雹,巧散点图 求出墨,巧各自经验分布函数露和彤 对妻隧的经验分雍函数,( 力,王f j 锄 苌,譬,矿 。( ) i ) , 西( ) i ) 引7 5 5o f 6 2o 0 5 1 8便6 4 田,4 l 髂o 3 lo :o 笼io 5 7 5 9 电3 3 2 7o 0 1 5 5o 0 9 4 6o 7 5 2 3由,3 7 4 5o 0 0 6 2o 6 2o 6 弘2 m o疆0 2 船o 1 3 7 3o ,8 1 7 3o 3 3 0 4q o o o 1 l 氇7 嘲 最2 仍 o 0 5 s 8 o l 咖 o 盼1 6奄f 2 9 “ o 0 1 8 6o i 5 4 3疆8 7 3 l n 2 酣5o f 0 9 2 9 o 2 2 2 8o 9 4 4 3彤工4 2 3o 。0 3 4 io 1 9 弘统舛1 2 以1 6 1 8 o 1 5 1 7 o 2 6 5 5q 9 8 1 4 田。l 2o - 铆4 4 2 4疆9 5 3 6 一o ,1 1 9 lo 1 粥ln 3 0 娩往9 8 7 ;6田,1 5 乾q 1 2 6 9o 2 8 6 5氇粥1 4 _ o 0 7 6 4啪0 3 5 i o0 ,9 9 3 b 田1 i o l o 2 1 3 6o 3 3 嘶o 。9 9 3 8 m 3 6o 3 嘴o 3 9 3 7o 9 9 3 8田6 00 3 l 眇o 3 7 4 6o | 9 蚴 o 姗lo 娜4 6 o f 3 6 4 1 - o 0 2 2 0 o 4 2 4 l o - 4 i s 7l 脚 河南大学硕士学位论文 画出经验分布函数图: 对数差弼,巧经验分布函数图 由以上图表观察弼,巧在。点概率近似o 5 ,且关于。点近似对称,接近正态分布。 用m a t l a b 中的正态假设检验函麴b t e s t 在显著水平为o o l 时通过正态检验。 由( 2 1 4 ) v o nm i s e s 条件注解知剐,巧的极值分布为g u m b e l 分布。 设其样本( z i ,z 2 3 ) ,( 斫,鹕2 3 ) 服从g 眦b e l 分布: 日1 ( z ) = e 印一e 印( 一兰) ;日2 ( 可) = e 印一e 印( 一型) 由m a t l a b 可得参数的极大似然估计值: 口= - 0 0 7 3 8 ,参= 0 1 4 6 8 痧= 一0 0 6 9 4 于= 0 1 4 0 7 用( 3 2 ) 节似然比检验统计量进行对数差的独立性检验。o 代表接受独立性,1 代 表拒绝独立。 雹,w 检验值表 qo 10 0 50 0 2 5统计量值 t1117 5 4 9 5 5 9 河南大学硕士学位论文 由上表看出,在a = o 1 ,o 0 5 ,o 0 2 5 三种检验水平下均拒绝独立性。这与我们的 常识不符。相距甚远的两个区域的震级发生怎么会表现出较强的相关性? 仔细分析 发现【1 6 】中用对数差进行独立性检验是 2 0 已经检验了用模型对股市对数收益的极值 进行统计分析是一个很好的方法。且日收盘价数值较大,而震级数值较小,取对数 后再相减数据相差不大,造成未通过独立性检验。这给我们一个教训:简单的套用 有时是行不通的,但大胆的尝试是应该的。既然数值大时取对数才比较有效,我们 不妨验证差的独立性。 5 3 差的独立性检验 在作差的独立性检验时我们仍然采用二元l o g i s t i c 极值模型令j 掣= 咒+ 1 一托,蟛= k + 1 一k 仿照上面对数差的独立性检验方法,可进行如下差的独立性检验。 差础,w 7 散点图 求群,掣各自经验分布函数f ”( z ) ,日料( z ) 河南大学硕士学位论文 差豹经验分布蒴数广0 ) ,矿劬 cr r广广矿0 7 )广矿 - 2 4 o oo 3 l o 3 8 o 6 6 0 5- 2 7 瑚o 0 0 3 lo 0 8 0 00 5 盼 2 1 4 0 0o 0 0 9 3o 6 6 o 7 6 舛- 2 枷参6 2o 3 6 0 0o ,6 7 9 0 l ,8 6 o 0 1 8 5o 9 4 0 8 5 4 9- 2 1 鲫覆0 0 9 3o 6 4 0 0o 7 9 0 l 一1 5 8 0 0o 6 3l 忽o oo 9 3 2 li 8 啪o 0 1 5 40 9 2 0 00 8 7 6 5 1 3 0 0 0o 0 7 7 21 5 0 o 9 5 0 6一l ,6 0 o 0 3 柏1 2 0 0 0 0 - 9 l 鳃 1 0 2 0 0o 1 3 2 7 1 7 8 0 0 0 9 8 1 51 3 2 0 0o 0 5 2 51 铝o oo 9 4 7 5 _ o ,7 4 0 0o 1 8 9 3 2 0 6 o 。7 7 1 0 4 0 0& l 嗍1 7 6 0 0 o 9 7 2 2 o 翩o ,2 8 0 92 瑚o0 9 9 0 7七7 6 0 0o 1 7 2 82 0 4 0 0o 9 8 7 7 o 1 8 0 0o 4 0 4 3 2 国o 9 9 3 8o 4 8 0 0o 2 8 7 02 3 2 0 9 9 3 8 0 1 0 o 5 幸3 22 9 0 o 9 9 移- o 2 0 0 0o 4 l 篼2 o 9 9 6 9 画出群,彤相应经验分布函数图 差掣,掣经验分布函数图 2 7 河南大学硕士学位论文 在显著水平为o 0 1 时通过j b t 鹄t 正态检验图形化正态检验的正态概率图如下: ,7+ ; , + , 零 聋 2 - , r 厂 。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文档格式化编写与版本控制模板
- 大医精诚护理考试题库及答案
- 健康数据统计表-健康数据监测报告
- 质量标准与服务信誉承诺书8篇
- 高三关于四季的记叙文600字作文(15篇)
- 医疗安全法规培训课件
- 保险业产品销售代理协议
- 品牌合作推广服务合同
- 畜牧业生产技术服务外包合同
- 医疗安全事件培训记录课件
- 政务摄影培训课件模板
- 2025年新疆中考数学试卷真题(含答案解析)
- 中央厨房体系管理制度
- GB/T 19437-2025印刷技术印刷图像的光谱测量和色度计算
- 2025至2030中国医疗服务行业产业运行态势及投资规划深度研究报告
- 宾馆内部治安管理制度
- 《鲁迅故居》课件
- 央视春晚活动策划
- 全职妈妈工作简历模板
- 网络安全面试题库及答案
- GB/T 45266-2025消费品质量分级导则羽绒制品
评论
0/150
提交评论