




已阅读5页,还剩55页未读, 继续免费阅读
(载运工具运用工程专业论文)数据挖掘技术在我国汽车保险业中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 计算机技术发展的历史在某种意义上也是数据自动采集、生成和处理的历 史。目前,全球为各行各业服务的数据库不仅在数量上快速增长,而且在规模上 也越来越大。数据挖掘正是在这样的应用需求背景下产生并迅速发展起来的一个 重要的研究领域。 随着我国保险体制改革的深化,w t o 的加入,国外保险公司的全面进入, 我国保险业的竞争也日趋激烈。与其他行业相比,保险业拥有更多有关客户的数 据,谁能正确地挖掘与分析隐含这些数据中的知识,谁就能更好地控制客户理赔 风险,同时又可以向客户提供更好的保险产品与服务,从而在竞争中获胜。国内 对这方面的研究还刚刚起步,国外在这方面已经大大地领先于国内。因此,研究 数据挖掘技术在我国保险业中的应用具有重要的价值。 数据挖掘技术是先进的信息处理技术,汽车保险是随着汽车工业的加速发展 和人民生活水平的提高而发展起来的一种保险业务,随着汽车工业的加速发展和 人们购买力的增加,保险公司如何有效地利用已有的数据来改革和推动自己的保 险业务,已经成为各保险公司共同关注的问题。本文阐述了汽车保险业的现状, 数据挖掘技术的分类,方法、应用流程;探讨了汽车保险业务决策中数据挖掘技 术的模型及算法。 本文通过对于车险业务的现状、问题和发展趋势的分析,提出了将数据挖掘 技术应用到车险系统,重点研究了如何应用数据挖掘技术来提高车险的分析水 平,并针对客户风险分析、投保行为分析、客户价值分析和欺诈识别四个商业主 题的应用进行了数据挖掘流程设计和建模,并利用c t r c e 软件对模型进行了进一 步的验证和评价。 关键词:数据挖掘,汽车保险,客户流失 a b s t r a c t t os o m ee x t e n t ,c o m p u t e rt e c h n o l o g ye v o l v e m e n ti n c l u d e st h ee v o l v e m e n to f d a t ae x t r a c t i o n ,d a t a g e n e r a t i o n a n dd a t a p r o c e s s i n gt e c h n o l o g y c u r r e n t l y , o p e r a t i o n a ld a t a b a s ei na l li n d u s t r yf i e l d sg r o w sr a p i d l yn o to n l yi nn u m b e r ,b u ta l s o i nd a t av o l u m e d a t am i n i n gi sam a j o rr e s e a r c ha r e a , w h i c hi sd r i v e nb yt h e a p p l i c a t i o nr e q u i r e m e n ti nt h i sf i e l d w i t ht h ei n s u r a n c es y s t e mr c f o n nd e v e l o p m e n ta n do u re n t r a n c eo fw t oa n d c o m p r e h e n s i v ee n t r a n c e o fe x t e r n a li n s u r a n c ec o m p a n i e s ,t h ec o m p e t i t i o no f i n s u r a n c eo p e r a t i o ni sb e c o m i n gf i e r c e r c o m p a r e dw i t ho t h e ri n d u s t r y , i n s u r a n c e o p e r a t i o nh a sm o f ed a t aa b o u tc u s t o m e r e n t e r p r i s e st h a tc a nm i n ea n da n a l y z et h e k n o w l e d g ec o n t a i n e di nt h ed a t ac o r r e c t l yw i l ld r o pr a t eo fc l a i mo f f e ri n s u r a n c e p r o d u c ta n dt oc u s t o m e rb e t t e ra n df i n dm o r eo p p o r t u n i t i e s ,t h u sw i nt h ec o m p e t i t i o n o u rd o m e s t i cr e s e a r c ho nt h i sf i e l di ss t i l la ti n f a n c y ,e x t e r n a lr e s e a r c hh a sa l r e a d y b e e ns u p e r i o rt om i n eg r e a t l y s oi ti sv i t a la n dv a l u a b l et oi n v e s t i g a t et h ea p p l i c a t i o n o fd a t am i n i n gt e c h n o l o g yi nd o m e s t i ci n s u r a n c ei n d u s t r y d a t a m i n i n gt e c h n o l o g y i s a na d v a n c e d t e c h n o l o g y o f p r o c e s s i n g i n f o r m a t i o n w i t ht h ei n c r e a s i n gd e v e l o p m e n to fm o t o re n t e r p r i s e ,a n dt h e i m p r o v e m e n to fl i v i n gs t a n d a r do ft h ep e o p l e ,t h ee n t e r p r i s eo fm o t o rc a ri n s u r a n c ei s d e v e l o p i n ga n db e c o m i n gak i n do fi n s u r a n c ee n t e r p r i s e w i t ht h ei n c r e a s i n g d e v e l o p m e n to fm o t o re n t e r p r i s ea n dt h ei m p r o v e m e n to fl i v i n gs t a n d a r d ,h o w i n s u r a n c ec o m p a n yt a k ea d v a n t a g eo ft h em a t e r i a lt or e f o r ma n dp r o m p ti n s u r a n c e e n t e r p r i s e ,w h i c hh a sb c c o m et h ec o m m o np r o b l e mo fan u m b e ro fm o t o ri n s u r a n c e c o m p a n i e s t h et h e s i st e l l st h ec u r r e n tc o n d i t i o no fm o t o ri n s u r a n c ee n t e r p r i s e ,a n d t h ec a t e g o r y ,m e t h o d s ,a n da p p l i c a t i o nf l o w i n gd i a g r a mo fd a t am i n i n gt e c h n o l o g y m o r e o v e rt h ep a s s a g ea l s os t u d i e st h ea p p l i c a t i o no fd a t am i n i n gt e c h n o l o g yo nm o t o r i n s u r a n c es t r a t e g ya n di t sf u t u r e t h i st h e s i sp u t sf o r w a r da p p l y i n gd a t am i n i n gi na u t o m o b i l ei n s u r a n c et h r o u g h a n a l y s i so fp r e s e n ts i t u a t i o n ,p r o b l e mt ob er e s o l v e d ,a n dd e v e l o p i n gt r e n d so f a u t o m o b i l ei n s u r a n c e ,m a i n l yr e s e a r c h e so nh o wt ou s ed a t am i n i n gt e c h n o l o g yt o i m p r o v et h el e v e lo fa u t o m o b i l ec o m p a n i e s a n a l y s i s f o c a lp o i n t sw e r es e to nf o u r b u s i n e s st h e m e s :c u s t o m e rr i s ka n a l y s i s ,c u s t o m e rb e h a v i o ra n a l y s i s ,c u s t o m e r v a l u a b l ea n a l y s i sa n df r a u dd e t e c t i o n , a n dd e s i g nt h ec o r r e s p o n d i n gd a t am i n i n gf l o w a n dm o d e l t h ed a t am i n i n gs o f t w a r ec t r e ew a su s e dt od e s i g n , v a l i d a t ea n da s s e s s m o d e l si nt h ed e m o n s t r a t i o np a r to ft h i st h e s i s k e yw o r d s :d a t am i n i n g , m o t o ri n s u r a n c e ,c u s t o m e rl o s t 独创性声明 本人声明,所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人 已经发表或撰写过的研究成果,也不包含为获得武汉理工大学或其它教育机构的 学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已 在论文中作了明确的说明并表示了谢意。 签名:茸日期:牡 关于论文使用授权的说明 本人完全了解武汉理工大学有关保留、使用学位论文的规定,即学校有权保 留、送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 研究生签名:! 趟 导师签名: 日期:珥z :彦 武汉理工大学硕士学位论文 1 1 课题背景 第1 章绪论 我国加入w t o 国内保险业将逐步全面地与国际保险体系接轨,更多的外资 保险公司将直接与本土的保险公司竞争。这为我国保险市场的发展提供了良好的 机遇,但是对于我国本土的保险公司来说,也必须面对的是由此而带来的考验。 国内保险业势必会受到一定的冲击,因为无论是从行业的成熟程度、资金实力还 是在管理运营的能力上都落后于起步早的国外公司。国外保险公司的竞争实力不 仅体现在雄厚的资金实力、多样的险种、细致的索赔评估和丰富的管理经验,而 且体现在广泛应用信息技术的方面。 汽车保险业务作为我国财产保险中的重要支柱,占财产险业务收入的6 0 左右。在2 0 0 3 年以前,国内各保险公司的车险业务采用的是中国保险监督管理 委员会( 保监会) 制定的统一的条款和费率体系,采用单一的营销方式,缺乏竞争 力。为了使国内保险公司通过自我竞争先行成熟起来,以应对车险业务放开后, 国外保险公司的挑战,我国推行了一系列车险改革措施。 通过汽车保险改革,将车险从长期统一、固定的局面中“解脱”出来,无疑 对于培养国内汽车保险业竞争力和长远发展,应对入世之后国外保险公司的竞争 是积极有益的。但是,由于国家长期以来对于财产险业务的监管:一方面,国家 不允许保险公司自行制定车险条款费率体系;另一方面,使得保险公司形成了对 于国家统一制定的条款费率指标体系的依赖性,缺少创新的动力。造成了车险改 革后,仍然缺乏保费制定的科学标准,保险公司产品开发、营销和服务的创新能 力不足。各保险公司内部实际上并没有针对车险的健全的数据统计、核算体系, 这样,条款费率的放开就给各保险公司的市场化经营带来了风险。也正是由于整 个市场制定保费的标准不确定,各公司为了争夺市场份额,可能会造成一定的混 乱局面。为了更好的解决汽车保险业务现存的问题,适应车险业务发展的趋势, 保险公司必须对于车险客户的风险、行为和价值进行分析,以支持保险公司的费 率风险防范、车险产品设计以及客户保持策略,从而实施有效的客户关系管理。 同时,考虑到车险业务海量的数据,应用数据仓库和数据挖掘技术具有更大的适 用性和紧迫性。所以,对于数据挖掘技术在车险中的应用研究有重要的理论和实 用价值。 武汉理工大学硕士学位论文 1 2 国内外相关理论研究综合评述 数据挖掘技术是近几年国内外迅速发展起来的一门交叉学科,涉及到数据 库、统计学、人工智能与机器学习等多个领域【1 1 。计算机的应用普及产生了大量 的数据,数据挖掘就是利用上述学科的技术进行大数据量的处理。数据挖掘的应 用领域非常宽广,从农业生产的预测到基因分类,从化学分子结构的识别到n b a 教练l 缶场更换队员,从信用卡欺诈到税务稽查,数据挖掘技术对未来社会的各个 领域将起到越来越主要的作用 2 1 。 1 2 1 国内应用现状 目前,国内企业实现数据挖掘的困难在于缺少数据积累、难于构建业务模型、 各类人员之间的沟通存在障碍、缺少有经验的实施者、初期资金投入较大1 3 j 。而 在国外,数据挖掘首先在金融、证券、电信、零售业( 当然包括保险业) 等数据密 集型行业中实施,因为这些行业信息化程度比较高,数据库中已经保留了大量数 据资源。虽然数据挖掘在保险应用方面的研究还远不如在基础理论和技术方面的 研究那么热烈,但目前业内已有很多成熟的数据挖掘方法论,为保险领域的实际 应用提供了理想的指导模型。 ( 1 ) 通过对保险业务风险分析,进行保费的制定 吉根林等人分别采用关联规则和分类模型技术对医疗保险数据库( 由个人信 息表、单位信息表、索赔单据表等数据表组成) 进行保险业务风险分析1 4 j 。通过 关联规则挖掘工具对个人索赔信息表进行挖掘,就可以得到一系列的关联规则。 通过关联规则的挖掘,可以发现投保人中索赔的具有什么特征,不索赔的具有什 么特征,这样保险公司就可以有针对性地对潜在客户开展工作,从而减少风险, 提高公司盈利能力。通过分类模型进行风险分析,在医疗保险数据集中,选取是 否索赔作为目标属性,其它属性作为条件属性。利用决策树生成工具对表所示的 数据集生成一个决策树,根据决策树和投保人的详细信息,可以预测一段时间内 索赔概率的大小,并相应制订某类投保人的保险费率。 田金兰等人运用s g i 公司的m i n c s e t - r 具对保险业务数据进行决策树和关联 规则的数据挖掘,并且m i n e s e t 可以自动调出可视化工具s c a t t e r v i s u a l i z e 显示结 果。 ( 2 ) 客户关系管理 黄沛等人运用v p r s 模型对车险保单数据进行分析,借助基于粗糙集理论的 数据挖掘工具r o s e t t a 挖掘出隐含其中的风险规则1 5 j 。得到这些风险规则后, 保险公司可以针对这些低风险规则的顾客进行营销和服务,以便留住这些顾客。 2 武汉理工大学硕士学位论文 李晓瑞等人通过对投保客户基本信息库的数据进行关联规则的数据挖掘,找 出客户购买群体的内在关联规则。对于保险公司来说,如何找出新客户、失去的 客户及老客户尤其是给公司带来最大利润的2 0 的“黄金客户”各属性的关联规 则,同时又能以用户易理解的方式概括出来,是决策者策划营销计划的关键。例 如通过关联规则挖掘得出这样一个规则:( 年龄:3 0 - 4 0 ) a n d ( 工作地区:a r i 区) = ( 险种:b ) ( 8 0 ) ,其表达了这样一个信息:客户年龄在3 0 - 4 0 岁之间, 其工作地区在a r i 区,那么此客户( 8 0 ) 的可能会投保b 险种。相似的规则对保 险业的决策是非常有用的。 1 2 2 国外应用现状 数据挖掘技术在国外保险业中的应用己经有很多的成功案例,下面简要介绍 一下国外有关的成功实例:澳大利亚的a l l i a n ze l e m e n t a r 保险公司,b l u ec r o s s a n d b l u es h i e l d o f f l o r i d a 保险公司和s p a n i s h i n s u r e r 保险公司利用数据挖掘 工具对客户忠诚度、客户细分和客户保持进行分析,以减少客户流失;美国的 a l l s t a t ef i n a n c i a l 保险公司利用数据挖掘技术对不同客户的消费特征进 行分析,制定以客户为中心的营销策略;a x ao y a k 利用数据挖掘技术提高市 场份额,提高了销售利润,并且对理赔客户进行欺诈识别,降低赔付风险;c h u b b & s o n 保险公司应用数据挖掘技术对客户价值进行分析,制定b t b 销售策略和 交叉销售;c o f a c e 保险公司和f i r e m a n sf u n d 保险公司利用数据挖掘技术对客 户进行风险评估,为制定费率及其理赔策略提供依据;法国的g r o u p a m a 保 险公司利用数据挖掘技术对客户行为和客户价值进行分析,提供销售决策支持; 美国的菲尔曼基金保险公司运用企业数据挖掘系统对付欺诈行为和代位追偿进 行分析,应用这个系统的结果是:该解决方案通过提高菲尔曼基金公司的财务和 经营报告能力所节约的成本和所增加的收入,累计每年为公司的底线增加2 弓 千万美元。反欺诈及代位追偿的作用:菲尔曼基金公司预计每年欺诈行为造成的 损失减少7 0 万美元,同时每年实现2 百万美元的代位追偿收入【”。 1 3 本论文的研究方法和内容 论文较系统地论述与分析了数据挖掘技术以及保险业的现状和特点。提出了 汽车保险业数据挖掘的主题,设计了汽车保险业数据挖掘的模型和算法,并对湖 北某产险公司的保险业务进行实证分析。 本人主要做了以下工作: ( 1 ) 首先,介绍保险业的概况及其主要发展趋势,并且对保险业信息化建设 3 武汉理_ 【大学硕士学位论文 作了简要的概述,信息化建设为保险公司应用数据挖掘技术奠定了基础,而在保 险业中引入数据挖掘技术,可以提升保险业的竞争能力。 ( 2 ) 对数据挖掘各种技术以及数据挖掘流程及其发展趋势进行简单的概述。 ( 3 ) 提出了我国汽车保险业目前迫切需要的4 个数据挖掘主题。 ( 4 ) 根据保险业需要挖掘的主题,提设计了汽车保险业数据挖掘的模型和算 法设计。 ( 5 ) 针对湖北某产险公司的保险业务进行了实证分析。 本文的组织结构如下: 第1 章绪论介绍了本课题研究的背景及国内外研究的现状。 第2 章分析了汽车保险业中数据挖掘的意义。 第3 章介绍了数据挖掘的基本理论。包括数据挖掘的发展历史,数据挖掘的 定义,数据挖掘的功能,数据挖掘与传统分析方法的区别,数据挖掘的过程,数 据挖掘的分类,数据挖掘所发现的知识。 第4 章提出了汽车保险业数据挖掘的主题,设计出了系统模型和算法。 第5 章针对湖北某产险公司进行了实证分析。 第6 章是结束语。 4 武汉理工大学硕士学位论文 第2 章汽车保险业中应用数据挖掘的意义 汽车保险作为一种财产保险,与其他险种相比具有自身的特点。汽车保险业 务量较大,拥有大量的客户信息、业务数据和财务数据,这为在车险业务中应用 数据仓库和数据挖掘技术创造了条件【1 2 1 。影响汽车风险的因素众多。机动车保 险中的危险因素与驾驶员的关系很大,如驾驶员的年龄、性别、职业、婚否、身 体状况、生活习惯等;具有很强的地区性特征,与当地的社会风俗习惯、经济活 动等关系密切;汽车保险的事故率与人为因素密切相关。但是,我国汽车保险业 务缺乏能够对于各种因素的影响进行分析专门的精算技术支持和健全的数据统 计核算体系【1 3 1 。 综合以上特点可以看出,汽车保险业务拥有大量的数据基础,而且迫切需要 数据分析技术的支持,所以,对于数据挖掘技术在车险业务中的应用研究具有较 大的可行性和实用性1 1 4 1 。 2 1 我国汽车保险业的发展历史 我国自1 9 8 0 年恢复国内保险业务以来,汽车保险业务蓬勃发展【1 5 】。从目前 看,车险的保费收入己占财产保费收入的6 0 ,成为我国财产保险业务的龙头险 种,也是目前尚未放手让外资保险公司经营的主要险种。就目前而言,我国汽车 保险无论从容量上,还是效率上都有相当大的发展空间和提升余地。承保机动车 仅占社会汽车拥有量的3 3 ,保险深度为1 5 7 ( 世界平均水平为7 3 ) ,保险 密度为1 2 美元( 世界平均水平为4 3 0 美元) ,赔付率却高达5 5 7 ,随着人们经济 条件的改善和国家把轿车作为新的消费增长点的产业政策的实施,未来的汽车保 险市场将有较大幅度的发展。也正是因为中国的保险市场如此肥沃,才引来2 0 0 多家外资保险公司和机构对此虎视眈眈。我国保险市场放开后,汽车保险业务必 定面临严峻的考验。目前我国经营车险业务的财险公司分别是:中国人民保险公 司、太平洋财产保险公司、平安保险公司、华泰财产保险公司、天安保险公司、 大众保险公司、华安财产保险公司、永安财产保险公司、中华联合财产保险公司 和太平保险公司等。其中前三家中国人保、太平洋财险、平安保险共占据了全国 车险业务9 0 的市场,其他保险公司还只在部分省市有分公司,业务规模偏小。 1 9 8 0 年开始到现在2 0 多年时间中,经营主体由中国人保一家上升至现在的2 0 多家大大小小的保险公司,但这些保险公司由于管理经营效率低,造成好多公司 车险处于亏损的局面,从世界上任何一个国家的保险业的发展历程来看,国家和 武汉理工大学硕士学位论文 行业如何对保险公司的主要经营行为。尤其是保费收取进行监督和管理始终是一 个焦点问题,存在着是采用较为严格的费率制度模式和采用完全市场化模式的权 衡。较为严格的费率制度即由国家保险监督管理部门或者由行业公会制定一套相 对严格的费率体系,市场上所有保险公司在经营过程中均必须严格遵循这一费率 体系;完全市场化的模式,即保险公司可以根据自己对风险的认识和经营方针自 由地确定费率,而国家保险监督管理部门则主要对保险公司的偿付能力进行监 控。 我国加入w t o 后,随着保险市场的日益开放和保险业竞争的日趋激烈化, 保险产品条款、费率的市场化成为保险业变革的必然趋势,而车险业务对此的要 求更为迫切。主要原因如下: ( 1 ) 汽车消费日趋旺盛,车险市场扩容迅速。近几年,我国汽车的年销售量 呈2 0 左右的比例增长,远远高于g d p 年7 8 的增长速度。2 0 0 1 年共承保汽 车1 8 9 1 4 万辆,增长1 2 2 4 。从各家保险公司承保车辆数目来看,除中国人保 因基数大增长率在8 7 外,其他保险公司增幅基本上在2 0 以上,增幅最高的 为1 3 1 2 4 。据美国通用公司对中国市场的预测:5 1 0 年后,中国市场每年对新 增汽车的需求量在4 0 0 万辆以上,按每辆车5 0 0 0 元的车险保费计算,计算结果 是2 0 0 亿元人民币。这将为车险提供丰富的保源,并促进车险市场的竞争和车险 费率的市场化。 ( 2 ) 费率市场化有助于科学制定车险费率。车险费率由纯费率和附加费率构 成。其中,纯费率以保险金额损失率为基础,通过精算手段测算出来,反映了车 险业务的实际损失状况,是维系偿付能力的根本,不允许随意调整。附加费率以 保险公司的营业费用为基础计算,用于经营费用和手续费支出,并可以形成部分 保险利润。车险费率市场化就是在维护纯费率基本不变的前提下,允许保险公司 在附加费率范围内进行价格调整,通过降低经营开支,增强竞争能力。 ( 3 ) 费率市场化有利于促进竞争,使消费者受益。随着车险经营公司日益增 多,车险市场份额在多家保险公司之间分配,垄断程度逐步降低,竞争日趋激烈。 市场竞争的一个重要手段就是价格竞争,对车险市场放开价格管制,将促使竞争 主体提高经营效率,最终使消费者得益。为了在我国实行车险费率市场化,国内 保险公司做了大量的准备工作。首先是建立车险的费率浮动制度,采用地区和险 种费率结构的调整,使费用水平更加贴近市场。其次是建立车险风险评估体系, 奠定市场化的信息基础。2 0 0 0 年,保监会在深圳试点推行智能保险证工作,这 项工作的最大特点之一就是建立了车险数据库模式,引进国际上普遍采用的“随 车、随人、地理和气候四要素费率”模式。第三,逐步研究个性化条款与费率, 推进产品细分和费率细分,在条件成熟的时候实现车险产品结构和费率要素与国 6 武汉理下大学硕士学位论文 际接轨。第四,采用国际标准的信息标准、赔付率计算方式和准备金提取方法, 推进车险精算研究,改革保险会计制度,适当的时候取消财务管理规定,强化保 险税法制度。2 0 0 1 年1 0 月1 日起,我国开始在广东省进行汽车保险费率改革试 点。2 0 0 2 年8 月,保监会发布了关于改革汽车保险条款费率管理制度的通知。 中国保监会决定改革现行的车险条款费率管理制度。l o 月2 8 日,新保险法 在人们期待己久的目光中诞生了,而其中车险费率的修改对车险市场影响深远。 新保险法中规定,保监会不再制订统一的车险条款费率,车险条款费率由各 保险公司自主制订、修改和调整,经保监会备案后,向社会公布使用。这意味着 保监会对车险费率放开,由保险公司自主决定,使车险费率走向市场化。2 0 0 3 年1 月1 日起,在全国范围内实施新的车险条款费率管理制度。经过三个月过渡 期,从当年4 月1 日起,各保险公司全部实行自行制定,经保监会批准的新车险 条款费率体系。历经四年,由于市场需求及国家政策的变化,2 0 0 7 年4 月1 日 起,由中国保险行业协会牵头开发的2 0 0 7 版新行业车险产品将正式启用,原2 0 0 6 版行业基本条款停止使用。2 0 0 7 版行业基本条款分为a 、b 、c 三款,国内经营 车险的保险公司都必须从这三款行业基本条款中选择一款经营。新版行业产品涵 盖车辆损失险、三者险、车上人员责任险、盗抢险、不计免赔率特约险、玻璃单 独破碎险、车身划痕损失险和可选免赔额特约险等8 个险种。仍然为h 、b 、c 三套,由各家保险公司自行选择,三套之间保障范围、费率结构、费率水平和费 率调整系数基本一致。也就是说,4 月1 日起,消费者在不同保险公司投保上述 八大常用险种将享受同样价格。车险费率经历由国家统一控制到费率市场化,最 后又回到了费率趋于统一的时代。 2 2 汽车保险的经营现状 近几年,我国车险保费收入稳步增长,且增长比例稳中有升。2 0 0 0 年以来, 车险保费收入占财险保费收入比例一直维持在6 0 以上,车险市场的发展状况 对于财险市场的发展有着举足轻重的作用。各财险公司的车险业务量占财险业务 的大部分,对车险的经营状况直接影响到整个公司的发展,各家公司在积极调整 险种结构的同时仍把车险放在重点。车险综合赔付率。2 0 0 0 年以前,车险的 赔付率逐年下降,但是自2 0 0 0 年以来,车险赔付率直线上升,且仍有继续上升 的趋势。自2 0 0 1 年以来,车险市场的赔付率增长速度大大快于保费收入增长速 度,赔付率增长过快的原因有很多方面,最直接的结果导致保险公司的赔付压力 过大,支出超过预算,公司的盈利水平明显下降。营运性车辆的高赔付,是车险 赔付率高的首祸。由于营运车风险大、出险频率商赔付水平居高不下。据了解, 一直以来营运车辆赔付率都在7 0 8 0 左右,出租车赔付率几乎达到1 0 0 ,1 0 7 武汉理工大学硕士学位论文 吨以上的货车赔付率在2 0 0 左右,5 至l o 吨载重的货车赔付率超过1 5 0 。另 一方面,2 0 0 3 年新车销售量大幅度增加,上路的新手也对应增加,尤其是私家 车。但私家车驾驶员大多为新手,出险频率极高,私家车的赔付率己高达7 0 , 远远超出了车险赔付率的警戒线。更重要的是,在案件很小的情况下,保险公司 都得照常履行理赔程序,有时理赔金额可能只有几十元,但保险公司往往要为此 支付上百元的成本,如拖车费3 0 0 元辆。当满期赔付率数值超过7 0 时,车 险业务亏损。在新的车险条款费率管理制度实施前,满期赔付率相对较低。而在 新的车险条款费率管理制度实施的第一年,满期赔付率大幅度上升,车险业务严 重亏损。2 0 0 4 年前5 个月的满期赔付率稍低,部分原因与保险公司对出现的新 情况采取了一系列措施有关。事实上,最近几年车险市场的经营结果并不令人满 意,行业亏损也成为大家公认的看法。车险行业的经营结果不佳,并非某一个因 素的影响,而是赔付率、手续费及费用率过高的综合影响。 2 3 汽车保险产品领域存在的问题 就目前财险公司在经营车险的过程中存在的问题,重点应该从下面几个方面 掌握: 1 车险产品同质化。一些公司耗费巨资和人力开发出新产品,结果很快被 竞争对手模仿和跟风,对一些条款稍作变动和调整,类似产品一时间冒出很多, 甚至以更低的价格和条件向市场推销,因此,很多保险公司往往不愿意在新产品 研发上做高投入。西南财经大学保险与社会保障研究中心主任林义教授告诉记 者,如果把产品的模仿和复制比喻为“劣币”,产品创新和投入比喻为。良币”, 很多保险机构为抢占市场份额,或基于短期的盈利目标,不愿意或难以做好一些 实实在在的调研工作,市场就陷入所谓。劣币驱逐“良币”一格雷欣法则支配的 金融怪圈。由于多数消费者不明就里,或者对保险知识知之甚少,现实需求的存 在往往在客观上助长了“劣币”的盛行,但是,一个合理的逻辑推断在于,如果 “劣币”的增加不能与“劣币”供应者的服务供给相匹配,那么,。劣币”将会 被自己所驱逐,再把“良币”请回来。功能类似的产品对消费者往往缺乏吸引力, 即使市场需求十分庞大,部分消费者还是会花费大量时间进行比较和甄别,一旦 产品雷同,最终靠的是服务和管理之间的较量。一家公司即使是模仿了产品,但 相关的服务、管理等配套措施跟不上,也会导致消费者对产品失去信心,最终导 致退保等现象的发生。人有我无,未必意味着我失去市场,公司需要真正做出自 己的品牌和特色,在各个环节上进行自主创新。 2 风险管理能力低下。保险业在这多年的经营过程中,积累的数据不少, 但是有用的,符合规范的数据比较少,同时缺乏先进的数据处理技术。近几年来, 8 武汉理工大学硕士学位论文 中国保险机构受市场经济利益驱动的影响,过于强调业务导向,自上而下重业务、 轻风险管理的意识相当浓厚。突出表现在重视保险业务收入指标,以业务量多少、 保费收入多少论业绩,忽视理赔指标考核的重要性,重视宣传保险营销的事例多, 介绍保险信用先进事迹的偏少。同时,对保险风险控制及保险管理没有形成一套 严格、科学的约束机制和具体量化考核办法,使保险信用关系失去了坚实的信用 基础。 2 4 数据挖掘技术在汽车保险业中应用的意义 保险企业的业务活动主要有以下几个方面:保险产品销售,定制新产品,用 户投保,理赔,赔付等。在这些业务活动中产生了大量的数据并形成了各自的事 务型数据库,如用户信息数据库、索赔数据库等。从这些数据中获取有用的知识 并用于相关的业务活动中是保险业务在竞争中取得优势的重要手段【蛉 l 。 保险是一项风险业务,也是风险评估技术的最重要的应用,保险公司的一个 重要工作就是对不同风险领域进行鉴定和分析,即风险评估。风险评估对保险公 司的正常运作起着至关重要的作用,保费和保单的设计都需要比较详细的风险分 析【捧1 9 l 。保险公司成功的一个关键因素是在设置具有竞争力的保费和覆盖风险之 间选择一种平衡,保费是通过对一些主要的因素,如汽车保险中车辆的类型等进 行分析和判断来确定,由于市场情况常常是变化的,每年都要根据往年数据分析 调整保费闭。目前保险公司的专业人员采用的分析方法常常是粗略的,往往需 要分析人员对大量的统计数据报表凭经验做出决策,这不仅是相当困难的,而且 受主要因素的影响1 2 “。 数据挖掘提供了进行保险投资组合数据库分析的环境,数据挖掘的多种方法 可用来进行风险分析。通过数据挖掘技术,可以从过去的保单及其索赔信息出发, 利用决策树的方法,寻找保单中风险较大的领域,从而得出一些实用的风险规则, 对保险公司的工作起到指导作用,帮助保险公司规避风险。运用基于粗糙集来挖 掘保单数据中的风险规则,得到一些风险规则后,保险公司可以针对这些低风险 的顾客进行营销和服务,以便留住这些顾客i 翻。在运用粗糙集对保单数据进行 挖掘的步骤( 1 ) 数据准备,( 2 ) 数据补缺和离散化,( 3 ) 属性的约简,( 4 ) 风 险规则的产生和过滤。关联规则发现是数据挖掘技术的一种简单又很实用的方 法,可以运用不同的软件工具如:s g i 公司的m i n e s e t ,c t r e e 对保险业务数据 进行关联规则进行挖掘。在运用关联规则方法对保单进行挖掘的准备工作,先从 源数据中挑选出有关信息,如年龄、年工资、单位类别、单位地区、索赔次数, 然后对年龄、年工资等连续数值数据进行离散化。这些准备工作做完后,才开始 进行挖掘嘲。 9 武汉理工大学硕士学位论文 第3 章数据挖掘的基本理论 3 1 数据挖掘技术的发展历史 如今,数据库技术应用极为广泛,通过使用各种数据库管理系统以及数据库 开发工具,人们可以建立数据库来存储数据,可以实现数据的整理、加工、查询 和输出。当前,在各种企业、金融证券、商业交易、科学研究和各种调查所建立 的数据库中,都积累了大规模的数据i 刎。激增的数据背后隐藏着许多重要的信 息,常规的数据检索和分析功能给人们提供了诸如快速查询、分类汇总、统计分 析等功能。但是人们希望能够对其进行更高层次的分析,以便更好地利用这些数 据。目前的数据库系统无法发现数据中存在的关系和规则,无法根据现有的数据 预测未来的发展趋势i 瑚。缺乏挖掘数据背后隐藏的知识的手段,导致了“数据 爆炸但知识贫乏”的现象。常规的数据处理不能充分地利用数据库数据,需要一 些新的数据提取、分析处理功能,以便在大量数据存储中发现和提取潜在的、有 价值的信息,例如数据间的联系、数据分类特征等,这些信息称为知识吲。数 据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的 知识,这两者的结合促成了数据库中的知识发现( k d d :k n o w l e d g ed i s c o v e r yi n d a t a b a s e s ) 的产生,k d d 所研究的主要内容,即寻找有效的数据整理和重构的机 制,以及寻找新的数据分析工具来发现知识【2 ”。从数据库中发现出来的知识可 以用在信息管理、过程控制、科学研究、决策支持等许多方面 2 s l 。 1 9 8 9 年8 月在美国底特律召开的第n 届国际人工智能联合会议的专题讨论 会上首次出现k d d 这个术语。随后举行的k d d 专题讨论会,汇集来自各个领 域的研究人员和应用开发者,集中讨论数据统计、海量数据分析算法、知识表示、 知识运用等问题。 数据挖掘是k d d 最核心的部分,是采用机器学习、统计等方法进行知识学 习的阶段1 2 9 侧。数据挖掘算法的好坏将直接影响到所发现知识的好坏。目前大多 数的研究都集中在数据挖掘算法和应用上。人们往往不严格区分数据挖掘和数据 库中的知识发现,一般在科研领域中称为k d d ,而在工程领域则称为数据挖掘。 k d d 的研究非常有现实意义,所获取的信息或知识可以广泛用于各种应用,包 括商务管理、市场分析、管理决策、生产控制、工程设计等。典型的例子是:保 险公司从大量的客户数据中可以发现客户的风险特征,从而为风险预测提供支 持。k d d 一般包含如下几个步骤( 图3 1 ) : 武汉理工大学硕七学位论文 数据清理与集成选择与转换数据挖掘评估与表示 图3 1 数据库知识发现的步骤 ( 1 ) 数据清理 对原有数据库中的数据进行检查和预处理,包括填写遗漏数据、发现和改正 不正确的数据、识别和删除偏离期望的数据以及重复的数据等。 ( 2 ) 数据集成 原有的数据库可能是分散在异地数据源中或不适合于知识发现。将所涉及的 多个数据源的数据加以集成,构成数据仓库或关系数据库或其他适当的数据库形 式。 ( 3 ) 数据选择 。 根据任务的要求,从数据库中提取与分析任务相关的数据。 ( 4 ) 数据变换 将数据变换成适合挖掘的形式。 ( 5 ) 数据挖掘 用合适的方法提取和抽象出数据模式。所谓模式是指挖掘到的信息形式。 ( 6 ) 模式评估 根据某种兴趣度识别出真正有趣的数据模式,即知识。 ( 7 ) 知识表示 使用可视化和知识表示技术,向用户提供挖掘的知识。 在k d d 过程中,数据挖掘是一个基本步骤,其功能是从大量数据中提取模 式。从理论角度,数据挖掘的主要问题是寻找有效的算法;从实用角度,在实际 的应用中要实现算法,并确定数据模式的输出形式。仅将数据挖掘看作k d d 过 程中的一个基本步骤是不合理的,因为数据挖掘的前序步骤也是重要的,在这些 武汉理工大学硕士学位论文 步骤的基础上,才可以进行数据挖掘。因此,将数据挖掘与数据库中知识发现视 为同义词,这种看法在实现实际应用中的数据挖掘中,显然更有实际意义,因为 现实中的数据库形式一般不直接适合于数据挖掘,必须整理、转换为挖掘算法要 求的数据形式,然后运用挖掘算法发现数据模式。总之,数据挖掘就是对数据库 中大量的数据进行分析,提取令人感兴趣的模式,来充分利用数据库数据。模式 是数据挖掘的结果,模式的形式化定义如下:给定一个事实( 数据) 集f ,一个语 言l ,以及可信度度量c ,一个模式s 就是l 中的一个陈述,s 以可信度c 来描 述f 的一个子集f s 中的关系,并使得s 要易于对f s 所有事实的简单枚举。发现 有趣的模式是数据挖掘的目标,模式的有趣度度量由用户给出。 3 2 数据挖掘的定义 3 2 1 技术上的定义 数据挖掘( d a t am i n i n g ) 就是从大量的、不完全的、有噪声的、模糊的、随 机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用 的信息和知识的过程p 1 1 。与数据挖掘相近的同义词有数据融合、数据分析和决 策支持等。这个定义包括好几层含义:数据源必须是真实的、大量的、含噪声的; 发现的是用户感兴趣的知识;发现的知识要可按受、可理解、可运用;并不要求 发现放之四海皆准的知识,仅支持特定的发现问题。 何为知识? 从广义上理解,数据、信息也是知识的表现形式,但是人们更把 概念、规则、模式、规律和约束等看作知识。人们把数据看作是形成知识的源泉, 好像从矿石中采矿或淘金一样。原始数据可以是结构化的,如关系数据库中的数 据1 3 2 l ;也可以是半结构化的,如文本,图形和图像数据;甚至是分布在网络上 的异构型数据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎 的,也可以是归纳的。发现的知识可以被用于信息管理,查询优化,决策支持和 过程控制等,还可以用于数据自身的维护。因此,数据挖掘是一门交叉学科,它 把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策 支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工 智能技术、数理统计、可视化技术、并行计算等方面的学者和工程技术人员,投 身到数据挖掘这一新兴的研究领域,形成新的技术热点。 这里所说的知识发现,不是要求发现放之四海而皆准的真理,也不是要去发 现崭新的自然科学定理和纯数学公式,更不是什么机器定理证明1 3 3 j 。实际上, 所有发现的知识都是相对的,是有特定前提和约束条件,面向特定领域的,同时 还要能够易于被用户理解。最好能用自然语言表达所发现的结果。 武汉理工大学硕十学位论文 3 2 2 商业上的定义 数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大 量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的 关键性数据。 简而言之,数据挖掘其实是一类深层次的数据分析方法【矧。数据分析本身 已经有很多年的历史,只不过在过去数据收集和分析的目的是用于科学研究,另 外,由于当时计算能力的限制,对大数据量进行分析的复杂数据分析方法受到很 大限制。现在,由于各行业业务自动化的实现,商业领域产生了大量的业务数据, 这些数据不再是为了分析的目的而收集的,而是由于纯机会的商业运作而产生。 分析这些数据也不再是单纯为了研究的需要,更主要是为商业决策提供真正有价 值的信息,进而获得利润。但所有企业面临的一个共同问题是:企业数据量非常 大,而其中真正有价值的信息却很少,因此从大量的数据中经过深层分析,获得 有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也因此 而得名p j 。 因此,数据挖掘可以描述为:按企业既定业务目标,对大量的企业数据进行 探索和分析,揭示隐藏的、未知的或验证已知的规律性,并迸一步将其模型化的 先进有效的方法【3 6 j 。 3 3 数据挖掘的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年下半年吉林延边公交集团公开招聘10人易考易错模拟试题(共500题)试卷后附参考答案-1
- 高铁制梁场复垦施工合同(3篇)
- 高速公路改造合同模板(3篇)
- 安全施工考试题及答案
- 高明租房合同台账模板(3篇)
- 事业单位聘用合同解除与竞业限制期限合同
- 2025河南公务员面试题及答案
- 《中小学校学生家长参与学校课程改革协议》
- 股权代持解除与控制权恢复-法律程序与执行合同
- 中央预算单位公务卡支付结算与财务管理合作协议
- 第3章 即时定位与地图构建技术课件讲解
- 锚杆格梁施工合同书
- 汽车用品采购合同
- P.E.T.父母效能训练
- 《研学旅行课程设计》课件-了解研学旅行概念
- 传统中医针灸技术操作规范
- 沅陵旅游宣传方案
- 个人防护用品使用和检查知识
- MBTI量表完整版本
- 《检验手册》全文
- 基本不等式-高考历年真题
评论
0/150
提交评论