保险业信息化中数据挖掘技术的应用研究.doc_第1页
保险业信息化中数据挖掘技术的应用研究.doc_第2页
保险业信息化中数据挖掘技术的应用研究.doc_第3页
保险业信息化中数据挖掘技术的应用研究.doc_第4页
保险业信息化中数据挖掘技术的应用研究.doc_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

加入WTO后,随着国内经济的快速发展,保险业也进入了激烈竞争的时代。而许多国内保险公司面对大量的保单业务数据,却没有相应的能力对之进行深层次的分析和挖掘,不能让海量数据为企业发展带来巨大的增值作用。数据挖掘技术在保险业中的应用,可以帮助保险公司提高管理和决策水平,为保险企业和用户创造更高的投资回报率。目前有关保险业中数据挖掘的应用研究文献还较缺乏,本文中将尝试进行这方面的探索,并针对数据挖掘技术在我国保险业应用中存在的问题提出具体建议。1 数据挖掘与我国保险业信息化现状信息化水平是衡量一个保险企业核心竞争力、经营管理水平的重要标志。随着中国保险业面对全球保险业的竞争和挑战加剧,充分利用信息技术来提高经营管理水平成了保险机构和企业最重要的应对策略和措施之一。信息化建设已经不再是单纯支撑保险业务开展的手段,而是公司核心竞争力的重要组成部分。经过几年来的发展,国内保险业的信息系统已经基本建立起来。但无论是与国外的保险业相比还是与国内的银行业、证券业相比,其信息化水平还处于相对落后的水平。目前信息化在保险业务管理以及决策方面应用的广度和深度离保险业持续快速发展的需要还有一定的差距,数据资产利用率不够是信息化水平落后的重要表现。9面对大量的保单数据,目前很多国内保险企业往往不能通过深层次的分析和挖掘,让海量数据为企业发展带来巨大的增值作用。数据挖掘技术是解决这一问题的重要手段。近年来,数据挖掘成为各行各业中广为关注的IT技术热点之一,在企业日常运营和决策中占据了重要的位置。Gartner Group在2007年的高级技术调查中将数据挖掘和人工智能列为“未来三到五年内将对行业产生深远影响的五大关键技术”之首。按照Han Jiawei的定义,数据挖掘是从大量的数据信息中提取人们感兴趣的知识,是知识发现的过程,1数据挖掘分为预测、关联、聚类、异常及序列相关性五大类分析。通过数据挖掘技术的应用,保险企业可以对保险公司的客户资源进行筛选、分类,对客户风险进行预测,有效地避免骗保的发生;可以帮助保险公司把低收益客户群中的潜在客户转移到高收益客户群中,提高公司收益;也可以帮助保险公司发现可能流失的客户,使企业客户挽留活动的利润达到最大化;还可以通过发现被客户同时购买的产品之间的关联,帮助保险公司制定营销策略。总之,数据挖掘使企业得以利用公司的历史数据资源去认识客户,认识市场,提供信息化决策支持,使保险企业从粗放式管理向精细化管理转移,真正实现数据向知识的转化。2 数据挖掘在我国保险行业中的应用目前来看,我国保险业中数据挖掘技术的应用主要集中在客户关系、风险管理及数据中心建设等几个主要方面,以下对它们的应用状况进行分析。2.1 客户关系管理客户关系管理(CRM)是数据挖掘的重要应用领域。13将数据挖掘结合在保险业CRM 中或者作为一个独立的应用程序来实施 ,可以帮助保险公司在客户生命周期的各个阶段充分挖掘客户的价值以及客户可能带来的潜在价值。8充分挖掘客户的价值以及发现客户可能存在的潜在价值,是客户关系数据挖掘的根本目标。1) 在客户识别方面,通过数据挖掘技术可以进行客户特征的细分,识别潜在客户,然后将他们转变成真正的客户。数据挖掘技术的概念/类描述可以用简捷汇总的形式描述给定的任务相关数据集,提供客户数据的一般特征。此外,分类和聚类也可用于客户评级和分类。52) 在客户保持方面,挖掘的应用包括客户忠诚度分析和客户流失警示分析。通过数据挖掘,对客户历史交易行为的分析,警示客户异常行为,并提出相应的对策建议。3) 在提高客户价值方面,首先,数据挖掘可以提供客户购买行为模式分析,进行客户细分,从而提供更具针对性的个性化服务;其次,数据挖掘支持客户盈利能力分析,预测客户盈利能力变动以增强客户盈利能力;此外,通过有效的进行交叉营销,向现有的客户提供新的产品和服务,可以实现购买推荐和升级销售 。2.2 风险管理从总体上看,中国保险业风险管理水平还较低,风险管理理念不强。统计数据表明我国近年来40的保费增长率是在粗放型经营模式下,15也即在风险管理未能有效实施的情况下实现的,这种经营模式不仅有悖于保险业风险承担、风险分散的宗旨,而且大大影响保险业可持续发展的基础。保险经营是在大量可保风险前提下运用大数法则对可保风险进行分散,各类风险数据、损失数据是保险经营的数理基础。在相当程度上也可以说,风险数据、损失数据是保险经营的保险资源。我国相当部分保险公司都未能建立有效的风险信息系统,导致保险经营决策缺乏合理依据,这也是中国保险业风险管理水平较低的重要原因之一。数据挖掘技术是为保险业风险管理提供科学决策依据的重要手段。利用数据挖掘技术可以对保险业的客户资源进行筛选、分类,将客户信用分成若干等级,对客户风险进行预测,从而有针对性地对信用等级预测低的客户进行资料的调查核实,有效地避免骗保的发生,规避业务风险。11进而针对不同的风险级别,帮助保险公司在产品定价中发挥作用。对客户信用产生影响的因素很多,如客户的收入水平、保费与收入的比例、教育程度、居住地区、信用历史、年龄、职业,等等。信用评级实际上是将一个总体按照不同的特征分成若干不同组的一种方法,即是一种数据分类和预测方法。分类和预测用于提取描述重要数据类的模型或用于预测未来的数据趋势。目前分类预测方法主要包括判定树分类方法、基于神经网络分类方法和贝叶斯法等。1判定树是一个类似于流程图的树结构,其中,每个内部节点表示在一个属性上的测试,每个分枝代表一个测试输出,每个叶节点代表一个类或类分布。图1是保险业客户信用等级的判定树例子,表示概念credit_rating,用于指出客户的信用状况。此外,也可使用关联属性的计算和挖掘,发现影响信用的主要因素和次要因素,辅助营销策略。72.3 数据中心与数据仓库保险业庞大的信息系统需要一个数据中心对其进行整合和统一管理,这也是保险业一体化管理的必然要求。数据中心是在对数据进行处理、清洗后建立的一个标准信息库,通过它把数据有效地管理起来。对海量的客户及保单数据,可以进一步经过处理形成数据仓库,将客户对市场的反馈呈现在数据仓库中,对整合好的数据建立起一个信息分析的中心,以满足更高层面、更深入的分析和决策需求。可见,现在的数据中心早已突破传统数据中心存储、计算、处理的应用,升级到为企业业务发展提供支持与决策的层面。6数据仓库是伴随着决策支持系统的演化发展而逐渐发展起来的。按照W.H.Inmon的定义,数据仓库是一个面向主题的集成的时变的非易失的数据集合,支持管理部门的决策过程。3数据仓库可以把事务数据库中原始混乱的数据集成转化成数据仓库中规范的数据,方便用户的分析和查询,进而辅助企业决策。数据仓库提供联机分析处理(OLAP)工具,用于各种多维数据分析。例如,管理者可能希望按职业、按地区、按收入、以及按其他因素查看保险销售的变动情况,同时希望能提供诸如最大、最小、总和、平均和其他统计信息。图2是以三维角度观察公司销售数据的数据仓库星型模式示例,三个维属性分别是地区类别单位类别和产品类别。有了数据仓库的统计数据,既可以直接做为联机分析,也使得以之为基础的挖掘效率和性能大大提高。3. 对我国保险业深化数据挖掘技术应用的建议由上述可见,数据挖掘技术可以极大提高保险企业信息化决策和管理的水平,同时促进我国保险信息化的发展。与国内其他金融行业的机构及欧美国家的同业保险机构相比,目前我国保险业的信息化发展还存在许多问题,制约了数据挖掘技术的更深入的推广与运用。以下针对存在的问题提出具体建议和对策。(1) 进一步加大保险信息化投入和人才培养力度。IDC的IDC中国保险行业IT解决方案20082012预测与分析统计数据表明,2007年,中国保险业IT投资规模为38.46亿元人民币,IDC预测,未来几年内国内保险业IT投资规模将保持在14%左右的增长率。而 “十五”期间,我国保险业务收入年均增长超过25%,数字的对比也显示出我国保险业的信息化进程相对于迅速扩张的保险业务处于一种相对滞后的阶段。对于海量数据的处理需要大规模数据库和存储设备的支持,数据挖掘的推广和使用需要大量的人力和财力的支持,是一个渐进的长期的过程。除了硬件设施、软件平台的逐步完善,数据挖掘人才的不足也是制约它发展的瓶颈。IDG统计数据显示14,2005年我国IT业人才至少缺少42.5万人,即使按照目前IT业人才的培养速度,今后每年至少仍然还有20万人左右的缺口,而数据挖掘是IT行业人才紧缺方向中的重要一个。进一步加大IT人才培养和信息设施投入力度是促进保险业信息化发展和数据挖掘深入应用的重要前提。(2)构建技术标准化体系我国保险业的技术标准化体系还相对缺乏,各地区各自为政、系统平台不一致的问题仍存在。数据挖掘是从海量数据中进行知识发现,数据不集中的问题在很大程度上制约了以数据挖掘进行分析决策的实施。大量的分散的保单业务数据,给数据挖掘和分析工作带来巨大困难和代价。尽快推进保险业务平台的统一化、实现信息共享,是保险业提高科学决策与管理水平的重要保障。(3)促进企业经营理念的转变由于历史原因,我们许多保险企业仍实行风险管理和科学决策水平低下的粗放式经营,缺乏忧患意识,这将使中国保险业在国际保险市场中丧失竞争力,导致中国保险业在对外开放和加入WTO中处于更加不利的局面。企业应该去思考如何充分利用公司的数据资产实现决策支持,使粗放式管理向精细化管理转移,真正地实现数据到知识的转换。新时代背景下,保险信息化对于我国保险企业来说,即是新挑战也是新机遇。(4)鼓励自主研发目前市场上存在一些通用的数据挖掘专业软件,如在统计分析和数据挖掘领域具有权威性的美国SPSS Clementine产品,它支持数据挖掘模型的多样性,同时具有可视化的优势。但通用产品在满足个性化需求的功能方面明显不足。目前,我国尚缺少数据挖掘方面软件的自主知识产权,12对于有志于提供特色差别服务的国内保险企业来讲,应大力提倡和鼓励数据挖掘系统的自主开发和研制。(5)关注技术发展趋势从技术层面看,数据仓库是数据挖掘的重要预处理步骤。借助数据仓库和数据立方体,通过关联分析、聚类、孤立点分析等,可以在保险数据分析和决策中发挥重要作用。数据挖掘与数据仓库系统的集成有助于数据挖掘的高性能和高效率 ,从而改善信息化决策支持的水平,也是高效挖掘系统的特征和趋势。此外,随着

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论