已阅读5页,还剩55页未读, 继续免费阅读
(计算机应用技术专业论文)基于数据仓库的车险业务分析系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东大学硕士学位论文 摘要 近年来,各种新型的保险业务不断涌现,人们对保险业务的要 求也不断提升。如何根据投保品种、投保人等历史数据,合理设定 储备金数额、保险金标准,进行快速有效的风险分析和损益判断, 提供个性化保险服务,进而计算制定出适合个体保险公司的车险统 计指标,是保险业亟需解决的问题。 商业智能( b u s i n e s si n t e1 1ig e n t e ,简称b i ) 技术是随着企业 信息化等不断深入而产生的一种技术,可以对企业信息系统收集的 大量零散、杂乱、孤立的信息进行有效、合理地分析和处理,提取 企业所需要的有用的信息,为企业决策者提供可靠的依据。b i 技术 主要包括数据仓库、o l a p 和数据挖掘等技术。这些技术都是目前计 算机科学研究的一个热点和难点。本文主要探讨商业智能技术在车 险业务分析中的应用,提出了一种基于数据仓库和数据挖掘技术的 车险业务分析系统。 本文在对车险行业进行了详细分析的基础上,介绍车辆保险的 基本指标,重点介绍了保费指标、赔款指标、赔付率指标、管控指 标和财务指标。其次,根据实际的业务情况,基于商业智能技术, 提出了系统总体的架构设计,主要介绍系统的软件架构及系统的部 署结构。本文重点介绍了数据仓库的建立,以及如何利用数据挖掘 技术对数据仓库中的保单、保费等数据进行分析,重点介绍数据分 析设计的2 4 分法、历年制赔付率的计算方法,数据仓库模块中的处 理技术和报表的设计制作方法。针对数据分析指定的新指标,给出 一种修改的指标计算方法,可以为保险企业的运营决策提供科学、 高效、准确地支持,为市场经营工作提供及时、准确、科学的决策 依据,使企业适应日趋激烈的市场竞争环境,提升企业管理水平和 经营决策水平,从而提高企业的核心竞争力。 开发的系统已经用于车险业务分析。系统提供了丰富的报表展 山东大学硕士学位论文 示功能,可以为企业的管理者提供丰富的数据展示,让管理者可以 更好的了解当前公司业务和财务发展动态,进行风险控管,对渠道 和业务员进行绩效考核,为公司领导提供决策支持,提高企业的整 体评价业务水平。 关键词:商业智能、数据仓库、o l a p 、数据挖掘、车险业务 i i 山东大学硕士学位论文 a b s t r a c t i nr e c e n ty e a r s ,w i t ht h ec o n s t a n te m e r g i n go ft h en e wt y p e so f i n s u r a n c eb u s i n e s s p e o p l ea r er e q u e s t i n gah i g h e rd e m a n do nt h e i n s u r a n c eb u s i n e s s h o wt oc a r r yo u tr i s ka n a l y s i sa n dju d g et h ep r o f i t a n dl o s sr a p i d l ya n de f f e c t i v e l y ,p r o v i d eap e r s o n a l i z e di n s u r a n c e s e r v i c e s ,t h e nc a l c u l a t ea n dw o r ko u tav e h i c l ei n s u r a n c ec o m p a n i e s f o ri n d i v i d u a ls t a t i s t i c a li n d i c a t o r sa c c o r d i n gt ov a r i e t yi n s u r e d ,t h e i n s u r e d ,a n do t h e rh i s t o r i c a ld a t a w es e tar e a s o n a b l er e s e r v el e v e l w h i c hi st h eu r g e n tn e e dt os o l v ei nt h ei n s u r a n c ei n d u s t r y b u s i n e s si n t e l l i g e n c e ( b u s i n e s si n t e l l i g e n c e ,c a l l e db i ) i sak i n d o ft e c h n o l o g yw h i c hi sg e n e r a t e db yt h ec o n s t a n td e v e l o p m e n to ft h e e n t e r p r i s ei n f o r m a t i o n b is y s t e m sc a nc o l l e c tt h el a r g en u m b e ro f f r a g m e n t e d ,u n s y s t e m a t i c ,i s o l a t e de n t e r p r i s ei n f o r m a t i o ns y s t e mt o a n a l y s i sa n dp r o c e s se f f e c t i v e l ya n dr e a s o n a b l y ,c a ne x t r a c tu s e f u l i n f o r m a t i o nw h i c hi sn e e d e db yt h ee n t e r p r i s e ,a n dp r o v i d er e l i a b l e b a s i sf o rb u s i n e s sd e c i s i o n - m a k e r s b i st e c h n o l o g i e si n c l u d ed a t a w a r e h o u s e 、o l a pa n dd a t am i n i n g t h e s et e c h n o l o g i e sa r eh o ta n d d i f f i c u l tp o i n t si nc u r r e n tc o m p u t e rs c i e n c er e s e a r c h t h i sa r t i c l e d i s c u s s e st h eb u s i n e s si n t e l l i g e n c et e c h n o l o g yi nt h ev e h i c l ei n s u r a n c e b u s i n e s s ,t h e np r o p o s e sa na n a l y s i ss y s t e mw h i c hi sb a s e do nt h ed a t a w a r e h o u s ea n dd a t am i n i n gt e c h n o l o g y b a s e do nt h ed e t a i l e da n a l y s i so fv e h i c l ei n s u r a n c ei n d u s t r y ,t h i s a r t i c l ei n t r o d u c e s t h eb a s i ci n d i c a t o r so fv e h i c l ei n s u r a n c e ,a n d f o c u s e so nt h ep r e m i u mt a r g e t s 、i n d i c a t o r so fc o m p e n s a t i o n 、p a y m e n t r a t et a r g e t s 、i n d i c a t o r sa n dc o n t r o lo ff i n a n c i a li n d i c a t o r s s e c o n d l y , b a s e do nt h ea c t u a lb u s i n e s sa n db u s i n e s si n t e l l i g e n c et e c h n o l o g y ,t h i s a r t i c l ep r o p o s e dao v e r a l ls t r u c t u r eo ft h es y s t e md e s i g n ,m a i n l y i i i 山东大学硕士学位论文 i n t r o d u c e ss y s t e ms o f t w a r ea r c h i t e c t u r ea n dt h e s y s t e md e p l o y m e n t a r c h i t e c t u r e t h i sa r t i c l ef o c u s e so nt h e b u i l d i n g o ft h ed a t a w a r e h o u s e 、d a t am i n i n ga n dh o wt ou s ed a t am i n i n gt e c h n o l o g yt o a n a l y s i st h em e t h o do ft h es t o r a g eo fd a t a 、t h ep r e m i u m s 、a n do t h e r d a t a h i g h l ye m p h a s i z e dt h e2 4p o i n t s ,t h ey e a r s r a t eo fp a y m e n t c a l c u l a t i o nm e t h o d a n da n a l y z e dt h ed a t aw a r e h o u s em o d u l ei nt h e p r o c e s s i n gt e c h n o l o g ya n dt h es t a t e m e n t sd e s i g n t h e s et e c h n i c a l i n d i c a t o r sc a np r o v i d es c i e n t i f i c 、e f f i c i e n ta n da c c u r a t es u p p o r tf o rt h e o p e r a t i o nd e c i s i o no fi n s u r a n c ec o m p a n i e s ,c a np r o v i d et i m e l y 、 a c c u r a t ea n ds c i e n t i f i cb a s i sf o rm a r k e to p e r a t o r s d e c i s i o n s ,m a k i n g e n t e r p r i s e st oa d a p tt ot h ei n c r e a s i n g l yf i e r c em a r k e tc o m p e t i t i o n t h r o u g ht h es y s t e md e s i g n ,w ec a na d j u s tc u s t o m e rd a t a ,a ta d e e p e r l e v e lo f u n d e r s t a n d i n g o fc u s t o m e rb e h a v i o r ,r i s ka n d p r o f i t a b i l i t y t h eu s eo ft h es o l u t i o n ,y o uc a nm a k em o r ee f f e c t i v eu s e o fc o r p o r a t ea s s e t sa n dc h a n n e lr e s o u r c e st oi n c r e a s et h ev a l u eo ft h e c o m p a n y 。sc u s t o m e r s ,a tt h es a m et i m ey o u rc o m p a n yc a ni n c r e a s et h e v a l u et oc u s t o m e r s ,t h e r e b ya c h i e v eaw i n w i ns i t u a t i o n k e y w o r d s :b u s i n e s si n t e l l i g e n c e 、d a t aw a r e h o u s e 、0 l a p 、d a t a m i n i n g 、v e h i c l ei n s u r a n c eb u s i n e s s 原创性声明和关于论文使用授权的说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独 立进行研究所取得的成果。除文中已经注明引用的内容外,本论文不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研 究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明 的法律责任由本人承担。 论文作者签名: 蛰叁 日期:趔星:应:勿 关于学位论文使用授权的声明 本人完全了解山东大学有关保留、使用学位论文的规定,同意学 校保留或向国家有关部门或机构送交论文的复印件和电子版,允许论 文被查阅和借阅;本人授权山东大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段 保存论文和汇编本学位论文。 ( 保密论文在解密后应遵守此规定) 论文作者签名:监导师 山东大学硕士学位论文 1 1 研究背景 第一章绪论 在当前的保险业务的发展过程中,随着人们的消费水平的不断提高, 车辆已经成为我们的一种主要的交通工具,随之而来的是人们的投保意识 的不断增强,因此对车辆的投保已经成为保险公司的主要业务之一。 信息化是当今世界保险与其他金融领域发展的重要趋势。信息技术已 广泛渗透到保险业发展的各个环节,推动保险业发展达到一个新的高度。 保险信息化发展是保险业发展的重要组成部分,是保险业未来发展的战略 制高点,关系到保险业发展的全局。信息化水平是衡量一个保险企业核心 竞争力、经营管理水平的重要标志。 目前,信息化的发展还是停留在对数据的管理和维护上,随着信息化 程度的不断加强,数据管理和维护的领域也不断扩展,从企业的财务管理 到业务管理,从单一的数据领域到复杂的数据处理,信息化已经充斥了企 业的方方面面。但是随着业务的发展,对信息化又提出了新的要求:新业 务的发展加剧了数据集中的需求:需求的个性化提高了保险业的服务意识; 专业化经营增加了对外包业务的需求;网络优化、数据存储是近期保险信 息化的重点:数据挖掘、决策支持越来越为车险业所关注。信息化覆盖面 不断扩大,信息技术支撑发展的能力进一步增强。面向产品开发、营销渠 道开拓与整合、客户服务和再保险等方面的信息技术应用不断加强,这些 新的要求也就促使车险行业的经营者不断加强车险业的技术投入。如何使 企业的利润最大化,这就要求我们要寻找一种适合车险企业运营的整体方 案,在这样的背景下,本文研究设计了基于商业智能技术的车险业务分析系 统。 当前,商业智能( b u s i n e s si n t e l l i g e n c e ,b i ) 技术正方兴未艾,己成 为信息化应用的新热点n 们。在欧美发国家,以数据库、联机分析处理和数 据挖掘为基础的商业智能应用首先在金融业、保险、证券、电信、税务等 山东大学硕士学位论文 传统数据密集型行业取得成功。美国p a l oa l t o 管理集团公司1 9 9 9 年对 欧洲、北美和日本3 7 5 家大中型企业的商务智能技术的使用情况进行了调。 结果显示,在金融领域,商务智能技术的应用水平已经达到或接近7 0 , 在营销领域也达到5 0 ,并且在未来的3 年中,各个应用领域对该技术的 采纳水平都将提高约5 0 。现在,许多企业都把数据看成宝贵的财富,纷 纷利用商务智能发现其中隐藏的信息,借此获得巨额的汇报。据i d c 对欧 洲和北美6 2 家采用了商务智能技术的企业的调查分析发现,这些企业的3 年平均投资回报率为4 0 l ,其中2 5 的企业的投资回报率超过6 0 0 。调查 结果还显示,一个企业要想在复杂的环境中获得成功,高层管理者必须能 够控制极其复杂的商业结构,若没有详实的事实和数据支持,是很难办到 的。因此,随着数据仓库和数据挖掘技术的不断改进和日益成熟,它必将 被更多的用户采用,使更多的管理者得到更多的商务智能。 在国内,数据仓库应用刚刚起步,电信、金融、证券、零售业、保险 行业等已有大量操作型数据积累的企业都提出了迫切的应用需求。国内保 险行业中的商业智能产品主要集中在应用型系统开发方面,他们利用国外 的b 1 支撑软件,构建分析模型,对e r p 、c r m 等业务数据进行分析,但国 外软件从操作习惯、使用习惯等方面都与国内不同。国内软件一般只提供 b i 整体结构中的一环或者几环,以满足用户的报表、分析、查询、统计需 要。 近年来,各种新型的保险业务不断涌现,随着人们的投保意识的不断 增强,人们对保险业务的要求也不断提升,应用b i 技术可以根据投保品种、 投保人等历史数据,合理设定储备金数额、保险金标准,进行风险分析和 损益判断,提供个性化保险服务,进而计算制定出适合个体保险公司的车 险统计指标。为此,本文主要探讨商业智能技术在车险业务分析中的应用, 提出了一种基于数据仓库和数据挖掘技术的车险业务分析系统。 1 2 研究内容 本文在对车险行业进行了详细分析的基础上,介绍车辆保险的基本指 标,重点介绍了保费指标、赔款指标、赔付率指标、管控指标和财务指标。 2 山东大学硕士学位论文 其次,根据实际的业务情况,基于商业智能技术,提出了系统总体的 架构设计,主要介绍系统的软件架构及系统的部署结构。 本文重点介绍了数据仓库的建立,以及如何利用数据挖掘技术对数据 仓库中的保单、保费等数据进行分析,重点介绍数据分析设计的2 4 分法、 历年制赔付率的计算方法,数据仓库模块中的处理技术和报表的设计制作 方法。针对数据分析指定的新指标,给出一种修改的指标计算方法,可以 为保险企业的运营决策提供科学、高效、准确地支持,为市场经营工作提 供及时、准确、科学的决策依据,使企业适应日趋激烈的市场竞争环境, 提升企业管理水平和经营决策水平,从而提高企业的核心竞争力。 1 3 论文组织 本文共分七章,各部分内容如下: 第1 章绪论首先对课题提出的背景进行了介绍,分析了提出了本论文 的研究内容和论文的组织结构。 第2 章主要介绍了与本文研究内容密切相关的商业智能的基本概念及 其核心技术,包括数据仓库、o l a p 以及数据挖掘技术,并对这三种技术进 行了详细的分析和说明。 第3 章首先对系统的开发建立了车险业的分析目标,提出了车险业的 主要技术指标和主要经营指标。出了系统的软件架构和系统的部署结构, 并对系统的整体方案提出了新的要求。 第4 章重点介绍整个系统的整体架构,依次讲解了硬件架构、软件架 构和系统部署结构。 第5 章重点介绍数据仓库的设计,和如何利用新的方法2 4 分法和历年 制赔付率方法对车险业务的数据进行分析,如何利用数据挖掘技术对分析 结果进行处理,同时设计了丰富的数据展示层将分析结果以报表或其他类 型的数据表的形式展现在前台。 第6 章给出了车险分析系统的设计实例,并对数据仓库模块中的处理 技术和报表的设计制作进行了详细的制作分析。 第7 章进行了总结,并对未来的发展趋势进行了展望。 山东大学硕士学位论文 第二章相关技术 本文用到的主要核心技术包括数据仓库( d a t aw a r e h o u s i n g ) 、联机分 析处理( 0 n li n ea n a l y t i c a lp r o c e s s i n g ,o l a p ) 、数据挖掘( d a t am i n i n g ) 在内的用于统计和分析商务数据的先进的信息技术口3 。 2 1 数据仓库 数据仓库( d a t aw a r e h o u s e ) 是一个面向主题的( s u b j e c to r i e n t e d ) 、 集成的( i n t e g r a t e ) 、相对稳定的( n o n - v o l a t i l e ) 、反映历史变化( t i m e v a r i a n t ) 的数据集合,用于支持管理决策啼1 。对于数据仓库的概念我们可 以从两个层次予以理解,首先,数据仓库用于支持决策,面向分析型数据 处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构 的数据源有效集成,集成后按照主题进行了重组,并包含历史数据,而且 存放在数据仓库中的数据一般不再修改。 根据数据仓库概念的含义,数据仓库拥有以下四个特点: 1 、面向主题。操作型数据库的数据组织面向事务处理任务,各个业务 系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织。 主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点 方面,一个主题通常与多个操作型信息系统相关。 2 、集成的。面向事务处理的操作型数据库通常与某些特定的应用相关, 数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原 有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到 的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个 企业的一致的全局信息。 3 、相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要 及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据 操作主要是数据查询,一旦某个数据进入数据仓库以后,般情况下将被 4 山东大学硕士学位论文 长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作 很少,通常只需要定期的加载、刷新。 4 、反映历史变化。操作型数据库主要关心当前某一个时间段内的数据, 而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点 ( 如开始应用数据仓库的时点) 到目前的各个阶段的信息,通过这些信息, 可以对企业的发展历程和未来趋势做出定量分析和预测。 数据仓库系统体系结构如下: 数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包 括企业内部信息和外部信息。 数据的存储与管理:是整个数据仓库系统的核心。数据仓库的真正 关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统 数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和 技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针 对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行 组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数 据仓库( 通常称为数据集市) 。 o l a p 服务器:对分析需要的数据进行有效集成,按多维模型予以组 织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为: r o l a p 、m o l a p 和h o l a p 。r o l a p 基本数据和聚合数据均存放在r d b m s 之中; m o l a p 基本数据和聚合数据均存放于多维数据库中:h o l a p 基本数据存放于 r d b m s 之中,聚合数据存放于多维数据库中。 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数 据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。 其中数据分析工具主要针对o l a p f j 艮务器,报表工具、数据挖掘工具主要针 对数据仓库 2 2 联机分析处理 联机分析处理( o n l i n ea n a l y t i c a lp r o c e s s i n g ,简称o l a p ) 是使分析 人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、 山东大学硕士学位论文 能够真正为用户所理解的、并真实反映企业维度特性的信息进行快速、 致、交互地存取,从而获得对数据的更深入了解的一类软件技术哺1 。它的 技术核心是“维”这个概念,因此o l a p 也可以说是多维数据分析工具的集 合。数据仓库建立之后,即可以利用o l a p 复杂的查询能力、数据对比、数 据抽取和报表来进行探测式数据分析了。用户在选择相关数据后,通过切 片、切块、上钻、下钻、旋转等操作,可以在不同的粒度上对数据进行分 析尝试,得到不同形式的知识和结果。o l a p 侧重于与用户的交互、快速的 响应速度及提供数据的多维视图。 在用o l a p 对数据进行访问的方式有三种:向下钻取( d r i l l - d o w m ) , 数据切片( s l i c e ) 和旋转( d i c e ) ,以及交互式的图形分析能力,使得用 户可以从任意角度观察和研究数据。 向下钻取:一层一层地深入剥取详细信息直到发现最关键的核心信息。 数据切片和旋转:通过插入或移动数据的行或列或其任意组合来从各 个角度观察业务信息。 交互式图形分析:以图形化的方式观察和分析数据之间的关系以及在 不同数据之间显示其变化。 2 3 数据挖掘 数据挖掘( d a t am i n i n g ) 又称知识发现( k n o w l e d g ed i s c o v e r yi n d a t a b a s e ,简称k d d ) ,是从大量数据中抽取有意义的、隐含的、以前未知 的并有潜在使用价值的知识的过程阽1 。数据挖掘是一个多学科交叉性学科, 它涉及统计学、机器学习、数据库、模式识别、可视化以及高性能计算等 多个学科。利用数据挖掘技术可以分析各种类型的数据,例如结构化数据、 半结构化数据以及非结构化数据、静态的历史数据和动态数据流数据等。 数据挖掘对象分类:关系数据库( r e l a t i o n a ld a t a b a s e ) 中通常存储和 管理的是结构化的数据,它将一个实体的各方面信息通过离散的属性进行 描述叩3 。而文本数据库( t e x td a t a b a s e ) 或文档数据库( d o c u m e n td a t a b a s e ) 则通常存储和管理的是半结构化的数据,例如新闻稿件、研究论文、电子 邮件、书籍以及w e b 页面等都属于半结构化数据。空间数据库、多媒体数 6 山东大学硕士学位论文 ! i ii;_ i m ;m i ; mm | 鼍詈皇詈詈詈鼍詈曼詈鼍曼! 曼詈曼! 据库中存放的是非结构化数据,例如地图、图片、音频、视频等都属于非 结构化数据。相对于半结构化和非结构化数据来说,针对结构化数据的数 据挖掘技术比较成熟,市场上有很多的商品软件可以使用,用的较多的包 括i b mi n t e1 li g e n tm i n e r 、s a se n t e r p r i s em i n e r 、s g im i n e s e t 、 c 1 e m e n t i n es p s s 以及m i c r o s o f ts q ls e r v e r2 0 0 0 等。 数据挖掘是一项新技术,它被用于从大规模数据库中发现新的、有用 的知识。数据的不断增长产生了对知识发现的需求:数据挖掘技术正是为 适应这一需求而出现的,因此数据挖掘又被成为知识发现( k d d ) ;数据挖 掘使用一些有效的分析算法从平凡数据中发现有用的模式,可以说数据挖 掘是将海量数据库和有用的知识紧密相连的桥梁。 企业级数据挖掘是将数据挖掘技术应用于挖掘企业数据,如:客户数 据,来挖掘新的客户知识,具有很高的商用价值,并且能够应用到商业实 际。企业运用数据挖掘进行知识发现的过程一般包括7 个步骤。 1 ) 识别商业问题。 2 ) 识别和研究数据来源,选取数据。 3 ) 提取和处理数据。 4 ) 对数据进行挖掘( 如:发现关联规则或者产生预测模型) 。 5 ) 验证数据挖掘的结果。 6 ) 在商业实际中应用挖掘模型。 7 ) r o i ( 投入产出1 计算。 数据挖掘的数据源并不局限于某一种数据,可以在多种异构源商进行 数据挖掘,如:数据仓库、o l t p 系统、e x c e l a c c e s s 数据、文本文件等。 但是普通的数据并不都能不加处理地直接用于数据挖掘,这主要是因为普 通的业务数据中往往存在很多问题如:数据表示不一致、空缺值、数据类 型不统一等。这时就需要在数据挖掘之前进行对各种数据源的数据进行预 处理,这些操作有如下几个方面:数据清理、数据集成、数据选择、数据 变换和数据修正等。数据的预处理完成后,就可以按照企业的需要进行数 据挖掘。数据挖掘的任务一般分为描述和预测;描述型数据挖掘用于刻画 数据库中数据的一般特性,预测型数据挖掘在当前的数据上建模并进行预 测。数据挖掘是一项新技术,但是数据挖掘并不是独立的一门学科,它与 7 山东大学硕士学位论文 数据库技术、统计学、机器学习、模式识别等技术紧密相关。近几年,许 多学者都已经在这些方面做了大量的工作,这里作者就不再赘述。 在数据挖掘技术中常用的数据模型有:分类模型,是根据商业数据 的属性将数据分派到不同的组中;关联模型,主要描述一组数据项目的 密切度和关系:顺序模型,主要用于分析数据仓库中的某类同时间相关 的数据,并发现某一时间段内数据的相关处理模型:聚簇模型,当要分 析的数据缺乏描述信息,或者是无法组织成任何分类模式时,可以采用聚 簇模型。聚簇模型是按照某种相近程度度量方法将用户数据分成互不相同 的一些分组。组中的数据相近,组之间的数据相差较大。 数据挖掘注重自动发现隐藏在数据中的模式和有用信息,尽管允许用 户指导这一过程。o l a p 的分析结果可以给数据挖掘提供分析信息作为挖掘 的依据,数据挖掘可以拓展o l a p 分析的深度,可以发现o l a p 所不能发现 的更为复杂、细致的信息。 山东大学硕士学位论文 第三章系统需求分析 在车险的业务处理中,业务处理者面临着数据太多、信息太少的问题, 数据太多使得决策者难以挖掘出潜在的规则,难以交互分析了解各种组合, 难以追溯历史数据,从而使得数据形成孤岛,这种情况会随着数据量的不 断增大而愈发严重,数据处理的难度也会约来越大。 近年来,各种新型的保险业务不断涌现,随着人们的投保意识的不断 增强,人们对保险业务的要求也不断提升,应用b i 技术可以根据投保品种、 投保人等历史数据,合理设定储备金数额、保险金标准,进行风险分析和 损益判断,提供个性化保险服务,进而计算制定出适合个体保险公司的车 险统计指标。为保险企业的运营决策提供科学、高效、准确地支持,对于 提高保险企业决策的科学性、为市场经营工作提供及时、准确、科学的决 策依据,使企业适应日趋激烈的市场竞争环境,提升企业管理水平和经营 决策水平,从而提高企业的核心竞争力。在研究本系统的数据仓库的设计 之前,我们要先了解一下车险业务的经营指标。 3 1 车险业分析目标 在具体的车险行业中,公司综合分析系统总体设计目标是分析车险公 司综合业务系统数据,进行数据挖掘,展示公司营运过程中的各项业务和 各项数据,并通过系统分析工具详细描述公司业务和发展动态,进行风险 控管,对渠道和业务员进行绩效考核,为公司领导提供决策支持。 ( 1 ) 财务统计分析:浏览、加工、分析公司财务业务数据( 包括:资 产负债、资金运营、现金流量等) ,应用各种分析方法对各项财务数据进行 综合分析,对关键的财务指标进行实时的排行、监控、显示和报警,进行 财务预测和财务控制,监视和控制公司财务经营活动。主要分析方法有, 同比分析、实际预算比分析、行业比分析、自定义的其他分析法。 ( 2 ) 业务经营分析:分析公司经营的保险产品成本和效益等各种项目 9 山东大学硕士学位论文 指标,监控业务开展进度。业务统计口径按机构、险类、险种、条款、险 别、伤人非伤人等进行划分,统计分析签单保费、生效保费、实收保费、 应收保费、已决赔款金额、已决赔款件数、已赚净保费、估损金额、定损 金额、未决赔款等保险产品指标值,参考时间、区域、客户群体等环境因 素原因,为优化保险产品结构、设计新险种产品提供有效的决策支持。 保险业务成本效益分析,通过投入和产出发展变化规律,显示业务开 拓和发展规律曲线,分析保险产品的发展状况和经营成本。 ( 3 ) 风险控管分析: 分析客户群体、销售渠道、保险产品和产品定价之间的关系,确定保 险产品风险控管指标监界点,包括盈利能力、费率指标、客户评价指标、 出险频率、赔额、应收保费等。对每笔保单业务进行分级风险控管。 ( 4 ) 绩效考核分析: 确定业务员和渠道代理考核指标,计算人均产能,进行业务员经营分 析,考核业务员全年经营状况、业务结构、盈利情况。对全体业务员和个 代渠道进行绩效考核。 3 2 基本指标界定 ( 1 ) 计量单位和承保数量:承保数量单位按承保对象确定。承保对象 不同,其承保数量的计量单位也不同。计量单位不同的承保数量是不能相 加的。保单注销,应冲减承保数量,保单退保,不应冲减承保数量。增加 标的的加保,承保数量不增加;不增加标的数量的加保,承保数量也不增 加。 ( 2 ) 保险金额:是指在保险合同中,经被保险人确定因保险标的遭受 保险事故时,应由保险人承担的经济补偿或给付的最高金额。保险金额= 保单保额+ 批单保额变化。 ( 3 ) 赔偿限额:是指在责任保险中保险公司承担赔偿责任的最高限额。 以批单形式对赔偿限额的增加或减少,直接增加或冲减保险合同的赔偿限 额。 ( 4 ) 保费收入:保费收入是按保险费率计算的保费减去按规定减收、 1 0 山东大学硕士学位论文 三! 詈ii 曼曼皇曼皇曼曼喜皇皇鲁皇 折扣和各种优待的余额。 保费收入= 签单保费+ 批增保费一批减保费( 保单及其批单之和) 。 批增保费:指保险公司通过批单批改后增收的保险费金额,以正数表 示。 批减保费:指保险公司通过批单批改后减收的保险费金额,主要包括 注销、退保、退费及被保险人提出的其它原因的批改保费,以负数表示。 ( 5 ) 优质客户:我们从客户提供的资料中找出客户信誉度高的人群作 为我们的重点客户,重点客户是指被企业确定为重点发展的业务对象。在 激烈的客户资源竞争中,企业要对重点客户采取适当的政策倾斜,挽留优 质客户,优质客户是指和企业建立较长时间业务关系并发生较大业务量的 重点客户。 3 3 车险行业的主要经营指标 在这一部分中我们要了解车险行业的主要经营指标,了解车险业务的 主要经营指标可以更好的进行车险业务的数据分析: 3 3 1 保费指标: ( 1 ) 毛保费:指按照基准费率表上的基准费率计算得出的初始保费( 即 保险公司初次签发的保险单上扣除所有折扣和优待之前的保险费) 。 ( 2 ) 签单保费:指在保险公司初次签发的保险单上注明的“保险费合 计”项下的保费金额( 即毛保费扣除所有折扣和优待之后的保险费) 。 签单保费= 毛保费一保单折扣保费 ( 3 ) 批改保费:指以批单形式对原保单进行变更引起的原保单保险费 的增加或减少的金额。 ( 4 ) 签单净保费:指签单保费减去批改金额,加上批增金额以后的保 险费( 签单净保费不扣除手续费) 。签单净保费= 签单保费+ 批增保费一批减保 费 ( 5 ) 满期保费:指自保单生效之日起到报告期止已满期的那部分保费, 计算方式般为2 4 分法或3 6 5 分法。 山东大学硕士学位论文 3 3 2 赔款指标: ( 1 ) 已决赔款:指保险人对发生保险事故的被保险人在结案后支付的 保险金。( 2 ) 未决赔款:指保险人对于已经发生保险事故应当支付给被保 险人,但因保险事故未结案而未支付的那部分保险金。 未决赔款的准确性和及时性是保险公司经营策略调整的必要基础,尤 其是在现阶段车险条款、费率改革之际,它的准确性与及时性对于产品的 设计和费率的厘定有着重要的意义。 未决赔款的分类和影响因素如表3 1 所示: 表3 - 1 未决赔款的分类和影响因素 分类影响因素可控性 车损部分 车型、配件渠道、市场环境 。 财产部分财产类别、行业特点、环境 1 伤害的类型、程度、医院、治疗方案、 人伤部分 药品、受害人及护理人的职业收入等 3 3 3 赔付率指标: ( 1 ) 会计年度制赔付率: 会计年度制赔付率i :( 统计期间已决赔款) 统计期间的保费收入 会计年度制赔付率: ( 统计期间( 已决赔款+ 未决赔款) ) 统计期间的保费收入 会计年度制赔付率目前是保监会等政府部门要求提供的数据,它的统 计口径是在统计期间签单的保费和发生的已决赔款;会计年度制赔付率可 以用来以赔款和保费的变化趋势进行比较评估。 ( 2 ) 承保年度制赔付率: 满期赔付率:( 承保年度生效的保单项下的( 已决赔款+ 未决赔款) ) 1 2 山东大学硕士学位论文 承保年度保险单的满期保费 实际赔付率:( 承保年度生效的保单项下的( 已决赔款+ 未决赔款) ) 承保年度保险单的保费收入 承保年度制赔付率又称保单年度制赔付率;赔款部分指的是在统计区 间内起保的所有保单项下发生的赔款;保费部分指的是在统计区间内起保 的所有保单项下的净保费,由于满期保费的引入,它又被分为满期赔付率 和实际赔付率两个指标。它对盈亏的反映是最准确的,但需要保单满期后 很长一段时间才能得到准确的数据,不能及时指导经营政策的调整。 实际赔付率的走势基本是保持上升趋势;满期赔付率由于分母是随着 时间而不断增加,并且前期分母较小,因此它在前期会处于相对不稳定状 态,一般情况下进入十个月以后,才逐渐稳定,当责任期满时,与实际赔 付率的数值相同。实际赔付率和满期赔付率的走势如图3 一i 所示: l l 图3 一i 实际赔付翠和满期赌付翠的走势图 ( 3 ) 历年制赔付率: ( 期末已决赔款+ 期末未决赔款一期初未决赔款) ( 期末净保费一期末 未满期保费+ 期初未满期保费) 历年制赔付率是介于会计年度制赔付率和承保年度制赔付率之间的一 种赔付率;它从一定程度克服了承保年度制赔付率统计时间过长、反馈滞 后的缺点,又比会计年度制赔付率更能较准确地反映经营的状况;它受未 决赔款预估偏差和非本年及时登录赔款的影响较大,因此它有一定误差。 ( 4 ) 事故历年度制赔付率: ( 统计期间发生保险事故的已决和未决赔款) ( 期末净保费一期末未满 山东大学硕士学位论文 期保费+ 期初未满期保费) 事故历年制赔付率是对本年满期和上年未满期保费的经营业绩进行反 映的指标,它的作用类似于以往的加权满期赔付率,但它已克服了加权满 期赔付率不准确的缺点:如果在理想状态下,偏差为零,非本年出险本年 立案赔款为零,则事故历年度制赔付率与历年制赔付率是相等的。换言之, 它与历年制赔付率的差额就是偏差和非本年出险本年立案赔款对历年制赔 付率的影响,它对于考核数据质量有着重要的作用。 3 3 4 管控指标: ( 1 ) 核保方面: 保单及时登录率= 正常录入笔数录入总笔数。直接业务要求保单生效 当天内在系统形成保单,代理业务要求在保单生效4 0 天内在系统形成保 单。 续保率= 已续保笔数应续保笔数。 验车实施率= 验车笔数应验车笔数。 ( 2 ) 核赔方面: 未决及时登录率= 及时登录未决笔数立案件数。 结案率= 已决件数总立案件数 预估偏差:指保险人对发生的保险事故确定的损失预估金额与最终实 际赔偿金额的差额,按照计算方法分为相对预估偏差和绝对预估偏差。 相对预估偏差:预估金额一实赔金额 绝对预估偏差:i 预估金额一实赔金额i 预估损失偏差率i :( i 总预估金额一总实赔金额i ) 总实赔金额 预估损失偏差率i i :( i 预估金额一实赔金额1 ) 总实赔金额 由于预估损失偏差率i 可以进行调整,因此它对保证数据质量,真实 反映经营状况的意义不是特别明显,所以将此项指标调整为预估损失偏差 率,该指标是一个客观的指标,对于保证数据质量具有非常重要的意义。 1 4 山东大学硕士学位论文 3 3 5 财务指标: ( 1 ) 会计年度= 财务收付日期所在的年度。 ( 2 ) 会计保费:起保期落在本年度及以前年度的保单的签单保费收入 ( 3 ) 应收保费:承保出单后至统计结算日止尚未收到的起保日落在本 年度及以前年度的保单的签单保费收入。 ( 4 ) 本期签单应收保费= 本月签单的、本月未实收的应收保费 ( 5 ) 非本期签单应收保费= 以前月份签单但未到帐的应收保费。 ( 6 ) 累计签单应收= 截止本月累计签单的、财务未实收的应收保费。 ( 7 ) 资产负债率= 负责总额资产总额x1 00 ( 8 ) 所有者权益增长率= ( 本年末所有者权益一上年末所有者权益) 上年末所有者权益10o 山东大学硕士学位论文 4 1 硬件架构 第四章系统整体架构 本系统的硬件由服务器和工作站组成。服务器上运行服务程序,包括 保险业务服务程序和数据库服务程序,工作站上运行业务界面程序。服务 器为h p 9 0 0 0 系列小型机、d e ca l p h a 系列小型机,其操作系统为u n i x ,数 据库系统为o r a c l e 数据库管理系统。而工作站为5 8 6 以上档次的p c 机, 其操作系统为中文w i n d o w s9 5 或版本更高的w i n d o w s 系统。 整个车险公司的管理体制是一个多级结构,即:总公司、分公司、支 公司、办事处、代理点。分公司作为具体的业务管理层负责本地区的所有 保险业务,支公司、办事处、代理点具体操作保险业务,总公司作为整个 公司的最高决策层,掌握着整个公司的所有业务信息。相应地,整个公司 的计算机系统的网络结构也是一个多层的结构,整个网络系统是一个通过 电信部门的数据通信网( d c n ) 的广域网系统。在本网络系统中存在多种网络 连接介质,包括:网络电缆( 局域网中) 、d d n 专线、x 2 5 专线、电话线。 根据业务量的大小,总公司是通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025医疗器械安全及使用等知识题库及答案
- 2025年网络营运专员招聘面试参考题库及答案
- 2025年家电维修技术员招聘面试题库及参考答案
- 2025年募捐专员招聘面试题库及参考答案
- 2025年信贷风险控制专员招聘面试题库及参考答案
- 2025年客户代表招聘面试题库及参考答案
- 2025年视听媒体采购专员招聘面试题库及参考答案
- 2025年界面设计工程师招聘面试题库及参考答案
- 消防理论测试题库及答案
- 2025年医疗招聘专员招聘面试参考题库及答案
- 客户发展业务流程管理
- 了解丝印、丝印入门知识
- 老年人能力评估 能力评估
- GB/T 19216.11-2003在火焰条件下电缆或光缆的线路完整性试验第11部分:试验装置火焰温度不低于750°C的单独供火
- GB/T 13172-2009裂变钼99-锝99m色层发生器
- 线边仓运行规则及作业要求
- 护士长月报表1
- 在生活中学习写作ppt
- 家禽集中屠宰建设项目可行性报告
- (完整版)形式发票模版(国际件通用)
- 临汾市规划管理技术规定
评论
0/150
提交评论