




已阅读5页,还剩74页未读, 继续免费阅读
(计算机应用技术专业论文)面向银行crm的数据挖掘系统研究与应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
y5 8 6 l 9 4 摘要 客户关系管理 ( c r m) 是基于先进信息技术平台和支持体系上的 业务处理和决策分析系统。 数据挖掘技术是c r n 系统的核心, 是c r m 中实现客户数据分析的技术基础。 本文针对商业银行实施 c r m 过程中的具体需求,在深入地分析 了银行c r m特点的基础上, 重点研究了数据挖掘技术在银行c r m应 用中所要解决的关键问题。首先研究了数据挖掘模型的表示, 详细介 绍了由d mg提出的基于 x ml的预言模型标记语言p mml的特点、 表示方法及规则。 其次, 在参照文献z 5 】提出的数据挖掘应用平台 框架的基础上, 根 据银行c r m的特点结合p mml设计了一个银行c r m数据挖掘应用 系统。该系统分为数据访问层、算法层和模型层,具有较强的通用性 和可扩展性。 系统采用p m ml 标准来存储和管理数据挖掘模型, 便于 模型的使用和共享。 最后详细阐述了华夏银行银行 c r m 系统的系统框架结构、系统 环境、应用逻辑结构和功能模块等。重点介绍了数据挖掘部分的具体 实施步骤、系统思想等。 关键字:c r m,数据挖掘,p mml ,数据挖掘系统 ab s t r a c t c u s t o m e r r e l a t i o n s h i p ma n a g e m e n t ( c r m) i s a t r a n s a c t io n p r o c e s s i n g a n d d e c i s i o n s u p p o r t s y s t e m w h i c h b a s e d o n m o d e m i n f o r m a t i o n t e c h n o l o g y . d a t a m i n i n g i s t h e c o r e o f t h e c m a n d i t i s t h e t e c h n o l o g i c b a s e o f t h e a n a ly s i s o f c u s t o m e r d a t a . t h e c h a r a c t e r i s t i c s o f t h e b a n k o f c r m a r e a n a l y z e d p r o f o u n d l y a n d t h e k e y p r o b le m s t h a t n e e d t o b e s e t t l e d o u t i n t h e a p p li c a t i o n o f t h e b a n k c r m a r e s t u d i e d e m p h a t i c a l l y a i m e d a t t h e d e t a i l e d n e e d o f p r o c e s s i n w h i c h t h e c o m m e r c i a l b a n k i m p l e m e n t s t h e c r m. t h e e x p r e s s i o n o f d a t a m i n i n g m o d e l i s s t u d i e d a n d t h e c h a r a c t e r i s t i c s , a p p l i c a t i o n a p p r o a c h e s a n d r u l e s o f t h e p r e d i c t i v e mo d e l ma r k u p l a n g u a g e ( p mml ) w h i c h i s b a s e d o n xml a r e i n t r o d u c e d i n d e t a i l . a f t e r w a r d s , a d a t a m i n i n g s y s t e m o f c o m m e r c i a l b a n k c r m i s d e s i g n e d a c c o r d i n g t o t h e a p p l i c a t i o n p l a t f o r m o f d a t a m i n i n g p r o v i d e d b y l i t e r a t u r e ( 2 5 . t h e s y s t e m i s c o m p o s e d o f t h r e e l a y e r s : d a t a a c c e s s l a y e r , a l g o r i t h m s l a y e r , d a t a m i n i n g m o d e l l a y e r . i t i s u n i v e r s a l a n d e x p a n s i b l e . p m m l i s a d o p t e d i n t h e s y s t e m t o a r c h i v e a n d m a n a g e t h e d a t a m i n i n g m o d e l , w h i c h m a k e s it c o n v e n i e n t f o r t h e a p p l y i n g a n d e x c h a n g e s o f d a t a mi n i n g m o d e l s . f in a l ly , t h e s y s t e m a r c h i t e c t u re , e n v i r o n m e n t , a p p l i c a t i o n s t r u c t u r e s a n d f u n c t i o n m o d e l s o f h u a x i a b a n k s c r m s y s t e m a re p r e s e n t e d . t h e d e t a i l e d i m p le m e n t a t i o n s t e p s a n d i d e as t h a t d a t a m in i n g i s n e e d e d a r e s e t f o r th p r o f o u n d l y . k e y w o r d s : c r m, d a t a m i n i n g , p mm l , d a t a m i n i n g s y s t e m 北京交通大学硕士研究生学位论文 第一章绪论 1 1 概述 近些年来,在世界范围内,随着对c r m 理念认同程度的扩大和 行业产品系统的日趋成熟,一些大型银行和新型银行纷纷将c r m 在 银行领域的应用实施列入工作日程。如此关注c i t m 是金融服务市场 开放、竞争的结果,是银行多样化的产品和服务发展的结果,是信息 技术突飞猛进的结果,也是银行管理和业务的需要。2 0 世纪9 0 年代 初,发达国家的商业银行就已经实现了业务处理的规范化、办公事务 的自动化和决策支持的智能化,并在发展网上银行方面先行一步,以数 据仓库技术为基础,以联机分析处理和数据挖掘工具为手段的c r m 系统也日趋成熟。国外金融界十分重视对c r m 的开发实施工作,据 i d c 调查,2 0 0 2 年全球5 0 0 家大银行中的前1 0 0 家,已经有近9 0 家 建有c r m 。在美国建有c r m 的银行中,以大型银行为主,美国排名 前1 0 0 位的商业银行已有5 0 多家在客户关系管理中实旖了数据仓库和 数据挖掘项目,剩余的银行正在准备实施。 商业银行所积累的信息数据量非常大,这些数据中有相当大部分 是内部统计和账务核算的需要,想找出与客户相关的有价值的信息, 找出这些信息的关联,就需要从大量的数据中经过深层分析,从而获 得有利于商业运作、提高竞争力的信息,数据挖掘就是从海量数据中, 抽取出潜在的、有价值的知识、模型或规则的过程,挖掘出更有价值 的信息。因此数据挖掘技术是c r m 系统中的核心组成部分,是实现 银行客户分析的技术基础1 3 2 】。 数据挖掘( d a m m i n i n g ) ,又称数据库中的知识发现( k n o w l e d g e d i s c o v e r yi nd a t a b a s e ,k d d ) ,是指从大型数据库或数据仓库中提取 隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数 据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、 机器学习、统计学等多个领域的理论和技术。数据挖掘使数据进行查 询,并且能够找出过去数据之间的潜在联系,从而促进信息的传递。 北京交通大学硕士研究生学位论文 数据挖掘技术以数据仓库和联机分析处理( o l a p ) 为平台,借 助企业拥有的所有可能的大规模数据,通过清洗、转换、装载等数据 处理方法,发现大量资料问的关联与趋势,探寻一种独特的、通过其 他方法发现不了的业务规律和模式。它广泛应用的统计分析方法包括 线性、非线性回归分析、判别分析、聚类分析、主成分因子分析和时 闯序列分析等;所运用的特有分析方法则包括决策树分析( d e c i s i o n t r e e ) 、准则推断( r u l ei n d u c t i o n ) 、关联探测( a s s o c i a t i o nd e t e c t i o n ) 、神 经网络( n e u r a ln e t w o r k s ) 和基因算法( g e n e t i ca l g o r i t h m s ) 等等。 数据挖掘的一般过程: 数据挖掘作为知识发现的过程,一般由三个主要的阶段组成【16 1 : 数据准备、数据挖掘、以及结果的解释评估。知识的发现可以描述为 这三个阶段的反复过程,如图1 1 所示。 国1 - 1 数据挖掘的一般过程 1 ) 数据准备 数据准备又可分为三个子步骤:数据选取( d a t as e l e c t i o n ) 、数据 预处理( d a t ap r e p r o c e s s i n g ) 和数据变换( d a t at r a n s f o r m a t i o n ) 。数据 选取的目的是确定发现任务的操作对象,即目标数据,它是根据用户 的需要从原始数据库中抽取的一组数据。数据预处理一般包括消除噪 声、推导计算缺失数据、消除重复记录、完成数据类型转换( 如把连 北京交通大学硕士研究生学位论文 续值数据转换为离散值数据,以便于符号归纳,或是把离散值数据转 换为连续值数据,以便于神经网络归纳) 等。当数据挖掘的对象是数 据仓库时,一般来说,数据预处理已经在生成数据仓库时完成了。数 据变换的主要目的是将数据转换成适合数据挖掘需要的格式,例如将 文档信息转换成数值向量形式,另外还包括数据维度的削减或降维 ( d i m e n s i o nr e d u c t i o n ) ,即从初始特征中找出真正有用的特征以减少 数据挖掘时要考虑的特征或变量个数。 2 ) 数据挖掘 数据挖掘阶段首先要确定挖掘的任务或目的是什么,如数据总结、 分类、聚类、关联规则发现或序列模式发现等。确定了挖掘任务后, 就要决定使用什么样的挖掘算法。同样的任务可以选用不同的算法来 实现。选择实现算法有两个考虑因素:一是不同的数据有不同的特点, 因此需要用与之相关的算法来挖掘;二是用户或实际运行系统的要求, 有的用户可能希望获取描述型的、容易理解的知识( 采用规则表示的 挖掘方法显然要好于神经网络之类的方法) ,而有的用户或系统的目 的是获取预测准确度尽可能高的预测型知识。完成了上述准备工作后, 就可以实施数据挖掘操作了。具体的数据挖掘方法将在后面章节中作 较为详细的论述。需要指出的是,尽管数据挖掘算法是k d d 的核心, 也是目前研究人员主要努力的方向,但要获得好的挖掘效果,必须对 各种挖掘算法的要求或前提假设有充分的理解。 3 ) 结果解释评估 数据挖掘阶段发现的模式,经过用户或机器的评估,可能存在冗 余或无关的模式,这时需要将其易l 除;也可能挖掘结果不满足用户要 求,这时则需要整个发现过程退回到发现阶段之前,如重新选取数据、 采用新的数据变换方法、设定新的数据挖掘参数值,甚至换一种挖掘 算法( 如当发现任务是分类时,有多种分类方法,不同的方法对不同 的数据有不同的效果) 。另外,由于k d d 最终是面向用户的,因此 可能要对发现的模式进行可视化,或者把结果转换为用户易懂的另一 种表示,如把分类决策树转换为“i f t h e n ”规则。 北京交通大学硕士研究生学位论文 1 . 2论文背景及意义 本课题是我们参与的北京联银通科技有限公司所承担的华夏银行 客户关系管理系统项目中的一部分,主要研究的是项目中的数据挖掘 部分的方案设计。 华夏银行是一家成立于1 9 9 2 年1 0 月的全国性股份制商业银行, 在2 0多个国内大中城市设立了1 8 8 家分支机构。 长期以来, 华夏银行 各分支机构积累了大量的客户数据信息。为充分利用这些信息,华夏 银行提出了建立了总行、分行两层的基于数据仓库的c r m系统。该 c r m系统主要用于全行范围内的业务分析, 为各级管理决策者提供及 时有效的决策信息。 目 前,在银行 c r m 中鱼需通过数据挖掘技术解决的客户分析业 务 模 型问 题 包 括以 下 几 类 12 6 1 . 交叉销售、客户响应、客户流失、客户利润等。 建立这些跟银行业务密切相关的客户分析业务模型,对于银行吸 引新客户、保持老客户、增加利润、防范风险等具有重大的意义。 , . 3研究内 容 目 前商业数据挖掘工具种类繁多, 并且在各自 特定领域表现优异。 但银行在选择数据挖掘产品的时候,不仅考虑产品的价格因素,更关 心的是怎样将它与现有的业务分析系统无缝地整合到一起。而大多数 的商业数据挖掘工具要么是一个独立的产品,要么是一个庞大商业解 决方案的一部分。前者难以很好的整合到银行的业务系统中,而后者 又很难完全适合银行的具体需求。 因此,我们需要研究数据挖掘的一般过程,构建一个灵活的数据 挖掘应用系统,并能将它整合到银行 c r m系统中,针对银行特定的 业务需求,提供完整的数据挖掘解决方案,使华夏银行可以方便的创 建客户业务分析模型并应用到对客户的分析中去。 本文首先研究了基于 x m l的预言模型标记语言 ( p m ml, p r e d ic t iv e m o d e l m a r k u p l a n g u a g e ) , 分 析了 它 的 内 容以 及如 何 用它 来描述数据挖掘模型。 文献12 5 )根据扩展的c r i s p - d m过程模型, 提出 北京交通大学硕士研究生学位论文 了一个数据挖掘应用平台框架。我们借鉴该数据挖掘应用平台框架, 结合p mm l设计并初步实现了一个面向c r m的数据挖掘应用系统, 具有较强的可扩展性。 该系统采用p mml 标准存储和管理数据挖掘模 型,有利于数据挖掘模型的使用和交换。 最后,介绍了华夏银行基于数据仓库的 c r m系统的系统架构、 功能模块的设计等内容。重点介绍了在该系统中数据挖掘技术实施过 程。 1 . 4论文结构 本篇论文共分六章: 第一章为绪论,介绍了数据挖掘技术在银行 c r m 中的作用、数 据挖掘的一般过程、选题背景、研究内容和论文结构。 第二章讲述了c r m的概念、 基于数据仓库的c r m系统及o l a p . 数据挖掘在系统中的作用等:分析了银行 c r m 系统的构成与实施情 况。 第三章介绍了预言模型标记语言p mml , 分析了它的内容以及如 何用它来建立预言模型。 第四章详细介绍了在数据挖掘系统框架指导下可扩展的数据挖掘 系统各功能模块的设计,包括了数据层的设计、算法层的设计、模型 层的设计。 第五章详细阐述了华夏银行 c r m 系统的系统框架结构、系统环 境、应用逻辑结构和功能模块等。重点介绍了数据挖掘系统在银行 c r m系统中解决客户业务分析模型问题的实施步骤等。 第六章是论文的结束语部分。 北京交通大学硕士研究生学位论文 第二章客户关系管理 2 . 1 c r m的概念 客 户 关系 管 理2 1 1 ( c r m, c u s t o m e r r e la t i o n s h ip m a n a g e m e n t ) , 是现代管理科学与信息技术结合的产物, 是企业树立“ 以客户为中心” 的发展战略,从而在此基础上开展的包括判断、选择、争取、发展和 保持客户所实施的全部商业过程;是企业以客户关系为重点,通过再 造企业组织体系和优化业务流程,展开系统的客户研究,提高客户满 意度和忠诚度、提高运营效率和利润收益的工作实践;也是企业为最 终实现信息化运营日 标所创造和使用的技术、软硬件系统及集成的管 理方法、解决方案的总和。 c r m 是企业管理中信息技术集成的管理方法和应用解决方案的 总和,它既是帮助企业组织管理客户关系的一系列信息技术、方法和 手段,又是运用信息技术对企业涉及销售、客户服务等业务流程自 动 化的软件乃至硬件系统, 也就是说, c r m系统是一套基于数据仓库的 客户资料分析系统。c r m通过先进的数据仓库技术和数据挖掘技术, 分析现有客户和潜在客户相关的需求、模式、机会、风险和成本,从 而最大限 度地赢得企业整体经济效益。就银行业来说,通过建立大型 的数据仓库,对积聚于银行的大量数据进行综合分析,识别在市场竞 争中最有利可图的客户群,确定目 标市场,将客户通过多种指标进行 分类,针对不同的客户,实施不同的策略,为目 标客户群提供 “ 一对 一”式的、符合客户心理的服务。 2 . 2基于效据仓库的c r m 企业在长期的运作过程中积累一些有关客户信息的数据,这些数 据中蕴含着大量的有用信息。在落后的管理条件下,这些数据难以共 享,无法发挥决策支持作用。要使客户的信息转化为知识,需将客户 信息重新整合到支持决策分析的数据仓库环境中,提供一个整体的、 结构化的数据模型,对数据进行标准化、抽象化、规范化、系统地分 析和分类,为决策提供所需要的信息。然后通过数据挖掘等方法,了 北京交通大学硕士研究生学位论文 解客户、预测其行为及公司效益,根据这些信息,公司能优化可利用 的资源,集中服务于所挑选的客户群体。 2 . 2 . 1 数据仓库在分析型c r m 中的作用 c r m 是数据库技术同 市场营销相结合的产物3 1 。 通过强大的数 据仓库技术,分析现有客户和潜在客户相关的需求、模式、机会、风 险和成本,最大限度的赢得企业整体经济效益。通过资料的汇总,建 立大型的数据仓库对相应的数据进行分析,识别在市场竞争中最有利 可图的客户群,确定目 标市场、目 标客户群,并整合所有资料,将客 户通过多种指标进行分类,针对不同的客户,实施不同的策略,为目 标客户群提供一对一式的、符合客户心理的服务。数据仓库在 c r m 中有以下三方面的作用:客户行为分析、重点客户发现和市场性能评 估。 1 、客户行为分析 客户行为分析可以分为整体行为分析和群体行为分析。整体行为 分析用来发现企业所有客户的行为规律,但仅有整体行为分析是不够 的。企业的客户千差万别,众多的客户在行为上可以划分为不同的群 体,这些群体具有明 显的行为特征。行为分组是c r m 的一个重要的 组成部分。行为分组是按照客户的不同种类的行为,将客户划分成不 同的群体。通过行为分组,企业可以更好地理解客户,发现群体客户 的行为规律。 通过对客户的理解和客户行为规律的发现,企业可以 制 定相应的市场策略。同时,通过对不同客户的群组之间的交叉分析, 可以 使企业发现客户群体间的变化规律。 2 、重点客户发现 重点客户发现的目 标是找出对企业具有重要意义的客户,包括潜 在客户、交叉销售、增量销售、客户保持等。重点客户发现过程,通 常是有一系列数据处理和转换过程以及数据挖掘来组成。通过这样的 过程,针对每个种类的客户确定一个或多个分析发现的流程,从而自 动发现重点客户。 3 、性能评估 北京交通大学硕上研究生学位论文 根据客户行为分析,企业可以准确地制定市场策略和市场活动。 然而,这些市场活动是否能够达到预定的目标,是改进市场策略和评 价客户行为分组性能的重要依据。同样,重点客户的发现过程,也需 要对其性能进行分析,在此基础上修改重点客户发现过程。这些性能 评估都是建立在客户对市场反馈的基础上。通过数据仓库的数据清洁 与集中过程,可以将客户对市场的反馈自动地输入到数据仓库中,这 个获得客户反馈的过程被称为客户行为跟踪。 2 2 2o l a p 和数据挖掘在分析型c r m 中的作用 数据挖掘( d a t am i n i n g ) ,就是应用一系列技术从大型数据库或数 据仓库的数据中提取人们感兴趣的信息和知识,这些信息或知识是隐 含的、事先未知而潜在有用的,提取的知识表示为概念、规则、规律、 模式等形式。它的目标是将大容量数据转化为有用的知识和信息。这 些对决策有潜在价值的知识和信息,能够根据己有的信息对未发生行 为做出结果预测,为企业经营决策、市场策划提供依据。 o l a p 和数据挖掘技术不仅是面向特定数据库的简单检索查询调 用,而且要对这些数据进行微观、中观乃至宏观的统计、分析、综合 和推理,以指导实际问题的求解,企图发现事件间的相互关联,甚至 利用已有的数据对未来的活动进行预测。 o l a p 和数据挖掘在c r m 中的作用表现为以下六个方面: 1 、客户特征多维分析: 挖掘客户个性需求,客户属性描述要包括地址、年龄、性别、收 入、职业、教育程度等多个字段,可以进行多维的组合型分析,并快 速给出符合条件的客户名单和数量。 2 、客户行为分析: 结合客户信息对某一客户群的消费行为进行分析。针对不同的消 费行为及其变化,制定个性化营销策略,并从中筛选出“重点客户”。 3 、客户关注点分析: 客户接触与客户服务的分析。 4 、客户忠诚度分析: 北京交通大学硕士研究生学位论文 对客户持久性、牢固性及稳定性分析。 5 、销售分析与销售预期: 包括按产品、促销效果、销售渠道、销售方式等进行分析。同时, 分析不同客户对企业效益的不同影响,分析客户行为对企业收益的影 响,使企业与客户的关系及企业利润得到最优化。 6 、参数调整: 为了提高分析结果的灵活度,扩大其适用范围,企业需要对有关 参数进行调整。例如,价格的变化对收入会有什么样的影响? 客户的 消费点临近什么值时开始成为“正利润”,企业需要通过对收集到的 各种信息进行整理和分析,利用科学的方法,做出各种决策。 因此,通过数据仓库,o l a p 与数据挖掘,企业可以及时、准确 地收集和分析市场、销售、服务及整个企业的各类信息,同时获取并 分析与客户之间的交往历史,从整个企业的角度认识客户,并为企业 的决策者提供直观、准确的分析结果,帮助企业有针对性的进行市场 开拓工作,这样就可以为每一个客户量身定做个性化的解决方案。 2 2 3 基于数据仓库的c r m 的基本工作流程 图2 1 基于数据仓库的c r m 系统体系结构图 c r m 数据仓库中的数据和信息处理的基本流程为:最初,从与客 户的“接触点”收集运营数据。这些数据连同内部客户数据和外来的 市场数据经过整合和变换、装载进数据仓库。之后,采用o l a p 工具 北京交通大学硕士研究生学位论文 和数据挖掘从数据中分析和提取相关规律、模式或趋势。最后,利用 报表工具和企业信息系统等,把有关客户信息和知识在企业内得到流 转和共享,并转化为企业的战略和战术行动,以提高在所有渠道上同 客户交互的有效性和针对性。利用数据仓库实现 c r m 的系统体系结 构如图2 - 1 所示。 2 . 3 c r .的基本特征 虽然每个c r m提供商所开发的模块在技术和功能上都不尽相同, 但总的来说, 一个能够有效实现c r m经营理念的c r m应用解决方案 有以下六个基本特征: 1 、基于一个统一的客户数据库。 客户信息作为公司的重要资产,必须由 全公司统一管理。其所有 权在公司层面,而不是由部门或个人部分占有。 2 、具有整合各种客户联系渠道的能力。 整合各种渠道,就是不论客户通过何种方式发出请求,都必须准 确地、 无遗漏地、 无重复地反映到数据库中, 即要做到客户信息的“ 零 丢失”。客户可以选择他们喜欢的任何一种方式与企业联系,在利用 其它渠道时,不必重复提供已提供的信息。 3 .能将信息以快速、方便的方式向系统用户传递。 系统的各种用户 ( 包括客户服务支持人员,市场营销人员,现场 服务人员,销售人员以及合作伙伴等),能以各种方便的方式和设备 获取各种客户有关的信息,如通过桌面计算机,手提电脑,各种无线 设备,互联网等,实现 “ 设备独立”的目 标。 4 、 提供销售、 服务和营销三个业务的自 动化工具, 并在三者之间 能进行无缝的整合。 向面向客户的员工提供日常操作工具,方便使用,并且要打破销 售、服务和营销的业务限制,使整条客户服务流程在部门之间能够平 滑接续。 5 、 具有一定的从大量交易数据中提炼决策信息的能力商业智 育 gg a 北京交通大学硕士研究生学位论文 对c r m 应用的一个重要的要求就是要有对客户行为的预测能力, 否则有差别管理客户关系的理念无从谈起。因此,具有一定的商业智 能能力是一个重要的目标。之所以是“一定的”,是因为商业智能具 有很强的行业特性,数据挖掘手段的适应性也差别很大。不过,仅仅 提供一般的对历史行为总结的功能是不够的,应该有适用的预测模型。 6 、具有基于开放标准的与其它企业应用系统的整合能力,成为企 业应用系统网络的有机组成部分。 c r m 应用必须解决同其它应用整合的问题,否则,前后台的断点 必定会影响客户服务的质量。最需要的整合是c r m 系统同后台e r p 应用的整合。 2 4 银行c r m 系统的构成 由于银行在各地建有大量的分支机构,银行c r m 系统一般都采 用分布式数据仓库环境,即所有分行均拥有自己的c r m 系统,并与 本地综合业务系统及呼叫中心连接。在总行建有中,t l , c r m 数据仓库, 提供面向全行的分析决策功能,并为网上银行业务提供数据查询支持。 银行c r m 系统【2 8 i 一般由业务处理、客户联系和客户关系分析中 心三部分组成。业务处理部分是指银行的综合业务处理系统,包括柜 面业务系统、信用卡系统、p o s 机和a t m 机等;客户联系部分由呼 叫中心和网上银行组成:客户关系分析中心则以c r m 中心数据仓库 为核心,通过数据集成系统与业务处理部分连接,同时为银行的管理 层和业务分析人员提供客户分析系统。 银行c r m 系统主要提供客户基本信息的管理和分析、信用分析 及风险监控、效益和商机分析及个性化服务等功能,同时有连接呼叫 中心业务处理流程控制、网上银行业务处理流程控制、综合业务处理 流程控制、银行卡业务处理流程控制、国际业务处理流程控制、中间 业务处理流程控制和会计统计报表等系统的接口。 从数据的流向,业务处理部分的数据由客户关系分析中心的数据 集成系统抽取到c r m 数据仓库中。客户联系部分与客户关系分析中 心的数据流向是双向的,呼叫中心在为客户服务时将充分利用c r m 北京交通大学硕士研究生学位论文 数据仓库的信息,同时,呼叫中心为客户的服务过程又被c r m 数据 仓库所记录。客户联系部分与业务处理部分的数据流向也是双向的, 客户呼叫中心需要实时查询业务系统的当前数据,呼叫中心也可能需 要为客户实施业务流程。最后,c r m 的决策分析环境将结果反馈到客 户联系部分。 在c r a m 数据仓库中,实际数据分为操作数据和分析模型。操作 数据包括客户基本信息、客户账务信息和操作控制( 客户个性化服务 信息) 。分析模型包括客户关系管理的所有分析模型、市场分析、客 户信用度分析、客户满意度分析和销售行为分析。因此,c r m 的主体 部分将通过数据集成系统与业务处理部分( 综合柜面系统等) 和客户 联系部分( 呼叫中心等) 连接起来。同时,由于业务处理部分一般都 采用银行的现有系统,而呼叫中心则可以成为一个相对独立的模块, 因此,银行c r m 系统的实施主要体现在c r m 数据集成系统、c r m 数据仓库、c r m 决策分析环境、基本信息服务接口等四大部分。 图2 - 2 银行c r a m 的组成及分类 从体系结构角度看,银行c r m 应用系统与其它类型的c r m 系统 一样,可以分为操作型( o p e r a t i o n a l ) c r m 、分析型( a r m i y t i c a l ) c r m 和协作型( c o l l a b o r a t i v e ) c r m 三类: 北京交通大学硕士研究生学位论文 1 、操作型 c r m:用于自动地集成商业过程,包括客户接触点 ( c u s t o m e r t o u c h p o in t ) 、 渠 道 和前 后 方办 事 处的 集成。 2 、分析型c r m:用于分析操作型c r m产生的数据。 3 、协作型c r m:用于协作的服务,包括电子邮件、人性化的出 版、电子社区和其它类似的交流手段,提供这些服务的应用程序方便 了客户和机构间的交互。 2 . 5银行c r m实 施的途径 2 . 5 . 1 实施银行c r m的四个阶段 客户关系管理的实施有四个阶段至关重要:识别客户;对客户进 行差异分析:与客户保持良 性接触;定制化服务以满足每个客户群体 的需要。 1 、 识别客户 ( i d e n t i 行) 银行在与客户接触过程中,必须深入了解客户的各种信息,真正 懂得客户的需求和消费模式,特别是那些占到银行主要赢利的 “ 金牌 客户”。可以 通过建立客户档案的形式实现。客户档案一般应包括以 下内 容: 客户原始记录 :即 有关客户的基础性资料,它往往也是 银行获得的第一手资料, 具体包括以下内容: 客户代码、 名称、 地址、 邮政编码、联系人、电 话号码、银行帐号、存款种类、消费记录、 付 款信用记录等。 统计分析资料 :主要是通过顾客调查分析或向 信 息咨询业购买的第二手资料。包括顾客对银行的态度和评价与存在问 题、信用情况、与其他竞争者交易情况、需求特征和潜力等。银行 投入记录 : 银行与顾客进行联系的时间、 地点、方式 ( 如访问、 打电 话) 和费用开支、 给予哪些优惠、 提供服务的记录、 合作与支持行动、 为争取和保持每个客户所做的其它努力和费用。 2 、对客户进行差异分析 d i ff e r e n t i a t e ) 中国银行业一贯对客户采取 “ 一视同仁”的无差别策略,无论是 老客户还是新客户,大客户还是小客户,都一律平等对待,不能够针 对不同客户提供不同服务。因为不同的客户对银行服务有着不同的需 求,给银行创造不同的利润,银行应该根据客户的需求模式和盈利价 北京交通大学硕士研究生学位论文 值对其进行分类,找出对银行最有价值和最有盈利潜力的客户群以及 他们最需要的银行产品和服务,更好地配置资源,改进银行产品和服 务,牢牢抓住最有价值的客户,取得最大的收益。 3 、与客户保持良性接触 ( i n t e r a c t ) 银行需要和客户保持良 好的接触,以了 解客户不断变化的需求。 在今天银行不仅要了解客户过去的交易行为,而且要能够预测客户未 来的消费行为,分析客户的潜在需求,从而更好的面对竞争。所以银 行要长期保持与客户的关系,经常与客户交流,征求客户的意见。 4 、定制化服务 ( c u s t o m i z e ) 银行需要针对不同客户设计不同的产品和服务模式,适应客户的 需求,真正实现 “ 一对一”的市场营销,将银行的盈利客户发展为忠 实客户,构成银行持续发展的基础。 2 .5 .2 银行c r m实施的步段 c r m是建立在数据仓库技术上的综合分析系统, 数据仓库体系包 括数据仓库、数据挖掘和数据中心库。数据仓库综合了银行的各种信 息,包括来自 多种源系统的数据。它支持多种结构,通过网络进行商 业通信和交易处理。数据挖掘是从大型数据库或者数据仓库中发现并 提取所需信息或知识的过程。目的是帮助分析人员寻找各种数据之间 的关联,寻找其中的规律性,从而提供有效的决策支持。c r m 系统 建立在银行现有的数据系统之上,通过建立科学的数据模型,进行数 据挖掘,向银行提供客户的各种信息资料,以便银行进行决策支持。 1 、建立数据模型 由于银行汇聚了客户的多种数据信息, 并来自 不同的数据库系统, 在商业银行构建客户关系管理系统时,不可避免地会遇上如何管理这 些浩如烟海的数据,以及如何从中提取有用的信息的问题;而数据仓 库的最大优点在于它能把企业网络中不同信息岛上的商业数据集中到 一起,存储在一个单一的集成的数据库中,并提供各种手段对数据进 行统计、分析。 建立数据仓库的首要任务是明确客户的需求,为数据仓库中存储 北京交通大学硕士研究生学位论文 的数据建立模型。通过数据模型,可以得到银行客户完整而清晰的描 述信息。通过分析客户具体指标,逐渐量化来构造数据模型,进一步 发掘数据, 构建性能卓越的数据仓库, 建立起整个c r m的框架体系。 2 、设计和创建c r m数据仓库 数据仓库是数据的中心仓库, 包括来自 多种源系统的数据。它支 持多种结构,通过网络进行商业通信和交易处理。在数据模型构造成 功后,组织技术人员来开发数据仓库系统,实现大型数据库与市场营 销的结合,成功的实施 c r m客户关系管理系统,建立与客户长期的 合作关系,提供更准确和成功的市场信息,并预测客户未来的行为和 客户对新的产品或服务的反应。 2 . 6小结 客户关系管理 ( c r m) 是企业管理和信息技术相结合的产物。 本 章详细介绍了客户关系管理的概念,分析了基于数据仓库的c r m 系 统的体系结构,并讲述了 数据仓库、o l a p和数据挖掘等在 c r m系 统中的重要作用。 最后分析了银行c r m的构成, 以 及银行c r m实施 阶段、实施步骤等问题。 北京交通大学硕士研究生学位论文 第三章 预言模型标记语言 3 . ,概述 在数据仓库环境中,数据挖掘作为一项重要的分析工具,占有相 当重要的位置。但数据挖掘系统如何与数据仓库祸合;如何管理数据 挖掘相关的元数据;数据挖掘模型的表示与存储等都需要一个统一的 标准。 一种有效的解决方案是利用元数据。元数据是数据仓库的一个重 要特点,用于建立、管理、维护和使用数据仓库。它可以对数据仓库 的所有元素进行描述,只要定义一组对元数据进行操作的标准接口, 企业的平台内部组件之间以及和外部系统之间都通过接口调用进行数 据交换,所有实现标准接口的工具都可以互相替代,这样,企业的应 用就不会受到工具的限制。 p m m l ( p r e d i c t i v e m o d e l m a r k u p l a n g u a g e ,预言模型标记语言) 是 1 9 9 9 年由d mg提出的一种标准的数据挖掘建模语言,使用x ml 描述和存储数据挖掘模型。它使得数据挖掘系统在模型定义和描述方 面有共同的标准可以 遵循, 这样各个系统之间可以共享数据挖掘模型, 既可以解决目 前各数据挖掘系统之间封闭性的问题,又可以在其它应 用系统中间嵌入数据挖掘模型,解决孤立的知识发现问题。 下面我们介绍p mml的相关内容, 为我们后面数据挖掘系统的构 建提供一个基础。 3 . 2掀据挖握建摸语言 3 . 2 . 1 p mml p m m l 1 l被一 个称 作数 据挖掘协会 ( t h e d a t a m i n i n g g r o u p, h tt v :/ / w w w .d m g 止 o r q , d m g ) 的 组织开发。 该 组织由a n g o s s , m a g n if y , n c r , s p s s 和芝加哥i l l i n o i s 大学等企业和单位组成, 它的目 的是开 发预言模型开放标准, 将此标准推荐给w3 c工作组, 使p mm l成为 w3 c的正式推荐物。 w3 c己 经接受其作为数据挖掘模型定义的标准, 北京交通大学硕士研究生学位论文 当前p mml最新版本是2 .0 . p mml主要目的是允许应用程序和联机分析处理 ( o l a p )工具 能从数据挖掘系统获得模型,而不用独自 开发数据挖掘模块。另一个 目的是能够收集使用大量潜在的模型, 并且统一管理各种模型的集合。 这些能力在商业应用领域是有效的配置分析模型的基础。 p mm l为各个公司定义预言模型和在不同的应用程序之间共享 模型提供了一种快速并且简单的方式。通过使用标准的x ml解析器 对p mml 进行解析,应用程序能够决定模型输入和输出的数据类型, 模型详细的格式,并且按照标准的数据挖掘术语来解释模型的结果。 p m m l 提供了一个灵活机制来定义预言模型的模式, 同时支持涉 及多 个预言模型的 模型 选择和 模型平衡 ( m o d e l a v e r a g i n g ) 。 对于 那 些需要全部学习、部分学习和分布式学习 ( e n s e m b l e l e a rn in g , p a r t i t i o n e d l e a r n in g , a n d d i s t r i b u t e d l e a r n i n g ) 的 应 用程序, 这种语言 被 证明是非常有用的。另外,它使得在不同的应用程序和系统之间移动 预言模型变得容易、方便。 特别地, p mml非常适合部分学习、分布 式学习 3 . 2 . 2 、以及相关领域。 的作用1a 1 1 ) 模型交换 对于复杂的数据挖掘任务,需要应用不同的数据挖掘工具,因而 工具之间必须能够互相交换结果,在交换结果的同时不用考虑产生模 型的应用。而这需要有一个开放的数据格式支持。 2 ) 模型部署 商业智能应用开发的模型易于部署。软件商能够更容易地将数据 挖掘结果导入到其他支持这种标准的工具中。 从发展的眼光看,需要 将商业智能跨越在i n t e rn e t 上进行实施部署,p mml为这项功能提供 了的基础。 3 ) 独立性 独立于平台、应用和操作系统,只定义模型描述,而不是模型执 北京交通大学硕士研究生学位论文 行的方法。 4 ) 标准化 标准化的模型描述就像h t ml之于i n t e r n e t 一样,将开放模型的 封闭性,开放数据挖掘行业。 3 . 2 .3 p mmi . 文件的例子 p mml规范是一个称作文档类型定义 ( d t d)的文档, 它定义了 数据挖掘模型的文件所应遵循的格式。但是仅通过 d t d的表述, 我 们对 p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论