




已阅读5页,还剩62页未读, 继续免费阅读
(通信与信息系统专业论文)crm系统智能分析的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着全球经济一体化的发展趋势,企业间互相争夺的目标客户群也趋于一致, 企业管理人员都在考虑如何提高自己已有客户的忠诚度,以及如何争取更多的潜 在客户这类问题。借助于计算机技术帮助企业分析客户和服务数据将会给企业决 策带来帮助,因此,现在客户关系管理成为了企业管理人员和i t 产业界的研究热 点。 本论文在研究了客户关系管理技术、数据仓库和数据挖掘技术的基础上,针 对校园网络客户服务管理的实际需求,提出了对客户投诉服务的关联分析,呼出 电话业务的统计分类和判定树分类分析子模块的设计方案。系统通过对客户投诉 服务和电话业务数据的采集,构建了相应的数据仓库:采用数据挖掘技术,设计 了分析模型,实现了系统设计,为经营管理决策提供依据。系统采用符合j 2 e e 规范的e j b 组件技术进行应用服务程序的开发,具有较好的操作平台无关性、开 放性和可扩展性;用户端采用基于浏览器的技术,采用j s p 技术实现用户界面动 态交互操作,无需安装专门的客户端软件,便于使用和维护。 本论文课题来源于广东省科技厅的重大科研项目“电子商务应用示范工程” 之“电子商务客户管理与智能分析系统”。目前,首期工作已经完成,达到设计 要求,示范系统已经投入试运行,反映良好。 关键词c i t m ;数据仓库;数据挖掘:j 2 e e ;e j b 华南理工大学工学硕士学位论文 a b s t r a c t a st h et r e n do fg l o b ee c o n o m y ,e n t e r p r i s e s t a r g e tc u s t o m e rg r o u p sa r e m o r ea n dm o r es a m e m a n a g e r sa r et h i n k i n go v e rh o wt oi m p r o v et h ec u s t o m e r l o y a l t y a n dh o wt o g e t m o r e p o e n t i a l c u s t o m e r i ti sh e l p f u lf o rt h e m a n a g e r st ot a k ea d v a n t a g eo fc o m p u t e rt e c h n o l o g yt oa n a l y s ec u s t o m e ra n d s e r v i c ed a t a s oc u s t o m e rr e l a t i o n s h i pm a n a g e m e n th a sb e c o m eah o tt o p i c o fm a n a g e r sa n di te n t e r p r i s e b a s e do nt h er e s e a r c h so fc u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ,d a t a w a r e h o u s ea n dd a t am i n i n g ,t os a t i s f yt h er e q u i r e m e n to fs c h o o ln e t w o r k c u s t o m e rs e r v i c em a n a g e m e n t ,t h i sp a p e rp r e s e n t sad e s i g no fa s s o c i a t i o n a n a l y s i s o fc u s t o m e r c o m p l a i n ,s t a t i s t i ca n a l y s i s a n dd e c i s i o nt r e e a n a l y s i so fp h o n el o g b yr e c e i v i n gt h ec u s t o m e rc o m p l a i na n dp h o n el o g d a t a ,s y s t e mb u i l d sr e l e v a n td a t aw a r e h o u s e u s i n gd a t am i n i n gt e c h n o l o g y , s y s t e md e s i g n s a n dr e a l i z e st h ea n a l y s i sm o d e l ,a n dp r o v i d e sd e c i s i o n s u p p o r t f o rm a n a g e m e n t t h es y s t e mh a st h ec h a r a c t e r i s t i co fp l a t f o r m i n d e p e n d e n c e ,o p e n ,e x t e n s i b i l i t yb yu s i n gj 2 e ee j bt e c h n o l o g y t h ec l i e n t i sb a s e do nw e b ,u s i n gj s pt e c h n o l o g yr e a l i z eu s e rd y n a m i ca l t e r n a t i o n o p e r a t e i t i sn on e e df o r s p e c i a l c 1 i e n t s o f t w a r e e a s y t ou s ea n d m e i n t e n a n c e t h es u b j e c to ft h i sp a p e ro r i g i n a l l yc o m e sf r o mt h ep r o j e c to fs c i e n c e a n dt e c h n o l o g yo f f i c eo fg u a n g d o n gp r o v i n c e :“e - c o m m e r c ed e m o n s t r a ti o n p r o j e c t e c o m m e r c e c u s t o m e rr e l a t i o n s h i pm a n a g e m e n ta n di n t e l l i g e n t a n a l y s i ss y s t e m ”t h ed e s i g nm o d e l sh a v ea l r e a d yf i n i n s e d t h es y s t e mh a s r e a c h e dt h ed e s i g n t h ed e m o n s t r a t i o ns y s t e mi s s u b m i t t i n g t ob eu s e d k e yw o r d sc r m :d a t aw a r e h o u s e :d a t am i n i n g :j 2 e e :e j b 第一章绪论 1 1 前言 第一章绪论 客户关系管理产生的背景是与新经济和新技术有关系的。新经济的挑战包括 经济环境的自由化,打破了国家的垄断,打破了行业的垄断,打破了对资源的垄 断,带来的是竞争更加激烈,导致了产品的生命周期更短,客户的需求更加个性 化。企业如何保持竞争能力并求得发展,对于一个企业的经营者来说是至关重要 的。考察企业的生存环境,可以清楚地看到下述条件是关键因素:一、有最好的 产品,这个好是由客户来评判的,并不是由企业来评判的,而且还包括为什么样 的客户提供更加好的产品。二、经营效率高,使得企业交付产品与服务的时候能 够比竞争对手价格更低及如何管理企业内部的流程才能够使企业的效率更高。三、 能否与客户建立亲密的关系,使客户对你依赖到不可分离的地步。能够做到这三 点,所付出的代价是非常高的。这三个部分都是与企业的客户密切相关的,对企 业而言,客户是最宝贵的资源,失去了客户就失去了一切。失去了老客户,就意 味着业务无法进行,失去了新的客户,即潜在客户,就意味着业务停滞不前,无 法向前发展。 统计表明,从营销成本的角度看,吸引新顾客的成本至少是保持老顾客的成 本的5 倍,说服一个新客户来购买一个商品的成功率为百分之十五,而说服一个 老客户来购买一个商品的成功率可达百分之五十“1 。越来越多的企业认识到维系 现有的顾客的重要性,现有的顾客代表着最佳的利润增长机会。因为保留客户, 带来的远不止是顾客数量的维持和提高,还意味着“顾客质量”的提高。营销学 中有一条著名的“8 0 2 0 定律”,8 0 2 0 定律是十九世纪意大利经济学家佩尔图 ( b i l f r e d op a r e t o ) 率先发表的一项研究成果,后来被称为8 0 2 0 定律( 也称佩 尔图定律) 。对于此定律,最通俗的比喻即1 0 0 个观众在看电视节目,其中8 0 的 观众收看的是其中2 0 的节目,换而言之,就是电视节目很多,但吸引绝大多数 观众的只是其中的少数。那么具体到公司业务,对于已经与公司有业务往来的客 户,其中8 0 的业务来自于2 0 的客户;同样,对于暂时与公司还没有业务往来但 也是公司希望争取到的潜在客户而言,其中8 0 的潜在业务来自于2 0 的潜在客户 ( 潜在客户可被认为是那些曾一次或多次与你公司接触过或你公司与之接触过的 潜在客户,这里的接触无论发生在多久以前的) 。1 。据哈佛商业杂志发表的一项 研究报告指出:再次光临的顾客能为公司带来2 5 一8 5 的利润,这是因为一方面 企业节省了开发新顾客所需的广告和促销费用,而且随着顾客对企业产品信任度 的增加,可以诱发顾客提高相关产品的购买率。此外,根据口碑效应:一个满意 华南理工大学工学硕士学位论文 的顾客会引发8 笔潜在的生意;一个不满意的顾客会影响2 5 个人的购买意愿;如 果客户对一家公司的投诉能得到及时解决,有百分之七十的客户仍有可能继续与 此公司做生意。因此一个满意的、愿意与企业建立长期稳定关系的顾客为企业带 来的利润相当可观”1 。 经历过互联网的狂热后,人们开始冷静地思考一些东西,考虑信息技术为这 个社会能带来的真实价值在哪里? 面对竞争激烈、变化多端的市场,怎样发现、 吸引、留住客户成为企业越来越关注的问题,c r m 的理念因此大行其道,它是迄 今为止规模最大的i t 概念,它将看待客户的概念从独立分散的单个部门提升到了 企业的层面,虽然与每个客户的具体交互行为是由每个部门来完成的,但是却是 企业对客户负全面的责任。为了实现c r m ,企业与客户联系的每一个环节都应实 现自动化管理。营销自动化在此扮演着重要的角色,它是连接企业前台和后台办 公以及企业级共享客户信息的最根本环节,它与销售、客户服务以及后台办公一 起构成了企业的c r m ”1 。 最近几年,客户关系管理的概念已经渗透到了各个领域,各个角落。实施客 户关系管理的好处就是可以提高客户满意度、维持较高的客户保留,对客户收益 和潜在收益产生积极的影响,这些利益对企业来说都有很大的诱惑力。然而,明 确了解这些利益证明是需要面对极大的挑战的。许多实施了c r m 系统的企业发现 他们并没有达到预料的结果,还有更多企业的c r k l 彻底的失败了。2 0 0 1 年c r m 开 始有所下滑,并且2 0 0 2 年c r m 继续下滑。但是,无论从技术,还是从市场方面看, c r m 还是有很大发展空间。有研究表明小型和中型企业占c r m 市场还不到1 5 , 所以对于提供商来说还有很大的空间。而且我们可以看到在这个领域没有哪一家 厂商做的很好,这对于c r m 供应商来说都是一个施展拳脚的地方。g a r t n e r 的市 场分析专家j o eo u t l a w 对此也表示赞同,他说:“据我们调查中间市场还没有被 完全渗透,现在这些公司中仅仅2 0 实施了某种c r m 系统,但是当经济复苏时, 这些中型企业将会得到他们的i t 预算经费,我想c r m 会是他们的首选之一。”这 样就吸引了越来越多c r m 的提供商加入开发行列,如i b m 、o r a c l e 、b e a 、s u n 等 还在他们的产品里加入了门户技术,以便使中小企业更方便地实施c r y 系统。在 接下来的几年时间里,随着消费市场的复苏,企业对c r m 需求的增加,另外为了 降低企业呼叫中心等成本,客户自我服务的c r m 系统将逐渐占据主流,并且将c r m 推到一个全盛时期m ,。 c r m 的出现,从一个方面让许多企业看到i t 技术与传统企业经营相配合所产 生的巨大效益,国内和国外的软件开发商都认识到这是一个将i t 技术转化为生产 力的契机,c r m 软件与普通客户管理软件的不同之处就在于它有智能分析功能。 根据搜集到的文献表明到目前为止,国内在客户关系管理方面还没有完全成熟的 智能分析解决方案。 第一章绪论 华南理工大学信息网络工程研究中心是从2 0 0 0 年己开始进行客户关系管理 软件智能分析系统课题的研究的,华南理工大学硕士研究生陈海彬在他的硕士论 文 7 中研究了这个课题,他主要是完成了智能分析子系统的框架结构,客户购买 服务的关联规则分析,客户基本参数统计,客户聚类分析功能。我之所以论文课 题也选择研究客户关系管理系统智能分析子系统,是因为我认为以计算机技术来 实现客户关系管理是值得继续进行研究的,在实际校园网客户服务工作中还有更 多的需求需要借助于这个系统来完成,我这次的研究主要考虑了以下两个方面: 客户服务工作主要是要为客户提供最好的服务,而我们在实际工作中有时 会难以预先知道哪些服务会成为客户的下一个投诉目标,为解决这个问题, 让客户服务人员可以更加主动地为客户服务,我认为借助于客户关系管理 软件的智能分析系统来对历史数据做分析来预测应该改善哪些服务是一个 实用的研究内容。 在工作中我们同时也管理着校园内部电话网业务,而原来的智能分析系统 并未对这部分数据做任何的分析,我希望能从这些数据中找到一些我们感 兴趣的知识,比如从历史的电话业务数据中是否可以看到我们的校园电话 的呼叫类别特点,是否可以找到一些特殊的电话用户群体,等等。 所以我在这次的论文工作中主要是研究将理论知识用于解决这些具有实际意 义的工作需求。 1 2 国内外文献综述 因为客户关系管理技术是当今世界电子商务的热点课题,因此国内外许多学 者都在进行这方面的研究,以下是我收集的一些文献资料的综述。 现在许多机构收集和存储了关于客户、供应商和商业伙伴的宝贵数据。但是, 由于缺乏发现隐含在数据中的有用信息的能力,所以这些机构无法将数据转化为 知识。所以,企业希望从庞大的数据库中抽取有效的、未知的和能理解的信息, 用来提高效益。为了完成这些工作,机构要集成多种决策科学应用程序( 常叫做 决策引擎( d e c i s i o ne n g i n e ) ) ,以便用分析的方式组织数据,c r m 是决策科学技 术和数据挖掘应用中发展最快的领域之一。为了保持竞争力,企业应采取面向客 户、客户驱动和以客户为中心的发展策略。这些数据反映了企业希望建立持久的 客户关系的愿望。c r m 作为一种解决方案使这些努力真正给企业和客户带来好处, 从而使客户不再怀疑这些努力的作用“1 。美国客户关系管理研究专家a l e xb e r s o n 等在文献 9 中提到2 l 世纪的商业竞争不仅取决于对市场的反应速度,还取决于 对本行业新知识的获取、积累和有效利用的能力。他们提出善于利用信息的机构 将比他们的竞争对手拥有更大的竞争力,关键是对于数据仓库有效的数据管理策 华南理工大学工学硕士学位论文 略和交互式的数据分析能力,而数据挖掘则是后者技术发展的巅峰”1 。 加拿大学者j i a w e ih a n 教授等在文献 1 0 中提出数据挖掘是一个交叉学科领 域,受多个学科影响,包括数据库系统、统计学、机器学习、可视化和信息科学 “。关系数据库是数据挖掘最流行的、最丰富的数据源,因此它是我们数据挖掘 研究的主要数据形式1 。而现在通常我们会需要将多个数据库中的数据联合起来 进行分析,而这些数据库又存放在许多站点,我们就会希望有一个数据仓库来收 集这些来自不同站点的数据库数据,经过清理和净化,供给决策使用。 数据仓库之父w h i n m o n 在文献 1 2 中指出建造数据仓库有两个方面一一与 操作型系统接口的设计和数据仓库本身的设计1 。成功的数据挖掘的关键之一是 能访问正确的、完整的和集成的数据。这也是对数据仓库的要求。数据仓库不仅 是集成数据的一种方式和一个焦点,而且所有数据仓库的解决方案都源自和领事 于数据源部件的质量和效果( 这种部伯在数据仓库世界中称为抽取( e x t r a c t ) 、 变换( t r a n s f o r m ) 和装载( 1 0 a d ) 一一或e t l 工具) 。利用数据仓库的数据准备 和集成功能的数据挖掘应用会提供更强的竞争力“”。 石磊等在文献 1 4 中提出了基于影响域的o l a m ( o l a pm i n i n g ) 模型,将数 据挖掘和o l a p 技术结合分析的功能和灵活性,该模型有助于在大型数据库和数据 仓库中交互式地挖掘多层次的知识m j 。 开发应用技术方面在文献 1 5 中作者提出通过e j b ,可以开发出可扩展的、 健壮的、安全的企业级应用,而不用预先开发复杂的分布式对象框架。通过充分 发挥现有工业标准的基础作用,e j b 让我们轻松、快速地建造以j a v a 语言为基础 的服务器端组件。另外,e j b 从一开始就被设计成支持可移植和可重用于任何开 发商的企业级中间件服务中“。现在国内外普遍采用e j b 方式来开发电子商务系 统,例如文献 1 6 中介绍实现的喜玛拉雅在线冲印系统即是基于j 2 e e 平台的一个 电子商务系统。j 2 e e 已经作为一种可扩展的、全功能的平台,成为开发商创建电 子商务应用的事实标准,它可以将关键的企业应用扩展到任何w e b 浏览器上,并 可适合多种不同的i n t e r n e t 数据流,可连接到几乎任何一种传统数据库和解决方 案,使企业可以根据多家企业所提供的产品、技术开发以及部署最佳的解决方案 进而降低开发网络化应用科学的费用和复杂性,j 2 e e 技术作为大型b 2 b 市场和海 量交易处理的安全稳定的端到端平台而成为未来电子商务平台的应用趋势“。 网页技术方面文献 1 7 对现在流行的a s p 、p h p 和j s p 三种面向w e b 服务器的 动态网页技术进行了分析对比。它们的共同点是:主要由h t m l 代码负责描述信息 的显示格式,而程序代码则用来描述处理逻辑,客户端流星器不需要任何附加的 软件支持,三者都需要附加的语言引擎分析和执行程序代码,而不仅仅只领事于 w e b 服务器,程序代码的执行结果被重新嵌入到h t m l 代码中,然后一起发送给浏 览器,它们的不同:a s p 、p h p 有一个脚本级执行的通病,p h p 还有缺乏规模支持 第一章绪论 和缺乏多层结构支持的不足。j s p 作为新一代站点开发语言,完全克服了上述不 足,主要体现在j s p 可以在s e r v l e t 和j a v a b e a n 的支持下,完成功能更强大的站 点程序,并且,j s p 可以将静态页面的开发和动态内容的生成分开,它的效率和 安全性有所提高,组件方式更加方便,适应的平台较a s p 和p h p 更广,对客户端 浏览器的要求低“。 从我查找资料的过程中。我看到有些学者提到可以利用数据挖掘来改进电信 服务,比如文献 1 8 中举例可以对电信数据进行多维分析,进行模式分析和异常 模式识别,进行多维关联和序列模式分析和电信数据的可视化等,但没有查到文 献有设计和实现这些数据分析的资料,所以我认为有必要在分析这类数据方面作 一些研究。 1 3 本论文的主要研究工作 本论文课题来源于华南理工大学信息网络工程研究中心承担的广东省重大科 技项目“电子商务客户管理和智能分析系统”,研究了c r m 系统构建的关键组成模 块一一智能分析模块的核心技术:数据挖掘技术,以及这项技术的基础应用条件: 数据仓库的建立,研究数据挖掘算法,对原系统进行改进和增强。使这套系统的 智能分析模块更实用。 在论文工作阶段,我主要做了如下的研究工作: 研究了电子商务技术对企业的影响; 研究了数据仓库的构建技术,将客户的呼出电话日志转入到数据仓库中, 实现了数据加载接口; 运用数据仓库和数据挖掘技术对电话业务作了统计性的分类分析和判定树 分类分析,对统计分析结果做了可视化的图形效果,利用判定树分析可以 得到一系列的i f t h e n 规则,如果在学校里合理地应用这些规则将可以灵 活地调配校内资源; 研究了数据挖掘技术,对客户投诉的服务内容作了关联性分析,达到及早 预测客户不满意的服务项目,让企业在客户服务工作中占主动地位,有效 地提高客户满意度和忠诚度; 研究了基于w e b 浏览器的三层应用程序结构和符合j 2 e e 规范的e j b 组件技 术,实现了应用系统功能。 华南理工大学工学硕士学位论文 第二章客户关系管理与应用系统开发技术 2 1 客户关系管理 客户关系管理是指对企业和客户之间的交互活动进行管理的过程。客户关系 管理软件的用户主要是使用数据库的市场人员。客户关系管理系统实现市场人员 和数据库的交互过程自动化。为获得商业上的成功,市场人员首先对市场进行分 割,从数据库里找出现有的和高利润的潜在的客户,然后策划和实施促销活动以 影响客户的行为“。 客户关系管理关注的是市场与客户,因为今天的客户既可以通过传统市场所 提供的销售形式接触各类产品和服务,也可以方便地透过呼叫中心或互联网找到 自己感兴趣的产品和服务。他们的消费方式由被动接受变为主动选择,这一变化 要求企业必须接受这样一个事实:即客户有了比以往任何时候都多的对产品和服 务进行选择和比较的机会与权利,客户的需求越来越个性化,客户成了真正的上 帝。所以客户关系管理的作用主要在与客户直接接触的部门,它主要针对的是企 业的市场、销售、服务部门,包括管理整个客户生命周期的各个阶段,为企业提 供了对客户及所购产品的统计、跟踪和服务等信息化手段和功能。 客户关系管理的具体目标可归结为“提高客户满意度、降低客户流失率”,从 而在一对一营销的基础上,获得并保持客户,最终获取客户的终身价值。通过客 户关系管理系统,企业可以集成柜台、电话、e - m a i l 、短信等等多种渠道,企业 可以把客户在接触、采购、送递及服务方面的信息在各个部门之间共享,并以此 为基础,对客户进行分析,对客户的需求进行归纳,对客户的群体进行分类,从 而采取个性化的服务,以从长期的发展中获得价值。 客户关系管理的目标是获取最大利益。在这里我们认为客户天生就有区别。 只有企业真正了解了客户是否需要交互、交互什么和怎样交互,才有可能得到客 户的忠诚,才能提高收益。客户关系管理使企业能更好地分辨和更有效地将资源 分配给最希望得到它们的客户。但问题是,当客户关系管理成熟时,许多企业会 竞争同一群有吸引力的客户,并与他们保持有意义的联系,有些企业有可能失去 原有的客户。所以发展、维护和不间断地执行有效的客户关系管理程序就变得至 关重要1 。 2 2 数据仓库技术在客户关系管理中的应用 如果只有一个包含所有客户信息的数据库,事情就会简单得多。实际上,取 第二章客户关系管理与应用系统开发技术 得客户概观的过程就像马赛克拼图,从不同的角度可以看到不同的景象。只有将 各个角度看到的景像综合在一起,才能得到真正反映客户特性和行为的图像。 每含不完整的景像来自不同的联系渠道。例如,当销售人员接待客户时,他 们就会对客户产生某种印象。当客户拨打客户服务热线要求解决问题时,企业也 会得到客户的另一个景像( 满意或不满意) 。接触点,即你与客户接触和交互或客 户与企业接触的事件称为“接触点( t o u c hp o i n t ) ”,他们提供了关于客户最好的 信息,但问题是这样的“接触点”太多,而且每个接触点提供的信息都是不完全 的。 我们希望c r m 系统提供“封闭循环的推销”:意即不仅执行推销活动,而且 “封闭循环”,并衡量活动结果。系统一旦可以衡量推销活动的效果,在下一个循 环中,就可以采取措施提高其有效性。通过实验,我们可以更好地了解哪些措施 是有用的,哪些是没有用的,以及为什么。推销成功( 根据客户利润度衡量) 的 实验和衡量结果能促使数据挖掘系统更好地定位和预测客户的行为。 封闭循环的推销包括三个基本步骤: 衡量:以客户利润为标准衡量推销的结果。利用基于w e b 的工具访问客户 数据仓库,并在企业层面上做出r o i ( 投资回报率) 分析。 预测:使用数据挖掘技术预测客户行为,并从过去的实践中学习。利用数 据挖掘系统的结果来制订将来活动的重点并改善活动。 活动:使用活动管理系统,确保活动以可理解和可衡量的方式运行,并确 保在客户数据仓库和数据集市中能捕获活动的结果和过程”。 数据仓库是多种技术的混合体,它的目标是将可供使用的数据库有效地集成 到支持数据战略计划用途的环境。公司可以把收集到的信息作为“生数据( r a w d a t a ) ”加以利用,以获得较大的投资回报率,使自己具备持久的竞争力。 企业有多种联机事务处理系统( 如金融、定单、工作安排和销售点系统) ,这 些系统用于创建操作数据,这种数据组成企业基础设施的一部分,是详细的、非 冗余的和可更新的,它反映的是当前值,用于回答诸如“9 月1 9 日,1 2 3 8 7 6 号客 户购买了哪些服务? ”等问题。 而另一方面,信息数据是根据客户、服务提供商和产品等主题进行组合,它 用于回答决策者的问题,如“在过去的季度里,购买哪三样服务的客户最多? ” 信息数据往往经过概括总结,是冗余的,以支持变化的数据视图,而且是不可更 新的。 信息数据来源于操作数据( 来自企业内部一部分或全部的应用软件、数据库 和计算机系统) 。由于操作数据是不一致的和分散的( 例如,客户的姓名和地址在 不同的系统中所做的处理也不一样) ,所以操作数据必须经过“整理”才能符合统 一的格式、命名习惯和访f l 方法,以满足决策支持的需要,也即是需要创建数据 华南理工大学工学硕士学位论文 仓库来满足决策需要。“。 操作型数据库系统和数据仓库系统的区别如表2 一l 所示。 表2 1 事务数据库系统和数据仓库系统的比较”3 t a b l e2 1 c o m p a r eo l t pa n do l a ps y s t e m 事务数据库数据仓库 特征操作处理信息处理 面向事务分析 用户办事员、d b a 等主管、分析员等 功能日常操作长期信息需求、决策支持 d b 设计基于e - r ,面向应用星型雪花,面向主题 数据当前的,确保最新历史的,跨时间维护 汇总原始的,高度详细的汇总的,统一的 视图详细,一般关系汇总的,多维的 工作单位短的,简单事务复杂查询 存取读写大多数为读 关注数据进入数据输出 操作主关键字上索引散列大量扫描 访问记录数量数十个数百万 用户数数千个数百个 d b 规模1 0 0 m b 到g bg b 到t b 优先高性能,高可用性高灵活性,端点用户自治 度量事务吞吐量查询吞吐量,响应时间 2 3 数据挖掘技术在客户关系管理中的应用 要识别市场分割,就需要关于潜在客户和他们购买行为的有效数据。理论上, 数据越多越好,但实际上,大量的数据往往会妨碍市场人员的工作,因为他们不 得不从中筛选出有价值的信息。 “数据挖掘”( d a t am i n i n g ) 是一种新的商业信息处理技术,其主要特点是对 商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提 取辅助商业决策的关键性数据。近年来,数据挖掘引起了信息产业界的极大关注, 其主要原因是由于企业数据库的广泛使用,存在大量的数据,并且迫切需要从这 些数据中获取有用的信息的知识。获取的信息和知识有广泛的应用,例如:商务 管理、生产管理、市场控制、市场分析、工程设计和科学探索等。 第二章客户关系管理与应用系统开发技术 数据挖掘完成的主要任务如下: 发现知识:知识发现的目的是从公司数据库存储的大量数据中找出隐含的 关系、模式或相关性。 使数据可视化:分析师应该对要处理的存储在企业数据库中的大量信息有 所了解。所以在分析之前,必须先使大量的数据“人性化( h u m a n i z e ) ”, 并找到一种好方法来显示数据。 纠正数据:在合并大规模数据库时,许多企业发现数据是不完整的,而且 通常包含矛盾和错误的信息。数据挖掘技术能以最可靠的方式帮助识别和 纠正这些问题”“。 数据挖掘能为客户关系管理所做的最吸引人的功能是能建立预测模型而不是 回顾型的模型。这两种模型能回答的问题具有明显的不同之处,其区别如表2 - 2 所示。 表2 2 预测和回顾模型回答问题类型的比较“” t a b l e2 - 2c o m p a r ef o r e c a s ta n dr e v i e wa n s w e rq u e s t i o nm o d e l 传统决策工具是回顾型的数据挖掘工具是预测型的 “打印出上个月结算中心的花费”“预测和解释下个月的需求” “扶最近的邮寄单中列出最大的消“定义集中的微型市场以减少未来的 费者”邮寄费用和提高成功率” “利用模型,告诉去年有关合同取“解释为什么有些客户转向我们的竞 消方面的情况”争对手发展一些新的关于客户行为 的模式” 2 4 分布式对象技术 2 4 1 采用分布式对象技术的原因 分布式对象技术是伴随网络而发展起来的一种面向对象的技术。以前的计算 机系统多是单机系统,多个用户是通过联机终端来访问的,没有网络的概念。网 络出现后,产生了c 1 l e n t s e r v e r 的计算服务模式,多个客户端可以共享数据库 服务器和打印服务器等等。随着网络的更进一步发展,许多软件需要在不同厂家 的网络产品、硬件平台、网络协议异构环境下运行,应用的规模也从局域网发展 到广域网。在这种情况下,c 1 i e n t s e r v e r 模式的局限性也就暴露出来了,于是 中间件应运而生。中间件是位于操作系统和应用软件之间的通用服务,它的主要 作用是用来屏蔽网络硬件平台的差异性和操作系统与网络协议的异构性,使应用 软件能够比较平滑地运行于不同平台上。同时中间件在负载平衡、连接管理和调 度方面起了很大的作用,使企业级应用的性能得到大幅提升,满足了关键业务的 华南理工大学工学硕士学位论文 需求。但是在这个阶段,客户端是请求服务的,服务器端是提供服务的,它们的 关系是不对称的。随着面向对象技术的进一步发展,出现了分布式对象技术。可 以这么说,分布式对象技术是随着网络和面向对象技术的发展而不断地完善起来 的。网络分布式应用的第一代模式叫c 1 i e n t s e r v e r 模式,第二代叫3 层 c 1 l e n t s e r v e r 模式,第三代叫分布式对象模式。9 0 年代初c o r b a1 0 标准的颁 布,揭开了分布式对象计算的序幕。 分布式对象计算中,通常参与计算的计算体( 分布对象) 是对称的。分布对 象往往又被称为组件( c o m p o n e n t ) ,组件是一些独立的代码的封装体,在分布式 计算的环境下可以是一个简单的对象,但大多数情况下是一组相关的对象复合体, 提供一定的服务。分布式环境下,组件是一些灵活的软件模块,它们可以位置透 明、语言独立和平台独立地互相发送消息,实现请求服务。 2 4 2 三种主要的分布式对象技术的比较 目前国际上,分布式对象技术有三大流派0 m g 的c o b r a 、微软的c o m d c o m 和s u n 公司的j a v a r m l 。 c o r b a 技术是最早出现的,1 9 9 1 年o m g 颁布了c o b r a1 0 标准;再有就是 m i c r o s o f t 的c o m 系列,从最初的c o m 发展成现在的d c o m ,形成了m i c r o s o f t 一 套分布式对象的计算平台;而s u n 公司的j a v a 平台,在其最早推出的时候,只提 供了远程的方法调用,在当时并不能被称为分布式对象计算,只是属于网络计算 里的一种,接着推出的j a v a b e a n ,也还不足以和上述两大流派抗衡,而其目前的 版本叫j 2 e e ,推出了e j b ,除了语言外还有组件的标准以及组件之间协同工作通 讯的框架。于是,也就形成了目前的三大流派。 应该说,这三者之中,c o b r a 标准是做的最漂亮的。c o b r a 标准主要分为3 个层次:对象请求代理、公共对象服务和公共设施。最底层是对象请求代理o r b , 规定了分布对象的定义( 接口) 和语言映射,实现对象间的通讯和互操作,是分 布对象系统中的“软总线”;在o r b 之上定义了很多公共服务,可以提供诸如并发 服务、名字服务、事务( 交易) 服务、安全服务等各种各样的服务;最上层的公共 设施则定义了组件框架,提供可直接为业务对象使用的服务,规定业务对象有效 协作所需的协定规则。总之,c o r b a 的特点是大而全,互操作性和开放性非常好。 目前c o r b a 的最新版本是2 3 。 c o r b a3 0 也已基本完成,增加了有关i n t e r n e t 集成和o o s 控制等内容。c o r b a 的缺点是庞大而复杂,并且技术和标准的更新相 对较慢,c o b r a 规范从1 0 升级到2 0 所花的时间非常短,而再往上的版本的发 布就相对十分缓慢了。 c o m 技术是m i c r o s o f t 独家做的,是在w i n d o w s3 1 中最初为支持复合文档 1 0 第二章客户关系管理与应用系统开发技术 而使用o l e 技术上发展而来,经历了o l e2 c o m 、a c t i v e x 、d c o m 和c o m + 等i l + 阶段,目前c o m + 把n 息通讯模块m s m q 和解决关键业务的交易模块m t s 都加进去 了,是分布对象计算的一个比较完整的平台。m i c r o s o f t 的c o m 平台效率比较高, 同时它有一系列相应的开发工具支持,应用开发相对简单。但它有一个致命的日b 点就是c o m 的跨平台性较差,如何实现与第三方厂商的互操作性始终是它的一大 问题。从分布对象技术发展的角度来看,大多数人认为c o m 竞争不过c o b r a 。 相比之下,j a v a 标准的制订就快得多,j a v a 是s u n 公司自己定的,演变的很 快。j a v a 的优势是纯语言的,跨平台性非常好。j a v a 分布对象技术通常指远程方 法调用( r m i ) 和企业级j a v a b e a n ( e j b ) 。r m i 提供了一个j a v a 对象远程调用另 一j a v a 对象的方法的能力,与传统r p c 类似,只能支持初级的分布对象互操作。 s u n 公司于是基于r m i ,提出了e j b 。基于j a v a 服务器端组件模型,e j b 框架提供 了像远程访问、安全、交易、持久和生命期管理等多种支持分布对象计算的服务。 目前,j a v a 技术和c o r b a 技术有融合的趋势。 三种分布对象技术的详细比较可参见表2 3 。表中三个特性解释如下: 集成性:集成性主要反映在基础平台对应用程序互操作能力的支持上。它要 求分布在不同机器平台和操作系统上、采用不同的语言或者开发工具生成 的各类商业应用必须能集成在一起,构成一个统一的企业计算框架。这一 集成框架必须建立在网络的基础之上,并且具备对于遗留应用的集成能力; 可用性:要求所采用的软件构件技术必须是成熟的技术,相应的产品也必须 是成熟的产品,在至关重要的企业应用中能够稳定、安全、可靠地运行。 另外,由于数据库在企业计算中扮演着重要角色,软件构件技术应能与数 据库技术紧密集成; 可扩展性:集成框架必须是可扩展的,能够协调不同的设计模式和实现策 略,可以根据企业计算的需求进行裁剪,并能迅速反应市场的变化和技术 的发展趋势。通过保证当前应用的可重用性,最大程度地保护企业的投资 1 2 6 表2 - 3 分布式对象技术比较”7 1 t a b l e2 - 3c o m p a r ed i s t r i b u t e do b j e e ty e e h n o l o g y c o r b a o r ba c ti v e x d c o me j b r m i 集成性支持跨语言操作好好一般 支持跨平台操作好一般好 开发难易程度难较难易 开发时间长较长短 网络通信好一般好 华南理工大学工学硕士学位论文 公共服务组件好一般好 事务处理好一般一般 消息服务一般一般一般 安全服务好一般好 可用性目录服务好一般一般 容错性一般一般一般 产品成熟性一般一般一般 软件开发商支持度一般好好 可扩展性好一般好 经过对上述三种技术的分析比较,我们可以看到在系统中采用j a v a r m l 分布 式对象技术是一种较好的解决网络分布式应用问题的方案,所以在本系统中会采 用这种技术结构。 2 5 服务器端组件体系结构 2 5 1 采用服务器端组件体系结构的原因 多层服务器端应用开发思想的提出至今已经有很多年了,市场上已经出现了 许多应用服务器产品。这些应用服务器提供了服务器端组件的运行环境,并为组 件提供可靠的中间件服务的支持。但是由于到目前为止对什么是中间层组件还没 有一个明确的定义,所以每个应用服务器都是按照自己的模式而不是统一的模式 来提供这些服务。它意味着一旦您购买了一种应用服务器,您的代码就只能在这 种解决方案中运行,这就根本没有移植性可言,它限制了组件的商业前景,因为 用户不能将为一种应用服务器开发的组件组合到另外一种应用服务器中。 由于上述原因,需要一个服务器端组件体系结构的统一的标准。这个体系结 构需要明确定义出承载着组件的应用服务器间良好的接口。这些接口让组件不再 只能面向一种特定的应用服务器,而是能够在不同的应用服务器间安全可靠地移 植。组件供应商因此不用再顾虑他们提供组件运行所需要的例如资源回收、网络、 安全等的服务和支持,可以全力开发具体商业逻辑问题的解决方案。组件运行所 必需的各种服务和支持都由应用服务供应商提供,当然,应用服务器供应商要为 所有的组件开发者提供这些服务和支持。我们需要服务器统一标准的目的是进行 快速的服务器端应用的开发,允许开发者利用原来的网络中间件开发出可移植的 服务器端组件,这也让组件不需要进行任何代码上的修改和重新编译就能在多种 服务器中可靠地运行。 第二章客户关系管理与应用系统开发技术 2 5 2 三种主要的服务器端组件体系结构比较 为了满足对应用服务器的需求,很多公司都已经开发出各自的体系结构。目 前,最流行的标准出自m i c r o s o f t 公司的d n a 体系结构、s u n 公司的j 2 e e 和o m g ( o bj e c tm a n a g e m e n tg r o u p ) 组织的c o r b a 标准。 m i c r o s o f t 公司的d n a 体系结构( 分布式i n t e r n e t 应用体系结构, d i s t r i b u t e di n t e r n e ta p p l i c a t i o n sa r c h i t e c t u r e ) 是服务器端的开发平台, 它包含了各种服务器端组件运行所需的类似资源共享、数据库事务处理、异步通 信和安全等技术,而不需要用户干预。对于d n a 体系结构的开发,开发者只需要 使用同一公司提供的工具,简化了开发工作。但是,如果开发者一旦使用了 m i c r o s o f t 公司的多层体系结构,整个系统就势必只能使用m i c r o s o f t 公司产品, 而不能向高端计算机系统中进行移植。而高端系统所能够提供的高度可靠的运行 环境和多处理器与资源扩展是其他系统远远不能相比的。目前,基于m i c r o s o f t 公司服务器端产品工作站的增长速度异常迅猛,但是,由于这种体系结构中的计 算机数量巨大,因此,它所需要的维护费用相当可观,这种情况希望在将来得到 改善。 服务器端的应用是运行在受到严格控制的环境中,而且在多层体系结构的应 用中,一般情况下系统运行时间的8 0 甚至更多都是在处理数据库和网络访问, 所以j a v a 语言非常适合服务器端。因为服务器市场一直是大型机和u n i x 操作系 统的天下,所以j a v a 语言可以简化服务器端组件开发,开发者可以将开发好的组 件装配到任何服务器端的环境中,而且这也为用户现在的应用( 例如大型机上按 照c o b o l 标准开发的应用程序) 提供一个非常完备的移植到电子商务和其他现代 商务流程的措施。为了增强j a v a 在服务器端的应用,s u n 公司推出了一个完整的 开发平台:j a v a 2 平台企业版( j 2 e e ) 。j 2 e e 平台的主要目标是提供一个平台无关、 可移植、多用户、安全和标准的企业级j a v a 服务器端部署平台。而j 2 e e 的基础 就是应用j a v a 语言开发服务器端组件规范一一e j b 。j 2 e e 简化了构造可扩展的、 基于组件的服务器端应用中的很多复杂环节,它和w i n d o 再sd n a 体系结构非常相 似。两者问最大的不同在于:j 2 e e 是一个规范,而w i n d o w sd n a 则是一个产品。 j 2 e e 同时也规范了开发企业级应用软件所必须遵循的规则。开发商通过j 2 e e 兼 容的产品实现j 2 e e 规范。因为j 2 e e 是一个规范( 对很多公司来说这是非常重要 的) ,所以,它从实质上消除了对一家公司的依赖,并支持跨平台的应用程序部署。 这将激励应用供应商相互
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年专利领域招聘面试热点解析与模拟题答案
- 2025年农村合作社财务工作面临的挑战与应对策略含面试题
- 2025年初创企业项目管理实战模拟题集及解析
- 休闲食品全产业链可持续发展模式创新创业项目商业计划书
- 2025年二级建造师公路工程模拟试题及答案解析
- 2025年农村电商行业招聘考试高频考点及模拟题集详解
- 2025年医药销售代表面试技巧与模拟题集解析
- 2025年中国戏曲文化文创设计师认证考试模拟题集
- 2025年人工智能算法工程师面试宝典中级面试预测题详解
- 2025年全国普法知识考试题库与答案
- 小学科学新教科版二年级上册全册教案(2025秋版)
- 2025年海南省通信网络技术保障中心招聘考试笔试试题(含答案)
- 2025年国家卫生健康委医药卫生科技发展研究中心招聘考试笔试试题(含答案)
- 新课标(水平一)体育与健康《非移动性技能》大单元教学计划及配套教案(18课时)
- 2025至2030中国PE微粉蜡市场需求量预测及前景动态研究报告
- 2025年辅警招聘公安基础知识题库附含参考答案
- 2025年理赔专业技术职务任职资格考试(理赔员·保险基础知识)历年参考题库含答案详解(5套)
- 2025年北京标准租房合同范本下载
- 中华人民共和国治安管理处罚法2025修订版测试题及答案
- 第一单元复习与提高(单元测试)-五年级上册数学沪教版
- 2025年湖北高考历史试题(含答案解析)
评论
0/150
提交评论