




已阅读5页,还剩63页未读, 继续免费阅读
(计算机应用技术专业论文)粗糙集在商业银行crm中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南科技大学硕士研究生学位论文第1 页 摘要 中国加入w t o 后,银行间竞争急速上升。客户关系管理c r m 能够提供客 户资源及相关数据分析,从大量客户数据中发现有价值的客户模式。因此研 究适用于绵阳市商业银行的c r m 系统,具有重要的现实意义。 本文在研究b s 结构的基础上,开发了基于b s 三层结构的商业银行c r m 系统,实现了网上银行系统的部分功能和数据驱动的邮件、短信收发功能。 开发设计了适用于绵阳市商业银行c r m 的k d d 系统,使用粗糙集方法进行客 户分析。在数据预处理中引入属性约简进行维度归约,规则生成使用了基于 粗糙集的分类规则获取算法,生成决策规则,建立逻辑推理系统,引入了支 持度和可信度来描述不确定信息。 通过对c r m 系统中获取的数据进行实验分析,验证了本文采用的方法是 有效的、合理的,具有较重要的应用价值。 关键词:知识发现客户关系管理粗糙集理论 西南科技大学硕士研究生学位论文 第1 i 页 a b s t r a c t a f t e rc h i n aj o i n e dw t o ,t h ec o m p e t i t i o n a m o n gb a n k s r i s e s r a p i d l y c u s t o m e r r e l a t i o n s h i pm a n a g e m e n t ( c r m ) c a r lp r o v i d e t h ec u s t o m e rw i t h r e s o u r c e sa n dt h er e l e v a n td a t aa n a l y s i sa n dd i s c o v e r st h ev a l u a b l ec u s t o m e r s p a t t e r n f r o mah u g en u m b e ro fc u s t o m e rd a t a t h e r e f o r e ,t h er e s e a r c ho fa s u i t a b l ec r m s y s t e mf o rm i a n y a n g c o m m e r c i a lb a n kh a sa ni m p o r t a n tp r a c t i c a l s i g n i f i c a n c e ac r m s y s t e mf o rm i a n y a l l gc o m m e r c i a lb a n kh a sb e e nd e v e l o p e db a s e d o nb s o n l i n eb a n k ,e - m a i la n dm e s s a g es y s t e m sk n o w l e d g ed r i v e nh a v eb e e n r e a l i z e d k d ds y s t e ms u i t a b l ef o rc o m m e r c i a lb a n kc r mh a sb e e nd e s i g n e da n d r e a l i z e du s i n gr o u g hs e tf o rc u s t o m e rd a t aa n a l y s i s f i r s t l y ,w eo b t a i nd a t af r o m t h ec r ms y s t e m ,a n dc o n v e r tt h e mi n t or e l e v a n td e c i s i o nt a b l e s e c o n d l y , w e c o m p l e t ea n dd i s c r e t i z et h ed a t ai n t h ed e c i s i o n ,a n dr e d u c et h ea t t r i b u t e sa n d v a l u e t h i r d y , w ec o u l do b t a i nt h er u l e sf o rm a k i n gd e c i s i o na n de s t a b l i s hl o g i c r a t i o c i n a t i o ns y s t e m w ei n t r o d u c et h em e t h o do fs u p p o r td e g r e ea n da c c u r a c yt o d e s c r i b eu n c e r t a i ni n f o r m a f i o n a f t e ra n a l y z i n gt h et e s td a t af r o mc r m s y s t e m w ep r o v et h a to u rm e t h o d s i nt h i s p a p e ri s e f f e c t i v ea n dr e a s o n a b l e ,w h i c hh a sa ni m p o r t a n ta p p l i c a t i o n v a l u e k e y w o r d s :k d d ;c r m ;r o u g h s e t 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得西南科技大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名:6 勿诬砻日期:伽啤乡哆2 矽 关于论文使用和授权的说明 本人完全了解殖南科技大学有关保蜜、使用学位论文的规定,即:学校有权 保留学位论文的复印件,允许该论文被查阅和借阅;学校可以公布该论文的全部 或部分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的学位论文在解密后应遵守此规定) 签轹勘蜘 导师签名:旁唧竹拈日期:仞哆手芗矽胆j 争 西南科技大学硕士研究生学位论文第1 页 1绪论 1 1 选题的目的和意义 随着现代经营管理理念的建立和以银行为中心的传统服务模式越来越不 适应业务发展的需要,改变以银行为中心的业务处理模式已经成为中国商业 银行的发展需要。现代的银行业务正在由以“资会为中心”向以“客户为中 心”的运营模式转变,认为客户永远是银行的第一资产。客户关系管理 ( c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ,简称c r m ) ”“3 1 是在市场需求和企业 追逐盈利的双重推动下,继e r p ( e n t e r p r i s er e s o u r c ep 1 a n n i n g ,企业资源 计划) ”“”之后应运而生的。作为专门的管理客户的系统,客户关系管理为 企业提供了收集、分析和利用客户信息的功能,帮助企业充分利用客户信息 这种资源,为企业的决策管理提供方法和手段,成为银行以“客户为中心” 的有效工具。 c r m 就是借助先进的信息技术和管理思想,通过对企业业务流程的重组 来整合客户信息资源,并在企业的内部实现客户信息和资源的共享,为客户 提供“一对一”个性化服务、改进客户价值、满意度、赢利能力以及客户的 忠诚度,保持和吸引更多的客户,最终实现企业利润最大化。另一方面,c r m 应用系统通过对所收集的客户特征信息进行智能化分析,为企业的商业决策 提供科学依据。 c r m 的管理核心是,通过对“过程”、“客户状态”、“客户满意度”和“客 户成本”的评估、检测、控制等管理办法,运筹帷幄,不断地提升企业在市 场中的竞争力,支撑和延伸长期客户关系,不断创新和挖掘新的销售服务机 会,使企业最终实现销售收入、利润及股东价值的持续增长。可以利用 k d d ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,数据库中的知识发现) ”“将客户 数据库中的大量数据转变成描述客户特征的一些模式,以便充分理解客户以 及客户的爱好,从而改进客户关系管理,使企业获得更大的利益”“。 在c r m 中,k d d 正在起着导向的作用,它几乎可以应用于c r m 中的所有 领域,包括:数据库营销、关系营销、客户群体划分、客户背景分析、新客 户获取、交叉销售、客户流失分析、客户欺诈发现等方面。k d d 就是从大量 的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人 们事先不知道的、但又是潜在有用的信息和知识的过程。通过数据挖掘技术 可以挖掘出潜在的模式知识,找出最有价值的信息,指导商业行为或辅助科 西南科技大学硕士研究生学位论文第2 页 学研究。知识发现过程中重要的一个阶段是数据挖掘( d a t am i n i n g ,简称 d m ) 1 。 在后面的论述中,考虑到很多k d d 算法都主要应用在数据挖掘阶段,在 本文中也称之为数据挖掘算法。目前在c r m 中使用的知识发现系统大部分是 基于决策树、神经元网络、关联规则、聚类、k 近邻等算法的,这些算法有 一定的局限性,例如决策树面临碎片、重复和复制等问题;神经元网络缺乏 解释所获知识的能力;关联规则发现的许多规则价值都不高;聚类算法中参 数的设置通常是依靠经验,难以确定;k 近邻算法的计算效率不高,而且当 数据中存在许多不相关属性时,可能会弓1 起混乱等等”。 粗糙集( r o u g hs e t ,简称r s ) 理论是由波兰学者z p a w l a k 。“”1 于1 9 8 2 年 提出的研究不精确、不确定知识的新型数学工具。它不仅能够在缺少数据先 验知识的情况下,仅仅以对观测数据的分类能力为基础,解决不精确、不确 定性数据的分析和处理,而且算法简单,易于操作。 粗糙集算法,用于处理含糊性和不确定性,在数据挖掘中发挥重要作用, 是一种适用于在c r m 中进行知识发现的方法,它具有以下几个优势“7 ”2 : 第一,c r m 系统中的数据库多为关系数据库。关系表可被看作粗糙集理 论中的决策表,这给粗糙集方法的应用带来了极大的方便。 第二,c r m 中的客户信息有确定性的,也有不确定性的。从数据库中发 现不确定性的知识,为粗糙集方法提供了用武之地。 第三,从c r m 中的客户数据中发现异常,排除知识发现过程中的噪声干 扰也是粗糙集方法的特长之一。 第四,c r m 中数据量大,属性也很多。粗糙集方法不但易于并行执行, 显著地提高发现效率,而且,基于粗活集的数据约简可去掉冗余信息,提高 发现效率,降低错误率。 第五,利用粗糙集理论进行知识发现,不需要任何预备的或额外的有关 数据信息。 第六,粗糙集方法在得到的决策规则和失利过程方面比模糊集方法或神 经网络方法更易于证实和检测。 因此,研究适用于绵阳市商业银行的c r m 系统和在绵阳市商业银行c r m 中构建有效的基于粗糙集的数据挖掘应用,是非常有意义的,也是非常重要 的研究课题。 西南科技大学硕士研究生学位论文第3 页 1 2 课题来源 本课题来源于我们与绵阳市商业银行的合作,主要根据绵阳市商业银行 的需求开发一个适用于绵阳市商业银行的c r m 系统。 课题的研究工作要求是根据绵阳市商业银行提供的需求和数据资源, 完成对c r m 的基本概念、主要功能、软件系统结构进行研究。在此基础上, 对数据库中的知识发现的基本概念、常用方法、一般过程进行探讨。对其中 的挖掘技术一一粗糙集理论进行研究并编写相关算法代码。研究此技术的一 些应用实例,并获取相关的实验数据。为绵阳市商业银行的决策和管理提供 技术支持。 1 3 本论文的研究工作 本文主要研究基于粗糙集理论的知识发现在商业银行c r m 中的应用。从 事了以下几方面的研究工作: ( 1 ) c r m 在商业银行应用研究 研究了b s 体系结构及其优点,在绵阳市商业银行c r m 系统开发中体系 结构采用b s 结构模式;开发实现网上银行部分功能;实现客户的留言功能 管理,对客户的反映进行及时的答复;研究发送邮件和短信原理,提出了知 识库驱动的邮件发送和短信发送方案功能。 ( 2 ) 面向c r m 的知识发现的研究 在分析和研究c r m 的理论和应用的基础上,比较了r s 相对于其他算法的 优缺点,提出了使用粗糙集算法构建c r m 数据挖掘模型的方案。具体有以下 几方面的工作: 数据预处理技术的研究 数据预处理作为知识发现的一个重要步骤,它有助于提高样本数据的质 量及提高所获模式知识的可信度。本文使用一个常量来对数据进行补齐,但 对属性值缺失太多的属性直接从决策表中删除的方案,以确保数据的不失真。 离散化方法和泛化处理也提出了相应的解决办法,以满足用户的不同决策需 求。本文使用属性约简进行维归约,并给出了相应的设计及实验方案。 面向c r m 应用的粗糙集算法的研究 本文对粗糙集进行了研究,提出使用粗糙集理论中的约简算法和分类规 则获取算法来实现商业银行c r m 数据挖掘系统建模。约简算法主要用对决策 西南科技大学硕士研究生学位论文第4 页 表中的属性进行约简,然后使用分类算法,根据等到的上、下近似得到规则, 并对得到的规则进行抽取,得到满意的模式。 c r m 客户分类的研究 本文提出了适用于银行c r m 的客户分类方法,使用粗糙集算法约简算法 和分类规则生成算法对客户行为进行分析,生成规则,并显示给用户,让管 理者通过对客户贡献度的分析对不同类型的客户有一定的认识,对他们的决 策提供支持帮助。 c r m 营销预测模型的研究 通过挖掘得出的分类规则,预测客户的贡献度,用户可以输入客户信息, 得出客户贡献度的支持度和可信度。 1 4 本论文的组织结构 本论文共分六章: 第一章,绪论部份,对整篇论文的研究背景、课题由来、论文结构等进 行了编排。 第二章,阐述了c r m 的基本概念、主要功能。 第三章,阐述了知识发现的基本概念,知识发现的常用方法,知识发现 的一般过程,基本功能等。介绍了粗糙集算法的基本概念、研究动向等。 第四章,详细阐述了本项日使用粗糙集理论进行属性约简和规则生成所 使用到的理论和方法。 第五章,c r m 系统设计和实现部分。详细分析了商业银行c r m 需求,提 出了总体设计方案,并对设计的模块和实现的功能进行了详细的分析和说明。 第六章,k d d 系统设计和实现部分。详细介绍了将粗糙集应用于k d d 系 统原型的实现,包括数据预处理、属性约简、知识库和挖掘结果显示,并对 挖掘结果进行了分析。 结论部分,总结了本论文的研究内容、主要研究成果,并对以后的研究 工作进行了展望。 西南科技大学硕士研究生学位论文第5 页 2 客户关系管理c r m 银行的业务正在由以“资金为中心”向以“客户为中心”的运营模式转 变,认为客户永远是银行的第一资产。客户关系管理( c r m ) 成为银行以“客户 为中心”的有效工具。客户关系管理就是企业利用信息技术,通过对客户的 跟踪、管理和服务,留住老客户、吸引新客户的一种有效的手段和方法。众 多的管理者已经认识到实旋客户关系管理能够帮助企业深入了解客户需求, 及时与客户沟通,为客户提供更为个性化的深层次服务。 2 1 客户关系管理c r m 2 1 1 o r m 的产生和发晨 客户关系管理起源于美国学者巴利( b e r r y ) 于1 9 8 3 年提出的关系营销。 其后,许多学者如克里斯托弗( c h r is t p h e r ) 、莱西赫德( r e i c h h e l d ) 、萨舍 ( s a s s e r ) 等又对其进行了深入的研究,从而形成了现在的理论体系。美国 g a r t l i e ug r o u p 于1 9 9 7 年正式提出客户关系管理( c r m ) 这个概念。之后,客 户关系管理迅速风靡管理界,在理论和实践上都得到了不断的充实和完善。 客户关系管理的产生,是多种因素推动和促成的。首先,激烈的市场竞 争要求企业尤其是拥有庞大客户群体的企业,必须树立“以客户为中心”的 经营管理理念。只有建立并维持良好的客户关系,才能在市场中长期拥有至 关重要的客户资源:其次,核心竞争力建设要求企业必须以全面管理客户关 系为主线,集成各种面向客户的信息开展业务活动。如果说企业资源规划 ( e n t e r p r i s er e s o u r c ep 1 a n n i n g ,e r p ) ”3 1 等系统和工具帮助企业理顺了内 部流程、削减了成本、实现了事务处理自动化的话,那么,企业将更需要能 帮助其全面联系外部客户、把握市场、创造收益的c r m 管理工具。最后,先 进的技术支持使得客户关系管理的实现成为可能。i n t e r n e t 和数据库等技术 被日益广泛她应用于企业的信息系统构建和辅助管理上,包括从传统的办公 事务自动化( o f f i c ea u t o m a t i o n ,o a ) 发展到决策支持( d e c i s i o ns u p p o r t , d s ) 、商业智能( b u s i n e s si n t e l l i g e n c e ,b s ) ”“。 c r m 在国外已有近二十年的发展历史,目前国外c r m 市场已经处于比较 成熟的阶段。自8 0 年代中期以来,c r m 在美国、欧洲以至全球得到了蓬勃的 发展,并已成为继e r p 后企业最重要的应用领域。自1 9 9 7 年开始,全球c r m 市场一直处于爆炸性的增长之中。全球众多的企业,如微软、宝洁等均采用 西南科技大学硕士研究生学位论文第6 页 了c r m 信息系统。根据世界最知名的商业技术调查公司g a r t n e r 的抽样统计, 通过c r m 采用主动式客户服务的企业,其销售收入增加了1 5 到2 0 。专门从 事c r m 咨询和研究的m e t ag r o u p 公司的报告显示,在受调查的企业中,2 3 以上期望在未来五年内改变其客户关系的管理模式,3 4 以上的企业计划集 成“面对客户”的信息管理系统及其组织的其他部分。m e t ag r o u p 还指出, 未来企业在c r m 上的投入将赶上并超过e r p 。企业要实现现代化管理,就离 不开电子商务、c r m 和e r p ,而c r m 成为企业实现更高利润并增强竞争优势的 首要战略”“”“。 国内c r m 是在2 0 0 0 年初才开始受到不断关注和报道。现在已经广泛应用 于各个行业,并且取得了初步成效。在国内有很多的软件公司开始开发c r m 产品,如创智推出的p o w e r - c r m 、北京商能信息技术有限公司推出的m y c r m 、 合力金桥公司推出的h o l l y c r m 是其中比较成功的产品。在国内行业中应用的 比较多也比较成功的主要集中在银行、电信、保险等部门,现在也逐步在中 小企业的应用中取得了一定的成效。 2 1 2 c r m 的概念 客户关系管理c r m ”是英文c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t 的缩 写。现在,人们对客户关系管理( c r m ,c u s t o m e rr e l a t i o n s h i pm a n a g e m e n t ) 的理解已经趋于成熟。但人们对c r m 的定义却有不同的看法,但总的来说可 以从以下几个角度分析c r m 的含义: 从企业经营管理理念的角度来定义,客户关系管理是一种以期望为中心 的新型管理机制,它以信息技术为手段,对业务功能进行重新设计,并对工 作流程进行重组,提高客户满意度,从而是提高企业的竞争力的手段。 从信息技术的角度来定义,此时,客户关系管理是对以客户为中心的商 业模型提供支持的一整套软件系统。其中涉及i n t e r n e t 技术,数据库技术, 数据挖掘技术等信息技术。 简单地说,c r m 可定义为寻找、获得和保持客户,并且需要有一套系统 来保证它的实施,引入下面两种解释。 作为解决方案的客户关系管理,集合了当今最新的信息技术,包括:互 联网和电子商务、多媒体技术、数据仓库和数据挖掘、专家系统和人工智能、 呼叫中心以及相应的硬件环境,同时还包括与c r m 相关的专业咨询等等。 作为应用软件系统的客户关系管理,凝聚了市场营销等管理科学的核心 理念,市场营销、销售管理、客户关怀、服务和支持等构成了c r m 软件模块 西南科技大学硕士研究生学位论文第7 页 的基石。 c r m 既是管理理念、原则制度,也是软件和技术。只从信息技术或经营 管理的角度来谈论,都不完全正确。脱离了管理角度来谈c r m 是毫无意义的; 而脱离了信息技术的支持,c r m 将无法实现,只能是一种设想。 2 2 c r m 系统的体系结构 作为一个完整的体系结构,c r m 系统应该包括接入管理、流程管理和关 系管理三个部分。图2 1 概括地描述了一个比较完整的c r m 体系结构,从中 可以看出c r m 系统的构成、相互关系等。由于不同行业的c r m 系统实现不同 的功能,体系结构也就不尽相同。 协作型c r m ( 接入管理功能) :将市场、销售和服务三个部门紧密地结合 在一起,从而使c r m 为企业发挥更大的作用。 图2 - 1c r _ 系统体系结构 fig 2 - 1t h es t r u c t u r eo fac r hs y s t e m 操作型c r m ( 流程管理功能) :实现销售、营销和客户服务三部分业务流 程的自动化。 分析型c r m ( 关系管理功能) :强调对各种数据的分析,并从中获得有价 ,岳甑+前雠+料动遭孙,誉互动 西南科技大学硕士研究生学位论文第8 页 值的信息。分析型c r m 采集企业内部与客户及交易有关的数据和各种相关的 外部数据,形成企业的数据仓库,在此基础上,运用多种分析手段,形成对 企业各种级别决策具有支持作用的知识,并按照规范的接口供系统其他部分 使用。分析型c r m 以企业的数据仓库或数据库为基础,通过o l a p 、数据挖掘, 来实现对企业数据的分析,了解客户行为、期望等等,管理层可以依此确定 企业的经营战略。主要包括以下几个部分:数据支撑部分、分析处理部分、 知识管理部分、服务接口部分。 在c r m 的发展初期着重的是操作型c r m 和协作型c r m ,主要解决的是围 绕客户信息进行的各个部门的协同工作,也是企业的前端管理的业务流程进 行重新规划和调整,以最佳的工作方法来获得最好的效果。但是,在大量的 客户数据积累起来之后,对数据的分析将成为重点,高效、自动的客户接触 管理只是c r m 的一部分,公司也需要分析这些关系的性能,发现客户行为趋 势,理解客户对公司的真正价值。作为企业c r m 应用的重要组成部分,c r m 分析评价功能在各类c r m 解决方案中所占的比例正不断地加大,分析型c r m 中的分析贯穿于企业的各个活动中,可以指导企业许多方面的运转。 2 3 g r m 系统的典型功能 c r m 系统的核心是客户数据的管理。我们可以把客户数据库看作是一个数 据中心,企业可以记录在整个市场与销售过程中和客户发生的各种活动,跟 踪各类活动的状态,建立各类数据的统计模型用于后期的分析和决策支持。 一套c r m 系统大都是多种功能组件、先进的技术与多种渠道的融合,具备管 理、销售、服务和分析等功能。c r m 系统的典型功能“”有: 客户管理。主要功能有:客户基本信息;与此客户相关的基本活动和活 动历史:联系人的选择;订单的输入和跟踪;建议书和销售合同的生成。 联系人管理。主要作用包括:联系人概况的记录、存储和检索;跟踪同 客户的联系;客户的内部机构的设置概况。 时间管理。主要功能有:日历;设计约会、活动计划,有冲突时,系统 会提示;进行事件安排;进行团队事件安排;查看团队中其它人的安排;把 事件的安排通知相关的人:任务表;预告提示:记事本:电子邮件;传真。 潜在客户管理。主要功能包括:业务线索的记录、升级和分配;销售机 会的升级和分配;潜在客户的跟踪。 销售管理。主要功能包括:组织和浏览销售信息,如客户、业务描述、 西南科技大学硕士研究生学位论文第9 页 联系人、时间、销售阶段、业务额、可能结束时间等;产生各销售业务的阶 段报告,并给出业务所处阶段、还需的时间、成功的可能性、历史销售状况 评价等等信息;对销售业务给出战术、策略上的支持:对地域进行维护;把 销售员归入某一地域并授权;地域的重新设置;根据利润、领域、优先级、 时间、状态等标准,用户可定制将要进行的活动、业务、客户、联系人、约 会等方面的报告;提供类似b b s 的功能,用户可把销售秘诀贴在系统上,还 可以进行某一方面销售技能的查询;销售费用管理;销售佣金管理。 电话营销和电话销售。主要功能包括:电话本;生成电话列表:把电话 号码分配到销售员;记录电话细节,并安排回电;电话营销内容草稿;电话 录音,同时给出书写器,用户可作记录;电话统计和报告:自动拨号。 营销管理。主要功能包括:产品和价格配置器;在进行营销活动时,能 获得预先定制的信息支持;把营销活动与业务、客户、联系人建立关联;显 示任务完成进度;提供类似公告板的功能,可张贴、查找、更新营销资料, 从而实现营销文件、分析报告等的菇享;跟踪特定事件;安排新事件,如研 讨会、会议等,并加入合同、客户和销售代表等信息;信函书写、批量邮件, 并与合同、客户、联系人、业务等建立关联;邮件合并;生成标签和信封。 客户服务。主要功能包括:服务项目的快速录入;服务项目的安排、调 度和重新分配;事件的升级;搜索和跟踪与某一业务相关的事件;生成事件 报告;服务协议和合同:订单管理和跟踪;问题及其解决方法的数据库。 呼叫中心。主要功能包括:呼入呼出电话处理;互联网回呼;呼口q 中心 运行管理;软电话;电话转移;路由选择;报表统计分析;管理分析工具; 通过传真、电话、e - m a i l 、打印机等自动进行资料发送;呼入呼出调度管理。 合作伙伴关系管理。主要功能包括:对公司数据瘁信息设置存取权限, 合作伙伴通过标准的w e b 浏览器以密码登录的方式对客户信息、公司数据库、 与渠道活动相关的文档进行存取和更新;合作伙伴可以方便地存取与销售渠 道有关的销售机会信息;合作伙伴通过浏览器使用销售管理工具和销售机会 管理工具,如销售方法、销售流程等,并使用预定义的和自定义的报告;产 品和价格配置器。 知识管理。主要功能包括:在站点上显示个性化信息;把一些文件作为 附件贴到联系人、客户、事件概况等上;文档管理;对竞争对手的w e b 站点 进行监测,如果发现变化的话,会向用户报告;根据用户定义的关键词对w e b 站点的变化进行监视。 商业智能。主要功能包括:预定义查询和报告;用户定制查询和报告; 西南科技大学硕士研究生学位论文第1 0 页 可看到查询和报告的s q l 代码;以报告或图表形式查看潜在客户和业务可能 带来的收入;通过预定义的图表工具进行潜在客户和业务的传递途径分析: 将数据转移到第三方的预测和计划工具;柱状图和饼图工具:系统运行状态 显示器;能力预警。 电子商务。主要功能包括:个性化界面、服务;网站内容管理;店面; 订单和业务处理;销售空间拓展;客户自助服务;网站运行情况分析和报告。 2 4 g r m 发展趋势 管政的主流c r m 软件技术指标调查分析报告”7 1 显示出了开发c r m 的 现状和发展趋势。调查发现,在c r m 应用和开发中: 开发语言:j a v a 语言已经成为c r m 厂商使用最多的语言,达到了7 1 , 其次是v b 、j s p 等,这些语言的使用比例相对较小, 支持的数据库:c r m 厂商支持的数据库以o r a c i e 、m i c r o s o f ts q ls e r v e r 为主,他们分别占到了8 1 、1 0 0 的比例,其次是d b 2 ,占据3 8 的比例。 支持的操作系统:c r m 厂商支持的操作系统主要是w i n d o w s 系列,所占 比例已经达到了9 0 。但同时我们也看到了u n i x 和l i n u x 的运用也在逐渐增 加,它们的比例分别达到了3 8 和2 4 。 采用的是c s 还是b s 结构:采用b s 结构的厂商已经占据了主要地位, 并且有一个重要的趋势,很多厂商正从c s 结构模式向b s 转变。 采用的是标准化技术还是专有技术:采用标准化技术的厂商达到了1 8 家,占据了8 6 的比例,而采用专有技术的厂商数只有5 家。管理软件的集 成性已经成为各大软件厂商密切关注的焦点之一,采用标准化技术的优点是: 可以方便地与其他管理系统集成。 支持的语言:支持多国语言的软件厂商主要是外资厂商。国内绝大多数 厂商目前所能够支持的语言为简体中文,也有部分厂商支持繁体中文,只有 极少数国内厂商的产品支持国际主流语言。 安全:大多数c r m 厂商支持数字签名和数字证书;也有一些企业支持s s l 加密,保证数据传输的安全性。 软件集成:绝大多数厂商的产品只能与部分公司的产品进行集成;很多 企业为了与其它公司的产品集成都留有接口。 客户化:绝大多数c r m 厂商提供客户化工具。但部分工具用户不易掌握。 维护与服务:由于绝大多数c r m 厂商采用了b s 结构,客户端只需要使 西南科技大学硕士研究生学位论文第l1 页 用标准的i e 浏览器就可以进行相应的操作,c r m 售后服务完善问题还需要一 个逐步推进的过程。 从上面可看出,c r m 发展主要在c r m 应用的标准化、c r m 应用技术、c r m 商务逻辑。未来的c r m 在实用性上也会更强。未来系统可能有以下特点:多 种接入和交互手段、实时性、集成性、协同操作、知识管理、电子商务、系 统化的开发与实施。相信,随着c r m 技术的逐步成熟与完善,c r m 在企业管 理过程中的作用将会日益显著。 目前在美国,c r m ( 客户关系管理) 应用已经开始使用网格技术,在未来 网格技术也会应用到c r m 中去。 2 5 本章小结 本章介绍了c r m 的基本概念、原理、体系结构和主要功能,以及c r m 的 应用和发展。 西南科技大学硕士研究生学位论文第1 2 页 3 知识发现( k d d ) 和粗糙集( r s ) 理论 3 1 k d d 的产生背景和发展过程 随着计算机技术和信息技术的发展,信息的增长速度呈现指数上升,最 近几十年产生了很多超大型数据库,遍及超级市场销售、银行存款、天文学、 行政办公、科学研究、信息量的急剧增长,使传统分析方法远远不能满足现 实的需求。大量的数据被描述为“数据丰富,但知识贫乏”。在海量数据中找 到有价值的知识便变得非常困难。但决策不是基于数据库中的数据,而是基 于数据中隐藏的有价值的知识。面对海量数据,如何从中发现有价值的信息 或知识,成为一项非常艰巨的任务。人们急切的需要一种去粗存精、去伪存 真的技术,能够从海量的数据中提取知识和信息的数据挖掘技术应运而生。 数据挖掘是信息技术自然演化的结果。其演化过程如图3 一l 所示。 数据收集和数据库创建( 2 0 世纪6 0 年代及更早) 数据库管理系统( 7 0 年代) 高级数据库系统( 8 0 年代中期到现在) 基于w e b 的数据库系统 ( 9 0 年代到现在) 数据仓库和数据挖掘 ( 8 0 年代后期到现在) 新一代综合信息系统( 2 0 0 0 一) 圈3 - 1 数据挖掘的演化过程 f i g 3 1 e v o iu t i 0 1 3p r o c e s so ft h ed a t am i n i n gt e c h n o i o g y 1 9 8 9 年8 月,在美国底特律召开的第1 1 届国际人工智能联合会议的专 题讨论会上首次出现k d d 这个术语,随后在1 9 9 1 ,1 9 9 3 ,1 9 9 4 年都举行了 鹾南科技大学硕士研究生学位论文第1 3 页 k d d 专题讨论会,集中讨论数据统计、海量数据分析算法、知识表示、知识 运用等问题。到了1 9 9 5 年,在美国计算机年会( a c m ) 上,提如了数据挖掘( d m , d a t am i n i n g ) 的概念”5 ”2 “。 m e t ag r o u p 曾做出这样的评论:“全球重要的企业、组织会发现,到2 1 世纪数据挖掘技术将是他们商业成功与否的至关重要的影响因素”。i b m 公司 发布了基于标准的数据挖掘技术- i b m d b 2 智能挖掘器服务,可用于个性化的 解决方案。两大统计软件公司s a s 和s p s s 也推出了各自的数据挖掘工具 e n t e r p r s emj h e r 和c 1 e m e n t in e 。此外,在i n t e r n e t 上还有不少k d d 电子 出版物,其中以半月刊k n o w l e d g ed is c o v e r yn u g g e t s 最为权威,另一份在 线周刊为d s ( 决策支持) ,1 9 9 7 年开始出版。自由论坛d me m a i lc l u b 可以通 过电子邮件讨论数据挖掘和知识发现的热点问题。数据挖掘是数据库和信息 决策领域的最前沿的研究方向之一,已引起了国内外学术界的广泛关注。在 我国也已经开始进行数据挖掘技术的研究“”“。 3 2k d d 原理和应用 3 2 1k d d 概念 k d d 是k n o w l e d g ed i s c o v e r yi nd a t a b a s e s 的缩写,既数据库中的知识 发现,是近年来伴随着人工智能和数据库技术的发展而出现的一门新兴技术。 它是一个可以从大型数据库中智能地和自动地抽取一些有用的、有效的、可 信的和可以理解的规则的复杂过程,是当前十分活跃的研究领域。由于k d d 是一门交叉性学科,受到各种不同领域的研究者的广泛关注,因此有很多名 称,最常用的是k d d 和数据挖掘( d a t am i n i n g ,简称d m ) “。 数据库、人工智能和数理统计是k d d 的三个主要的技术支柱。k d d 是从 数据库中发现知识,现在人们已不严格区分数据挖掘和数据库中知识发现, 通常在科研领域中称为k d d ,而在工程领域中称为数据挖掘( d a t am i n i n g ) 。 3 2 2k d d 目的 k d d 的目的是帮助决策者寻找数据闻潜在的关联,发现被忽略的要素, 而这些信息对预测趋势和决策行为也许是十分有用的。k d d 需要凝结各种技 术和创造力去探索可能隐藏在数据中的知识。在很多情况下,应用数据挖掘 技术是为了实现以下三种目的: ( 1 ) 发现知识:知识发现的目标是从数据库存储的数据中发现隐藏的关 西南科技大学硕士研究生学位论文第1 4 页 系、模式和关联。例如,在商业应用中数据挖掘可用于发现分割、分类、关联、 喜好四种知识。发现分割知识可以将客户记录分组,策划为客户度身定做的 推销活动。发现分类知识可以将输入的数据分配到预定义的类别中,发现和 理解趋势以及对文本文档的进行分类等。发现交叉销售的机会是一种关联知 识,以及发现大部分客户的喜好的知识。 ( 2 ) 使数据可视化:分析人员需搞清楚数据库中存储的大量信息的含意。 在做任何分析之前,需先将待处理的数据人性化,并寻找显示数据的好方法。 ( 3 ) 纠正数据:在结合大规模的数据库时,数据库的数据常常是不完整的, 而且通常包含错误和自相矛盾的信息。数据挖掘需要以最稳定的方法识别和 纠正这些问题。 3 2 3k d d 的过程 数据挖掘是一个复杂的过程,它的全部过程可以用图3 2 来表示: 图3 - 2 知识发现过程 f ig 3 - 2p r o c e s so fk d d 分析问题:在进行数据挖掘之前,首先要明确你的业务露标,即想通过 数据挖掘解决什么样的问题,达到什么目的。源数据数据库必须经过评估确 认其是否符合数据挖掘标准,以决定预期结果。 数据清理和集成:清除噪声或不一致数据,将多种数据源可以组合在一 起,这一部分可作为数据预处理步骤。 西南科技大学硕士研究生学位论文第1 5 页 数据选择与变换:从数据库中检索与分析任务相关的数据,将其变换或 统一成适合挖掘的形式。 数据挖掘:是k d d 的基本步骤,使用智能方法提到数据模式。 模式评估:根据某种兴趣度度量,识别表示知识的真正有趣的模式。 知识表示:通过使用可视化和知识表示技术,向用户提供挖掘的知识。 3 2 4 典型的k d d 系统 k d d 系统典型结构如图3 - 3 所示。 数 图3 - 3k d d 系统典型结构 f i g 3 - 3t y p i c a i s t r u c t u r eo fk d ds y s t e m 数据库和数据仓库存储的原始数据经过数据准备阶段( 即数据清理、数据 集成和过滤) 然后装载入相应的数据库和数据仓库服务器,数据挖掘在此服务 器上进行挖掘。当用户提出请求时,数据挖掘系统首先对用户请求分析,转 换为适当的逻辑数学模型,通过数学模型选取恰当的k d d d m 引擎,然后通过 找到具体的数据挖掘算法对预处理过的数据进行挖掘,形成知识库;从知识 库中提取用户作决策用的目标数据形成分类规则,最后通过可视化的形式呈 现给用户。 西南科技大学硕士研究生学位论文第1 6 页 3 2 5k d d 的应用与发展趋势 k d d 技术从一开始就是面向应用的,它不仅可用于特定数据库的简单检 索查询调用,而且要对这些数据进行统计、分析、综合和推理,以指导实际 问题的求解,发现事件间相互关联关系和进行预测“”。 ( 1 ) 商业上通过使用面向c r m 数据挖掘技术使公司可以快速的对顾客的 需求做出反应,并且可以检验商业策略的成效。 ( 2 ) 在科学研究方面,一个天文学上的著名应用系统s k i c a t 就是相当成 功的数据挖掘应用,利用该系统,天文学家已发现1 6 个新的极其遥远的星群。 ( 3 ) 在生物医学和d n a 数据分析上,d m 可以完成异构、分布式基因数据 库的语义集成,用关联规则分析同时出现的基因序列,用路径分析发现在疾 病不同阶段的致病基因等。 ( 4 ) 在体育训练方面,n b a 教练就运用a d v a n c e ds c o u t 来挖掘信息,安 排阵型,提高了获胜的机率。 ( 5 ) 在金融投资方面,f a l c o n 系统是信用卡欺诈估测系统,已被相当数 量的银行采用,f a i s 是一个用于识别与洗钱有关的金融交易系统,l b s c a p i t a lm a n a g e m e n t 则使用了专家系统、神经网络和基因算法技术来辅助管 理多达6 亿美元的有价证券。 ( 6 ) 在电信业,利用数据挖掘可以确定潜在的盗用者和他们的非典型使用 模式,检测想侵入用户账户的企图以及发现需要引起注意的异常模式,从而 保证电信业的正常运转。 ( 7 ) 在电力系统中,应用于数据挖掘技术的数据有电力系统的范围特征与 统计特征,混合存在的离散信息和连续信息,对某些不确定量的掌握和处理。 ( 8 ) 在i n t e r n e t ,利用数据挖掘技术可以w e b 后台数据库进行分类处理, 从而向用户提供更快、更准、更有效的信息。同时,也可透过对w e b 日志进 行挖掘,发现w e b 用户访问模式,在高度相关的站点提供快速有效的访问通 道,帮助更好地设计w e b 主页,改善市场营销决策。 目前,k d d 已经广泛应用于银行金融、零售与批发、制造、保险、公共设 施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研 等方面。越来越多的人已经认识到k d d 技术能将原始数据转换为有意义的模 式,挖掘出潜在的巨大商业价值和所蕴含的科学知识。随着k d d 技术不断被 应用到新的领域和各种算法不断被应用到k d d 领域中,将更大激发k d d 技术 的潜力,进一步推进k d d 技术的发展和普及。当前,d m 研究正方兴末艾,研 究焦点可能会集中到以下几个方面: 西南科技大学硕士研究生学位论文第1 7 页 ( 1 ) 研究专门用于知识发现的d m 语言,向形式化和标准化方向发展; ( 2 ) 寻求数据挖掘过程中的可视化方法,使得知识发现的过程能够被用户 理解,也便于在知识发现过程中的人机交互; ( 3 ) 研究在网络环境下的数据挖掘技术,特别是在i n t e r n e t 上建立d 雎服 务器,与数据库服务器配合,实现数据挖掘; ( 4 ) 加强对各种非结构化数据的挖掘,如文本数据、图形图像数据、多媒 体数据。 但是,无论怎样,需求牵引,市场驱动是永恒的,d m 将首先满足信息时 代用户的急需,大量基于d m 的软件产品将会问世。 3 3 数据挖掘的分类和方法 作为知识发现的核心部分,数据挖掘是k d d 的研究重点。目前对数据挖 掘的研究主要集中在数据挖掘算法和应用领域方面。针对数据挖掘的处理过 程、功能模型、算法研究、应用等不同层面”7 “,数据挖掘可以分为以下 几类: 3 3 1 按照挖掘功能分 数据挖掘功能用于指定数据挖掘任务中要找的模式类型。数据挖掘系统 要能够挖掘多种类型的模式,以适应不同的用户需求或不同的应用。此外数 据挖掘系统应当能够发现各种粒度( 即不同的抽象层) 的模式。数据挖掘功能 以及它们可以发现的模式类型如下:概念类描述、关联分析、分类和预测、 聚类分析、孤立点分析、演变分折等。 3 3 2 按照数据挖掘方法分 数据挖掘是一个交叉学科领域,受多个学科影响。目前,存在有很多数 据挖掘方法或算法,丽描述或说明一个算法涉及三个部分:输入、输出和处 理过程。数据挖掘算法的输入是数据库,算法的输出是要发现的知识或模式, 算法的处理过程则涉及具体的搜索方法。依据算法的输入、输出和处理过程 这三个角度,可以按以下标准对数据挖掘进行分类:挖掘对象、挖掘任务、 挖掘方法。 根据挖掘对象分,有如下若干种数据库或数据源:关系数据库、面向对 象数据库、空间数据库、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位工勤技能-江苏-江苏经济岗位工一级(高级技师)历年参考题库含答案解析(5套)
- 2025年事业单位工勤技能-江苏-江苏堤灌维护工一级(高级技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-江苏-江苏不动产测绘员三级(高级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广西-广西行政岗位工二级(技师)历年参考题库含答案解析
- 2025年事业单位工勤技能-广西-广西水工闸门运行工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广东-广东造林管护工五级(初级工)历年参考题库含答案解析
- 2025年事业单位工勤技能-广东-广东水生产处理工三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东放射技术员五级(初级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-广东-广东仓库管理员三级(高级工)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-安徽-安徽下水道养护工二级(技师)历年参考题库典型考点含答案解析
- XXX加油站风险分级管控台账
- 甘12J8 屋面标准图集
- 购买设备合同
- GB/T 28288-2012足部防护足趾保护包头和防刺穿垫
- GB/T 19666-2019阻燃和耐火电线电缆或光缆通则
- GA/T 1241-2015法庭科学四甲基联苯胺显现血手印技术规范
- 小学和初中科学教学衔接
- 《循证医学》治疗性研究证据的评价和应用
- “李可中医药学术流派论治厥阴病”-课件
- 通用技术作品设计报告
- JJF 1847-2020 电子天平校准规范-(高清现行)
评论
0/150
提交评论