(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf_第1页
(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf_第2页
(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf_第3页
(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf_第4页
(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(企业管理专业论文)通过数据挖掘获得客户智能的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

通过数据挖掘获得客户智能辨搬用姘究 摘要 本文从知识经济时代的挑战、商务智能的熏骚性开始分析,提出新的条件下 通过数据挖掘技术进行知识发现的重要性。接着,作者从新时代营销所面临的挑 战指基客户智能豹重要蛙,劳毯新毪建提出通避数攥笼攘获褥客户帮戆这一愚 惩。 然后,作者从数据挖掘的技术介绍开始,讨论了通过数据挖掘获得客户智能 的可能性,并创造性地提出謦口分析了通过数据挖撅技术可以获得的客户智能的内 容及其需鬻构建的数据挖掘模型。然后通过数据撼掘的具体应用分析了其巨大的 商业价馕。 全文共,牵。主要分戚瓣帮分: 前三濑为文章的第一部分,先分析了通过数攒挖掘技术进行知识发城的重要 性,然尉对数据挖掘进行7 介绍,并提出通过数据挖掘获得客户智能这思路。 第四、五章是本文的重点,其中第四章则重虑讨论了如何运用数据挖掘技术 获得客户行为镪分、消费模式殷瑗、消费趋势磷究、键销夏应模式磷究及消费欺 诈行惫簿客户餐戆,蒸五霉粼分辑了魏餐运惩遮藏客户餐蕤透零亍裂润鼹舞。 第三部分,也就是第六章釉第七章,一部分怒逮一技术的应用实例,另一部 分是中国的应用状况分析。 最厝,作者对数据挖掘的皮用前景进行了展缀,并对其可能的发展趋势进行 了简要的说明。 关键诞:数据挖掘、商务鬻髓、客芦餐靛 复星丈学颈士举链论文 通过数据挖掘获得客户智能的应用研究 a b s t r a c t f a c e dw i t ht h ec h a l l e n g eo fk n o w l e d g ee c o n o m i c 1 1 1 i sp a p e rb e g i n sw i t ht h e a n a l y s i so ft h es i g n i f i c a n c eo fb u s i n e s si n t e l l i g e n c e ,o nt h eb a s eo f w h i c ht h ea u t h o r p u t sf o r w a r dt h a t ,i nt h i sn e ws i t u a t i o n ,k n o w l e d g ed i s c o v e r yt h r o u g hd a t am i n i n g t e c h n o l o g yi s o fg r e a ti m p o r t a n c e t h e n ,c o n s i d e r i n gc h a l l e n g e si n m a r k e t i n g ,t h e a u t h o rp o i n t so u tt h es i g n i f i c a n c eo fc u s t o m e ri n t e l l i g e n c e ,a n dc r e a t i v e l yr a i s e st h e n o v e li d e at h a tw ec a no b t a i nc u s t o m e r i n t e l l i g e n c eb y d a t a m i n i n g i nt h ef o l l o w i n gp a r t ,t h r o u g h i n t r o d u c i n gt h ed a t am i n i n gt e c h n o l o g y ,t h ea u t h o r n o to n l yd i s c u s s e st h ef e a s i b i l i t yo f o b t a i n i n g c u s t o m e r i n t e l l i g e n c eb y t h i st e c h n o l o g y , b u ta l s og o e s 如t h e rt oa d v a n c et h ed e t a i l e dc o n t e n to fc u s t o m e ri n t e l l i g e n c e ,f o r m t h ee s s e n t i a lm o d e lt oa n a l y z e si t b yd a t am i n i n ga tl e n g t hi nac r e a t i v ew a y i nt h e e n d ,t h ea u t h o ra p p l i e st h i si d e at or e a lb u s i n e s sa f f a i r sa n dd i g so u ti t sb u s i n e s sv a l u e o f g r e a tp o t e n t i a l t h e p a p e r c o n s i s t so f e i g h t c h a p t e r s ,w h i c h c a l lb ed i v i d e di n t of o u rp a r t s : t h ef i s tp a r tc o n t a i n st h ef i r s tt h r e ec h a p t e r s p r i o rt oi n t r o d u c et h et e c h n o l o g y b r i e f l y ,t h ea m h o ra n a l y z e st h ei m p o r t a n c eo fk n o w l e d g ed i s c o v e r yb yd a t am i n i n g t e c h n o l o g y ,a n d a sar e s u l t ,h er a i s e st h ei d e ao fo b t a i n i n gc u s t o m e ri n t e l l i g e n c e t h r o u g 1d a t am i n i n g t h es e c o n d p a r ti sm a d eu p o f c h a p t e r f o u ra n d c h a p t e rf i v e ,w h i c hi st h ef o c u s o f t h et h e s i s t h ef o u r t hc h a p t e rl a y ss t r e s so n d i s c u s s i n gt h em o d e l so f d a t am i n i n gt o g e t c u s t o m e r i n t e l l i g e n c e ,i n c l u d i n g c u s t o m e rb e h a v i o r s u b d i v i s i o n ,c o n s u m p t i o n p a t t e md i s c o v e r y , c o n s u m p t i o n 臼它n da n a l y s i s s a l e sp r o m o t i o np a t t e mf i n d i n ga n d c o n s u m p t i o ns w i n d l eb e h a v i o r i n t h ef i l t h c h a p t e r , t h e a u t h o r e x p l a i n s h o wt o p r o m o t ep r o f i t st h r o u g h t h ec u s t o m e ri n t e l l i g e n c es og o t t h et h i r dp a r tc o n s i s t so f c h a p t e r s i xa n d c h a p t e rs e v e n c h a p t e r s i xr e f e r st ot h e a p p l i c a t i o ne x a m p l e so ft h e d a t am i n i n gt e c h n o l o g y , w h i l ei n c h a p t e rs e v e n ,t h e a u t h o rg i v ea p e r f e c ta n a l y s i so f t h e c o n d i t i o no f i t sp r a c t i c ei nc h i n a a tl a s t ,i nt h ef o u r t hp a r t ,t h ea u t h o rn o to n l yl o o k sf o r w a r dt ot h ea p p l i c a t i o n p e r s p e c t i v eo f t h ed a t am i n i n g t e c h n o l o g y , b u t a l s op r e d i c t st h ep r o b a b l ed e v e l o p m e n t t r e n d sa n di l l u m i n a t e st h e m b r i e f l y k e y w o r d :d a t am i n i n g ;b u s i n e s si n t e l l i g e n c e ;c u s t o m e ri n t e l l i g e n c e 复鱼大学硬士学位论文 i l 通过数据挖掘获得客户智能的应用研究 前言 知识经济的兴起,使知识上升到社会经济发展的基础地位,知识成了最重要 的资源,“智能资本”成了最重要的资本,在“知识”基础上形成的科技实力成 了最重要的竞争力。但是,面对这一时代浩瀚无垠的信息海洋,知识的获取成了 我们最大的挑战。为了使消耗大量财力与物力所收集与整理的宝贵数据资源得以 利用,有效解决数据丰富性及知识贫乏性的矛盾,促使了数据库中的知识发现技 术的兴起。伴随它快速成长的就是数据挖掘技术。同时,在营销方面,企业也面 临着重大的挑战。即,面对无情的市场竞争,如何通过新的方式更有效地找到新 客户,让现在客户价值实现最大化,并且留住给企业带来最多利润的那部分顾 客? 当前,“商务智能”( b u s i n e s si n t e l l i g e n c e ,b i ) 正在快速地成为最热 门话题。因为它提供及时准确的信息以便用户更好地理解商务活动并做出更深、 更有效的决策,充分运用商务智能可以优化事务处理和资源利用,改进决策,利 润最大化或降低成本。 身为营销学方向的研究生,从理论所学和所参加的咨询实践,我深深地感受 到了客户忠诚对企业至关重要的意义。同时,我也不得不惊叹于商务智能的巨大 魄力,惊叹于通过数据挖掘获得商务智能的神奇。正是这些因素激发了我对客户 智能的研究兴趣,更深一步地激发了我对“通过数据挖掘获得客户智能”这一新 课题的研究热情,本文也就是在这一情况下诞生的。 商务智能虽然已经广为人们所接受,但在这方面的研究还没有成为一个严密 的体系。至于说客户智能,更是一个十分新颖的名词。雨数据挖掘,虽然已经有 了数十年的历史,但过去大部分的研究是侧重于其技术,对于其应用研究者关注 甚少。因而,给本文资料的收集带来了许多困难,但,这也正是其挑战所在。 从客户智能的重要性谈起,本文创造性地讨论了通过数据挖掘方法获得客户 智能的可能性及其途径。并通过其应用的实例说明了通过数据挖掘获得客户智能 的巨大商业价值。最后,作者还对“通过数据挖掘获得客户智能”在中国的发展 现状、问题、及应用前景进行了分析。 作者突破常规,将最新的科技手段( 数据挖掘) 融入到市场营销方法的研究 中,既对数据挖掘技术的应用现实作了一部分总结,更是提出了一部分设想。总 的来说,本文有如下创新之处: 夺明确提出通过数据挖掘获得客户智能,拓宽了数据挖掘的应用领域,为这一学科从 技术研究到实际应用提供了一个有极大商业价值的设想。 夺加深了利用数据挖掘进行知识发现的层次,使其具体到客户智能,在商业领域有较 大的实际意义,也因而产生巨大的商业价值。 复鱼大学硕:l 学位论文 通过数据挖掘获得客户智能的应用研究 夺突破了传统的消费者行为研究的理论框架与方法限制,创造性地提出利用数据挖掘 这一计算机技术进行更为切实有效的客户行为与特征研究,使其结果更有实际的指 导意义。 夺既总结又设想性地提出了可能运用到的客户智能发现模型,使得对客户研究的范围 和内容在本文得到了小小的总结和完善。 夺针对数据挖掘获得客户智能的可能结果,对一些新的营销理念与方法进行了解释和 总结,这在传统的营销研究中是不曾提到的。 2 1 世纪的中国,激烈的市场经济竞争使得每个企业都要划分和选取细分市 场以及在市场中定位,并必须做到有效的客户获得与保留。传统的细分市场方法 主观性的特点则难以支持客观的市场研究和营销决策。同时,在发展的过程中, 相当多的企业也积累了大量的顾客行为特征数据并开始使用较为简单的数据库 系统。而且,随着研究的持续深入及相关专业人士的不断探索,数据挖掘技术日 益完善。这样,外部竞争施加的压力,内部数据积累提供的条件,技术发展提供 的可能,数据挖掘技术在中国的应用必将有无限的前景。本文的研究则为其更深 层次的具体应用进行了探索,这也正是本文的意义所在。 在研究方法上,作者主要是站在前人研究的基础之上,利用文献综述、比较 分析、演绎推理及实证研究等方法进行分析,得出一些必要的结论。至于文中数 据挖掘模型的提出,一部分是在实际中已经被证实可以实现的,也有一部分是作 者的设想。 当然,作为非技术人员讨论数据挖掘的应用,作者自身也受到一些因素的局 限,这也进一步影响到本文所研究的内容重点。因而在成文过程中,作者更多地 是站在应用的角度谈论数据挖掘,对技术层面的问题没有深入地分析,这也芷是 本文需要迸一步完善的地方。 限于资料收集的完整性及本人的学识和精力,本文还有其他需要迸一步完善 和提高的地方,作为本人的研究兴趣所在,作者会在以后继续对其倾注无限的关 注。 复旦大学硕士学位论文 i i 通过数搪挖掘获褥客产智稽盼壤用研究 l 、研究背景;知识经济与商务智能 本章从知识经济的特襁开始分析,提鼢知识经济时代知识发现的蕊要性。接 着,作者进一步指出商务智能强当今时代的重要辩义,并对如何获得商务智能进 行了讨论,提蹬数攥挖拯搜术瓣惹要塞义。 l 。l “螺识经济”簿健与熟识管理 知识粒技术剖凝是太樊经游、季土会发骚兹重黉动力源慕。我们瞧歪生溅以智 力资源的占有、配鼹,以知识的生产、分配和使用( 消费) 为最黧要因素的经济 霹代。鬻黼言之藏燕耀小乎民悫搔蠢鹣“秘学攘零是第一生产力”酌麓谖经济 ( k n o w l e d g ee c o n o m y ) 时代a 在过去的3 0 0 荦时间燕,我镌蟊经经魇了不同的经济时代:从个依赖自然 资潦酶经济时代进入了生产资本整经济辞代,焉蔼黾又发震飘金敲资本蔓导靛经济 拜寸代。大终一个世纪翦,淡嬲嚣始认识型竞争力熬来源开始转纯势知识,我键已 经擞活在个新的时代知识经济时代。相对予以预期为基础,以优化资源为 重心静传统王驻,戳知识麓墓确煞耨嚣工数整筹戳篡辩预期糨适禽麓力鼹强灞嚣 显爨更为牵越。2 i 懋纪熬经济燕瞧器经济一薅纯条终下魏经济,怒戳躲谖决繁为 导向的经济。知识经济的悄然必超,可以说是一场无声的革命,对人类经济社会 活劫的各个领域,对现有的生产方式、生活方式、愚维方式等都礤在和将要产生 重大豹影嬲。 知识魈济的兴趣,使知识上升到社会缀济发展的蒸础地位。知识成了最麓要 酶资源,“智能资本”戒了最鬟婺鹳漆奉,在“豫谖”基憨上形畿豹稀授实力成 了最重要黥竞争力。在孬她竞争串是这令释子,天论爨镊器、傈酸、迄髂、翱造、 零售、能源行业,它们的麓要资产都是知识。如果不始“知识”怜当结合,任何 其他的资产( 机器、资金、晶臁、现金、土施等) ,都是无效资产或者褴本发挥 不了箨羁。蓬豢之阕夯是皴越纛家毒繁受过教育爨孽嚣众,基好熊蒸黜教蠢霸 离蒜教育体系,以获刨薪燃研究所等。惑恧言之,豳家的富强、民族的兴旺、企 业的发达和个人的发展,笼不依籁予甜知谈豹掌攥耦割遭褴的开籀写应魔,褥船 谖熬生产、擎瑶、截耩,烈簸恣入类豢耋要熬添懿+ 煞谖已藏了霹健发麓瓣圭流。 下面的简鹧例子明显地说明了“知识”在今必已经开始发挥燃越来越举足 轻羹的佟篇: 夺 毒一家蘧枣连载癌发臻雌灏粒霖枣之耀豹菜静关联蓑豢,傻得嚣魏不曩类型躲产品 的销售额同时樽刭了= 羹期 夺 泶化学带0 遗厂园向其一绫销售队伍开放了公司的知识库,从而撼离了京的客户服 务拳乎,并缀短了镇簧趣辩。 复虽太学磋士学健论文 通过数掭辛窑掘获得蒜户智耱的廉用研究 夺凳为效采避著静个铡子燕辐特汽车公萄。一豢将辩滚篝理看佟为是“智力资本程 杆”的福特汽车公司,于1 9 9 6 年到1 9 9 7 年间实现了超过3 亿美元的费用缩减,而 其中酶2 l 亿美元霹直接l 螫翡于萁麝采麓蘸一套熟识警瑾技寒最镌经验答菱 系统。更令人吃惊的是,这样巨大数融 的费用节省来自予由内部网络w e b 开发者 释两往经营专家在l e 天蠹帮发窭懿一凑累缓,褥荑冒掇率帮裹这善分之足手! 在知识经济时代,公诸1 决策者们需要阐临一次根本性的转换;即要从传统的 浚交暴避疆、惹聚统筹稳工终滚必皇要关注孩心戆警毽转戮建设怒一个旋够毒襞 力支持沟通建立、人际网络、在工作中学习等“知识管理”系统上来。而也只有 那塑貔够疆珙越造觳识,共享、获联襄努辑絮识瓣企韭方薄戆是2 l 毯纪鹣囊家。 那么,“知识管理”系统如何建立,虫聩何才能在企业现有的知识资产中提炼 曼犬羲赞镶程? 我弱嚣壤装知识繁理豹难题。 首先鼹回答的问题是,什么媳知识? 对这一问题的回答还要兜分清对“信 息”( i n f o r m a t i o n ) 和“翔识”( k n o w l e d g e ) 这嚣翥阕概念土的混浯。 根据商务价值链一书的作者迈克尔h 布拉克特的说法,信息就是“赋 予了囊业内容和意义的数据”1 。知识,扶隽一个方嚣说,是“认识,是对荣个事 物因熟悉丽知晓的状态”:被称为“知识管理之父”的诺纳卡和塔克茨把信息定 义为“一连串消息”,同时认为知识蹩“基予理勰_ 和信任,内一连串的信息 流所创造的”2 :托码斯h 达文波特、戴维德朗和迈竟尔c 沈尔斯 则认为“知识是信息与经验、前困蜃果、诠释鄹反映的结合体,是信息的高 价值阶段,能够喜接为决策和采取行动所掰”3 。p e t e rfd r u c k e r 在傀酶薪 现实中攒出,“知识”( k n o w l e d g e ) 是_ 种能够改变某些入或某些事物的信息 ( i n f o r m a t i o n ) - 这甄龟括使倍患成为行动的蒸穑的方式,瞧龟括逶j 窭对信患 的运用使某个个体( 或机构) 有熊力进行激变或谶行更为有效的行动的方式。” c h u r c h m a n 剃认为“将知识设想或筲作秀怒一释辩信患的集合的躐赢,事实上已 经将知识邀一概念从其全部生活之中剥离丁出去知识只存在予其使用者身上 丽不存在于对信恩静集合串。使霭者对篱意的集会静反应方式才楚轰为重鬟的。” 著名的知识学教授i k u j i r on o n a k a 在曾强调邋:只有人类才能在知识的创新 过程当中掰演核心建色。凭论诗箅梳静蔼纛箍毽髓力膏多丈,它们终究廷不过是 人类的工舆。正因为知识只存在予使用者身上而并不存在于信息的集合中,知识 豹翻薪氇袋麓是发生在入稻秘轻会互魂遥耩当孛。霄鞋试势,翔 :; 每藩惑这两者 农本质上烂根本不相同的两样事物! 对骨么是款识管理,攀者霰重鏊偿试羞遴行7 翳答。营骞一籁发表在s o f t w a r e m a g a z i n e 上的文黎将知识管理定义为:对数据间关系的理解、为镣理数据所制定 熬赞臻趣粼良及对数据戆漆确牲释整合蛙瓣僳证。毒之稳织,发袭在c o m p u t e r 复撼犬擎硬士学位论文 2 避过数摄挖掘获得客声蟹齄缒瓣研究 w o r l d 上的另一篇文章将知识管理定义为:对在线( o n l i n e ) 和离线( o f f 1 i n e ) 的知识与信息资源盼制图举式的籀绘和整理。这样的一种对知t ; 管理的理解和阐 释,基本上是以技术自身当中内嵌的规则和程序为基础,所以事实上它只适用于 一荦申稳定的和可预测的企簸组织环境,蔼笼法与秘态变亿澄的经济环境鞠适应。 而翅德尔和格雷森则说:“知识管理是一种有意识的战略,它把愉当的知识在恰 当鹃嚣于间传递给恰警瓣入,舞置帮韵天f f j 麓这些歙谚 共享,并摇翔谖融入巍挺并 组织绩效的行动中去。”闰内有学者指出,“知谈管理是当企业丽对日益增长着 静箨连续後静环凌变佬时,赞对缀缀匏遥残经、缀织静生存及缝缀静蕤力簿重要 方面的一种迎合性措施。本质上,它嵌涵了组织的发展进程,并寻求将信息技术 瑟撬供懿慰鼗据移信惠熬怒理麓力豁及天鹃发鹱弱餐薪能力这嚣者避霞寄板豹结 合。”也有人认为,可以从两个思路对知识管理予以考查; 夺基黪一:翔谖管理_ 瓣僖惠懿繁毽。这个镶壤戆麟宠者取专家裁一般都毒麓计算蔽 科举和信息科学的教篱背景。对他们来讲,知识州象井可以在信息系统当中被 拣缓耪娃瑾。逮一霉潞褥嚣撑技寒发袋瓣支嫠,瑷在发鬟穰抉。 夺思路二:知识管理= 对人的管理。这个领域的研究者和专家们一般都有着哲学、心 理掌、差圭会学鼗枣鼗警理的教蒡鹜景。德嚣j 经繁攀a 刭怼人类令终戆技能或行为斡 评储、改变绒是改进过程当中。对他们来说,知识= 过程,是一个对不断改囊着的 按辘与k n o w - h o w 等静一系列麓象戆、动态熬安搀。遽鎏入在馋统上,要么是像一 个心理学家那样热衷予对个体能力的学习和管理方面进杼研究,嬲幺就像一个哲学 家、鞋会学容或组织避论家那榉在缀织熬拳早上拜震磅究。这个思路鞍为蠢老。 且不讨论谁是谁非。笔者认为,知识管联的实质就是对知识与技能的捕获 丽不沦这些知识和技能是存在于数擐蓐孛、艘印刷子纸土办或是 警在于人们戆齄 海熙然后将这魑知识与技能分布到能够帮助众妲实现最大产出的任何地方的 过程。其蹬标就是力图能够将最惨当的知识在最恪璺豹时闼传递给最恰当嬲人以 便使他们能够做出最好的决策。 l + 2 数据荣i 炸健懿谣贫乏 在知识经济时代,通信、计算机和网络技术正激变着壤个人类和社会。一方 瑟,天髑生活孛蟊辩静信患越来趱多,举个篱单静铜子:缀约辩攘赉酾年我 的i 0 2 0 版扩张至现在的i 0 0 2 0 0 版,最高曾达1 5 7 2 版;北京脊年报也已 是1 6 4 0 敝;市场营销摄穗这1 0 0 激,焉溅骜数豢蓐援恭豹迅速发震帮警瑾系统 的广泛应用,企业内部也产生了越来越多的数据。另一方顽,大煮信息在给人们 带来方便懿鬻对也带来了一大堆瓣鼷,魏傣惠过重,难缢溪纯;信感箕缓雅戳瓣 识;信息安全难以保证:倍息形式不一致,难以统处理镰。 复飘大学硕士举缱论文 通过数攒挖掘获得客户智能的艨用研究 面对浩瀚无煨的信息海洋,数据洪水正向人们滚滚涌来。当数据量极度增长 辩,如暴没有有效的方法来提取脊稻的僚惠和知谖,入稍样会感到束爷无策。 难怪奈斯伯特o o l m n a i s b e t t ) 惊呼“人类磁被数据淹没,却饥渴于知识”5 。因此, 人们开始挺出一个新静强号:“簧学会搬弃痿意”。入们落开始毒意:“数簿才憝 不被信息淹没,渐是从中及时发现有用的知识、提高信息利用率? ” 灞蘩数据替璐豫藏案鹣重要鳎谖与鬻能,久稍希望熬够对箕进行一臻离墨次 的分析,以便更好地利用这些数据。于悬,用数据库管穗系统来存储数据,用机 器学磊斡方法来分耩鼗爨,挖攘丈量数撂鹜蓐豹懿识,遮薄者懿结会程袋了数寨 辟中的知识发现( k _ d d ) 的产生。 l 。3 翔谈共事与知谈获得发现 知识管理当每,我髫3 的闯题怒如何有效实现期识共享秘知识获褥。因为如果 没有知识共享,知识是不能创造价值的,也就失去了意义。但更多的时候,知识 共享是依赖知识获褥发现恧存在静,把知识获鳓发现放在最重袋的位鬟是显面 翁见的:只有当被共享的知识存程,知识菇享才有意义。知识获樽发现怒知识警 馥的薹兔葵突破的难题! 对知识管理深入研究酶结果袋明,知识获得,发现的荧键是显性知识和隐性知 识的融会贯通。下表简单地说踢了这个阍题: 知识获樽,发现的转化过攫( 1 k u j i r on o n a k a 镑) 注;嚣中i 衰承个傣,g 袭示群体。0 表录缝绥 夺裁会往:霹疆看盛怒令俸麓菸事穗健麴谖豹遂程 夺外部化:把个人隐饿的知识,通过能够让别人理解的方式袭达出来 夺综台稼:撼嚣挫翔镶热鞋综会,交戒鬟为复杂靛嚣瞧魏谖俸系 夺 内在化:把显性知识转化为个人的隐性知识 复苴太学碾士学位论文 4 通过数蒲挖播获褥客户智脆静藏用研究 尽管上瑟己缀清新遮给出了辩谈获褥,发瑗胃缒静转纯过程及箕途径,健在技 术上如何实现呢? 尽管已经有一燎专家把企业内部网、视频会议系统和网络广播 等獗技寒警 荤痤怼辩谖嚣雩代赛整鹬凌夔灵丹妙蘩。毽却没毒一个完全戆选人稻溱 意的解释。 歪在这令对捩,褰务餐戆( 8 ) 出溪? 。对翔滚警理袋漤,这是一个熏要魏 里程碑,也是实现知识共事的关镳所在。同时,商务智能也对知识获得发现产生 嚣要 睾爰,茏其是运曩离务蟹麓懿分援应煺工具簿。 1 4 “商务智能”及箕价值 在对“商务智能”进行了解强前,让我们先番下“智能”( i n t e l l i g e n c e ) 究竟是什么意思。下面是d i c t i o n a r y c o i n 上关于i n t e l l i g e n c e 的解释: 夺认知或理解的能力,全面的阅读能力; 夺 传授或获得的知识,包括通过学习、磷究或体验而得到的知识: 夺认知的行为或状态,对鲡识的运用。 可见,“智能”更强调是经过思考或实践所获得的智慧、有效的价值,是把 倍患提离个层次籍的懿谈。然丽逡德静怒,蓟辩前为止,虽然“商务鹫辘” ( b u s i n e s si n t e l l i g e n c e ,b i ) 磁在快速地成为最热门话题? 人们对商务智能的 裰念也舔跫经能够接受,氆还没裔个校藏匏定义薅既骰斑解释。下嚣罴企韭弄 i b m 和学术界的几个定义: 夺i b m 试为蘸务智簸悬指一种能力;遥避智髓豹使蹋铱静数据黠产柬稍定蔓好鳎商务 决燕。它的意思是说各种企业的决策人员以企业中的数据仓库( d a mw a r e h o u s e ) 为 本,经壶备式蔷样静套谗分橱i 兵( q u e r y r e p o r t t o o l s ) 、鞭桩分耩簸理( o n l i n e a n a l y t i c a lp r o c e s s i n g 简称o l a p ) i 具、或是数揲挖掘( d a mm i n i n g ) i 具加土决策规 戴天曼懿蟹我籍谖( i n d u s t r yk n o w t e d g e ) ,获数爨仓辏孛获褥套裁薛辖惑,谶嚣黎韵 企业提高获刹,增加生产力与竞争力。 夺t o m a s c a s a s l k l e t t 在链秀穗务智缝一零写鹣滓孛撵巍:亵务簧缝是默“攫本土 帮助你把公司的运营数据转化成为高价值的可以获取的僚息( 或糟知识) 并且在 馀套熬彝攘遴过稳当| 孽方式辩蛉当戆壤意薅遽绘恰当熬入”。 一学术界的观点是7 :b i 实际上是帮助企业提高决策能力和遥营能力的概念、方法、 过程菠及软转懿纂念,其主要鏊糖;是将企韭翳掌握豹僖悫转换戒竞争捷势,提寒企 业决策能力、决策散翠、决策准确性。 就遽些商务智熊( b i ) 豹定义装器,它势不毙燮全等霹与戋曩识获褥发现,知 识获得是多途径的,而商b i 则只怒其一部分,即愚数据库中的知识发现。但就其 发震嚣言,嶷务智能( b i ) 已经紧紧地与“知识”粒信息缝合在一遛,牢不霹分, 美照太学硬士学证论文 速过数攥挖掘获樽雾产管缝睽擞爨| 研究 它的定义已经不耄要了。我们也没有必要深入她讨论商务智能( 8 i ) 和知识管骥 之间的区别,尽管它们会有一些麓别。 事实上,许多已成功实现商务智能系统的企她郄了孵内容相似的两个论点: 夺商务智能以将信息转为知识,再将知识转为竞争优势i 夺灏务智能系统将成为企业中最宝贵的经营舞产。 也就建说,商务智勰( 8 i ) 掇供及时穗确的傣意以便丽户更好缝瑾解商务活动 并做出熨深、更肖效的决策。充分运用商务智能可以优化事务处理和资源利用, 改进决策,剃润最大纯或降低成本。8 i 静解决方案可戳为财务、竞争力簸控、市 场、产品比较以及商业活动范围的整合带来无限的应用。良活的8 i 解决方案可以 逡蔫于锤簿行监并为其谈爝萃盆获得稽斑秘增毽。这些解抉方案使得决策者可懿 做到: 争使用最短瓣辩闯搜集各释裰荧雏裔监傣患 夺自动将这拨信息吸收到个性化的智能巾去。 夺为进行毙羧衽智戆决策提供分辑戆工箕。 夺缩短从决策到执行之间的过程。 重要瓣是,囊务餐麓( 瓣1 ) 是嚣藜金鼗赛粒软薛嚣发赛受搿广泛关注豹一个繇突 方向,它把先进的信息技术应用剿整个众业、不仅为其撼供信息获取能力,而且 逶过薅傣患蘸开发,姆菸转交兔众鼗懿竞争霞势。嚣照,越来憨多戆垒攮提窭穗 们对b i 的需求,把b i 作为一种帮助企业达到经鬻目标的一种有效手段;另一方 骥,谤冀援赛缀多著名公嗣已经认识型b | 基夫憨发震潜力,纷纷艇入刭从事b l 研究和软件开发的行列、比如;i b m 建立了专门从事b i 方案设计的研究中心。 o r a c l e 、m i c r o s o f t 等著名爨软 孛厂藤纷纷推爨支持b 嚣发毒应弱豹敦静蓉缝。哥 以看出,b i 无论对于企业界还是对于计算机界,都燕一个非常具肖吸引力的方向。 一令企业在拳头上援骞与熟翻戆褰务、毽稻敬窖产、镳粕懿会终钬转数及魏 们的商业运作有关的商、业智能越移,它就越能够做出更好的选择,它的竞争优势 瞧就越强。捌如,企业可以剩援巍业蟹熊擦决方案来了烬客户豹购买习惯,穗定 销售和利润增长的机会,可以更好地预测并且满飕客户的霈求。并且帮助他们提 寓总俸鲍决策水平。 据国际数据公司( i d c ) 对6 5 个公司的案例研究显示,在过去2 3 年熏,商务 智能投资的平均嬲报超过丁4 0 0 。一项来自美国k i e t ag r o u p 豹帝场分攒指出, 9 2 的企业将在今后3 年内使用数据仓库。可见商务智能的价值及其发展潜力。 l 。5 “糍务餐戆”憨获褥 同知识和信息密不可分的商务智能的价值是不言而喻的,但如何获得商务智 麓,著运遥稠震藏务智麓程竞争审蕤高? 蔓燕太拳硪士学位论文艿 遇过数据挖搬获得客户智鲢的应用研究 让我们先着一下商务餐耱豹应髑情况,因魏艘用的状况决定了箕获得的蒸础。 就目前鹩状况寨蠢,商务餐麟大都广泛地斑用程誉黉、魄倍帮保黢、嘏行等行监。 它们一般英肖以下特征: 夺 大璧的顾客,海量的交易数据。 夺 # 常激烈的竞争弗有藏劳纯的嚣豢。这些抒渡一般提供黪都是差异他缀小静产始, 辫黠行业肉的竞争叉嚣常激烈,取蓠使差异纯麓服务威麓企韭必然逡择。 夸 能容易地收集到大量豹电子数据。这些行韭一般都有较完善的电子燮翁记录系统, 薅l 噩穰方便的嫒集羲犬黛翁毫予交舞数据。 从商务智能的应用情况可以看出,“数据”悬商务智能的源泉。难怪商务智 能一书的作者伯纳德剩舆托德朔马竞哈蒙德指如,获得和利用商务饕能豹 一韬答繁裙在数舔之串,鼗掇静灵魂莛信惠,餐惑造裁鬻戆。 那么我们又怎么能从太豢的数援中获得我们慧簧的商务智能昵? 从技术上如 餐露这一游题避行解决考蔻簸骞效筑瓣? 下圈熄i b m 蠼出的一个b i 的体系架构图:从这个体祭架构量,我们可以看到 数据挖攒怒支挎b i 应用的个熏要的过程,墩怒黼务智能获得的个重要途径。 i商务智能的应用 1 r i决策支持工具 i报告嗣誊询 o l a p数据挖掘 圈:商务智能的体系浆构 同对,t o m a sc a s a sik l e t t 在继受商努餐戆一书写豹廖巾攒蹬,簿务 智能的蛊骚应用部分在于;篱攀戆撒鬻和查诲、农线分析技术( 0 l 矗p ) 、经毽倍患 系统( e i s ) 、数鼹挖掘和辨鼹。这里,从b i 缒黩鼹我们媳可以看出来,数据挖掘 在商务鬻髓的获褥方蘑是不麓蠛缺的一项援米。 茎量太攀撷女攀证谚文 一 惩数鼹簿璇 一 遴过数摆挖掘获褥窖产蟹缝麴应惩研究 也有人认为,念业为迎接市场的挑战,必须对带场运作有准确的分析。商务 智能系统的最大好处是可以得到狼确、及订寸的信息,帮助众业赢得竞争优势,而 这熬功能的完成主要依靠数据仓库、联机分析处理嗣数据挖掘这三丈技术。数据 挖掘在这曼再次被强调。 大量的数据带来巨大的动力,为企业在商业智能舞台上实现商务解决方案提 供了竞争能势。德公司倍感资产的价值并不在于存贮和提联信怠的髓力,前在于 将信息与特定过程和未知情境进杼动态匹配的能力。如果遮些信息资产不能够加 戬剩用,就慧味着大量机会和金钱的滚费。器蘸,大多数众监只零j 焉了很少的数 据资源用于统计汇总,而泉下的数据资源则不断随时间增长,成为座含愈量很 高、毽是被忽略了瓣矿出。 从前文的分析中可以看出,在获得商务智能的过程中,方法悬多种多样的。 毽我侮毽瑶疆看到,不论燕企韭赛凌是溪究静学者,都不终褥圈戆戆鼗豢挖箍看 成烧一个有用的工舆,一种结合发现和分析的新的方法。足见其适用性,后面, 本文将嚣数据挖掭鼢方法避行分撰螽对j 恕鸯骚霞答。 复曼大学额攀挝论文 8 通过数据挖掘获得客户智能的应用研究 2 、数据挖籀 本章从数据库中的知识发现开始,对k d d 与数据挖掘进行了对比分析,并通 过对数据挖掘与其他概念的比较阐明了数据挖掘的含义。然后,作者对数据挖掘 迸行了分类,势进一步讨论了数播挖掘技术的价值所在。 2 。l 数据露孛夔知识发褒与数据挖掘 2 1 1 数据魔中的知识发现 自从商了体力劳动与脑力劳动的分工,人们对知识的探求便从来没省停过, 知识经济时代以来,更是形成了个蔚所未有的高潮。随着数据库技术豹迅速发 震殴及数攥黪整理系统戆广泛蔽溪,太襄袭罴熬数攒麓寒越多。垂涎予激罐豹数 据背后隐藏麓静诲多重要信惠,人们希望麓够对其避行曼离层次豹分析,激便更 好地利用返魃数据。 关系数据库提供的简单查询及报表生成功能,只能获得数据的表艨信息,而 不能获得数据属性的内在关系釉隐含的信息,即淹没了包含的知识,造成了资源 戆浪费4 。为? 捷溃耗大量怼力鸯携力瑟牧集与整骥瓣裳爨数据燹潺褥戳秘趱,有 效簿决数禚辜富经及知 贫乏谯瓣矛盾,需要蓊按拳餐缝、量动遗势橱怒毽原始 数据,促使了数据库中的知识发现( k d d ,k n o w l e d g ed i s c o v e r yi nd a t a b a s e ) 技术的出现。 追根朔源,1 9 8 9 年8 月在荧龋底特律召开的第l l 属冒际人工智能联合会议 蕊专题讨论衾上首次出现固d 这个术语。蘧基在1 9 9 1 霉、1 9 9 3 年帮1 9 9 4 冬郡举 幸亍k d d 专嚣讨论会,汇集来鑫务个领域魏臻究大受秘疲焉开发者,案审谬论数舞 统计、海囊数据分析算法、知谈袋示、知识运用祷问鼹。髓着参与人员的不断增 多,k d d 国际会议发展成为年衾。迄今为止,由美隔人工智能协会主办的k d d 国 际研讨会已缀召开了1 0 数次,规模由原来的专题讨论念发展至8 国际学术犬会,人 数由二三卡人热| 近手入,研究鬟点毽逐海麸发瑰方滋转良系统应用,势基注薹多 稗发疆策瘵粒羧术魏集或,臻及多释学耱之两耱攘嚣渗透。 此外,数据库、人工智能、信息处理、知识工獠簿领域的国际学术干u 物瞧纷 纷开辟了k d d 专题或专刊。i e e e “的k n o w l e d g ea n dd a t ae n g i n e e r i n g 会刊领 先在1 9 9 3 华出版了k d d 技术专刊,所发表的论文已经较全面地论述了k d d 系统方 法论、发现结豢的浮徐、k d d 系统设诗豹逻辑方法,煞中讨论了鉴予数据蓐豹动 态夔嚣余、麓嗓声秘不臻定毽、窆毽等翅蘧,趵d 系统毒其它筵统戆辍释学习、 专家系统、人工神经网络、数璃统计分析系统的联系和嚣剐,以及稆藏的基本对 复星夫学硕士举 i 论文 警 运过数搬挖掘获得蒜户智转缒黩用辑究 繁。不仅如此,在i n t e r n e t 上还餐不少k d d 电子出版物,其中以半月刊k n o w l e d g e d i s c o v e r yn u g g e t s 最为枚威。 2 。1 2k d d 兹实熬过程 实际上,数据库中的知识发现( j ( d d ) 是一门交叉性学科,涉及到机器学习、 缓式谈巅、统诗学、智能数据疼、辩谖获淑、数据霹筏缘、塞憋髓嚣雾、专家系 统等多个领域。落是多个步骤相烈连接、反复进行人机交飘的过耩。具体甑括:” 夺学习菜个痘蘑领域:鸯耩反瓣孛豹羰先知识露嚣标。 夺 建立目标数据集:选择一个数据集或糕多数撮鬟的子絮上聚焦。 夺 数搭颈处壤:去豫骚声或无关数撰,去瓣窆彝数器域,考露封阕照| 葶密数摆变豫等, 夺数据转换:找到数据的特征液示,用维变换或转换方法减少有效变量的数目或找剽 数据豹不变式。 夺 选定数据挖掘功能;决定数据挖掘的目的。 夺选定数据挽掘算法:舞k d d 过程孛静难辩,遗撵某个特蹩数据挖掘算法( 妇汇总、 分类、回归、聚类蒋) 用于搜索数据中的模式 夺 数据挖掘:搜索袋产生一个特定熬感必趣静攘式或一个特定的数攘纂。 夺 解释:解释某个发现的模式,去掉多佘的不切越意的摸式,转抉菜个有用的模式, 以使用户明白。 夺发现知识:把这些知识结合剡运行系统中。获樽这些知谖的作用或证明这些知识。 用预先、可信的知识检查和鳃决知识中茸能的矛盾。 2 1 3 数据挖掘 随着数据库串存储数耩羹秘慧掰增大,在太纛豹数据背后隐藏着译多重要麓 倍息,如果能把这些信息从数据麟中抽取出来,将为公司创造很多潜在的利润, 数据痒串鹃稻谈茨凝毒数攥挖掘穰念藏爱麸这耩瓣黉堑惫炭嚣笈漱来熬。蠢上瑟 对数据库中知识发现的分析,似乎可以认为,数撼挖掘只是数据库中知识发现的 一个步骤,它震专瓣算法鼠数据审_ 癌彀楱泼( p a t t e r n s ) 。毽氇鸯一鎏定义把鼗 撼挖掘看作是任何一种发现形式,而知识发现仅谶用于与特定的算法各类有关的 羧零子纂。委霜露露建,程安虢审,诲多入往往霹戳不麓送裂缝馊瘸k d d 帮数蕹 挖掘。 当蔻,数据撼握稻翔滚发瑗凌嚣鼗襄辩按蠹缓、产照分辑数及公司繁理方覆 受到了越来越多的关注。郧么什么是数据挖掘呢? 取决于定义者的观点和背景, 萁定义饕鬻蒺凝。魏下是些翻文熬、捺广数擐攘撼瘦弱熬敬 孛企溲及一些专业 缀理人士对其的定义”: 复凰太学硕士学位论文 1 0 通过数撼挖掘获得客户智能的应用研究 夺羧豢掩掘是露在知识发现建覆,来辩识存在予数攒串熬未弼关系窝摸蕊秘一些方 法。( f e r r u z z a ) 夺数据挖掘是一个从大型数攒库中提取以前未知的、可理解的、可执行的信息并用它 来进行关键的商业决策的道程。( z e k u l i n ) 夺数攒挖播是发现数据中商蕊模式的过程。( j o n n ) 夺数爨禳掘是我髓为那鍪来舞敬售惠模式嚣礤突夫婆l 数攥囊懿一个决策支持过程。 ( p a r s a y e ) 夺 “数据库中的知识发现最个在数据里发现确定谢效的、新颖的、有潜程使用价值 的及最终可理解的高价值( n o n t r i v i a l ) 过程”( f a y y a d 等,知识麓现和数据挖 掘的进展,1 9 9 6 ) 数攒挖撼是一巾簸六鍪数据露串捷疑鞋羲不稚j 蓑鹩霹撵俸毪痿患戆絮谈挖攘遂程。 ( a a r o nz o r n e s ,t h eg , e t ag r o u p ) 夺 “数据挖掘是通过仔细分析犬重数据来揭示有意义的新的关系、模式和趋势的过 程。它使用模式认知技术、统计技术和数学技术。”( g a r t n e rg r o u p ) 夺 “数据挖掘是一个分析熟体数据,摹取和展现w 杼动的、稳含的、颠鞭的信息, 竣簿凌建努运霆熬滚程”( n c r ) 夺 “数据挖掘是一个扶太整数据霹中萃取有效熊、骥往不兔人所知的、最终能令天瑾 解的信息,并利用它作出麓簧决策的流程”( 1 b m ) 夺 “数据挖掘是一个选择、研究、建模大量数据,为商业利益发现前所来知的模式的 流程”( s a si n s t i t u t e ) 夺数攘羧攘是:决策瓣、 孛缀麓终、羧饕j 接蓊、最遴邻方法、建接算法,( m e h t a ) 夺 一麓渡务经理和 # 专韭入奎人为数据挖掘作了如下定义( 这些定义逶藤予鳃决韭务 间蹶的数据仓库和数据于窀搠技术) :客户盈利能力、客户保留、客户细分、客户倾 向、渠道优化、营销目标、风险管理、防止欺诈、购物倾向分析、需求预测、价格 优化。 尽彗对数攥挖掇熬表述冬器,毽毯稍死乎都毽霁l 爨蔻增强豹诗冀拔零釉蹇级 统诗分褥投零来揭示大鼙数据纛串斡可雳关系。嚣魏,爵戳认建所谡数攒挖掘, 是一个萃取( e x t r a c t i n g ) 和展现( p r e s e n t i n g ) 以往无法探知的新知识的流程, 这些新知识辩乏自数据库并为可付诸行动的决策提供服务,是具有潜在威用价值的 模型或规则。“作者对此深以为然。 数据挖攘髂隽一季孛蠢韭摹娥。翔蓠在过去豹爨次淘金热孛一样,嚣橼建“开 发矿工”。澎乎企盈瑟言,鼗攘挖撵霹疆畜魏予爱凌液务发震豹趋势,撼示已聚 的事实,预测未知的结果,并帮助企、韭分析出完成任务所需的关键因素,以达到 增加收入、降低成本,使企业处于更有利的竞争位鬣的目的。 复曼大学颈士攀经避文 通过数据挖掘获得端户智能的威用研究 数据挖掘的穰源在数据分析,机会就在数据审。翟数据挖瓣发现数攥中的模 型或规则,也只照开始。后面的决策要由人来做。因而,最好的数据挖掘软件处 瑗技术缀节,觚 搿让管瑾者捂精力集中褒如何决策上。辅鲡,聚蹙技寒磁班识嚣 业务表现类似的人员群体或者因繁群体,可以识别这些群体的业务表现燧否超过 谈定韭务器标或囊没有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论