(技术经济及管理专业论文)数字化营销中的数据挖掘.pdf_第1页
(技术经济及管理专业论文)数字化营销中的数据挖掘.pdf_第2页
(技术经济及管理专业论文)数字化营销中的数据挖掘.pdf_第3页
(技术经济及管理专业论文)数字化营销中的数据挖掘.pdf_第4页
(技术经济及管理专业论文)数字化营销中的数据挖掘.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华北电力大学 ( 北京)硕十学位论文摘要 摘要 随着信息技术的发展和计算机的普及,数字化营销孕育而生,并得到了 广泛的应用。它与传统的营销相比多了很多新的特点,本文的第二章中有具 体阐述了。营销数据挖掘作为数字化营销的基础,主要承担了挖掘营销信息 的主要任务。 本文结合数字化营销的特点,建立了营销数据仓库,并建立了多维立方 体,给出了 o l a p操作的数学表述,和数据预处理的方法。接下来进入本文 的核心部分进行营销数据挖掘,这一部分可以分为三个部分。第一部分对营 销数据库中的客户部分利用决策树分类方法进行了客户细分。第二小部分讨 论了销售对营销努力的反应的模型,利用多元线性回归的方法进行了测算。 第三部分用关联规则的方法挖掘了销售商品之间的关联规则。最后一部分应 用三个数学模型对某公司的商品进行了具体的营销挖掘。 关键字:数字化营销,数据挖掘,数据仓库,决策树 华北电力大学 ( 北京)硕士学位论文摘要 ab s t r a c t wi t h t h e d e v e l o p m e n t o f i n f o r m a t i o n t e c h n o l o g y a n d t h e p o p u l a r i z a t i o n o f c o m p u t e r , d i g i t a l m a r k e t i n g h a s b e e n f o r m e d a n d w i d e l y e m p l o y e d . t h e c h a p t e r t w o o f t h i s p a p e r a r g u e s t h e c h a r a c t e r s o f d i g i t a l ma r k e t i n g . d i g i t a l m a r k e t i n g i s b a s e d o n m a r k e t i n g d a t a m i n i n g t h a t i s a p p l i e d t o m i n e t h e u s e f u l m a r k e t i n g i n f o r ma t i o n . t h e p a p e r e s t a b l i s h e s t h e d a t a b a s e o f m a r k e t i n g a n d m u l t i d i m e n s i o n a l d a t a c u b e w i t h t h e c h a r a c t e r o f d i g i t a l m a r k e t i n g . t h e m a t h e x p r e s s i o n o f o l a p o p e r a t i o n a n d t h e m e t h o d s o f d a t a p r e t r e a t m e n t a r e e x p r e s s e d . t h e n t h e c o r e p a r t o f t h i s p a p e r m i n e s t h e m a r k e t i n g d a t a a n d i s m a d e o f t h r e e s u b - p a r t . t h e f i r s t u s e s t h e d e c i s i o n t r e e t o c l a s s t h e c o n s u m e r g r o u p . t h e s e c o n d r e s e a r c h t h e m o d e l o f s a l e r e a c t i o n t o m a r k e t i n g e f f o r t s . t h e t h i r d a p p l i e s t h e a s s o c i a t i o n r u l e t o l o o k f o r t h e a s s o c i a t i o n o f m u c h m e r c h a n d i s e . t h e l a s t p a r t o f t h i s p a p e r e m p l o y s t h e s e m o d e l s e t t l i n g t h e r e a l m a r k e t i n g p r o b l e m o f a c o m p a n y l i u z h e n ( t e c h n o l o g y e c o n o m i c a n d ma n a g e m e n t ) d i r e c t e d b y p r o f . l i x i a n g k e y wo r d s : d i g i t a l ma r k e t i n g , d a t a mi n i n g , d a t a wa r e h o u s e , d e c i s i o n t r e e 华北电力大学( 北京) 硕士学位论文 第一章引言 1 . 1研究的意义 随着世界经济一体化的形成和各国信息高速公路的相继建立,人类迎来了全 新的经济全球化时代与网络时代。 特别是网络技术已成为传统经济之后新兴的 “ 网 络经济”的基础,网络可以快速地传输信息使市场营销效率和效能进一步提高, 而且使营销本身及其环境发生了根本的转变。随着新时代的到来传统的营销方式 受到了冲击,对营销提出了新的要求和新的标准,同时它也给市场营销带来了变 革与发展契机。传统的市场营销积极利用现代计算机信息与网络技术等手段,向 数字化营销转变,实现营销方式的脱胎换骨。但同时 “ 信息爆炸”现象也随之在 市场营销中出现。大量的销售、客户等信息给企业带来了一些问题:第一是信息 过量,难以消化;第二是各种销售信息真假难以辨识;第三是面临这些信息如何 获得企业需要的信息,同时利用这些数据进行营销决策,第四是营销信息安全难 以保证;第五是营销信息形式不一致,难以统一处理。面对这些问题,数据挖掘 技术孕育而生, 并显示出强大的生命力。 在一次高级技术调查中, g a r t n e r g r o u p 将数据挖掘和人工智能列为 “ 未来三到五年内将对工业产生甚远影响的五大关键 技术”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大 新兴技术前两位。根据 g a r t n e r 的h p c 研究表明, “ 随着数据捕获、传输和存储 技术的快速发展, 大型系统用户将更多地需要采用新技术来挖掘市场以外地价值, 采用更为广阔地并行处理系统来创建地商业增长点。” 1 . 2国内外研究现状 数据库中发现知识 ( k d d , k n o w l e d g e d i s c o v e r y i n d a t a b a s e ) 一词首次出 现在 1 9 8 9 年8 月举行的第 1 1 届国际联合人工智能学术会议上。迄今为止,由美 国人工智能协会主办的k d d国际研讨会已经召开了7 次,规模由原来的专题讨论 会发展到国际学术大会, 人数由二三十人到七八百人, 论文收录比例从2 x 1 到6 x 1 , 研究重点也逐渐从发现方法转向系统应用, 并且注重多种发现策略和技术的集成, 以及多种学科之间的相互渗透。其他内容的专题会议也把数据挖掘和知识发现列 为议题之一,成为当前科学界的一大热点。数据库、人工智能、信息处理、知识 工程等领域的国际学术刊物也纷纷开辟了k d d 专题或专刊。 工 e e e 的k n o w l e d g e a n d d a t a e n g i n e e r i n g 会刊领先在 1 9 9 3 年出版了k d d 技术专刊,所发表的5 篇论文 代表了当时k d d 研究的最新成果和动态。 不仅如此, 在工 n 七 e r n e t 上还有不少k d d 电子出版物,其中以半月刊k n o w l e d g e d i s c o v e r y n u g g e t s 最为权威。此外,国 外很多计算机公司非常重视数据挖掘的开发应用,i b m和微软都成立了相应的研 究中心,一些公司的相关软件已研发出来并在大型银行、保险公司、电信公司和 华北电力大学( 北京) 硕士学位论文 销售业中广泛使用。 与国外相比,国内对数据挖掘的研究较晚。国内从事数据挖掘研究的人员主 要在大学,也有部分在研究所或公司。所涉及的研究领域很多,一般集中于学习 算法的研究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。目 前进行 的大多数研究项目是由政府资助进行的,如国家自 然科学基金、8 6 3计划、 “ 九 五”计划等。目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理 论及其应用研究,这些单位包括清华大学、中科院计算机技术研究所、空军第三 研究所、海军装备论证中心等,其中北京系统工程研究所对模糊方法在知识发现 中的应用进行了较深入的研究,北京大学开展对数据立方体代数的研究,南京大 学、四川联合大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现 以及w e b 数据挖掘。 1 . 3本文解决的问题和主要结构 本文是根据数字化营销的特点在营销数据库的基础上进行数据挖掘工作,文 章主要分三个部分。第一部分是论文的开篇主要研究数字化营销与传统营销相比 有哪些新特点和新功能。数据挖掘技术作为数字化营销的基石,是本文重点讨论 的问题,在这一部分就给出了数据挖掘的过程图及其在数字化营销中数据挖掘的 任务。数据挖掘是以数据仓库技术为基础,因此数据挖掘的第一步应该是建立数 据仓库,本文在第二部分结合数字化营销的特点,建立了营销数据仓库,并建立 了多维立方体, 给出了 o l a p 操作的数学表述。 这一部分还给出了数据预处理的方 法。接下来进入本文的核心部分即第三部分进行营销数据挖掘,这一部分又可以 分为三个小部分。第一小部分利用决策树分类方法对营销数据库中的客户部分进 行了细分,并进一步利用模糊数学的方法对决策树分类模型进行了改进。第二小 部分讨论了销售对营销努力的反应模型。第三小部分用关联规则的方法挖掘了销 售商品之间的关联规则。在第四部分中,利用第三部分的挖掘模型,针对某公司 的某种商品进行了具体的挖掘,最后给出了挖掘出具体的营销信息。 第二章 华北电力大学( 北京) 硕士学位论文 数字化营销及其数据挖掘的任务 2 . 1 战略的数字化营销模式 数字化营销 ( d i g i t a l - m a r k e t i n g ) 是指以计算机技术为基础, 通过现代电子 手段和通信网络技术,有效地调动企业资源开展市场营销活动,以实现企业产品 和服务有效销售的一系列的企业活动过程。数字化营销的实质就是通过计算机网 络信息传输等数字化手段来进行营销活动,它着眼于物流、资金流和信息流的有 效协调与统一,从而达到让顾客满意和使企业获利的目的。也可以说,数字化营 销首先落在 “ 营销”二字上,其本质仍然是营销的本质,数字化只是一种手段。 数字化营销是以现代科学技术发展为基础,以计算机信息网络技术为核心,从而 使传统市场营销发生根本的变革,企业市场营销方式也将随之发生根本性变革。 2 . 1 . 1 数字化营销的产生与发展 数字化营销作为一种全新的理念与方法可以追溯到 2 0 世纪8 0 年代中期。可 以这么说,数字化营销的发展是与经济全球化和 i n t e r n e t 的发展密不可分达的。 经济全球化使得企业面对的市场环境由区域性转向全球性,商品贸易活动的全球 化,市场信息收集市场与传递的全球化,资金流动的全球化与自由化等等,而这 一切仅仅依靠传统的营销方式与手段显然已不可能。因此,经济全球化对企业市 场营销活动的影响决定了企业必须适应市场环境变化。 而此时 i n t e r n e t 的发展为 这种需求提供了现实的可能,企业可以 充分利用现代计算机信息与网络技术等手 段,大力推进数字化营销方式,借此提高企业市场营销管理水平和工作效率。正 是由于 i n t e r n e t 的迅速发展, 随着世界经济一体化速度的加快和各国信息高速公 路的相继建设,人类迎来了全新的数字化时代与经济全球化时代。特别是 i n t e r n e t的出现及广泛应用,对传统市场营销客观上提出了新的要求和新的标 准,同时它也给市场营销带来了变革与发展的契机。传统的市场营销积极利用现 代计算机信息与网络技术等手段, 向数字化营销转变, 实现营销方式的脱胎换骨。 传统市场营销方式正在被现代市场营销方式取代,基于网络的数字化营销正在逐 渐成为市场营销的主要手段,从环境、界面、手段到决策等诸多方面都面临着变 革,以i n t e r n e t 为核心支撑的数字化营销必将成为未来市场营销的主流。 展望未来,数字化营销作为一种现代营销方式与手段是实现经济全球化的基 础;经济全球化则是数字化营销发展的加速因素。经济全球化迫切需要数字化营 销,而数字化营销将在经济全球化过程中扮演一个重要的角色。对于每一个企业 而言,其市场营销方式必将由传统营销向数字化营销方式转变。 华北电力大学 ( 北京) 硕士学位论文 2 . 1 . 2 战略的数字化营销模式 早在 1 9 9 6 年, 美国毕晓普信息集团公司就提出了一个通用的“ 战略的数字化 营销模式”,它主要包括以下五个步骤: 第一步,建立营销数据库。使用数字和传统的营销工具来收集有关己有营销 的信息并将这些数据输入到一个关系数据库中,围绕数据库建立的环境叫做数字 领域。这个领域是一个假设的数字环境,在其中,企业和客户集成在一起。营销 人员的目的就是利用独特的促销方式, 把客户和潜在的客户吸引到数字领域里来。 第二步,细分客户。把客户数据库按照共同特征细分。 第三步,开发独特产品和服务。开发新的和有创意的数字产品和服务,提供 给每个细分客户。 第四步,开发独特的数字促销方法。要为每种独特的产品和服务设计一种独 有的数字促销方法。 为了吸引人们自 愿地进入数字领域, 要使数字促销方法有用、 有趣一些。 第五步,使用数字和在线手段、进行沟通。客户和潜在客户会使用数字和在 线技术访问 数字促 销活动并且为 数据 库留 下 有关自 己 的 信息, 一旦 数据库中 存有 了客户和潜在的信息,要经常使用数字手段和他们沟通。 第六步, 扩展数字领域。 当营销数据库内容增加时, 数字领域同时也有扩展, 要开发更多的新产品和服务及创新的数字促销方法,采用新的数字手段和能力, 用来满足客户的新需要。 2 . 2 与传统营销相比数字化营销的特点 从上面给出的战略的数字化营销模式, 可以发现数字化营销与传统营销相比, 具有以下几个方面的特点。 2 . 2 . 1数字化营销是以快速发展的数字技术为基础 这一点是数字化营销与传统营销的本质区别。企业在营销领域里使用数字化 技术使得产品和服务的设计、生产、定价、分销以及促销的方式正在发生巨大的 变化。利用数字调查可以收集到更多的市场调研数据;在因特网上做广告可以让 更多的顾客看见;使用电子邮件使你和客户之间的通信更快更容易;通过数据库 跟踪客户的偏爱和购买方式更好地为他们服务等等。数字化技术可以给企业带来 很多好处,然而企业之所以采用这些数字技术最大的好处是可以节省开支和产生 更大的效率。 但并不意味着应该放弃那些经过实际检验、 靠得住的传统营销方法。 值得一提的是,数字技术发展之快,特别是计算机技术十八个月更新换代一次, 这样使企业的营销手段更加先进快捷。不过这也同样带来了费用的增加,可能销 售人员刚刚掌握了一种数字技术,新技术又诞生了,这也会给企业和员工带来很 a 华北电力大学( 北京) 硕士学位论文 多压力和麻烦。因此数字化营销给企业带来了很多便捷的同时,也给企业提出了 很多挑战。 2 . 2 . 2数字化营销面对的是完全开放的市场环境 工 n t e r n e t 的出现与广泛应用已将企业营销引导至一个全新的信息经济环境。 信息经济传统经济的区别如表 2 -1 所示。 在这种新的经济环境下, 市场营销活动 所必须的物理距离,将在很大程度上被网络上的电子空间距离所取代,网络将世 界变成一个庞大的村落,营销活动与空间距离的关系变得不那么重要了。然而, 网络在打破空间限制的同时,也引来了全球化的竞争,整个世界在成为你的客户 和朋友的同时, 也成为了你的竞争对手, 机遇与挑战并存。由于 工 n t e r n e t网络的 开放性和公众参与性,数字化营销所面对的市场环境是完全开放的,并因其丰富 多彩的内容和灵活、便利的商业信息交流,吸引着越来越多的网络用户。另外由 于网络的自由开放性,网络时代的市场竞争是透明的,每个企业都能掌握竞争对 手的产品信息与营销作为。因此胜负的关键在于如何适时获取、分析、运用这些 信息,来开展优势的竞争策略。此外,数字化营销联盟也是网络时代的主要竟争 形态, 竞争从“ 你死我活” 变为“ 合作双赢”, 从 “ 公司竞争” 变为“ 联盟竞争”。 因为在全新的经济 表格 2 - 1 信息时代经济 完全自由 一对一关系 运动 价值转移 实时运行 组合产品、市场和渠道 改变或适应未来 鼓励试验 选择性经营 网络化的非正式联盟 允许失败 风险和报酬有直接的联系 信息时代经济与传统经济的对比 一丁 传统 经 济 稳定而明确的经营权 规模经济 停滞,依赖于地域和资金 市场定位 长期规划 保护产品、市场和渠道 预测未来 鼓励重复 详尽的行动计划 结构化的正式联盟 拒绝失败 报酬和产出间联系弱 环境中,许多新商机都需要将多种复杂的系统结合在一起,而不是围绕一件独立 的产品进行技术革新。由于必须将全然相异的技术有机地结合在一起,又要为管 理建立全面的标准程序,与配套产品的供应者联盟,吸收潜在的对手加盟,这种 种需要就意味着未来的竞争不仅仅是单个公司间的较量,同时也是那些相互既竞 争又联合的战略联盟之间的较量。 因此如何运用网络来组成数字化营销合作联盟, 并以联盟所形成的资源规模创造竞争优势,将是未来企业经营的重要手段之一。 华北电力大学( 北京) 硕士学位论文 2 . 2 . 3数字化营销是并行的,不是线性的 传统的营销本质上来说基本是线性的,每个过程都是一步一步地来做,具体 信息反馈 图2 -1传统营销过程 过程如图2 - 1 所示。在传统营销中,各阶段按逻辑顺序实现。每件事都发生得很 慢, 反馈需要几个月, 甚至几年。 每做一个决定都需要收集一个阶段得有关信息。 如果发生一件错误,修正错误需要逐步修改,成功往往需要几个月的时间,但这 样浪费了时间和潜在得赚钱机会。相反,数字营销在本质上是并行的。在这种并 行的状态下,所有的营销步骤同时发生。客户可以实际参与到营销的整个过程, 从商家提供得一大堆部件中虚拟组装出自己需要的产品,并把销售体验及时反应 给商家。销售报告源源不断地在线显现出来,而且可以及时更新,随时获取。同 时数字化营销还可以减少中间商环节直接让利于顾客。网络销售渠道结构具有明 显的宽口径、少环节的优点,它将成为未来企业销售渠道的一个重要补充,甚至 于可能成为一些企业的主流渠道。中间商的角色将从实体经营、实物经营转化为 虚拟经营和信息经营,成为网介者 ( c y b e r m e d i a r y ),并提供创新后的新的中介 服务,如搜索服务、虚拟商店、专题讨论区等等。数字化营销的具体过程如图 2 一2所示。 华北电力大学( 北京) 硕士学位论文 知识管理和数据库 图2 -2数字化营销过程 2 . 2 . 4数字化营销时代的营销战略发生新的转变 市场营销管理从 4 p( 产品、 价格、 渠道、 促销) 发展到4 c( 顾客需求、 成本、 方便、沟通), 数字化营销的特点恰巧符合 4 c的要求。同时企业市场营销战略将 向 4 d战略转变,即数字化沟通 ( d i g i t a l - c o m m u n i c a t i o n )、数字化调研 ( d i g i t a l - r e s e a r c h )、数字化促销 ( d i g i t a l - p r o m o t i o n ) 、数字化贸易 ( d i g i t a l - t r a d e )四个方面,4 d战略则是以 信息沟通的数字化为基础,以市场 信息的有效获取为主要内容, 以数字化促销作为传统营销手段的重要补充和发展, 以贸易的网络化为最高阶段。 2 . 2 . 5数字化营销宣传活动通常不是强制性的 宣传活动在市场营销中有着非常重要的作用,但传统的宣传一般采用大面积 传播的方式,具有强制收视的效果,属于传统的 “ 强势营销”。数字化宣传则不 具有这种强制力,它的优势在于互动、跨越时间和多媒体,使广告由 “ 印象型” 转化为 “ 信息型”,消费者做出购买决策的机制发生了变化,数字化营销中的宣 传主要是基于信息的理性说服机制, 而传统宣传则是基于印象的联想型劝诱机制。 如果客户不想被数字媒体打扰,就可以很容易地避免。数字媒体不像突然出现在 电视屏幕上的广告,或者是在路上驾车时忽然吸引你注意力的广告牌。数字营销 媒体必须有趣,必须把数字信息处理成很有趣的形式,让客户们自觉自愿地一而 再、再而三地回来看。由于数字营销不是侵入性的,它可以被客户躲开,相对于 强行推销在传统营销环境里的作用而言,数字营销在数字营销环境里就没有那么 明显的作用。为了让人们进入数字领域内,必须为他们提供一些诱惑,或者一些 有创意的项目来让他们自觉自愿地进入数字领域。 2 . 2 . 6数字化营销强调以客户为中心,推行一对一营销。 市场是企业发展的龙头,客户是企业盈利的根源。 “ 以客户为中心”的表述 华北电力大学 北京) 硕士学位论文 长期以来一直频繁地出现在企业的管理活动中,但在数字化时代,企业真正实现 “ 以客户为中心”战略的条件才基本齐备。今天的企业之所以要更加强调 “ 以客 户为中心”,是因为客户为本理念顺应了新经济发展的要求,使传统企业有可能 以更低的成本和更先进的管理参与数字时代的竞争。数字化营销所具备的让传统 企业运作更有效率的机能,其主要的原因概括为两方面:中间环节的精简和一对 一营销 ( o n e - o n e m a r k e t i n g ) 的跨越性实现。中间环节的精简已经在第三个特点 中 提及 这粤 不再重复 讲述 在传统营销中,客户渴望得到进一步的咨询和服务通常要经过复杂的过程, 常常无法在第一时间达成交易。这种 “ 一对一”的营销理念如果说在传统商务活 动中遭遇规模化生产与个性化的矛盾,在执行上充满障碍的话,那么今天在数字 化营销中却显得再适合不过了。 唐 佩柏和马莎 罗杰斯早在 1 9 9 3 年就提出了一 对一营销并列了一张大众化营销与一对一营销之间的对比表,如表2 -2 所示。 表格 2 - 2 大众化营销 顾客平均化 顾客匿名 标准产品 大众化生产 大众化分销 大众化广告 大众化促销 单向信息 规模经济 市场份额 全部顾客 顾客吸引力 大众营销与一对一营销的对比 js r f3 j1rf7on ,ieflyf 从上表我们可以看出一对一营销是以顾客份额为中心,通过与每个客户的互 动对话,与客户逐一建立持久、长远的 “ 双赢”关系,为客户提供定制化的产品 的营销活动。这种营销模式不但可以将数字化营销固有的优势发挥到极至,更可 以与用户建立起历久弥坚的客户关系。 2 . 3数据挖掘是数字化营销成功的基础 从数字化营销的角度来看,营销数据挖掘是一种决策支持过程。营销数据挖 掘是指从大型营销数据库的数据中提取人们感兴趣的营销知识,而这些知识是隐 含的、 理的、 行决策 事先未知的、潜在的有用信息。它从大量数据库中发现并提取隐藏内的合 有效的消息,帮助营销人员寻找规律,发现被忽略的要素,预测趋势,进 华北电力大学( 北京) 硕士学位论文 2 . 3 . 1数字化营销中数据挖掘系统结构 营销数据挖掘系统结构,如图2 -3 所示。图中营销数据仓库是一组营销数据 图2 -3数字化营销数据挖掘系统结构 信息库。可以在数据上进行数据清理、集成和过滤。数据库或数据仓库服务器是 根据用户的数据挖掘请求,数据库或数据仓库服务器负责提取相关数据。知识库 是与营销领域相关的知识,用于指导数据挖掘。数据挖掘引擎是数据挖掘系统基 本的部分,根据销售人员的需要,其中包括各种数据挖掘模型,用于挖掘他们所 关心的信息。图形用户界面是一个人机交流界面,便于营销人员操作。 2 . 3 . 2利用数字化手段收集营销数据 数据挖掘的第一步就是收集营销数据。在传统市场营销中,获得数据需要消 耗大量人力和物力进行市场调研。而在数字化营销中利用数字化技术来收集数据 不但可以节约人力和物力而且调研的覆盖面很广,这一点也是数字化营销中的优 势之一。随着科技的发展数字化手段越来越得到人们广泛的应用,以下是几种比 较常用的数字化手段。 2 . 3 . 2 . 1电话 这种数字化手段几乎人人都在用,尤其是随着手机功能的强大, 利用电话来收集数据。例如把语音邮件系统直接连接到客户数据库上 集到客户数据。打电话的客户按了某一数进入某项竞赛。为了参赛, 电话键回答 5 个问题,并且说出自己的名字、地址、电话号码等信息 信息可以被直接送到客户数据库。 9 有很多公司 ,就可以收 他必须使用 。同时这些 华北电力大学( 北京) 硕士学位论文 2 . 3 . 2 , 2网络 网络是一个非常强大的数据收集器。现在,网络调研广泛应用于各个企业。 在网络企业可以利用电子邮件与每个客户进行对话,可以利用电子表格方式对每 个访问者进行各种内容的调研,这个访问者可能是企业用户,也可能不是。企业 还可以利用搜索引擎来搜索各种信息。同时还可以登陆各种官方、行业性等网站 购买企业想要得到的商业数据。 2 . 3 . 2 . 3磁性条码 就像许多信用卡和会员卡一样,这些卡在背面有一条磁性条码。你用这种卡 划过一种设备,该设备就会读出磁性条码中关于卡主的信息。这些数据被连接到 一台记录个人账号的计算机上。那么这个客户的名字和他所进行的交易自动记录 进数据库中。 2 . 3 . 2 . 4条形码 这种技术现在得到了广泛的应用,特别是在零售的超级市场。用条形码扫描 器来读卡,可以把数据传输到企业的数据库中,从而来跟踪购买情况。这种技术 起源于4 0 年代,研究于6 0 年代,应用于7 0 年代,普及于8 0 年代。9 0 年代的国 际流通领域将条形码誉为商品进入国际计算机市场的“ 身份证” ,使全世界对它刮 目相看。 印刷在商品外包装上的条码,像一条条经济信息纽带将世界各地的生 产制造商、出口商、批发商、零售商和顾客有机地联系在一起,各种商品的相关 信息犹如投入了一个无形的永不停息的自动导向传送机构,活跃在世界商品流通 领域。 除了这四种常用的数字化手段外,还有传真、智能卡、传呼机等多种数字手 段。随着科技的发展,无线个人数字助理、交互电视、视频邮件等先进的数字化 手段也将走入我们的工作和生活。但是不论使用哪种手段收集数据,对于以利润 为中心的营销活动来说,节约成本应该首先考虑到。企业应该结合自己的实际情 况,来选择适合自己的数字化手段,收集各种营销数据。 2 . 3 . 3数字化营销中数据挖掘的任务 简单来说,数字化营销中数据挖掘的任务就是挖掘有用的营销信息。通过数 字化手段收集的数据信息被组合,应用计算机、并行处理、模型化算法和其他信 息处理技术手段,得到商家所需要的营销信息用来决策的过程。本文从零售业的 角度出发在营销数据库的基础上,利用数学模型对营销数据进行挖掘。首先利用 决策树分类方法对营销数据库中的客户部分进行了分类,并进一步运用模糊数学 的方法对决策树分类模型进行了改进。 接下来讨论了销售对营销努力的反应模型。 1 0 华北电力大学( 北京) 硕士学位论文 然后,用关联规则的方法挖掘了销售商品之间的关联规则。最后给出了一个应用 示例,并提出了数字化营销的方案。 华北电力大学( 北京) 硕士学位论文 第三章营销数据仓库的设计 从上面的分析可以看出,数字化营销中的数据挖掘以营销数据仓库为基础, 是在这个大型数据库中进行挖掘,这一章的重点是建立营销数据库。数据仓库就 是面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的 决策制定过程。数据仓库中的数据面向主题与传统的数据库面向应用相对应。主 题是一个在较高层次将数据归类的标准,每一个主题对应一个宏观的分析领域。 因此营销数据仓库的主题就是营销,那么营销数据仓库就是与营销主题相关的数 据集合。数据仓库的集成性是指在数据进入数据仓库之前,必须进行数据加工和 集成。数据仓库的稳定性是指数据仓库反映的是历史数据的内容,而不是日 常事 务处理产生的数据,数据经加工和集成进入数据仓库后是很少修改或根本不修改 的;数据仓库是不同时间的数据集合,它要求数据仓库中的数据保存时限能满足 进行决策分析的需要,而且数据仓库中的数据都要标明该数据的历史时期。 3 . 1 营销数据仓库的建模 3 . 1 . 1星型模型 星型模型是一种由一点向外辐射的建模范例,中间有一单一对象沿半径向外 连接到多个对象。一个简单的星型模型由一个事实表和若干个维表组成。复杂的 星型模型包含数百个事实表和维表。事实表包含基本的营销措施,可以由成千上 万行组成。维表包含可用于s q l 查找标准的属性,一般比较小。这种模型图很像 星星爆炸,维表围绕中心显示在射线上。星型模型结构示意图如图3 -1 所示。 图3 -1星型模型结构图 3 , 1 . 2雪花模型 雪花模型示对星型模型的扩展,每一个点都沿半径向外连接到多个点。雪花 模型对星型的维表进一步标准化,它的优点是通过最大限度的减少数据存储量以 及把较小的标准化表 ( 而不是大的非标准化表)联合在一起改善查询性能。由于 华北电力大学 ( 北京) 硕士学位论文 采取了标准化及维的较低的粒度,雪花模型增加了应用程序的灵活性。但雪花模 图3 - 2雪花模型结构图 型也增加了用户必须处理的表的数量,增加了某些查询的复杂性,会影响查询的 速度。雪花模型结构图如图3 -2 所示。 3 . 1 . 3事实星座 复杂的应用可能需要多个事实表共享维表。这种模型可以看作星型模型集 因此称为星系模式,或事实星座,其结构图如图3 -3 所示。 图3 -3事实星座模型结构图 3 . 1 . 4营销数据仓库的事实星座 利用雪花模型的架构建模得到营销数据仓库的维表,它们是:产品维 ( d i 犯p r o d u c t ),产品分类维 ( d i m - c l a s s - p r o d u c t ),店铺维 ( d i 处s t o r e ), 时itl 维 ( d i m ji m e ),地点维 ( d 工 m - l o c a t i o n ), 仓库维 ( d i m _ w a r e h o u s e ),账 目 维 ( d i m _ a c c o u n t ), 分类维 d i m _ c l a s s ), 促销维 ( d i m _ p r o m o t i o n ), 受教 育维 ( d 工 m - e d u c a t i o n ), 职业维 ( d i m _ o c c u p a t i o n ) 等维表。 从营销活动中可以 发现营销数据仓库中主要有四个事实表,它们是: 销售表 ( f a c t _ s a l e s ), 存货 表 ( f a c t _ s t o c k ) , 销售费用表 ( f a c t _ e x p e n s e s ) , 客户表 ( f a c t _ c u s t o m e r s ) 。 营销数据仓库事实星座的架构如图3 -4 所示, 在表3 -1 到表 3 -4中给出了四个 事实表中,每一个维度的解释。 华北电力大学( 北京) 硕十学位论文 di m p r oduct cl as s f act s al e s di m_ p r o mo t i o n p r o d u c t es c l a s s _ i d p r o d u c t c l a s s n o p r o d u c 口d p r o mo t i o n jd s t o re es s a l e s q u a n ti t y - s al e s t i me i d 一 s t o r e _ i d s t o r e c o s t p r o mo t i o n i d pr o mo t i on n o p r o mo t i o n n a me p r o d u c t s u b g r o u p di m product p r o d u c t i d p r o d u c t _ n o p r o d u c t 一l a s s - i d p r o d u c t es n a me b r a n d 一 n a m e d e s c r i p t i o n me d i a _ ty p e c o s t s t a rt d a t e e n d d a t e f act s tock di m s t or e s t o r e id s t o r e n o na me p r o d u c t i d s t o rejd t i me i d wa r e h o u s e _ i d un i t s o r d e r e d u n i t s _ s h i p p e d wa r e h o u s e _ s ale s wa reh o u s e 一 c o s t s 仍化 i n v o i c e t i me i d ye a r mo n t h d a y d a y _ o f _ m o n t h d a y _ o 臼e a r mo n t h _ o 几 y e a r q u a r t e r l o c a t i o n i d ma n a g e r f ac t es e xp e ns e s di m- a c c ou nt p h o n e d e s c r i p t i o n fa x s t o r e i d c a t e g o ry di m l oc at i o n a mo u n t i d a c c o u n t i d ac c o u n t es n o a c c o u n t es p a r e n t t y p e d e s c r i p t i o n l o c a t i o n 一d c o u n t ry p r o v i n c e c i ty s t r e e t z i p c o d e f a c t es c us t o me r s di m educati on c u s t o me r ee ieed c u s t o me r n o a c c o u n t es n u m n am e e d u c a t i o n _ i d e d u c a t i o n n a me d e s c r i p t i o n d i m_ wa r e h o u s e wa r e h o u s e id wa reh o u s e _ n o na me ow n e r - n a me l o c a t i o n _ i d p h o n e f习 , s ex , l o c a t i o n id e d u c a t i o n - i d e x p e n s e a g e p h o n e y e a r l y es i n c o m e o c c u p a t i o n _ id ma r r i a g e di m- occ up a t i on o c c 即a ti o n _ id o c c u p t i o n na m e s t a b i l i t y d e s c r i p t i o n 图3 - 4营销数据仓库事实星座模型图 1 4 华北电力大学( 北京) 硕士学位论文 表格 3 一1销鲁事实表的维度 维度名称维度描述 p r o d u c t i d 产品 产品 标识、产品编号、 产品名称、品 牌名称、分类、 描述 p r o m o t i o n i d 促销 促销标识、促销编号、促销名称、媒体类别 开始时间、结束时间、成本 s t o r e s a l e s 销售额 具体数量 q u a n t i t y - s a l e s 销售量 具体数量 ti m e i d 时间 时间标识、年、月、日、 年月、日 月、年日 、季节 s t o r e i d 店铺 店铺标识、店铺编号、名称、类型、地址标识 负责人、电话、传真、描述 s t o r e c o s t 成本 具体数量 表格 3 一2仓储事实表的维度 维度名称维度描述 p r o d u c t i d 产品 产品 标识、产品 编号、产品名称、品牌名称、分类、 描述 s t o r e i d 订货当铺 店铺标识、店铺编号、名称、 类型、地址标识 负责人、电话、传真、描述 ti m e i d 时间 时间标识、年、月、日、 年月、日 月、年日、 季节 w a r e h o u s e i d 仓库 仓库标识、仓库编号、名称、 所有者、地址标识、电话、传真 u n i t s o r d e r e d 订货量 具体数量 u n i t s _ s h i p p e d 运输量 具体数量 w a r e h o u s e s a l e s 仓库出货额 具体数量 w a r e h o u s e c o s t 仓库成本 具体数量 s t o r e i n v o i c e 订货店铺发票 具体发票形式 华北电力大学( 北京) 硕士学位论文 表格 3 一3营销费用事实表的维度 维度名称维度描述 s t o r e i d 店铺 店铺标识、店铺编号、名称、类型、地址标识 负责人、电话、传真、描述 ti m e i d 时间 时间标识、年、月、日、年月、日月、年日、季节 c a t e g o r y 类别 费用类别,根据会计科目 而定 a m o u n t i d 店铺账号 账号标识、账号编号、母账号、类别、描述 表格 3 一4客户事实表的维度 维度名称维度描述 c u s t o m e r i d 客户标识 唯一标识 c u s t o m e r n o 客户编号 具体编号 a c c o u n t n u m 客户账号 具体账号 n a m e 姓名 具体姓名 s exnt # u 男、女 l o c a t i o n i d 地址 地址标识、国家、省、市、地区街道、邮编 e d u c a t i o n - i d 教育程度 教育标识、教育程度名称、描述 e x p e n s e 消费额 具体数量 b i r t h d a y 生 日 年月日 p h on ef$ itu 具体数据 y e a r l y - i n c o m e 年收入 具体数量 o c c u p a t i o 几i d 职业 职业标识、职业名称、职业稳定性、描述 m a r r i a g e 婚姻状况 未婚、己婚有独子女、已 婚无子女、已婚有多子女 华北电力大学 ( 北京) 硕士学位论文 3 . 2营销多维数据模型的 o l a p 操作 o l a p ( o n l i n e a n a l y t i c a l p r o c e s s i n g ,联机分析处理)是基于数据仓库的 信息分析处理过程。 o l a p 工具是整个数据仓库解决方案中不可缺少的一部分。 在 多维数据模型中,数据组织成多维,每维包含由概念分层定义的多个抽象层。这 种组织为用户从不同角度观察数据提供灵活性。 o l a p 为交互数据分析提供了友好 的环境。 使用。 l a p 工具, 人们可以分析和深入研究数据, 发现趋势, 看到异常情 况, 并得到重要细节以更好的理解营销活动的变化。 o l a p 工具将数据以多维立方 体的形式存放。 沿着多维立方体的轴线,用户可以对数据进行上卷、下钻、切片、 旋转等操作。 3 . 2 . 1多维立方体的定义 数据仓库中可以使用两种原语定义:一种是立方体定义,一种是维定义。立 方体定义语句具体如下语法形式: d e f i n e c u b e : 维定义语句具有如下语法形式: d e f i n e d i m e n s i o n a s ( ) 根据上面销售事实表和相关维表来定义多维营销数据立方体, 其它事实表和 维表用相同方法处理。 d e f i n e c u b e s a l e s p r o d u c t _ i d , p r o m o t i o n _ i d , t i m e _ i d , s t o r e _ i d , : s t o r e _ s a l e s = s u m ( s t o r e _ s a l e s ) ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论