基于某旅游公司的客户信息挖掘分析_第1页
基于某旅游公司的客户信息挖掘分析_第2页
基于某旅游公司的客户信息挖掘分析_第3页
基于某旅游公司的客户信息挖掘分析_第4页
基于某旅游公司的客户信息挖掘分析_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内 容 摘 要本文的研究利用数据挖掘技术与 CRM 的有机结合, 通过客户关系价值分类、有针对性的市场营销、高质量的游程管理和及时的游客跟踪服务,能够提供给游客更加个性化、人性化和标准化的旅游产品,从而提高游客对旅行社的满意度和忠诚度,进而实现客户价值和公司利益双赢的目的。因此,把在温州某民营旅行公司实习所接触到的客户旅游的信息作为这次论文研究的对象,尝试通过所得客户旅游信息数据,采用数据挖掘方法对温州客户旅游性质进行分类和关联规则分析,在了解客户的特征之后,便可以采取一对一的营销服务,使旅行社更加有效的进行客户关系管理,提高公司盈利。关键词:数据挖掘、客户关系管理、客户营销、关联分析、旅行社ABSTRACTUtilize the combine organically of the technology of data mining and the CRM, through the Classify of customers relation value, pointed marketing, high-quality visiting distance management and prompt visitors follow-up service, we can offer more individualized, favor and standardized travelling products to visitors, thus improve visitors satisfaction and loyalty to the travel agency.So put the customer travel information of private traveling company in Wenzhou where I studied as research object of this thesis, Try to though the customers travel information data I get, adopting the method of data mining to Classification and related regular analysis the customers travel properties in Wenzhou. After finding out the characteristic of the customers, then we can adopt the marketing service of one-to-one, Enable the more effective that carrying on the customer relationship management of travel agency and improving the profits of the company. KEYWORDS:Data Mining,CRM, Customers Marketing ,Relation Analysis,Travel Agency正文目录第一章 引言 .1第一节 研究的背景与现状 .1第二节 研究的目的与意义 .5第三节 研究的内容 .8第二章 数据挖掘理论和客户营销理论 .9第一节 数据挖掘的产生和发展 .9第二节 数据挖掘的定义和常用技术 .10第三节 客户营销理论 .13第四节 数据挖掘在客户关系管理中的应用 .18第三章 温州某民营旅游公司客户信息分析 .21第一节 线路分析 .21第二节 出行时间及人数分析 .23第三节 旅游目的和特征分类 .23第四节 客户信息的关联分析 .24第四章 对关联分析结果的讨论 .35第五章 结论 .36【参考文献】 .37致 谢 .38第一章 引言第一节 研究的背景与现状一、 研究背景旅游业具有“无烟产业”和“永远的朝阳产业”的美称,它已经和石油业、汽车业并列为世界三大产业。旅游业一般分为国际旅游业和国内旅游业。国内旅游业是为国内旅游者服务的一系列相关的行业,它关系到国内游客、旅行方式、膳宿供应设施和其它各种事物。改革开放以来,我国的旅游业有了非常迅速的发展,但是比较而言,我国国内旅游业发展的广度深度都远远不能适应经济发展和人民生活水平提高的需要。随着市场经济的发展和人民收入水平的进一步提高,人民对旅游消费的需求将进一步上升,国内旅游业在国民经济中的地位和作用越来越重要。 12008 年旅游企业业绩普遍下滑,受挫感要比行业宏观形势更加强烈。中国旅游研究院 11 月份对 564 家旅游企业进行的产业景气调查的结果表明,旅游企业景气指数为 89.3,处于相对不景气区间,绝大多数旅游企业判断 2008 年经营状况与 2007 年相比大致持平或将会下降,只有 30.9%的旅游企业判断 2008年企业经营状况较 2007 年上升。从行业来看,旅行社行业最不景气,景气指数为 54.7;饭店企业次之,景气指数为 100.5;景区企业最为景气,景气指数130.5。从地区来看,东部地区旅游企业景气指数为 101.4,处于微景气区间;中部地区旅游企业景气指数为 92.4,处于微弱不景气区间;西部地区旅游企业景气指数为 38,处于较重不景气区间。 2温州作为华东地区民营经济发展最快最繁荣的地区,从 1995 年到 2008 年这 14 年间,不管是温州国内旅游业还是国际旅游业都保持着迅猛发展的态势。根据浙江省旅游资源普查结果表明,温州有各等级旅游资源单体 3279 个,超过杭州,在浙江省位列第一。这几年,市委、市政府非常重视发展旅游业,把旅游业作为新的经济增长点和第三产业的龙头产业来抓,旅游业取得了长足的发展。旅游业的发展对温州地区的经济增长起到积极的促进作用,并且拉动了相关产业的发展,本文的研究正是在全国旅游业繁荣推进的大背景下,以温州旅游业发展为研究背景,针对自己所实习的温州某民营旅游公司的客户数据对客户的旅游特征和习惯进行分析。1 李亚非. 旅游经济 M. 中国林业出版社, 2001.2 戴斌. 2008 年旅游经济回顾与 2009 年趋势预测J. 旅游研究,2009(1)二、 研究现状(一) 数据挖掘在各方面的应用数据挖掘可以通过挖掘数据仓库中存储的大量数据,从中发现有意义的新的关联模式和趋势的过程。数据挖掘最吸引人的地方是它能建立预测模型而不是回顾型的模型。1. 数据挖掘在企业 CRM 中的应用闫禹在数据挖掘在客户信息管理中的运用中指出:随着我国商品经济的迅猛发展,从大量顾客基础信息中了解顾客行为和购买倾向越来越有重要的商业价值。数据库中的知识发现(简称 KDD)是目前人工智能和数据库相交叉的一个热门研究领域。数据挖掘是 KDD 的一个核心步骤,其内容涉及各种知识模式的提取算法。数据挖掘在商业部门的许多领域得到广泛应用。采用客户信息的简单数据集,每个顾客有客户类别、职业、年龄、收入水平、化妆品消费额度/年、消费国产/进口品牌等属性。运用数据挖掘技术对商业客户信息进行挖掘分析的方法:1. 采用概念描述的方法评价客户信息。2. 使用关联规则发现客户信息数据之间的关系。3. 使用分类与聚类方法对客户归类。2. 数据挖掘在旅游方面的应用在现代旅游业管理中,我们应该能随时随地访问到任何需要的信息,这就要求有一个体系结构来容纳各种格式的内部数据和外部数据。例如经营数据、历史数据、现行数据以及来自 Internet 服务提供商(ISP)的数据。使用数据分析可以进行有目标的市场销售,把最满意的旅游商品和服务送到可获得最大利润的客户手中。基于顾客的年龄、性别、职业、人口统计数据和其他类似因素,对其进行分析,辨别出具体的顾客偏好,组织他们到本旅行社来,这将是有很大潜力的市场。吴春阳等在数据挖掘技术及其在旅游线路规划系统的应用中指出:当前的一些旅游公司在规划旅游线路时,一般采用以下几种方式:一是主题旅游线路设计,比如红色旅游等来安排旅游线路;二是超市型旅游路线设计,顾客可以根据自己需求随意挑选景点,来安排自己的旅游线路;三是应用运筹学方法来寻求最优线路,从而把整个路线关联起来;最后就是市场导向,根据市场的要求来安排路线。但这些方法并没有充分利用信息技术的优势。随着数据库技术的发展,尤其是数据挖掘在各个行业中的广泛应用,为挖掘出合适的旅游线路提供了可能。相关公司可以利用数据挖掘技术提出更为合理、受用户欢迎的旅游线路,从而提高企业的经济效益。李君铁等在基于 WEB 数据挖掘的旅游需求分析与预测中指出:研究发现,使用互联网过程中,大部分的游客不会直接在网上预订,但他们却会通过网络搜索旅游信息,根据网上信息组合行程后再通过旅游中介进行预订。央视调查咨询中心所做的北京中青年网民“互联网网民旅游消费调查”结果显示:21.8%的网民登录过旅游网站,43.2%的网民表示将会登录旅游网站;在已经登录旅游网站的网民中,3.8%的网民已经进行过与旅游相关的网上预订,54.2%的网民表示将会尝试网上预订。可见互联网在旅游信息获取中的地位逐步提高。Web 数据挖掘和传统的市场调研及网络调研相比较,优势十分明显。目前,Internet 是一个巨大的、分布广泛的全球性信息服务中心,它包括新闻、广告、消费信息等各种各样的旅游信息。不仅如此,Web 还包含着丰富的结构化数据,如动态变化的超链接信息以及对于 Web 页面的访问和使用的信息等,这为 Web数据挖掘提供了丰富的资源。潜在客源对所感兴趣的旅游信息点击的记录可以作为旅游业对潜在客源的消费特性进行分析的重要数据依据,这些记录可以显示何地的潜在客源(who)对何目的地(where)在何时(when)进行点击。张晗等在基于数据立方体的多维关联规则在旅游服务中的应用中指出:利用 OLAP(联机分析处理)技术实现对多维数据的分析,形成多维数据集,这些数据集可以作为多维关联规则算法的源数据。通过对多维数据集进行高效、多视角查看和维间关联分析,挖掘出适合游客的多维一体化旅游资源信息,例如景区景点、酒店、旅行社以及个性化的旅游线路等。根据用户给定的挖掘任务,从数据仓库中生成数据立方体,在此数据立方体上进行关联规则挖掘,具有一定的针对性。(二) 关联分析在旅游方面的应用1. 关联分析在旅行社 CRM 中的应用徐会敏在关联规则在旅行社 CRM 中的应用中研究出:用关联规则挖掘将对游客消费项目(即旅行产品)的特征进行分析,判断出游客的行为方式和消费习惯,进而将游客分类,分析不同类型的游客的价值,确定旅行社的目标市场,制定出详细的计划。在旅行产品的众特征中,依据旅行社的自身经营特色,这里只抽取其最常见/重要的五种来刻画,并标记每种为(1)体验性(2)休闲化(3)生活化(4)娱乐化(5)生态化。进而得出该类型游客的消费项目的特征常是体验性、休闲化同时是生活化或者生态化的,在了解该类型游客的需求特点后,旅行社可对推出针对性强求的一对一的服务,为其设计相符的、个性化的旅游服务,才能让其深刻体会到旅行社让渡的顾客价值,最终实现旅行社的价值。2. 关联分析在旅游突发事件预测中的应用唐亮等在关联规则挖掘在旅游突发事件预测中的研究中指出:为了挖掘预测规则,需要向系统输入以前发生过的突发事件的相关信息,包括事件发生的前导因素和结果因素等。对其进行关联规则的挖掘,可以找出事件发生的规律,例如某些前导因素会以多大概率导致某些后果的发生。根据得到的这些规则和当前发生的行业事件,可以推测出将来有可能发生的行业事件及其造成的后果。针对记录旅游事件信息的数据库,尤其是记录突发事件的数据库,每一条事件的记录包含着该事件发生的时间、地点、当时的客流量等事件发生的主客观因素信息,以及事件造成的财产损失、事件造成的人员伤亡等后果信息。上述各种前因后果信息首先通过聚类、离散化后,作为分析系统的输入,可以得到各种事件发生的规律。.这种利用关联规则挖掘分析预测突发事件的方法,建立在对历史数据中所蕴含的规律信息的挖掘的基础上,根据现有的数据库中的数据,通过数学推导得到事件发生的规律及其发生的概率,从而对突发事件进行预测。3. 关联分析在旅游行程规划中的应用王玉珍在关联规则挖掘方法在旅游行程规划中的应用中指出:利用Apriori 算法来找出旅游景点之间的关联性,并以关联规则表示。其算法说明如下:(1)找出所有 1-项目组的支持度,满足最小支持度者,即成为高频 1-项目组,若是,则停止执行;(2)由(1)的高频 1-项目组组合成 2-项目组,找出所有 2-项目组的支持度,满足最小支持度者,即成为高频 1-项目组,若为=,则停止执行;(3)找出高频(k-1)-项目组,k2;(4)由(3)中找出任两个有(k-2)项目组相同的高频(k-1)-项目组,组合成 k-项目组;(5)判断由(4)所找出的 k-项目组,其所有包括的(k-1)-项目组之子集合是否都出现在(3)中,假如成立就保留此 k-项目组,否则就删除;(6)再检查由(4)所撷取的 k-项目组,若满足最小支持度,即成为高频 k-项目组,否则就删除;(7)跳至(3)找高频(k+1)-项目组,直到无法产生高频项目组为止;对所有高频项目组,找出满足最小信赖度的关联规则。第二节 研究的目的与意义一、 研究的目的 (一) 在国民经济中的地位旅游在促进经济发展方面有着巨大的作用,按照中国制定的全国旅游发展规划,以 2000 年为基数,到 2020 年,旅游业总收入翻三番,将达到 36000 亿人民币,占 GDP 的 8%,中国将成为世界第一大旅游目的地国家,因此随着经济的发展和社会的进步,作为六大新兴消费热的行业之一的旅游行业,在今后几年,将存在广阔的发展空间,成为发展势头和规模最快的产业之一,对于城市经济的拉动性以及对于文化和环境的促进作用也日益的显现。(二) 所面临的国内国际环境根据“外资旅行社 2007 年 7 月 1 日起,将取消对外商投资旅行社设立分支机构的限制,并对外资旅行社的注册资本实行国民待遇。”修改后的旅行社治理条例规定:所有国际旅行社都可以经营出境旅游业务,但同时设置了一个质量保证金的门槛;其二,根据 ADS 协议的条款,在经营到官方认可的中国公民出境旅游目的地国家旅游时,旅行社还必须得到签约双方的认可,一些原本有资格经营的国际旅行社被排斥在外;其三,最外边还有一个大围墙,合资旅行社和外资旅行社不得经营中国公民的出境旅游。出境旅游业务的开放问题成了一个重要的焦点,形成了政府、内资旅行社和外资旅行社多重博弈。(三) 发展中存在的问题随着中国旅游业市场机制的确立,我们清楚地看到长期困扰我国旅行社业的深层次问题:那就是朝阳产业成为微利行业,甚至亏损行业。但其原因是多方面的,首先是政府干预过多。政府对旅行社实行的“严格的审批制度,进入旅游市场的旅游企业数量受到限制”。其次,传统观念制约。跟我国其他许多行业一样,旅游行业的许多企业家与西方提倡的“战略联盟”这一重要观念格格不入。再次,所有制形式单一。我国目前现有旅行社中合资旅行社屈指可数;集体所有制旅行社略多;私有制旅行社同样寥寥无几。本文的研究是希望研究结论能给所实习的温州某民营旅游公司在客户营销方面带来更大的收益。二、 研究的意义(一) 国内竞争近年来,旅行社的数量不断增加,旅游市场竞争日益激烈,为了争夺市场份额都把降价作为争夺客源的主要手段甚至是惟一手段。一些旅行社以低价格吸引旅游者和打击竞争对手,其竞争对手则以更低的价格为手段进行复,致使旅游市场上的旅行社产品价格越来越低,各家旅行社竞相削价,走进了削价竞争的误区,造成旅行社行业处于无序竞争的恶性循环。(二) 国际竞争一个国家的旅行社业结构是否合理、优化,直接关系到旅行社国际竞争力的强弱。我国旅行社业竞争力的不足,我国除国际、中国、青年三大旅行社外,其他旅行社的集团优势还不十分显著,经济规模还有待培育。另外,我国旅行社的业务范围过窄,多为经营团队旅游、观光旅游,未充分挖掘市场潜力;国际旅行社的自组能力差,其国际业务多为接待外国旅行社发来的团队。从现有文献来看,对旅游经济的研究大多是从旅游业整体进行的,对民营私有旅行社的研究比较少,但在浙江民营企业蓬勃发展的经济大省,对民营私有旅行社的研究尤有重要的意义。正如王世忠指出:“留住一个客户比找到一个新客户更有价值。从营销成本上讲,寻找新客户的成本是最高的,而留住客户,不仅可以有效降低成本,更能为口碑营销带来机遇。”(一) 客户资源是现代企业的重要战略资源当今世界,市场竞争的焦点已从产品的竞争转向品牌、服务和客户资源的竞争。谁能拥有客户,并能和客户建立且保持一种长期、良好的合作关系,赢得客户信任,给客户提供满意的服务,谁就能通过为客户服务的最优化来实现企业利润的最大化。(二) 争夺客户资源是现代商战的主要特点由于客户资源已经成为一种战略资源,因此对客户资源的争夺已经成为现代商战的主要特点。客户是企业生存和发展的基础,市场竞争的实质是争夺客户资源,一项研究表明:争取一位新客户的成本是保住一位老客户的 5 倍。由于竞争加大了赢得新客户的难度和成本,使越来越多的企业转向老客户,把营销重点放在获利较为丰厚的客户群上,即使不在新客户上投资,企业也能够实现大部分的盈利目标。客户关系管理的策略着眼点不仅在于维系现有客户,还在于维系老客户的基础上去发展新客户。企业要在竞争中保持优势,采取信息化手段建设客户关系管理系统和以客户为中心的营销机制,才是提升竞争力的根本措施。(三) 寻求企业利润最优化是客户关系管理的根本目的通过采用先进的客户管理系统,一方面,企业能够对客户信息进行全面整合,在企业内部充分共享,从而为客户提供更快速、更周到的优质服务,吸引和保持更多的客户;另一方面,借助客户关系管理所蕴含的先进的管理理念优化企业的业务流程,把“满足客户明确和隐含的需求”的经营理念贯彻到企业经营的全过程中,无论客户采取什么样的途径向企业发出任何联系信号,都能够像对待老朋友那样及时对待,企业的每个部门都知道他寻求的目标、购买的习惯、付款的偏好和感兴趣的产品。由于客户的一切信息尽在掌握之中,就能够有的放矢地提供及时、周到、满意的客户服务,使企业通过客户价值的最大化、客户服务的最优化来寻求市场开拓的最大化和企业利润的最优化。第三节 研究的内容本文通过对温州某民营旅行社客户旅游线路的挖掘分析,找出客户对出行时间、旅游景点、旅游性质及一些偏好的关系。首先,通过相关研究资料的搜集、文献的阅读。之后,运用温州某民营旅游公司提供的旅游客户信息,对客户信息进行分析,采用关联挖掘方法对温州客户旅游性质进行分类和关联规则实证分析。最后,得出结论,对结论进行分析并给出适当的建议。拟解决的问题主要是得出哪些是有待开发的线路和哪些最适合推荐给顾客及如何引导客户出游目的倾向性等等。第二章 数据挖掘理论和客户营销理论第一节 数据挖掘的产生和发展一、 数据挖掘的产生当今,数据容量规模已经达到万亿字节(TB)的水平。过量的数据被人们称为信息爆炸,带来的挑战是一方面规模庞大、纷繁复杂的数据体系让使用者漫无头绪、无从下手;另一方面在这些大量数据的背后却隐藏着很多具有决策意义的有价值的信息。那么如何发现这些有用的知识,使之为管理决策和经营战略发展服务?计算机科学给出的最新的回答是数据挖掘(Data Mining,DM)。数据挖掘产生的前提是:从大量数据中找出隐藏在其中的、有用的信息和规律;计算机技术和信息技术的发展使其有能力处理这样大量的数据。 二、 数据挖掘的应用价值应用数据挖掘从大量数据中所发现的规律并不是“放置四海而皆准”的规律,而是面向某一应用的规律,具有具体的指导意义。早期,数据挖掘主要应用于商业领域,如许多读者熟知的“啤酒和尿布”的故事,就是零售业巨头“沃尔玛”从大量销售数据中分析出来的规律:美国的男士在下班后要去超市买婴儿尿布,他们在购买尿布的同时会买啤酒。“沃尔玛”因此将这两种“毫不相干”的商品摆放在靠近的货架上,并在其间摆放一些下酒小菜,使这些商品销量大增。随着人们对数据挖掘了解的逐步深入,其应用领域逐步扩大,如科学研究、市场营销、金融分析、体育比赛等。三、 数据挖掘的发展过程数据挖掘是 20 世纪 80 年代,人工智能(Artificial Intelligence,AI)研究项目失败后,AI 转入实际应用时提出的。它是一个新兴的,面向商业应用的 AI 研究。知识发现(Knowledge Discovery In Database,KDD)和数据挖掘是数据库领域中最重要的课题之一,国际上第一次关于数据挖掘与知识发现的研讨会于 1989 年在美国的底特律召开,在此次会议上第一次提出了知识发现一词。1995 年,在加拿大召开了第一届 KDD 和 DM 国际学术会议。会议对 KDD 做了确切的定义,未对 DM 做确切的定义。目前 KDD 和 DM 已成为研究热点和焦点,一批 DM 系统开发出来,在商业、经济、金融和管理领域都取得了应用性的成果。第二节 数据挖掘的定义和常用技术一、 数据挖掘的定义数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘应该更正确地命名为“从数据中挖掘知识”。原始数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形、图像数据等。一般的说,数据挖掘是一个利用各种分析方法和分析工具在大规模海量数据中建立模型和发现数据间关系的过程这些模型和关系可以用来作为决策和预测。二、 数据挖掘的常用技术(1) 决策树方法决策树方法就是利用训练集生成一个测试函数,根据不同取值建立树的分支:在每个分支子集中重复建立下层结点和分支,这样便生成一棵决策树。然后对决策树进行修剪处理,最后把决策树转化为规则,利用这些规则可对新事例进行分类。这种方法实际上是根据信息论原理对数据库中存在的大量数据进行信息量分析,在计算数据特征互信息的基础上提取出反映类别的重要特征。典型的决策树方法有分类回归树(CART)、ID3、C4.5 等。(2) 神经网络方法神经网络源于自然界的神经网络,由许多神经元所组成,模拟人类的直觉思维和神经元功能,根据生物神经元和神经网络的特点,通过带有一定权重的“导线”连接神经元以形成并行网络。利用非线性映射的思想和并行处理的方法,经过输入层、隐藏层和输出层等,实现输入到输出的映射关系,对数据进行调整、计算,最后得到结果。神经网络方法用于非线性数据和含噪声的数据时具有更大的优越性,比较适合于市场数据库的分析和建模。目前,在数据挖掘中,最常用的神经网络是 BP 和 RBF 网络。(3) 关联规则挖掘算法关联规则是数据挖掘的核心技术,是由 R.Agrawal 等人首先提出的,关联规则就是给定一组属性和一个记录集合,通过分析记录集合,推导出属性间的相关性,是以形式为“A1A2AnB1B2Bn”来描述数据之间存在的关系规则。其作用是在数据库的对象间挖掘出满足一定条件的依赖关系,并有可能描述属性间的因果关系。(4) 遗传算法它是基于自然进化理论,模拟基因联合、突变、选择等过程的一种优化技术,但也是人们理解最少的一种方法。它是以模拟生物进化过程为基础,就如同进化是产生较优的生物种类一样,遗传分析应用定向搜索的迭代过程,先找出两个合适的父样本,通过基因组合、交叉、变异和自然选择四种典型的带有生物遗传特点的操作产生子样本,反复迭代操作直到收敛为止。遗传分析常用于预测分析。除了上述的常用方法外,还有模糊集合方法、Bayesian Belief Netords、最邻近算法(k-nearest neighbors method, KNN)和可视化技术等。在实际问题解决中,数据挖掘算法是最核心的问题,关键就在于算法的选择和实现。一般根据实际问题决定选择采用何种挖掘算法,但往往为了达到更好的挖掘效果,还要同时使用多种数据挖掘技术。例如:在数据预处理阶段,会使用粗糙集方法进行属性归约;在挖掘初期会使用聚类分析方法来预分类,简约规格化后的数据集合,为后面采用其他的数据挖掘方法来达到更好的挖掘效果;当在挖掘过程中,发现选择的数据不合理,或者采取的挖掘技术达不到预期效果,就重新开始挖掘过程,因此可以说,整个挖掘过程就是一个不断反复的过程,通过运用多项技术对原数据进行处理和分析,最后得出宝贵知识的过程。三、 关联规则算法(一) 基本概念定义 1 设关联规则挖掘的数据集记为 D,D=t 1,t2,tk,tn,tk=i1,i2,ip,t k(k=1,2,n)称为事务,i m(m=1,2,p)称为项目。定义 2 设 I=i1,i2,im是 D 中全体项目组成的集合,I 的任何子集称为D 中的项目集,|X|=k 称为集合 X 为 k 项目集。设 tk和 X 分别为 D 中的事务和项目集,如果 X!tk,称事务 tk包含项目集 X。每一个事务都有一个惟一的标识符,称为 TID。定义 3 数据集 D 中包含项目集 X 的事务数称为项目集 X 的支持数,记为x。项目集 X 的支持度记为 support(X),support(X)=x|D|100%;其中|D|是数据集 D 的事务数,若 support(X)不小于用户指定的最小支持度(min_ support),则称 X 为频繁项目集,简称频集,否则称 X 为非频繁项目集,简称非频集。定义 4 若 X、Y 为项目集,且 XY=,蕴涵式 X#Y 称为关联规则,X、Y 分别称为关联规则的前提和结论。项目集 XY 的支持度称为关联规则的 X#Y 支持度,记作 support(X#Y),support(X#Y)=support(XY);关联规则的 X#Y 置信度,记作confidence(X#Y),confidence(X#Y)=support(XY)support(X)100%。通常用户根据挖掘需要指定的最小置信度记为 minconfidence。支持度用于衡量关联规则在整个数据集中的统计重要性,而置信度用于衡量关联规则的可信程度。一般说来,只有支持度和置信度均较高的关联规则才可能是用户感兴趣、有用的关联规则。定义 5 若 support(X#Y)minsupport,且 confidence(X#Y)minconfidence,称关联规则 X#Y 为强规则,否则称关联规则 X#Y 为弱规则。定理 1:设 X、Y 是数据集 D 中的项目集:(1)若 X!Y,则 support(X)support(Y)。(2)若 X!Y,如果 X 是非频集,则 Y 也是非频集。(3)若 X!Y,若 Y 是频集,则 X 也是频集。由上述定义可知,定理 1 成立是显然的。(二) 解决方法一般地,给定一个数据集 D,关联规则挖掘的任务,就是要通过用户指定最小支持度和最小置信度来寻找强规则的过程。因此,该任务又可以划分为以下两个子任务。(1)寻找所有频集通过用户给定的最小支持度,寻找所有频集。事实上,这些频集可能具有包含关系,一般地,我们只关心那些不被其它频集所包含的所谓最大频集的集合。寻找所有频集是形成关联规则的基础。(2)生成关联规则通过用户指定的最小置信度,在每个最大频集中,寻找置信度不小于最小置信度的关联规则。(三) Apriori 算法与寻找频集Apriori 算法是挖掘产生布尔关联规则所需频集的基本算法,也是一个很有影响力的关联规则算法。该算法是根据有关频集特性的先验知识(prior knowledge)而命名的,它利用了一个层次顺序搜索的循环方法来完成频集的挖掘工作,即利用 k-项集来产生(k+1)-集。具体做法:首先找出频 1-项集,记为 F1;然后利用 F1 来挖掘 F2,即频 2-项集;不断如此循环下去直到无法发现更多的频k-项集为止。每挖掘一层就需要扫描整个数据集一遍。为提高按层次搜索并产生相应频集的处理效率,Apriori 算法利用了一个重要性质,即上述定理 1 所述,该性质可有效缩小频集的搜索空间。(四) 关联规则的生成在用 Apriori 算法挖掘出所有的频集后,就可以较易地获得相应的关联规则。即产生满足最小支持度和最小置信度的强规则,可利用上述定义 4 中confidence(X!Y)=support(XY)support(X)100%公式来计算关联规则的信任度。具体操作如下:(1)对于每个频集 f,产生 f 的所有非空子集。(2)对于每个 f 的非空子集 s,若 support(f)support(s)minconfidence;则产生一个关联规则“s!(f-s)”;其中 minconfidence 为最小置信度。四、 数据挖掘的过程数据挖掘是指一个完整的过程,该过程从大量数据中挖掘先前未知的、有效的、可使用的信息,并使用这些信息做出决策或丰富知识。数据挖掘的一般步骤如图 1-2 所示:图 1-2 数据挖掘的过程第三节 客户营销理论 3随着市场竞争的加剧,客户个性化程度不断分化,以及 IT 技术进步带来的营销革命,越来越多的服务性企业开始进入新的营销浪潮之中,即客户洞察驱动的个性化营销。越来越多的企业营销经理开始谈论客户关系营销、直复营销、数据库营销、个性化营销这些名词,听个性化营销可能为企业带来的巨大投资回报,往往令每一位营销经理鼓舞,但企业在建立个性化营销的核心能力方面,往往有所欠缺,而在实际的企业营销实践中又往往急于求成,是造成这些企业实际的营销效果往往不如期望的那样的乐观的原因所在。来看看下面这些营销经理经常面对的典型问题: 向哪些媒体和营销渠道进行营销投入,会使得发展新用户的效率最高收益最大? 公司在营销佣金上的支出越来越大,但是为什么公司的利润却没有相应增加?3 史雁军. 个性化客户营销的四大核心能力. /data/2005/2005-11-12/126786_3.shtml,2005-11-12.选 择 预 处 理 转 换 挖 掘 分 析原 始 数 据 被 选 择的 数 据 预 处 理 后的 数 据 转 换 后的 数 据 被 抽 取的 数 据 分 析 的结 果确 定 业 务 对象 数 据 准 备 数 据 挖 掘 分 析 及 知 识同 化 现在的客户看起来越来越不忠诚了,经常在竞争者之间来回选择,应当如何识别那些可能流失的客户,如何采取措施提高客户的忠诚度呢? 一些客户的购买次数和数量都在不断下降,如何提升这些客户的价值呢? 公司的产品线越来越长,如何识别哪些是有购买潜力和购买意向的客户呢?企业营销经理们在进行服务或产品营销策划时,在很多情况下都是从产品的角度来考虑问题,往往是沿着产品的特性来进行以产品为核心的营销策划,而经常由于各种条件的限制忽略了以客户为中心的客户特征识别和分析。从客户营销的根本来讲,企业营销策划的目的一般都是为了实现以下的一些营销目标: 更高效的客户获取,提高产品或服务的市场占有率 更高的客户忠诚度,以减少客户流失,增加客户终身价值 更大的客户占有率,以提高客户价值贡献水平 更佳的营销投资回报率,优化营销与服务成本,以获得更大的营销利润而从企业营销管理的角度来看,以上四个目标都各有侧重:一、 更高效的新用户发展有统计显示,获取一名新用户的成本是保留一名现有客户的七倍。这就需要企业能够精确进行目标客户定位,理解客户的需要和需求,策划和执行高效的营销活动,通过最恰当的营销渠道和沟通策略向客户传递正确的营销意图。二、 更高的客户忠诚度客户服务营销的一个最重要的目的就是要提高客户的满意度,通过营销与服务流程的优化,改善客户体验,从而提高客户满意度,降低客户流失率。有统计显示,获取一名新用户的成本是保留一名现有客户的七倍之多。这就需要企业能够真正理解客户的需要和需求,有效的对产品和服务的设计和提供过程进行分析,不仅能够识别客户的忠诚度和生命周期价值,并能通过整合的营销沟通策略来优化与客户的关系。三、 更大的客户占有率在目前激烈的客户竞争中,仅仅简单将营销目标定位于保留客户是远远不够的,而应当让客户将更多的消费集中于本企业的产品和服务上,让客户享用企业更多的产品与服务组合,或是提高客户在某一产品或服务上的消费水平,即提高忠诚客户的占有率变得越来越重要。通过交叉销售、向上销售来提高客户的购买水平是最直接采用的营销方式。但企业的营销经理仍然面临着几大难题:如何保证销售活动的效果?向哪些客户进行营销?向他们推荐什么产品和服务?什么时间以什么方式进行?四、 更佳的营销投资回报率很多企业已经认识到,当定位于不同的客户、不同的营销渠道、不同的产品和服务时,营销投资回报率经常会有较大的差异。要保证营销投资回报率,就需要理解客户的生命周期价值,根据不同的客户价值来优化并控制产品与服务的提供成本,加强营销风险管理能力等等。企业的营销经理都已经认识到,并非所有的客户都应等同对待的。企业应当为那些为企业带来高额利润的客户提供更好的服务,而对于那些带来较低收益的客户提供与其提供价值相对等的服务,并通过服务营销来提升客户的收益贡献水平和利润贡献率。以上这些都是企业在进行个性化客户营销时所需要达到的营销目标,也是大多数企业的营销经理每天面临的营销问题,但实际情况往往是企业有进行个性化营销时需要了解客户的信息不足,以及获取的信息对于营销的策划和实践的驱动力不足。不少企业在面对这样的问题时,往往求助于信息技术的手段,但是这些问题的解决,远远不是通过增加投资建立一个客户信息管理系统,再买套统计分析软件那么简单的。根据国际上的服务营销的成功经验,要提高企业的个性化营销的能力,都需要基于以下四项关键的营销能力的建立,即客户数据管理能力、客户分析能力、营销活动管理能力,以及洞察驱动的客户互动能力:(一)客户数据管理能力经验证明,高质量的客户数据管理能力是企业采取差异化营销以区别对待不同客户的基础。著名的研究机构 Gartner Group 也将客户数据管理能力列为影响企业进行个性化营销的最重要的能力之一。很多运营多年的企业往往有着比较完备销售数据和交易数据,这些企业往往认为对这些数据进行有效的采集和集成即可以有效的帮助企业进行一对一的个性化营销,而实际营销的效果经常差强人意。造成这样的原因何在?这些企业虽然有了完整的交易数据,如交易时间、交易次数、交易金额等等,但是这些数据全部是基于事务处理过程中产生的交易数据,而从客户知识的角度所需的客户信息并不仅仅是交易数据。客户数据是根据客户的需求来设计和采集的,而实际上大多企业非常缺乏能够洞察客户行为和价值的客户信息,如人口统计数据、行为心理数据等等。这些数据并不影响企业与客户的交易行为,但对于分析和识别客户的行为和价值却至关重要。我在给国内一些企业提供客户分析咨询时,经常听到企业的技术人员讲,我们已经应用国际领先厂商提供的先进工具建立了数据仓库,但当基于某些应用主题对客户进行分析建模需要抽取客户数据时,常常发现企业建立的所谓的数据仓库只是基于交易数据的汇总,有时甚至连基本的数据建模都存在问题,更不用提能否支撑基于分析主题的业务建模了,客户分析所需的一些行为变量根本没有,经常需要重新构建分析所需的客户数据文件。而这时企业的市场管理人员,往往又不理解为什么投巨资建立的数据仓库不能支持有效的客户分析工作。这是因为,企业没有建立起完整的客户数据管理策略,即从统一客户视图的角度来规划客户数据管理策略。而建立客户数据管理能力往往需要多年的积累,有计划有策略的采集和丰富客户数据,有时需要从外部采集第三方的数据源,与内部的数据进行集成和丰富,建立高质量的客户信息基础,并在企业层次管理和维护客户数据质量,这才是在企业层次应用客户知识的重要的基础和保障。(二)客户分析能力简单来讲,客户分析能力就是将客户信息转化为客户知识,并在企业内部进行知识共享的过程能力。一些企业中,有些技术经理谈到客户分析时都认为,客户分析就是数据挖掘和客户细分,这些企业非常热衷于在客户分析方面投资于昂贵的统计分析软件,有些企业甚至在一开始就不惜重金采购 SAS、SPSS 等高级统计分析工具,但在每年支付着高昂的分析软件服务费用的同时,这些分析工具却并没有给企业带来预期的收益和效果。究其原因,客户分析首先要基于企业的业务目标,主导客户分析的是企业的业务和客户营销策略,分析软件仅仅是这一过程的支撑工具而不是主导。企业在没有清晰的客户营销策略下往往听信软件厂商宣称的统计分析工具的强大功能,在没有清晰的客户营销分析策略时,就将大量资金投在了分析软件工具的采购上。这就好比带着高级计算器去参加高考的数学考试一样,计算器也好,统计分析软件也好,仅仅是技术工具,只能帮助你提高计算的效率,而不能告诉你解决问题的思路一样。应当由营销部门和服务部门来主导客户分析能力的建设过程,营销和服务部门需要客户分析的结论来支撑营销和服务策略的执行。而在国内企业的现状是,业务部门往往缺乏对分析技术了解的业务人员,而信息技术部门的工程师虽然有着很强的数据库技能,但是往往由于对于业务和客户的理解差异,面对着海量的数据,不知如何为业务部门提供分析。分析客户数据的能力并不仅仅是掌握数据库技术和统计技术就可以,关键的不完全是统计技术,而是客户策略主导的业务应用。客户分析是通过对客户信息的理解,应用适应性建模技术,通过动态的行为和价值分析,识别客户的行为、价值和需求,从而为采取差异化的营销与服务策略区别对待不同的客户群提供支撑,并帮助企业建立起实时的业务和客户洞察力。(三)营销战役管理能力基于高质量的客户数据和高水平的客户分析能力,能够有助于企业针对不同的客户群设计营销策略,具体营销活动的管理能力也是个性化营销中重要的环节,企业的营销执行能力和活动管理水平才是确保营销投资回报率能够实现的真正保障。一些客户密集型企业往往一年要进行数十次,甚至数百次的营销活动,面对如此频繁的营销活动,企业进行营销战役管理的能力就显得尤为重要。营销战役管理是一个在营销实践中动态学习的过程,不仅需要应用行业的最佳营销实践,通过客户分析能力的驱动,设计出客户针对性强、市场竞争力强的营销方案,而且还需要实时收集营销执行的效果,应用实时的营销分析和客户洞察,匹配目标客户以最适合的产品和服务,并且通过完善的营销绩效分析,努力提高营销投资回报率。从这个意义上来讲,营销战役管理是以客户为核心进行完整的营销策划、战役实施、营销绩效分析的全过程。而国内企业经常进行的营销活动管理虽看似也有着策划、实施和总结评估的阶段,但往往缺乏以客户为中心的营销分析驱动,对于营销活动的过程分析也极为溃乏,往活动从策划和实施的阶段是分离的,鲜有动态的调整和优化,而基本信息的营销分析能力则更是国内企业的营销软肋。以国内移动通信行业为例,某些省级移动运营商每年进行的营销活动都是以数以百计甚至数以千次来计,而企业实际的营销管理能力又相对较弱,往往一个营销活动接着一个营销活动。市场部十几个人一年负责面向数百万客户,围绕数十个产品,策划的实施数以百计的营销活动,经常的情况是只有时间策划活动,根本没有精力顾及营销的实施,更不用说对营销进行实时的动态监控和完善和营销分析了。而且,受到国内目前移动通信企业大多是按产品进行企业组织职能设置而缺乏以客户为核心的职能的限制,这些营销活动基本上都是以产品为核心进行了产品策划和推广,一些通信企业甚至会不欠其烦在相近的时间内多次向同一客户针对不同产品进行营销推广活动。这样一来,企业的市场营销部门仿佛成了营销活动的实验室,而在市场中进行着一次又一次的产品营销试验,一些企业根本就没有建立起有效的机制和能力,来记录和跟踪分析每一次营销活动的执行效果和收益,只是一年到头时算个总帐,看看发展了多少新用户,一共创造了多少收入,是赔是赚,年底做帐。这样的结果经常造成企业的很多营销活动只播不收。 (四)洞察驱动的客户互动能力客户互动能力即是选择一个对企业和客户都有利的互动方式的能力。高质量的客户互动离不开企业对客户的理解,即客户知识对客户互动能力的驱动能力。客户互动能力往往涉及到以下几个关键的核心的营销管理问题:渠道组合管理、客户接触点管理、客户沟通和客户体验管理。在“渠道为王”的传统营销思想影响下,很多国内服务企业在 IT 技术进步带来的营销通路变革和客户消费偏向与方式变化情况下,并没有在客户渠道偏好上进行相应的分析,在利用多通路进行营销渠道组合的设计和实践中,往往是沿着企业有哪些可利用的渠道来接触客户的进行营销通路设计,而没有从客户偏好于通过什么渠道来与企业联系来进行考虑。虽然不小企业都寻求在客户接触点上都为客户提供最好的服务,在所有客户接触点上建立和执行高效的、高个性化的客户沟通能力对于很多国内服务企业是个挑战。我早在十几年从事国际航空服务策划和管理的时候,国内一些航空服务企业就在提客户接触点管理和服务体验优化,时至今日,国内航空服务管理水平与国际航空服务相比,仍有着巨大差距!我们的航空企业有着国际最先进的飞机机型,这十几年国家对机场的巨大投资也使得国内的航空地面设施有着国际同步甚至领先的硬件水平,相对飞速改进的硬件环境和设施来说,国内航空服务在客户服务体验方面的改进却落后甚多,很多地方机场甚至十几年如一日,至今仍停留在客户至上的口号上。以国内近几年来逐渐成熟起来的电话营销和目录营销来说,在客户互动方面需要的改进就更多了。随着国内通信产业的迅速发展,电话营销也逐渐也为电信行业主要的营销通路之一,甚至有些电信运营商已经将电话营销称为与营业厅、代理商和大客户渠道并列的“第四通路”,但目前运营商在进行电话营销中仅仅比较多的关注于电话座席代表的电话营销沟通技能,而在电话营销策略、沟通设计设计、沟通

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论