




免费预览已结束,剩余9页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
精品文档 你我共享 腹有诗书气自华 基于数据挖掘技术的企业 CRM 系统的设计与实现 河北金融学院 郭佳 许明 摘要 CRM Customer Relationship Management 是客户关系管理的简称 它 是一个系统性的工程 是技术和管理相结合的产物 CRM 实现了企业由以产品 为中心向以客户为中心的转变 客户首次作为一种资源纳入企业的管理视野 本文以企业销售业绩为对象 利用决策树分类算法中的 ID3 算法 得到支持决 策 从而挖掘出理想客户 建立满足公司需求的 CRM 挖掘系统 关键字 客户关系管理 数据挖掘 决策树分类算法 ID3 算法 一 客户关系管理及数据挖掘技术 1 客户关系管理的概念 客户关系管理CRM 是一种现代经营管理理念 2 CRM 包含的是一整套解决方案 3 CRM 意味着一套应用软件系统 2 数据挖掘的概念 从技术上定义 数据挖掘 Data Mining 简称为 DM 是一种半自动地从大 量的 不完全的 有噪声的 模糊的 随机的数据中 提取出隐含在其中的 人们事先不知道的 但又是潜在有用的信息和知识的过程 数据挖掘从数据中 提取人们感兴趣的可用信息和知识 并将提取出来的信息和知识表示成概念 规则 规律和模式等便于人们理解与利用的形式 如果从企业角度说 数据挖掘是一种新的客户信息处理技术 其主要特点 是对企业数据库中的大量业务数据进行抽取 转换 分析和其他模式处理 从 中提取辅助企业决策的关键性数据 因此 数据挖掘也可被描述为 是提取有 用信息的数据产生过程 是从大量数据中挖掘出隐含的 先前未知的 对决策 精品文档 你我共享 腹有诗书气自华 有潜在价值的知识和规则 并能够根据已有的信息对未发生行为做出结果预测 为企业经营决策 市场策划提供依据的过程 二 天鹏进出口公司 CRM 系统分析 1 天鹏进出口公司实施 CRM 的可行性分析 首先是市场需求的原因 企业销售成功的关键在于针对客户的需要 提供 产品和服务来满足这种需要 然后通过对客户关系的管理 确保客户满意和再 次交易 然而过去的企业大多以为他们的产品和服务无与伦比 客户会一如既 往的使用他们的产品 现在 客户变的越来越大胆和挑剔 他们不仅要求优质 的产品 而且需要优质的服务 天鹏公司发现各部门的信息化程度越来越不能 适应业务发展需要 需要提高日常业务的自动化和科学化 这是客户关系管理 应运而生的需求基础 其次 技术的进步推进了 CRM 的发展 计算机 通讯技术 网络应用技 术的保证使得构建 CRM 系统的想法不再停留在梦想阶段 办公自动化程度 员工计算机应用能力 企业信息化水平 企业管理水平的提高都有利于客户关 系管理的实现 天鹏公司经过多年的发展 市场经济的观念已经深入人心 公司的工作重 点正在经历着从以产品为中心向以客户为中心的转移 在引入客户关系管理的 理念和技术时 不可避免的要对企业原来的管理方式进行改变 创新的思想将 有利于企业员工接受变革 因此发展 CRM 的时机已经成熟 通过 CRM 对该企 业的客户资源进行有效的管理 不但会提高企业收益 也将改变企业运行的战 略思维 2 天鹏进出口公司实施数据挖掘的可行性分析 对该公司客户进行分类的数据挖掘是可行的 因为公司的客户资料已达到 了数据挖掘所需要的海量 而公司的经营者也希望获得更大的利润 所以一般 都支持数据挖掘 希望充分利用已有的数据信息 而且公司的信息化建设比较 好 数据比较完备 网络设置和员工的计算机水平都比较好 而且为了适应业务发展的需要 公司先后在上海 天津 匈牙利设立了办 事处和分支机构 拉近公司与客户之间的距离 从而更加方便快捷的将国际领 先的产品和优质规范的服务源源不断的呈现给广大客户 另外 当公司管理者 需要对公司的贸易策略进行修改 对公司的进货量进行调整的时候 往往需要 精品文档 你我共享 腹有诗书气自华 对以前的数据进行分析 而对于海量数据人们根本无从下手 分析数据只能凭 借决策者的直觉 这样对数据是一种无形的浪费 在公司实行数据挖掘的目的就是从日积月累的海量数据中发现隐藏在数据 中的潜在规则 根据这些规则 将客户合理分类 进而根据其特点制定 一对 一 的个性化贸易策略 3 天鹏进出口公司 CRM 系统需求分析 一个企业业务流程是系统设计的关键 要实施开发 CRM 系统 必须确定 系统的功能需求 这就必须先了解企业的业务流程 从业务流程中分析系统的 需求 1 客户信息管理 客户信息包括客户名称 所属国家地区 详细地址 电话传真 电子邮箱 开户银行 银行账号 增值税信息等 2 活动信息管理 活动管理系统模块主要记录与客户之间的联系计划信息 以便及时和客户 取得联系 随时了解客户的情况 保证稳定的客户来源 3 销售信息管理 销售管理系统模块主要是对与客户之间的销售进行管理 包括销售和销售 列表两部分 销售部分用于记录与客户进行的销售事件 销售列表部分用于对 与客户发生的销售进行统计 4 服务信息管理 服务管理系统模块主要是记录客户的反馈事件信息及其处理方式 并对服 务信息进行统计 帮助企业更好的把握服务的动态趋势 5 费用信息管理 与客户联系就必然会产生费用 费用管理系统模块主要记录与客户之间发 生的费用信息 以控制和客户发生的费用 6 分析管理 分析管理系统主要用于对系统中的数据进行列表分析与图表分析 在该模 块中始终贯穿着数据挖掘的思想 7 报表管理 精品文档 你我共享 腹有诗书气自华 报表管理系统主要用于对系统中的数据进行报表显示与数据文件生成 方 便用户打印和下载 可以更快捷的将数字信息变为实际纸张上的信息 8 库存管理 库存管理模块主要是对销售的产品进行有效的管理及其相应的进货 可分 为库存管理 库存详表 进货管理和进货详表几部分 9 E mail 管理 E mail 管理系统是为了使用户能够方便的联系客户 也是 CRM 的一个重 要组成部分 使得用户可以方便的管理所属客户的电子邮件地址 并具有分类 群发的功能 10 后台管理 后台管理是对负责系统管理和维护的用户进行授权 对系统部门进行管理 对客户 销售 服务等信息进行实时查询和汇总 提供分析数据列表和图表 并生成便于打印和下载的数据报表和数据文件 提供给管理高层进行分析和决 策 三 天鹏进出口公司 CRM 系统设计 1 系统结构设计 精品文档 你我共享 腹有诗书气自华 2 系统数据挖掘模型的设计 1 用于分类的训练数据源组 在本文研究的企业数据中 首先是将不同部分的数据进行集成 然后是对 数据进行概化处理 将低层次的原始数据概化为高层次的概念 以便于进行数 据挖掘 将具体的客户年龄概化为50 三个年龄段 分别代表青 年 中年和老年客户 将产品价格分为高 中 低三档等 具体见表 1 将企 业 CRM 系统数据库中销售及客户信息经汇总后得到的信息资料 它有 4 个属 性 客户年龄段 文化程度 销售地区 产品档次 类别是销售业绩 分为好 和差两类 表 1 训练样本集合 attributeageeducationarealevelclass 1 30 H lowbad 2 30 H highgood 3 外部数据 交易数据历史数据 规则输出接口 规则库知识库 分析人员 图 1 CRM 系统结构图 精品文档 你我共享 腹有诗书气自华 4 30 H highgood 5 30 L highgood 6 30 L lowgood 7 30 L lowgood 8 30 M highgood 9 30 M mediumgood 10 30 M mediumgood 1150 M highbad 25 50 M highbad 26 50 M mediumgood 表 2 训练数据中各属性的说明 属性属性说明说明 age客户的年龄段 education文化程度 area业务销售地区天鹏进出口公司 CRM 系统中决策树分类算法的应用 决策树分类是一种从无次序 无规则的训练样本集中推理出决策树表示形 式的分类规则的方法 在各种决策树分类算法中 ID3 算法是最具有影响力的 接下来以企业销售业绩为对象 介绍 ID3 算法在 CRM 系统中分类模型的建立 精品文档 你我共享 腹有诗书气自华 由表 1 可知 类标号属性有两个不同的值 因此有两个不同的类 I 18 8 0 8905 下一步 需要计算每个属性的熵 即客户年龄 文化程度 产品档次和销 售区域 先看 age 属性 观察 age 的每个样本值的 good bad 分布 对每个分 布分别计算信息熵 当 age 当 age 在 31 50 间 s12 8 s22 4 时 I s12 s22 当 age 50 s13 1 s23 2 时 I s13 s23 如果样本按 age 划分 对一个给定的样本分类所需的信息熵为 E age 0 8192 类似的 可以得到 E education 0 7669 E production 0 853 精品文档 你我共享 腹有诗书气自华 E area 利用上述属性对当前分支节点进行相应样本集合划分所获得的信息增益分 别为 Gain age I s1 s2 E age 0 8905 0 8192 0 0713 Gain education I s1 s2 E education 0 8905 0 7769 0 1236 Gain production I s1 s2 E production 0 8905 0 853 0 0375 Gain area I s1 s2 E area 0 8905 0 783 0 1075 Gain equipment 1 576 0 873 0 703 由上述结果可知 属性 education 具有最高 信息增益 因此成为决策树根节点的测试属性 如下所示 8I 30 highgood 9I 30 medium good 10 30 medium good 11I 50 highbad 精品文档 你我共享 腹有诗书气自华 图 2 决策树根节点的测试属性 在样本中对属性 education 的 3 个取值进行分支 3 个分支对应 3 个子集 分别为 P1 1 2 3 4 15 16 17 18 19 P2 8 9 10 11 12 13 14 22 23 24 25 26 P3 5 6 7 20 21 其中 P3 的样本都为 good 类 因此对应分支标记为 good P1 和 P2 的样本 类别不定 因此需要对 P1 子集和 P2 子集分别递归调用 ID3 算法 在 P1 中可求出余下的三个属性 age production area 的信息增益 25 50 high bad 26I 50 mediumgood 5I 30 highgood 6I 30 lowgood 7 30 low good 20 30 high good 21I 31 50 lowgood 1I 30 lowbad 2I 30 highgood 3 30 medium bad 4 ID3 算法分类预测其 class 为 good 我们用 IF THEN 形式的分类规则提取图 3 决策树中表示的知识 企业可以 从中发现销售规律 以便制定未来更有效的营销策略 例如 1 IF education H AND area I OR area AND age IF education H AND area I AND age 31 50 AND THEN achievement good 3 IF education H AND area I AND age IF education M AND production high AND age THEN achievement good production highlow goodgoodbadbad 30 31 50 goodgood age area I 31 50 30 badbad age production mediumhigh badbadgoodgood education H M L goodgood 50 badbad age goodgood 31 50 area I goodgoodbadbad goodgood production mediumhighlow IF education M AND production high AND age 50 OR age 31 50 AND area THEN achievement bad 前三条分类规则说明该企业的高档产品对于本地区受过高等教育的年轻客 户的吸引力较大 低档产品对该类客户的吸引力较小 该企业的各档次产品对 于本地受过高等教育的中年客户吸引力均较大 后两条规则说明企业的高档产品对于受过中等教育的年轻客户或者本地的 中年客户吸引力较大 高档产品在受过中等教育的老年客户或者外地区的中年 客户中不很受欢迎 因此该企业可以加大高档产品在年轻客户中的宣传以及各 档次产品在本地受过高等教育的中年客户中的宣传 他们是该企业的一个重点 客户群 在外地区针对受过中 高等教育的中年及老年客户的销售业绩还有待 提高 该企业的产品对于教育程度较低的客户群销售业绩比较平稳 四 天鹏进出口公司 CRM 系统中数据挖掘技术的实现 1 决策树挖掘技术的实现 在 SQL Server2000Analysis Manager 控制台上 可按下述步骤使用 Microsoft 决策树挖掘技术 1 在 Analysis Manager 控制台左侧树型结构中 找到指定服务器和分析数 据库 右击 挖掘模型 新建挖掘模型 2 完成 选择源类型 和 选择源多维数据集 对话框 进入 选择数据 挖掘技术 对话框 在 SQL Server 的 AnalysisServices 中提供了两类数据挖掘 模型 即决策树模型和聚集挖掘模型 本系统采用 Microsoft 决策树模型 3 进入 选择被预测实体 对话框 在 源多维数据集的度量值 事 例级别的成员属性 和 其他维度的成员 三个选项中选择合适的内容 4 进入 选择培训数据 对话框 选定培训数据的维度层次 5 进入 创建维度和虚拟多维数据集 对话框 填写新建内容和名称 6 填写模型名称 并选定 保存并开始处理 选项 待新建的挖掘模型处理结束后 将出现 OLAP 挖掘模型编辑器 窗口 列出新建的挖掘模型 2 天鹏公司 CRM 系统的实现 精品文档 你我共享 腹有诗书气自华 天鹏公司的 CRM 系统实现了对客户销售 市场 价值和服务的全面管理 能实现客户基本数据的记录 跟踪 客户市场的划分和趋势研究 以及客户支 持服务情况的分析 并能在一定程度上实现业务流程的自动化 在系统分析模块中可以实现销售分析 客户地域分布分析 客户价值分析 服务趋势分析和服务构成分析等 每种分析功能又可以按照多种条件进行分析 例如在进行客户价值分析时还可以选择按交易次数 交易金额 时间范围等条 件具体分析 针对不同的分析功能 分析结果可以选择以报表形式或者以图表形式进行 显示 报表显示主要是将从数据库中读取的数据按照一定的格式显示出来 主 要通过 vbscript 函数实现 图表显示主要是利用 VML Vector Markup Language 矢量标记语言 来实现 在 VML 中单个元素被定义为形状 shape 大多数形状是由矢量路径描述 的 形状有很多属性 例如 名称 填充 fill 填充颜色 fillcolor 等 本文中分析模块利用的就是 VML 的基本元素 通过画线 填充 和样式的控制来实现柱状图的显示 五 结论 本文在研究客户关系管理系统 数据挖掘技术和相关算法的基础上 分析 了数据挖掘技术在该公司 CRM 系统中应用的可行性 建立了天鹏进出口公司 CRM 系统的挖掘算法模型 实现了对该公司客户群体以及客户销售等情况的细分 建立了满足公司需求的 CRM 挖掘系统 参考文献 1 郑伟民 数据挖掘纵览 计算机世界 1999 5 2 黄刚 数据挖掘工具及其选择 计算机世界 1999 5 3 杨辉 数据挖掘分类优化方法研究 上海交通大学博士论文 1999 4 郑伟民 数据挖掘纵览 计算机世界 1999 5 5 黄刚 数据挖掘工具及其选择 计算机世界 1999 5 6 杨辉 数据挖掘分类优化方法研究 上海交通大学博士论文 1999 出出师师表表 两汉 诸葛亮 精品文档 你我共享 腹有诗书气自华 先帝创业未半而中道崩殂 今
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能化服务效果分析-洞察及研究
- 新零售下百货服务创新-洞察及研究
- 劳动权益与工作伦理-洞察及研究
- 云计算背景下的调查数据管理-洞察及研究
- 无人化作业系统开发-洞察及研究
- 卡络磺钠纳米靶向递送研究-洞察及研究
- 用户心理行为分析-洞察及研究
- 福利政策与团队凝聚力-洞察及研究
- 基础会计实务电子课件与练习题
- 企业对账函标准模板合集
- 子宫动脉栓塞术后护理常规
- 教育中的数字化转型读书心得体会
- 幼儿园一日工作流程解读
- 纤支镜灌洗的术前术后护理讲课件
- 加气站风控分级管理制度
- 乡墅建房公司运营管理制度
- 学习通《大学生就业指导》章节测试含答案
- 工程机械发动机课件
- 动物素描阅读试题及答案
- JG/T 511-2017建筑用发泡陶瓷保温板
- T/JSWP 04-2022广告企业信用评价规范
评论
0/150
提交评论