已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
内容纲要 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具 1 业智能)是目前全球 关键推进因素是 成了海量数据,如何发挥这些数据的价值其实就是 数据 - 信息 - 知识 的一个逐步转化过程; 数据仓库 联机分析处理 数据挖掘 大部分组成; 2 3 内容纲要 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具 4 典型的业务问题 如何优化下一阶段的营销活动? 高价值客户中,谁可能流失? 谁贡献的利润最多?谁花费的成本最高? 客户都有什么样的消费特点? 5 数据挖掘都可以应用到何处? 6 何谓数据挖掘? 数据 信息 决策 数据挖掘是一个从海量数据中抽取前所未知的,可理解的,可操作信息的过程。 7 数据库与数据挖掘发展历程 8 数据挖掘是一门交叉学科 数据挖掘 数据库技术 统计学 其他学科 信息科学 机器学习 可视化技术 9 内容纲要 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具 10 数据挖掘的过程 商业理解 数据理解 数据准备 数据 挖掘 建立模型 模型评估 模型发布 11 商业理解 定义商业目标 定义数据挖掘目标 12 数据理解 需要的数据 可以获得的数据 对可获得的数据进行观察、分析 用直方图显示输入数据分布 聚类以发现孤立点 在保持数据特征的基础上抽样 过滤不想要的数据 值映射 13 数据准备 一定要保证数据质量! 14 建立模型 确定抽样规则 选择合适的算法 调整算法的参数 15 模型评估 使用一组新数据评估构建好的模型 16 模型发布 制作成自动化处理软件包,上线使用。 17 数据挖掘过程中工作量比例 18 数据挖掘的过程 数据仓库 选择的 数据 选择 转换 挖掘 理解 转换后的数据 可理解的信息 抽取的信息 19 内容纲要 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具 20 业务问题与数据挖掘算法间关系 0K Q Q Q Q I I 1 2 3 4 5 6 n 神经网络 类分析 t ? 列分析 策树 倾向性分析 信用特性分析 客户保留 客户生命周期管理 目标市场 价格弹性分析 客户细分 市场细分 倾向性分析 客户保留 目标市场 欺诈检测 关联分析 市场组合分析 套装产品分析 目录设计 交叉销售 21 数据挖掘的类型 预测型 数据挖掘: 使用已知知识构建模型,用以预测未来。 描述型 数据挖掘: 寻找数据中的模式,使用找到的模式指导决策。 22 数据挖掘技术 (预测型 /描述型) 分类 结果将落入哪个类别中? 影响预测结果的主要因素是什么? 值预测 这一事件发生的可能性是多大? 23 数据挖掘技术 聚类 存在哪些逻辑上的群集? 关联规则 事件之间存在怎样的联系? 序列模式 这个事件之后会发生那些事件? 相似时间序列 这个结果是否与以前的一个模式相同? 24 三种主要的数据挖掘技术 分类 (客户流失) 聚类 (客户细分) 关联规则 (购物篮分析) 25 分类 分类算法 采取行动! 26 决策树分类 训练:基于历史数据,创建决策树 27 决策树分类 应用:基于历史数据,创建决策树 28 决策树分类的参数 一般数据挖掘工具在应用决策树分类算法时,可调整的参数: 输入变量 误差矩阵(代价矩阵) 最大树深度 节点最大纯度 节点最少记录数 29 神经网络分类 输入层 (i) 隐藏层 (j ) 输出层 (k ) x1 x2 O j O k 前馈是指信号先前传播,输入 - 隐层 - 输出 结点 (神经元) 30 网络结构的确定 性)来定。每个属性为一个输入结点; 几个输出值,就有几个输出结点; 层数和结点数点的确定:主要靠经验。 决于对问题的了解和先验知识,那部分作用强,权值就设得大些;靠经验。 训练过程:一个神经元连接权重调整的过程。 输入层 隐层 输出层 计算输出的结果和目标结果的差距 经输出层 隐层 输入层 反推神经元连接的权重调整 到网络收敛为止 31 聚类 低 高 高 高 1 2 8 4 5 3 7 6 因素二 因素三 因素一 示例 32 聚类算法 演示图分群 神经网络( 33 关联规则 34 关联规则 对于规则 A=B, A=时包含 A、 总事务数 A= )的支持度 A= 35 序列模式 100购买 产品。 36 相似序列 37 相似序列 38 神经网络 预测结果是个连续型变量 39 根据输出空间,将输入空间划分为区域 计算每个区域的区域中心 40 计算每个中心的权重 Y=f(x1,x2, 41 第一步: 训练 第二步: 应用 42 内容纲要 数据挖掘的基础知识 数据挖掘过程 常用数据挖掘方法 常用数据挖掘工具 43 常用数据挖掘工具 44 新业务营销 留住老客户 (提升老客户活跃度 ) 识别与培养影响力高 端 根据客户本业务行为特征及偏好开展针对性营销, 改进客户体验 客户流失预警及客户挽留 靠影响力高端带动 数据 数据 数据 发展新客户 发现潜在客户,进行交叉销售 靠影响力高端带动 数据 数据 识别影响力高端 根据影响力高端的需求特点设计产品 制定能激发影响力高端积极进行横向传播的营销策略 数据 数据 数据 营销方式 营销方式 注释 : 电信新业务营销思路 项目整体操作框架 数 据模 型部 分用 户 行 为分 析 模 型分 析应 用部 分新 业 务 营 销 管 理 平 台影 影 影 影 影 影 影影 影 影 影 影 影 影 影影 影 影 影 影 影 影 影用 户 行 为 属 性 标 签影 影 影 影 影 影影 影影 影 影 影 影 影影 影影 影 影 影 影 影影 影影 影 影 影 影 影影 影影 影 影 影 影 影影 影 ( 影 影 影 影影 影 影 影 影 影 影 )影 影 影 影 影 影影 影影 影 影 影影 影 影 影影 影 影 影用 户 数 据 、 标 签 、 模 型 标 识 信 息 结 果 集数 据整 合部 分数 据 集影 影 影 影 影 影 影 影 影 影影 影 影 影 影 影 影 影 影 影 影影 影 影 影 影 影 影 影 影影影 影 影 影 影影 影 影 影 影 影 影 影 影 影基 于 用 户 人 性 特 点 的 细 分基 于 单 业 务 ( 彩 铃 ) 用 户 生 命 周 期 的 细 分基于用户彩铃生命周期细分的算法描述 细分用户群 算法潜在彩铃用户 从没有开通彩铃的用户彩铃业务新用户 首次开通彩铃时间 3 且为非彩铃业务新用户彩铃沉默用户 上月下载次数 + 2 上月设置次数 0 且为非彩铃业务新用户彩铃流失用户 入网开打后曾开通彩铃业务但现在没有使用彩铃业务的用户潜在高概率用户 决策树算法建模 ( 调优 : 用户三个月平均数据 , 增加对历史数据的分析 )流失高概率用户 法建模 ( 调优 : 扩大随机样本量 )影响力用户 影响力评价模型数据源整合需求 用户细分模型及行为属性标签 彩铃营销管理子平台建设需求 彩铃潜在用户决策树模型 彩铃目标用户 ( N=20228; L= ( N=1238; L= 58元 ( N=8880; L= ( N=18940; L= N=862; L= 8 信发送 =10条 ( N=5076; L= 短信发送量=10 15元 ( N=2479; L=30%) 15 漫游 ( N=808; L= 有漫游 ( N=1788; L= 漫游业务 漫游业务 漫游 ( N=821; L=20%) 有漫游 ( N=1658; L= 梦网短信用户 梦网短信用户 ( N=1029; L= 网短信用户 ( N=629; L=41%) 信用户 ( N=194; L= 彩信用户 ( N=627; L= 彩信用户 新业务个数 =1 ( N=1069; L= ( N=719; L= 信用户 ( N=282; L= 彩信用户 ( N=3522; L= 彩信用户 15 ( N=1555; L= ( N=1967; L= 漫游业务 漫游 ( N=401; L= 有漫游 ( N=1154; L=23%) 动感地带学生套餐 0 学生套餐 ( N=9626; L= 生套餐 ( N=434; L=13%) 数据源整合需求 用户细分模型及行为属性标签 彩铃营销管理子平台建设需求 改造平台,从用户出发重新规划彩铃铃音内容属性 分析个人铃音库中铃音内容属性特点 抽提出用户铃音内容偏好 依据用户铃音内容偏好进行针对性营销 对应归类打标 榜单 无跟随倾向音乐时尚观 时尚族是否T O P 1 0 0 喜欢主流歌手歌手 无明显歌手倾向歌手性别 男歌手地域 国语音乐类型 大众流行P O 视插曲表达情绪 伤感适合场所 休闲圈D I Y 铃音 不具标新立异特质数据汇总 营销效果回馈 贴铃音内容偏好标签 铃音内容偏好 属性标签构建思路框架 数据源整合需求 用户细分模型及行为属性标签 彩铃营销管理子平台建设需求 彩铃铃音内容属性标签应用示例 榜单 音乐时尚观 歌手 地域 音乐类型 音乐来源 表达情绪 适合场所 D I Y 音乐跟随消费倾向性 音乐潮流观 歌手偏好音乐地域偏好音乐类型偏好接触的媒体偏好 当前情绪 交际侧重 标新立异歌手 地域 表达情绪 铃音类型 音乐来源 榜单 音乐时尚观 铃音标签 销量榜 经典榜 新歌榜 首发排行榜 前日最热排行榜 音乐时尚观 是否T O P 1 0 0 歌手1 0 0 0 0 2 1歌手名 歌手性别 地域 音乐类型 音乐来源 表达情绪 适合场所 D I Y 音乐王强 1 2 1 2 2 2 0秋天不回来 销量榜 经典榜 新歌榜 首发排行榜 前日最热排行榜 音乐时尚观 是否T O P 1 0 0 歌手0 0 0 1 1 1 1歌手名 歌手性别 地域 音乐类型 音乐来源 表达情绪 适合场所 D I Y 音乐周杰伦 1 2 1 3 2 2 0黄金甲 销量榜 经典榜 新歌榜 首发排行榜 前日最热排行榜 音乐时尚观 是否T O P 1 0 0 歌手0 0 0 0 0 2 1歌手名 歌手性别 地域 音乐类型 音乐来源 表达情绪 适合场所 D I Y 音乐张靓颖 0 1 1 1 4 2 0of 篇版) 数据源整合需求 用户细分模型及行为属性标签 彩铃营销管理子平台建设需求 用户铃音内容偏好 抽提示例 用户 A: 铃音库中铃音: 铃音 歌手秋天不回来 王强铁血丹心 罗文甄妮菊花台 周杰伦用户 B: 铃音库中铃音: 铃音 歌手缠绵高潮篇) 上帝是女孩( G O
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民办企业内部制度
- 河南省信用社内部制度
- 海关内部疫情防控制度
- 海尔集团内部控监督制度
- 火锅店内部人员管理制度
- 煤矿中队内部管理制度
- 煤矿内部转运管理制度范本
- 猎头公司内部奖金制度
- 环卫站内部管理制度
- 皇室内部通婚制度
- OpenClaw发展研究1.0报告 by 清新研究
- 2025届北汽集团全球校园招聘正式开启(1000+岗位)笔试参考题库附带答案详解
- 文明礼仪教育主题活动方案
- 电子行业跟踪报告:OpenClaw助力AIAgent技术范式升级
- GB/T 1534-2026花生油
- 2026年新能源产业发展政策解读试题
- 2026天津市津鉴检测技术发展有限公司招聘工作人员14人笔试备考试题及答案解析
- 2025geis指南:软组织肉瘤的诊断和治疗课件
- 2026广东汕头市公安局招聘警务辅助人员152人考试参考试题及答案解析
- 施工机械安全防护方案
- 危险品全员安全培训方案课件
评论
0/150
提交评论