行业数据挖掘应用.ppt_第1页
行业数据挖掘应用.ppt_第2页
行业数据挖掘应用.ppt_第3页
行业数据挖掘应用.ppt_第4页
行业数据挖掘应用.ppt_第5页
免费预览已结束,剩余44页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘行业应用 议程 2 数据挖掘现状银行行业应用电讯行业应用政府行业应用司法行业应用 数据挖掘定义 通俗地讲 数据挖掘就是对海量数据进行精加工 严格地说 数据挖掘是一种技术 从大量的数据中抽取出潜在的 不为人知的有价值信息 模式和趋势 然后以易于理解的可视化形式表达出来 其目的是为了提高市场决策能力 检测异常模式 控制可预见风险 在经验模型基础上预言未来趋势等 数据挖掘方法 CRISP DM Cross IndustryStandardProcessforDataMining 就是公认的 较有影响的方法论之一 商业理解 BusinessUnderstanding 数据理解 DataUnderstanding 数据准备 DataPreparation 建模 Modeling 评估 Evaluation 发布 Deployment 数据挖掘过程 数据挖掘的过程就是一个不断探索数据特征 建立和检验模型 发现客户消费行为特征的过程 6 2020 2 22 行业应用过程 行业应用分布 行业应用方法 数据挖掘存在一个较长的应用周期 数据挖掘应用的有效方法是 从一个较小的 关键的问题出发 建立起相对有效的模型 并通过应用实践不断检验和完善模型 逐步替使用者解决问题 银行行业应用 1 客户细分2 存贷款业务交叉销售3 预防客户流失4 信用卡风险控制5 防范信贷风险及欺诈6 其他挖掘主题 客户流失分析 业务目标 得出最可能流失的客户名单 交由客户服务部门采取挽留措施 建模数据 客户个人资料 消费情况 历史流失情况 挖掘模型 神经网络 C5 0决策树 线性回归部署数据 新的客户资料 消费情况挖掘结果 预测出每个新客户的流失概率 并从中取概率最大的一部分 客户流失分析 尽可能减少客户流失 增加交叉销售 吸引有价值的新客户 在与客户发生关系的整个过程中增加盈利能力 客户信用评分 业务目标 给每个客户进行信用评分 以便确定客户的贷款授信 信用卡透支额度等 建模数据 客户个人资料 历史信用情况 挖掘模型 神经网络 C5 0决策树 线性回归部署数据 新的客户个人资料挖掘结果 为新客户给出信用评分 0 1 洗钱行为监测 业务目标 分析客户交易行为 从中找出少部分异常的交易 重点检查是否为洗钱 建模数据 帐号及相应的交易行为信息 挖掘模型 K means聚类 TwoStep聚类部署数据 同建模数据 挖掘结果 筛选出与大多数交易行为不同的交易记录 客户风险控制 风险控制 客户行为分析 客户行为及资料聚类 low high high E Profit E Volume E Losses 客户评价分析 Lowcutoffs Highcutoffs 客户欺诈分析 欺诈数据挖掘及评分 客户财务数据挖掘 1 公司之间的相似程度 它们的距离 合并 2 公司有金融比率值高或很高 其他则低或很低 3 金融分析家和有经验的投资者可以通过改变金融比率的选择 开始新的聚类分析 他们可以从多次 多层聚类分析的结果中获得更多有用的信息 银行其他应用 1 构建信用评级模型来评估贷款申请人或信用卡申请人的信用风险 2 构建探测欺诈模型来对可能的欺诈交易及早发出警告 3 更好地理解消费者和客户 例如通过购物篮分析 4 将用户分类 例如通过聚类 所获结果可以用来制定邮寄类别 有针对性的广告和促销活动等 5 构建模型来预测购买特定产品或服务的概率 从而推动交叉销售和向上销售 银行行业案例 金融行业中国建设银行 基于SPSS统计分析产品的风险预警管理系统光大银行 采用Clementine产品 进行企业信贷风险数据数据分析中国银行 建立信用风险评级管理系统 有效组建内部评级分析体系FirstUnion 美国第六大银行企业 现在我们确切明白了需要做些什么来满足客户的需求和期望 我们的交付系统也发生了重大变化 BarclaysBank 英国领先的金融服务集团 Barclays的市场研究小组可以进行不断增加的有效的调查 从而在研究客户需求时可以从数据中获取更多的价值美国汇丰银行 预测分析帮助我们在合适的时间 用合适的产品和服务来接触合适的人 而SPSS为我们提供了进行这些分析的有力武器 SPSS银行业用户 TheWorldBankGroup 电讯行业应用 电信运营商拥有许多成熟的数据库应用系统如网管系统 财务系统 计费账务系统 112障碍管理系统 缴费销账系统等 并产生了大量的业务处理数据 如果针对客户关系管理相关决策分析的需求 对这些数据进行重组整合 就能充分利用这些宝贵的数据 体现信息的真正价值 电讯行业应用 快速占领市场 扩大市场份额牢牢掌握大客户 防止流失了解竞争对手 强化竞争优势分析收入组成 制定战略决策发现欺诈规律 减少欺诈行为 电讯客户流失 电信客户流失涉及以下的一些问题 1 哪些现有客户即将流失 2 现有客户的流失概率如何 3 哪些因素造成了客户的流失 4 客户流失对客户自身会造成什么影响 5 客户流失对电信公司的影响如何 6 不同类别客户的流失情况有什么差别 7 如果某个客户将要流失 他会在多长时间内流失 销售提升解决方案制定或推荐什么样的产品或者服务组合 然后我们就可以成功地对这些客户设定有效的销售战略 发现现有和潜在的客户需求 基于对客户的行为描述来制定提供有针对性的策略来获得最佳的新客户 25 电讯行业应用 电讯行业应用 欺诈防范解决方案利用数据挖掘和统计分析技术 对欠费行为进行事前预测 在恶意欠费发生前就采取防范措施 就可以大幅减少欠费行为给运营商带来的巨额损失 利用数据描述技术 可以对已知的欺诈性客户和非欺诈性客户进行有关的数据分析 发现可能影响客户欠费的因素然后 我们可以根据对以上因素的分析和统计 构建预测模型 并应用到当前客户数据库中 利用上述预测结果 我们可以适时地对大客户进行重点跟踪 并在必要时采取措施 以减少损失 电讯行业案例 邮电通信江苏移动经营分析系统项目 建立了大客户异动分析 潜在大客户预测 分类业务套餐测算和消费模型分析等四个专题模型内蒙古移动市场细分项目 优化配置营销费用 提高营销活动的市场回应率曲靖联通客户流失分析项目 通过对用户通话行为数据 用户资料数据和用户使用曲靖联通服务的情况等数据的深入分析 对影响流失各个因素进行了探索性分析并建立了预测客户流失的Logistic回归模型 英国电信 建立探索模型 更好地客户的行为特征CallCounter CallCounter用SPSS快速 方便地对呼叫数据进行分析 发现收入损失的地方 并提出解决建议 为其客户节约了时间和费用 西南贝尔 Gallagher和他的同事们都在使用SPSS来进行高水平的 足以影响公司决策的数据分析 美国Verizon公司 美国最大的无线通讯运营 建立客户流失分析模型并采取适当的市场策略进行挽留Vodafone 埃及 公司 对客户的资料数据 客户详单 CDR 数据进行了聚类分析 并将结果用于新产品推出 交叉销售和服务改进 国内电信业用户 SPSS电信业用户 税务行业应用 地方税务局要进行下一年度的税收收入预测 以制订新年度的工作计划 构建稽查选案系统是税务信息化建设 司法行业应用 司法应用主题网络信息挖掘 聚类 决策树 关联规则 情报分析挖掘 聚类 决策树 关联规则 案件分析挖掘 聚类 主成分 神经元网络 嫌疑人分析 聚类 决策树 串并案分析 关联规则 情报分析挖掘 定量分析 就是把已经获得的情报进行数理逻辑化的处理 就这些情报的真伪 多寡 轻重 远近等进行分析 作为一种解析模式 这个模式相对恒定 可以处理相关 相类的情报材料 情报分析挖掘 六个分析区间 第一区间 情报来源分析 聚类 关联 第二区间 情报真伪分析 聚类 决策树 第三区间 情报的归类分析 决策树 第四区间 情报指向分析 决策树 第五区间 情报转化分析 关联规则 第六区间 情报矫正分析 聚类 主成分 因子 神经元网络 案件分析挖掘 利用计算机数据仓库 可以在拟定的算法下对大量的行为记录进行分析 从而发现案件的规律 趋势 了解不同案件行为之间的关联 譬如何种状态会诱发何种行为 相信这是国安领域数据挖掘的新方向 政府行业案例 政府机构南京市地税局 建立科学的稽查管理方案北京市地税局 成功实现了科学评估纳税指标 科学预测税收情况澳大利亚昆士兰州消防和援救管理局 提取和分析累计超过40万条重大事故报告的数据苏格兰东艾尔郡州议会 该州议会服务民众的能力得到了提高魁北克健康和社会服务地方委员会 通过数据清理技术提高了数据的可利用性美国弗吉尼亚青少年审判局 SPSS提高了我们的统计能力 并向我们提供了制定更好决策所需的信息美国夏洛特 卡罗莱纳警察局 对居民对社区警务的满意度进行评估英国农渔食品部 MAFF 使用SPSSClementine的神经网络和规则归纳算法来发现数据中隐藏的模式法国地方研究机构IAURIF 采用SPSSClementine的规则归纳算法得到了意想不到的结果英国西米德兰警察局 确定关键案件的模式和趋势 SPSS能源 学术 政府用户 制造行业应用 六大主题 销售与生产能力的关系分析财务的数据挖掘技术质量与品种的优化分析生产 运输成本的控制分析客户关系及营销分析企业利润状况的趋势和预测 制造行业应用 生产成本分析成本分析收集整理ERP成本系统和其它相关系统的数据 生成生产单元 辅助单元 因素分析和成本会计等主题 建立相关分析模型 对产品成本进行跟踪分析 动态监控各产品的竞争力 全面分析产品的综合效益 为实现企业效益最大化提供决策参考 制造行业应用 生产成本预测明细产品成本测算收集整理质量设计数据 成本数据 销售价格数据和生产率标准数据等 生成明细产品成本主题 实现明细产品成本标准的自动生成与信息共享 建立产品标准成本测算 盈利能力分析 评价体系对产品进行边际贡献分析与评价 为产品定价及合理组织生产提供决策依据 制造行业应用 产品质量分析功能包括信息查询 产品化学成分 工艺参数 力学性能 表面质量 尺寸精度的统计分析以及质量判定分析等 制造行业应用 产品成份分析分析产品成份中各因素的作用及权重 网络信息挖掘主题 1 热点网站分析 根据实际用户的浏览情况 发现焦点网站的网站 聚类分析 可以提供三种统计类型的报告 1 user based例如 频繁访问本站的前N名的用户地址2 path based例如 被频繁访问的前N名的路径3 group based例如 被频繁访问的前N名的pagegroup 2 代理结构分析 从proxy的访问信息中可以分析网站的代理模式和路径 网络图分析 关联规则 网络信息挖掘主题 3 个性分析挖掘 根据发现的个性喜好 动态地分析用户类别 决策树 在此基础上 利用数据挖掘算法发现 最常访问方式及路径 最常访问网站页面 网络信息挖掘主题 4 隐藏信息挖掘 通过网络访问内容及访问路径 发现隐藏信息 决策树 网络信息挖掘主题 网络信息数据挖掘对象 UsageData 数据的抽象对象 1 User2 PageView Click 用户在某个时刻看到的浏览器中的内容3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论