第16讲决策支持与人工智能企业的智囊.ppt_第1页
第16讲决策支持与人工智能企业的智囊.ppt_第2页
第16讲决策支持与人工智能企业的智囊.ppt_第3页
第16讲决策支持与人工智能企业的智囊.ppt_第4页
第16讲决策支持与人工智能企业的智囊.ppt_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十六讲决策支持与人工智能 企业的智囊 商务智能分析方法 统计分析数据挖掘人工智能 统计分析 研究如何测定 收集 整理 归纳和分析反映客观现象总体数量的数据 以便给出正确认识 客户的平均年龄 平均收入水平 销售额 销售额是否与销售员的年龄 广告的强度等有密切关系 如果有关系 它们之间是什么关系 关系强度如何 数据挖掘 多功能分析 从数据库的大量数据中揭示出隐含的 先前未知的并有潜在价值的信息的非平凡过程 知识形成过程 数据 信息 知识 商务智能 行为 案例 零售店的尿布与啤酒 购物篮分析 零售店的尿布与啤酒经常一起被销售知识 啤酒和尿布摆放在一起零售店 周五晚上尿布销量在一周尿布销量总量中占很大比例知识 促销尿布 商务智能 谁买 为什么买 互补品 知识 周五晚上在尿布附近促销啤酒 数据挖掘分类 关联分析 决定哪些事情将一起发生分类 如信用卡申请者 分类为低 中 高风险 客户流失风险分析聚类 对记录分组 把相似的记录在一个聚集里 客户细分 哪一种类的促销对客户响应最好 分类举例 决策树 分类举例 决策树 分类举例 决策树 聚类 假设某银行拥有以下数据 1 客户号 2 储蓄账户余额 3 活期账户余额 4 投资账户余额 5 日均交易次数 6 信用卡支付模式 7 是否有抵押贷款 8 是否有赊账额度 9 客户年龄 10 客户性别 11 客户婚姻状况 12 客户家庭情况 孩子数 13 客户年收入 14 客户是否拥有一辆以上小汽车 15 客户流失状态 K means聚类算法 人工智能 智能计算 人工神经网络遗传算法模拟退火算法模糊数学等等 智能计算 也称 软计算 是们受自然 生物界 规律的启迪 根据其原理 模仿求解问题的算法 从自然界得到启迪 模仿其结构进行发明创造 这就是仿生学 这是我们向自然界学习的一个方面 另一方面 还可以利用仿生原理进行设计 包括设计算法 这就是智能计算的思想 如人工神经网络技术 遗传算法 模拟退火算法等 人工神经网络 指模拟人脑神经系统的结构和功能 运用大量的处理部件 由人工方式构造的网络系统突破了传统的 线性处理的数字电子计算机的局限 是一个非线形动力学系统 并以分布式存储和并行协同处理为特色单个神经元的结构和功能极其简单有限 但是大量的神经元构成的网络系统所实现的行为却是极其丰富多彩的 人工神经网络 神经元 隐藏单元 输入 输出 人工神经网络 隐藏层 输出层 输入层 隐藏单元 输入 隐藏 输出 10 11A 12B 13C 1 2AGE 3INC COMBINATION ACTIVATION tanh 1 2AGE 3INC A 4 5AGE 6INC tanh 4 5AGE 6INC B 7 8AGE 9INC tanh 7 8AGE 9INC C COMBINATION COMBINATION ACTIVATION COMBINATION ACTIVATION 年龄 收入 人工神经网络 规则 两个以上输入为1时 则输出为1 人工神经网络 人工神经网络 人工神经网络 训练神经网络即调整神经元的权重 人工神经网络的应用 神经网络的应用案例 银行 遗传算法 GeneticAlgorithm GA 遗传算法是一类通过模拟生物界自然选择和自然遗传机制的随机化搜索算法 由美国J Holand教授于1975年首次提出 它是利用某种编码技术作用于称为染色体的二进制数串 其基本思想是模拟由这些串组成的种群的进化过程 通过有组织地然而是随机地信息交换来重新组合那些适应性好的串遗传算法对求解问题的本身一无所知 它所需要的仅是对算法所产生的每个染色体进行评价 并根据适应性来选择染色体 使适应性好的染色体比适应性差的染色体有更多的繁殖机会 遗传操作 采用整数的二进制编码x 10111 表示了16 4 2 1 23 初始化种群 计算适应度 选择 交叉 变异 停止条件 最优个体 是 否 遗传算法流程图 优点 解决非线性最优化问题可以简化复杂的目标函数以及制约条件最优化过程相对简单缺点 不能很清楚地表示对那些部分进行了遗传运算不能对数据进行可视化解释 TSP问题 TSP问题 随机路线为 4 5 10 11 13 14 1 8 12 7 6 3 2 9 411 7 10 4 12 9 14 8 13 5 2 3 6 1 118 7 9 12 2 5 1 4 11 14 6 3 13 10 8 总距离 71 1144 TSP问题 最优解路线 5 4 3 14 2 1 10 9 11 8 13 7 12 6 5总距离 29 3405 大数据 或称巨量资料 指的是所涉及的资料量规模巨大到无法透过目前主流软件工具 在合理时间内达到撷取 管理 处理 并整理成为帮助企业经营决策更积极目的的资讯 大数据更准确的应该叫 大数据挖掘 大数据 资料 一天之中 互联网产生的全部内容可以刻满1 68亿张DVD 发出的邮件有2940亿封之多 相当于美国两年的纸质信件数量 发出的社区帖子达200万个 相当于 时代 杂志770年的文字量 卖出的手机为37 8万台 高于全球每天出生的婴儿数量37 1万 截止到2012年 数据量已经从TB 1024GB 1TB 级别跃升到PB 1024TB 1PB EB 1024PB 1EB 乃至ZB 1024EB 1ZB 级别 国际数据公司 IDC 的研究结果表明 2008年全球产生的数据量为0 49ZB 2009年的数据量为0 8ZB 2010年增长为1 2ZB 2011年的数量更是高达1 82ZB 相当于全球每人产生200GB以上的数据 而到2012年为止 人类生产的所有印刷材料的数据量是200PB 全人类历史上说过的所有话的数据量大约是5EB IBM的研究称 整个人类文明所获得的全部数据中 有90 是过去两年内产生的 而到了2020年 全世界所产生的数据规模将达到今天的44倍 大数据 案例 你开心他就买 你焦虑他就抛华尔街 德温特资本市场 公司首席执行官保罗 霍廷每天的工作之一 就是利用电脑程序分析全球3 4亿微博账

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论