第16讲决策支持与人工智能企业的智囊_第1页
第16讲决策支持与人工智能企业的智囊_第2页
第16讲决策支持与人工智能企业的智囊_第3页
第16讲决策支持与人工智能企业的智囊_第4页
第16讲决策支持与人工智能企业的智囊_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十六讲 决策支持与人工智能:企业的智囊1商务智能分析方法统计分析数据挖掘人工智能2统计分析研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识。客户的平均年龄?平均收入水平?销售额?销售额是否与销售员的年龄、广告的强度等有密切关系?如果有关系,它们之间是什么关系?关系强度如何?3数据挖掘:多功能分析从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。4知识形成过程数据信息知识商务智能行为5案例:零售店的尿布与啤酒购物篮分析:零售店的尿布与啤酒经常一起被销售知识:啤酒和尿布摆放在一起零售店:周五晚上尿布销量在一周尿布销量总量中占很大比例知识:

2、促销尿布?商务智能:谁买?为什么买?互补品?知识:周五晚上在尿布附近促销啤酒!6数据挖掘分类关联分析:决定哪些事情将一起发生分类:如信用卡申请者,分类为低、中、高风险;客户流失风险分析聚类:对记录分组,把相似的记录在一个聚集里。客户细分,哪一种类的促销对客户响应最好?7分类举例:决策树8分类举例:决策树9分类举例:决策树10聚类假设 某银行拥有以下数据:1客户号;2储蓄账户余额;3活期账户余额;4投资账户余额;5日均交易次数;6信用卡支付模式;7是否有抵押贷款;8是否有赊账额度;9客户年龄;10客户性别;11客户婚姻状况;12客户家庭情况(孩子数);13客户年收入;14客户是否拥有一辆以上小汽

3、车;15客户流失状态。11K-means聚类算法 1213人工智能:智能计算人工神经网络遗传算法模拟退火算法模糊数学等等14智能计算也称 “软计算”,是们受自然(生物界)规律的启迪,根据其原理,模仿求解问题的算法。从自然界得到启迪,模仿其结构进行发明创造,这就是仿生学。这是我们向自然界学习的一个方面。另一方面,还可以利用仿生原理进行设计(包括设计算法),这就是智能计算的思想。如人工神经网络技术、遗传算法、模拟退火算法等。 15人工神经网络指模拟人脑神经系统的结构和功能,运用大量的处理部件,由人工方式构造的网络系统突破了传统的、线性处理的数字电子计算机的局限,是一个非线形动力学系统,并以分布式存

4、储和并行协同处理为特色单个神经元的结构和功能极其简单有限,但是大量的神经元构成的网络系统所实现的行为却是极其丰富多彩的1617人工神经网络神经元隐藏单元输入输出18人工神经网络隐藏层输出层输入层隐藏单元19输入隐藏输出10+11A+ 12B+13C1+ 2AGE+ 3INCCOMBINATIONACTIVATIONtanh(1+ 2AGE+ 3INC) =A4+ 5AGE+ 6INCtanh(4+ 5AGE+ 6INC) =B7+ 8AGE+ 9INCtanh(7+ 8AGE+ 9INC)=CCOMBINATIONCOMBINATIONACTIVATIONCOMBINATIONACTIVATI

5、ON年龄收入20人工神经网络规则:两个以上输入为1时,则输出为121人工神经网络22人工神经网络23人工神经网络训练神经网络即调整神经元的权重24人工神经网络的应用25神经网络的应用案例:银行信用卡持有者的年龄、收入和职业信用卡显示的大额购买额度大额购买次数大额购买交易地点良好的交易可能是欺诈性交易输入层隐藏层输出层26遗传算法(Genetic Algorithm:GA) 遗传算法是一类通过模拟生物界自然选择和自然遗传机制的随机化搜索算法,由美国J.Holand教授于1975年首次提出。它是利用某种编码技术作用于称为染色体的二进制数串,其基本思想是模拟由这些串组成的种群的进化过程,通过有组织地

6、然而是随机地信息交换来重新组合那些适应性好的串遗传算法对求解问题的本身一无所知,它所需要的仅是对算法所产生的每个染色体进行评价,并根据适应性来选择染色体,使适应性好的染色体比适应性差的染色体有更多的繁殖机会。27遗传操作采用整数的二进制编码x = 10111表示了16+4+2+1 = 2328初始化种群计算适应度选择交叉变异停止条件最优个体是否遗传算法流程图优点:解决非线性最优化问题可以简化复杂的目标函数以及制约条件最优化过程相对简单缺点:不能很清楚地表示对那些部分进行了遗传运算不能对数据进行可视化解释29TSP问题位置编号X坐标Y坐标116.4796.1216.4794.44320.0992

7、.54422.3993.37525.2397.2462296.05720.4797.02817.296.29916.397.381014.0598.121116.5397.381221.5295.591319.4197.131420.0992.5530TSP问题随机路线为:4510111314181276329411710412914813523611187912251411146313108总距离:71.114431TSP问题最优解路线:54314211091181371265总距离:29.340532大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达

8、到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据更准确的应该叫“大数据挖掘”33大数据-资料一天之中,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于时代杂志770年的文字量);卖出的手机为37.8万台,高于全球每天出生的婴儿数量37.1万截止到2012年,数据量已经从TB(1024GB=1TB)级别跃升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)级别。国际数据公司(IDC)的研究结果表明,2008年全球产生的数据量为0.49ZB,2009年的数据量为0.8ZB,2010年增长为1.2ZB,2011年的数量更是高达1.82ZB,相当于全球每人产生200GB以上的数据。而到2012年为止,人类生产的所有印刷材料的数据量是200PB,全人类历史上说过的所有话的数据量大约是5EB。IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。34大数据-案例你开心他就买,你焦虑他就抛华尔街“德温特资本市场”公司首席执行官保罗霍廷每天的工作之一,就是利用电脑程序分析全球3.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论