版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目五供应链大数据挖掘机械工业出版社CONTENTS目录01
认识供应链数据挖掘02
供应链数据挖掘的流程和算法认识供应链数据挖掘01了解供应链数据挖掘
数据挖掘与供应链
数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。数据挖掘与供应链
供应链挖掘起源数据挖掘起源于多种学科,其中最重要的两门是统计学和机器学习
数据挖掘的任务数据总结浓缩数据,通过统计方法或OLAP技术实现数据的总体把握分类用分类模型将数据分派到不同组关联分析找出数据间的关联关系,如“尿布与啤酒”案例聚类分析按相近程度将数据分成子集合,用于缺乏描述信息或无分类模式的数据小案例尿布与啤酒”的故事
关联模型的一个典型场景是市场菜篮分析(MarketingBasketAnalysis)通过挖掘数据派生关联规则,可以了解客户的行为。比较典型的案例是“尿布与啤酒”的故事。在美国,一些年轻的父亲下班后经常要到超市去买婴儿尿布,超市也因此发现了一个规律,在购买婴儿尿布的年轻父亲们中,有30%~40%的人同时要买一些啤酒。超市随后调整了货架的摆放,把尿布和啤酒放在一起,明显增加了销售额。同样的,我们还可以根据关联规则在商品销售方面做各种促销活动。数据挖掘在供应链中的应用
核心应用场景预测需求、优化配送路线、避免废品和抱怨、风险管控、提高采购效率
面临的挑战数据整合难度大、数据质量问题及隐私安全问题需企业优化解决供应链数据挖掘的流程和算法02供应链数据挖掘的流程
预处理预处理包括异常点检测、比例缩放等
模型评估解释模型以辅助决策,流程具有高度反复性数据收集数据收集分设计实验和观察法
解释模型与得出结论选择并评估数据挖掘模型常见数据挖掘算法决策树起源于概念学习系统CLS(ConceptLearningSystem)。结构简单、分类速度快,适用于大规模数据处理决策树表示法决策树构造思想决策树的方法特点树状结构,它从根节点开始,对数据样本进行测试,根据不同的结果将数据样本划分成不同的数据样本子集,每个数据样本子集构成一子节点量通过将大量数据有目的分类,从中找到一些有价值的,潜在的信息。决策树的生成是一个从上至下,“分而治之”(Divide-And-Conquer)的过程,是一个递归的过程。小案例决策树模型在某地电视机生产中的应用
为了适应市场的需要,某地准备扩大电视机生产。市场预测表明:产品销路好的概率为0.7;销路差的概率为0.3。备选方案有三个:第一个方案是建设大工厂,需要投资600万元,可使用10年;如销路好,每年可赢利200万元;如销路不好,每年会亏损40万元。第二个方案是建设小工厂,需投资280万元;如销路好,每年可赢利80万元;如销路不好,每年也会赢利60万元。第三个方案也是先建设小工厂,但是如销路好,3年后扩建,扩建需投资400万元,可使用7年,扩建后每年会赢利190万元。小案例
各点期望:点②:0.7×200×10+0.3×(−40)×10−600(投资)=680(万元)点⑤:1.0×190×7−400=930(万元)点⑥:1.0×80×7=560(万元)小案例
比较决策点4的情况可以看到,由于点⑤(930万元)与点⑥(560万元)相比,点⑤的期望利润值较大,因此应采用扩建的方案,而舍弃不扩建的方案。把点⑤的930万元移到点4来,可计算出点③的期望利润值。点③:0.7×80×3+0.7×930+0.3×60×(3+7)−280=719(万元)最后比较决策点1的情况。由于点③(719万元)与点②(680万元)相比,点③的期望利润值较大,因此取点③而舍点②。这样,相比之下,建设大工厂的方案不是最优方案,合理的策略应采用前3年建小工厂,如销路好,后7年进行扩建的方案。常见数据挖掘算法遗传算法模拟自然界生物进化过程与机制求解极值问题的一类自组织、自适应人工智能技术。特点流程优点从问题解的中集开始嫂索求解时使用特定问题的信息极少极强的容错能力采用随机方法隐含的并行性仿生全局优化包含5个基本要素:问题编码,初始群体的设定,适应值函数的设计,遗传操作设计,控制参数设定。常见数据挖掘算法神经网络以重复学习的方法,将一串例子交与学习,使其归纳出足以区分的样式。基本介绍特点神经网络是一种可以容易的应用于预测、分类和聚类的强有力工具。具有良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性。小贴士
MP模型属于一种阂值元件模型,它是由美国McCulloch和Pitts提出的最早神经元模型之一。MP模型是大多数神经网络模型的基础。常见数据挖掘算法关联规则分类算法通过发现数据集中的关联规则来预测新数据的分类标签关联规则分类算法介绍在此算法中,数据集通常由项
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 总包单位责任制度
- 我国证券民事责任制度
- 打灰站责任制度
- 扫恶除霸年终责任制度
- 技工室人员岗位责任制度
- 折板机安全生产责任制度
- 报关企业岗位责任制度
- 指导教师责任制度
- 控烟责任制度
- 摔伤责任制度
- 第四章 物质的特性 单元测试-七年级科学上册同步备课系列(浙教版)
- JG/T 118-2018建筑隔震橡胶支座
- 水平定向钻进管线铺设工程技术规范
- 香港公司意向协议书
- 《西藏自治区地质灾害危险性评估报告编制及审查技术要求(试行)》
- TCPQSXF006-2023消防水带产品维护更换及售后服务
- 物业入场通知函
- 2024年中国科学技术大学少年创新班数学试题真题(答案详解)
- LightTools优化模块用户指南
- 2024年山东济南中考满分作文《为了这份繁华》
- 2024年八年级历史下册 第一单元 中华人民共和国成立和向社会主义过渡 第2课《人民政权的巩固》说课稿 华东师大版
评论
0/150
提交评论