大数据财务分析与决策 课件 第6章 智能供应链管理_第1页
大数据财务分析与决策 课件 第6章 智能供应链管理_第2页
大数据财务分析与决策 课件 第6章 智能供应链管理_第3页
大数据财务分析与决策 课件 第6章 智能供应链管理_第4页
大数据财务分析与决策 课件 第6章 智能供应链管理_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第6章

智能供应链管理XX老师本章内容

6.1传统和智能化供应链管理的比较6.2智能供应商推荐6.3智能客户风险评价机器学习平台网址

01传统和智能化供应链管理的比较6.1.1传统供应链管理的不足6.1.2智能化供应链管理的优势6.1.1传统供应链管理的不足供应链管理是指对供应链涉及的全部活动进行计划、组织与管理,以确保产品或服务能够以最低的成本、最高的效率和最佳的质量,从原材料供应商流向最终客户。供应链管理的定义与传统供应链管理的不足信息孤岛问题严重。企业内部不同部门之间以及不同企业之间都缺乏有效的信息共享机制,降低企业的决策效率,阻碍了整个供应链的高效运作。对动态环境适应性差。传统的供应链管理方法大多基于静态或相对稳定的假设,难以对快速变化的市场需求和突发事件做出准确、及时的反应。成本与效率难以兼顾。技术手段有限,依靠人工,导致企业不得不在控制供应链管理成本和提高供应链管理效率之间寻找最佳平衡点,最终的决策结果可能是在成本约束下的一种妥协。010203传统供应链管理的不足协同度与透明度提升数据驱动决策通过大数据技术实时收集并分析供应链上各环节的数据,从而为企业提供更为准确、及时的决策支持。实现了各环节之间的紧密连接,信息的实时共享不仅提升了供应链的透明度,还加强了各环节之间的协同合作。智能化管理降低成本实现诸多操作的智能化和自动化,不仅能够降低人力成本,还大幅提升了运营效率和准确性。客户需求的响应更及时风险管理能力提升通过大数据分析,帮助企业及时发现并预警各种潜在风险。借助实时的大数据分析技术,更准确地把握市场动态和客户需求,从而及时调整生产和供应链策略,更好地满足客户需求。6.1.2智能化供应链管理的优势02智能供应商推荐6.2.1实训任务要求与特点6.2.2基于随机森林的供应商推荐(1)供应商在历史交易中的中标次数,作为判断该供应商是否具有合作价值的依据;(2)供应商基本信息,包括供应商名称和编码;(3)供应商财务指标,包括注册资金、资产规模、固定资产、营业额、年利润等;(4)供应商非财务信息,包括企业性质、员工数量、研发能力、制造工艺、质量保证能力等。其中,后两类变量共有23个,是此次任务的预测因子。(1)对供应商数据进行导入和清洗;(2)计算供应商中标次数的累积频率,将累积频率超过80%的供应商视为贡献最大的20%,即值得推荐的供应商,在此基础上,生成名为“是否推荐”的虚拟变量,作为预测目标;(3)将供应商数据按固定比例随机划分为训练集和测试集,选择合适的分类算法进行模型训练、预测和评估,输出推荐的供应商名单;(4)对模型特征的重要性进行分析,展示在推荐供应商时重点考虑的指标及其权重。数据表中的列变量分类任务要求6.2.1实训任务要求与特点本次任务旨在为某制造业企业建立智能化的供应商推荐模型6.2.2基于随机森林的供应商推荐供应商推荐的技术流程供应商推荐的技术流程图供应商推荐属于分类任务,可以采用Logistic回归、决策树、随机森林、XGBoost、深度神经网络等常见的分类算法来完成。结合本次任务的数据特征,我们选择以随机森林模型为例来展示预测过程。6.2.2基于随机森林的供应商推荐步骤一:数据导入与处理0102数据导入导入名为“供应商基础信息数据.xlsx”的原始数据文件。030405删除缺失观测直接删除缺失变量较多的供应商。生成目标变量根据供应商的“中标次数”生成“是否推荐”变量,“是否推荐”取值为1表示中标次数大于或等于20,应推荐该供应商。生成虚拟变量选用类别法对“企业性质”生成虚拟变量,可得到8个哑变量,均以“企业性质_”为前缀来命名。数据标准化处理调整特征变量值的大小,使其符合均值为0、标准差为1的标准正态分布。6.2.2基于随机森林的供应商推荐虚拟变量生成结果在训练集和测试集的划分中,我们将90%的数据作为训练集,10%的数据作为测试集。划分方法采用随机划分,并记录下使用的随机数种子,以备在每次操作时都能得到相同的随机数序列。数据集划分得到的训练集包含141条观测,测试集包含16条观测。划分训练集和测试集模型训练步骤二:随机森林建模过程6.2.2基于随机森林的供应商推荐本次任务的预测目标为“是否推荐”,预测因子为经过处理之后的供应商特征变量。使用随机森林分类模型时需要指定一些重要参数的取值。我们指定参数n_estimators的值为100,即构建100个基学习器(决策树);其他参数均采用默认值。我们利用构建好的随机森林模型对训练集数据进行拟合。样本内预测。用测试集运行,结果显示目标变量的真实值、预测值以及每个供应商被推荐的概率值。模型评估得到分类模型的混淆矩阵。全局特征重要性分析展示各项特征变量对预测目标的取值结果的影响程度,明确评价标准。随机森林模型预测及效果评估6.2.2基于随机森林的供应商推荐步骤三:随机森林模型预测及效果评估模型共分类正确15个测试集样本,把11个真实值为“不推荐”的样本预测为了“不推荐”,同时将4个真实值为“推荐”的样本预测为了“推荐”。右上角的“1”说明模型将一个真实值为“不推荐”的样本错误地预测为了“推荐”。左下角的“0”说明模型没有遗漏需要推荐的样本。随机森林模型混淆矩阵6.2.2基于随机森林的供应商推荐随机森林模型分析图示:模型评估与全局特征重要性分析随机森林模型评估结果全局特征重要性分析结果分类模型的性能评估通常采用准确率、精确率、召回率、F1-score和AUC值等,各指标的取值越大,说明模型的拟合程度和预测效果越好。如图,模型的各项指标取值都很大,综合性指标AUC达到0.9583,这表明模型的拟合效果很好,预测值与实际值之间存在较小偏差,模型的解释能力较强。对供应商推荐模型的分类结果贡献最大的特征变量是供应商的专利数,其次是供应商有无资质证明,说明客户企业十分看重供应商的创新能力和质量保障能力。03智能客户风险评价6.3.1实训任务要求与特点6.3.2基于随机森林的客户风险评价6.3.1实训任务要求与特点预测目标名单属性、是否黑名单客户(是为1)预测因子客户编号、注册资本、实缴资本、出资未到位比例、所属行业二级代码、对外投资企业异常数量占比、净资产收益率(%)、销售利润率(%)、总资产报酬率(%)、盈余现金保障倍数、总资产周转率(次)、存货周转率(次)、应收账款周转率(次)、流动资产周转率(次)、两金占流动资产比重(%)、资产负债率(%)、速动比率(%)、现金流动负债比率(%)、带息负债比率(%)、已获利息倍数、研发经费投入强度(%)、营业现金比率(%)、是否经营异常(是为1)、是否失信被执行(是为1)、是否行政处罚(是为1)、是否环保处罚(是为1)、是否欠税(是为1)、欠税余额占实缴资本比重、是否为纳税非正常户(是为1)、负面涉案占实缴资本比重、是否与本单位发生诉讼(是为1)、是否为建筑企业黑名单(是为1)、本年应收账款周转率(次)、本年应收账款收回率(%)、上年末应收账款周转率(次)、上年末应收账款收回率(%)、应收账款平均账龄变量列表本次任务以某集团公司为例,利用该公司掌握的客户信息,通过构建机器学习模型对客户风险进行智能评价。所使用数据表中的“是否黑名单客户”是基于案例公司提供的黑白名单而生成的虚拟变量。任务要求:(1)对客户风险评价数据进行清洗和计算,生成所需的特征变量;(2)选择合适的分类算法,建立客户风险评价模型,输出黑白名单客户;我们以随机森林算法为例来展示预测过程;(3)进行全局特征重要性分析,展示评价客户风险的关键指标及其权重。6.3.2基于随机森林的客户风险评价客户风险评价的技术流程图客户风险评价的技术流程6.3.2基于随机森林的客户风险评价步骤一:数据导入与处理0102数据导入导入名为“客户风险评价数据”的数据文件,并查看描述性统计结果。030405缺失值填充对高缺失率的四个缺失值按照“企业所属二级行业”的中位数进行分组填充。。生成行业虚拟变量将“企业所属二级行业”转化为虚拟变量,虚拟变量的生成方法选择“类别(属于特定类别则取1,反之取0)”。删除缺失观测删除变量有缺失值的观测记录,在机器学习平台中,这一步可以通过设置一个极小的缺失比例阈值(例如1%)来实现。数据标准化处理调整特征变量值的大小,使其符合均值为0、标准差为1的标准正态分布。在训练集和测试集的划分中,我们将80%的数据作为训练集,20%的数据作为测试集。划分方法采用随机划分,并记录下使用的随机数种子,以备在每次操作时都能得到相同的随机数序列。最终得到的训练集包含264条观测,测试集包含66条观测。划分训练集和测试集模型训练步骤二:随机森林建模过程6.3.2基于随机森林的客户风险评价本次任务的预测目标为“是否黑名单客户”,预测因子为经过处理之后的客户特征变量。随机森林模型对异常值与噪音的容忍度较高,相比于决策树模型有更好的分类性能。使用随机森林分类模型时需要指定一些重要参数的取值.我们指定参数n_estimators的值为500,其他参数可采用默认值。样本内预测。利用测试集运行构建好的随机森林模型,得到目标变量的真实值、预测值以及每个客户被纳入黑名单的概率值。模型评估得到分类模型的混淆矩阵,66条测试集观测记录中,真正例为18,真负例为40,假正例和假负例分别为2和6。模型准确率为0.88,召回率为0.75,精确率为0.9,AUC为0.85全局特征重要性分析通过机器学习平台来查看模型的特征重要性。失信被执行、销售利润率低和总资产报酬率低的客户最有可能成为黑名单客户随机森林模型预测及效果评估6.3.2基于随机森林的客户风险评价步骤三:随机森林模型预测及效果评估随机森林模型混淆矩阵全局特征重要性分析结果04畅销品预测6.4.1实训任务要求与特点6.4.2基于LSTM的物料排产量预测6.4.3畅销品分析6.4.1实训任务要求与特点本次任务以某生产型企业为例,基于其历史经营过程中积累的排产数据,从物料排产数据中洞察市场需求以及消费者偏好的变化趋势。本次任务所需的原始数据表名为“生产型企业排产数据.xlsx”,其中包含信息属于时间序列数据。任务要求:(1)对需要预测排产量的物料进行数据清洗,包括缺失值处理、归一化等。(2)采用LSTM模型,对物料的日排产量进行时间序列预测。(3)将每种物料在未来一个月内的日排产量求和,得到月排产总量。按月排产量降序排列所有物料,排名最靠前的定义为畅销品。或者,基于预测的月排产量与过去一个月的历史月排产量来计算排产量的环比增长率,将增长率最高的物料定义为畅销品。6.4.2基于LSTM的物料排产量预测LSTM时间序列预测的技术流程图LSTM时间序列预测的技术流程步骤一:数据导入与处理01导入名为“生产型企业排产数据.xlsx”的原始数据文件。本任务主要使用到“物料编号”、“单据日期”、“排产量”等三个变量。数据导入02删除上述三个变量缺失的观测记录。在机器学习平台中,这一步可以通过设置一个极小的缺失比例阈值(例如1%)来实现。缺失观测删除03排产数据中可能存在同一物料在同一天内的排产量分多笔来记录的情况,我们需要将这种情况聚合为一条记录。数据聚合6.4.2基于LSTM的物料排产量预测6.4.2基于LSTM的物料排产量预测步骤二:物料筛选数据筛选预测畅销品意味着我们需要先对每种物料的排产趋势进行独立预测,需要逐一筛选出单次预测的物料对象。数据归一化处理对筛选出的物料的历史排产量数据进行归一化处理。考虑到标准化处理后的数值可能含有负数,因此,本任务采用归一化处理。数据归一化处理结果将聚合后的排产量(图中最后一列)进行最值归一化缩放,即通过线性变换,使得数据的最小值映射到0、最大值映射到1,从而将变量的取值范围缩放到[0,1]范围内6.4.2基于LSTM的物料排产量预测步骤三:LSTM建模过程划分训练集和测试集将时间序列数据划分为训练集和测试集时,需要保留客观上时间的先后顺序。我们在保留时序的前提下,将前80%的数据划分为训练集,后20%的数据划分为测试集。构建LSTM模型之前,需要生成时间序列的滞后数据,以供LSTM模型后续训练使用。生成滞后数据是指将时间序列数据中的当前观测值延迟(滞后)若干个时间步,作为特征变量输入到模型中。本例中,我们将时间步数设置为15,即利用过去十五日(t-15、t-14、t-13、…、t-2、t-1)的排产量数据来预测当天(t)的排产量,从而完成模型构建。模型训练6.4.2基于LSTM的物料排产量预测步骤四:LSTM模型预测及效果评估样本内预测利用构建好的LSTM模型在训练集上进行时序样本内预测,得到物料WL0001日排产量的预测值。模型评估基于测试集样本的预测结果,采用均方误差(MSE)、均方根误差(RMSE

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论