下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 基于数据挖掘技术的物流配送成本估计研究 秦智聃 陈章跃 弓宪文摘 要: 传统物流配送成本估计方法对于配送费用数据的支持度阈值计算不够精确,导致物流配送成本估计困难,为此研究基于数据挖掘技术的物流配送成本估计方法。该方法通过聚类分析,将庞大的费用数据划分成具有相同特征的数据类簇,找出其中出现频繁的数据类簇计算每一特征属性下的支持度阈值,挖掘出数据之间的关联规则,利用回归差分移动平均法搭建数学模型,以此实现物流配送成本估计。实验结果表明,与传统成本估计方法相比,所研究的方法对于数据支持度阈值计算更加准确,挖掘到的关联规则更详尽,估计
2、出的物流配送成本更加精确。由此可见,所研究的方法更适用于企业物流配送成本估计要求。关键词: 物流配送; 成本估计; 数据挖掘技术; 数学模型搭建; 阈值计算; 关联规则挖掘: tn911.1?34; tp361 : a : 1004?373x(2020)13?0183?04research on logistics dist
3、ribution cost estimation based on datamining technologyqin zhidan, chen zhangyue, gong xianwen(chongqing university of education, chongqing 400067, china)abstract: the traditional logistics distribution cost estimation method is not accurate enough to calculate the support threshold of the distribut
4、ion cost data, which leads to the difficulty of logistics distribution cost estimation. therefore, the logistics distribution cost estimation method based on data mining technology is studied. with this method, the huge cost data is divided into the data type of clusters with the same characteristic
5、s by means of cluster analysis, the data class clusters which appear frequently are found out to compute the support threshold of each feature attribute, the association rules between the data are mined, and the mathematical model is built with the regression difference moving average method. the lo
6、gistics cost estimation method is realized in this way. the experimental results show that, in comparison with the traditional cost estimation method, the proposed method is more accurate in calculating the data support threshold, its mined association rules are more exhaustive and its estimated log
7、istics distribution cost is more precise. it can be seen that the method is more suitable for cost estimation of logistics distribution enterprises.keywords: logistics distribution; cost estimation; data mining technology; mathematic model building; threshold value calculation; association rule mini
8、ng0 引 言數据挖掘技术旨在处理数量庞大、信息类型复杂、结构形式多样化的数据信息。而当前的物流运输配送行业发展迅速,并且一些企业也将物流配送作为发展外延,因此使得企业财务部门对于物流配送成本估算有了更高的要求1。传统的成本估计方法考虑的影响因素较少,对于相关数据的划分也不够细致,这就使管理人员在查询关联数据时,数据基数变小,估计出的成本数值会影响企业的发展。为此本文研究一种基于数据挖掘技术的成本估计方法,该方法对相关费用数据进行聚类分析、分类分析、异常分析、组群分析以及关联性分析,通过找到数据之间隐含的潜在规则,提升成本估计的准确度,确保企业的成本预算2的准确性。1&
9、#160; 数据挖掘技术的物流配送成本估计方法1.1 聚类物流配送数据数据挖掘技术与计算机科学相关,通过数据收集、回归分析、数据聚类、关联规则以及神经网络方法,可以从海量数据中抓取隐藏的具有特殊关联属性的数据信息,预测或估计有关数据。物流配送成本主要在配送流程和配送环节产生,主要包括分拣费用、流通加工费用、装配费用以及运输费用。其中,分拣费用包含分拣人工费用、分拣设备费用;流通加工费用包含流通加工设备、加工材料以及在流通加工过程中从事加工活动的管理人员、工人及有关人员工资、奖金等费用的总和;装配费用包含装配材料、人工以及相关辅助费用;运输费用则包含车辆费用和其他运营间接费用3。由此
10、可知,配送成本细化后,其中的费用类别多,二阶科目更加繁琐,因此,利用数据挖掘技术中的数据聚类手段,根据配送成本相关数据的近似情况,将数据信息组成多个不同类别或簇,保证同一个类别或簇中的数据彼此之间存在一定关联属性,而不同类别或簇之间存在一定的数据差异。因此聚类物流配送成本相关数据的计算公式为:式中:m表示聚类后的类簇数量,i,j分别表示具有一个特征属性的簇;nj表示j数据簇中的项目数;k表示数据项;d表示空间维度;ajkd代表数据簇j中的第k项数据;bid代表數据簇i中的初始中心节点在d维度空间中的数据4。将配送成本进行聚类的部分示意图如图1所示。通过图1a)可以看出:w代表总的物流配送成本,
11、其中,包含了n个相关费用数据,聚类后得到图1b),可知按照不同的费用类型,将这些数据打散,根据相同属性特征进行划分可得到新的同种类的数据类簇5。1.2 挖掘数据之间的关联规则根据聚类后的成本数据类簇,找出同一特征数据中不同信息之间的内在关联。各结构通常被用来列举那些存在可能性的数据类簇,一般包含c个不同项的数据类簇,可能会存在2c个频繁数据类簇,并且会有s个规则6。因此,在这些复杂繁琐的数据集合中找出满足最小支持阈值的所有频繁数据类簇,再从这些类簇中挖掘出具有高置信度的关联规则,频繁数据类簇之间可能存在的规则可以利用式(2)进行表述:根据表1中的频繁数据类簇项目,计算得到每一数据之
12、间的支持度,以此得到数据之间每一种关系的关联程度,找出不同费用之间存在的关联规则10。1.3 搭建数学模型估计成本在挖掘出配送成本中各项数据关联规则的基础上,搭建一个数学预测模型,估计物流配送的总成本。物流配送成本中,总的来说主要涉及到人工成本和机械设备成本两大类,因此配送成本在估计的过程中,根据分配和运送两个流程中的管理人员、装卸人员以及运送人员的调度,计算每一工作阶段中产生的直接人工费用以及运输费用11。将细化后的费用上传到财务部门的记账管理系统中,按配送时间,记录货物种类、配送人员、使用车辆等摘要,分别记录每一操作流程下的费用,登录财务记账页面,输入相关数据,如图2所示12。
13、从图2a)操作页面可知,点击该系统中的记账模块,将配送费用类数据输入到上述财务系统中,统计每种费用的总数据,得到的结果如图2b)所示。月初时,打开该系统的业务往来模块,点击月末处理按键,结转上月的物流配送成本,将导出的表格上传到成本估算系统中13。基于回归差分移动平均方法,根据线性时间序列对配送成本进行预测估计。通过多次差分计算处理,将动态变化的时间序列转换成平稳的序列。设置一个参数为,将其当成差分次数,利用,p,q构建估计模型,并对转换后的平稳序列进行建模,然后将其替换为原有序列14。以,p,q为计算参数的估计模型,其预测表达式如下所示:式中:y表示物流配送成本估计值;m表示费用数据之间存在
14、的m个规则;p表示特征参数p下的模型;q表示特征参数q下的模型;q表示在特征参数q下的随机误差。上述计算过程中,要保证时间序列的稳定性。当数据序列存在波动性特征时,要对其进行差分处理,根据自回归系数以及偏回归系数定阶所要处理的目标数据序列。至此,根据以往月份或年度的成本数据,利用数据挖掘技术估计出此阶段的物流配送成本15。2 仿真实验搭建一个仿真实验平台,利用该平台检测数据挖掘技术所估计出的物流配送成本,为了令实验结果更加直观,将该估计方法与传统估计方法相比较,分析两种成本估计方法下,所研究的数据挖掘技术较传统方法而言,其具有大量物流配送数据的处理能力。2.1 实验准备此次实验通过搭建hadoop实验云平台,利用某一大型物流企业财务管理部门所记录的从20052015年的395 gb配送费用相关数据,按照年份分别预测当年的运输成本。仿真实验环境如图3所示。图3中设备1为仿真实验计算机,设备2为专用服务器,设备3为数据实时变动液晶显示屏幕,设备4为网络稳定路由。此次实验选择两台型号、配置相同的计算机展开实验,该计算机cpu为3.4 ghz,8 gb内存,500 gb硬盘空间,选用高速计算网络和千兆储存网络,打开无线路由连接计算机。该计算机的操作系统为ubuntu 18.04,java执行环境为jdk?7u21?li
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中职大数据应用技术(数据采集技术)试题及答案
- 2025年大学化妆品技术(化妆品研发)试题及答案
- 2025年中职(物联网应用技术)传感器应用综合测试题及答案
- 2025年大学大三(畜牧兽医法规)畜牧兽医行业法规应用阶段测试题及答案
- 2025年大学食品科学与工程(食品添加剂)试题及答案
- 2025年大学环境设计(公共空间设计)试题及答案
- 2025年大学大四(历史学)世界近代史工业革命测试题及答案
- 2025年高职(荒漠化防治技术)植被恢复技术专项测试试题及答案
- 巴洛克纹样介绍
- 运维管理制度
- 2026年扬州工业职业技术学院高职单招职业适应性测试参考题库含答案解析
- 2026国家电投集团苏州审计中心选聘15人笔试模拟试题及答案解析
- 2026年桐城师范高等专科学校单招职业技能考试题库及答案1套
- 雾化吸入操作教学课件
- 上海市杨浦区2026届初三一模英语试题(含答案)
- 2025年小学图书馆自查报告
- 【语文】广东省佛山市罗行小学一年级上册期末复习试卷
- 2025年医疗器械注册代理协议
- 新疆三校生考试题及答案
- 2025新疆亚新煤层气投资开发(集团)有限责任公司第三批选聘/招聘笔试历年参考题库附带答案详解
- 围手术期心肌梗塞的护理
评论
0/150
提交评论