




已阅读5页,还剩60页未读, 继续免费阅读
(机械电子工程专业论文)基于数据挖掘的采购决策研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 采购管理和库存管理是新一代的企业管理思想一企业资源计划( e r p ) 中至 关重要的两个问题。在以订单驱动生产的企业生产中,采购数量的准确性( 主 要是材料废品系数的准确性) 直接影响企业的库存状态,而供应商的选择在采 购管理中占用重要地位。要提高采购数量的准确性和优化供应商的选择,就要 对大量数据进行分析以得出有用的信息和知识,而数据挖掘技术恰能很好的做 到这一点。对此,本文利用数据挖掘中的决策树技术和人工神经网络方法,来 分别解决确定材料废品系数和进行供应商选择的问题。 本文首先对材料废品系数和供应商选择这两个问题进行了深入分析,阐明 了它们对e r p 的意义。接下来分别以决策树和b p 人工神经网络原理为基础, 具体研究这两种数据挖掘技术的结构设计原理和实现机制。 对确定材料废品系数,充分利用了决策树对数据集智能分类的特点,采用 信息增益的判定方法,论述了决策树主属性的确定、判定属性标准化、计算信 息增益、决策树的剪枝、测试等问题。 对供应商选择,针对不同类型的供应商制定不同的供应商选择评价指标体 系,以此为基础,论述了如何设计人工神经网络的结构和网络初始参数的选取, 最后讲述了网络的学习和测试。 最后,本文以东莞某墙纸厂的管理信息系统作为案例分析,利用o r a c i e 8 i 和m a t l a b 5 2 作为开发工具分别进行决策树和人工神经网络的试验,进一步 论述了这两种数据挖掘方法设计和实现的全过程。 关键词:数据挖掘;决策树:人工神经网络;材料废品系数;供应商选择 团队项目( 项目号:2 0 0 0 3 0 5 1 ) 的联合资助 a b s t r a c t p u r c h a s eo r d e rm a n a g e i n e n ta n ds t o c kc o n t r o la r et w oc o n l p o n e n t si m p o n a n t o ft h ee n t e r p r i s er e s o u r c ep l a n n i n g ( e r p ) i nt h ee n t e r p r i s e sw i t hm a n u f a c t u r i n g m o d em a k e t o o r d e r ( m t o ) ,t h ea c c u r a c yo fp u r c h a s i n gq u a n t i t y ( i e t h ea c c u r a c y o fs c r a pr a t i oo fm a t e r i a l s ) i n n u e n c e st h es t o c ks t a t e s ,a n ds u p p l i e rs e l e c t i o nh a s i m p o r t a n tp o s i t i o n i nm ep u r c h a s eo r d e rm a n a g e m e n t i no r d e rt o i m p r o v et h e a c c u r a c y o f p u r c h a s i n gq u a n t i t y a n dt os e l e c t s u p p l i e ro p t i m a l l y , d a t a b a s e s u p p o r t e dk n o w l e d g ea c q u i s i t i o n a n dd a t a m i n i n gt e c h n o l o g i e s a r e u s u a l l y u s e dt o c a p t u r eo b j e c t i v e i n f o r m a t i o na n d k n o w l e d g e f t o m m a s s i n f o r m a t i o n i nt h i sd i s s e r t a t i o n ,t w oa d v a n c e dt h e o r i e so fd a t am i n i n g d e c i s i o n t r e ea n da r t i f i c i a ln e u r a ln e t w o r k s ( a n n ) a r e a p p l i e d t oc o n f i r mu t i l i z a t i o nr a t i oo f m a t e r i a l sa n ds e l e c ts u p p l i e r sr e s p e c t i v e l y f i r s t l y ,s c r a pr a t i oo fm a t e r i a l sa n ds u p p l i e rs e l e c t i o na r ea n a l y z e dd e e p l ya n d t h e i ri m p o r t a n c et oe r pi sd e s c r i b e d t h et h e o r yo fd e c i s i o nt r e ea n da n n a r e e x p l a i n e d ,a n dt h e nt l l ea p p l i c a t i o no f t h et w ot h e o r i e si sd e v e i o p e d t ba p p l yt 1 1 ed e c i s i o nt r e et h e o r yt os c r a p 姐t i od fm a t e r i a l s ,i n f o r m a t i o ng a i n d e t e m l i n a n tm e t h o di su s e dt oe s t a b l i s ht h et a r g e ta t t r i b u t e s ,t os t a n d a r d i z et h e d e c i s i o na t t r i b u t e s ,t oc o m p u t ct h ei n f o r m a t i o ng a i n 。t op r u n et h et r e e ,a n dt ot e s t t h et r e e a n ds oo n s i m i i a r l y ,t oa p p l yt h ea n n t o s u p p l i e rs e l e c t i o n 。c o r r e s p o n d i n g e v a l u a t i o n s y s t e mf b rd i f f e r e n tt y p eo fs u p p l i e r si sd e s i g n e d ,t h ea n n ss t r u c t u r ei sd e s i g n e d , a n dt h e t l l ea n nm o d e l i st r a i n e da n dt e s t e d f i n a l l y ,t h ei n f o r m a t i o ns y s t e mi sd e v e l o p e da sp r a c t i c a lr e s e a r c h o r a c l e 8 i a n dm a t l a b 5 2a r ec h o s e na st h et o o l st od e v e l o pt h es y s t e m t h er e s u l t ss h o w n m a tt h ea p p l i c a t i o r e s e a r c hh a si m p o r t a n tp r a c t i c a lv a l u et oc h i n e s ee n t e r p r i s e s k e y w o r d s :d a t am i n i n g ,d e c i s i o n1 l e e ,a r t i f i c i a ln e u r a ln e t w o r k s ,s c r a pr a t i oo f m a t e r i a l s ,s u p p l i e rs e l e c t i o n 第一章绪论 第一章绪论 1 1 课题的研究背景 2 0 世纪9 0 年代以来,随着经济全球化和市场国际化的发展趋势,制造业所面 临的竞争更趋激烈。以客户为中心,基于时间,面向整个供应链,成为在新的形势 下制造业发展的基本动向”j 。 实施以客户为中心的经营战略就要对客户需求迅速做出响应,并在最短的时间 内向客户交付高质量和低成本的产品。这就必须扩大企业的控制范围,面向整个供 应链,把从供应商到客户的全部环节都集成起来。在这种管理需求下,企业资源计 划( e n t e r p r i s er e s o u r c ep l a n n n g ,e r p ) 系统应运而生。 e r p 的概念由美国g a n n e r g r o u p 公司于2 0 世纪9 0 年代初首先提出。它源于 m r p i i ( 制造资源计划) ,吸收了先进的管理思想和信息技术,根据市场的需求对企 业内部和其供应链上各环节的资源进行全面规划、统筹安排和严格控制,以保证人、 财、物、信息等各类资源得到充分、合理的应用。从而达到提高生产效率、降低成 本、满足顾客需求、增强企业竞争力的目的。e r p 是现代管理思想的产物,它将许 多先进的管理,如敏捷制造、精益生产、并行工程、供应链管理、全面质量管理等 体现在e r p 软件系统中,成为崭新的现代制造业的管理手段昭l 【4 】。 要保证e r p 系统的正常运作,首先要保持生产的连续性。由于制造业的一个共 同特点就是必须购买原材料才能进行加工,必须购进配套件、标准件才能进行装配。 为了保证生产正常进行,就要有高质量的原材料和零部件的供应体系。这就涉及到 采购数量控制、供应商的选择和管理、库存管理等方面的问题。 采购管理和库存管理是e r p 系统的重要环节,该部分功能是否能较好的实现直 接决定着生产能否顺利进行,也就决定了能否满足客户购买需求与服务需求,也最 终决定了企业能否获得利润。而该部分有两个关键问题,一是采购数量的控制。采 购数量超过生产的需求量,就会增加库存,提高采购和库存成本。如果采购数量无 法满足生产需求,则会延误产品的交货期,甚至无法按合同交货。第二是供应商的 选择和管理问题,选择合适的供应商,可以恰当的满足企业的购买需求,降低采购 与库存成本,提高企业的竞争力。 广东工业大学工学硕士学位论文 1 2 国内外研究现状 采购管理在企业的生产中占有重要地位,国内外对其研究较多,研究成果主要 在以下两个方面: 1 2 1 采购数量的控制 对采购数量的控制,主要体现在订货批量的确定上。常用的确定订货批量的方 法有如下几种:固定订货批量法、经济订货批量法、按需确定批量法、根据固定时 区的需求确定批量法、时区订货批量法、最小单位费用法、最小总费用法、能l g n e r - w h n i n 法f 5 】【刚。 ( 1 ) 按需确定批量法( l o t f o r i o t ) 根据各时区的净需求量来决定订货量,需要多少定多少,也称为直接批量法。 ( 2 ) 根据固定时区的需求确定批量法( f i x e dp e n o dr e q u i r e m e n t s ) 首先确定每批订货所要覆盖的时区数,然后由所覆盖的几个时区内的需求量来 确定批量。 ( 3 ) 时区订货批量法( 尸e d o do r d e rq u a n t i t y ,p o q ) 这是一种为适应间断性需求环境而在经济订货批量法的基础上修改而得的方 法。这种方法首先根据各时区己知的净需求量数据,用标准的经济订货批量法算出 每年的最多次数,然后用1 年的总时区数除以订货次数,即得到订货的时间间隔。 而每次订货覆盖此间隔内的所有需求。 ( 4 ) 最小单位费用( l e a s tu n i tc o s t ,l u c ) 最小单位费用法实际上是一种试探法,为了确定订货批量,l u c 计算出在不同 批量下的“单位费用”( 即单位订货费用加上单位保管费用) 。单位费用最小的那个 批量将作为订货批量。 ( 5 )最小总费用法( l e a s t r m a ic o s t ,l t c ) 最小总费用法所依据的原理是,当计划期内的订货费用越接近于保管费用时, 这个计划期内的所有批量的订货费用与僳管费用之和也越小。为了达到使总费用最 小的目的,l t c 的具体做法就是选取尽可能使单位订货费用与单位保管费用相接近 的订货批量。 ( 6 ) w a g n e r w h i t l n 法 2 第一章绪论 这种方法的出发点是逐一评审能满足计划期内每个时区净需求量的所有可能的 订货方案,以便找出对于整个净需求量日程表总体最优的订货方案。w a g n e 卜w h i t i n 法的确能使订货费用与保管费用之和最小,所以可用作衡量其他针对间断性需求的 批量确定方法的标准f 1 】o 1 2 2 供应商关系研究 在现代供应链管理中,越来越多的学者把供应链管理看作一种战略性的管理体 系,偏重于研究所有节点企业的战略合作关系,偏向于长期计划的研究,而不再局 限于短期的、基于某些业务活动的经济关系研究。因此,供应商制造商之间的 战略合作关系研究得到重视,其中包括: ( 1 ) 供应链合作关系( s u p p i y c h a i np a r i n e r s h i p s ) 的概念研究: r o b e r t 等人在1 9 9 8 年提出了合作伙伴关系发展的四个阶段;谈判关系阶段、 互助关系阶段、协调关系阶段、战略合作关系阶段【9 1 。g e r a r d 【1 0 1 ,b o w o n 【1 1 1 ,张荣 耀【12 】等都提出了各自对供应链合作关系的定义,并都强调了承诺和效力( p r o m i s e a n de f f e c t i v e n e s s ) 在优化关系中的重要性。 ( 2 ) 供应商联盟( s u p p e r a a n c e s ) 问题: h a 胛3 l ,a 盼e r t o 1 4 1 ,c h a r i e s 【1 5 】,傅伟【1 6 】等人研究并总结出通过供应商联盟能 实现双赢( w i n w i n ) 、整体供应链的高效率等优势。 ( 3 ) 供应链战略合作关系的制约因素研究: f e r g u s o n 【1 7 】。s h e l 【18 l ,李洪波”9 】,许志端倒等指出并阐述了供应链上的买卖 双方,在利用战略合作关系实现真正的双赢优势的过程中,将会面临的各种制约因 素。 上述这些研究都强调了战略管理的重要性,强调相互之间的协作关系,强调企 业与供应商关系及评价选择供应商的重要性。 供应商评价包括评价体系和评价方法两部分内容【2 1 】,对于供应商评价体系, d i c i ( s o ng w 在1 9 6 6 年提出了2 3 项供应商绩效评价准则,在此之后,大量学者对 供应商的评价体系问题进行了广泛、深入的研究,s i a m m 和g o i h a r l 2 2 】、日l 陷m 【2 3 1 、 和k i s e f 2 4 】分别提出了1 3 、1 8 、6 0 条评价标准。对于供应商的评价方法,目前比较 常见的有层次分析法、数据包络分析法等。下面分别对其进行介绍: ( 1 ) 供应商评价体系 3 广东工业大学工学硕士学位论文 谌述勇、陈荣秋( 1 9 9 8 年) 在对神龙汽车公司和2 0 多家汽车零部件供应商调 查的基础上,提出对供应商的评价不能仅仅依据价格,还应考虑供应商在质量、交 货期、批量柔性、交货期与价格的权衡、多样性等方面的水平f 2 5 】。 朱道立等人( 2 0 0 0 年) 对集成化管理软件e r p 的供应商选择进行较深入的讨 论,指出e r p 供应商选择由技术特征、费用、用户服务和供应商特征等四项指标组 成f 2 8 。 马士华、林勇、陈志祥( 2 0 0 0 年) 在供应链管理一书中针对供应链管理环 境下合作伙伴的选择提出了一个综合评价指标体系,并将影响合作伙伴选择的主要 因素归结为四类:企业业绩、业务结构与生产能力、质量系统和企业环境( 羽。 霍佳震( 2 0 0 1 年) 提出应根据供应商的产品类型选择不同的评价指标【2 8 1 。 ( 2 ) 供应商评价方法 1 ) 层次分析法( a h p ) 层次分析法( a h p ) 是一个非常简捷有效的方法c 2 9 1 ,a h p 方法不仅考虑了不确 定的和主观的因素,而且运用了入的经验、洞察力和直觉、更为重要的是层次分析 法中的层次结构关系本身能对影响供应商的各个因素之间的相关性作出理性的判断 【3 0 】。利用a h p 进行供应商选择的步骤如下1 3 1 】: 明确问题:选择最好的供应商。 建立供应商选择问题的层次结构。如图1 1 根据层次结构中供应商选择的准则,两两比较并量化构成相应的判断矩阵, 采用特征向量法确定供应商选择的准则的权重,并判断一致性。 层次单排序,针对每个准则给出各个供应商的评价值,构成每个供应商对应 于每个准则的判断矩阵,计算相应的权重。 层次总排序,计算每个供应商的综合权重,根据权重作为最后选择供应商的 依据。 2 ) 模糊层次分析法 基于模糊层次分析的供应商评价是在层次分析方法的基础上,对同一层次上的 元素,通过成对的重要程度比较,组成模糊比较矩阵。模糊比较矩阵是一致性矩 阵。设模糊比较矩阵为c = ( c d ,则q = 只( 4 ,a ,) ,且满足c g = l ,q ( 其中 、 是比较的对象) 。相应于该模糊矩阵的主特征值的主特征矢量元素的大小,表示了各 评价对象的优先级顺序【3 邻。 4 图1 1 供应商选择的层次结构 f i g 1 1 t h e h i b e r a r c h yo fs e l e c t i n gs u p p e r s 3 1 数据包络分析法( d e a ) 数据包络分析法( d e a ) 是以相对效率概念为基础发展起来的一种新的效率评 价方法,是处理多目标决策的有效方法。根据一组输入数据和输出数据来评价决策 单元( d m u ) 的优劣,即评价各单位的相对效率c 3 4 】。 利用d e a 选择供应商的时候,参与竞争的供应商作为决策单元,对供应商的评 价指标作为输入,最终的输出就是对供应商的评价结果。 由于d e a 方法的评价结论全依赖客观数据,往往不能反映决策者对各准则的偏 好程度,因此出现了对最初d e a 的多种改进方法删。多阶段优化方法通过把供应 商的评价选择分为不同的阶段,每个阶段针对各自的特点选择模型进行优化选择。 目前主要有d e a 结合混合整数规划的方法,多目标规划和d e a 想结合的方法【3 6 】, 根据锥比率和约束锥的概念构造的偏好约束锥d e a 模型等等【3 7 l 。 4 l 作业成本法 作业成本( a c n v i l y b 笛e dc o s t n g ,a b c ) 法的依据是生产加工产生作业活 动,作业活动耗用资源。a b c 法的独特之处在于它以作业( 影响成本的因素) 为中 心,并视之为基本的成本对象,会计人员利用作业成本计算系统汇总生产的所有作 业活动成本,进而确定产品成本【3 8 】。 对供应商进行选择和评价的a b c 法是由r o o d h o 矾k o n i n g s f 3 9 】首先提出 的。该方法针对单一订单,在一组供应商中选择最佳者。其基本思想是,供应商所 供应产品的任何因素的变化都会引起采购企业总成本的变动,价格过高、质量达不 5 广东工业大学工学硕士学位论文 到要求,供应不及时等都会增加采购企业的成本。 上述这些研究均从不同角度对如何对供应商进行选择与评价提供了有益的思 路。 但是,目前对供应商关系的研究和对供应商选择与评价的研究还是基本相互独 立的,尤其是对在战略合作关系基础上的供应商选择与评价这一课题,尚未见到较 为全面和系统的研究成果,以及具体可操作的实旅办法。 1 3 本文工作内容 基于目前的研究现状和开发项目的实际情况,本文在第二章中简要介绍与采购 决策相关的基本概念,如材料废品系数、物料需求计划等,与数据挖掘相关的概念 与理论,包括数据挖掘模型简介及各自的适用范围,为后文的决策树方法和人工神 经网络方法应用研究打下基础。 第三章以决策树原理为依据,采用计算判定属性最大信息增益的i d 3 算法建立 决策树,并利用其解决确定材料废品系数问题,讲述了如何利用决策树分类器自动 地在企业生产信息数据集上对材料废品系数进行分类,得到具有不同应用条件的材 料废品系数,包括决策树的原理、决策树的属性选择度量、决策树用于确定材料废 品系数的具体应用方法、决策树的剪枝与测试等; 第四章以b p 人工神经网络原理为依据,论述了如何利用网络原理解决供应商 选择问题,详细讨论了如何对神经网络的结构进行设计,初始参数的选取方法以及 网络的学习和测试; 第五章在前文研究的基础上,以东莞某墙纸厂的e r p 系统作为案例,利用 o 限c i e 8 i 和m a t l a b 5 2 作为开发工具分别进行决策树和人工神经网络的试验,详 细论述了决策树与b p 人工神经网络的应用过程及试验结果; 最后是本文的总结与展望。 6 第二章采赡决策及数据挖掘技术 第二章采购决策及数据挖掘技术 2 1 采购决策理论 采购环节在供应链中的地位与作用非常重要,因为任何一个制造企业,都必须 从外界获取原材料,以及时满足生产的需要。从企业的整个生产经营过程来看,采 购是企业产品增值过程的起点,是企业核心业务流程的始端。更进一步理解,采购 不仅仅是简单去市场购买所需的原料,而是把一个企业的制造能力扩展到外部资源, 即供应商上。因此,可以将采购环节的管理理解为“外部制造的管理”【4 0 】。 采购的总体目标是五个恰当:恰当的数量、恰当的时间、恰当的地点、恰当的 价格、恰当的来源。影响采购目标实现的因素有多个,在e r p 系统的运行环境下, 其中比较重要的因素包括物料需求计划和供应商的选择。 2 1 1 材料废品系数 为了说明材料废品系数所代表的意义,可以先看一个例子。假设在装配产品a 和b 的时候,每装配一个产品需要一个三极管;当装配a 时,估计有5 的三极管 损坏;而在装配b 时,估计有3 的三极管损坏,在这样的前提下,为生产a 和b 所需的三极管的毛需求要增加组装损耗部分。装配1 0 0 个a 需要1 0 5 个三极管部件 ( 1 0 0 1 0 5 ) 。装配2 0 0 个b 需要2 0 6 个三极管部件( 2 0 0 1 0 3 ) 。对组装过 程中物料损坏情况的估计就是材料废品系数。 材料废品系数是对部件毛需求的调整。当一个零部件在装配它的父项时,可以 根据以往的生产情况,估计到零部件的损失或毁坏。一个项目对不同的父项,损失 率不同。因此,材料废品系数( 以百分数形式表示) 存放在物料清单中】。 物料清单( b o fm a t e r j a i ,简称b o m ) 是组织产品数据的重要形式,是进行 e r p 运算的基础数据。它描述一个父件和其多个子件间的关系,一般由以下几部分 构成:( 1 ) 主物料项是b o m 将要描述的物料项,对于装配关系来说,它就是父件。 ( 2 ) 子物料项是指在形成主物料项之前的前驱物料,对装配关系来说,它就是子件。 ( 3 ) 8 0 m 属性包括所描述的物体形态转变中的条件和控制,对装配关系来说,就是 装配的数量关系和工装夹具。假设产品a 由b 和c 构成,b 由d 和e 构成,组成 7 广东工业大学工学硕士学位论文 的b o m 表如2 1 所示。 表2 1 产品a 的b o m 表 1 a b 2 1t h eb o mt a b i eo fd r o d u c ta 父件子件单位用量材料废品系数 ab11 ac10 bd22 be51 在离散行业中,b o m 表一般称为产品结构树,按构成产品的所有部件、零件、 装配关系和数量要求构成层次结构关系;在流程行业中,b o m 表以产品配方及消耗 定额表示。透过b o m ,最终产品的需求可层层展开,并计算出所有组件、零件及原 材料的需求f 4 2 j 。如果低层零件计划存在问题,通过对b o m 的跟踪,就能确定生成 这一零件需求的上层物料。b o m 信息主要用于物料需求计划的计算、成本计算和库 存管理。 2 1 2 物料需求计划 物料需求计划( m a t e n a ir e q u i r e m e n t sp j a n n i n g ,简称m 只p ) 是e r p 的核心思想 和方法,它解决了企业生产过程中所需要的物料数量及需求时间,从而解决物料库 存、组织生产和物料采购问题。 物料需求计划是采购或制造订单的分时间段的计划,是主生产计划的详细化。 为编制这种订单计划,需要从下列来源中获取数据: 主生产计划: 物料清单文件; 库存文件; 主生产计划:主生产计划( m a s t e rp r o d u c f i o ns c h e d u i e ,m p s ) 制定每一产品 在指定时间段内的生产数量。 物料清单文件:从物料清单文件中得到有关主生产计划项目的零部件、原材料 的数据。 库存文件:库存文件是编制物料需求计划的最后一个数据来源。从这个文件中, 可得孤关于项目可用性和订货信息。 8 第二章采赂决策及数据挖掘技术 m r p 的生成分两步进行,第一步将m p s 按照b o m 进行需求分解形成m r p 需求,即通称所说的毛需求。第二步将m r p 需求对照库存信息生成m r p 需求计划, 即通常所说的净需求 4 3 1 。 由于材料废品系数是放在b o m 表中的,它的准确性将直接影响毛需求的准确 性,进而对采购数量的准确性产生影响。在绝大多数情况下,材料废品系数是由技 术人员根据经验确定的,它的准确性比较差,导致毛需求脱离实际生产需要。而且 由于b o m 的层次性,某一层材料废品系数的偏差,可能造成计算出的最终物料毛 需求与实际需求之间有巨大差距。例如假设有如表2 2 所示的b o m 表。 表2 - 2 某产品的b o m 表 1 - a b 2 2t h eb o mt a b i eo fad r o d u c t 父件子件单位用量( 单位:个)材料废品系数 ab51 5 bc32 cd62 如果在某些情况下,由b 装配a 的材料废品系数可以下降到1 ,那么要生产 1 0 0 0 个a ,通过b o m 表计算出对d 的需求为9 5 0 4 1 个,而实际需要是9 4 5 7 3 个, 计算出的毛需求比实际需求要多4 6 8 个。当毛需求高于实际需求,就会引起库存的 增加。而如果毛需求低于实际需要的时候,可能造成生产的中断,为了避免这种情 况,企业不得不保持一定的库存,这就增加了企业的库存成本和风险。在现代制造 业中,“零库存”越来越成为企业提高竞争力的手段。在这种趋势下,对提高材料废 品系数准确性的要求越来越迫切。材料废品系数的准确度成为影响采购决策的一个 重要因素。 物料的损失或毁坏一般出现在生产环节,而且e r p 系统会忠实记录投入和产出 情况,这就为计算某次生产的材料废品系数提供了依据。但是对企业的每次生产而 言,生产条件不会完全相同,得到的材料废品系数也不只是一个数值,那么能不能 在这些庞杂的数据中,找到某种规律,根据不同的条件确定相应的材料废品系数呢? 数据挖掘技术的出现,使这种需求变为可能。 本文用决策树方法确定材料废品系数,以尽量确保在制定物料需求计划的时候, 所选用的材料废品系数与实际生产情况比较吻合。 9 广东工业大学工学硕士学位论文 2 1 3 供应商的选择 运用m r p 的结果,一方面生成计划的生产订单,另一方面生成计划的采购订 单。在确定采购计划以后,就要选择合适的供应商,以确保采购有恰当的来源。 供应商的业绩对采购方的影响越来越大,在产品质量、产品设计、交货、提前 期、库存水平等方面都影响着采购企业的成功与否。所以现代供应链管理强调从战 略性的角度选择合适的供应商,建立长期的合作伙伴关系f 4 4 】,选择合适的供应商成 为采购方最重要的采购决策之一。 选择供应商,是对企业购入物料的适当品质、适当时间、适当数量、适当价格 与适当地点的总体进行综合考虑而作出的选择起点与归宿。在选择供应商的实际运 作中,应该依据不同的目标选择不同类型的供应商。对于短期或某短暂市场需求 而言,只需选择普通供应商满足需求则可,以保证成本最小化;对于长期需求而言, 要求供应商能保持较高的竞争力和增值率,因此最好选择战略性供应商;对于中期 需求面言,可根据竞争力和增值率对供应链的重要程度不同,选择不同类型的供应 商( 有影响力的或竞争性技术性的供应商) 。本文利用b p 神经网络的方法进行供 应商的选择。 2 2 数据挖掘 2 2 1 数据挖掘的概念 数据挖掘( d a f am i n i ng ,d m ) ,简单地说,就是从一个数据仓库中自动的发现相 关的模式,进一步说就是从大量的、不完全的、有噪声的、模糊的、随机的数据中, 提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,是 一种从大型数据库或数据仓库中提取隐藏的预测性信息的新技术【惦】。数据挖掘技术 是面向应用的,它不仅是面向特定数据库的简单检索查询调用,而且要对这些数据 进行微观乃至宏观的统计、分析、综合和推理,以指导实际问题的求解【4 6 】。它能发 现潜在的模式,找到最有价值的信息,指导商业行为或辅助科学研究。 数据挖掘是随着计算机的广泛应用和数据的大量积累而发展起来的,它的技术 基础是人工智能【4 7 j 。在很大程度上,数据挖掘是人工智能的某些成熟技术在特定的 应用系统中具体而微小的应用。数据挖掘虽然以人工智能为基础,但其规模和难度 第二苹采购决策及数据挖掘技术 都大大降低,而且除人工智能外,数据挖掘还结合了传统的统计分析方法、模糊数 学方法等,以数据仓库为研究对象,形成了数据挖掘的方法和技术。 数据挖掘的任务一般可以分为两类:描述和预测。描述性挖掘任务发现数据库 中数据的一般特性:预测性挖掘任务在当前数据上进行推断,以进行预测。数据挖 掘常见的数据模式有概念类描述、关联分析、分类和预测、聚类分析、孤立点分析、 演变分析。本文所采用的决策树和神经网络的方法都是属于分类和预测的数据模式。 数据挖掘利用了人工智能和统计分析的进步成果。但它不是要替代传统的统计 分析技术,而是统计分析方法学的延伸和扩展【4 8 j 。 统计学在数据样本选择、数据预处理等数据挖掘的步骤中有重要的作用阳j 。但 统计学研究的焦点是小规模样本采集和小规模数据集处理的问题,它着眼于线性模 型、参数估计、严格分类的参数模型上,对较大的数据集、非线性问题则有些力不 从心,而且大多数数据库用户并不具备恰当使用统计学知识的能力。而数据挖掘恰 好能解决统计所不能解决或解决不好的问题:数据挖掘中的神经网络等模型能够解 决非线性问题;数据挖掘的多种模型都具有人工智能的特点,在足够多的数据和充 分大的计算能力支持下,它们几乎不用人的关照就能自动完成许多有价值的功能。 2 2 _ 2 数据挖掘方法和技术 数据挖掘与数据库新的发展技术数据仓库有着密切的联系。数据仓库技 术源于数据库技术,它的主要设计思想是将分析决策所需的大量数据从传统的操作 环境中分离出来,把分散的、异质的操作数据转换成集中统一的、面向主题的新型 数据结构。数据仓库可以定义为:数据仓库是一个面向主题的、集成的、不同时间 的、稳定的数据集合,它为数据挖掘提供了数据基础。 数据挖掘的经典技术主要包括统计、近邻、聚类三个经典方法【5 1 l ,它们的可行 性都是经过长期实践检验的。 ( 1 ) 统计 统计是涉及数据收集和描述数学的分支,它是由数据驱动的,并用来发现模式 和建造模型。统计之所以算作数据挖掘的一种方法是因为二者都是以大量的数据为 研究对象,统计着重于分析建立的回归预测模型。并对某些时间进行预测,而数据 挖掘所包括的内容要广阔的多,它不仅进行趋势预测,而且还可以发现相关的模式 和内在的关联。 1 1 广东工业大学工学硕士学位论文 ( 2 ) 最近邻 最近邻技术以与人们思维方式相似的方式工作一检测最接近的匹配样本,即 相互之间“接近”的对象也会有相似的预测值。这样,如果知道了其中一个对象的 预测值,就可以用它来预测它最近的邻居对象。 ( 3 ) 聚类 聚类用于将记录聚集在一起。它直接比较样本中各样本之间的距离,把距离较 近的归为一类。而将距离较远的分在不同类中【5 2 1 。 随着数据挖掘技术应用领域的不断扩展,又出现或改进了一些新的数据挖掘方 法,主要包括决策树、神经网络和规则归纳。 ( 1 ) 决策树方法信息论方法) 决策树方法是利用信息论的原理建立决策树,树的每个分支都是数据元组的一 个共性,树叶是带有分类的数据分割。决策树的分割是基于特定原理的,即对某些 重要的信息做出预测,同一个分割中的记录之所以会落在一起,是因为它们对要预 测的信息是相似的。从决策树中得到的分割同时还带有对它本身进行定义的一些特 性的描述。因此,尽管决策树和生成决策树的算法比较复杂,但结果却可以用一种 很好理解的方式表示出来,这对商业用户来说是非常有用的。 ( 2 ) 神经网络 神经网络是在计算机上运行的实现模式识别和机器学习算法的计算机程序,通 过对大量历史数据库的学习和计算来建立预测模型。它的发展源于神经生物学家及 心理学家对于研究及测试模拟神经计算的探索。它是理论化的人脑神经网络的数学 模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。神经网络 能够进行复杂的逻辑操作和非线性关系的实现,而且它对噪声数据具有很强的承受 能力以及对未经训练的数据进行分类的能力。 ( 3 ) 规则归纳 规则归纳也是数据挖掘的一种主要形式,它实现将数据中所有可能的模式系统 地抽取出来,然后再估计它们的正确性和重要性,以判断模式令人信服的程度有多 高,再次出现的可能性有多大。 1 2 2 3 基于数据挖掘的采购决策 2 3 1 基于数据挖掘的材料废品系数确定方法 确定材料废品系数的问题属于“有指导的学习”,即模型的学习是在被告知每个 训练样本属于哪个类的“指导”下进行的,因此不能利用聚类等“无指导的学习” 的分类方法。 利用贝叶斯分类等方法来实现分类则有一定的应用困难,因为目前尚无较好的 软件工具来实现之。 人工神经网络的方法用于分类的优点是对噪声数据的承受能力高,但其明显的 缺点是结果的可解释性较差,即不能对分类结果做出较明确的解释,这一点是不符 合确定材料废品系数的要求的。 因此本文采用决策树的方法,它有如下的优点: 自动对数据库或数据仓库中的数据按照分类目的进行分类 决策树的分类结果具有良好的可解释性 在大量数据的前提下的分类效率和正确性较高【5 3 1 2 3 。2 基于数据挖掘的供应商选择方法 供应商的选择问题,已经有不少学者对此做了研究。如运用层次分析法( a h p ) 选择合作伙伴,毛宁等人提出的利用定性搜索算法来选择合作伙伴【洲,马鹏举【3 2 】等 人提出的利用模糊层次分析法( f a h p ) 等。a h p 法让评价者给出各因素话两比较 的重要性等级。因而可靠性高、误差小,但在影响因素较多时,其判断矩阵难于满 足一致性要求,因此仅适用于影响因素较少的情况,而本文的供应商尤其是战略伙 伴型供应商评价指标体系比较完整,指标较多,因此不适用利用层次分析法或模糊 层次分析法。而定性搜索算法应用的前提条件则是需要有大量的备选供应商以供选 择,比较适用于从大量备选合作伙伴中准确挑选出合格者,而本文所讨论的问题并 不具备这样的条件。本文所要解决的实际上是如何充分利用先前的成功判定案例和 现有专家的知识来解决今后供应商的选择问题,可以说是一个有关预测的问题。 利用b p 神经网络原理解决此类问题,可以建立接近于人类思维模式的定性与 定量相结合的选择模型,然后通过对给定样本模式的学习,使网络获取先前成功案 1 3 1 。,。,。二釜三些盔茎三:鐾耋耋垒鎏二。,。,。一 例的经验并获取专家正确的主观判断、直觉思维及对目标重要性倾向,当对合作伙 伴做出综合评价时,可再现评价专家的经验、知识和直觉思维并模拟先前的成功案 例,从而使做出的决策更加接近最优。 2 4 小结 本章介绍了e r p 系统中物料需求计划的数据来源,以及在现代供应链管理中, 在不同的条件下对供应商进行选择的方法。 e r p 系统在生成物料需求计划的时候,材料废品系数的准确度直接影响采购数 量的准确性。而材料废品系数的确定与企业的生产条件有关,利用企业已有的大量 生产信息确定材料废品系数,可以提高它的准确度,从而提高采购数量的准确性。 在选择供应商的时候,可以根据以往成功选择供应商的大量经验信息,为供应商的 选择提供参考。 通过数据挖掘,我们可以从大量信息中找到有用的知识。其中,决策树方法可 以用来确定材料废品系数。而b p 神经网络方法可以再现成功选择供应商的经验, 并用来选择恰当的供应商。 1 4 第三章基于决策树的材料废品系数计算方法 第三章基于决策树的材料废品系数计算方法 3 1 决策树原理 决策树是一个类似于流程图的树结构,其中每个内部节点表示在一个属性上的 测试,每个分枝代表一个测试输出,而每个树的叶节点代表类或类的分布。树的最 顶层节点是根节点。决策树归纳学习是数据挖掘中最重要的内容之一,可用于知识 的自动获取过程。通过决策树进行分类,是知识获取过程中最为常用而有效的方法。 一棵典型的决策树如图3 1 所示,它表示的概念是顾客是否购买打印机。内部节点 用矩形表示,而树叶节点用椭圆表示。为了对未知的样本分类,样本的属性在决策 树上的内部节点测试。依据由根到存放该样本预测的叶结点的路径,决策树能够较 容易的转化为分类规则。 图3 1 概念“购买打印机”的决策树 f i g 3 1t h e d e c i s i o nt r e ef o rp u r c h a s ;n gp i n t e r s 3 1 1 决策树构造原理 创建一棵决策树可以递归地实现,首先选择一个属性作为根节点,然后把该属 性每一个可能的值作为子节点。这样就把整个数据集分成了几个子集,根节点的属 性的每个值都是一个子集。现在这个过程可以递归地应用到每个子树上进行进一步 地划分。在任何时候,如果子集中的所有元素都是同一类或满足一定标准,那么就 停止划分。决策树的归纳算法很多,如i d 3 、c 4 。5 、c a r d 、c h a i d 等,其中应用 最广的是i d 3 归纳方法,本文就采用这种方法。 i d 3 算法的基本策略如下( 结合后面的算法) : ( 1 ) 算法使用信息增益的基于熵的度量作为启发信息,选择能够最好地将样 1 5 。l ,。,。三耋:翟呈型耋耋警銮耋箜塑垒圣。,。,。一 本分类的属性( 步骤1 ) 。该属性成为该节点的“判定”或“决策”属性。 ( 2 ) 根据决策属性创建节点( 步骤2 ) 。 ( 3 ) 如果样本都在同一个类,则该节点成为树叶,并用该类标记( 步骤3 和 4 ) 。 ( 4 ) 对决策属性的每个己知的值创建一个分枝,并据此划分样本( 步骤7 、 8 ) 。 ( 5 ) 使用同样的过程递归地形成每个划分上的样本判定树。 ( 6 ) 递归划分步骤仅当下列条件之一成立时停止: 给定节点的所有样本属于同一类( 步骤3 和4 ) 所有剩余决策属性取值完全相同( 步骤5 ) 。在此情况下,使用多数表 算法 输入 输出 步骤 决( 步骤6 ) ,这涉及将给定的节点转换为树叶,并用样本中的多数所 在的类标记它。 遍历了所有决策属性( 步骤1 0 ) 。 d e c i s i o n j r e e 由给定的数据产生一棵决策树 训练样本s a m p l e s ,由离散值属性表示;候选属性的集合a n r b u t e - i i s t 一棵决策树 ( 1 ) 选择a n r _ b u t t l i s t 中具有最高信息增量的属性d e c i s i o n - a i n r i b u t e ( 2 )标记节点n 为d e c j s j o n a n r j b u t e ; ( 3 ) i fs a m p i e s 都在同一个类c ,t h e n ( 4 ) 返回n 作为叶节点,以类c 标记; ( 5 ) i fa n n b u t e - l i s t 取值唯一,l h e n ( 6 ) 返回n 作为叶节点,标记为s a m p i e s 中最普通的类;多数表决 ( 7 ) f o r e a c h d e c i s i o n - j m 曲u t e 中的已知a l ,划分s a m p i e s ( 8 ) 由节点n 长出一个条件为d e c i s i o n a l t r b u t e = a i 的分枝; ( 9 ) 候选属性集合a 钍曲u t e - j i s t 中去除属性d e c i s i o n m r i b u t e ; ( 1 0 ) i fa n r | b u t e j _ s t 不为空,t h e n 转到步骤( 1 ) 1 6 一一。 。耋翟鲨鲨鲨塑墼登篮鍪。一 3 1 2 决策树属性选择的信息增益度量 上节讲述了决策树的构造方法与步骤,其中在算法的第6 步中,最高信息增量 的确定需要利用信息论方面的理论。以下将简述此算法的基本原理。 在树的每个节点上使用信息增益( 1 n f o r m a t i o ng a i n ) 度量选择决策树属性,这种 度量称作属性选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 病理考试题及答案中专
- 板子焊工考试题及答案
- 安全评考试题及答案
- hse培训考试题及答案
- crc初级考试题及答案
- cdr考试题及答案2019
- 服务公司物业管理制度
- vip体检随访管理制度
- 服务窗口人员管理制度
- 公司第三方开源管理制度
- 创业基础理论与实务(宁波财经学院)知到智慧树章节答案
- 《燃气分布式能源站调试及验收规程》
- 土地租赁协议书样本
- 《某飞机场物业管理服务方案》
- 移动OA系统建设方案
- 2024年重庆高考化学试题卷(含答案解析)
- 人体器官讲解课件
- DB3301-T 0256-2024 城市生态河道建设管理规范
- 2023年南京市卫健委所属部分事业单位招聘考试试题及答案
- 《管理会计》说课及试讲
- 二手农机买卖合同协议书
评论
0/150
提交评论