数据挖掘技术论文数据库技术论文——数据挖掘技术在饰品设计中的应用.doc_第1页
数据挖掘技术论文数据库技术论文——数据挖掘技术在饰品设计中的应用.doc_第2页
数据挖掘技术论文数据库技术论文——数据挖掘技术在饰品设计中的应用.doc_第3页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据挖掘技术论文数据库技术论文数据挖掘技术在饰品设计中的应用摘 要本文简要阐述了饰品设计的现状,提出了将数据挖掘技术应用到饰品设计的方案,并使用Microsoft时序模型对企业数据进行了销售预测,且对该挖掘模型进行了验证。这为饰品企业的决策提供了新的思路,有利于帮助领导更准确地进行市场定位,把握未来饰品发展趋势,具有一定的实用价值。 关键词数据挖掘 Microsoft时序 饰品设计 销售预测 决策 自从有人类开始,饰品便与服装同时出现,发展到今天,已有久远的历史。怎样将饰品融入现代文化观念,怎样设计新的饰品,及什么样的设计才能被消费者接受,都是新一代饰品设计所面临的新问题。饰品设计虽然出自设计师之手,但并不是凭空想象的,而是根据企业年度计划书进行设计的,针对不同区域、不同民族,饰品的设计风格、材料、款数及生产总量都是不同的,企业领导必须要先了解往年的饰品销售情况以及各地区的特色,才能准确地定位饰品流行趋势。信息化的推进让企业积累了大量的数据,企业领导要进行决策前需要了解各个业务部门的数据。而这些数据通常是零散的、不规范的,像噪声数据、空缺数据和不一致数据等问题都会给领导的决策带来了困扰。现在企业面临的一个共同问题是企业数据量非常大,而其中真正有价值的信息却很少。数据挖掘的出现,给企业决策者带来了辅助决策支持。企业可以利用先进的数据挖掘和商务智能分析技术,通过对历史信息的分析、挖掘实现对饰品流行趋势信息的预测,提高市场命中率,降低滞销率。 一、数据挖掘技术 1.数据挖掘概念 数据挖掘是一种新的商业信息处理技术,其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其它模型化处理,从中提取辅助商业决策的关键性数据。利用从不同数据中发现的已知结果,预测是对未来产品需求的分析,企业领导可以在预测的基础上针对未来需求做出决策,利用最少的资源获取最大化的利润,准确的预测可以帮助企业进行更好的市场定位和制定更有效的生产计划,减少失销现象和库存,加强生产、物料规划以充分利用公司资源。 时间序列是一种基于前期销售数据的纯理性销售预测模型,能有效模拟饰品销售的季节性、周期性和趋势性,因此借用时间序列预测能有效修正人员预测的主观性,提高预测精度。时间序列预测法的基本思想,在分析销售数据时,通常都将销售数据按照年、月的次序进行排列,以观察其轨迹。所谓的时间序列预测法就是采用此种方式,分析销量随时间变化的动向,从而来预测未来销量的一种方法。 2. Microsoft时序算法 Microsoft时序算法是一个新的预测算法,是Microsoft SQL Server 2005 Analysis Services提供的回归算法,它结合了自动回归技术和决策树技术。我们也把该算法称为自动回归树(AutoRegression Tree,ART) 。用于创建数据挖掘模型以预测连续列,如预测企业的产品销售额。时序模型的预测仅根据算法在创建模型时从原始数据集派生的趋势。 (1)使用多个时间序列。就DMX而言,一个时间序列就是一个事例。一年有52个星期,在一年中饰品每周的销售额形成的时间序列是一个事例。一个挖掘模型可能包含多个时间序列。例如,一个模型可能包含所有饰品销售额的时间序列,包括耳环、项链、戒指、吊坠等等。并且这些序列可能不是相互独立的,如项链和吊坠的销售额可能有较强的关联关系。当这种关系存在的时候,Microsoft时序算法可以识别出这些序列是交叉序列。这是该算法独特的特征之一。 (2)自动回归树。使用Microsoft时序算法创建的模型是一个自动回归模型,在该模型中,函数 对应于一棵回归树,即在ART中,函数 代表回归树。图1显示了使用时间序列数据创建的项链-吊坠回归树。回归树的第一个拆分条件是两个月前吊坠的销售额。如果两个月前吊坠的销售额超过5000,则另一个拆分属性是上个月项链的销售额。在上个月项链的销售额少于6000的情况下,项链销售额的线性回归公式如(1)式所示。 (1) 图 1 项链吊坠回归树 (3)季节性。大多数时间序列都有季节性的模式。在文献4中详细介绍了ART使用事例转换的步骤处理季节性,还可以使用季节性参数Periodicty_Hint来增加历史数据点。在饰品就属于季节性非常强的产品,一般季节性的周期是3个月。在周期为3个月的情况下,ART在一个表中包含观察值、,则回归树将在拆分的时候使用这些观察值,并且在回归树节点的回归公式中也将使用这些观察值。当有多个周期性的时候,ART算法基于季节性在经过转换的事例表中增加多个列。如果没有指定周期性,则Microsoft时序算法将使用自动检测季节性的功能,并且基于快速傅立叶变换。 (4)预测历史。当一个时序模型处理完之后,该模型可以用来对未来进行预测,还可以对历史进行预测。在DMX中,有一个预定义的预测函数PredictTimeSeries。例如,PredictTimeSeries(Necklace,5)返回一个包含5行嵌套表,这5行分别表示接下来的5个月Necklace的销售额。 Microsoft时序算法可以利用该模型对过去的饰品销售情况进行预测,例如PredictTimeSeries(Necklace,-10, -5)函数可以返回过去5到10个月项链预测的销售额,时序算法使用Historical_Model_Count和Historical_Model_ Cap参数对历史的数据进行预测,其中Historical_Model_Count参数用来指定要创建的历史模型的数量,Historical_Model_Cap参数用来指定历史模型的时间增量。 二、数据挖掘技术在饰品设计中的应用 通过对历史数据和现有数据的分析,我们可以根据国家、地区、饰品分类(包括佩戴方位、材料、年龄段)、饰品选材、饰品款式等对饰品进行归类,根据以往的销售数据和现有数据利用数据挖掘技术预测这些国家、地区的饰品需求及其发展趋势。企业可以制定相应的采购计划、库存计划、促销策略等,更好地定位市场。通过数据挖掘,可以对营销策略及措施的实施结果进行分析,进而对营销活动的效果做出评估,为下一步营销决策提供参考依据。 Microsoft时序算法使用线性回归决策树方法来分析与时间相关的数据,例如,月销售额数据或年利润。饰品是一种季节性较强的产品,销售量的变化与时间成一定函数关系,因此本文借用时间序列预测模型的特点,来构建新的饰品销售预测模型。时间序列模型5能根据销售历史数据,对未来的饰品销售走势作有效的客观分析,避免销售预测中对历史数据的主观判断,能够根据历史销售数据实现对饰品销售的季节性、周期性和趋势性三大特点的有效模拟。由于影响销售量的因素很多,如销售区域、饰品类别、顾客的结构、季节性以及同类企业的竞争情况等,而且企业数据库每天都产生大量的销售数据,如何利用这些海量数据对销售情况进行分析,得出隐含于其中的有用模式对饰品公司来说具有重要的意义。 1.数据准备 为实现数据挖掘,需要将多个数据源的数据合并存放到同一个数据存储中即数据集成,将多个数据源中的数据进行合并处理,解决语义模糊性并整合成一致的数据存储。数据集成涉及模式集成、数据冗余处理和数据值冲突的检测与处理。 XG饰品有限公司的数据主要来源于企业内部的ERP系统和OA系统,以产品库存为例,以ERP系统数据库的饰品库存流水表、饰品生产流水表和OA系统中的物料库存表数据源,数据经过一定的预处理,合并存放到数据仓库中,其集成过程如图2所示。 图2由操作层转移到数据仓库层时数据的集成 在数据准备好以后,就可以运行接口程序,将经过清洗和转换后的数据装入到数据仓库中了。本系统采用的ETL工具是SQL Server 2005自带的Integration Services,这是SQL Server 2005的一个全新的企业级数据整合平台,可以提取和转换来自多种源(如 XML 数据文件、平面文件和关系数据源)的数据,然后将这些数据加载到一个或多个目标。通常在业务系统处在不繁忙的时候,系统自动定期进行数据加载。事实表的数据都是从ERP系统和OA系统中载入的。 2.模型的实现 本文以XG饰品有限公司2005年1月至2007年6月期间的历史销售数据来预测当年秋季项链和吊坠的销售额。用于预测的时间序列数据以月销售额为时间序列的值,用每行代表一个时间序列的方式存储在关系数据库中。 根据时间序列表中的数据,利用DMX语言创建时序模型,部分代码如下: Create Mining Model NecklacePendantTSa( Time date key time, Necklace long continuous predict, Pendant long continuous predict ) Using Microsoft_Time_Series 在时序模型中,不需要连接新的事例,预测的值直接由训练事例派生得出。经过挖掘算法分析处理后,可以得到如图3所示项链、吊坠的预测图表。 在图3中,实线代表实际的销售额,虚线代表预测的销售额,2007年7月之前的虚线显示的是历史预测销售额,之后的虚线表示的是今年秋季的预测销售额;竖线显示的是预测的偏差,对于将来的预测越远,则预测的偏差越大。 数据挖掘的主要目的是获取知识以支持决策,因此对结果进行解释和评价是非常重要的,从上述图表可以得到的结论有: (1) 通过历史销售预测情况可知预测数据与真实数据基本上是吻合的,所以用时序算法进行销售预测是有效的。 (2) 在有大量销售历史数据的情况下,利用数据挖掘工具对销售数据进行分析,可以从这些看似杂乱无章、毫无规律的数字中得到意想不到的结果,这些结果对企业来说可能是至关重要的决策依据、是在市场竞争中取得胜利的关键信息。 (3) 本例利用时序算法的数据挖掘工具对大量销售历史数据进行学习、分析,可得出销售额变化趋势,利用训练好的时序模型可以预测未来的销售额、销售价格、销售利润等,根据销售预测,企业可以制定相应的采购计划、库存计划、促销策略等。 图 3项链-吊坠的预测图表 三、结 论 本文提出了将数据挖掘技术应用到饰品设计,并以XG公司2005年1月至2007年6月期间的历史销售数据为例,使用Microsoft时序模型进行饰品销售预测,且验证了所采用的挖掘模型的准确性。这为饰品企业的决策提供了新的思路,有利于帮助

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论