




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章 数据挖掘在产品设计中的应用7.3 面向产品设计的数据挖掘模型随着企业信息化程度的不断提高,CAD/CAM/CAPP等先进设计、生产方法的运用,同时企业事务电子化的迅速普及,企业积累了大量的设计、生产数据资料;另一方面,企业需要在继承原有设计信息的基础上,设计出具有新功能、创新性的产品。因而如何更加充分利用己有设计数据信息成为企业设计人员关心的主要问题之一。毫无疑问,这些庞大的数据库及其中的海量资料是极其丰富的信息源,传统的信息检索机制和统计分析方法只能获得这些数据的表层信息,不能充分利用丰富的数据资源,远远满足不了人们对数据内部隐含的、有价值的信息和知识获得的需求。如何将这些数据资源的利用提高到更高阶段,达到数据资源利用过程和人的知识创新过程的有机结合。作为一种独立于应用的技术,数据挖掘方法的提出,让人们有能力最终认识数据资料的真正价值,即蕴藏在资料中隐含的、潜在有用的信息和知识,被产品设计的研究人员看作是一个越来越重要的研究课题。产品的研制过程,往往是在一定的信息资源基础上的知识创新。从原有的信息资源中挖掘知识,在一定程度上会给设计人员以启发和借鉴。能否充分合理地利用现有丰富的设计资源,是影响产品研制周期、产品设计质量以及产品创新性的重要因素,也是衡量设计人员水平的重要标准之一。把成熟的设计资源中蕴涵的知识应用到新产品的研制中,不仅可以缩短设计周期、降低成本,而且可以确保产品的设计质量。概念设计是产品设计的先导,又是产品构型设计的前提。在概念设计阶段,设计人员对产品的认识很多都是经验性知识,而这些经验性知识的获得,一方面是设计人员从大量的设计活动中积累的,另一方面是从前人的设计方案中继承来的。而拥有大量的、丰富的经验知识是很少的设计领域专家才具备的,并且设计专家的许多有价值的设计经验很难准确地表达出来。因此,将数据挖掘的研究从理论研究转向应用,从不同侧面、不同应用层次最大限度地利用企业积累的丰富信息资源中蕴涵的知识,是数据挖掘技术在工程实践领域的最终目标。将数据挖掘应用到产品概念设计中具有很强的现实意义,同时也可以加快概念设计的进展和应用。7.3.1 数据挖掘过程前面已介绍过,数据挖掘过程是在设计者的主动参与下进行的知识发现过程,是在积累了大量的数据后,从中识别出有效的、新颖的、潜在的、最终可以理解并加以有目的运用的知识。因此,数据挖掘的主体是具有一定知识背景,知识结构和知识创新能力的数据集合。数据挖掘的结果是由设计者经过思考、选择和决策后,通过对信息(知识)进行关联和聚合,形成新的信息(知识),而不是通过简单继承或信息过滤得到的信息堆积。在产品概念设计过程中需要建立基于约束的,面向知识应用的数据挖掘模型,也就是用户根据功能需求和结构要求选择挖掘算法,选择预测实体和训练数据,建立适当的关系数据挖掘模型或联机分析处理(OLAP)数据挖掘模型,OLAP数据挖掘模型可以执行如概念描述、关联、分类、聚类、时间序列分析等多种数据挖掘任务。如图7-5所示为面向知识应用的OLAP数据挖掘模型结构。图7-5 面向知识运用的OLAP数据挖掘模型结构由于概念设计的结果确定了产品的基本特征和主要结构,因此概念设计过程中需要数据挖掘工具的辅助推理与决策。在图7-5所示的数据挖掘模型结构中,数据抽取、过滤和集成是根据用户的数据挖掘请求,负责从相应的数据源中清理和提取的相关数据,也就是相关数据准备和预处理的过程。元知识库中存有领域知识,用于指导数据挖掘或评估结果模式的兴趣度。元数据库也称数据字典,用于存储元数据(元数据的相关概念可参考第1章)。这里,我们建立的元数据主要是描述产品设计原理和方法的基本专业术语及其定义,以及与数据仓库要求格式之间的转换规则,其中部分信息可从领域专家处获取。数据挖掘引擎是数据挖掘模型的基本部分,它由一组功能模块组成,用于特征化、关联、分类和聚类分析等。产品概念设计中的数据挖掘过程可以分为以下五个步骤:(1)相关数据的准备。(2)数据预处理。(3)建立挖掘模型(Mining Models,MM)。(4)用测试集对挖掘模型评估、预测。(5)挖掘模型应用。整个数据挖掘过程是交互的,与领域相关的,需要设计师特别是具有设计知识、经验的专家参与,它并不是一个全自动化过程。1相关数据的准备通过对设计方案的知识表示和用粗糙集表示设计知识库中的基本概念,形成了数据挖掘的数据对象,包括以下三个方面:(1)训练数据集。在构建数据挖掘的初始模型时,要用到训练数据。该数据集也许会有一些偏差或额外的特性,但是它如实反映了用来进行数据挖掘的样本。(2)测试数据集。在对模型进行训练的过程中,训练数据集逐渐被矫正,并随之变成了测试数据集。测试数据的修正是一个反复的过程,直到对测试数据集所建立的模型能准确地反映真实的数据,令用户满意为止。(3)评估数据集。评估用数据集就是从同一个数据种群中抽取的作为测试用的数据集。它必须含有不同的记录,用它的属性值来检验由前两种数据所建立的数据挖掘模型的准确性。2数据的预处理数据预处理阶段主要包括数据的理解,模式识别,属性选择,连续属性离散化,数据中的噪声、丢失值或空缺值的处理,实例(Case)选择,各种数据集的生成等。经过数据清理(消除噪声或不一致数据)、数据集成(多源数据的组合)后,就可以进行数据选择(从数据库中检索与分析任务相关的数据),将要设计的功能树上的某个结点的功能要求作为检索条件或规则,从已有产品实例库、机构数据库、知识库和规则库中挖掘出符合近似度条件的机构方案及其各种参数,然后从中选择或全部选择,生成测试数据集(即测试集)。3建立挖掘模型数据挖掘建模是数据挖掘操作的核心步骤。挖掘建模包括学习算法的选择,算法参数的确定等。用户根据功能需求和结构要求选择合适挖掘算法、选择预测实例(Case)和训练数据,建立适当的数据挖掘模型。数据挖掘模型是在数据源中的实体中产生的,使用向导通过预先设定好的有限的几个步骤完成相应的建模任务。主要通过以下的步骤来创建模型:(1)选择数据源。可以创建一个新的数据源或者是从已经存在的数据源中进行选择。(2)选择实例表或者数据挖掘模型表。选择和已经选择的数据源相关联的表。(3)选择数据挖掘技术方法(算法)(此处选择决策树算法)。(4)选择实例关键列。为实例的关键列选择标识键,标识键的选择将对算法的输出产生极为重要的影响,因为挖掘引擎是靠该键来区分不同实例的。(5)选择输入和预测列。输入列用于训练挖掘模型的实际数据,至少应该有一个输入列。预测列用于存储挖掘模型的预测信息。(6)结束。接下来的就是处理浏览数据挖掘模型。在产品概念设计过程中,人们需要对相关数据和方法进行分类,找出各数据或方案间的联系,在此基础上创造新的功能和方案。决策树方法的数据挖掘模型可辅助设计师对历史的产品数据进行分析预测,寻找规律和关系。决策树方法就是利用信息论中的信息增益,寻找示例库中具有最大信息量的属性字段,建立决策树的一个结点,再根据该属性字段的不同取值建立树的分支,在每个分支再重复建立树的下一个结点和分支的过程。其基本原理如下:设E=F1F2Fn是n维有穷向量空间,其中,Fj是有穷离散符号集;E中的元素e=V1,V2,Vn称为例子,其中,VjFj,j=1,2,n。设PE和NE分别为E的正例集和反例集:假设向量空间E中的正例集PE和反例集NE的大小分别为p,n,且假设:l 在向量空间E上的一棵正确决策树对任意例子的分类概率同E中正反例的概率一致。l 一棵决策树对一例子做出正确类别判断所需的信息量为: P 如果以属性A作为决策树的根,A具有m个值V1,V2,Vm,它将E分成m个子集|E1,E2,Em|。假设Ei中含有Pi个正例和Ni个反例,那么子集Ei所需的期望信息是I(Pi,Ni),以属性A为根所需的期望熵是:以A为根的信息增益是:Gain(A)=I(p,n)-E(A)该方法选择使Gain(A)最大(即E(A)最小)的属性A作为根结点,对A的不同取值对应的m个子集Ei递归调用上述过程生成A的子结点B1,B2,Bm。本决策树方法是对结点上的每个属性都计算其增益,然后从中选取增益量最大者作为该结点上的属性。根据上述方法,在VC+里实现决策树的构造算法如下(局部程序):创建决策树的根结点 root=S;Void TreeExpansion(root,Ad,Ac)if 满足结束条件利用分类函数对该结点进行分类并退出/*变量初始化*/A c.RemoveAll(); for Ac中的每个连续属性ai对vij进行排序并构造边界bij; for属性ai的各边界bij 构造属性aij; Ac.AddTail(aij); fMinEntropy=AlargeNumber;/*计算离散属性的熵值*/for Ad内的各离散属性aifor属性ai的各属性值vij 选择估价函数并计算E(Sij); if E(Sij) fMinEntropy MinEntropy=E(Sij); /*计算连续属性的熵值*/ forAc内的各离散属性aij选择估价函数并计算E(ContSij)与E(_ContSij); if E(ContSij) fMinEntropy fMinEntropy=E(ContSij); if E(_ContSij)0,j0,其中pij=0或1(1表示拥有该属性的相应水平),则产品效用值为,该值表示了用户对该产品的喜好程度。为了开发新产品,必须了解目标市场对新产品性能的重要度以及各性能的期望水平。传统方法是让被调查者对单个产品性能的重要度打分,没有考虑产品性能之间的相互作用。人们实际购买时经常对产品的几个性能组合进行总体评价,而不是一次单独对一个产品性能进行评价,其结果的可靠性令人置疑。因此,采用交合分析法(Conjoint Analysis,CA)进行分析,即产生一组用户对产品概念的总体效用,并通过CA法进行分析,得到用户对产品性能水平的效用值。分析数据的获得一方面可以通过网页调查,另一方面可以从实际发生购买行为的客户订单中统计得到。为了减少产品概念数并产生有效的产品概念,用来测试的产品概念是根据用户的身份,从数据仓库中挖掘出来的被用户接受的可能性较大的产品概念。市场细分理论被广泛用来指导企业寻找目标市场,对产品进行精确市场定位。该模型采用利益细分理论,即人们在消费某一特定产品时寻求的利益是细分市场存在的真正原因。用户需求效用值矩阵,其实就是用户寻求的利益。对用户的需求效用值矩阵进行分析,可以将效用值相同或接近的划分为一个细分市场。采用模糊逻辑神经元进行聚类,这些聚类中心就是细分市场的需求效用值。模糊逻辑神经元是一个三层的前馈自组织神经网络。一旦根据消费者寻求的利益将他们划分为不同的细分部分,每一细分部分都会在人口特征、消费量、品牌感知、媒体习惯、性格和生活方式等方面与其他细分部分形成对比。将用户的这些特征归纳起来,就是需要的细分市场。也可用效用值来表达一个细分市场。设Qi为用户属性i,Qij为用户属性i的水平j,则为细分市场对属性i的水平j的效用值,为细分市场效用值矩阵。矩阵s列的列向量表示该细分市场对模糊变量“属性s”的模糊集合。如果给定一个特定的用户,其属性矩阵q=qij|i0,j0,其中qij=0或1(1表示拥有属性i的水平j),则值表示了该用户对该细分市场的隶属程度。实际上,一个特定的用户并不能准确地说隶属于某个细分市场,细分市场本身就是一个模糊的概念,因此采用模糊数学的方法来定义某个用户所属的细分市场。向量说明该用户对细分市场1的隶属度为1.0,对细分市场2的隶属度为0.3,对细分市场3的隶属度为0.6,对细分市场4的隶属度为0.2。用户需求通过上述方法获取并表达以后,还需要运用一些规则对细分市场的需求进行推理。这些规则如下:设集合Q为用户属性集合,则Q的第i个元素Qi表示用户的第i个属性,Xi表示属性Qi的水平集合,则Xi就是语言变量Qi的论域。而细分市场效用值矩阵可以看成是细分市场对各个属性的模糊集合。同理,如果设集合P为产品属性集合,则P的第i个元素Pi表示用户的第i个属性,Yi表示属性Pi的水平集合,则Yi就是语言变量Pi的论域。而需求效用值矩阵可以看成是需求对各个属性的模糊集合。如果一个细分市场的效用值矩阵为A,该细分市场的需求效用值矩阵为B,则一条需求规则就可以表示成“如果细分市场为A,则需求为B”,用蕴含关系可以表示成:A1A2A3AmB1B2B3Bn其中,Ai表示矩阵A的列向量,Bi表示矩阵B的列向量。如果客户属性为A1,A2,Am,产品属性为B1,B2,Bn,则其规则R=R1,R2,Rn,其中Ri:如果A1是ai,, Am是am,则B1是bi, , Bn是bn。Ri的前提条件构成了在直积空间A1A2Am上的模糊集合a1a2am,结论是q个控制作用的并,它们之间是互相独立的。因此,第i条规则可以表示成如下的模糊蕴含关系:Ri:(a1a2am)(b1+b2+bn)于是规则表示如下:R=(a1a2am)b1,(a1a2am)bn利用这些规则,就可以对细分市场的需求进行推理。企业在开发新产品或进行产品改型时,需要估计新产品投入市场后的市场份额占有率。基于以上规则,可以近似地模拟出这个效果。经过调查,或从数据仓库中可以近似地得到各个细分市场的相对人数。因此可以得到一个关于细分市场人数的集合:式中,为细分市场i的相对人数。如果给定新产品或改型产品的性能,则可以用该产品与各个市场细分的需求的贴近度作为该产品对“拥有市场细分i”的隶属度函数,也可以得到市场细分的模糊集合:A=X1/市场细分1+X2/市场细分2+Xn/市场细分n近似地,由加权平均法得到期望该新产品的相对人数为,这个人数占总人数的百分比就是该新产品的市场份额比率。基于以上思路,建构的需求分析模型可以挖掘出关于用户需求的一系列规则。利用这些规则模拟产品改型或新产品投入市场后的市场份额占有率,对不同客户的需求进行推理。基于数据挖掘的需求分析模型流程如图7-6所示。图7-6 需求分析模型流程图由用户提出的设计和使用要求到形成用户的需求,并利用数据挖掘的需求分析模型对该需求进行分析,将需求映射为功能要求,这是概念设计阶段的一项重要设计任务。如图7-7所示为采用数据挖掘技术实现需求分析映射的框架图。图7-7 需求分析映射的数据挖掘实现过程7.3.3 功能结构数据挖掘过程的实现产品的功能设计是概念设计中极为重要的一环,概念设计过程的实质就是一个产品的功能定义、功能结构的实现并进行优化的过程。功能定义的方法不同,功能分解和工作的原理不同,都会产生完全不同的设计思路和解决方案。产品的功能设计(功能建模)主要包括功能描述和功能树的建立等内容。功能建模在产品概念设计阶段扮演着非常重要的角色,主要体现在以下几方面:l 功能建模将设计问题模块化、结构化,从而使设计问题转变为一系列容易求解的子问题。l 功能建模将设计信息在功能层次上得到抽象描述,从而使产品的概念设计活动更注重于满足创新设计要求。l 功能建模将一个总体功能需求逐步地细化、具体化,由此建立各子功能之间的关系。l 功能模型为后续的分析推理提供了基础,如行为仿真、设计评价、决策和修改等。l 功能模型作为下游设计活动的重要参考模型,为面向功能的产品设计过程提供了基础。产品的总体功能可由不同的零部件或一些特定的几何特征互相协调共同完成,这表明产品的功能具有层次性。所谓产品的功能描述,就是将市场需求和用户要求进行功能抽象,使之转换为具体的、现实的、与产品几何形状无关的功能结构,以表达产品中各种功能特征和相关约束关系。并且要求功能描述的结果便于向产品的结构转化。对于一般的产品设计来说,在确定了产品的总功能后,不可能立即设计出相应的产品结构,往往要将总功能进行细化、分解,以便找到满足功能要求的结构特征。因此,产品的功能描述过程实质上就是一个功能分解的过程,也就是将产品的总功能分解为较为简单的分功能或功能元(最基本的不宜再分的功能单元),从而使问题的复杂度降低,以利于产品功能的结构求解。对产品的功能模型进行结构实现的求解即为产品功能到结构的映射(功构映射)。它是将产品功能性的描述转化为能实现这些功能的具有具体形状、尺寸以及相互关系的零部件的描述。在这里功能是产品结构的抽象,是结构实现的目的;而结构则为实现某功能而选用的一组构件或元件。在产品概念设计过程中,建立功能树后,就可以用一些推理手段、方法进行功构映射的转换,以完成概念产品的几何信息模型的建立。在概念设计阶段,设计对象往往只有一个粗略的形状和一些主要的尺寸和装配关系,或是一个标准件的代码。因此要建立一个草图系统,用一些符号和示意图来表示不完全几何信息和抽象几何,当然这个草图符号库也是面向具体设计的。在概念设计结束后,要用这个草图系统去表示概念设计方案,且后续的设计工作是在这个概念设计方案草图上进行的。这里主要侧重于在大量典型的常用机构数据库已经建立的情况下,根据产品功能树的各个基本结点上的功能元的具体要求和条件,进行智能挖掘推理和映射,得出适当的机构来,并可根据需要进行适当的修改。这样一一进行功构映射,最后就生成了对应于产品概念功能树的产品机构树。在进行功构映射过程中,通过建立基于约束的、面向知识应用的数据挖掘决策树算法模型,即可从数据库中挖掘出有效数据,生成测试集。在生成测试集时,子模块的功能需求可作为挖掘条件或规则输入到数据挖掘工具(DM Tool)中,DM Tool将从已有产品数据库、知识库和规则库中挖掘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年气候变化对海平面上升影响
- 2025年高二物理上学期波动创新制作大赛理论试题
- 2025年高二物理上学期“类比法”应用测试
- 基于项目式学习的足球大单元课内外融合教学设计与实践
- 2025年榆次教室招聘试卷及答案
- 2025年复旦通信考研真题及答案
- 体味西方礼仪试卷及答案
- 診所应急预案
- 晋中市小学模拟试题及答案
- 变态人格测试题及答案
- T-CALC 007-2025 重症监护病房成人患者人文关怀规范
- 托育早教中心家长常见问题(百问百答)
- QFD质量功能展开的未来发展趋势
- 燃气行业数字化转型研究
- 成长纪念册课件
- 超声引导下神经阻滞
- 浙江省安装工程预算定额说明及计算规则
- 围墙新建及改造工程施工组织设计(技术标)
- 房屋建筑学民用建筑构造概论
- 政策议程多源流模型分析
- GB/T 17980.37-2000农药田间药效试验准则(一)杀线虫剂防治胞囊线虫病
评论
0/150
提交评论