(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf_第1页
(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf_第2页
(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf_第3页
(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf_第4页
(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf_第5页
已阅读5页,还剩79页未读 继续免费阅读

(机械设计及理论专业论文)数据挖掘在网络化基于实例设计系统中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要摘要基于实例设计( c a s eb a s e dd e s i g n ,r e a s o n i n g ,c b r ) 在设计领域中的应用。c b d ) 是基于实例推理方法( c a s eb a s e d它利用人们以往求解类似问题的经验和知识进行推理,从而获得当前问题的求解结果。相比人工智能与专家系统而言,基于实例推理系统对知识、经验及信息完备程度的要求较低,但其推理效率却较高,为产品设计提供了一种高效可行的方法。但由于基于实例推理缺乏严密的理论基础,这种特殊性致使其具有致命的弱点,如:实例获取匿难、实例修改准则难以建立等,从而造成了基于实例设计系统开发困难;而且由于设计人员过多地参与设计过程,使得基于实例设计系统缺乏真正意义上的智能化与自动化,设计质量及精度也很难保证。为了解决基于实例设计系统中出现的问题本文把数据挖掘技术引入到基于实例设计过程当中,并实现了设计系统的网络化。文中分析了数据挖掘技术在基于实例设计系统中的应用,并提出了基于回归分析和m d o d 方法的实例修改策略。通过对设计系统的网络化实现,为实例获取提供了一种有效手段,把网络用户的设计结果存储在实例库中,使实例库不断地得到扩充,更好地满足设计要求。本文采用多元线性回归分析方法对二级圆柱齿轮减速器的单级齿轮副传动参数进行了分析,得出相关的回归方程;并根据回归分析得出的各因子偏回归平方和来判断其重要程度,分析哪些因子为平台参数哪些为特征参数,使设计人员对产品参数之间的关系有更深层次认识。根据回归分析结果即回归方程和各因子偏回归平方和,引入混合离散变量直接搜索( m d o d ) 方法对最佳相似实例进行修改,按照各因子偏回归平方和的大小确定修改次序。文中详缅给出了实例修改的流程图和实例修改结果,并与传统的设计方法进行了对比,证实了该方法的可行性与实用性。为了实现基于实例设计系统的网络化,本文提出了c s 与b s 相结合的远程设计模式,使得客户不仅可以利用测览器对设计结果进行浏览,还可以利用客户端应用程序对设计结果进行处理。本文对二级圆柱齿轮减速器c b d 系统实现了网络化,通过客户端应用程序的开发,用户可以利用客户端软件对设计结果进行可视化处理,最终得出二级圆柱齿轮减速器的三维参数化实体模型。该实体模型可以用柬进行工郑州人学丁学颁上论文程分析,还可以自动地生成工程图纸。由于传统的超文本标记语言( h t m l ) 不能够满足工程数据表达以及数据自动传送与提取的需要,因此本文采用x m l 与h t m l 相结合的办法,h t m l 文件供浏览器使用,x m l 文件供客户端虚用程序使用。为了实现利用x m l 文件进行数据的表达及传送,本文给出了对二级圆柱齿轮减速器进行描述的x m l 文件格式。关键词:基于实例设计数据挖掘回归分析混合离散变量直接搜索法远程设计可扩展标记语言i ia b s t r a c ta b s t r a c tc a s e b a s e dd e s i g ni sa na p p l i c a t i o no fc a s e b a s e dr e a s o n i n gm e t h o di nt h ee n g i n e e r i n gd e s i g nf i e l d s i ts o l v e sc u r r e n tp r o b l e m sa c c o r d i n gt or e a s o n i n gb yu s i n ge x p e r t i s ea n dk n o w l e d g ew h i c hh a v eb e e nu t i l i z e db yp e o p l et ow o r ko u tp r o b l e m ss i m i l a rt on e wo n e s c a s e b a s e dr e a s o n i n gs y s t e mr e q u i r e sl e s sk n o w l e d g e 、e x p e r t i s ea n di n t e g r a t i o no fi n f o r m a t i o nt h a na r t i f i c i a li n t e l l i g e n c ea n de x p e r ts y s t e m b e c a u s ef e ws t r i c tt h e o r i e sa r eb a s e db yc a s e b a s e dr e a s o n i n g ,t h e r ea r es o m ew e a k n e s s e sc a u s e db yt h i ss p e c i a lc h a r a c t e r , s u c ha sd i f f i c u l t i e si no b t a i n i n gc a s e sa n de s t a b l i s h i n gr u l et om o d i f yb e s ts i m i l a rc a s ee t c i tb e c o m e sv e r yh a r dt od e v e l o pac a s e - b a s e dd e s i g ns y s t e m m o r e o v e rd e s i g np e r s o n n e l sm o r ep a r t i c i p a t i n gi nt h ep r o c e s so fd e s i g nl e a d st ot h er e s u l t st h a tt h ec a s e - b a s e dd e s i g ns y s t e ml a c k si n t e l l i g e n c ea n da u t o m a t i o ni nt h et r u es e n s e ,a n dp r e c i s i o na n dq u a l i t yo f t h ed e s i g nc a nn o tb eg u a r a n t e e d i nt h i st h e s i sd a t am i n i n gt e c h n o l o g i e sa r ei n t r o d u c e di n t ot h ep r o c e s so fc a s e - b a s e dd e s i g nt os o l v et h eq u e s t i o n sa p p e a r i n gi nt h ec a s e b a s e dd e s i g ns y s t e m t h e nt h ed e s i g ns y s t e mi sp u to dt h ei n t e m e t t h ea u t h o ra n a l y z e st h ea p p l i c a t i o n so fd a t am i n i n gt e c h n o l o g i e si nt h ec a s e - b a s e dd e s i g ns y s t e m ,a n dp u t sf o r w a r dt h es t r a t e g yb a s e do nr e g r e s s i o na n a l y s i sa n dm d o dt or e v i s et h eb e s ts i m i l a rc a s e an e we f f e c t i v em e a n st oo b t a i nd e s i g nc a s e si sp r o p o s e da c c o r d i n gt on e t w o r k i n gt h ed e s i g ns y s t e ma n ds t o r i n gu s e r s d e s i g nr e s u l t si n t oc a s eb a s e t h em o r ec a s e st h ec a s eb a s eh o l d s ,t h eb e t t e rt h ed e s i g nr e q u i r e m e n t sc a nb em e t t h er e g r e s s i o ne q u a t i o ni so b t a i n e di nt h i st h e s i sb ya n a l y z i n gt h et r a n s m i s s i o np a r a m e t e ro fas i n g l eg e a rp a i ri nt h et w og r a d e sc y l i n d r i c a lg e a rr e d u c e ra c c o r d i n gt om u l t i v a r i a t el i n e a rr e g r e s s i o na n a l y s i s e a c hf a c t o r si m p o 砌n c ei sd e c i d e db yt h ep a r t i a lr e g r e s s i o nq u a d r a t i cs u mp r o d u c e db yr e g r e s s i o na n a l y s i s t h ed e s i g np e r s o n n e lc a ng e tad e e p e ru n d e r s t a n d i n go ft h er e l a t i o n s h i p sa m o n gt h ep r o d u c tp a r a m e t e r sb ya n a l y z i n gw h e t h e rt h ef a c t o r sa r ec o m m o np a r a m e t e ro rc h a r a c t e r i s t i cp a r a m e t e r o nt h eb a s i so ft h er e s u l t so fr e g r e s s i o na n a l y s i s ,r e g r e s s i o ne q u a t i o na n dp a r t i a lr e g r e s s i o nq u a d r a t i cs u m ,t h em e t h o do fm d o di si n t r o d u c e di n t ot h em o d i f i c a t i o no ft h eb e s ts i m i l a rc a s e t h em o d i f i c a t i o ns e q u e n c ei sd e c i d e db yt h eq u a n t i t yo fe a c hf a c t o r s p a r t i a lr e g r e s s i o nq u a d r a t i cs n m t h i st h e s i sp r e s e n t st 1 1 ef l o wc h a r ta n dr e s u l t so ft h em o d i f i c a t i o np r o c e s s b yc o n t r a s tw i t ht h et r a d i t i o n a ld e s i g nm e t h o d ,t h ef e a s i b i l i t ya n dp r a c t i c a b i l i t yo f t h em e t h o di nt h i st h e s i sa r ev a l i d a t e d t on e t w o r kt h ec a s e _ b a s e dd e s i g ns y s t e m ac o m b i n a t i o no fc sm o d ea n db sm o d ei sp u tf o r w a r d n o to n l yc a nt h ec l i e n t sb r o w s et h ed e s i g nr e s u l t st h r o u g ht h eb r o w s e r ,b u tt h e yc a na l s od e a lw i t ht h ed e s i g nr e s u l t sw i t ht h ea p p l i c a t i o na tt h ee n do f t h ec l i e n ti nt h i st h e s i sac b ds y s t e mo ft w og r a d e sc y l i n d r i c a lg e a rr e d u c e rh a sb e e nn e t w o r k e d 1 i l郑州人学t 学坝l 论文t h r o u g ht h ec l i e n tp r o g r a m st h ec l i e n tc a nv i s u a l i z et h ed e s i g nr e s u l t sa n dg e tt h et h r e e d i m e n s i o n a lp a r a m e t e r i z e ds o l i dm o d e lo ft h et w og r a d e sc y l i n d r i c a lg e a rr e d u c e lt h i ss o l i dm o d e lc a r lb e u s e dt oc a r r yo u te n g i n e e r i n ga n a l y s i s ,a n de n g i n e e r i n gd r a w i n g sc a nb ep r o d u c e da u t o m a t i c a l l yt h r o u g ht h es o l i dm o d e l b e c a u s et h et r a d i t i o n a lh y p e r t e x tm a r k u pl a n g u a g ec a n _ n o tm e e tt h en e e d so fr e p r e s e n t a t i o no fe n g i n e e r i n gd a t a ,d a t at r a n s m i s s i o na n de x t r a c t i n g ,e x t e n s i b l em a r k u pl a n g u a g ei si n t r o d u c e dt ob ec o m b i n e dw i t hh t m l t h eh t m lf i l e sa r eu s e db yb r o w s e ra n dt h ex m lf i l e sb yc l i e n tp r o g r a m s t or e a l i z et h ed a t at r a n s m i s s i o na n dr e p r e s e n t a t i o ni nx m lf o r m a t ,t h i st h e s i sr e p r e s e n t sax m lf i l ef o r m a tc o v e r i n gt h ed a t ao ft w og r a d e sc y l i n d r i c a lg e a rr e d u c e ra n dp r a c t i c a l l yv a l i d a t e si t sg o o dp e r f o r m a n c e k e y w o r d s :c a s eb a s e dd e s i g n d a t am i m n g r e g r e s s i o na n a l y s i sr e m o t ed e s i g n m d o d e x t e n s i b l em a r k u pl a n g u a g e郑重声明本人的学位论文是在导师指导下独立撰写并完成的,学位论文没有剽窃、抄袭等违反学术道德、学术规范的侵权行为,否则,本人愿意承担由此产生的一切法律责任和法律后果,特此郑重声明。学位论文作者( 签名) :国、j 、孑乙伽咖岁月尹日绪论1 绪论1 1 论文研究的背景和意义产品设计是产品开发过程中最重要的环节之一,是制造业的灵魂。随着产品功能趋向于集成化、复合化,设计过程中所涉及到的知识越来越多,学科越来越广泛,知识获取与应用问题将越来越突出,因此,可以说产品设计是一个基于知识和经验的创造性活动。在传统设计中,大多采用类比设计或者经验设计方法,在参考过去相似设计经历的基础上进行适当的修改和调整而生成新的设计方案。有关资料表明6 0 的机械产品设计是由原来产品的改型或者改进【1 】啪。产品设计过程的特征主要有下面三点:1 ) 产品设计是一个经验积累过程设计是一项复杂的活动,涉及各种知识,而这些知识并不能完全由简单的因果关系及明确的原理或者规则来表达。因此,设计问题很大程度上依赖于设计过程中的经验。经验积累存在于整个设计过程,设计质量和效率与经验积累有着密切的关系。2 ) 产品设计是一个创造过程知识和经验的应用是设计的基础,由于设计问题多样化,解决新的问题通常需要设计人员的创造能力,创造灵感往往来源于对已往设计的类比,而类比也正是设计问题求解时经常用到的有效思维方法。3 ) 产品设计是一个探索过程设计者对设计目标的原始理解是模糊的、不完整的,对设计约束条件的考虑是不详尽的,在设计过程中需要从以往大量的设计经历中回忆相关的知识和经验,并从中发掘、探索出设计变量之间内在的联系、设计条件之间的相互制约关系,反复修改最终才能完成设计。基于设计过程的以上特点,为了提高产品设计过程的智能化和设计效率,传统的人工智能( a i ) 与专家系统通过抽象过去的设计经验,提取出共性的知识或者规则来解决新的设计问题,对于比较复杂的应用领域,由于知识的获取十分困难,因此,人工智能与专家系统的实际应用受到很大的限制。为了提高问题求解的效率,使设计过程更符合人类的思维过程,领域专家提出了基于实例的推理方式郑卅l 大学t 学硕论文( c a s e b a s e dr e a s o n i n g ,c b r ) ,而基于实例设计( c a s e b a s e dd e s i g n ,c b d ) i e 是基于实例推理方法在产品设计中的应用,是近几年来发展最快的问题求解方法之一。基于实例的设计( c b d ) 是一种类比方法,利用人们以往求解类似问题的经验知识进行推理,从而获得当前问题的求解结果。相比人工智能与专家系统而言,基于实例的推理系统,对知识、经验及信息的完备程度要求远低于专家系统,且推理效率较高,为产品设计问题提供了一种可行的解决办法。但由于基于实例推理方法没有严密的理论做基础,导致其存在着致命的弱点,如:实例的获取困难、实例修改准则及设计结果评价标准难以建立等,上述问题导致基于实例设计系统不但在开发方面存在难度;而且设计人员的过多参与使得系统缺乏真正意义上的智能化与自动化,设计质量及精度也很难保证t s l 。为了解决在基于实例设计( c b d ) 系统建立及实际应用中出现的问题,本文提出了网络环境下基于数据挖掘技术的c b d 系统。1 2 基于实例设计的发展过程及前景基于实例推理( c b r ) 起源于r o g e r s c h a n k l 9 8 2 年在人工智能领域关于动态记忆和场景回忆问题求解过程中核心作用的研究1 ,随后的c y r u s 和p r o t o s 等系统地将其应用于旅游会议计划、法律推理、语言识别、拼写检查、配餐等领域。第个真正将c b r 方法应用于设计的系统是c y c l o p s ,它结合了基于约束的求解方法与园林设计中基于事例的调整和修补方法。随后出现的应用于建筑领域的a r c h i e 、c a d r e ,机械设计领域的d e j a v u ,k r i t i k 街道系统等进一步推动了对c b r 方法的研究h 。基于实例的设计( c a s e b a s e dd e s i g n ,c b d ) 是基于实例的推理方法在设计领域中的应用,其设计思想来源于人类的思维方式,面对一个新的设计要求,设计者脑海中往往首先浮现出在以往工作中曾经出现过的类似设计条件,找出两者之间的区别,并阻此为依据联系标准的设计准则,确定新的设计方案。基于实例的设计试图利用计算机再现这一过程:设计系统根据用户对设计条件的描述抽象出实例特征并建立筛选条件;根据这一条件从实例库中选择与设计要求最接近的实例:对比两者之间的区别,调整选定实例中不能满足条件的因素,生成最终的设计方案并更新实例库。设计问题往往涉及大量的、领域相关的知识和求解技巧,这些知识和技巧随着设计者的经验、习惯及设计条件的不同而不同,很难抽象出通用的表示因果关系的规则,因此传统的基于规则的方法在设计领域内很难获得成功的应用;而基于实例的设计方法与r u l e b a s e d 的传统人工智能设计方法不同,它不仅依赖于领域内的通用知识,而且还通过建立问题描述之间的抽象关系,应用以往特定设计环境下的独特经验完成当前的设计任务,领域专家的工作更多地倾向于描述设计经验而不是抽象出设计规则,因而更有利于系统设计者与领域专家的交流。另外基于实例设计系统的自扩充能力较强,随着实例的积累,系统的求解能力将不断提高。通过以上对比可以看出,基于实例的设计方法比基于规则的设计方法更适合于设计问题的求解,在智能设计领域具有更广阔的发展前景。由于c b d 是一种设计方法而不是一种特定的技术,这种界定使得c b d 系统成为一个开放式系统,能够不断吸取各种新的方法和技术来促进c b d 本身的发展。随着网络技术的发展和i n t e m e t 的普及,在1 9 9 6 年召开的“设计中的人工智能”国际会议,大会代表们把c b r 与w w w 相结合视为一个新的发展方向【5 】,以色列的o x i t i l t , r l 博士提出了以下几个研究方向:形成一个全球性的实例库网络;协同开发和使用实例;实例在网络中的表达;在网络上的实例分析:在网络上的实例获取:利用网络资源进行实例调整;设计搜索机制;图形方式的实例检索;自动索引和连接:作为网络交互的认知模型以及c b r 技术在网络上的使用等。可以看出与网络技术的结合将给c b r 的发展带来广阔的应用前景。1 3 基于实例的设计过程及其关键技术通过理解典型基于实例设计系统的设计过程及其关键技术,本小节对设计过程中遇到的问题进行了分析,并针对这些问题提出切实可行的解决办法,而这些解决办法正是本论文的研究内容或创新点。1 3 1 基于实例的设计过程基于实例设计的过程如图1 1 所示。用户首先对当前问题进行描述,系统根据这一描述提取特征属性信息,并以此为依据建立筛选约束条件,系统按照这一约束条件在实例库中筛选出与当前问题最相似的实例,并以此实例为基础,结合领域相关的设计知识,为用户提供当前问题的建议解决方案,经过系统评价和用户修正之后,产生邦州大学丁学硕十论文最终的设计方案,并对系统进行更新;若最终结果不能满足要求时,重复进行上述过程。从整个设计的过程可以看出,基于实例设计的本质就是利用以实例形式保存下来的以往领域知识及设计经验来解决所面临的新问题。但是在设计完成后,设计变量和性能指标之间的隐含或者不确定关系并不能够通过设计过程明确地反映出来,设计人员很难把握设计过程的本质,对设计结果进行正确、快速地评价更无从谈起。因此,为了改变这种局面,本文将从另外一个角度来考虑解决基于实例设计过程中数据充足,而可用知识匮乏的问题。确认解建议解图1 1 基于实例的设计过程 6 11 3 2 基于实例设计的关键技术一个可行的c b d 系统至少应有定义明确的实例描述规则及相应的实例库、有效的检索方法及详尽的修改策略i 实例库是c b d 系统的核心,有效的检索方法是c b d系统成功运行的保障;而详尽的修改策略则保证了设计结果的精度和质量。1 实例的获取详尽的实例库是c b d 系统成功的基础,实例的获取过程中首先要考虑实例的表达方式、存储结构等,这对实例检索有着很大的影响,直接关系到整个系统的运行绪论效率。传统单机运行的c b d 系统受环境条件限制,只能在小范围内使用,不利于实例的收集。如果能够实现c b d 系统在网络上运行,很多用户可以同时使用该系统,设计结果经评价后被转化为实例存储起来,这样就能够使实例库不断地得到扩充当然还要保证数据的正确性且不能产生数据冗余。2 实例的检索关于实例检索,目前研究工作进行的比较多,形成了一些比较通用的检索方法,如:最近邻居法,该方法的优点是算法简单、计算方便,容易理解;其主要缺点是检索速度较慢,相似度阀值的确定困难及缺乏多视角的检索功能等。3 实例的修改实例的修改被公认为是c b d 系统中最具有挑战性的问题。目前还没有很成熟的实例修改方案,主要的原因是c b d 在理论方面比较缺乏,尽管都知道c b d 有效,但很难从理论上给予严格的证明,加上现实世界的多样性,从而导致了对实例的修改只能具体问题具体分析而没有相对通用的方法。实例修改方法的不完善将导致c b d 系统缺乏真正意义上的智能化,设计结果仍需要人为调整,设计质量及精度难以保证。4 结果评价由于c b d 系统在理论方面的匮乏,要建立一个相对通用的评价准则仍旧是很困难的。从以上分析可以看出,虽然c b d 系统从一个与传统设计方法不同的角度提供了一种新颖的设计思路,但是由于相关理论不够完善,各项技术都还不是很成熟,在具体的实际应用中遇到了很大困难。基于实例推理方法的长处在于它能够利用以往的设计实例及经验,缺点是相关理论不够完善。随着计算机、数据库及其它相关学科的快速发展,数据挖掘技术有了突飞猛进的进展。数据挖掘利用各种相关的技术有效地解决了从大量数据中寻找有用知识的方法,这些被挖掘出来的知识可以用来对事物进行预测与描述,其各种理论及技术均相当成熟,因此本文把数据挖掘中的相关技术引入到了基于实例设计过程中,来解决基于实例设计中所遇到的一些问题,并取得了较好的效果。郑州大学工学硕l 论文1 4 网络技术、数据挖掘技术在基于实例设计中的应用根据以上的分析,本文提出了网络环境下基于数据挖掘技术的c b d 系统开发模式,c b d 系统的网络化使其获取丰富设计实例成为可能;数据挖掘中的各种技术以其雄厚的理论基础与基于实例设计相结合,为企业提供了一个较为通用的产品快速开发方法,事实证明这种结合模式能够大幅提高设计效率及设计质量。1 4 1 基于网络的实例获取方式随着i n t e m e t 和w e b 技术的发展,给人们提供了一种更为方便的信息获取方式,同时也对整个制造业造成了巨大的影响。日益激烈的竞争要求企业具有敏捷的反应机制,尽可能地缩短产品设计开发周期。异地设计或远程设计成为降低成本、缩短产品开发周期的一种有效解决办法。但异地设计的一方( 客户端) 远离设计中心( 服务端) ,缺乏实时资源保障,导致设计效率及安全性下降、开发周期延长。因此本文采用三层b r o w s e r s e r v e r 结构,用户只需浏览器( b r o w s e r ) 即可方便地访问应用服务器( a p p l i c a t i o ns e r v e r ) ,数据库服务器( d a t a b a s es e r v e r ) 后台运行直接与应用服务器发生作用,避免了客户端与数据库服务器的频繁数据传送,改善了网络环境,使得异地设计或远程设计能够顺利进行。同时,设计结果采用x m l 文件格式传送到客户端,用户可以对设计结果直接使用或进一步处理,提高了设计效率。对于基于实例设计,正如前文所讲,与一般的设计系统最大的不同点是实例库是设计系统的核心,系统要能顺利运行必须拥有包含大量设计实例的实例库。因此,如何获取丰富的实例便成为基于实例设计系统成败的关键,为了解决实例获取问题,本文把基于实例的设计系统运行于网络环境之下,使实例获取变得非常容易,这样基于实例的设计系统才能够发挥出其独特的优势。同时,以网络为平台的设计系统使得设计更加方便快捷、效率更高,提高了企业的快速反应能力。因此,设计优良的c b d 系统加以网络化的实例收集模式,将会高效率地解决企业的设计问题,加快企业的产品快速开发能力,并使设计过程更加专业化,设计结果趋于良性发展。绪论1 4 2 数据挖掘技术在基于实例设计中的应用随着计算机技术、数据库技术及网络技术的发展,一个被称为“数据挖掘”和“数据库知识发现”( d a t am i n i n g & k n o w l e d g ed i s c o v e r yi nd a t a b a s e ,简称d m k d d ) 的新领域得到了快速发展,这是一个介于统计学、模式识别、人工智能、机器学习、数据库技术以及高性能并行计算等领域的交叉新学科,已在经济、商业、金融、天文等行业得到了成功的应用,在国际上掀起了一股空前的研究热潮( 即所谓的“数据淘金潮”) 【”。k d d 就是把数据转化为信息、把信息转化为决策的一个交互迭代的过程。把k d d 定义为“从数据中识别那些有效、新颖、潜在有用、最终可理解模式的一个复杂过程”,而把数据挖掘看作这个过程中的一个特殊步骤,是运用统计学、人工智能等方法( 或算法) 发现模式和规律、发掘有价值的关系或知识的一个阶段,其它步骤还包括:数据仓储、目标数据选择、清洗、预处理、变换和缩减、模型选择、评价和解释、知识证实和使用等如图1 2 所示。图1 2d m & k d d 过程数据分析的目的并不是模拟那些转瞬即逝的随机模式,而是要找到反映问题本质的、可重复的基本模式结构。在基于实例设计的过程中,影响设计精度、阻碍系统快速开发与广泛应用的主要原因是很难对相似实例检索、修改以及实例评价过程建立一个较为通用的模式或者方法。而数据挖掘的目的恰好就是通过对大量数据的处理发现数据之间的内在联系,也就是发掘事物的本质联系。因此,如果利用数据挖掘中的一些技术对实例库进行分析,则可以挖掘出数据库中实例的各个参变量之间的关系,发现实例数据之间的本质联系,而这些本质性的关系可以用来对事物发展趋势进行预测与描述,即:指导实例的检索及评价,并对实例的修改提供一种可行的策略。这样也许就能够为基于实例的设计方法在不同领域的应用建立起一个较为通用的模式,加快基于实例郑卅1 入学t 学硕士论文设计系统的开发速度,提高设计精度,并能够分析出实例属性之间的本质联系,使设计人员能够更好地理解设计过程的本质。本文介绍了数据挖掘中几种常用的技术,并给出了它们在基于实例设计过程中的具体应用,如:神经网路、遗传算法、决策树以及统计学中的回归分析、主成分分析、因子分析等。本文最后利用数据挖掘技术完成了二级圆柱齿轮减速器c b d 系统的开发,并对设计实例采用不同设计方法( 如:传统计算,优化等) 进行计算,把计算结果与基于实侧设计系统的设计结果相对比,通过比较表明把数据挖掘中的相关技术应用到基于实例设计系统当中是一种行之有效的方法,不仅加快了系统的开发过程,还提高了设计的精度。1 5 论文的主要工作和创新点基于实例设计是一种新的设计方法,它改变了传统的设计模式,使产品的开发周期大幅度的缩短。基于实例设计的过程也是利用积累下来的专业知识及经验进行设计的过程,但是由于它的基本理论、相关技术还不够完善,使得系统的开发有一定的难度。本文把数据挖掘中的相关技术应用到基于实例的设计当中,即体现了实例在设计过程当中的重要作用,又避开了基于实例设计方法中不完善、不成熟的部分,取得了很好的设计效果。论文主要完成了以下工作:1 ) 网络环境下c b d 系统平台的构建;2 ) 数据挖掘技术在基于实例设计中的应用研究;3 ) 利用数据挖掘中的逐步回归分析方法建立数学模型;4 ) 根据数据挖掘的结果,实现了利用混合离散变量直接搜索方法( m d o d )进行实例修改;5 ) 采用面向对象( o o ) 技术对二级圆柱齿轮减速器数据模型进行构建,完成了实例库基础数据的收集整理工作;6 ) 形成网络化的二级圆柱齿轮减速器c b d 系统,通过设计结果对比验证了本文所提出的设计方法的可行性:7 ) 采用x m l 一可扩展标记语言作为数据传输标准,并针对二级圆柱齿轮减速1 绪论器对其x m l 文件作了详细的定义;8 1 利用v b 对a u t o c a d 进行二次开发形成客户端软件,利用该客户端软件读取x m l 文件,提取设计结果并对设计结果进行可视化处理,建立了二级圆柱齿轮减速器的参数化实体模型。论文研究工作主要有以下创新:a ) 基于实例设计系统在网络环境下运行的关键技术研究;b ) 把数据挖掘的相关技术引入到基于实例设计系统中;c ) 结合数据挖掘结果采用混合离散变量直接搜索( m d o d ) 方法进行最佳相似实例的修改。郑州大学工学硕j 一论文2 基于实例设计( c b d ) 中的数据挖掘技术2 1 数据挖掘技术概述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的以及最终可理解的模式的非平凡过程。它是- f l 涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。由于数据挖掘是- i - j 受到来自各种不同领域研究者关注的交叉性学科,因此导致了很多不同的术语名称。其中,最常用的术语是“知识发现”和“数据挖掘”。相对来讲,数据挖掘主要流行于统计界( 最早出现于统计文献中) 、数据分析、数据库和管理信息系统界;而知识发现则主要流行于人工智能和机器学习界。数据挖掘可粗略地理解为三部曲:数据准备( d m a p r e p a r a t i o n ) 、数据挖掘( d m am i n i n g ) ,以及结果的解释评估( i n t e r p r e t a t i o na n de v a l u a t i o n ) 。按照数据挖掘的任务分,可分为:分类或预测模型数据挖掘、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等。按照数据挖掘的对象分,有如下若干种数据源:关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据、异质数据库、遗产( 1 e g a c y )数据库以及w e b 数据源。按照数据挖掘的方法分,可粗分为:统计方法、机器学习方法、神经网络方法和数据库方法。统计方法中,可细分为:回归分析( 多元回归、自回归等) 、判别分析( 贝叶斯判别、费歇尔判别、非参数判别等) 、聚类分析( 系统聚类、动态聚类等) 、探索性分析( 主成分分析法、相关分析法等) 、以及模糊集、粗糙集、支持向量机等。机器学习中,可细分为:归纳学习方法( 决策树、规则归纳等) 、基于实例的推理( c b r ) 、遗传算法、贝叶斯信念网络等。神经网络方法,可细分为:前向神经网络( b p 算法等) 、自组织神经网络( 自组织特征映射、竞争学习等) 等。数据库方法主要是基于可视化的多维数据分析或o l a p 方法,另外还有面向属性的归纳方法。从上文的介绍可以看出基于实例推理c b r 也是数据挖掘中机器学习的一种方2 基于实例设计( c b d ) 中的数据挖掘技术法,在下一章将详细讨论c b r 在设计领域的应用即基于实例的设计- - c b d ,本章主要介绍在基于实例设计过程中用到的其它几种数据挖掘技术。2 2 人工神经网络( a n n )神经网络是指一类新的计算模型,它是模仿人脑神经网络的结构和某些工作机制而建立的一种计算模型。这种计算模型的特点是,利用大量简单的计算单元( 即神经元) 连成网络,来实现大规模并行计算。神经网络的工作机理是通过学习,改变神经元之间的连接强度,常用的神经计算模型有多层感知机、反传网络、自适应映射网络等,在神经网络中,由权重和网络的拓扑结构决定了它所能识别的模式类型。最流行的神经网络学习算法是b p 算法( b a c k p r o p a g a t i o na l g o r i t h m ) 。在基于实例设计过程中,实例之间相似度的计算可以采用神经网络方法。基于反向传播神经网络( b p n ) 的相似度计算方法采用如下步骤:首先,假定实例库中任意两个实例c a s e a 、c a s e b 的相似度s i m ( a ,鳓为已知,用实例库中各实例间的相似度构成训练样本对b p n 进行训练。设实例的描述特征数为k ,则b p n 的输入层共有2 k 个节点,输出层为1 个节点即c a s e a 、c a s e b 的相似度。隐层数根据实际问题的精度需求由试算确定。b p n 的结构如图2 1 所示脚。输入节点l i 广l 一图2 i 利用前馈神经网络( b p n ) 计算相似度嘲基于b p n 的最佳相似实例检索算法可以概括如下郑州大学t 学硕i 一论文1 ) 以两个实例的描述特征为输入,其相似度为输出,训练b p n ,并存储网络权值矩阵和结构参数。2 ) 输入新实例特征,利用训练好的b p n 循环计算新实例与实例库中所有实例之间的相似度。3 ) 将b p n 计算所得的各个相似度与事先设定的相似度阈值进行比较,相似度最大的实例即为最佳相似实例。2 3 遗传算法( g a )遗传算法是模拟生物在自然环境中遗传和进化过程而形成的一种自适应全局优化概率搜索算法,是一种可用于复杂系统优化计算的鲁棒搜索算法。遗传算法以决策变量的编码作为运算对象:直接以目标函数值作为搜索信患;同时使用多个搜索点的搜索信息并使用概率搜索技术,增强了搜索过程的灵活性与准确性。遗传算法应用与很多学科如:函数优化、组合优化、生产调度问题、自动控制、机器人学、图像处理、人工生命、遗传编程及机器学习等方面。在基于实例设计过程中可以利用遗传算法对检索出的最佳相似实例进行修改。遗传算法在基于实例设计过程中的应用模型有很多种,详细参见文献【8 】,【1 1 】,【1 2 】。2 4 主成分分析( p e a )主成分分析( p e a ) 或主元分析、主分量分析是一种将多个指标化为少数相互无关的综合指标的统计学方法。在基于实例设计中,一般情况下设计实例均为多指标( 变量) 问题,在很多情况下不同指标之间有一定的相关性。由于指标数目多再加上之间的相关性,势必增加了分析问题的复杂程度,降低了分析结果的准确性。这时,主成分分析方法就可以用来将原来实例的多个具有相关性的指标重新组合成一组互相无关的几个综合指标来代替原来的指标,同时根据需要可以从中取出几个较少的性能指标来尽可能多的反映实例的信息。在基于实例设计中主成分分析方法的数学模型可以作如下描述:设实例库中有,z 个实例,每个实例均有p 项属性指标来表示:五,x ,x 。,得2基于实例设计( c b d ) 中的数据挖掘投术到原始数据资料阵:其中x =x _ 】c 1 1x 2 lx 2 2x =。x 2 ,= ( x 1 ,一,x 。)= 1 ,一,p用数据矩阵x 的p 个向量( 即设计实例的性能指标向量) 作线性组合,可写为:e = a u x l + 口2 ,x 2 + 口x pi = 1 ,p( 2 - 1 )上述方程组要求:8 i + 口;,+ 口。2 ,= lf = l ,p且系数由一下两个原则决定:1 ) e 与,f ,i ,= 1 ,p 不相关。2 ) 曩是石l ,一,搿。的一切线性组合中( 满足上述条件) 方差最大的,是与e ,f 2 ,e 。均不相关的x l ,- ,x ,的一切线性组合中方差最大者。主成分的求解方法可以参见文献【1 3 】。下面主要讨论一下主成分分析的结果在基于实例设计当中的应用:a ) 根据主成分分析结果,初步判断实例各个性能指标的重要程度。b 1 利用主成分分析可以对实例进行初步评价。最简单情况,把各个实例按照第一主成分进行排序,在只考虑部分因素的情况下根据排列顺序给出实例的评价结果。c ) 消除性能指标之间的相关性,把多个性能指标转化为较少的几个性能指标,方便后续工作的进行。例如:主成分回归法,就是把各个主成分作为新的自变量代替原变量做回归分析,一般情况下可以消除多重共线性带来的干扰,能够取得更好的分析效果。总之,在基于实例设计中即可以把主成分分析作为一种综合评价的方法,又可以把它作为一种数据预处理的手段,为后续工作的顺利进行做准备。郑卅i 大学工学硕上论义2 5 回归分析回归分析是统计学中常用的一种方法,主要用来研究一组变量之间的关系【1 ”1 1 4 1 4 。基于实例设计的设计对象一般均为多因素( 变量) 问题,各个因素之间的关系不能用函数关系直接描述出来,在存在大量实例数据的情况下便可以引入回归分析技术,利用统计学方法来寻求各个因素之间的内在联系,同时可以利用回归分析结果即回归方程及各个因子的重要性指标对最佳实例进行修改和评价。本文就是以回归分析为基础来解决最佳相似实例的修改问题。在回归模型中,一类变量起着响应的作用,称为响应变量,而所有其它的变量看成是所有响应的预报因子,称为自变量。因此,在应用回归分析之前首先需要选择回归模型,回归模型的选择和基于实例设计应用的领域有着密切的关系,可以根据经验选择,也可以根据其它工具进行预先分析如m a tl a b 、o r i g i n 等工程分析与数据处理软件。下面主要介绍工程实际当中广泛应用的多元回归模型和多重多元回归模型。2 5 1 多元线性回归多元线性回归具有多个自变量和一个响应变量,在工程上有着很广泛的应用。2 5 1 1 模型和参数估计设一,z :,z 。是确定性变量,y 是随机变量,它们之间有关系y = 岛+ f l j x 】+ + p x p + 占( 2 2 )其中风,届,以是常数,s 是服从正态分布n ( 0 ,盯2 ) 的随机变量。这就是p 元线性回归模型。当然这里只讨论p 1 的情形。x ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论