(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf_第1页
(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf_第2页
(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf_第3页
(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf_第4页
(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf_第5页
已阅读5页,还剩72页未读 继续免费阅读

(机械制造及其自动化专业论文)基于知识的甘蔗收获机械智能设计知识发现系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于知识的甘蔗收获机械智能设计 知识发现系统的研究 摘要 本文研究的知识发现系统是基于知识的甘蔗收获机械智能设计系统的重要组成部 分之一针对甘蔗收获机械的开发过程中知识匮乏、共享性差等问题,并结合甘蔗收获 机械的知识具有模糊性、层次性、耦合性等特点,研究基于双库( 基础数据库和基础知 识库) 协同机制的知识发现系统,以便于对甘蔗收获机械设计过程中的数据进行总结、 概念描述、分类、聚类、相关性分析、偏差分析和建模等,为甘蔗收获机的智能设计提 供知识支持,缩短甘蔗收获机械产品开发周期,提高产品的设计质量。 论文根据甘蔗收获机械数据的特点,应用蹦m 最大树的聚类方法和“36 ”规则,采用 t - s q l 语言编程对真实数据库中的数据进行选取、预处理和离散等数据准备操作,形成 挖掘数据库;根据关联规则的形式定义引入充分性因子,并运用改进遗传算予的遗传算 法对挖掘数据库进行关联规则挖掘;通过分析甘蔗收获机械知识的群体型模糊信息和非 完备知识样本空间,针对不同的评价指标,提出三度评价和基于信息扩散原理的自动评 价方法,实现对知识的自动评价;对于评价的知识,中断k d d 过程,启动双库协同机制, 进一步改善所提取的知识;针对提取出的知识,构建关系型的动态存储知识库,实现可 理解的动态知识浏览。根据以上核心模块的分析,以v i s u a lc + + 为开发工具,实现数 据准备、数据挖掘和知识评价管理模块,并针对甘蔗收获机械的数据库进行人工知识获 取和半自动知识获取,从而构建出基于知识的甘蔗收获机械智能设计完整的知识发现系 统。开发适合甘蔗收获机械数据库挖掘的知识发现系统,可以获取大量知识,解决概念 设计过程中大量重复性工作,使设计师长期积累下来的设计经验得到最大限度的重用, 从而提高甘蔗收获机械智能设计的效率。 关键词:甘蔗收获机械智能设计s o l 遗传算法知识发现信息扩散原理 r e s e a r c ho nk n o w l e d g ed i s c o v e r ys y s t e mo f i n t e l l i g e n td e s i g no fs u g a r c a n e h a r v e s t e r b a s e do nk n o w l e d g e a b s t r a c t s u g a r c a n eh a r v e s t e r 虹o w l e 电ed i s c o v e r ys y s t e mw h i c hi sd e v e l o p e di n t h i s p a p e r i so n eo ft h ei m p o r t a n tp a r t so fi n t e l l i g e n td e s i g no fs u g a r c a n e h a r v e s t e rb a s e do nk n o w l e d g e c o n s i d e r i n gt h es h o r t a g eo fk n o w l e d g e ,t h el a c k o fc o m m u n i c a t i o nd u r i n gt h ed e v e l o p m e n to fs u g a r c a n eh a r v e s t e r , a n dt h ef u z z y h i e r a r c h i c a la n dc o u p l i n g i m o w l e 心ec h a r a c t e r i s t i c s ,s u g a r c a n e h a r v e s t e r k n o w l e d g ed i s c o v e r ys y s t e mb a s e do nd o u b l e b a s e ( d a t a b a s ea n dk n o w l e d g e b a s e ) c o o p e r a t i n gm e c h a n i s m i sd e v e l o p e dt os u m m a d z e ,c o n c e p t u a l l yd e s c r i b e , c l a s s i f y ,c l u s t e r , a n a l y z eb yt h ec o r r e l a t i o na n dd e v i a t i o nw a y sa n dm o d e lt h e d a t ao fs u g a r c a n eh a r v e s t e r , t og i v ek n o w l e d g es u p p o r tt oi n t e l l i g e n td e s i g no f s u g a r c a n eh a r v e s t e r , t or e d u c et h ep e r i o do fd e s i g n ,a n d t oi m p r o v et h ee q u a l i t y o f p r o d u c t i o n a c c o r d i n gt ot h ef e a t u r eo fs u g a r c a n eh a r v e s t e rd a t a ,t h ed a t ai nt h er e a l d a t a - b a s ei ss e l e c t e d , p r e p r o c e s s e d ,d i s c r e t i z e da n dc o n s t r u c t e dt h em i n i n g d a t a - b a s ew i t ht h ea i do ft - s q l ,c l u s t e r i n gm e t h o do fp r i mm a x i m a lt r e ea n d “36 ”p r i n c i p l e b a s e do nt h ef o r m a l i z a t i o nd e f i n i t i o no fa s s o c i a t i o nr u l e , s u f f i c i e n c yf a c t o ri sd e s i g n e da sam e a s u r ea p p r o a c h t h ea s s o c i a t i o n - r u l e m i n i n g i s i m p l e m e n t e db yt h ew a yo fi m p r o v e dg e n e t i ca l g o r i t h m s a f t e r a n a l y z i n gt h eg r o u p e df u z z yi n f o r m a t i o na n dt h ei n c o m p l e t es a m p l es p a c eo f k n o w l e d g e ,t h r e e - f a c t o re v a l u a t i o nm e t h o da n da u t o m a t i ce v a l u a t i o nm e t h o d b a s e d0 1 1t h ei n f o r m a t i o nd i f f u s et h e o r ya r ed e v e l o p e di nv i e wo ft h ed i f f e r e n t e v a l u a t i o ni n d e x t h e n i i l t e r n l p t i i 培k d d ,t h e d o u b l e - b a s e c o o p e r a t i n g m e c h a n i s mi sd r i v e nt oi m p r o v et h eq u a l i t yo fk n o w l e d g e a c c o r d i n gt ot h e d i s c o v e r e d k n o w l e d g e ,t h er e l a t i o n a l ,d y n a m i cs t o r a g ek n o w l e d g e - b a s e i s c o n s t r u c t e dt od y n a m i c a l l yb r o w s et h eu n d e r s t a n d a b l ek n o w l e d g e a c c o r d i n gt o t h eh e r e i n b e f o r ea n a l y s i so fm a i nm o d u l e ,w i t ht h ea i do fm sv i s u a lc + + t o o l , t h ed a t ap r e p a r a t i o nm o d u l e ,t h ed a t am i n i n gm o d u l e , t h ee v a l u a t i o nm o d u l e ,t h e m a n u a la c q u i r e m e n to f k n o w l e d g ea n dt h eh a l fa u t oa c q u i r e m e n to fk n o w l e d g e a l e i m p l e m e n t e d s u g a r c a n e h a r v e s t e r k n o w l e d g ed i s c o v e r ys y s t e m o f i n t e l l i g e n td e s i g no fs u g a r c a n eh a r v e s t e rb a s e d0 1 1k n o w l e d g ei sc o m p l e t e l y c o n s t r u c t e d i ti sp r o v e dt ob ea ne f f e c t i v es y s t e mt h a td i s c o v e r sal o to f k n o w l e d g e ,s o l v e st h es h o r t c o m i n go ft h er e p e a t e dw o r kd u r i n gt h ec o n c e p t u a l d e s i g n ,u s e st h ea c c u m u l a t i v ed e s i g ne x p e r i e n c ew i t ht h em a x i m u ml i m i ta n d i m p r o v e st h ee f f e c to fi n t e l l i g e n td e s i g no fs u g a r c a n eh a r v e s t e r k e yw o r d s :s u g a r c a n eh a r v e s t e r ;i n t e l l i g e n td e s i g n ;s q l ;g e n e t i ca l g o r i t h m ; k n o w l e d g ed i s c o v e r y ;i n f o r m a t i o nd i f f u s et h e o r y 广西大学学位论文原创性声明和使用授权说明 原创性声明 本人声明:所呈交的学位论文是在导师指导下完成的,研究工作所取 得的成果和相关知识产权属广西大学所有,本人保证不以其它单位为第一 署名单位发表或使用本论文的研究内容。除已注明部分外,论文中不包含 其他人已经发表过的研究成果,也不包含本人为获得其它学位而使用过的 内容。对本文的研究工作提供过重要帮助的个人和集体,均已在论文中明 确说明并致谢。 论文作者签名:钐科冯字二呻年月如日 学位论文使用授权说明 本人完全了解广西大学关于收集、保存、使用学位论文的规定,即: 按照学校要求提交学位论文的印刷本和电子版本: 学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务; 学校可以采用影印、缩印、数字化或其它复制手段保存论文; 在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容。 请选择发布时间: , 叼即时发布口解密后发布 ( 保密论文需注明,并在解密后遵守此规定) 论文作者签名:燃 新鹳帕卜 砷年,月妒日 墓亏咖识的甘薨j l 戈获机械r 胤撤计系统知识戋现的研究 第1 章绪论 1 1 甘蔗收获机械智能设计系统研究的现状及意义 i 1 1 甘蔗收获机械研究现状 甘蔗是我国南部地区的主要经济作物之一,随着人们生活水平的提高,糖的需求量 越来越大,与此同时甘蔗种植面积也不断增加。据国家统计局公布的( 2 0 0 5 中国统计年 鉴显示,2 0 0 4 年,我国的甘蔗种植面积已经达到1 3 7 8 千公顷,其中广西为7 2 3 7 千 公顷,约占全国总种植面积的5 2 5 ;而甘蔗产量已经达到8 9 8 4 9 万吨,其中广西产量 5 0 0 3 9 万吨,约占全国总产量的5 5 7 。我国的甘蔗种植面积和总产量居巴西、印度之 后位列世界第三大国。但是广西甘蔗种植机械化程度远远落后于糖业发展的需要。广西 地处祖国的南疆,山多,丘陵多,其中甘蔗种植地很大一部分是丘陵地带。而丘陵地带 的一个主要特点就是粘土多,地势起伏不平,有坡度。蔗田地块小而分散,距离糖厂远, 运输条件差,土地准备和田间管理的各个环节没有为机械化收获创造条件,没有统一的 耕作制度,糖厂对含杂率指标要求过高( 我国0 5 ,国外5 - 2 0 0 , 6 ) ,蔗农缺乏对合理使用 机械的认识和训练。因此目前在我国,蔗断式收获机的使用根本不可能实现,整株式收 获机仅在少数农场使用,大多数甘蔗产地,仍以人力收获为主。由于我国甘蔗生产机械 化程度较低,制约了先进农业技术的应用,劳动效率低、生产成本高,己成为我国蔗糖 业与国际竞争的障碍。 目前国外一些产蔗国家,为了提高劳动生产率,进一步促进甘蔗生产的发展,都在 积极发展甘蔗收获机械化。澳大利亚,美国等发达国家都实现了甘蔗收获机械化。日本、 古巴、巴西、菲律宾、南非等国家正在引进或自行设计制造甘蔗收获机,已在不同程度 上取得了一些进展。 根据其地域广阔、平坦,糖厂自动化程度高,生产工艺先进等特点,其主要发展方 向为大型联合甘蔗收获机械,此类收获机分为切断式和整杆式两类。国外主要用切断式 收获机械,少量用整杆式甘蔗收获机械。澳大利亚几乎全部用切断式收获机械,并有完 全取代整杆式收获机械的趋势。切断式收割通常需火烧甘蔗叶,才能有效的进行收获。 此法收割的甘蔗必需在1 6 小时内送糖厂进行加工,否则会造成糖份损失和变质;而整 杆式甘蔗联合收获机对械倒伏严重的甘蔗较棘手,含杂率最低为7 1 0 。甘蔗联合收 基于知识的甘蔗收获机械智嫩 - p 系统知识戋现的研究 获机械的机械化程度高,效率高,但机械成本也高,如美国生产的联合收获机械每台成 本约2 0 0 万元左右。 我国甘蔗收获机械的研制也有4 0 多年的历史,大中小型的机型都有研制开发。大 型收获机多以仿制国外的大型联合收获机为主,且国外的收获机械又基本上是切断式, 整杆式的极少,这不符合我国的国情,我们的糖厂的压榨工艺不适于切断式甘蔗,因此 切断式在国内并不适用。而对已研制出不同类型中小型联合收获机械,还存在许多弱点, 如适应性及可靠性较差,机型杂乱,标准化、通用化程度低。由于甘蔗收获机研发的技 术难度比较大,已开发的数十种机型仍然存在田间通用性差等问题。尽管市场需求很大, 但可用的成熟机型少,特别缺乏适于丘陵地带的小型甘蔗收获机械。在现有的机型中, 对于不同的地形、地貌,不同的甘蔗品种,适应性也较差。另外甘蔗联合收获机械总体 上的成本均较高,使用性能方面也达不到要求,在国内尚未进入市场。在这种情况下, 研制小型、轻便、经济、适用于丘陵地带的甘蔗收获机械就显得尤为重要【。 1 1 2 智能设计系统概述 产品设计的典型过程是一个“设计评价一再设计”的知识循环创新过程【2 j 。智能 设计系统利用计算机辅助实现产品的设计,是多种技术的综合。其目的是运用计算机全 部或部分辅助地代替设计师从事这个设计过程,并采用计算机模拟再现工程师的创造性 设计过程。 目前c a d 技术广泛应用于不同行业、不同部门的设计应用领域,为解决各类复杂 的工程设计问题提供了强有力的手段和工具,把设计人员从枯燥的重复性工作中解脱出 来。然而,与产品设计过程的真正需求相比,常规的c a d 系统仍有一些无能为力之处 唧。真正有效的c a d 系统,除了能完成常规设计,即数值处理问题外,更重要的是能 有效地处理推理、判断和决策等非数值的问题,即符号处理问题,以便设计人员能顺利 完成更深层次的设计过程。这样的c a d 系统便是智能c a d 系统,即智能设计系统。知 识工程( k b e ) 和专家系统( e s ) 是人工智能) 研究中最有成就的分支领域之一,为推 进人工智能研究起到了重要作用。 知识工程综合了科学、技术和方法论三方面的因素,研究专门知识的获取、形式化 和计算机实现,为研制以知识为基础的各类人工智能应用系统提供一般方法和基本工具 1 4 1 。k b e 是面向整个产品开发过程,以提高市场竞争力为目标,通过知识的继承、归纳、 集成、运用和管理,建立各种异构知识系统和多种描述形式集成的开发开发设计环境, 广西大掣硕哇曲文 基于知识的甘蘑收获机械智期娃计系统知识袅现的研究 并提高创新能力的现代设计方法p j 。 设计型专家系统是专门针对工程设计问题开发的专家系统,在智能设计系统中具有 十分重要的地位。它强调对设计问题的分析与综合,通过分析与综合,经过方案确定、 参数选择、性能分析等设计阶段和设计过程,最终获得设计问题的一个或若干个可行解。 智能设计专家系统的任务是根据设计要求,求出满足设计问题约束的目标配置。目 前智能设计专家系统主要应用于电路( 如数字电路和集成电路) 设计、土木建筑工程设 计、计算机结构设计、机械产品设计和生产工艺设计等。比较有影响的系统包括v a x 计算机的总体结构和配置系统x c o n 、花布立体感图案设计和花布印染专家系统、大规 模集成电路设计系统和齿轮加工工艺设计系统等。我国在人工智能方面也取得了许多成 果,但传统的专家系统普遍存在产品信息模型简单、知识表示方法单一、图形处理能力 差、无法与有限元仿真结果有机结合等诸多问题。 1 1 3 研究基于知识的甘蔗收获机械智毹设计系统的意义 在农业机械设计方面,近年来开发了不少应用软件,发展速度也很快,但在农业机 械智能设计系统方面,相关研究和报告资料还是很少。在农业机械设计中,引入智能设 计系统,具有重要的发展意义。在农业机械设计中,不仅有理论性的东西,更重要的, 还有着许多未上升到理性的实践经验和实验测试数据,这些经验性的知识,在实际设计 中有着非常重要的作用,农业机械的设计水平更是常常依赖设计人员的实践经验。在农 业机械教科书中,大量的知识是以实验图表及实验数据给出的。每一位农业机械专家都 有自己的实践经验和解决问题的独特方法。显然,基于传统程序设计的农业机械辅助设 计是难以利用这些丰富的实践经验的,而且不能模拟专家基于经验知识的推理过程,更 无法汇总来源于不同专家的经验和知识,也就不能更好的实现设计目标和推动农业机械 学科的综合发展。智能设计系统正好可以弥补这些不足,为充分综合利用各个专家的研 究成果及实践经验提供有效的途径。 甘蔗收获机械属复杂机电产品,其设计过程必须把设计知识、设计经验同设计对象、 设计信息有机的结合起来。一方面应考虑设计是否合理可行,设计、生产成本是否可以 接受;另一方面,鉴于设计中存在的大量不确定因素,设计方案可通过仿真和智能决策 支持系统加以确定。国内外的研究表明,传统的设计技术多是不连续的设计任务,而虚 拟设计分析技术在缩短产品开发周期,提高产品的一次性研发成功率方面具有重要的作 用,有利于计算机辅助设计倩0 造装配分析的集成及产品动态性能的模拟;智能设计 基于知饭的甘蘑收获机械智翻澈计系筑知识戋现的研究 技术的引入则使产品的开发技术进入了一个新时代,它有利于建立面向整个设计过程以 及同时满足数值计算和知识推理的动态设计对象模型【6 j 。因此,从工程自动化的角度看, 充分发挥具有数值计算、仿真分析优化等能力的虚拟设计系统与具有知识处理、决策能 力的人工智能系统的优势,把虚拟样机技术和人工智能技术结合起来将成为一种创新设 计的必然趋势【刀嗍。 根据国内外甘蔗收获机械的研究现状,结合丘陵地区甘蔗收获机械开发中的难题, 构建丘陵地势地貌及甘蔗种植特点知识库;通过虚拟样机技术对甘蔗收获机扶蔗、砍蔗、 断尾、剥叶等关键部件及整机性能进行仿真分析;使用合理的知识表达方式,结合虚拟 设计技术和人工智能技术,建立甘蔗收获机械智能设计系统。基于知识的甘蔗收获机智 能设计系统的研发,可以使设计师长期积累下来的设计经验得到最大限度的重用,可以 解决概念设计过程中大量的重复性工作,有效地缩短新产品研发周期,促进甘蔗收获机 系列机型的迅速研发。可见,建立基于知识的面向产品设计全过程的智能虚拟设计系统 对于实现设计问题计算机化、可视化、决策智能化、技术创新以及产品系列的迅速研发 等方面,具有广阔的前景和重要的现实意义。 1 2 知识发现系统研究综述 1 2 1 知识发现系统研究现状 知识发现k d d ( k n o w l e d g ed i s c o v e r yi nd a t a b a s e ) 是从大量数据中提取出可信的、 新颖的、有效的并能被人理解的模式的高级处理过程,是人工智能、机器学习与数据库 技术相结合的产物即 i o l l u j 。k d d 一词是在1 9 8 9 年于美国底特律市召开的k d d 讨论会上 正式提出的。1 9 9 5 年,在加拿大蒙特利尔市召开了第一次k d d 国际学术会议,以后每年 召开一次。迄今为止,由美国人工智能协会主办的k d d 国际研讨会已经召开了7 次,规模 由原来的专题讨论会发展到国际学术大会,人数由二三十人到七八百人,论文收录比例 从2 :l 到6 :1 ,研究重点也逐渐从发现方法转向系统应用,并且注重多种发现策略和技术 的集成,以及多种学科之间的相互渗透。其他内容的专题会议也把数据挖掘和知识发现 列为议题之一,成为当前计算机科学界的一大热点。g a r t n e rg r o u p 的报告列举的5 项将 在今后几年内对工业产生重要影响的关键技术,其中k d d 和人工智能排在第一位。 目前,国外在数据挖掘方面的发展趋势及研究主要有:对知识发现方法的进一步研 究,如近年来注重对b a y e s ( 贝叶斯) 方法以及b o o s t i n g 方法的研究和提高;统计学回归 4 | l 于知识的甘蔗收获机械智能设计系统知识童现的司院 法在k d d 中的应用;k d d 与数据库的紧密结合;对网络信息挖掘方法的研究等。国外很 多计算机公司非常重视数据挖掘的开发应用,i b m 和微软都成立了相应的研究中心,一 些公司的相关软件也开始在国内销售,如p l a t i n u m 、b o 以及i b m 。基于k d d 的应用也得 到全面发展,从工业到农业;从天文学上的行星到地质学上的矿藏探测;从分析商场客 户的消费行为模式到分析生物的基因构成。美国市场研究公司a c n i e l s e n 公司推出市 场预测系统o p p o r t u n i t ye x p l o r e r :通用电器公司( g e ) 和法国飞机制造公司( s n e c m a ) 合作研究的q u a k - f i n d e r 系统等。 在国内,从事数据挖掘研究的人员主要在大学,也有部分在研究所或公司,如中国 科学院计算所、南京大学、吉林大学、清华大学计算机系知识工程组、长城战略研究所, 以及台湾交通大学知识工程研究所等。所涉及的研究领域很多,但主要应用于金融业、 商业、医学上,在工业方面的应用相对比较少,有较系统研究的有上海交大学阮雪瑜教 授和严隽琪教授等,如基于实例的工艺知识获取模型等。并且一般集中于学习算法的研 究、数据挖掘的实际应用以及有关数据挖掘理论方面的研究。目前进行的大多数研究项 目是由政府资助进行的,如国家自然科学基金、8 6 3 计划、”九五”计划等f 1 2 】【b l 。 1 2 2 支持知识发现系统的技术基础 知识发现是一门交叉学科,它涉及几个不同领域的知识。这些领域可以分为两类, 即与挖掘( m i n i n g ) 技术( 或算法) 相关的领域和与数据本身相关的领域。与挖掘相关的两 个主要领域是人工智能的其中一个分支机器学习( 枷r 怕c h i n el e a r n i n g ) 和统计 学,特别是统计的模式识别。其它的与挖掘相关的领域是数据可视化和认知心理学:与 数据相关的主要领域是数据库管理系统( d b m s ) 和数据仓库( d a t aw a r e h o u s ed w ) 。知识 发现的产生与发展也和这两个相关领域有紧密的联系。因此,知识发现是人工智能、机 器学习与数据库技术等相结合的产物。作为知识发现的核心内容,人们通常将数据挖掘 和知识发现视作同等概念【9 】。 现在知识发现得到广泛的应用,是因为支持该技术的三种基础技术已经发展成熟, 即:【1 4 l 海量数据搜集 强大的多处理器计算机 数据挖掘算法 f r i e d m a n 1 9 9 7 1 5 】列举了四个主要的技术理由激发了数据挖掘的开发、应用和研究 5 蓉于知识的甘藤收获机械智舅缸定计系统知识戋现的研究 的兴趣: 超大规模数据库的出现; 先进的计算机技术,例如更快和更大的计算机自动搜集的数据记录; 对巨大量数据的快速访问; 对这些数据应用精深的统计方法计算的能力。 尤其数据仓库的快速发展已经满足知识发现的前提条件,而挖掘算法经过多年的发 展已经成为一种成熟、稳定且易于理解和操作的技术。 1 2 3 知识发现过程 知识发现过程可粗略地理解为三个过程:数据准备( d a t ap r e p a r a t i o n ) 、数据挖掘 ( d a t am i n i n g ) 、结果解释和评价( i n t e r p r e t a t i o na n de v a i u a t i o n ) ( 见图卜1 ) 。 可视化 图卜1 知识发现过程示葸图 f ig 1 1t h ef l o wo fk n o w l e d g ed i s c o v e r y 数据准备包括数据选取( d a t as e l e c t i o n ) 、数据预处理( d a t ap r e p r o c e s s i n g ) 和数 据变换( d a t at r a n s f o r m a t i o n ) 三个主要步骤,数据选取的目的是确定发现任务的操作 对象:数据预处理的主要任务是对选取的数据进行包括消除噪声、推导计算缺值、消除 重复记录等工作;数据变换把清洗后的数据变换成适于数据挖掘阶段使用的数据。数据 挖掘是知识发现的核心步骤,数据挖掘阶段根据任务的目的采用诸如分类、聚类、关联 规则、神经网络、遗传算法等知识发现方法进行具体的挖掘工作,并得到作为结果的模 式、规则等知识,第三步的评价阶段对这些结果进行评价,对冗余或无关的知识将其剔 除。有可能挖掘的知识完全不能满足用户的要求,这是根据具体情况需要退回到前两步 重新进行,直到结果满足要求1 1 6 】【。 6 基于知识的甘藤收获机械智能设计系统知识裳,现的研究 1 3 本文研究内容及意义 甘蔗收获机械产品数据主要包括市场需求信息、产品概念设计数据、产品详细设计 数据、产品制造数据、产品售后客户数据等。其主要特点:( 1 ) 数据种类繁多,包括显式 的与产品设计有关的数据( 例如c a d 数据) 和相关的隐含数据( 例如产品的需求说明、设 计说明等) ,并且这些数据不是全部可以通过规则表达的;( 2 ) 数据是动态变化的,在实 际设计中产品数据随着产品的概念设计、总体设计和详细设计的进行以及操作方式( 自 顶向下的设计方式或自底向上的设计方式) 的不同,会出现不同的数据生成过程,数据 是随产品相关活动的开展而逐渐由抽象向具体转化的过程。从以上两个特点可以看出, 产品结构数据的包容量大,表述范围广【1 3 】,所以在甘蔗收获机的开发过程中目前遇到的 问题是: 1 9 1 ( 1 ) 甘蔗收获机的研发出的部分部件有效成果的知识缺乏有效的归纳和整理,知识和经 验的重用性和共享性差; ( 2 ) 进行零部件和整机的设计过程中花费大量的时间查阅和检索书本知识和网络知识, 有用资料知识没有系统化; ( 3 ) 新成员重复犯前人的错误; ( 4 ) 老专家无法采用先进的仿真设计手段产生新的知识。 随着日益增长的数据量,传统的手工处理方法变得不切合实际,因此需要采用自动 化程度更高、效率更高的数据处理方法帮助人们更高效地进行数据分析。而且由于数据 的繁杂,在由人工对数据进行处理过程中,很难找出关于数据的较为全面的信息,这样 许多有用的信息仍然隐含在数据中而不能被发现和利用,造成资源的浪费。机器学习通 过对数据对象之间关系的分析可以提取出隐含在数据中的模式,即知识。因此针对甘蔗 收获机中领域知识匾乏、重用、共享性差等的问题,建立基于知识的甘蔗收获机智能设 计系统知识发现系统是必要的。 知识发现是智能设计的“瓶颈”,成功地研发甘蔗收获机械知识发现系统将可以合 理存储甘蔗收获机设计中的师长们的经验、书本知识与设计中的常识性知识;有利于对 甘蔗收获机械设计过程中的数据进行总结、概念描述、分类、聚类、相关性分析、偏差 分析和建模等,为甘蔗收获机的智能设计提供知识支持。 针对上述情况,本论文从文献 2 0 构建的甘蔗收获机械关系型数据库出发,从数据 集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式,以便提高推理效率 7 基于知识的甘蔗收获机械智能设计系统知识发现的研究 和质量,缩短产品的设计周期,为设计优化、方案决策等提供更可靠的保障,从而提高 产品的设计质量。 本论文研究的课题来源于国家自然科学基金项目一“基于知识的甘蔗收获机械智 能设计系统关键技术的研究”( 编号5 0 3 6 5 0 0 1 ) 。本论文主要研究该项目内容之一基 于知识的甘蔗收获机城智能设计知识发现系统的开发。主要内容包括数据选取、数据挖 掘、知识评价和管理等方面的研究。具体包括以下几个方面: 1 通过分析甘蔗收获机械知识特点,实现动态扩充数据库,构建合理的动态存储知 识库。 2 通过分析基于知识的甘蔗收获机械智能设计总体结构和知识库系统结构,从而构 建基于双库协同机制的知识发现系统结构。 3 通过对基础数据库的模糊聚类分析,提出模糊相似表和最大支撑表的概念,并 应用p r i m 最大树的聚类方法和“36 ”规则,采用s q l 语言编程,解决缺失 值、噪声和孤立点( 最大数据) 等脏数据问题。 4 根据关联规则的形式定义,引入充分性因子,使关联规则更可靠,通过改进了遗 传算子的遗传算法对基础数据库进行数据挖掘。 5 对基础数据库的群体型模糊信息和非完备知识样本空间分析,运用三度和信息扩 散评价方法对挖掘的知识进行评价。 6 介绍了双库协同机制的实现策略。 7 研究知识的检测、管理和维护的有效方法。 8 广西大掌硗j 啦文矗厅知饭的甘蔗收获机械智能设计系统知识裳现的研究 第2 章甘蔗收获机械智能设计系统的总体结构 2 1 甘蔗收获机械智能设计系统总体结构( 1 9 1 1 2 】 甘蔗收获机械智能设计系统利用计算机辅助实现甘蔗收获机械产品的设计,其重要 组成技术包括专家系统技术、仿真技术等。甘蔗收获机械智能设计系统的总体结构如图 2 1 所示,主要由知识库、数据库、推理机、人机接口、仿真分析模块、评价模块组成。 图2 - 1s h i d s 系统设计总框图 f i g 2 - 1t h eg e n e r a ls t r u c t u r eo f s u g a r c a n eh a r v e s t e ri n t e l l i g e n td e s i g n 甘蔗收获机属于复杂的机电产品,其整机设计参数与部件设计参数之间以及各部件 设计参数之间存在着相互约束和相互影响,因此甘蔗收获机械智能设计系统采用“整机 9 基于知识的甘蔗收获机械智能设计系统知识裳现的研究 部件整机”的设计模式,首先根据用户输入的整机设计要求和使用条件完成整 机的选型设计并确定相关的重要参数,并返回可行的设计方案,用户根据各方案的评价 信息进行方案选择;然后根据用户输入的部件设计要求,并参考整机机型和相关参数, 进行各关键部件的结构设计和参数设计;最后将各个部件整合成整机,并进行仿真分析, 依据仿真分析结果对设计方案进行评价,不满足要求则返回重新进行设计。 各主要模块功能如下: ( 1 ) 数据库用于存储领域内的初始数据和推理过程中得到的各种信息,该数据库可 随时将更新的数据加到各自相应的数据库中,同时实现数据库设计过程与各数 据库的自动联结; ( 2 ) 知识库是领域知识的存储器,甘蔗收获机械设计知识主要包括丘陵地带甘蔗种 植地势地貌环境、甘蔗生长情况及机械系统设计的各种知识和模型,其设计知 识获取的主要来源于甘蔗收获机械设计领域知识、数字仿真、物理样机实验、 产品市场信息及用户要求等。知识库管理模块主要包括知识的编辑、添加和修 改,以及成功设计实例的存储等。由于甘蔗收获机械属于复杂机械,论文研究 采用层次化知识库组织模型。方法库主要存储各种有限元计算方法、优化设计 方法、甘蔗收获机械各部件设计约束函数等。知识库系统是推理机的前提; ( 3 ) 推理机负责控制并执行问题的求解过程; ( 4 ) 人机接口是智能设计系统与用户通信的部分,用来接收来自用户的信息,并将 其翻译成系统可接受的内部形式,将问题的结果输出给用户 ( 5 ) 知识获取是把用于问题求解的专门知识从知识源中提炼出来,并转换为计算机 程序或将其存储的过程。专家系统的推理能力是由它拥有知识的数量和质量决 定的,知识获取的效率是专家系统成败的关键。甘蔗收获机械智能设计系统的 知识可以分为静态知识和动态知识两种。 静态知识包括甘蔗机械设计领域知识、甘蔗种植地势地貌知识、甘蔗生长情况知识 等,对于静态知识的获取和维护,只需要知识工程师通过甘蔗收获机械智能设计系统主 界面调用知识库管理系统的知识获取模块就可以完成。即对于静态知识,通过半自动方 式实现知识获取。 动态知识是指甘蔗收获机械智能设计系统在推理过程中产生的新知识和仿真分析 测试过程中所形成的知识。对于每次设计方案的仿真分析都可以作为一个样本,如果甘 蔗收获机械智能设计系统能够通过自学习从样本中提取知识和实例,并利用这些知识和 1 0 | l 于知蕾啪甘囊 收获机械智期撤计系统知识鬟现的研究 实例指导进一步推理,那么随着系统推理次数的增加,系统的推理能力也将随之增强, 也就是说,甘蔗收获机械智能设计系统的智能设计的能力会随着经验的累积而增强。对 于动态知识,采用编写算法程序的方式,实现知识的自动获取。 2 2 甘蔗收获机械知识库系统总体结构 2 2 1 甘蔗收获机械知识的特点 甘蔗收获机械属于复杂的机械产品,其除机械设计知识的一般特点外,还有其自身 的特点嗍。只有充分考虑到其设计知识特点,才能采取有效地知识表达、知识发现、规 则推理等,从而实现高效地设计。基于虚拟样机的甘蔗收获机设计知识具有以下特点: ( 1 ) 设计知识的模糊性。 主要包括设计数据和参数值的模糊性、系统状态描述的模糊性。设计数据和设 计参数值的模糊性:设计数据和设计参数值往往是不确定的值,或是一个估计值,但根 据专家经验或进行仿真分析提取,能够获得此模糊数据和参数的取值范围。例如设计手 册中的许用应力范围,刀架的台升高度可根据地貌及功能需求确定其台升范围,以及由 于甘蔗种植生长状况较复杂、甘蔗田地不规则使得不同地段实地测量的数据会有一定的 范围等:系统状态描述的模糊性:某些设计对象的设计参数的状态、性能要求等的模 糊性。例如:“刀片厚”与“刀片薄”、“扶蔗效果好”与“扶蔗效果差”,有些状态 在此类二者之问,没有明确的界线分属与二者中的一者,其间有一个过渡的状态。 ( 2 ) 层次性 甘蔗收获机械的设计是可以分解为各个关键部件的设计。可以认为,整个甘蔗收获 机械的设计知识是由整机的知识和各个零部件的知识组成;各部件自身也具有层次性。 ( 3 ) 耦合性 机械零部件对象之间存在装配关系、动力匹配,运动协调等关系,因此其设计知识 也不是孤立存在的,也存在着联系。这种联系有时表现为设计变量间的约束关系。 ( 3 ) 创新性知识的形式复杂性 基于虚拟样机的甘蔗收获机设计采用p r o e ,i d e a s ,a d a m s ,a n s y s 等建模分析软 件,对设计对象进行建模仿真分析,通过对系统受力的分析、动力分析和运动分析,得 到系统的重要参数值,其结果是以曲线图表或图形的形式给出,仿真方法中模型的建立 若采用不同的约束前提,所得的仿真结论有些差异。 基于知识的甘蘑收获机械智能设计襄统知识直观的研究 根据以上对于甘蔗收获机械知识特点的分析,对于知识的模糊性、层次性、耦合性 的表达,以及获取创新性知识、仿真分析信息并将其转变为对系统设计各阶段的指导性 知识,并且排除创新性设计结果的差异性将是知识发现、知识表示的一大难点。 2 2 2 甘蔗收获机械知识表示 文献 1 9 已经针对甘蔗收获机械的知识特点,分析了知识的各种表示方法的优劣, 最终选取与或树产生式规则、框架、面向对象的综合表示方法。这种方法可以利用规则 的表示和基于规则的推理实现对有关分析、判断、决策、经验、描性知识的知识存储和 知识运用:框架结构具有组织成块知识的良好特性,采用框架表示方法抽取出设计零部 件的重要参数或性能指标,在参数的框架下,形成对参数值推理的多元性。在面向对象 的表示方法,每个对象的所有属性、对该对象的属性进行操作的方法以及操作时使用的 规则,都封装在对象类之中,对于优化设计或数值计算等设计方法可设计为方法函数。 同样也可采用此方法设计推理程序,有机结合规律类和框架类,以及对部分需要数 值计算等的设计方法,实现推理机的高效推理。图2 2 为混合知识表达模型。 图2 - 2 混合知识表达模型 f i g2 - 2t h em o d u l eo f m i x i n gk n o w l e d g er e p r e s e n t a t i o n 甘蔗收获机中每个被设计的部件都有决定其性质和功能的参数,如果参数的取值是 以描述性知识或判断性知识存在,则此类知识以规则的形式进行表达。规则既可以表示 精确性知识又可以表示模糊性知识。本文采用数据库的关系模型来存储和表达这些规 则,规则知识由多个规则表组成,他们之间通过关键字相互关联,该方式有效实现复杂 规则前提和后项的匹配。衍生知识库规则的卜r 实体模型如图2 3 。 f - 西大胄嘲t 鲁文基于知识的甘蘑收获机械智能设计系统知蕾u k 现的研究 器辈圆蛊 匝驴广一 圆圆 图2 - 3 规则库模犁 f 培2 - 3 t h em o d u l eo f r u l e 衍生知识库规则表示方法的实现是采用数据库中的关系模型进行组织。规则和框架 的表达方式存放在s q l s e r v e r 数据库中,如下表所示。规则关系如图2 4 所示。 表2 - 1 规则前提表表2 - 2 规则后项表 t a b l e 2 一i1 t 峙c o n d i t i o 鸺t a b l e1 曲l e 2 - 2t 1 l ec o n c l u s i o n st 幻l e l r u l e i d i f p a g ai f 、,砒t i c l 规则号前提参数前提值 i r u l e dt h e i i p a r at h e n v a l u e i l 规则号后项参数后项值 表2 - 3 规则连接表 1 a b l e 2 3t h er u l ec o n n e c t i o nt a b l e i l r u l e i di f n u i i lt h e n n u m r u l e s u p r u l e c o n l 规则号前提数量后项数量 支持度可信度 图2 _ 4 规则表前提、后项及规则的关系图 f i g 2 - 4r e l a t i o na m o n gt h ec o n d i t i o n ,t h ec o n c l u s i o na n dr u l e 广西大擘颂j 仑文| l 于知识的甘蘑收获机械智能设计系自知识裳现的研究 根据关系图,我们可以把关联规则在数据库中的存储方法表示为: a s s o c i r u l e : i f ( r u l e i d ,i f p a r a ,i f v a l u e ) t h e n ( r u l e i d ,t h e n p a r a , t h e n v a l u e ) r u l e ( r u l e i d ,r u l e s u p ,r u l e c o n ) 三个表之间通过r u l e i d 属性进行连接,就可以组成相应关联规则。这种存储方法 的特点是:关联规则存储的形式规范,易于在不同系统之间共享关联规则;数据冗余量 小,在其中查询关联规则的速度快;提取关联规则容易,只要按规则的r u l e i d 号分别 提取前提、后项和规则连接表参数进行拼接即可;知识发现系统挖掘的关联规则易于自 动存入衍生知识库。 文献 2 4 描述了多规则之间的联系,从而实现 产生式的与或树表示。如图2 - 5 ,d i d 3 构成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论