(计算机应用技术专业论文)神经网络在构件分类与模糊检索中的应用与研究.pdf_第1页
(计算机应用技术专业论文)神经网络在构件分类与模糊检索中的应用与研究.pdf_第2页
(计算机应用技术专业论文)神经网络在构件分类与模糊检索中的应用与研究.pdf_第3页
(计算机应用技术专业论文)神经网络在构件分类与模糊检索中的应用与研究.pdf_第4页
(计算机应用技术专业论文)神经网络在构件分类与模糊检索中的应用与研究.pdf_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文 m a s t e r st h e s i s 摘要 复用概念最早出现在1 9 6 8 年的n a t o 会议上。至今,软件复用的发展及研究 涉及面已非常广泛,复用程度也将越来越大,从而,应用在不同领域、不同作 用的各种各样的软件构件层出不穷。面对如此众多的软件构件,我们在软件开 发中将如何对构件进行分类,如何选择我们所需要的构件,就成为了我们首先 面对的一个必需解决的问题。 现今,对构件的分类与检索已有很多方法,如:刻面、索引、基于知识库 等许多方法,但都存在一定的缺陷,特别是在构件的自动分类和模糊检索上存 在很大的问题。本文分别对这些分类及检索方法进行了讨论,并从中选取了用 人工智能神经网络的方法来研究构件的分类及检索。 本文首先介绍的人工神经网络的理论,并提出可以利用自组织神经网络 ( s o m 网) 的无导师、自动学习、自动分类的特性对构件进行自动分类,并 在此基础上实现构件的模糊检索功能。 文章第四章用实例详细叙述了如何构建一个进行构件分类检索的自组织 神经网络,以及网络如何自动学习、自动分类,并通过图形客观的反应了分类 结果的好坏。进而在此基础上实现构件的模糊检索。结果表明把神经网络引入 构件的分类检索中,确实能够达到自动分类,模糊检索的目的,大大降低了人 工分类的时间开销,同时也给构件的检索提供了一个崭新的检索方法。 关键词:基于构件的软件开发,人工智能,自组织神经网,构件分类,模糊检索 + 本论文的研究工作受软件工程国家重点实验室开放研究基金( s k l s e 0 4 0 1 8 ) 和湖北 省重点科技攻关项目( 2 0 0 3 a a l 0 1 c 2 6 ) 支持。 i 硕士学位论文 m a s t e r st h e s i s a b s t r a c t s o f t w a r e - r e u s ea p p e a r sw i t ht h ec o n c e p ta se a r l ya si n1 9 6 8n a t oc o n f e r e n c e 。 u n t i ln o w , s o f t w a r e r e u s eu s e sd e v e l o p m e n ta n dr e s e a r c ha f f e c t e da r e aa l r e a d y e x t r e m e l yw i d e s p r e a d ,w i l lr e u s em o r ea n d m o r ei sa l s ob i gw i t ht h ed e g r e e ,t h u s , a p p l i e di nt h ed i f f e r e n td o m a i n ,t h ed i f f e r e n tf u n c t i o nv a r i o u ss o f t w a r ec o m p o n e n t e m e r g e s o n ea f t e ra n o t h e r i n c e s s a n t l y f a d n g t h es om u l t i t u d i n o u ss o f t w a r e c o m p o n e n t h o ww i l lw ec a r r yo nt h ec l a s s i f i c a t i o ni nt h es o f t w a r ed e v e l o p m e n tt o t h ec o m p o n e n t ,h o ww i l lc h o o s et h ec o m p o n e n tw h i c hw ew i l ln e e d ,h a sb e c o m ea n e s s e n t i a ls o l u t i o nq u e s t i o nw h i c hw ef i r s tw i l lf a c e n o w a d a y s ,h a dv e r ym a n ym e t h o d st o t h ec o m p o n e n tc l a s s i f i c a t i o na n dt h e r e t r i e v a l ,f o re x a m p l e :f a c e t e d ,i n d e x ,b a s e do nk n o w l e d g el i b r a r ya n ds oo n ,b u t a l lh a st h ec e r t a i n f l a w , s p e c i a l l y h a st h ev e r yb i gp r o b l e mi nt h e c o m p o n e n t a u t o m a t i cs o r t i n ga n dt h ef u z z yr e t r i e v a l t h i sa r t i c l es e p a r a t e l yh a sc a r r i e do nt h e d i s c u s s i o nt ot h e s ec l a s s f i c a t i o n sa n dt h er e t r i e v a lm e t h o d a n ds e l e c t c dh a ss t u d i e d t h e c o m p o n e n t w i t ht h ea r t i f i c i a l i n t e l l i g e n c e n e r v en e t w o r km e t h o dt h e c l a s s i 矗c a t i o na n dt h er e t r i e v a l t h i sa r t i c l ef i r s ti n t r o d u c e dt h ea r t i f i c i a ln e r v en e t w o r kt h e o r y , a n dp r o p o s e d m a y u s ef r o mt h es e l f - o r g a n i z a t i o nf e a t u r em a dn e r v en e t w o r k ( t h es o m n e t ) n o n t e a c h e r , t h ea u t o m a t i cs t u d y , t h ea u t o m a t i cs o r t i n gc h a r a c t e r i s t i c c a r r i e so nt h e a u t o m a t i cs o r t i n gt ot h ec o m p o n e n t ,a n dr e a l i z e st h ec o m p o n e n tf u z z yr e t r i e v a l f u n c t i o ni nt h i sf o u n d a t i o n t h ef o u r t hc h a p t e ri nd e t a i ln a r r a t ew i t ht h ee x a m p l eh o wt oc o n s t r u c tt h e o r g a n i z a t i o nn e r v en e t w o r kt oc a r r yo nt h ec o m p o n e n tc l a s s i f i c a t i o nr e t r i e v a l ,a s w e l la sh o wd i dt h en e t w o r k a u t o m a t i c a l l ys t u d y , t h e a u t o m a t i c s o r t i n g ,a n dt h r o u g h g r a p ho b j e c t i v er e s p o n s ec l a s s i f i c a t i o nr e s u l tq u a l i t y t h e n r e a l i z e st h ec o m p o n e n t f u z z yr e t r i e v a li nt h i sf o u n d a t i o n t h er e s u l ti n d i c a t e di n t r o d u c e st h en e r v en e t w o r k t h ec o m p o n e n ti nt h ee l a s s i f l e dr e t r i e v a l ,t r u l yc a l la c h i e v et h ea u t o m a t i cs o r t i n g , t h ef u z z yr e t r i e v a lg o a l ,g r e a t l yr e d u c e dt h em a n u a lc l a s s i f i c a t i o nt i m ee x p e n s e s , s i m u l t a n e o u s l y a l s o g a v et h ec o m p o n e n tt h e r e t r i e v a lt o p r o v i d eab r a n d - n e w r e t r i e v a lm e t h o d k e y w o r d s :b a s e do nc o m p o n e n ts o f t w a r ed e v e l o p m e n t ,a r t i f i c i a li n t e l l i g e n c e , s e l f - o r g a n i z i n g f e a t u r e m a p ,c o m p o n e n tc l a s s i f i c a t i o n ,f u z z y r e t r i e v a l 硕士学位论文 m a s t e r st h e s i s 华中师范大学学位论文原创性声明和使用授权说明 原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究 工作所取得的研究成果。除文中已经标明引用的内容外,本论文不包含任何其 他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和 集体,均已在文中以明确方式标明。本声明的法律结果由本人承担。 作者签名: 日期:弘争年月,。日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校 有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查 阅和借阅。本人授权华中师范大学可以将本学位论文的全部或部分内容编入有 关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位 论文。 作者签名: 日期:跏, 日 导师签名: 日期:。年月 日 本人已经认真阅读“c a l i s 高校学位论文全文数据库发布章程”,同意将本 人的学位论文提交“c a l i s 高校学位论文全文数据库”中全文发布,并可按“章 程”中的规定享受相关权益。圃童逾塞握窒卮进卮;旦坐生;旦二笙;旦三生 筮i 吐 作者签名:乇w 动儿 日期:,哆年f 月r 口日 导师签名: 日期:年月 日 硕士学位论文 m a s t e r st h e s i s 第一章绪论 1 1 论文的研究背景及意义 1 1 1 国内外构件的发展现状 软件重用是指在软件开发过程中重用过去软件开发所获得的成果。采用软 件重用技术能有效地提高软生产率,降低软件开发费用,增加软件可靠性及可 维护性,提高软件质量,因此软件重用技术是解决“软件危机”的一种有效方 法【”1 。复用概念出现早在1 9 6 8 年的n a t o 会议上,在其后二十多年中,已有 了许多成功的复用例子。当前对软件复用的研究涉及面较宽,包括构件模型, 构件的设计、生产或获取,构件描述语言,构件的再次工程,构件的分类、组 织、存储和查询,构件的复合组装,基于构件的价格分析,构架,框架,模式 等等。 软件业是目前最有发展前途的产业,其营业额均以每年2 0 的速度递增, 预计到2 0 0 0 年,年销售额将达9 0 0 0 亿美元,软件业将成为世界第一大产业。 软件构件技术在一、二年内将轰轰烈烈地开展起来。目前国内许多大工程、大 项目都纷纷采用这项技术,如8 6 3 计划近一半的项目、通信方面许多大项目的 投标、金融行业的业务处理系统等,都在朝这个方向走。 正是随着软件业的蓬勃发展,构件的不断增加,构件库应运而生,它负责 对构件进行分类、存储、检索等功能。在软件复用研究工作中,支持构件分类、 组织、存储和查询的构件库系统的研究是一项非常重要的工作,当前已有一批 典型的软构件库系统研究工作,如r e b 0 0 t 等实际的系统,r i g 、n a t 0 等标准, a l o a f 等模型方面的研究“3 。在国内,有北大青鸟的青鸟软构件库系统j b c l ”1 1 , 硕士学位论文 m a s t e r st h e s i s 主要用的分类方法是层次分类法,刻面分类法等等。 1 1 2 本文的意义和必要性 全世界的软件行业,特别是在应用领域中的软件技术,正在酝酿着一次飞 跃。这次飞跃将会对软件行业的生产方式产生根本性的变革。这对于我们来说 既是挑战也是机遇。例如,套装软件是目前软件市场上的主要形式,但是系统 配制的不灵活性是套装软件的一大弊端。如果我们充分利用构件化技术,就可 以将我们的套装软件做得更灵活、更经济、更易于普及。又例如,中国软件行 业要涉足国外应用软件市场,因为存在语言文化的障碍则必然会困难重重。如 果我们做的是标准化的软件构件,则这一障碍将大大降低,有希望在下一世纪 仞大规模地进入国际市场。总而言之,软件构件化技术为我国的软件行业提供 了迎头赶上的可能性,至于如何把握这一契机,则是应该引起我们充分重视的 问题。通过了解软件构件发展的现状,我们不难知道: 第一,软件复用的研究涉及面将越来越广,复用程度将越来越大,从而, 应用在不同领域、不同作用的各种各样的软件构件层出不穷。面对如此众多的 软件构件,我们在软件开发中将如何寻找、如何选择就成为了我们首先面对的 一个必需解决的问题。 第二,对单个构件的重用可以划分为构件的识别和检索、构件理解和适配 ( 适应性修改) 三部分,其重用成本可用公式表示为”1 : 重用成本= 检索成本+ 理解成本+ 适配成本 第三,对大量构件进行分类有三个好处:便于组织管理、方便查询和辅助理 解,类是建立( 包括生成) 和维护构件目录信息的活动,构件的检索方法依赖于 构件的表示和分类。随着软件复用的进一步深入,各种各样的软件构件库也层 出不穷,而作为一个好的构件库,就必须有好的检索机制并且是多种检索方法 的集合。 通过以上的论述,我们不难发现,构件检索在软件复用中起着至关重要的 作用。好的检索策略和检索方法,不仅能大幅度的提高检索的效率,两且能增 硕士学位论文 m a s t e r st h e s i s 加检索的成功率。而本文所提出的分类、检索机制正是与现在其它检索所不同 并且在一定程度上弥补了其它检索缺陷的一种检索策略,它将对检索机制的完 善提供一个新的方法和补充。 1 2 本文的目的、提出方法及实现模型 本文是在总结了现在构件库检索机制存在的一些问题的基础上提出的一种 分类、检索方法。此方法的提出主要希望达到两个方面的目的: 1 ) 是要解决构件在分类中会花费大量的人力,耗费大量的时间的问题,从 而希望找到一种能使构件自动分类的方法; 2 ) 对构件查找者来说,希望构件库不仅能提供查找准确率,同时也希望能 提供查全率,即希望能查找到与所提供构件类似的构件,亦即构件的模糊检索。 为了能够解决以上两个问题,作者想到了神经网络在模式识别中的应用。 1 9 7 2 年,芬兰的t k o h o n e n 教授,提出了自组织映像( s o m ) 理论,并不断 发展成完善的s o m 神经网络。s o m 神经网络是一类无导师的学习网络,主要 应用于模式识别、语音识别、分类等场合。s o m 网模型中的无导师、自学习、 分类的特性正好可以拿来用于解决构件的自动分类,模糊查询问题。 1 3 本文的结构安排 第一章为绪论,介绍本研究课题的背景和意义、论文的主要研究内容、目 标、实现模型以及论文的篇章结构。 第二章主要介绍人工神经网络的理论。本章循序渐进,首先介绍人工智能 的基本特征、生物神经元的结构及其神经元的数学模型,其次介绍自组织神经 网络模型的拓扑结构、运行原理、学习方法,为后章节构件分类、模糊检索的 神经网络的构造提供数学理论依据。 硕士学位论文 m a s t e r st h e s i s 第三章简要叙述现今比较流行的构件分类检索方法,并提出本课题对构件 的表示及分类方法。 第四章用实例建构一个构件分类、检索的自组织神经网络模型的方法,并 说明此模型是如何工作的。 第五章分析和总结全文并对日后工作提出展望和改进。 4 硕士学位论文 m a s t e r st h e s i s 第二章人工神经网络理论 人类具有高度发达的大脑,大脑是思维活动的物质基础,而思维是人类智 能的集中体现。长期以来,人们想方设法了解人脑的工作机理和思维的本质, 向往能构造出具有类人智能的人工智能,以模拟人脑功能,完成类似于人脑的 工作。本文正是把人类在人工神经网络方面的研究与构件检索的具体实际问题 相联系,从而达到可以对构件进行自动分类和模糊检索的目的。 2 1 人工神经网络基本特征与功能 神经网络的研究可追溯到1 9 世纪末期,其发展历史从1 9 世纪到2 0 世纪 8 0 年代可分为启蒙、低潮、复兴、高潮四个时期。直到目前,人工神经网络已 在中国科研、生产和生活中产生了普遍而巨大的影响【l “。 人工神经网络( a n n ) 是在向生物神经网络( b n n ) 学习的基础上发展起 来的。它借鉴了生物神经网络的一些主要结构特点,建立一套简单易行且能完 成人们所期望功能的模型【1 3 】。人工神经网络是人脑及其活动的一个理论化的数 学模型,它由大量的处理单元通过适当的方式互连构成,是一个大规模的非线 性自适应系统。1 9 8 8 年,h e c h t - - n i e l s e n 曾经给人工神经网络下了如下的定义: 人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新 型信息处理体系。通过模仿脑神经系统的组织结构以及某些活动机理,人工神 经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能。 神经网络的特征归纳为结构特征和能力特征如下1 1 4 j : ( 1 ) 结构特征:并行处理、分布式存储与容错性。人工神经网络是由大量 简单处理组件相互连接构成的高度并行的非线性系统,具有大规模并行性处理 硕士学位论文 m a s t e r st h e s i s 特征。 ( 2 ) 能力特征:自学习、自组织与自适应性。自适应是指一个系统能改变 自身的性能以适应环境变化的能力,它是神经网络的一个重要特征。 人工神经网络是借鉴于生物神经网络而发展起来的新型智能信息处理系 统,由于其结构上“仿照”了人脑的生物神经系统,因而其功能上也具有了某 种智能特点。下是神经网络的基本功能的简要介绍: ( 1 ) 联想记忆:由于神经网络具有分布存储信息和并行计算的性能,因此 它具有对外界刺激和输入模式进行联想记忆的能力。 ( 2 ) 非线性映像:在客观世界中,许多系统的输入与输出之间存在复杂的 非线性关系,对于这类系统,往往很难用传统的数理方法建立其数学模型。设 计合理的神经网络通过对系统输入输出样本对进行自动学习,能够以任意精度 逼近任意复杂的非线性映像。 ( 3 ) 分类与识别:神经网络对外界输入样本具有很强的识别与分类能力。 对输入样本的分类实际上是在样本空间找出符合分类要求的分割区域,每个区 域内的样本属于一类。传统分类方法只适合解决同类相聚,异类分离的识别与 分类闯题。 ( 4 ) 优化计算:优化计算是指在已知的约束条件下,寻找一组参数组合, 使由该组合确定的目标函数达到最小值。某些类型的神经网络可以把待求解问 题的可变参数设计为网络的状态,将目标函数设计为网络的能量函数。神经网 络经过动态演变过程达到稳定状态时对应的能量函数最小,从而其稳定状态就 是问题的最优解。 ( 5 ) 知识处理 知识是人们从客观世界的大量信息以及自身的实践中总结归纳出来的经 验、规则和资料。神经网络获得知识的途径与人类似,也是从对象的输入输出 信息中抽取规律而获得关于对象的知识,并将知识分布在网络的连接中予以存 6 硕士学位论文 m a s t e r st h e s i s 储。 2 2 人工神经元模型 神经生理学和神经解剖学的研究结果表明,神经元( n e u r o n ) 是脑组织的 基本单元,是神经系统结构与功能的单位。 2 2 1 生物神经元的结构 人脑中神经元的形态不尽相同,功能也有差异,但从组成结构来看,各种 神经元是有共性的。图2 1 显示了个典型神经元的基本结构和与其它神经元 发生连接的简化示意图。 图2 1 生物神经元和与其它神经元发生连接的简化示意 神经元在结构上由细胞体、树突、轴突和突触四部分组成。 ( 1 ) 细胞体:是神经元的主体,由细胞核、细胞质和细胞膜三部分构成。 细胞核占据细胞体的很大一部分,进行着呼吸和新陈代谢等许多生化过程。 ( 2 ) 树突:从细胞体向外延伸出许多突起的神经纤维,其中大部分突起较 短,其分支多群集在细胞体附近形成灌木丛状。神经元靠树突接受来自其它神 经元的输入信号,相当于细胞体的输入端。 7 硕士学位论文 m a s t e r st h e s i s ( 3 ) 轴突:由细胞体伸出的最长的一条突起称为轴突。轴突比树突长而细, 用来传出细胞体产生的输出电化学信号。轴突也称为神经纤维,其分支倾向于 在神经纤维终端处长出,这些细的分支称为轴突末梢或神经末梢。神经末梢可 以向四面八方传出信号,相当于细胞体的输出端。 ( 4 ) 突触:神经元之间通过一个神经元的轴突末梢和其它神经元的细胞体 或树突进行通信连接,这种连接相当于神经元之间的输入输出接口。突触包括 突触前、突触间隙和突触后三个部分。突触前是第一个神经元的轴突末梢部分, 突触后是指第二个神经元的村突或细胞体等受体表面。突触在轴突末梢与其它 神经元的受体表面相接触的地方有1 5 5 0 n m 的间隙,称为突触间隙,在电学 上把两者断开,见图2 2 。每个神经元大约有1 0 3 _ 1 0 5 个突触,多个神经元以突 触连接即形成神经网络。 图2 2 突触结构示意图 生物神经元间的信息的产生、传递和处理是一种电化学活动,神经元之间 就是通过上面四部分组成一个有机的整体,从而多个神经元又组成一个庞大的 体系,进行着各种信息的加工和处理。 2 2 2 神经元的建模 人工神经网络是在现代神经生物学研究基础上提出的模拟生物过程以反映 人脑某些特性的计算结构。它不是人脑神经系统的真实描写,而只是它的某种 硕士学位论文 m a s t e r st h e s i s 抽象、简化和模拟。目前人们提出的神经元模型已有很多,其中最早提出且影 响最大的,是1 9 4 3 年心理学家m c c u l l o c h 和数学家w p i a s 在分析总结神经元 基本特性的基础上首先提出的m p 模型。该模型经过不断改进后,形成目前广 泛应用的形式神经元模型。关于神经元的信息处理机制,该模型在简化的基础 上提出以下6 点假定进行描述: ( 1 ) 每个神经元都是一个多输入单输出的信息处理单元; ( 2 ) 突触分兴奋性和抑制性两种类型; ( 3 ) 神经元具有空间整合特性和阂值特性; ( 4 ) 神经元输入与输出间有固定的时滞,主要取决于突触延搁; ( 5 ) 忽略时间整合作用和不应期; ( 6 ) 神经元本身是非时变的,即其突触时延和突触强度均为常数。 显然,上述假定是对生物神经元信息处理过程的简化和概况,它清晰地描 述了生物神经元信息处理的特点,而且便于进行形式化表达。上述假定,可用 图2 3 中的神经元模型示意图进行图解表示。 x l - : x i _ - n x 1 : x i _ - x n ( a ) 多输入单输出 0 j o j x l - : x 1 - - x n x 1 _ : x i - x n ( b ) 输入加权 o j ( c ) 输入加根求和 ( d ) 输几一输出菡数 图2 3 神经元模型示意 9 o j 硕士学位论文 m a s t e r st h e s i s 2 2 3 棒经元的数学模型 上述内容可用一个数学表达式进行抽象与概括。令x i ( t ) 表示t 时刻神经元 j 接收的来自神经元j 的信息输入,o j ( t ) 表示t 时刻神经元j 的信息输出,则神 经元j 的状态可表达为 o a 0 2 , 【w f 置( 卜勺) 】一t ) ( 2 1 ) 式中 zi 输入输出问的突触肘延; t ,一神经元j 的阂值; w ;,一神经元i 到j 的突触连接系数或称权重值; f o 神经元转移函数。 为了简单起见,将上式中的突触时延取为单位时间,则式( 2 1 ) 可写为 o i + 1 ) ;, 【z 。g ) 】一弓 ( 2 2 上式描述的神经元数学模型全面表达了神经元模型的6 点假定。其中输入 x i 的下标i = 1 ,2 ,n ,输出o j 的下标j 体现了神经元模型假定( 1 ) 中的 “多输入单输出”。权重值w n 的正负体现了假定( 2 ) 中“突触的兴奋与抑制”, t l 代表循定( 3 ) 中神经元的“阈值”:输入总和常称为神经元在t 时刻的净输 入,用 删:( f ) = w o x i ( f ) ( 2 3 ) 表示,n 剖;( r ) 体现了假定( 3 ) 中提到的神经元j 的“空间整合特性”而未考 虑时间整合,当n e t :( f ) 一丁,0 时,神经元才能被激活。o j ( t + 1 ) l 5x i ( t ) z f 日q 的单 位时差代表所有神经元具有相同的、恒定的工作节律,对应于假定( 4 ) 中的 “突触延搁”;w “与时间无关体现了假定( 6 ) 中神经元的“非时变”。 为了简单起见本文并不考虑( i ) 的变化对系统的影响,而默认所有信息没有 1 0 硕士学位论文 m a s t e r st h e s i s 时延性从而式( 2 3 ) 可表示为权重向量w 和输入向量x 的点积 n 甜;0 ) 。町x ( 2 4 ) 其中w i 和x 均为列向量,定义为 w j2 ( 1 ,2 ,( i ) n ) 1 x = ( x 1 ,x 2 ,确) 7 如果令x 0 = 1 ,6 0 0 = t j ,则有- :r j = x 0r a ) 0 ,因此净输入与阚值之差可表达为 删:一t 一删= 一彤工 ( 2 5 ) 显然,式( 2 4 ) 中列向量w 和x 的第一个分量的下标均从l 开始,而式( 2 5 ) 中则从0 开始。采用( 2 5 ) 的约定后,净输入改写为n e t j ,与原来的区别是包 含了阈值。综合以上各式,神经元模型可简化为 d ,= f ( n e t ) = y ( w f x ) 2 。3 自组织神经网络 2 3 1 人工神经网络模型 ( 2 6 ) 大量的神经元组成庞大的神经网络,才能实现对复杂信息的处理与存储, 并表现出各种优越的特性。神经网络的强大功能与其大规模并行互连、非线性 处理以及互连结构的可塑性密切相关。因此必须按一定的规律将神经元连接成 神经网络,并使网络中各神经元的连接权按一定规律变化。 现在人工神经网络的模型很多,可按不同的分类方法进行分类。其中常见 两种分类方法是,按网络连接的拓扑结构分类和按网络内部的信息流向分类。 按网络连接的拓扑结构可分为: ( 8 ) 层次型结构:将神经元按功能分成若干层,如输入层、中间层( 也称 硕士学位论文 m a s t e r st h e s i s 为隐层) 和输出层,各层顺序相连,如图2 4 所示。 麟燃 f f1 lfttfff 单纯层次型网络结构 层内有互连的层次型 网络结构 输出屋到输 层有连接的 屡赶型网路结构 图2 4 层次型网络结构 输入层各神经元负责接受来自外界的输入信息,劳传递给中间各隐层神经 元;隐层是神经网络的内部信息处理层,负责信息交换,根据信息交换能力的 需要,隐层可设计为一层或多层;最后一个隐层传递到输出层各神经元的信息 经进一步处理后即完成一次从输入到输出的信息处理,由输出层向外界输出信 息处理结果。 ( b ) 互连型结构:对于互连型网络结构,网络中任意两个节点之间都可能 存在连接路径,因此可以根据网络中节点的互连程度将互连型网络结构细分为 3 种情况:( 1 ) 全互连型;( 2 ) 局部互连型;( 3 ) 稀疏连接型。如图2 5 1 2 硕士学位论文 m a s t e r st h e s i s 一豳 全互涟型冈络结构 图2 5 互连型网络结构 按网络信息流向类型来分可以分为:前馈型网络和反馈型网络。 2 3 2 自组织神经网络 采用有导师学习规则的神经网络要求对所有学习的样本给出“正确答案”, 以便网络据此判断输出的误差,根据误差的大小改进自身的权值,提高正确解 决问题的能力。然而,在很多情况下,人在认知过程中没有预知的正确模式, 人获得大量知识常常是靠“无师自通”,即通过对客观事物的反复观察、分析 与比较,自行揭示其内在规律,并对具有共同特征的事物进行正确归类。对于 人的这种学习方式,基于有导师学习策略的神经网络是无能为力的。白组织神 经网络的无导师学习方式更类似于人类大脑中生物神经网络的学习,其最重要 特点是通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网 络参数与结构。这种学习方式大大拓宽了神经网络在模式识别与分类方面的应 用。 s o m ( s e l f - o r g a n i z i n gf e a t u r em a p ) 自组织特征映像网是1 9 8 1 年芬兰 h e l s i n k 大学的t k o n h o n e n 教授提出一种神经网络,因此又称为k o n o n e n 网。 k o n o n e n 认为,一个神经网络接受外界输入模式时,将会分为不同的对应区域, 各区域对输入模式具有不同的响应特征,而且这个过程是自动完成的。从而根 据这一特点提出s o m 网。 硕士学位论文 m a s l 置r st h e s l s 2 3 2 1s o m 网涉及的基本概念 模式:是对某些感兴趣的客体的定量描述或结构描述。 模式类:是具有某些共同特征的模式的集合。 分类:是在类别知识等导师信号的指导下,将待识别的输入模式分配到各 自的模式类中去。 聚类:无导师指导的分类称为聚类,聚类的目的是将相似的模式样本划归 一类,而将不相似的分离开,其结果实现了模式样本的类内相似性和类间分离 性。 神经网络的输入模式用向量表示,比较不同模式的相似性可转化为比较两 个向量的距离,因而可用模式向量间的距离来判断模式的相似性。可采用欧式 距离和余弦法,如图2 6 。 謦黪 图2 6 计算向量距离的两种方法 欧式距离:j 阻一x ,| | = 何- x ;) 7 僻- x 。) 两个模式的欧式距离越小,说明 两个模式类越相近,反之越远。 余赫酚艟觖触躺纠s 妒4 高 2 3 2 2s o m 网拓扑结构 s o m 网共有两层,如图2 7 ,输入层模拟感知外界输入信息的视网膜,输 硕士学位论文 m a s t e r sy b l e s i s 出层模拟做出响应的大脑皮层。输入层各神经元通过权向量将外界信息汇集到 输出层的各神经元。输入层的形式与b p 网相同,节点数与样本维数相等。输 出层也是竞争层,神经元的排列有多种形式,可以是一维线阵、二维平面和三 维栅格阵。 图2 ,7自组织网络的典型结构 2 3 2 3s o m 网运行原理 s o m 网的运行分为训练和工作两个阶段。在训练阶段,网络随机输入训练 集中的样本,对某个特定的输入模式,输出层会有某个节点产生最大响应而获 胜,而在训练开始阶段,输出层哪个位置的节点将对哪类输入模式产生最大的 响应是不确定的。当输入模式的类别改变时,二维平面的获胜节点也会改变。 获胜节点周围的节点因侧向褶互兴奋作用也产生较大响应,于是获胜节点及其 获胜邻域内的所有节点所连接的权向量均向输入向量的方向作相应程度的调 整,调整力度依邻城内各节点距获胜节点的远近而逐渐衰减。网络通过自组织 方式,用大量训练样本调整网络的权值,最后使输出层各节点成为对特定模式 类敏感的神经细胞。当两个模式类的特征接近时,代表这两类的节点在位置上 也接近。从而在输出层形成能够反映样本模式类分布情况的有序特征图。 s o m 网训练结束后,输出层各节点与各输入模式类的特定关系就完全确 定了,因此可用作模式分类器。当输入一个模式时,网络输出层代表该模式类 的特定神经元将产生最大响应,从而将该输入自动归类。应当指出的是,当向 网络输入的模式不属于网络训练时见过的任何模式类时,s o m 网只能将它们 归入最接近的模式类。 1 s 硕士学位论文 m a s 豫r st f t e s i s 2 3 2 4 学习算法 s o m 网的学习算法如下: ( 1 ) 初始化:对输出层各权向量赋小随机数并进行归化处理,得到w i ,j = 1 , 2 ,m ;建立初始优胜邻域n j 。( o ) ;学习率r t 赋初始值。 ( 2 ) 接受输入:从训练集中随机选取一个输入模式并进行归一化处理,得到 r ,p e 1 ,2 ,p 。 ( 3 ) 寻找获胜节点,计算x 9 与w j 的点积,j = 1 ,2 ,m ,从中选出点积 最大的获胜节点 s ;如果输入模式未经规一化,应先计算欧式距离,从中找出 距离最小的获胜节点。 ( 4 ) 定义优胜邻域n j + ( t ) :以j + 为中心确定t 时刻的权值调整域, 一般初始邻 域n j * ( 0 ) 较大,训练过程中n j 4 ( t ) 随训i 练时间逐渐收缩。 ( 5 ) 调整权值:对优胜邻域n j * ( t ) 内的所有节点调整权值 p + 1 ) ;+ 彳p ,j i 、9 f 矽一吩9 ) 】 f = 1 ,乏,2 ;,( f ) ( 2 7 ) 式中,7 ( ,n ) 是训练时间t 和领域内第j 个神经元与获胜神经元j + 之间的拓扑距 离n 的函数,该函数一般有以下规律 tf n4 ,nf n4 很多函数都能满足以上规律,例如可构造如下函数 , k t ,) = r l ( t ) e 一” ( 2 ,8 ) 式中,n ( t ) 可用t 的单调下降函数,图4 8 给出几种可用的类型。这种随 时间单调下降的函数也称为退火函数。 ( 6 ) 结束检查:s o m 网的训练不存在类似b p 网中的输出误差概念,训练何时 结束是以学习率n ( t ) 是否衰减到零或某个预定的i e d , 数为条件,不满足结 束条件则回到步骤( 2 ) 。 硕士学位论文 m a s t e r st h e s i s k o b o n e n 学习算法的程序流程如图2 8 : 初贻化、归化权阿量,得 札j = l ,2 : 建立枕始优胜塑# 塑j $ ( 0 ) 学习辜n ( t ) 赋韧始值 j 黔蛊 叱样本 2,l 选出点积最大得获胜节点j ; 定义优胜锺域8 p ( t ) l 、l , 对优胜掘| 盛i 4 0 t ) 内节点调整权值 w l j ( t + 1 ) = w i jt ) + n ( t ,坷) 【x w i j ( t ) 】 i = 1 2 n tn j “) i 。杰 圜 图2 , 8k o h o n e n 学习算法的程序流程 1 7 硕士学位论文 m a s t e r st h e s i s 第三章构件检索与分类 对软件复用和软件构件的研究始于6 0 年代后期,3 0 年来人们直关心的 两个问题是:( 1 ) 如何有效地表示可复用软件构件? ( 2 ) 如何在已有的大量 构件中找到所需的构件? 本文关心的重点在于第2 个问题。本章将首先描述构 件的表示方法的需求,然后介绍现在普遍存在的一个构件检索分类方法及他们 的优缺点,最后重点介绍基于神经网络的构件分类检索方法。 3 1 构件的表示分类 为了解决软件危机人们提出了软件复用的概念。为了使软件能够很好的 :寻 到复用从而引发了软件构件技术,软件构件技术又是支持软件复用的核心技 术。随着软件构件的目益增多,我们需要对软构件进行有效的组织和管理,进 而产生了构件库。软构件的表示方法、分类和检索方法,决定了构件库的组织、 管理。构件库的查询和用户对软件构件的理解,是软件重用的基础性问题,也 是近来软件复用研究的一个热点。 然而,到目前为止还没有一个软件构件的统一定义,其中比较有代表性的定 义有2 0 0 0 年5 月c m u s e i 的f e l i 、b a c h m a n 等人在一份关于基于构件的软件 工程的报告中给出的定义:软件构件是一个不透明的功能实现;能够被第 三方组装;符合一个构件模型“。基于构件的软件开发过程是目前构造软件 系统的主流技术之一,使用构件来开发软件系统的主要原因在于构件具有如下 特征:互操作性、动态调用、可置换性。因此,一个有效的构件表示、分类方法 应当满足以下一些特性:“6 。” ( 1 ) 对于管理人员和用户来说都易于使用。不同的软构件库可能面向不同 1 8 硕士学位论文 m a s t e r st h e s i s 的用户群体,如,对于面向最终用户的软构件库,应当使用简单、易学的表示方 法( 关键词方法等) ,如果使用规格说明等表示方法则会拒用户于千里之外: f 2 1 能够适应对库中的软件构件分类的需要,可以容纳不断扩大的构件集合, 这是大部分软件组织的特点之。软构件库的规模参差不齐 ,j 、到数十个,大到 成千上万,对于较小的软构件库宜于采用简单的表示方法,可以减少分类的代价: 对于规模较大的软构件库应采用反映构件本质特征的方法,以区分较小的功能 差异,另外,表示方法还应支持自动分类。 ( 3 ) 能支持较好的检索效率。检索工作是使用软件构件的开始,它直接影晌 到后续的构件使用、集成等步骤,好的检索效率包括理想的查全率、查准率以 及响应时问。 ( 4 ) 好的表示方法应当是多种基本表示方法的综合。根据f r a k e s 和p o l e 的一项调查结果显示“,没用一种检索方法能满足所有用户的所有检索要求, 用户往往需要根据自己的喜好采用他自己认为最合适的检索方法。综合表示方 法可以适应变化的环境,适应各种不同的用户,这也是一些成功的软构件库的 经验之一。初级用户可以选择使用自己熟悉的方法,高级用户可以综合使用几 种方法实践 正明各种方法互相补充,能够提高检索效率“”软构件表示方法本 身并无优劣之分,对其评价应是相对的,即相对于方法应用的环境( 包括应用领 域、使用者、构件库规模、构件类型等) 。在一定的应用环境之中,可以通过表 示方法对构件分类、检索、使用、组合、定制等的支持来评价一个表示方法的 优劣。 ( 5 ) 准确并且有较强的描述能力。表示方法不但要对底层代码信息有所描 述,而且对高层领域信息也要有所描述。构件的检索不但要使用户快速查到他 所需要的构件,而更重要的是,查到的构件要用于复用,所有必须要知道什么 样的构件接口是用户需要的。 ( 6 ) 易于维护,即增加、删除、更新分类的结构和词汇不需要对构件重新 1 9 硕士学位论文 m a s t e r st h e s i s 分类,服从自动化的过程。构件的表示方法直接关系到构件库的维护难以程度, 由于大量的构件的加入,从而使得需要对构件重新分类,这在人力和物力上将 是一笔巨大的浪费。最好能够实现构件入库的自动分类。 ( 7 ) 支持寻找相似构件的能力,而不是精确匹配;支持跨领域寻找功能等 同构件的能力。精确查找匹配固然重要,但它只能满足用户查准率方面的需求, 确不能达到查全率方面的需求。很多时候用户都需要构件库能够提供模糊查询 方面的功能。 3 2 构件各种表示分类的比较 软件的表示、分类和检索的方法有很多。w , f r a k e s 和r y mm f l i 等人分别对 现有的构件表示和检索进行了分类。w f r a k e s 从构件表示出发将现有的方法分 为四种方法i2 0 】:基于人工智能的方法;基于超文本浏览的方法:基于库 科学,1 言息科学的方法:基于规格说明的方法。 而b e r t r a n di b r a h i m 在其论文中总结了八种方法:分类方法;自动索引方 法:形式化规格说明方法;基于知识的方法;基于行为的方法;基于神经 元网络的方法;浏览方法;超文本方法。 后者中的、三种方法对应前者中的方法,方法、对应前者的 方法,方法、为前者的方法,后者的方法对应前者的方法,由此,后 一种划分方法实际上是前一种方法的细化。文献“”对各种构件分类与检索方法 进行了综述。下面将讨论每一种划分方法来逐一分析比较: 1 ) 分类方法:目前存在的主要分类方法分别为;枚举、属性一值、刻面分 类。枚举分类的每部分都被组织为类,类间通常是等级关系。该分类法有以下 缺点:索引必须手工建立,开销大,易产生错误:一个部分的概念模糊可 能让该部分适用于配置中的多个位置,难以定位;结构不容易平衡,相同类 型的部分较多而另一些很少的局面很难灵活使用。属性值分类中每部分由属 硕士学位论

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论