




已阅读5页,还剩96页未读, 继续免费阅读
(计算机软件与理论专业论文)可复用资产管理系统中资产检索方法的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 摘要 随着软件行业的发展,软件的需求量迅速增加且软件系统规模也 日益扩大,越来越多的软件企业意识到软件复用的重要性。软件企业 实施软件复用最有效途径是对企业自身的资产进行复用。可复用资产 管理系统以对象管理组织( o m g ) 提出的可复用资产规约为理论依 据,实现对企业内可复用资产的描述、存储和检索等功能。开发该系 统时所面临的一个主要技术问题是如何检索系统中大量的资产,合理 的资产检索方法能大大降低检索成本和理解成本,反之则会提升企业 使用系统的难度,最终导致复用失败。 文章结合国内软件企业的软件复用现状和企业的需求,确立了基 于资产实体描述文件的关键词检索和领域刻面分类检索两种检索方 法。它们分别适合企业实施可复用资产管理系统的初期和后期,能适 应开发人员在软件复用经验上的成长变化。本文主要研究如何实现这 两种检索方法,其中涉及对一些成熟的检索技术进行改进,并运用到 可复用资产管理系统中,使检索功能更符合企业的需求。 首先,本文对可复用资产规约进行研究,并实现了资产的实体描 述文件,它是一种煳l 文档,包含了资产的元数据。在资产实体描 述文件的 元素中,实现了资产的关键词描述和领域刻 面术语描述,这些描述信息用于建立资产的相关倒排索引,以提高资 产检索效率。 其次,文章详细阐述了利用传统信息检索技术对资产实体描述文 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 件进行关键词抽取、编码和通过倒排索引实现关键词检索的过程。抽 取关键词时,本文提出由人为指定资产的关键词序列以解决缺乏软件 复用领域词典的问题,使用正向匹配算法实现资产实体描述文件的关 键词抽取。为了使检索结果粒度更细,帮助用户获取资产中最相关的 信息,本文研究对于某个查询关键词序列,如何利用d e w e y 编码查 找资产实体描述文件树的关键词最小公共祖先结点。为了对检索结果 进行排序,研究关键词与资产实体描述文件的相关度计算公式,并且 从关键词的概率分布以及在描述文档中的位置两方面来衡量相关度。 此外,本文对传统刻面模式进行了改进。在分析了传统刻面模式 的不足后,提出基于f o d a ( 面向特征的领域分析) 的领域刻面分类 模式,它将所有刻面分为三层,每一层的刻面组对应f o d a 的三个 阶段:确定领域边界并建立边界模型、提取功能需求并建立特征模型 和细化领域分析并建立架构模型。每一层中的刻面术语分别对应边界 模型、特征模型和架构模型中的特征术语。实现领域刻面分类检索时, 由于刻面术语之间存在一般特殊关系,为了使术语与资产匹配时能 体现这种关系,对刻面描述文件进行编码,并利用d e w e y 编码的特 点判断术语的所有子术语、生成刻面匹配术语集合和计算术语权重。 最后,详细介绍资产检索模块的设计与实现。以m v c 模式中的 模型实现资产检索模块,介绍实现这些模型的关键技术和核心代码。 关键词:d e w e y 编码,领域,刻面,检索,可复用资产 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 r e s e a r c ha n d 仰l e n 三n t p 灯1 0 l no fa s s e t i 冱t r ! 、厂a i ,i nr e u s a b l ea s s e tm a n a g e m 匝n t s y s t e m a bs t r a c t 晰t ht h ed e v e l o p m e n to fs o 胁a r ei n d u s 吼d e m a n d sf o rs o 脚a r e r a p i d l yi n c r e a s e 趾ds c a l e so fs o m a r es y s t e m sa l s o 孕。o w t h u s ,m o r c a n dm o r es o 凡a r ee n t e 印r i s e sh a v er e a l i z e dm ei m p o r t a n c e0 fs o 小v a r e r e l l s e t h em o s te f f e c t i v em e t h o do fs o r w a r e 砌j s i n gf o rs o 腑a r e e n t e 印r i s e si s t 0r e u s es o r w a r ea s s e t so ft h e i ro w n t h er e u s a b l ea s s e t m a n a g e m e n ts y s t e m , w h i c hi sb a s e do nr e u s a b l ea s s e ts p e c i f i c a t i o n p r e s e n t e db yo m qi m p l e m e n t st h em n c t i o n so fa s s e td e s c r i p t i o n ,硒s e t s t o r a g ea n da s s e tr e t r i e v a l h o wt or e t d e v e 硒s e t si nt h es y s t e mi sam a i n p r o b l e m w h e nw e d e s i g nt h er e u s a b l ea s s e tm a n a g e m e n ts y s t e m ap r o p e r r e t r i e v a lm e t h o dw i l le f r e c t i v e l yr e d u c et h ec o s t so fr e t r i e v a l o nt h e c o n t r a r y ,ar o u g hm e t h o dw i l lm a k et h eu s eo fs y s t e mm o r ed i m c u l ta n d r e s u l t si naf a i l u r eo fs o f t w a r er e u s e a c c o r d i n gt ot h es i t u a t i o no fs o f t w a r er e u s ei nd o m e s t i cs o f h a r e e n t e 印r i s e sa n dr e q u i r e m e n t s f 如m e n t e 印r i s e s ,t l l i sp 叩e rp r o p o s e s k e y w o r dr e t r i e v a lb a u s e do na s s e tm a n i f e s t sa i l dd o m a i nf a c e t e dr e t r i e v a l k e y w o r dr e t r i e v a lm e t h o di ss u i t a b l ef o re n t e 叩d s e sd u d n gt l l e i rr o o l ( i e i 东华大学硕士学位论文 可复用资产管理系统中资产检索方法的研究与实现 d a y so fr e u s a b l ea s s e tm a n a g e m e n ts y s t e mi m p l e m e n t a t i o n t h e 劬e ri s s u i t a b l ef o re n t e 叩r i s 骼d u r i n gt h e i rm a t u r ed a y s t l h e 似伧r e t r i e v a l m e t h o d sw i l lb ea d 印t e dt ot l l e 罂o w t ho fd e v e l o p e r s s o 胁a r er e u s i n g e x p 耐e n c e t 1 1 i sp 印e rm a i l l l yf o c u s e so nt h ei m p l e m e n t a t i o no ft h e s e 押or e t r i e v a jm e t h o d s d u d n gt h er e s e a r c h ,w ei m p r o v es o m em a t u r e r e t d e v a lm e t h o d s 龇l d 印p l yt h e mt 0t h er e u s a b l ea s s e tm a n a g e m e n t s y s t e m f i r s t l m t h e p a p e rr e s e a r c h e s o nr e l l s a b l ea l s s e t s p e c m c a t i o n 觚d c r e a t e sa s s e tm a n i f e s t sb a s e do ni t a s s e tm a n i f e s t sa r ex m lf i l e sa n d c o n t a i nm e t a d a t ao fa s s e t s w ec r e a t et l l ed e s c r i p t i o n so f 弱s e tk e y w o r d s a n df a c e tt e r l l :l su n d e rt h ec l a s s i f i c a t i o ne l e m e n ti na s s e tm a l l if e s t t h e s e d e s c r i p t i o n sa i - eu s e dt oc i e a t ei n v e r t e dl i s t so f a s s e t s e c o n d l y ,t h ep a p e rr e s e a r c h e so ne x t r a c t i n gk e y w o r d s 丘- o ma s s e t m a n i f e s t , e n c o d i n g a s s e tm a n i f e s ta n d c r e a t i n g i n v e n e dl i s t w h e n r e s e a r c m n go ne x t r a c t i n gk e y w o r d s ,w ep r o p o s eam e t h o do fm a n u a l l y d e f i n i n gk e y w o r dl i s t ,w h i c hc a na v o i daw o r d - e x t r a l c t i n gd i c t i o n a wo f s o 仕w a r er e u s i n g ,a n dw eu s ead i r e c t e dw o r ds e g m e n ta l g o r i t h mt o r e a l i z ee x t r a c t i n gk e y w o r d sf 如ms e n t e n c e s t bh e l pu s e r sc a t c ht h em o s t r e l a t e di n f o 眦a t i o no fa s s e t s ,t 1 1 ep a p e rr e s e a r c h e sh o wt of i n dt h e k e y w o r d ss m a l l e s tc o m m o na n c e s t o ri nam a n i f e s t 骶eb ya n a l y z i n g d e w e yi do fn o d e s t b s o r tt h er e s u l to fr e t r i e v a l ,w er e s e 锄c ho n c a l c u l a t i n gt l l ec o 仃e l a t i o nb e 附e e na s s e ta n dk e y w o r dl i s t ,w r h i c hd 印e n d s 东华大学硕士学位论文 可复用资产管理系统中资产检索方法的研究与实现 o nk e y w o r d ss t a t i s t i c sa n dt h e i rp o s i t i o n si na s s e tm a n i f e s t m o r e v 也ep 印e rp r o p o s e s 缸i m p 删e n to nt h et i 们i t i o n a lf a c e t s c h e m e a r e ra n a l y z i n gt h es h o r t a g eo f 仃a d i t i o n a lf a c e ts c h e m e ,w e p r e s e n tad o m a i nf a c e ts c h e m eb a s e do nf o d a ( f e a t u r e do r i e m e d d o m a i na m a l y s i s ) ,w h i c hh a st h r e el a y e r s e a c hl a y e ri nm i sf a c e ts c h e m e c o n e s p o n d st oap h a s eo ff o d 凡a n dt e m si ne a c hl a y e rc o n e s p o n dt 0 t e m si nc o n t e ) 【tm o d e l ,f e a t u r em o d e la n d 锄h i t e c t u r em o d e l c o n c e m i n gi m p l e m e n t a t i o no fd o m a i nf a c e t e dr e t r i e v a l ,t e r n 够i nf k e t a l w a y sh a v er e l a t i o n s h i po fa n c e s t o ra 1 1 dd e s c e n d a n t t or e f l e c tt h i s r e l a t i o n s h i pa m o n gt e r n l s i n m a t c h i n ga l s s e t s , w ee n c o d et h ef - a c e t m a n i f e s tt or e a l i z e 丘n d i n ga l l d e s c e n d a n t so fo n e岫 c r e a t i n g m a t c 址n g t e ml i s ta n dc a l c u l a t i n gt e m lw e i 曲t s l a s t l y t h ep a p e ri n t r o d u c e sh o ww ed e s i g nt h em o d m e so fa s s e t r e t r i e v a l w 色i m p l e m e n tt h e s em o d u l e sa sm o d e l so fn c 劬m e w o r k k e y w o r d s :d e w e yc o d e ,d o m a i n ,f a c e t ,r e t r i e v a l ,瞅l s a b l ea s s e t v 东华大学学位论文原创性声明 本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位 论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除 文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体 已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对 所写的内容负责,并完全意识到本声明的法律结果由本人承担。 学位论文作者签名:李:虱走 日期:z 口矿海弓月d 日 东华大学学位论文版权使用授权书 学位论文作者完全了解学校有关保留、使用学位论文的规定,同 意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允 许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或 部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复 制手段保存和汇编本学位论文。 保密口,在年解密后适用本版权书。 本学位论文属于 不保密吐 学位论文作者签名:巷1 鼐苞 日期:2 ,蛐x 年弓月f 0 日 指导教师签名: 日期:夕柳珲弓月,口日 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 1 1 研究背景与意义 1 1 1 研究背景 第一章绪论 一个软件系统的开发通常是从需求分析开始,经过模块设计、编码、测试等 过程,最后交付使用。软件企业在系统开发过程中经常会遇到一些需求相近的系 统,如果都按照传统的软件工程方法从头设计系统,那么就浪费了企业已有的劳 动成果,产生一些重复的软件开发活动。 随着计算机应用的逐步扩大,软件的需求量迅速增加,规模也日益扩大,带 来了软件的复杂程度的增加和程序代码的几何级增长,最终导致软件开发成本增 加,开发周期延长,产品的质量不高。为了解决这些问题,必须真正实现软件的 工业化生产方式。而有效利用已开发的成熟产品,即进行软件复用,是一条现实 可行的途径【l 】。 软件复用本质上是运用现存软件系统的产品或工程知识构造新的软件系统, 在软件开发中避免重复劳动。其出发点是以已有的工作为基础,充分利用过去应 用系统开发中积累的知识和经验,从而将开发的重点集中于应用的特有构成成 份,以提高软件开发的效率和软件的正确性【2 】。 由于国外软件行业发展较早,软件复用已经被一些有先见之明的国外软件企 业付诸实践。尽管业界的许多先驱已经谈论软件复用多年了,但大多数实践者没 有指出如何以一种可重复的并且系统级的方式进行软件复用。理由很简单,将软 件复用付诸实践所需的技术直到最近才可行。面向对象方法和编程语言的到来、 领域工程方法、集成的软件环境和c a s e 以及新的过程范型使得大范围的软件复 用成为可能。软件体系结构的进展为我们提供了软件复用的基础,而相关标准的 一致为我们提供了规划3 】【4 】。 尽管国内企业早已意识到软件复用是一个潜在的有力技术,但是许多企业在 实践时发现力不从心。实际上,大多数国内软件企业开发人员对软件复用概念依 然是迷茫的,甚至认为复用是乏味的,毕竟谁会对一个像编程一样陈旧的话题感 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 兴趣呢。目前国内对软件复用的研究主要集中在构件和构件库方面,构件库是由 一些组织建立的用于软件复用的构件存储系统,系统中的构件主要收集于互联网 或由某些构件开发商提供。国内软件企业对构件库的利用率并不高,主要原因有 两个:其一是构件库并不是为某个特定企业服务的,因此库里的构件类型比较杂, 并不能经常满足某个企业的需求,久而久之便使企业失去了兴趣;其二,构件不 是免费的,这就使得企业在复用构件时需要承担一定的风险和成本损失,结果造 成企业忙活了一场后发现软件复用得到的成本降低比期望中少的多。 1 1 2 可复用资产管理系统的研究意义 可复用资产管理系统是依据对象管理组织o m g ( o b j e c tm 觚a g e m e n tg r o u p ) 提出的可复用资产规约( r 肌s a b l e 雒s e ts p e c i f i c a t i o 玛r a s ) 【5 】而实现的软件复用 管理系统,提供对软件企业已有的可复用资产进行描述、存储和检索等功能。对 可复用资产管理系统的研究具有长远的意义,主要体现在以下两个方面: 其一,随着我国软件行业的迅猛发展,软件复用在国内软件企业的未来是美 好的,一定会引发不同寻常的反响。就目前情况来看,软件企业对构件库的反应 是冷淡的,那么国内软件复用的下一种形态是什么呢? 本文认为国内软件复用的 下一形态是对软件企业自身的资产复用,这里选择了术语“资产 是为了体现软 件企业的可复用软件所具有的永久价值。 随着软件企业对实施软件复用的意愿越来越强烈,它们迫切需要一个能对企 业可复用资产进行管理的系统。而目前只有i b m 开发了r a t i o n a la s s e tm a n g 盯 系统用以支持企业管理内部的可复用资产,除此之外市场上没有类似的系统。可 以预见,对企业可复用资产进行管理的相关系统的需求量将来会非常大。 其二,随着构件技术的广泛使用,s u n 、m i c r 0 s 0 f i 等大公司和国际组织制 定和提出了许多构件标准和参考模型,其中比较有代表性的有c o l m a 【6 1 、 c o m d c o m 阴以及j a v ab e 一8 】【9 】。然而,在这些构件规范和标准中,缺乏描述 软件设计体系中较高层次的复用产品的规范标准,所以造成目前已实现的构件往 往都集中在二进制代码级别。 随着对软件复用理解的深入,我们发现复用的范围己经不再局限于二进制代 码构件,而是延伸到系统的需求规约、构架、文档、测试计划、测试案例和数据 以及其它对开发有利的信息。终于,为了描述更宽泛的可复用软件制品,o m g 2 东华大学硕士学位论文 可复用资产管理系统中资产检索方法的研究与实现 提出了可复用资产规约( 本文中简称r a s ) 网。r a s 对资产的定义是软件开发 生命周期中在一个特定周境( c o m e x t ) 下对某个问题的解决( s 0 1 砸0 n ) ,可见这 是一种范围更广、面向问题域的定义。经过对r a s 的深入研究,我们发现r a s 对资产的描述具有极强的可扩展性,它引入剖面( p r o f i l e ) 的概念来描述不同类 型资产的元素和属性。剖面是资产信息的语义约束,它规定了不同类型资产的必 须或可选的元素和属性,通过对已有剖面的继承可以扩展更多的资产类型。i 认s 标准将来的重要性不会亚于o m g 曾经提出的c o i 淝a 标准。关于r a s 及其对 可复用资产的描述将在本文第二章详细介绍。 由于0 m g 提出r a s 标准的时间不长,所以目前国内外比较缺乏关于i 认s 的研究,而且o m g 提供的文献更多的是讲述技术规范而非实现细节,因此基于 该规约的拓展研究和系统开发将会成为软件复用领域的一个新的研究热点。 1 1 3 资产检索方法的研究意义 开发一个可复用资产管理系统所面临的主要技术问题是如何有效检索系统 中大量的可复用资源。 可复用资产的检索过程就是定位满足复用需求的资产,使用者只需理解查询 得到的少数资产就可以决定是否直接重用。通常,在较小规模的软件复用管理系 统中的检索是比较简单的,用户能够很容易地检索到所需的可复用资产,并可通 过它们的名字或通过浏览系统页面来选择它们:但在一个大规模的系统中检索可 复用资产就没有这么简单,存在很多影响检索效率的因素,一般包括: ( 1 ) 用户请求与所需资产信息的相近程度; ( 2 ) 搜寻和索引策略: ( 3 ) 索引方法的详尽性和具体性; ( 4 ) 使用的匹配和相似分析机制。 图1 1 资产复用示意图 3 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 图1 1 给出了资产复用的示意图,对资产的复用可以划分为可复用资产的识 别和检索、资产的理解和适应性修改三部分,复用成本公式为【l o j : 复用的成本= 检索成本+ 理解成本+ 修改成本 有效的检索机制能大大降低检索成本和理解成本,良好的检索方法可以使检 索者容易获得真正需要的可复用资产;而不好的检索方法则容易导致两个结果: 检索结果中包含许多不需要的资产;检索不到可复用资产。这样将大大增加复用 成本,并可能导致复用失败。因此,如何实现可复用资产管理系统中的资产检索 方法是非常值得研究的课题。 1 2 国内外研究现状 虽然目前国内外文献缺乏对基于r a s ( 可复用资产规约) 的资产检索方法 的研究,但由于r a s 对于资产的描述非常灵活,可以通过扩展已经成熟的构件 分类检索技术,使其能被运用到可复用资产管理系统中。 构件的分类和检索方法已经形成了比较成熟的体系。w f r a l ( 懿从构件表示出 发将构件分类分为人工智能方法、超文本方法和信息科学方法三类。信息科学方 法是目前实际复用项目中应用较为成功的一类,它又可分为基于受控词汇表( 枚 举、刻面) 分类和基于不受控词汇表( 如关键词) 分类两种形式,其中以枚举、 刻面、属性值、关键词和正文检索几种方法较为常见;另外,h m i l i 按照复杂度 和检索效果的递增将构件分类分为基于文本的、基于词法描述子的和基于规约的 分类方法【1 1 1 。相应的构件检索方法又可以归结为三类1 2 1 :( 1 ) 基于外部索引的 检索( 如关键词、刻面、属性值) ( 2 ) 基于内部静态索引的检索( 基于规约的构 件检索) ( 3 ) 基于内部动态索引的检索( 基于行为的检索) 。r u b 既p r i e t o d i 配 等人在i e e es o 胁a r e 发表了文献 1 3 】,提出了用刻面分类方法来对可复用软件 构件进行分类与组织的思想,具有重大的意义。构件的刻面表示方法属于图书馆 与信息科学方法的范畴,它具有对构件进行多视角的分类描述的特点,所以它的 提出立刻得到了普遍的应用与研究。n a t o 组织的软件复用标准以及r e b o o t 项目中构件的表示方法都是采用了刻面表示方法【1 4 】【1 5 】。青鸟构件库系统中的构 件采用的也是以刻面分类为主、多种分类模式相结合的构件表示方法【1 6 1 。现在 国内外仅有一些少量的软件构件库系统,在这些构件库系统中,都给出了一定的 4 东华大学硕士学位论文 可复用资产管理系统中资产检索方法的研究与实现 构件分类模式及其相应的检索机制,并且取得了一定的成功。表1 一l 中列出了部 分构件库系统的构件表示和检索方法。 表1 1 部分构件库系统的构件表示和检索方法 系统 组织 表示和检索 构件类型状况 r e b o o t e s p r j t - 2 刻面o o 构件原型 r e s u s e w 商t i n g h 0 枚举和刻面a d a 构件 产品 鹏 a 硎 g t e 刻面f 0 咖构已部署 l i b 豫r y 件 c a t a l o g b e n l a b s 不受控关键词c 函数 已部署 l 峪l i l l “釉e t r i c s 不受控关键词a d a 构件已部署 和枚举 j b c l 青鸟工程关键词、刻面、多形态多 原型 属性、超文本层次o o 构件 近年来,本体论作为共享知识的表达基础己经被广泛应用于信息科学中,例 如软件复用、信息检索、需求获取等。领域本体为领域内的概念以及概念间广泛 存在的各种关系提供了共享的描述,因此可以作为领域内构件描述的知识基础。 r u b p r i e t o d i a z 在他的文章 1 7 仲给出了一种基于刻面的本体构建方法,基本 步骤可以分为:抽取领域词汇、抽取关键词汇构造刻面,进而对所有词汇分类加 入词汇与词汇之间的关系。基于领域的本体一方面可以更加准确、完整地描述检 索需求,另一方面可以为构件的刻面描述提供丰富的语义注解,从而更好地填补 用户复用需求与构件描述之间的“鸿沟”【1 8 】。文献 1 8 中认为引入本体后,构件 描述仍然以刻面方案为主,不同的是领域本体将作为构件描述和检索的知识基础 存在。这些知识将有助于揭示构件复用需求以及构件描述的真实含义,提高构件 复用的机会。领域知识主要体现在叶子刻面下的术语空间上,而刻面树主要体现 一系列正交的描述方面的组成关系。将叶子刻面和术语定义为本体中的概念,而 叶子刻面、术语以及其它概念之间的关系也将在本体中定义。 以上所有的刻面描述模型中刻面的定义基本集中在一般构件的几个属性中 如构件的功能、环境或者操作对象等,很少涉及到构件应用到的领域及其领域的 5 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 专业方面的属性,在北大青鸟构件库中构件的刻面描述中定义了一个应用领域的 刻面,它描述了构件可能被使用到的应用领域及其子领域的名称,而不涉及到构 件的专业术语方面的描述。但是构件领域特征的描述又是理解构件和对领域构件 复用的关键,针对这方面存在的问题,根据领域的特征在构件的刻面描述中增加 领域特定的元素。由此用户能更加准确的理解目标构件的信息,提高构件检索的 效率和质量。 1 3 本文主要研究内容 本文以可复用资产管理系统为依托,研究如何在系统中实现有效的、面向复 用需求的资产检索方法。 结合国内软件企业的软件复用现状和企业的需求,文章确立了基于资产实体 描述文件的关键词检索和领域刻面分类检索两种检索方法。其中,关键词检索是 许多软件企业的开发者和领导所提出的需求。我们在与软件企业交流时发现许多 软件企业的开发人员缺乏软件复用知识和经验,关键词检索适合软件企业实施可 复用资产管理系统的初级阶段,主要面向缺乏复用知识的用户( 此类用户目前占 了大多数) 。而刻面分类检索已经是较为成熟的检索方法,被构件库广泛运用。 本文的领域刻面分类模式可以弥补传统刻面术语与用户需求之间的歧义问题,成 为企业实施系统高级阶段时的主要检索途径。图1 2 形象地描绘了这两种检索方 法对企业实施可复用资产管理系统时的作用。 企业使用系统的初期企业使用系统的后期 n 乜 缺乏软件复用知 识和经验的用户 随着系统的使用 亡= = = = = = 转变为 软件复用 领域专家 图l - 2 关键词检索和领域刻面分类检索各自的作用 本文围绕如何实现关键词检索和领域刻面分类检索而展开,其主要研究内容 6 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 如下: ( 1 ) 研究o m g 组织提出的可复用资产规约( r a s ) ,依据r a s 实现资产的 实体描述文件,并研究如何在资产实体描述文件中实现资产的关键词描述和领域 刻面术语描述,这些描述信息用于建立资产的相关倒排索引,以提高资产检索效 率。 ( 2 ) 深入研究利用传统信息检索技术对资产实体描述文件进行关键词抽取、 编码和通过倒排索引实现关键词检索等问题。资产实体描述文件包含了资产的元 数据,描述了资产最详尽的相关信息,因此最适合作为关键词检索的对象。为了 能充分利用资产实体描述文件的煳l 结构特点,使返回的检索结果粒度最细, 以帮助用户获取资产中与查询关键词序列最相关的资产元素( 例如制品、资产使 用说明或相关资产) 的信息,因此需要研究对于某个查询关键词序列,如何利用 d e w e y 编码的特点确定资产实体描述文件中的关键词最小公共祖先。抽取关键词 时,本文提出由人为指定资产的关键词序列以解决缺乏软件复用领域词典的问 题,使用正向匹配算法实现资产实体描述文件的关键词抽取。为了对检索结果进 行排序,研究关键词与资产实体描述文件的相关度计算公式,并且从关键词的概 率分布以及在描述文档中的位置两方面来衡量相关度。 ( 3 ) 本文对传统刻面模式进行改进,提出了一种刻面分类模式的新思路。研 究传统构件库刻面分类模式的不足、领域工程的相关知识以及具体的领域分析方 法,包括领域分析方法各阶段的步骤和模型。在此基础上,本文提出基于f o d a ( 面向特征的领域分析) 的领域刻面分类模式,它将不同的刻面组分成三层,每 一层对应了f o d a 的三个阶段:确定领域边界并建立边界模型、提取功能需求 并建立特征模型和细化领域分析并建立架构模型,每一层中的刻面术语分别对应 了边界模型、特征模型和架构模型中的术语,由此构建了一座用户复用需求与刻 面术语之间的桥梁。 ( 4 ) 刻面的术语之间往往存在一般特殊关系,即有些术语包含子术语,这使 得刻面的术语空间呈现树状结构。当用户选择了某些术语进行检索时,系统应该 把这些术语的所有子术语都找出来,都作为资产匹配的依据。该问题可以引申为 如何查找树中某个结点的所有后代结点。因此本文研究如何对领域刻面描述文件 ( x m l 文档) 进行编码,并利用d e w c y 编码的特点,实现查找刻面中某些术语 7 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 的所有子术语,从而生成匹配术语集合,并迸一步计算匹配时子术语的权重。 1 4 论文的组织与结构 本文共分为六章: 第一章绪论,介绍了本文的研究背景、研究意义、国内外研究现状和本文的 主要研究内容。 第二章可复用资产相关知识,主要介绍o m g 组织提出的可复用资产规约 ( r a s ) ,给出了资产的定义、核心r a s 以及剖面等相关知识,介绍了资产实体 描述文件及其中资产检索方法的相关描述,最后介绍了如何实现对资产的创建和 打包。 第三章基于资产实体描述文件的关键词检索,详细阐述了系统如何实现资产 实体描述文件的关键词检索和相关算法。该章首先分析了目前l 文档检索的 三种主要技术并确立了利用传统信息检索技术对实体描述文件进行关键词检索 的方法;然后,按照传统信息检索的流程,该章会陆续给出资产描述文件中的关 键词抽取、对资产实体描述文件的编码、建立倒排索引以及计算关键词与资产的 相关度等内容。 第四章面向复用需求的领域刻面分类检索,则介绍了提出领域刻面分类检索 的原因和相关实现。该章会首先介绍领域工程的相关概念:然后通过分析传统构 件库刻面分类检索的缺陷,提出基于f o d a 的领域刻面分类模式,介绍该模式 中刻面的功能和术语以及用f o d a 领域刻面分类模式进行资产检索的流程;详 细介绍如何利用编码和倒排索引实现领域刻面资产匹配的过程;最后指出领域刻 面分类模式对于软件企业的重要意义。 第五章可复用资产管理系统及资产检索的设计与实现,详细介绍了资产检索 的模块设计与核心模块的实现。 第六章总结与展望,总结全文的研究工作,同时也展望了整个可复用资产管 理系统及资产检索功能将来的发展路线。 8 东华大学硕士学位论文 可复用资产管理系统中资产检索方法的研究与实现 2 1 概述 第二章可复用资产相关知识 随着对软件复用理解的深入,我们发现复用范围己经不再局限于二进制代码 构件,而是延伸到系统的需求规约、构架、文档、测试计划、测试案例和数据以 及其它对开发有利的信息。终于,为了描述更宽泛的可复用软件制品,对象管理 组织o m g ( o b j e c tm 趾a g e m 即tc 的u p ) 提出了可复用资产规约( r e i l s a b l e 嬲s c t s p e c i 矗c a t i o 玛r a s ) p 】。该规约是关于可复用软件资产的结构、内容和描述方面 的一套指导原则与建议。可复用软件资产有不同的范畴和类型,规约中规定了部 分范畴,更确切地说是规定了部分类型或剖面,并提供了对这些剖面的通用指导 原则。目前国内一些软件组织也提出了和r a s 类似的可复用资产标准。 本文所依托的可复用资产管理系统是依据r a s 规约实现的,能够对软件企 业的可复用资产进行描述、存储和检索。 本章将简要介绍可复用资产的相关知识。本章2 2 节给出可复用资产的定义; 2 3 节介绍o m g 组织的可复用资产规约;2 4 节介绍本文对可复用资产规约的实 现;2 5 节主要介绍可复用资产管理系统中资产的创建和打包。 2 2 可复用资产的定义 简单地说,可复用资产是在一个给定的周境( c 0 n t e x t ) 中对某问题的解决方 案( s o l u t i o n ) 。如图2 1 所示,文献【5 】给出了可复用资产的一个高层次描述:资 产具有可变点它是资产中的一个特定位置或参数,资产的使用者可在该位置上 自定义参数,从而改变资产复用时的状态;此外,资产具有用于指导该资产如何 使用的规则;资产还应包含至少个制品,制品是软件开发生命周期中的任何工 作产出,例如需求文档、模型、源代码文件、部署描述子、测试用例或脚本等, 通常术语“制品 与一个文件关联。 9 末华大学碰学位论文日复用资产管理系统中资产检索方法的研究与实现 2 3 可复用资产规约 问题 口 解决方案 使用规则 削2 1 资产的形魏描述 r a s ( 可复用资产规约) 主要定义软件复用工程中的基本组成元素嘲。它试 图通过一致的、标准的封装来减少复用业务中的成本。这与汽车有方向盘、转弯 信号灯、踏板和燃料量表等部件非常相似,虽然这些部件随汽车的样式和构造的 不同而有细微差异,但大部分是相似的,如对它们进行标准化,则能极大地降低 复用的成本。 r a s 从两个主要范畴来描述:核心r a s ( c o 陀r a s ) 和剖面( p r o 矗l e ) 。核 心r a s 是可复用资产的描述,表达了资产规约的基本元素。剖面描述对这些基 本元素的扩展。剖面不能改变核心r a s 所规定的节点和元素的定义或语义。 2 3 l 核心r a s 图2 2 标识了核心r a s 的一些主要部分和元素。在图的顶端是些资产级 的属性。核心r a s 定义一个资产由四个主要部分组成:分类( a 豁甄缸a t i 蚰) , 解决( s o l 埘o n ) ,用法( u s a g e ) 以及相关资产( r d 缸e d a s s 幽) 。这些部分( 回 到前面汽车的类比,这些部分类似于方向盘,方向灯等) 的作用是: 分类部分,描述资产的分类信息和资产检索方法。 解决方案部分,描述资产的制品。 用法部分,包含安装,定制和使用资产的规则。 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 相关资产部分,描述了与其它资产的关系。 一般情况下,一个资产由这些包含在资产的元数据中的不同组成部分来规 约。即使是中等大小的资产,它所包含的独立制品的数量也可能非常多。r a s 通过规约资产的制品是如何组织的、资产的元文档( 描述资产的信息) 中哪些是 必需的,来为资产管理和使用提供帮助。 2 3 2 剖面 资产描述状态版本剖面 分类 描述子:名称值对 周境 领域,开发,测试 部署等 解决 需求 制品模型,代码,测试 文档 用法 用法说明活动 填充口t 变点 相关资产 关联,聚合 依赖父 图2 - 2 核心黜峪的组成 由于核心r a s 是非实例化的,因此一个资产必须是基于某特定剖面进行描 述的资产。核心r a s 和剖面间关系如图2 3 所示。 图2 3 核心r a s 和剖面关系 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 目前o m g 官方定义的剖面包括:默认剖面( d e f i u d tp m f i l e ) 、默认构件剖 面( d e f a m tc o m p o n e n tp r o f i l e ) 和默认w 曲s e i c e 剖面( d e f ;i u l tw 曲s e i p r o f i l e ) 三种。默认剖面是核心r a s 的一个实现,可以描述任何类型的资产, 默认构件剖面和默认w 曲s e 而c e 剖面都派生自默认剖面,派生信息可从剖面历 史中得到。根据实际的需求,我们也可以自定义剖面( 例如u m l 模型剖面) , 自定义的剖面可以派生自以上的任意一个剖面。 创建一个r a s 剖面可引入一些更为严格的语义和约束。例如,一个新的剖 面可使当前剖面的可选节点成为必需的节点。但父剖面中的约束不能被移除,例 如,现有节点在新剖面中的约束不能少于该节点在父剖面中的约束。 可以在新r a s 剖面中增加当前节点的属性。但当前属性上的约束不能减少。 例如,一个新剖面可使当前可选属性变为必需属性。但是该属性在父剖面中的约 束不能被去除。现有属性在新剖面中的约束不能少于该属性在父剖面中的约束。 2 4 可复用资产规约的实现 2 4 1 资产实体描述文件 资产实体描述文件是描述可复用资产的一个元信息文档,它是对某特定剖面 ( p r o f i l e ) 验证有效的l 文档,一般命名为r a s s e t m l 或m a i l i f e s t m l 。资产 实体描述文件对于资产就相当于身份证,标示了资产的剖面类型、包含的制品、 使用规则、各种分类信息和相关资产信息等等。在本文的可复用资产管理系统中, 资产实体描述文件目前有三种类型:默认资产描述、默认构件描述和默认w 曲 s e r v i c e 描述,都是根据o m g 制定的三种剖面而实现的,图2 - 4 用u m l 模型阐 明了本系统中默认资产实体描述文件的关键删l 元素和属性,该模型是在一个 抽象层次上给出的。类间的聚合关系表示元素的拥有者和包含者之间的关系。关 联关系描述了资产元素的关联,一般用标识符( 属性i d ) 来保持关联关系。 由于篇幅关系,本文只介绍涉及资产检索的c l 弱s i f i c a t i o n 元素及与其相关的 元素。d a s s i 6 c a t i o n 元素描述了资产的检索方法和分类信息,如图2 4 所示,本 文根据实际的资产检索方法在c l a s s i f i c a t i o n 元素中加入k c y 、) l ,o r d s 舯u p 和 k e y w o r d 元素,表示资产以关键词分类;在c l 鹤s i f ic a _ t i o n 元素中的c 0 n t e x t 元素下 加入f 如e t 元素和t e n i l 元素,以资产的刻面术语来表示资产的周境。本文第三章 1 2 东华大学硕士学位论文可复用资产管理系统中资产检索方法的研究与实现 和第四章中会详细介绍如何在d 弱s i f i c 撕o n 元素中描述资产的关键词和资产的刻 面分类术语。 2 4 2 剖面描述文件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 蒸汽安全知识培训总结课件
- 蒲瓜营养知识培训课件
- 蒲城会计财税知识培训课件
- 2025年高考历史试题分类汇编:中国古代史·选择题(魏晋-唐宋元明清)原卷版
- 2025年展望:我对长期服务合同的新见解
- 向量加法运算题目及答案
- 乡土中国的题目及答案
- 2025年矿压观测工考试题库及答案(含各题型)
- 沧州科学期末考试试卷及答案
- 2025跨国合作协议范本
- 汽车保养基础知识优秀课件
- 青少年运动员 运动损伤的预防 课件
- 音乐《上学歌》课件
- 绿色校园创建资料
- 污水处理池 (有限空间)作业安全告知牌及警示标志
- 2022年十部经典的三级片电影
- 六三制新青岛版四年级科学上册第一单元《动物王国》全部课件(一共5课时)
- 消防安全培训及应急演练主题教育课件PPT模板宣传PPT动态PPT
- 顶推法钢箱梁安装施工方案
- 中国诗词协会入会申请表
- 新版人民音乐出版社三年级(上册)音乐教案简版
评论
0/150
提交评论