




已阅读5页,还剩77页未读, 继续免费阅读
(计算机应用技术专业论文)构件的检索技术研究及其在信用领域构件库中的应用.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江工业大学硕士学位论文 构件的检索技术研究及其在信用领域构件库中的应用 摘要 软件复用被视为解决软件危机,提高软件生产效率和质量的现实 可行的途径。引入软件复用来实现信用评估系统的构件化开发,可快 速构建适应性好、可靠性高的信用评估系统以准确评估企业信用状 况,同时有效地减小软件开发成本。如何在大量的软件可复用资产中 找到需要的构件是基于构件复用的信用评估软件开发过程中的关键 问题。 信用构件库提供信用构件的存储、管理、r 检索以及库豹浏览与维 护,是支持复用的重要基础设施。信用构件库构件的组织和检索是基 于构件的有效表示之上的。本文通过对信用评估领域的分析,提出了 信用构件信息的表示方法,并在此基础上,重点讨论了信用构件库采 用的检索技术。 本文主要在以下几个方面展开研究: 1 、通过分析构件的刻面分类优势和原则,运用领域工程方法, 对信用评估领域分析,提出符合构件提取特征的信用构件刻 面分类模式,使信用构件具有了良好的刻面信息表示; 2 、在信用构件的刻面信息表示基础上,结合树匹配模型和层次 编码技术,将信用构件刻面检索转换为字符串的匹配,达到 相对的松弛匹配效果,采用向量空间模型v s m ( v e c t o rs p a c e i 浙江工业大学硕士学位论文 m o d e l ) 计算相似度,在保证一定查准率的情况下提高查全率; 3 、本文运用l u c e n e 全文检索技术实现信用构件库的关键词和 属性值的匹配,达到了检索效率的提高,以此适应多层次辅 助查询的需求; 4 、在上述研究的基础上,实现了信用构件库的构件检索子系统, 验证了可行性和实用性。 本文通过对信用构件库检索技术的讨论,运用了综合检索性能较 好的实现方法,对支持基于构件复用的信用评估系统的开发具有一定 的促进意义。 关键字:信用构件库,构件检索,刻面分类,信用评估 浙江工业大学硕士学位论文 r e s e a r c ho nc o m p o n e n tr e t r i e v a lt e c h n o l o g ya n di t s a p p l i c a t i o ni nt h ec r e d i t - d o m a i nc o m p o n e n tl i b r a r y a b s t r a c t s o f t w a r er e u s eh a sc l a i m e dt ob et h er e a l i s t i cm e a n st oi n c r e a s et h e p r o d u c t i v i t y o fp r o g r a m m e r sa n di m p r o v et h eq u a l i t yo fd e v e l o p e d s o f t w a r e b e s i d e s ,aw e l l - a d a p t e da n dr e l i a b l ec r e d i te v a l u a t i o ns y s t e m u s e dt oe v a l u a t et h es t a t u so ft h ec r e d i tl e v e lo fe n t e r p r i s e sc a l lb e d e v e l o p e dq u i c k l yt h r o u g ht h ec o n s t r u c t i o no fd i f f e r e n tc o m p o n e n t s ,a n d t h ec o s to ft h es o f t w a r ed e v e l o p m e n tc a nb er e d u c e ds h a r p l ya tt h es a m e t i m e c o n s e q u e n t l y , h o wt of i n dt h en e e d e dc o m p o n e n t sf r o mv a s t a m o u n to fs o f t w a r er e u s a b l ec o m p o n e n tl i b r a r yh a sb e c o m et h ek e y p r o b l e mo ft h ed e v e l o p m e n tp r o c e s so fc r e d i t e v a l u a t i o ns o f t w a r eb a s e d o nc o m p o n e n tr e u s e t h es t o r a g e ,m a n a g e m e n t ,r e t r i e v a l ,b r o w s e sa n dm a i n t e n a n c eo f c r e d i tc o m p o n e n tl i b r a r yh a sb e e np r o v i d e d ,w h i c hi st h em o s ti m p o r t a n t i n f r a s t r u c t u r es u p p o r t i n gs o f t w a r er e u s e t h ec o m p o s i t i o na n dr e t r i e v a lo f t h ec o m p o n e n tl i b r a r ya r eb a s e do nt h ee f f i c i e n t d e s c r i p t i o n o f c o m p o n e n t s s e v e r a lm e a n st op r e s e n t t h ee v a l u a t i o n c o m p o n e n t i n f o r m a t i o nh a sb e e np r o p o s e 也b a s e do nw h i c ht h ea d o p t e dr e t r i e v a l t e c h n o l o g y o ft h ee v a l u a t i o n c o m p o n e n tl i b r a r y h a sb e e nm a i n l y i i i d i s c u s s e d 浙江工业大学硕士学位论文 t h i sd i s s e r t a t i o nh a sd o n ei t sr e s e a r c ho ns e v e r a lr e s p e c t sa sf o l l o w s : 1 t h r o u g ha n a l y s i s o fc r e d i te v a l u a t i o nd o m a i nb a s e do nt h e a d v a n t a g ea n dp r i n c i p l eo ff a c e tc l a s s i f i c a t i o na n dd o m a i ne n g i n e e r i n g ,a f a c e tc l a s s i f i c a t i o ns c h e m ao fc r e d i tc o m p o n e n tc o r r e s p o n d e n tt ot h e r e t r i e v a lc h a r a c t e r i z a t i o nh a sb e e np r o p o s e d 2 o nt h eb a s i so fe f f i c i e n tr e p r e s e n t a t i o no ft h ei n f o r m a t i o no fc r e d i t c o m p o n e n t s ,i nc o n j u n c t i o nw i t ht h et e c h n o l o g yo ft r e e m a t c hm o d e l a n d h i e r a r c h ye n c o d i n g ,t h er e t r i e v a lo fc o m p o n e n tf a c e t si sc o n v e r t e d t ot h e m a t c hb e t w e e ns t r i n g st oa c h i e v et h eg o a lo fr e l a x a t i o nm a t c h i n ge f f e c t t h r o u g ht h ec a l c u l a t i o nb a s e do ft h ev s m ,t h er e c a l lh a sb e e ni m p r o v e d b a s e do nt h ec e r t a i nl e v e lo fp r e c i s i o n 3 t h i sd i s s e r t a t i o nh a sa d o p t e dl u c e n ef u l lt e x ts e a r c ht e c h n o l o g y t oi m p l e m e n tt h em a t c ho fk e y w o r da n da t t r i b u t ev a l u ef o rt h ec r e d i t c o m p o n e n tl i b r a r y a sar e s u r ,t h ee f f i c i e n c yo ft h er e t r i e v a lh a sb e e n g r e a t l yi m p r o v e dt os a t i s f yt h er e q u i r e m e n to fm u l t i l a y e ra s s i s t a n ts e a r c h 4 b a s e do nt h ea b o v er e s e a r c h ,t h i sd i s s e r t a t i o nh a si m p l e m e n t e d t h ec o m p o n e n tr e t r i e v a ls y s t e mo fc r e d i tc o m p o n e n tl i b r a r y , a n dt e s t i f i e s t h ef e a s i b i l i t ya n dp r a c t i c a b i l i t yo ft h es y s t e m t h r o u g ht h ed i s c u s s i o no ft h er e t r i e v a lt e c h n o l o g ya p p l i e dt ot h e c r e d i t c o m p o n e n tl i b r a r y , t h i s d i s s e r t a t i o nh a s p r o p o s e d a g o o d i m p l e m e n t a t i o nm e a n sw i t hg o o ds e a r c hp e r f o r m a n c e ,a n df a c i l i t a t et h e i v 浙江工业大学硕士学位论文 d e v e l o p m e n to f c r e d i te v a l u a t i o ns y s t e mb a s e do nc o m p o n e n tr e u s e k e yw o r d s :c r e d i tc o m p o n e n tl i b r a r y , c o m p o n e n tr e t r i e v a l ,f a c e t c l a s s i f i c a t i o n ,c r e d i te v a l u a t i o n v 浙江工业大学 学位论文原创性声明 本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行 研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文 不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江 工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出 重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的 法律责任。 作者签名:罗1 弱 日期:溯年于月歹多e l 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意 学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文; 被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存 和汇编本学位论文。 本学位论文属于 l 、保密口,在年解密后适用本授权书。 2 、不保密瓯 ( 请在以上相应方框内打“4 ) 作者签名: 导师签名: 日期:多a c i 肄 日期:佣年 只弓b 岁月哆日 浙江工业大学硕士学位论文 1 1 研究背景及意义 1 1 1 信用评估 第一章绪论 随着市场经济的不断发展和信用制度的逐步完善,市场交易方式逐步发生变 化,先后经历了三个阶段:实物交易阶段、货币交易阶段和信用交易阶段。西方 国家交易方式9 0 都是采用信用交易,以此提高效率,降低成本【l 】。信用交易已 经成为市场经济高度发达和完善的一种表现形式。 然而,如果进行信用交易时一方不守信用,交换关系和市场秩序就会遭到破 坏,不仅信用交易无法进行,实物交易与货币交易也会受到影响,经济活动就难 以健康发展。必然给企业带来经营风险,因此企业迫切希望提高自己的信用能力 和信用管理水平以防范和规避信用风险。 信用评估【l 】又称资信评估、信用评级,是指由独立的社会中介机构,通过对 企业、债券发行者、金融机构等市场参与主体的信用记录、经营水平、财务状况、 所处外部环境等诸因素进行分析研究之后,就其信用能力( 主要是偿还债务的能 力及其可偿债程度) 所作的综合评价,并且用简单明了的符号表达出来,以满足 社会需要的市场行为。 信用评估作为社会信用体系的重要组成部分,在完善市场体系、维护市场秩 序、促进市场经济发展等方面发挥着重要作用,是企业控制商业风险、保证市场 有效和稳定运行的一个非常重要的途径。 在我国,企业信用评估业已有了一定的发展,但与国际评估业还有很大的差 距,认识不够全面,立法仍然滞后,专业评估机构规模小,市场运作不规范。资 本市场全球化已成为2 l 世纪经济发展的主流,市场风险联动性的加强,使投资 者更加重视风险控制与防范,对客观、公正、权威的信用风险分析、评价与管理 的需求将大量增加【2 1 。 浙江工业大学硕士学位论文 借助计算机技术和信息技术构建信用评估系统,对提升传统的信用评估模 式、完善信用服务机制、增强对市场的应变能力、促进经济的稳定持续发展具有 非常重要的现实意义。目前,根据具体应用的不同,信用评估方法会有所不同, 但在信用评估领域的业务流程、信用数据处理和信用评估方面却有极大的相似 性。然而在信用评估系统的开发过程中,仍然采用一切从零的开发思想,对过去 存在质量较高的软件模块重用很少,更没有提供专门的管理系统对这些可重用模 块进行管理。本文引入软件复用思想来对开发信用评估系统过程中产生的软件模 块等高质量软件资产实现复用,以加快系统开发,减小成本,进而支持信用评估 业的发展。 1 1 2 软件复用技术 随着计算机技术在各行各业中的迅速发展,软件开发的规模急剧增大,复杂 性增高,导致了“软件危机”的出现,在软件开发中存在如开发周期长、效率低、 可维护性差、适应性差,开发成本高和不能满足用户的需求等诸多问题。这使得 人们开始重视对软件结构和生产方式的研究,要彻底解决“软件危机 ,保证软 件生产的高效率和高质量,就必须采用工程化的开发方法与工业化的生产技术 【蜘,而以构件为基础的软件复用技术为这一问题提供了新思路。 在1 9 6 8 年北大西洋公约组织( n o r t ha t l a n t i ct r e a t yo r g a n i z a t i o n ,n a t o ) 软件 工程会议上,d m c l l r o y 在他的论文“m a s s p r o d u c e ds o f t w a r ec o m p o n e n t s 中首 次提出了可复用软件构件库的思想以及形式化软件复用的概念。所谓软件复用是 指用已有的软件成分( 构件) 构造新的软件系统。软件复用的出发点是应用系统的 开发不再采用一切“从零开始 的模式,而是以已有的工作为基础,充分利用过 去应用系统开发中积累的知识和经验,如:需求分析结果,设计方案,源代码, 测试计划及测试案例等,从而提高了软件开发的效率,同时,通过复用已有的高 质量的软件资产,避免了重新开发可能引入的错误,提高了软件质量。据统计, 软件系统的开发中若复用程度达到5 0 ,则其生产率提高4 0 ,开发成本降低 约4 0 ,软件出错率降低近5 0 。软件工程专家b o h e m 认为,近十年来软件复 用已成为解决软件危机、提高软件生产率和质量的最有效、最具潜力的手段【5 8 1 。 软件复用的概念提出以来,一直被认为有明显回报的很有吸引力的思想,被 2 浙江工业大学硕士学位论文 认为是摆脱软件危机,提高软件生产效率和质量的现实可行的途径【3 】,软件复用 及其相关技术受到了高度重视和发展。在9 0 年代发展起来的基于构件的软件工 程c b s e 州( c o m p o n e n tb a s e ds o f t w a r ee n g i n e e r i n g ) 成为现代软件工程进步中的一 个里程碑,它极大地促进了软件复用思想进入各行各业信息系统的开发中,并且 产生了大量的高质量的可复用构件。 随着面向对象技术、i n t e r n e t 和w e b 技术的出现和成熟以及o l e ( o b j e c t l i n k i n ga n de m b e d d i n g ) 和j 2 e e 、c o m 、c o r b a 等工业标准的出现,为软件复 用提供了基本的技术支持,大大刺激了构件技术的发展,并逐步成为主流技术, 软件复用已成为当前软件开发的一个研究热点。 软件复用主要涉及构件的获取、构件存储管理和构件组装等方面,这几个环 节在软件复用过程中都处于非常重要的地位。无论是从可复用构件的开发角度、 还是从基于构件的复用角度来看,可复用构件的数量、种类和质量都是成功地进 行软件复用的重要前提。构件库系统主要对构件提供存储、管理、检索以及库的 浏览与维护等【5 】,为基于构件软件开发的用户提供良好的管理平台。 目前,现有的大多数构件库系统还是针对领域间通用的面向对象构件的,对 特定领域业务相关可复用构件的支持不够,而大多数的构件复用是发生在领域内 不同应用系统之间的,业务相关构件对于领域应用来说有着更高的复用价值。因 此,建立信用评估专用的构件库可以提高信用评估系统的开发效率,减小重复开 发的成本。 信用领域复用实践的深入,信用构件库将会积累大量自主开发的构件、购买 的商业c o t s ( c o m m e r c i a l l yo f ft h es h e l f ) 构件和其他组织开发的 n d i ( n o n - d e v e l o p m e n t a li t e m ) 构件。构件库作为支持信用评估系统实现构件化开 发的一个重要基础设施,关键的目标是支持使用者高效而准确地发现他们所需要 的可复用构件,与这一目标有关的主要技术问题是构件的分类和检索方法。 构件的表示与检索技术是可复用软件构件库的两个核心技术。一方面,拥有 大量可复用构件的组织必须以种易于分类管理而又方便复用者检索的机制来 表示和保存构件资源;另一方面,有效地检索机制能够降低构件查找和理解的成 本,从而提高软件产品的开发效率。因此构件的表示和检索已得到了软件复用界 广泛地重视和研究。 浙江工业大学硕士学位论文 1 2 国内外研究现状 1 2 i 构件检索的发展现状 构件库可以有效地组织和管理大量的可重用构件,并提供相应的工具支持用 户方便地检索所需构件,因此构件库及其相关问题的研究是一项非常重要的工 作。当前,国内外学术界对构件库系统进行了比较深入的研究,已经出现了不少 构件库系统和原型,如a l o a f ( a s s c tl i b r a r yo p e na r c h i t e c t u r ef r a m e w o r k ) 等模 型,r i g ( r e u s el i b r a r yi n t e r o p e r a b i l i t yg r o u p ) 、n a t o 等标准,r e b o o t ( r e u s e b a s e d0 no b j e c to r i e n t e dt e c h n i q u e s ) 、i b ma l p h a w o r k s 、f l a s h l i n e 和北大青鸟构 件库和上海构件库f 5 8 】等实际系统。它们都基于一些共同的观念,同时,它们之 间存在着一定的差异,主要表现在各个构件库采用的技术、系统的侧重目标、以 及处理的构件类型和形态等方面【6 】。为了进一步理解构件检索技术的研究现状, 以下简要介绍四种有代表性的构件库及其使用的构件检索技术。 l 、r e b o o t 构件库及其检索技术 r e b o o t ( r e u s eb a s e do no b j e c to r i e n t e dt e c h n i q u e s ) 是欧盟信息技术计划 e s p r i t 中的一个项目,目标是研究、开发以及推广重用驱动的和面向对象的软 件技术。r e b o o t 系统是9 0 年代初期国际上比较著名的构件库系统,由一个存 储构件的复用库以及一组支持构件生产、考查、分类、选择、评估和适配的复用 工具组成。 r e b o o t 采用基于刻面分类的构件检索方法作为主要检索方法,定义了 a b s t r a c t i o n ,o p e r a t i o n s ,o p e r a t e so n ,d e p e n d e n c i e s 四个刻面来描述系统所存储 的面向对象的源代码构件。a b s t r a c t i o n 刻面常为类名,o p e r a t i o n s 刻面常是类的 方法,o p e r a t e so l l 刻面描述与之合作的其它构件,其术语空间与抽象刻面是基本 一致的。从整体上看来,r e b o o t 的刻面分类模式主要针对的是源代码级别的 构件,而且不具备描述粒度较大、结构较复杂的构件如模式、框架等的能力。 2 、c o d e b r o k e r 构件库及其检索技术 c o d e b r o k e r 是美国c o l o r a d o 所开发的一个构件库原型,其特点是构件库与 源程序编辑工具实现无缝集成,为用户提供主动查询服务。c o d e b r o k e r 存储的 构件是j a v a 的类和方法,辅助j a v a 程序员的开发。 4 浙江工业大学硕士学位论文 系统通过三个a g e n t ( l i s t e n e r ,f c t c h e r ,p r e s e n t e r ) 实现构件的主动检索。 l i s t e n e r 在后台实时监控用户在编辑器中的输入,通过对输入文本( 注释、类名或 方法名) 的分析获得检索条件,交给f e t c h e r 处理。f e t c h e r 在构件库中检索满足条 件的构件通过p r e s e n t e r 在编辑器中动态显示出来,这样编程人员就可以及时而 自动地获取所需要的构件。c o d c b r o k e r 的检索条件完全依赖于用户在编写程序 过程中的文本输入,因此查准率较低,为此c o d e b r o k e r 提供了一套构件过滤机 制帮助用户快速删除不相关的构件。 3 、a g o r a 构件搜索引擎及其检索技术 a g o r a 是c m u s e i 开发的一个构件搜索引擎。s e i 的一些研究人员认为传统 的构件库是一种大型的集中式系统,库的可访问性和可扩展性都有限。随着 j a v a b e a n s ,a c t i v e x ,c o r b a 等商业构件标准的建立与发展,在i n t e r n e t 的各个 结点上分布着大量可复用的标准构件。因此,应该研究一种在i n t e r n e t 上搜索这 些构件的工具。 a g o r a 通过对w e b 页面的搜索来获取构件u r l 等相关信息,采用和普通搜 索引擎相同的方式管理构件信息。除了利用s p i d e r 技术在w e b 页面上搜索构件 外,a g o r a 也允许构件开发者将他们开发的构件直接在a g o r a 服务器上注册。 a g o r a 节省了构件验证和构件库管理的成本,构件开发者无需提交构件,构件库 的用户能够相对及时地得到构件的最新版本。但是,其搜索的构件种类有限,由 于构件模型的差异,对j a v aa p p l e t 和a c t i v e x 的搜索效果比较好,而对其他种类 的构件( 如c o r b a ,e r a ) 搜索效果较差。而且构件的描述信息和分类信息不够充 分。缺乏构件功能的语义描述信息,用户只能通过方法、事件或属性名称进行检 索,不便于用户准确定位和使用构件。库中构件的唯一性和存在性也得不到保证。 4 、青鸟构件库管理系统及其检索技术 青鸟构件库管理系纠n ( m c l m s ) 是国家。九五”重点科技攻关项目“软 件工程环境( 青鸟c a s e ) 工业化生产技术及系统( j b s e i m s ) 的研究开发一中的核 心组成部分之一。j b c l m s 是一个基于i n t e r n e t 的软件资产库管理系统。它可以 存储和管理广义的构件。采用数据库管理系统存储构件描述信息,文件系统存储 构件实体。j b c l m s 提供以刻面分类为主,结合多种标准的分类方法对构件库中 大量构件进行有效的管理。选取使用环境、应用领域、功能、层次、表示方法作 浙江工业大学硕士学位论文 为基本刻面,以满足多形态多层次构件的描述需求。 j b c l m s 使用者可以按刻面进行检索,即通过选择任意刻面的一个或多个术 语,就可以迅速限定构件的范畴。除了刻面检索外,使用者可根据构件的任意属 性进行辅助检索。使用者在检索构件过程中,可随时通过超文本浏览器对库中构 件进行有层次地浏览。j b c l m s 还提供了类似“服务台 的机制。使用者在检索 构件过程中,可以向“服务台 求助,也可以向它提出自己的意见和建议。使用 者找到一个构件时,j b c l m s 可以显示出与该构件有某种关系的所有构件。较为 熟练的使用者可以用类似s q l 检索语句的形式,以构件的属性和刻面作为条件 变量,并允许检索条件进行与、或、非的任意组合。上面提到的检索方法可以任 意组合,逐步求精,并允许检索过程的回溯。j b c l m s 还提供了基于数据仓库技 术的构件反馈机制,为用户选取构件提供辅助分析。 构件库技术在商业界和学术界都得到广泛的研究和应用,已经开发了不少的 构件库系统。除了以上介绍的四种构件库系统外,商业界有r e u s er e p o s i t o r y , s a l m s ( 软件资产库管理系统) 、a s r r ( 自动软件复用库) 、t h eu n i v e r s a l r e p o s i t o r y ( 通用库) 、a r e s ( 基于似的软件复用库) 、r l t ( 复用库工具集) 和h s t x 复用库等构件库系统。政府级构件库有:d s r s ( 美国国防部软件库系统) 、l m ( 构 件库互操作示范工程) 、i - c a s e ( 计算机辅助软件工程集成环境) 、m o r e ( 面向多 媒体的构件库) 、s a i c a s s e t ( 面向软件工程的软件资产复用技术) 、p a l ( 公共 a d a 库) 、c a p s 软件可复用软件构件库和d i s a ( a d a 库暨美国国防部信息系统代 理复用库) 等。表1 1 中列出了一些构件库及其使用的构件检索技术3 0 。 表i - i 部分构件库的构件检索技术 系统 组织表示和检索构件类型状况 c 函数、t r o f f c a t a l o g b e l l 不受控关键词 已部署 宏块 r e u s et i 受控关键词 已部署 l a s s i e b e l ll a b s a i 框架c 构件原型 b a u h a u si n f e r e n c e 公司a i 框架a d a 构件已部署 p l a n e t e x t f i g m c c超文本 c 函数 原型 s e e ru l l i v - o f m a i n e超文本b o o t h 构件原型 l u j u n i s y s 语义网a d a 构件已部署 a s s e tl i b r a r yg t e 刻面f o r t r a n 构件已部署 6 浙江工业大学硕士学位论文 不受控关键词、 r s l i n t e r m e t r i c sa d a 构件已部署 枚举 m e s b e l ll a b s 基于规则 p l 1 构件原型 i 己e u s e w e s t i n g h o u s e枚举和刻面a d a 构件 产品 c a n 口p e s 美国空军枚举、属性 a d a 包已部署 属性、关键词、 p r o t e u s u n i x 工具原型 刻面、枚举 通过对上表几种比较典型的构件库及其检索技术概述,可以看出构件的检索 采用的方法不仅与构件库中构件的类型有关,也与构件的分类结构紧密相关。构 件的分类结构一般被认为是获得好的检索效果的关键。构件的分类结构应该能够 为查找构件过程尽可能地提供自然的线索。 1 2 2 刻面分类检索 实践中构件数量不断增长,构件也随技术和领域演化而更新,要在库中众多 的构件中寻找自己需要的构件,就必须借助于检索工具的支持。对单个构件的重 用可以划分为构件的识别和检索、构件理解和适应性修改三部分,其复用成本公 式【3 0 】为: 复用成本= 检索成本+ 理解成本+ 修改成本公式1 1 有效的构件检索机制能够大大降低构件检索和理解的成本,而构件的分类正 是为了实现高效方便的检索。因此,管理构件库和减小复用成本两方面的要求都 促进了对构件表示和检索机制的研究和评价,为实践中的重用项目提供了技术支 持。 构件的分类方法有很多种,其中隶属信息科学领域的刻面分类方法正逐步得 到重视与应用。目前,基于刻面分类表示的构件检索方法是现在通用构件库系统 中较为流行的一种分类检索方法,因为刻面分类方式比较适合大规模的构件管 理,可以较大地提高检索效率,而且有助于复用者理解构件和目标领域。同时, 刻面分类检索又是检索代价、复杂性和检索质量三者最为均衡的方法,所以在此 基础上的构件检索技术已得到软件复用界的重视与应用。r e b o o t 构件库采用 了刻面分类方案,北大西洋公约组织( n a t o ) 标准推荐在构件库中采用刻面分类 模式【8 】,北大青鸟构件库提供刻面分类为主,关键词和属性值等多种模式相结合 的分类方法。 7 浙江工业大学硕士学位论文 构件库在理论和实际应用中在我国也已被软件工程研究人员普遍关注。在上 述的北京大学青鸟构件库系统和上海的上海构件库实际应用外,中科院软件所、 复旦大学、南京大学、华中科技大学、中山大学、吉林大学等高校和研究所,也 陆续发表了许多非常有价值的学术论文,把刻面分类作为构件库构件的主要分类 方法。上海市共享构件库【3 8 】采用了应用领域、操作系统环境、容器环境、构件 类型、开发工具作为刻面分类方案;教学评测和评估【3 9 】采用功能、应用领域、 构件类型、操作对象作为构件的刻面分类方案;v e g a g i s 构件库系统 4 0 3 采用了按 标准、按功能、软件工程、g i s 领域作为刻面分类。 构件的检索效率与构件库的构件的描述及检索方法密切相关,刻面分类和检 索被认为检索效果明显优于其它方法【1 0 1 。在基于刻面分类模式的构件检索方式 的实现上,目前主要有两种方法:1 ) 采用传统的数据库检索技术为主并结合利用 刻面术语空间的层次结构来实现构件的检索,这种方式因为是用数据库中各个表 的关系来实现对构件的刻面描述,所以在查询时,数据库的多层关联使检索效率 难以保证;2 ) 采用基于x m l 的查询语言x q l 来实现构件的检索。例如,f o r b e s g i b b 在他们的可重用软件构件研究项目【9 】中引进了x m l 作为构件刻面描述的标 记语言,并应用x m l 检索语言x q l 来实现构件的检索。但是,使用x q l 只能 检索到与检索条件精确匹配的结果。而构件的检索还需要兼顾对所查询构件的不 完全描述,对查询的匹配应有一定的张驰能力【l o 】。所以该方法也不能很好地满 足构件检索的要求。 1 3 论文的主要研究内容 1 3 1 研究目标 设计良好的信用构件信息的表示和检索方法,对信用构件进行高效的组织和 管理,能够较好满足检索的松弛匹配和模糊匹配,返回检索匹配相似度以供用户 参考,保证一定查准率的情况下提高查全率。结合多种查询方式,适应不同方式 的查询需求。 浙江工业大学硕士学位论文 1 3 2 研究内容 本文以信用评估构件库为研究背景,借鉴通用构件库系统的构件刻面描述和 检索的研究成果,通过对信用评估领域的分析,结合软件复用的特点,对构件的 描述和检索做如下的研究工作: 1 ) 对信用评估系统及评估建模方法的分析,提出一种良好的能覆盖所用信 用评估构件的刻面分类模式,适合各种粒度,具备较好的可理解性与易 用性,对信用构件进行有效的管理和描述; 2 ) 结合具有良好扩展性的层次编码方法对描述信用构件的术语空间进行编 码,将刻面检索对术语的匹配转化为对字符串的匹配。运用向量空间模 型v s m ( v e c t o rs p a c em o d e l ) 对查询条件和构件描述进行相似度计算,提 高模糊查询能力; 3 ) 在刻面分类检索的基础上,多种方法相结合的检索方式。采用l u c e n e 全文关键词检索、属性值检索、超文本浏览检索多种方法对构件库进行 多样化检索,符合不同层次用户的需求,提供友好的查询手段以及快速 正确的检索技术; 4 ) 为信用构件库的刻面术语空间提供良好的和易于维护的管理方式。 1 4 论文的组织结构 论文章节安排如下: 第一章介绍了论文的研究背景、研究意义和论文的主要研究内容。 第二章对构件库相关基础理论和构件检索技术进行了概述,为信用评估构件 库的检索方案做了理论和技术上的准备。 第三章对信用评估系统进行了领域分析,重点论述了信用评估系统体系结构 和评估模型的建立过程,通过信用评估构件特征属性的提取建立了信用评估构件 的刻面分类方案。 第四章提出了信用构件库构件的统一描述方式、术语同义词的处理方法,结 合层次编码和树匹配思想对构件检索算法进行了设计,运用向量空间模型v s m 进行相似度计算来提高查全率。 9 浙江工业大学硕士学位论文 第五章给出了信用评估构件库检索的具体实现,主要有基于层次编码的刻面 松弛匹配、l u c e n e 全文关键词、属性值、超文本浏览等检索方法,建立了构 件的反馈机制和刻面术语空间的维护工具,最后对刻面检索进行了性能分析。 第六章是对全文的总结和进一步工作的展望。 1 0 浙江工业大学硕士学位论文 第二章构件库及检索技术概述 可复用构件的表示和检索是成功复用构件的重要保证。人们使用各种方法和 工具对可复用构件的表示和检索进行研究,伴随复用实践的深入和新技术的出现 不断取得进展。本章首先从构件、构件表示描述、构件库的相关技术进行概述, 然后详细介绍了几种具有代表性的构件检索技术。 2 1 构件库概述 构件库是实现构件管理的基础设施,它主要包括构件的存储、检索、管理、 安全和维护等功能【l l 】。与构件库相关的热点问题主要集中在构件描述、构件库组 织结构和构件库检索等方面。国内外众多研究机构和著名公司,如北大青鸟工程 j b 3 t 1 2 1 、s t a r s 1 3 1 、n a t o 8 ,皆对此做了大量的研究。 2 1 1 构件 构件( c o m p o n e n t ) 是指应用系统中可以明确辨识的构成成分。而可复用构件 ( r e u s a b l ec o m p o n e n t ) 是指具有相对独立的功能和可复用价值的构件。可复用构 件应具备以下属性: 1 ) 有用性( u s e f u l n e s s ) :构件必须提供有用的功能; 2 ) 可用性( u s a b i l i t y ) :构件必须易于理解和使用; 3 ) 质量( q u a l i t y ) 构件及其变形必须能正确工作; 4 ) 适应性( a d a p t a b i l i t y ) :构件应该易于通过参数化等方式在不同语境中进行 配置: 5 ) 可移植性( p o r t a b i l i t y ) :构件应能在不同的硬件运行平台和软件环境中工 作。 软件构件是单独开发并具有特定功能的软件单位,用于与其它构件及支撑环 境组装成应用系统。构件可以是被封装的对象类、类树、一些功能模块、软件框 浙江工业大学硕士学位论文 架( f r a m e w o r k ) 、软件构架( 或体系结构a r c h i t e c t u r a l ) 等。 基于构件的软件复用开发,一个关键的前提就是必须获取充足的、可靠的、 成熟的构件,构件获取的主要工作是引入领域工程和软件再工程相关知识对可重 用模块的辨识,识别符合构件标准的候选构件,并加以度量,提取出相对通用的 部分改造成有用的构件。 目前构件标识算法的研究还不是很成熟,在对构件的识别上存在着困难。其 中比较容易识别构件的算法是以构件之间的关系为基础的标识算法 r b c i ( r e l a t i o n s h i pb a s e dc o m p o n e n ti d e n t i f y ) 川。 2 1 2 构件描述 构件库构件是由构件描述和构件实体组成。构件描述是指构件特性和行为的 定义,说明构件“是什么 ,而构件实体则是构件的可执行代码,或者其他形式。 构件复用过程就是要通过构件描述来检索和了解构件的具体行为,然后再调用构 件实体的功能。 目前,i n t e m e t 上已经出现许多专业构件库,如a l p h a w o r k s ,c o m p o n e n t p l a n e t , c o m p o n e n t s o u r e e ,f l a s h l i n e 等,提供了多种不同类型的构件实现模型,如 j a v a b e a n e j b ,c o m d c o m ,c o i 出a 等。但是,由于这些构件库在构件描述、 构件格式、组织结构和访问方式上各不相同,造成构件的选择、搜索、获取,以 及分析、组装等构件处理活动中的困难。因此,首先要解决不同构件之间的描述 不一致问题。具体来说,构件的通用描述应该满足下列要求【1 5 】: 1 ) 尽可能描述构件完整的功能信息,帮助用户和计算机理解构件行为。 2 ) 提供足够的实现构件组织的构件分类信息及构件的应用领域信息,便于 建立用户需求和构件之间的联系。 3 ) 精确描述构件行为的语义信息和上下文的依赖关系,便于使用智能代理 等自动化工具进行构件的组装等操作。 4 ) 支持传统的基于关键字的构件检索和更为精确的基于规约的构件检索。 5 ) 构件描述符不依赖于特定的构件技术,并可根据需要扩展新的描述信息。 目前提出的构件表示方式有许多种,但这些表示方法追本溯源都可归结为两 个主要的构件描述模型。在“r e u s ei np r a c t i c ew o r k s h o p 中由一些系统工程领 1 2 浙江工业大学硕士学位论文 域的专家提出的3 c 模型【1 6 】和r e b o o t 项目中提出的r e b o o t ( r e u s eb a s e do n o b j e c t o d e n t e dt e c h n o l o g y 基于面向对象技术的复用) 模型【1 7 】。这些模型均是学 术界提出的指导性模型,抽象层次比较高,用户可以根据不同的问题域对其进行 扩展。 3 c 模型从概念( c o n c e p o 、内容( c o n t e n t ) 和语境( c o n t e x t ) - - - 个不同方面来描述 构件。 概念:关于“构件做什么一的抽象描述,可以通过概念去理解构件的功 能。概念包括接口规约和语义描述两个部分,语义描述和每个操作相关 联( 至少表示为前后置谓词形式) ; 内容:概念的具体实现,描述构件如何完成概念所刻画的功能,如算法、 结构等。在本质上,内容是对一般用户隐蔽的信息,只有那些企图修改 构件的人才需要了解这些信息; 语境:构件和外围环境在概念级和内容级的关系。语境刻画构件的应用 环境,为构件的选用和适应性修改提供指导。 。 r e b o o t 模型是建立在p r i e t o d i a z 研究工作的基础之上,实质是一个刻面 分类模型。该模型认为:可以用有限维信息空间的术语组合从若干个刻面的综合 角度来刻画一个构件。一个构件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家属答谢活动策划方案
- 家乡名人活动方案
- 家长入场活动方案
- 小学团建活动方案
- 小学捐资活动方案
- 官窑瓷器征集活动方案
- 封山活动策划方案
- 家居地产活动策划方案
- 小学普法周宣传活动方案
- 宜秀区防灾宣传活动方案
- GB/T 43868-2024电化学储能电站启动验收规程
- 统计与数据分析基础-形成性考核二(项目3-项目5阶段性测试权重25%)-国开-参考资料
- 中医药健康管理服务流程
- 资本论在中国智慧树知到期末考试答案2024年
- 国家职业技术技能标准 6-16-02-06 油气水井测试工 人社厅发202226号
- 继电保护配置及整定计算
- 初高中物理衔接课件
- 血管导管相关血流感染预防与控制
- 第四次教育革命:人工智能如何改变教育
- 汽车电气工学一体化学生工作页
- 中国人的规矩
评论
0/150
提交评论