已阅读5页,还剩65页未读, 继续免费阅读
(管理科学与工程专业论文)基于xtm的政务知识导航系统的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 电子政务门户是统一对外服务的窗口和整合政府信息资源的关键,其发展水平是衡 量一个国家电子政务进程的核心标志。作为用户在政务门户中浏览、检索的“航向标”, 导航系统在门户信息内容构建、提高用户浏览速度和检索质量等方面发挥着重要的作 用,是对电子政务服务质量一个直接的检验。而现有政务门户导航系统多数只是提供粗 略的内容分类,有的提供站内基于关键词的信息导航功能。关键词的导航是一种基于信 息匹配的缺乏知识的导航方法,在查全率、查准率和可扩展性方面存在严重的不足。 针对以上问题,本文运用知识管理思想,结合政务门户导航的特点,提出了一个基 于x t m 的政务门户知识导航系统模型。模型从政务资源和服务对象两方面深入分析了政 务门户导航系统的特点,提出了导航模型的四层结构。对原有的x r m ( ) ( m l t o p i c m a p ) 技术体系进行了二级关联扩展,通过划分主题关联种类实现了从“主题图”到“主题树” 的转换,引入语义距离提出了主题之间以及主题和资源间的相关度计算方法。结合政务 资源对安全性要求高的特点,设计了主题和资源的访问权限控制机制。设计实现了系统 的导航机制和相应的导航流程,通过主题的关联和别名机制实现了语义消歧操作,从一 定程度上克服了传统导航的查全率和查准率低的问题,并给出了导航过程中关键技术的 具体算法。选择突发公共事件预警为应用领域构建了主题图本体。采用微软的n e t 平 台设计实现了原型导航系统。系统通过主题图的i d 编码实现了从主题图到数据库的映 射,通过x s l t 技术对x t m 进行格式转换,实现了基本的主题浏览和知识检索功能。 在实验中得到了较好的结果。 论文是把知识管理的思想运用到信息导航领域的一次尝试。在现有主题图技术的基 础上加以改进,将大量分布异构的政务资源抽象成一张系统的知识网。与传统的信息导 航过程不同,将导航范围确立在更加精炼的知识层上,增大导航单元的粒度,缩短了导 航路由,提高了用户的信息获取量。通过引入语义相关度和权限控制机制,实现了导航 控制,进一步缩小了检索空间,提高检索效率。该模型的研究,在电子政务和知识导航 领域有一定的应用价值。 关键词:x t m ;知识导航;关联扩展;相关度;权限控制 薹王茎! 翌塑塞堑塑望呈堕墨堑塑受茎量壅里 r e s e a r c ha n dr e a l 虹a t i o no fe - g o v e r n m e n tk n o w l e d g en a “g a t i o n s y s t e mb a s e do nx t m a b s t r a c t b g o v e m m e n tp o r t a li st h c 、i n d o wo fs e r v i c e sa n dk e yo fc o 耐b n i l i t yo fg o v e n n e n t i n o m a t i o nr e s o u r c e 、池i c hi sb e c o m i 工l gas i g no fe g o v e m m e md e v e l 叩m e n t n a v i g a t i o n s y s t e mp l a y sa ni m p o r t 趿tr o l emi n f 0 衄a t i o na r c h j t e c t u r ea n di l 工i p r o v e m e n to fn a v i g a t i o n s p e e da 1 1 dq l l a l i t y b u te x i s t i n gn 撕g a t i o ns y s t e m s0 1 1 1 yp r o v i d ec u r s o r yc o n t e n ts o n i i l g 卸d i 耐b r m a t i o ni l a v i g a t i o nb a s e do nk e ) w o r dw i l i c hi sb a s e do ni - o a d o nm a t c h j n ga n d1 a c k0 f k 工l o w l e d g e nh a sp r o b l e m si 1 1r e c a l l ,p r e c i s ea n de x t e n s i b i l i t y t os 0 1 v e 也ea b o v ep r o b l e m s ,也ep a p e ra n a l y s i se - ( 如v e m m e n tp o n a l sc h a r a c t e r i s t i c s , p r o p o s e sa ne - g o v e m m e n t 鼬1 0 w l e d g en a v i g a t i o ns y s t 锄m 0 d e lb a s e do nx t mb yu s i n g t l l ei d e ao f 妇o w l e d g em a n a g e m e n t 删c he x p a l l d st h es e c o n d1 e v e ia s s o c i a t i o nb a s e do n x t m m lt b p i cm a p ) ;r - e a d i z et l l et 咖s i t i o n 丘o m “t o p i cm a p ”t o “t o p i ct r e e ”b yd i v i d i l l g t h et y p eo ft o p i ca s s o c i a t i o n s ;am e 山o do fc a l c l l l a t ct 1 1 ed e g r e eo ft o p i cr e l a t i v ei sp r o p o s e d u s i n gs e m a t i cd i s t 姐c e a n a c c e s sa u 恤o r i t yc o m r o lm e c h a n i s mo ft o p i ca n dr e s o u r c ei s d e s i g n e d i nt h ep r o c e s s0 fn a v i g a t i o n ,r e d u c e t h es e m 缸c g a pu s i l l gt o p i c v a r i a i l ta n d a s s o c i a t i o i l ,s 0 1 v et h e1 0 w r e c a l la n d1 0 w _ p r e c i s ep r o b l e mt 0ac e n a l ne x t e n t ,p r o p o s em e a l g 耐t h m so fc o r ep r o c e d u r c s c h o o s i n gm ep u b l i ce m e r g e n c y ,b u i l dt h c d o m a i nx 州 o m o l o g y b a s e do nt h e n e tp l a t f o n no fm i c r o s o 如d e v e l o pt 1 1 en a v i g a t i o ns y s t e mw 1 1 i c h a c c o m p l i s h e st h em 印p i n gf o r n lt o p i cm a p t od a t a b a s eu s i n gi dc o d i l l go ft o p i c ,也es y s t e m p r o v i d et o p i cb r o w s ea n dk n o w l e d g cs e 盯c hf i m c t i o n sb yu s i z l gx s l t 协m s f b m x t m 聃恤c h l l a sag o o dp c r f o 如曲n c e t h ep 印e ri saa t t e m p to fu s i n gm ei d e ao fh l o w l e d g em a i l a g e m e mi i li i l f o 皿1 a t i o n n a v i g a t i o n ak n o 、) v _ 1 e d g e 、v e bi sd b s 仃a c t e d 奇o m1 a r g eq u a n _ t i t i e so fd i s 砸b u t i n gi s o m e r o u s g o v e 1 1 1 1 e n tr e s o u r c e sb yu s i r 培i 1 工】l p r o v e dx t m n a v 追a t i o ns c 叩ei sb m l to nal c l l o w l e d g e 1 e v e lw h i c he n l a r g et h en a v i g a t i o nu 血g r a n u l a r i t y 姐dq u 枷t yo fr e c e i v i n gi n f o m a t i o n , s h o r t e n 恤en a v i g a t i o nr o u t i n g ,i r r ) r o v e 也ee m c i e n c yo fn a v i g a t i o n t h er c s e a r c hi sv a l u a b l e i ne g o v e 锄e n ta n dk n o 、玑e d g en a 啊ga _ t i o n k e yw o r d s :x t m ;k n d w i e d g en a “g a t i o n ;a s s o c i a t i o ne x p a n d i n g ;r e l a t i v ed e g r e e ; a u t h o r i t yc o n t r o l 独创性说明 作者郑重声明:本硕士学位论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得大连理 工大学或者其他单位的学位或证书所使用过的材料。与我一同工作的同志 对本研究所做的贡献均已在论文中做了明确的说明并表示了谢意。 大连理工大学硕士研究生学位论文 大连理工大学学位论文版权使用授权书 本学位论文作者及指导教师完全了解“大连理工大学硕士、博士学位论文版权使用 规定”,同意大连理工大学保留并向国家有关部门或机构送交学位论文的复印件和电子 版,允许论文被查阅和借阅。本人授权大连理工大学可以将本学位论文的全部或部分内 容编入有关数据库进行检索,也可采用影印、缩印或扫描等复制手段保存和汇编学位论 文。 作者签名珧必仟 导师签名墓1 兰! 盍 兰堑年互月盟曰 大连理工大学硕士学位论文 1 绪论 1 1 问题的提出 近几年我国电子政务发展较快,已从单机应用进入“整合”阶段【l j 。电子政务门户 是统一对外服务的窗口和整合政府信息资源的关键,其发展水平也成为衡量一个国家电 子政务进程的核心标志。“是否建设政府门户网站已经不再成为问题,如何建设好政府 门户网站并发挥其电子政务的抓手作用”成为当前中国各级政府正在思考的热点问题【2 1 , 据统计,目前各级政府部门大约集聚了全社会信息资源总量的8 0 。如何在电子政 务门户这个平台上实现政务资源的管理、利用、共享,为用户提供一站式的优质服务是 政务门户的核心所在。作为用户在政务门户中浏览、检索的“航向标”,导航系统在门 户信息内容构建、提高用户浏览速度和检索质量等方面发挥着重要的作用,是对电子政 府服务质量一个直接的检验。 构建一个准确、系统的政务门户导航系统不仅仅是为用户提供检索和浏览服务,还 包括资源内容的选择、描述、组织、管理、整合,构建门户内容的知识体系。而现有政 务门户导航系统多数只是提供粗略的内容分类,有的提供站内基于关键词的信息导航功 能。关键词的导航是一种基于信息匹配的缺乏知识的导航方法,其主要依靠对信息的词 法分析等手段进行统计、聚类等操作,这样就无法避免数据的语义无关性所带来的知识 的机器不可知性和不可管理性,导致在结果的正确性和可扩展性方面都存在着严重的不 足。其主要问题表现如下: ( 1 ) 完全地依赖关键词检索,查全率不高。如我们输入关键词“计算机”,并不能 得到关于“电脑”的信息。而这两个词所指却是一样的,这样就可能漏掉了我们需要的 重要信息。 ( 2 ) 检索的准确度不高,存在太多的“垃圾”信息,即不相关信息。如我们想检索 有关“长城”的信息,却会出现如“长城电脑”和“长城润滑油”这样的信息,导致的 结果就是往往上万条的检索结果总是让检索者“望洋兴叹”。 ( 3 ) 缺乏相应的关联扩展检索,虽然有的导航系统提供了这个功能,但还是基于关 键词的关联,其关联性只是停留在关键词的包含上,缺乏知识层面上的联系,可用性不 强。 本论文正是针对以上问题,运用知识管理思想,结合政务门户导航的特点,在x t m 的基础上引入了关联量化和权限控制机制,提出了一个基于x t m 的政务门户知识导航系 统模型。系统实现了导航控制,缩小了检索空间,提高检索效率,并可以为用户提供全 面、个性化的导航服务。 基于x t m 的政务知识导航系统的研究与实现 1 2 国内外相关研究综述 1 2 1 导航技术研究现状分析 导航系统是提供信息获取和基于知识的信息引导和浏览服务的系统。可以分为站内 导航和站外导航。站内导航是指在网站内容的基础上进行导航,站外导航则是在 i n t e r n e t 上提供检索服务。而现在门户网站的导航系统实际上都整合了这两项功能。导 航系统的实现包括两种主要方式:搜索与浏览。 国内外学者对导航系统的研究和应用日益重视,并取得了重要的进展和成果,提出 了各种导航的理论和方法,同时也出现了相应成形的产品,现综述如下: ( 1 ) 基于关键字和全文检索的导航技术 关键字和全文检索技术是当前主流的检索技术。它通过被称为s p i d e r 的程序自动 地在网上沿着超文本链递归地访问并收集w w w 网页。通过分析页面的内容,生成索引和 摘要。用户通过系统提供的w w w 查询服务界面同系统交互。系统根据用户的查询请求在 索引库中查找相关信息在网上的位置,随后将查询结果按照相关度排序后返回,最终帮 助用户尽快地找到所需的信息。这类系统由于采用自动方式维护系统,因此其索引的网 页规模巨大,并且能够定期重新收集网页,更新索引库的内容,向用户提供最新的w e b 网 页信息。但是该类搜索引擎的查准率较低。而且它只能提供基于关键词的检索,用户只 有确切地知道自己感兴趣的网页含有哪些关键词时,查询的效果才比较理想。否则,返 回的结果很可能和用户的实际需求“风马牛不相及”。 g o 0 9 1 e 搜索引擎是关键字检索技术的代表,其采用p a g e r a n k 技术通过对关键词检 索结果认同程度的统计为用户提供尽可能满意的结果聊。g o o g l e 因其p a g e r a n k 技术而 具有相当好的查询效果,耳前索引的网页量已超过2 0 亿。但是由于信息的快速增长, 基于关键字的搜索引擎所返回的查询结果的文档列表通常过于庞大,而且其中大多数与 用户的实际信息需求无关。 ( 2 ) 基于分类目录的导航与检索技术 基于分类目录导航与检索技术主要是将信息资源按照一定的分类标准进行分类。用 户可以在分类目录中逐级选择自己感兴趣的内容进行检索。它们主要是通过具有专业知 识的网页编辑人员人工地对网页进行精选,建立一个索引目录,向用户提供目录导航服 务。用户可以沿着分类目录的层次逐步进入自己感兴趣的主题,进而找到所需的信息。 由于这种人工方式对网页内容的理解比较准确,因此该类系统的查准率较高。而且当用 户对某个领域感兴趣但并不熟悉这个领域的关键词时,这种查询方式可以很好地为用户 提供服务。但是由于语言的歧义性及多义性,不同用户对同一检索词可能有着不同的理 大连理工大学硕士学位论文 解。丽通过逐步深入各级目录的方法,常会因为个人对于目录体系的理解不同而产生“歧 路”甚至“死路”。另外这种方法目前主要是由人工将文档进行分类,很难应付日益膨 胀的w e b 信息。 支持分类且录的搜索引擎( 典型的范例为强h o o 【4 】) 为用户提供人工建立的主题层次 结构,在信息集上添加一定的高级导航结构。瑞典的工程电子图书馆( e n g i n e e r i n g e l i b r a r y ,s w e d e n ) 【5 】利用e 1 分类体系对w e b 上的工程技术方面的信息资源进行了组织 并提供访问。针对人工分类效率较低的问题,提出了自动分类技术。文献 6 利用有指 导的机器学习方法实现了中文网页的自动分类技术,为“天网”搜索引擎提供目录导航 功能。文献 7 利用分类主题词典实现了信息自动分类,文献 8 提出了一种动态树型目 录结构的导航网页的制作方法。 ( 3 ) 基于概念检索的导航技术 概念检索技术是一个全新的更接近于人类思维的知识导航理念,它提出了在概念表 示、语义理解和本体计算层次上的知识扩展检索导航机制【9 】。其核心思想是构建一个包 含众多互相关联的语义结点的概念层次网,而这个概念网可以描述某个领域的语义关系 和角色信息f l o 】。概念检索至少包括两个方面的含义。首先,它是一种思想,它是为了突 破机械式匹配局限于表面形式的缺陷,从词所表达的概念意义层次上来认识和处理用户 的检索请求,以更好地满足用户需求。其次,它是一种技术,从技术层面上来说,概 念检索包括两个方面的内容:同义扩展检索和相关概念联想,前者能够提高检索的查全 率,而后者可大大加强检索系统和用户的交互,使其具有一定的智能【l “。 基于概念的检索技术是一个全新的导航理念,成为国内外学者研究的热点,并取得 了重要的进展和成果,提出了各种概念导航的理论和方法: 李振东,费翔林【1 2 蠕概念分为三类:上层概念( 概括性) 、下层概念( 专门性) 和所有 实例的公共特征和限制( 选择性限制) 。使用层次结构描述概念间的关系,提出了基于树 状概念层次的概念信息检索模型。 郑毅,吴斌,史忠植【1 3 】使用数据挖掘、文本分析等技术对文本进行文本聚类、文本 分析、建立概念空间。使用h o p f i e l d 网络搜索概念空间,结合传统的关键词搜索技术, 提出了概念检索模型。另外,h o p f i e l d 网络在计算概念间的关联度方面也有很好的应用 【1 4 】。 基于向量空间的概念检索技术【l l 】结合了向量空间技术和概念检索技术的优势,通过 建立一个表示概念及其间语义关系的语义词典( 包括同义概念,上位概念,同位概念和 下位概念) 将文献表示成文献中概念权值的向量。通过同义概念扩展将用户的查询请求 基于m 的政务知识导航系统的研究与实现 用向量表示。将查询过程转换为向量计算,大大提高了检索的查全率和查准率。另外还 利用语义词典提供了查询提示功能,提高了用户接口的友好性。 面向) ( m l 文档的概念检索技术【1 5 提出一个将结构检索和语义检索相结合的面向x m l 文档的概念检索原型系统,结合了中文分词技术的列l 文档解折器对儿文档进行结构 分析和分词处理,采用b u s 【1 6 1 技术对) ( m l 文档建立结构索引,同时应用“上下文共现 分析( c o o c c u r e n c e ) ”技术【l s l 构建语义词典,实现检索过程中的语义扩展。 李蕾,王楠,钟义信等实现了一个基于语义网络的检索系统【拶j ,系统采用人工智能 中专家系统的构造技术,通过创建专家知识库初步实现了特定领域的概念检索。 基于0 n t o l o g y 的概念导航技术【2 0 】运用强大语义表达功能的o n t 0 1 0 9 y 改造h t m l 网 页结构,改善“混沌网”的数据可操作性差的现状,从而全面提高网络信息的检索效率。 由德国的研究机构0 n t o p r i s e 【2 1 l 的专家d f e n s e l 等在f l a i r s 一9 8 大会上提出的 0 n t o b r o k e r l 2 2 l 一概念代理引擎,重点解决在网络上的信息资源检索问题。它的显著特点 是不摒弃现有的h t m l 文档格式,而是设计一些专门的工具和标记语言,直接在h t m l 文 档上添加o n t 0 1 0 9 y 标记,在尽可能减少冗余数据的前提条件下改善非结构化和半结构 化数据,使丰富的网页资源在概念检索、知识管理和智能检索中被充分利用。 张玉峰,李敏【2 3 】在神经网络与语义网络的理论基础上,构建动态约束性概念网络。 在原有的概念网络基础上,引入了关联控制条件作为对此关联方向上进行概念激活行为 的约束。约束使知识检索结果的相关度更加符合用户的要求。缩小了检索空间,同时约 束搜索的有序性能避免控制约束的混乱,提高检索效率。 现将以上基于概念的检索技术总结如下: 表l l 概念导靛技术总结表 t a b 1 1t a b l eo fc o n c e p t u r en 8 v i g a t i o nt e c h n o l o g y 概念导航技术 实现机制 基于h o p f i e l d 网络的概念导航 基于向量空间的 概念导航 面向蹦l 文档的 概念检索 使用数据挖掘、文本分析等技术对文本进行文本聚类、文本分析、建立概念空 闻。使用h o p f i e l d 网络搜索概念空间。 建立表示概念及其间语义关系的语义词典,将文献表示成文献中概念权值的向 量。将用户的查询请求用向量表示。将查询过程转换为向量计算。 结合了中文分词技术的x m l 文档解析器对) 。文档进行结构分析和分词处理, 采用b u s i “”1 技术对几文档建立结构索引。 基于0 n t 0 1 0 9 y在h 删l 文档上添加o n t o l o g y 标记,改善非结构化和半结构化数据,使丰富的 的概念导航网页资源在概念检索、知识管理和智能检索中被充分利用。 大连理工大学硕士学位论文 在理论研究的基础上,同时也出现了一些采用概念检索导航技术的产品。o i n g o 搜 索引擎、首信公司的“倚天”内容导航系统犯5 l 是其中的代表。o i n g o 是基于o n t o l o g y ( 本 体) 技术的网站,它做了较详细的目录体系,并给出与检索词匹配的子目录。首信公司 的“倚天”内容导航引擎概念检索系统基于概念图技术。据介绍,该概念检索可以实现 同义词扩展检索、语义蕴涵、外延扩展检索、语义相关扩展检索。但测试使用中存在很 多空链接,效果并不理想。o i n g o 和“倚天”都致力于开发检索词专用词典,依然没有 脱离关键词的约束。 上述三种导航方法各有特点和其相应的应用领域,现对其进行比较分析,总结如下 表所示: 表1 2 导航技术分析表 t a b 1 2a n a l y s i st a b l eo fn a v i g a t i o nt e c h n o l o g y 上述三种导航方法中应用最为广泛的还是基于关键字的检索技术,而后两种方法在 实际应用中也没有完全摆脱关键词的约束,不同的只是在于关键词的使用方式和检索算 基于x 1 m 的政务知识导航系统的研究与实现 法上。三种导航技术是一种渐进的发展过程,大多数实际应用都是以一种技术为主,综 合其它一种或两种技术来改进导航的效果。如g o o g l e ,b a i d u ,天网搜索引擎在关键词 导航的基础上引入分类目录思想,而后两种导航技术在实际应用中也要依靠关键词技 术。 近几年里,人们在知识管理与网络信息管理导航领域提出了许多新的思想和方法, 语义( s e m a n t i c ) 、语境( c o n t e x t ) 、模型( m o d e l ) 成为现代知识领域研究的重点【2 犯引。其 中,c o 胁o n k a d s ( 通用知识分析与设计方法系统) 提出了知识工程的结构化建模方法,为 知识工程的发展提供了一种全新的开发思科划:o n t 0 1 0 9 y ( 本体) 对于领域知识表示和知 识交换( k n 0 w 1 e d g ei n t e r c h a n g ef o 瑚a t ,k i f ) 提供了一个新的模型机制【3 1 】;w e b 的创 始人t i mb e r n e r s l e e 更是提出了语义w e b 的体系结构。当前,在语义w e b 体系中,为 了解决网络数据的语义无关性和数据资源的结构化编码,现阶段已经有两个可用的标 准:x h i lt o p i cm a p si s 0 1 3 2 5 0 ( x m l 主题地图,x t m ) p 2 j 和w 3 c 推荐的r e s o u r c ed e s c r i p t i o n f r a l i l e w o r k ( 资源描述框架,r d f ) 【3 。 有了语义w e b 的支持,信息不再是单纯的语义无关的机器数据,而成为机器可以理 解的知识,为知识导航提供了更广阔的发展空间: 1 2 2x t m 技术研究现状 主题图( t o p i cm a p ) 是一种新兴的数字化知识组织方式,在x t m ( ) ( m lt o p i c p ) 1 o 规范【3 2 】中,主题图被定义为一系列以主题、联系和范围组成的主题图节点组成,这些节 点以符合x t m 或者其他规范( h y t m ) 的文件形式或者以满足x t m 加工需求的内部应用的方 式存在。概括地说,主题图是一种用于描述信息资源的知识结构的数据格式,它可以定 位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系。主题图被誉为信 息管理和知识管理之间的桥梁,是信息世界中的g p s 定位仪,它可以提供信息资源的直 观的导航【”】。 主题图技术吸收了传统的知识组织方法( 叙词表) 的思想,并有所发展。由于其富有 表现力的数据结构,直观自然的知识建模方式、由数据驱动的灵活的模式、简单而系列 化的数据格式、明确的合并规则等,使得主题图成为知识导航的主流技术之一【3 6 d ”。 主题图将所有可能的对象,例如人、事、时、地、物等,不论其是一具体存在的物 质或是抽象的概念,皆统称为主题。从描述主题本身的属性开始,进而组织与此主题相 关的所有资源,对这些资源进行定位,最终将所有相关的主题,依据彼此间的关系及相 对于该关系的角色,建构出一个信息主题图。因此,主题图可以说是将主题、关联性及 资源实体三者利用主题索引的概念及网络的特性加以结合。 大连理工大学硕士学位论文 客观事物往往具有其某些特征,如名称、位置、存在的特定范围以及某一事物和其 他事物之间的联系等,这些事物在主题图中的反映就是一组主题。这些主题同样也包含 自身的特征集合,基本的特征是主题的名称,主题所在的资源实体以及它与其它主题 间的关联,另外还有主题的标记( i d e n t i t y ) ,分面( f a c e t ) 、范围( s c o p e ) 等1 3 印。 ( 1 ) t o p i c s ( 主题) 。根据x t m 标准,主题就是现实事物的具体化,主题可以是任何的 名词,如名称( n a m e ) 、基本名称( b a s e n a m e ) 、显示名称( d i s p l a y n 锄e ) 和排序名称 ( s o r t n 锄e ) 。其中基本名称是必须的,而显示名称和排序名称则可根据需要设置,但不 允许在同样的环境中出现两个不同的主题具有同样的名称。主题图标准并没有将所有主 题可能用到的名称都罗列出来,而只是选择了几个有代表意义和特殊用途的作了规定。 主题类型( t o p i c t y p e s ) 是主题所归属的类别,是典型的分类实例关系,它们能够自定义 为主题,允许主题图自我编制。 ( 2 ) a s s o c i a t i o n s ( 关联) 。关联是一个描述两个或多个主题间相互关系的连接元素, 表示主题间的语义关系,将具有相同关系的主题汇集成群。这种主题图与信息资源的分 离性,还使得同一个主题图可以被用于多个不同的信息资源,就像一个信息资源可以拥 有多个主题图一样。关联同样具有不同的类型,关联类型本身也是以主题的方式定义的。 这种为关联赋予不同类型的做法使得主题图的功能更加强大,它可以将给定的主题按照 关联类型进行聚合。关联自身具有多方向性,因此在创建关联时,应确切地知道谁是影 响者,谁是被影响者。很多情况下,同样的两个主题间可能会存在多个不同的关联类型 范围。主题间不同的关联类型是由于它们位于不同的上下文环境中,而“范围”就是用 来描述上下文环境的概念。 ( 3 ) 0 c c u r r e n c e s ( 事件或资源实体) 。主题链接的一个或多个可寻址( a d d r e s s a b l e ) 的信息资源,可以是内部或外部链接,如同资源指引类型的资源指引角色( a s s o c i a t i o n s r 0 1 e ) ,也被视为主题。 ( 4 ) i d e n t i t y 与p u b l i s h e ds u b j e c ti n d i c a t o r s ( 主题的标记) 。有时同一个事物被 多个t o p i c 表示,这可能出现在当合并两个主题图时。在这种情况下,有必要建立一种 标志来区分不同的主题。p u b l i s h e ds u b j e c ti n d i c a t o r s ( p s i ) 是一个为了简化主题图 的简化和合并而在公开的地址上发布并维护的一个主题指示符( s u b j e c ti n d i c a t o r ) , 其实现机制是i d e n t i t y 属性。任何通过他们的i d e n t i t y 属性指向同一个主题的t o p i c 都 被认为是语义相同的,可以被合并。这个概念在两个主题图合并时非常重要。 ( 5 ) f a c e t s ( 分布) 。分面提供了给信息资源赋予属性一一值对的机制。一个分面只是 一个属性,其值为f a c e t v a l u e s 。分面被用来提供以s g m l 或h y t m 形式向文档管理系统提 供的元数据。这种属性可能包括“l a n g u a g e ”,“s e c u r i t y ”,“a p p l i c a b i l i t y ”, 基于m 的政务知识导航系统的研究与实现 “u s e r l e v e l ”,“o n l i n e 0 f f l i n e 等,这种属性可以作为过滤条件,用来生成限定 的资源子集。目前只有h y t 1 支持f a c e t 语法。 ( 6 ) s c o p e ( 范围) 。名称、出处、联系是一个特定主题的特征,这些特征都是在一定 的背景中有效的。主题的特征的有效限制范围被称为s c o p e 。在主题图中使用定义良好 的一致的s c o p e 不仅仅能够消除概念的不确定性,而且可以辅助导航,可以根据用户的 兴趣提供信息的导航。 主题图的这些特征充分反映了主题图思想的精髓,主题图利用具体化的方式,将任 何事物具体化为计算机可识别的标记,任何事物( 包括关联和出处) 都可以是主题,主题 还可以聚集成类,成为主题类型;主题图用基本名和别名的机制解决同一主题的不同名 称问题,还可以定义“用代”关系来解决这个问题;关联也可以聚集成类,关联中有 关联角色和关联成员之分;主题的标记是主题在主题图中的标示符,其中p u b l i s h e d s u b j e c ti d e n t i t y 在主题图的合并、扩展和重用中起着重要作用;主题图中利用范围 ( s c o p e ) 来定义该主题或者关联有意义的背景环境;分面( f a c e t ) 提供了给信息资源赋予 属性一一值对的机制,可用于信息过滤,但是主题图的x t m 语法中没有f a c e t 的标签, 所有的概念属性都是用关联( a s s o c i a t i o n ) 来表达的。 lt o p i cm a p si s 0 1 3 2 5 0 ( 捌l 主题地图,x t m ) 标准一直在不断地发展完善,i s 0 1 3 2 5 0 2 :t o p i cm a p s d a t am o d e l 3 明、i s o1 3 2 5 0 一5 :t o p i cm a p s _ r e f e r e n c em o d e l 【40 1 、 t m c l ( t o p i cm a p sc o n s t r a i n tl a n g u a g e ) 【4 l 】、t m q l ( t o p i cm a p sq u e r yl a n g u a g e ) r 栏j 、 t l r a p ( t o p i cm a p sr e m o t ea c c e s sp r o t o c 0 1 ) 【4 3 】、t o p i c m a p s t e r p w j 以及t m i p ( t o p i cm a p i n t e r a c t i o np r o t o c 0 1 ) 【4 5 】等相关标准和技术的出现为t o p i cm a p 在数据模型定义、主 题合并、主题查询以及通信方面提供了有力的支持。在主题图的可视化f 4 6 】,与数据库的 集成f 4 7 】方面也有了相应的研究成果。另外,也出现了一些主题图的开发和浏览软件:如 0 k s ( 0 n t o p i ak n o w l e d g es u i t e ) 【4 8 】,t m c o r e 0 5 【4 9 】,t m 4 j 【5 0 1 和t m 4 l 瞪1 1 等。 目前,基于主题图的相关的应用主要在信息的结构化索引、w e b 应用、应用发展、 应用集成等方面1 5 2 l 。在知识导航方面曾被应用于构建沙尘暴知识导航系统中 5 3 】和数字图 书馆科技文献知识导航 5 4 1 ,在政务门户知识导航方面的应用还没有见到。 综合以上描述,我们对主题图技术做一个简单总结,见表: 大连理工大学硕士学位论文 表1 3 导航技术分析表 t a b 1 3a n a l y s i st a b l eo fn a v i g a t i o nt e c h n o l o g y 定义一种用于描述信息资源的知识结构的数据格式, 作用资源位置定位,表示知识概念间的相互联系 构成t o p i c s , a s s o c i a t i o n s ,o c c u r r e n c e s 特点将主题、关联及资源实体三者利用主题索引的概念及网络的特性加以结合 描述对象主题,资源,关联,角色, 相关支持技术m m 、1 脚、t m c l 、t m q l 、1 1 l f r a p 、t o p i c m a p s t e r 、t m i p 应用软件0 k s 、t k o r e 0 5 、t m 4 j 、删4 l 主要应用领域信息的结构化索引、w e b 应用、应用发展、应用集成等方面 优点数据结构表现力丰富,知识建模方式直观自然,数据驱动灵活,数据格式 简单,明确的合并规则 缺点 管理和维护工作需要人工参与,缺乏量化机制 1 3 本文研究思路和主要工作 本文在从政务资源和服务对象两方面深入分析了政务门户导航系统的基础上,提出 了基于x t m 的政务门户导航模型。根据模型的四层体系结构,首先选取突发公共事件预 警作为应用领域构建了x ,r m 本体,然后对) 汀m 进行了二级关联扩展并设计了相关度 的计算方法,最后设计了导航过程中关键技术的实现机制,并采用砸t 平台构建了基 于x r m 的政务知识导航原型系统。主要研究工作包括: ( 1 ) 提出基于x i m 的政务门户知识导航模型的四层结构。从系统功能角度对模型进 行了相应的功能细分。 ( 2 ) 依据本体构建的原则,选取突发公共事件预警作为应用领域,在对领域概念层次 和关联进行分析的基础上完成了领域主题图本体的构建,最后以标准的x t m 编码方式 完成了对主题图本体的x t m 编码。 ( 3 ) 对原有的x t m 技术体系进行了二级关联扩展,通过划分主题关联种类进行从主 题图”到“主题树”的转换,引入语义距离设计了主题之间以及主题和资源问的相关度 计算方法。结合政务资源对安全性要求高的特点,设计了主题和资源的访问权限控制机 制。 ( 4 ) 设计实现了系统的导航机制和相应的导航流程,通过主题的关联和别名机制实现 了语义消歧操作,从一定程度上克服了传统导航的查全率和查准率低的问题。并设计了 导航过程中一些关键技术的具体算法。 基于x t m 的政务知识导航系统的研究与实现 ( 5 ) 采用微软的n e t 平台设计实现了原型导航系统。设计主题图的d 编码实现了从 主题图到数据库的映射,通过x s l t 技术对x ,r m 进行格式转换,实现了基本的主题浏 览和知识检索功能,并开发了相应的主题图编辑模块来进行相应的对x r i m 的操作。 大连理工大学硕士学位论文 2 基于x t m 的政务门户知识导航系统模型设计 2 1 政务门户导航需求分析 构建政务门户导航系统是一项复杂的系统工程,其系统结构如图2 1 所示,需要运 用系统的思想分析导航系统的需求,以更加真实地反映导航系统的运行情况。 图2 1 系统结构图 f i g , 2 1s t r u c t u r eo fs y s t e m 导航系统的系统输入是政务资源,即门户网站的内容,是导航服务的原料。导航系 统的系统输出是导航服务,即提供给最终用户的系统导航服务。导航是将门户资源进行 加工处理后以特定形式呈现给用户的过程。包括系统资源内容的选择、描述、组织、管 理、整合,构建门户内容的知识体系等。对下面我们将分别从政务资源( 系统输入) 的特 点和导航服务的受众( 系统输出) 两方面来对导航系统的需求加以分析。 目前各级政府部门集聚了大量的信息资源,这些信息资源还常常比一般的信息资源 更有价值,质量和可信度也较高,直接关系到国民经济与社会发展的状况和水平【5 5 】。其 特点总结如下: ( 1 ) 多样性。政务资源不光数量庞大,而且表现形式多样,其中包括结构化,半结 构化和非结构化多种类型的信息资源。 ( 2 ) 层次性。由于政府机构是有层次性的,所以其所有的资源也是分层次的,不同 级别的政府部门存储着不同级别的信息资源。而政务信息资源本身也是有层次的,可以 分为战略、策略和执行三个级别。 ( 3 ) 安全性要求高。政务资源不同与一般的信息资源,它往往会涉及很多具有一定 密级要求的信息,只供在少数人或部门间传播。一旦外泄会造成严重的后果,所以在安 全性方面要求有强有力的保障。 ( 4 ) 关联性。政务资源相对于一般资源而言,其资源间的关联性更强。 ( 5 ) 分布性。政务资源分别存储在各级政府相关部门,在地理上分布广阔。 政务门户一般分为内部门户和外部门户,外部门户主要的服务对象是市民和企业, 内部门户的服务对象是政府工作人员,这些工作人员按照职位,工作性质等进一步划分 基于x 办d 的政务知识导航系统的研究与实现 为不同的用户群,相应地应该享受不同的服务。在所有的服务对象中,对政务知识掌握 程度也不同,这就决定了导航系统输出的友好性和多样性,需要针对不同用户的需求, 提供不同的导航服务。 导航系统是对分布异构的政务资源进行收集、整合、管理,构建政务资源的索引知 识网络,为不同用户提供准确、安全的导航服务。通过对导航系统输入和输出的分析, 我们可以得出如下政务门户导航系统的基本需求: ( 1 ) 分布性。系统必须具备集成不同地理位置政务资源的能力。 ( 2 ) 资源访问形式的多样性。包括对不同格式的资源进行访问的能力和对同一资源 提供不同的访问途径。 ( 3 ) 对不同用户群提供个性化的服务。 ( 4 ) 导航的关联性。提供导航结果的关联扩展,提高用户每次检索的信息获取量。 ( 5 ) 知识导航的系统性。导航结果不是单个知识点,而应该是以用户查询知识为核 心包括相关知识的一个知识系统。 ( 6 ) 清晰安全的访问控制。 2 2 模型整体框架 2 2 1 模型理论基础 知识导航不网于信息导航,信息导航是一种“以点对网”的导航方法,用户查询直 接面对信息资源,是一种直接的字符匹配。知识导航是在用户查询接口和资源层之间引 入知识层,作为用户和资源之间的桥梁,从而不仅可以为用户提供资源视图,还可以提 供知识视图,包括了资源是什么,它的位置,资源间的关联,另外资源也不仅仅局限于 文档资料,可以扩展到数据、应用程序和拥有知识的专家等。知识导航扩展了传统导航 系统的功能,可以更好地实现用户查询和资源之间地语义匹配。 主题图实际上是在信息资源的上层构建了一个结构化的语义网,它独立于技术平 台,描述主题之间的关系及主题与具体资源的联系,通过揭示概念之间的关系,将用户 指引到相关的资源。主题图的t a o 架构通过对知识、知识间的关联以及知识和资源之间 联系的描述,为门户导航提供了一个很好的知识一一资源视图。主题图可以利用一定的 知识组织体系,对系统资源集合的主题内容结构、主题词汇、主题间相互关系以及主题 与具体资源的链接进行描述,建立资源集合的主题索引或交叉参照,链接复杂主题范围 的分布式资源来建立虚拟知识体系,可以通过主题概念与资源的不同链接在同一资源体 系上建立面向不同主题体系或不同用户的资源界面。为知识导航的实现提供了很好的技 术框架。 大连理工大学硕士学位论文 氪f 义耥d b 斑f j 程序 专家 图2 2x 碗结构图 f i g 2 2s t r u c t u r eo fx 删 基于x t m 的政
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026心理咨询师资格题库含答案
- 2026年心理咨询师资格考试试题及答案解析
- 2026年天华专升本心理学真题试卷及答案
- 2026年柳州国家级检验检测机构资质认定评审员考试试题及答案
- 2026年湖北省孝感市晋升中、初级专业技术职务水平能力测试(水产工程)试题解析及核心考点
- 2026年湖北省工程专业职务水平能力测试(发酵)模拟试题及答案
- 甲状腺炎诊疗专家共识
- 东辽县全民健身中心建设项目水土保持报告表
- 35kV先锋变扩建工程水土保持报告表
- 建筑施工安全培训制度
- 取民工驻地管理办法
- 地质矿产专家库管理办法
- 2025年安徽省中考数学试题含答案
- 湖南省雅礼集团2024-2025学年七年级下学期期末语文试题(含答案)
- 2025年广东省中考数学试卷真题(含答案详解)
- 2025年高考数学真题一卷和二卷(含答案)
- 中国石油化工股份有限公司西北油田分公司顺北油田原油外输管道工程环境影响后评价环评报告
- 浙江省杭州市临平区2023-2024学年五年级下数学期末基础性学力测评试卷(含答案)
- CJ/T 288-2008预制双层不锈钢烟道及烟囱
- 2025广州市小升初英语复习汇编:任务型阅读(含解析)
- 项目清场协议书
评论
0/150
提交评论