




已阅读5页,还剩68页未读, 继续免费阅读
(计算机应用技术专业论文)基于语义的网络化制造资源智能检索技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文摘要 摘要 网络化制造可以使企业间的合作效率更高、成本更低,资源得到更充分和合 理的利用,因此,对于提高企业的新产品开发能力,快速、低成本地制造产品能 力等都具有非常重要的意义。然而网络化信息表现形式多样,结构化程度低,不 是机器可理解格式,获取困难;而传统搜索引擎,只针对关键字匹配,不具有语 义,影响了查全率和查准率。因而网络化制造资源的智能获取和查询,成为制约 网络化制造技术发展的一个瓶颈问题。 在这样的背景下,我们结合语义网技术对网络化制造环境下的制造资源获 取、本体建模、语义标注、智能检索、语义查询前端等问题展开研究,实现了一 个原型系统m r i s s 。 首先,本文对国内外网络化制造资源智能检索相关技术的研究现状进行了分 析,提出了m r i s s 的系统总体结构和四层系统层次模型。 其次,本文建立了面向网络化制造资源的本体结构,采用o w l 建模语言,使 用概念、概念属性以及概念间关系,通过概念蕴涵、属性关联、相互约束以及公 理定义等方法,形成复杂的网状结构,成为系统在语义和推理上的底层支撑。 随后,本文在分析当前网络化信息获取方式的基础上,提出定制s p i d e r 的 方案。并在开源s p i d e rh e r i t r i x 的基础上进行定制和扩展,实现了针对目标网 站进行抓取的聚焦s p i d e r 。并根据网页信息分布特点,完成半自动化标注工作。 最后,本文针对当前制造资源检索方法存在的问题,提出多层次智能检索模 型和智能检索模块的总体结构。运用j e n a 工具包,设计和实现多层次智能检索, 设计了界面友好的图示化语义查询前端。并设计了查询树这一数据结构用来连接 用户输入和s p a r q l 语义查询语言,且研究了查询树和s p a r q l 的转换算法。最后 通过运行实例验证了系统的功能。 关键词网络化制造,语义网,本体,智能检索,h e r i t r i x ,o w l ,j e n a 浙江大学硕士学位论文a b s t r a c ! a b s t r a c t n e t w o r km a n u f a c t u r i n gm a k e sc o o p e r a t i o nb e t w e e ne n t e r p r i s e sm o r ee f f i c i e n t , l o w e rc o s t , r e s o u r c e sm o r ef u l l yu s e d ,i ti n c r e a s e st h ea b i l i t yo fe n t e r p r i s e st od e v e l o p n e wp r o d u c t sr a p i d l y ,l o wc o s t h o w e v e r ,o no n es i d e ,w e bi n f o r m a t i o ni si nv a r i o u s f o r m s ,u n s t r u c t u r e do rs e m i s t r u c t u r e d ,m a c h i n e su n r e a d a b l ea n dd i f f i c u l tt of e t c h o n t h eo t h e rs i d e ,n o r m a ls e a r c he n g i n e su s ek e y w o mm a t c h i n go n l y ,w i t h o u ts e m a n t i c i n f o r m a t i o n ,w h i c hl e a dt ol o wr e c a l lr a t ea n dl o we x a c tr a t eo ft h eq u e r yr e s u l t s t h e r e f o r e ,f e t c h i n ga n dq u e r y i n gn e t w o r k sr e s o u r c e si st h eb o t t l e n e c kw h i c hr e s t r i c t s t h ed e v e l o p m e n to fn e t w o r km a n u f a c t u r i n gt e c h n o l o g y i no r d e rt os o l v et h i sp r o b l e m t h i st h e s i sc o m b i n e ss e m a n t i cw e bt e c h n o l o g yt o n e t w o r km a n u f a c t u r i n g 。w ed e s i g na n di m p l e m e n tap r o t o t y p es y s t e m ,m r i s s ,w h i c h i n c l u d e so n t o l o g ym o d e l i n g ,m a n u f a c t u r i n gr e s o u r c ea c q u i s i t i o n , s e m a n t i ca n n o t a t i o n , i n t e l l i g e n ts e a r c h i n ga n ds e m a n t i cb r o w s e rm o d u l e f i r s to fa l l ,t h i st h e s i ss t u d i e st h es t a t u sq u ob o t ha th o m ea n da b o a r da b o u tt h e n e t w o r km a n u f a c t u r i n gi n t e l l i g e n ts e a r c hr e l a t e dt e c h n o l o g i e s t h e nw ep r o p o s e m r i s so v e r a l ls t r u c t u r ea n daf o u r - l e v e ls y s t e mm o d e l s e c o n d l y ,t h et h e s i se s t a b l i s h e sa no n t o l o g ys t r u c t u r ef o rn e t w o r km a n u f a c t u r i n g r e s o u r c e s ,u s i n go w lm o d e l i n gl a n g u a g e ,i n c l u d i n gc o n c e p t s ,p r o p e r t i e so fc o n c e p t s a n dt h er e l a t i o n s h i pb e t w e e nc o n c e p t s w ea l s oc r e a t em a n ya x i o m sf o rr e a s o n i n g a l l o ft h e s ec o n s t r u c tac o m p l e xn e t w o r ks t r u c t u r ea n dm a k et h es e m a n t i cb a s eo ft h e w h o l es y s t e m t h i r d l y ,t h et h e s i sa n a l y z e sc u r r e n ti n f o r m a t i o na c q u i s i t i o nm e t h o d s a n d p r o p o s e s t h a tac u s t o m i z e ds p i d e ri sar e a s o n a b l ew a yt os o l v et h i sp r o b l e m b a s e do nt h eo p e n s o u r c es p i d e r ,h e r i t r i x ,w er e a l i z et h ef o c u s e ds p i d e rw h i c hf u l f i l l e dc r a w l i n gf o rt h e t a r g e ts i t e s w ea l s oc o m p l e t et h es e m i - a u t o m a t i ca n n o t a t i o nf o rt h et a r g e ts i t e s f i n a l l y ,t h et h e s i sp r o p o s e sm u l t i l e v e lm o d e lo fi n t e l l i g e n ts e a r c ha n dt h eo v e r a l l s t r u c t u r eo fi n t e l l i g e n ts e a r c hm o d u l e u s i n gj e n at o o lk i t s ,w ei m p l e m e n tm u l t i l e v e l m o d e lo fi n t e l l i g e n ts e a r c h ,w i t ht h eu s e r - f r i e n d l ys e m a n t i cb r o w s e r w ed e f i n ea l l 浙江大学硕士学位论文a b s t r a c t q u e r yt r e et oc o n n e c tt h eu s e ri n p u tw i t hs e m a n t i cq u e r yl a n g u a g es p a r q la n ds t u d y t h ea l g o r i t h mt oc o n v e r s et h eq u e r yt r e et os p a r q l a t l a s t ,e x p e r i m e n tp r o v e st h e f e a t u r e so fm 砌s s k o , w o r d s :n e t w o r km a n u f a c t u r i n g , s e m a n t i cw e b ,o n t o l o g y , i n t e l l i g e n ts e a r c h , h e r i t r i x ,o w l ,j e n a 浙江大学硕士学位论文表目录 表目录 1 1 加工制造领域术语使用的同义异形示例3 3 1 概念o w l 定义l8 3 2 概念属性o w l 定义2 1 3 3 概念约束o w l 描述2 l 3 4 传递关系o w l 描述2 2 3 5 对称关系o w l 描述2 3 4 1s p i d e r 在s o u r c e f o r g e 上表现2 6 4 2 概念属性o w l 标注3 9 4 3 “车床”概念o w l 标注3 9 4 4 “企业”概念o w l 标注4 0 4 5 概念间关系o w l 标注4 0 v l i 表表表表表表表表表表表 浙江大学硕士学位论文图目录 图目录 图2 1m r i s s 系统总体结构图1 2 图2 2m 魁s s 系统层次结构图1 3 图3 1 制造资源概念层次( 部分) 1 9 图4 1h e r i t r i x 架构设计图2 7 图4 2 “中华机床网”定制抓取流程图3 4 图4 3 信息抽取和语义标注流程3 7 图4 4 横向网页3 8 图4 5 纵向网页3 8 图5 1 多层次智能检索模型4 1 图5 2 智能检索总体结构4 2 图5 3j e n a 总体结构图4 3 图5 4 语义查询前端4 9 图5 5 查询树相关节点类类图5 l 图5 6q u e r y t r e e n o d e 类图5 2 图5 7q u e r y t r e e d a t a p r o p e r t i e s n o d e 类图5 l 图5 8q u e r y t r e e c o n c e p t n o d e 类图5 2 图5 9q u e r y t r e e o j e c t p r o p e r t i e s n o d e 类图51 图5 1 0 查询树5 2 图5 1 1 查询树到s p a r q l 转换算法流程图5 3 图6 1 运行实例一( 查询条件) 5 6 图6 2 运行实例一( 相关概念) 5 6 图6 3 运行实例一( 查询结果) 一5 7 图6 4 运行实例二( 查询条件) 5 8 图6 5 运行实例二( 查询结果) 一5 8 图6 6 运行实例三一5 9 图6 7 运行实例四6 0 浙江大学研究生学位论文独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他入已经发 表或撰写过的研究成果,也不包含为获得逝姿盘堂或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文作者签名:莓山 签字日期: 沙f 年 占月磊日 学位论文版权使用授权书 本学位论文作者完全了解滥鎏盘堂有权保留并向国家有关部门或机构 送交本论文的复印件和磁盘,允许论文被查阅和借阅。本人授权迸婆盘堂可 以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:套去 导师签名: 签字日期:加髫年月营日 吓倪 签字日期:h 启年( 月日 浙江大学硕士学位论文第1 章绪论 第1 章绪论 1 1 引言 随着互联网的快速发展,网络技术对于制造业的影响已经渗透到相关的各个 领域,并且还在不断地迅速扩大,并由此形成了一种新的制造模式,即网络化制 造。所谓网络化制造,是先进制造技术在网络上实施,它吸收了计算机辅助设计、 集成制造、虚拟制造、协同设计等方面的最新技术成果,尤其是计算机网络技术, 并将其综合应用于基于互联网的产品开发与设计、制造、检测、管理及售后服务 的制造全过程,实现优质、高效、低耗、清洁、敏捷制造i 。相对于传统方式, 网络化制造跨越了企业间的空间差距,实现企业间的信息集成、业务过程集成、 资源共享,实现产品商务、设计、制造的协同,缩短产品的研制周期和研制费用, 提高整个产业链和制造群体的竞争力。 然而目前我国网络化制造系统的发展还不尽如人意,还存在着制约网络化制 造技术发展的一系列瓶颈问题。其中的一个核心问题是如何实现网络化制造资源 的智能获取和智能检索。 网络化制造资源的获取一般有两种方法:方法一是通过人工搜集并手工输入 数据库进行管理,其缺点是开放性、实时性较差,成本高;方法二是直接从因特 网上获取网络化制造资源并进行集成管理,这种方法可以克服方法一的缺点。但 方法二存在着一系列关键问题有待解决:能从因特网中直接获取到的网络化制造 资源,其信息描述的复杂度高、一致性低、表现形式具有多样性、结构化程度低, 互操作性差【2 】,同时获取的信息不包含语义。 而网络化制造资源检索,基于目前i n t e m e t 信息表达主要以h t m l 等文本页 面为主,其检索仍然存在着许多缺陷,主要表现在:信息是面向用户直接阅读, 不利于计算机直接阅读和处理;检索以关键字匹配为主,易出现不相关内容,准 确率低,遗漏大量的与检索概念同义或相关的内容,查全率不高;检索粒度过大、 精度不够,无法实现问答式的查询,检索效率低;以页面为单位,无法跨越网页 浙江大学硕士学位论文第l 章绪论 边界;难以进行推理,实现间接的信息内容检索【2 1 。 针对目前因特网在信息表达、检索等方面存在的缺陷,w w w 的创始人t i m b e m e r s l e e 提出了语义网( s e m a n t i cw e b ) 的概念 3 1 4 1 ,其目标是使因特网上的 信息具有计算机可以理解的语义,从而满足智能软件代理a g e n t 对w w w 上异构、 分布信息的有效检索和访问,实现网上信息资源在语义层上的全方位互联,并在 此基础上,实现更高层的、基于知识的智能应用。 由于现有的信息获取和检索技术仍存在难以避免的局限性,而同时网络化制 造环境又是非常复杂的,迫切需要有一种新的思路和方法来解决这些问题。从语 义网技术的内涵和发展来看,能解决目前网络化制造系统在资源信息表达和检索 中所面临的问题,因此,引入语义网技术,对于有效解决网络化制造资源的自动 获取和智能检索问题很有必要,也很有价值。 1 2 网络化制造资源概述 1 2 1 网络化制造资源概念 随着制造业的不断发展,敏捷制造( a m ) ,虚拟制造m ) 等一批新的制造模 式应运而生。相应地,供应链技术、多智能体( m u l t i a g e n t ) 结构与网络化制造技 术等成为研究热点。网络化制造技术就是为满足制造业网络化发展的需要而在二 十世纪九十年代发展起来的一系列制造技术的总称。网络化制造技术是先进制造 技术在网络上实施,它吸收了计算机网络、计算机辅助设计、集成制造、虚拟制 造、协同设计、计算机仿真、工作流、现代管理等方面的最新技术成果,并将其 综合应用于基于互联网的产品开发与设计、制造、检测、管理及售后服务的制造 全过程,实现优质、高效、低耗、清洁、敏捷制造。从本质上可以说,网络化制 造技术是传统制造技术、信息技术、自动化技术和现代管理技术等的有机融合【1 1 。 把网络化制造资源的定义分为广义和狭义两种,其狭义网络化制造资源的定 义【2 】,适合于本文的研究内容,狭义网络化制造的定义: 网络化制造是指企业通过因特网,从事产品协同加工制造活动,具体包括搜 寻或发布产品供求信息、搜索加工任务、寻找产品生产合作伙伴,以及进行产品 2 浙江大学硕士学位论文第l 章绪论 的合作加工制造等等,以实现企业或企业间的资源共享、优化组合配置,实现加 工制造过程集成和异地协同制造。 1 2 2 网络化制造资源研究意义 网络技术对于制造业的影响渗透到相关的各个领域,并且还在不断的迅速扩 大,它使得企业间的合作效率更高、成本更低,企业的资源得到更加充分和合理 的利用,对于提高企业的新产品开发能力,快速、低成本地制造产品能力等都具 有非常重要的意义,具体体现在以下一些方面: 充分利用资源、减少重复投资 降低企业内运营成本 降低企业外交易合作成本 扩大合作伙伴的选择范围 寻找新机遇、开拓新市场 1 - 2 3 网络化制造资源面临的问题 网络化制造资源具有信息描述的复杂性高、一致性低、表现形式具有多样性、 结构化程度普遍较低的特剧列。 下面,我们以加工制造领域为例,说明信息描述的不一致性和复杂性。我们 收集了一些加工制造中在术语使用上或者表现形式上的同义异形例子,并根据产 生原因进行分类,如表1 1 所示。这些情况广泛存在,它是互操作性差的直接体 现,不仅严重影响了设计、制造人员人之间的信息交流,同时也给信息检索加大 了难度。 表1 1 加工制造领域术语使用的同义异形示例 原因分析举例 地域差异造成类别标准术语地方术语 同义异形 单位 1 0um 丝( 南方) 、道( 北方) 加工方法铸造 翻砂 新、老标准更替 类别新标准 旧标准 造成术语混用 常用术语表面粗糙度表面光洁度 热处理氧化处理发黑、发蓝 浙江大学硕士学位论文第1 章绪论 续表1 1 原因分析 举例 描述形式不同造成类别形式一形式二 同义异形 机床参数最大加工直径在“最大工件= 最大 工件执行宰最大工件 长度”中包含 级数数字表示,如文字描述,如“无级” 2 4 或“所有级别” 同时,传统信息的表达和检索技术方面,仍然存在着许多缺陷,因此为网络 化制造中的合作伙伴寻找、发现,协作的建立造成了极大的困难,主要体现在以 下一些方面: 以h t m l 语言表达的页面信息和组织方式,主要面向用户直接阅读,没 有将信息的表现形式、内在结构和表达内容相分离,因而,非常不利于计算机直 接阅读和处理。 信息检索主要以关键字匹配的方式为主,因此,检索结果往往出现一些 不相关的内容,准确率低,同时只通过关键字匹配的方法,遗漏了大量的与检索 概念同义或相关的概念内容,因此检索在查全率方面也不高。 信息检索的粒度过大、精度不够,无法实现问答式的查询,检索返回结 果以页面或链接为主,因此仍需花费大量的人工进行查找,检索效率低。 信息检索以页面为单位,无法跨越网页边界,因此造成检索结果分离, 需要附加大量的人工进行信息整合工作。 目前的信息检索只能搜索到网页中直接提及的问题,而难以进行推理和 回答间接的问题。 综上所述,由于目前现有信息表达和检索技术仍存在难以避免的局限性,而 同时面对的又是非常复杂的网络化制造环境所特有的诸多问题,因此,这越来越 成为制约网络化制造发展的一个问题。 1 2 4 语义网与网络化制造资源 w w w 的创始人t i mb e m e r s l e e 于2 0 0 0 年1 2 月1 8 日在x m l 2 0 0 0 会议上, 提出了下一代因特网的概念一语义网( s e m a n t i cw e b ) 。 4 浙江大学硕士学位论文 第1 章绪论 语义网与目前我们所使用的万维网的区别在于:万维网实际上是一个存储和 共享图像、文本的媒介,电脑所能看到的只是一堆文字或图像,对其内容无法进 行识别。而语义网的建立则将事情变得简单得多。语义网的主要开发任务是使数 据更加便于电脑进行处理和查找,其最终目标是让用户变成全能的上帝,对因特 网上的海量资源达到几乎无所不知的程度,计算机可以在这些资源中找到你所需 要的信息,从而将万维网中一个个现存的信息孤岛,发展成一个巨大的数据库。 语义网将使人类从搜索相关网页的繁重劳动中解放出来。因为网中的计算机能利 用自己的智能软件,在搜索数以万计的网页时,通过“智能代理”从中筛选出相关 的有用信息。而不像现在的万维网,只给你罗列出数以万计的无用搜索结果。 语义网是一项面向因特网应用的通用技术,它提出的目标完全能解决目前网 络化企业协作中在资源信息表达和检索中所面临的问题,因此,我们认为通过引 入该技术并进行尝试,对于有效解决目前的问题很有必要,也很有价值。 1 3 网络化制造资源智能检索相关技术研究现状 1 3 1 国内网络化制造资源检索现状 近几年,国内网络化制造资源检索相关的知识表示、资源获取、检索模型等 的研究主要如下: 贵州大学的谢庆生等进行了网络制造资源多层次智能检索模型的研究,建立 了制造资源智能化检索系统知识库,综合使用用户建模、机器学习、w e b 网页 识别、信息过滤、数据挖掘、人机交互等多项技术提出了多层次的智能检索模型 的总体结构,包括用户界面、信息采集子系统、信息反馈子系统、信息推送子系 统四个模块。其中信息推送子系统采用关联规则挖掘技术对用户兴趣进行挖掘, 实现了个性化搜索,基于案例推理技术的动态联盟伙伴企业检索模式【5 】【酬。 兰州理工大学在甘肃省科技攻关项目“有色行业集成信息体系结构研究支 持下进行了基于语义w r e b 的网络化制造知识集成技术的研究,采用p r o t d g d 工具, 使用o w l d l 语言对制造企业进行了本体建模,将制造企业本体分为时间本体、 活动本体和状态本体,并且使用s w r l 建立了公理集。提出基于语义的制造资源 浙江大学硕士学位论文第l 章绪论 检索,将语义检索分为:概念检索、实例检索和关系检索,并实现检索算法。并 且设计了p i n m b s 系统,包括:制造业元知识自动提取模块、数据存储模块、知 识查询推理模块和知识接收发布模块【。7 1 。 华中科技大学的祁型虹等进行了制造网格环境下制造资源的建模与形式化描 述的研究。将制造网格的体系结构分为构造层、制造网格核心中间件层、用户中 间件层和应用层四个大的层次,是以g l o b u s t o o l d t 的元计算目录服务组件和网格 资源分配管理者为基础而设计的。采用面向对象方法和统一建模语言u m l 相结 合建立了制造资源分类模型。实现了基于s t e p x m l w s d l 制造资源的描述【8 l 。 东南大学的江勇等进行了基于x m l 的网络化制造资源应用平台的研究与应 用,基于产品表达与交换标准s t e p ,建立了制造资源信息模型,包括制造资源 物理模型、能力模型、关联模型和状态模型。应用神经元仿生学原理,构建了多 层结构的制造资源组织模型,通过细胞、逻辑神经和知识网络实现对制造资源信 息、面向功能的制造资源组织逻辑和面向制造资源应用的知识的描述,为异地制 造资源信息集成、制造资源检索和应用提供支持。基于x m l 定义了制造资源标 注语言m r m l ,实现了m r m l 在制造资源的集成、信息挖掘、资源重构、数据 重用等制造资源应用【1 1 。 西南交通大学的屈喜龙等进行了区域网络化制造中的资源管理及其优化配置 技术研究,提出了一个三层的b t c q s 资源描述模型,并结合w e b s e r v i c e 技术的 优点,提出一个基于总平台重点城市分平台企业平台的三级资源管理解决方 案。在区域内制造资源的优化配置方面提出一个基于模糊a h p 方法的优选模型 和一个基于a h p 的c b r 实例检索模型【9 】。 1 3 2 基于语义网智能检索研究现状 基于语义网的智能检索系统的开发已经处于快速发展阶段。比较具有代表性 的系统主要包括以下一些: c o r e s e 1 0 i 是由i n r i a ( 法国国家信息与自动化研究所) 开发的基于本体的 搜索引擎,内部使用概念图,支持混合的元组查询。查询语言于 6 浙江大学硕士学位论文第l 章绪论 s p a r q l ,s e r q l ,r d q l 类似,但是支持近似化查询。近似化查询是基于两个类在 层次结构中的距离和r d f s :s e e a l s o 的属性来衡量的。结果以与查询条件的相似度 来衡量。 o n t o s e a r c h 11 1 是由新加坡n t u 大学研发的“o n t o l o g yg o o g l e ,使用了g o o g l e a p i s ,用户输入关键字来搜索i n t e r n e t 上的o n t o l o g y 文件。后端采用了j e n a 。对 结构的排序采用向量空间的方法。 b e 珂e + + 1 1 2 1 由德国l 3 s 研究中心和h a n o v e r 大学在开源搜索引擎b e a g l e 的基 础上联合开发的桌面搜索原型系统,加入语义增强了全文搜索模块和r a n k i n g 模 块。使它支持r d f 元组索引。文档中的p r e d i c a t e 和o b j e c t 根据s u b j e c t 建立索引。 提出p r e d i c a t ep a t h s ( 在r d f 图中能横穿文档节点的p r e d i c a t e 路径) 。采用关键词 进行检索。 s w o o g l e t l 3 】是由美国u m b 大学研发的基于本体的语义搜索引擎,自行实现了 多个c r a w l e r ,抽取每个发现的文档的语义信息,计算文档之间的关系,采用 n g r a m 或者u r i r e f s 建立索引,还提出了一种衡量语义文档重要性的方法。 o n t o s e a r c h 2 1 1 4 】【1 5 】由英国a b e r d e e n 大学研发的语义本体搜索引擎,用户搜索 和发现本体。后端由知识库支持,提供了三种语义搜索本体的方法,基于关键字 的搜索,基于搜索结果的搜索,模糊搜索。 w a t s o n 1 6 1 是英国的k m i ( k n o w l e d g em e d i ai n s t i t u t e ) 研发的本体搜索引擎,能 够抓取语义文档( o w l ,r d f ( s ) ,d a m l + o i l ) 。首先检测本体位置,能维护 位于不同位置、不同语言本体之间的一致性。能够检索概念、实例和概念间的关 系。 国内目前主要有浙江大学吴朝晖【1 7 】等第一个将语义网用于解决中医药信息的 知识集成和管理,实现了基于本体的检索引擎,并且实现了关系数据库到语义层 之间的转换。上海交通大学俞勇等【1 8 】【1 9 1 研究把关键子查询转换成语义查询,包括 q 2 s e m a n t i c 转换接口和s p a r k 系统。 7 浙江大学硕士学位论文第l 章绪论 1 4 论文研究背景和内容 近年来网络化制造飞速发展,致力于跨越企业间的空间差距,实现企业间的 信息集成、业务过程集成、资源共享,实现产品商务、设计、制造的协同,缩短 产品的研制周期和研制费用,提高整个产业链和制造群体的竞争力。然而网络化 信息表现形式多样,结构化程度低,不是机器可理解格式,获取困难;而传统搜 索引擎,只针对关键字匹配,不具有语义,影响了查全率和查准率。因而网络化 制造资源的智能获取和查询,成为制约网络化制造技术发展的一个瓶颈问题。 本论文就是在这样的背景下提出的,属于浙江省重点攻关科技项目。本论文 开发和完成了一个基于语义网技术的、制造资源智能获取、智能智能检索的原型 系统m r i s s ( m a n u f a c t o r yr e s o u r c e si m e l l e c t u a ls e a r c hs y s t e m ) 。m r i s s 的关键技 术和创新点,主要包括, 适合网络化制造开放环境的共享资源本体建模技术; 网络化制造信息智能获取技术; 半自动化的语义标注技术; 多层次的网络化制造资源检索融合技术; 易用、清晰、简洁的网络化制造资源检索语义查询前端技术。 本论文共分为七章, 第一章“绪论”,对网络化制造资源资源检索相关技术的研究现状进行分析, 介绍了本文的研究背景、研究意义和内容组织结构。 第二章“m r i s s 总体结构 ,对m r i s s 的需求和功能进行分析,提出了 m r i s s 的系统总体结构和四层系统层次结构。 第三章“网络化制造资源本体建模”,建立了面向网络化制造资源的本体结 构,采用o w l 建模语言,使用概念、概念属性以及概念间关系,通过概念蕴涵、 属性关联、相互约束以及公理定义等方法,形成复杂的网状结构,从而成为系统 在语义和推理上的底层支撑。 第四章“网络化制造资源获取”,本文在分析当前网络化信息获取方式的基 础上,提出定制s p i d e r 的方案。并在开源s p i d e rh e r i t r i x 的基础上进行定制和扩 8 浙江大学硕士学位论文第l 章绪论 展,实现了针对目标网站进行抓取的聚焦s p i d e r 。并根据网页信息分布特点,完 成半自动化标注工作。 第五章“网络化制造资源智能检索 ,最后,本文针对当前制造资源检索方 法存在的问题,提出多层次智能检索模型和智能检索模块的总体结构。运用j e r l a 工具包,设计和实现多层次智能检索,设计了界面友好的图示化语义查询前端。 并设计了查询树这一数据结构用来连接用户输入和s p a r q l 语义查询语言,且研 究了查询树和s p a r q l 的转换算法。 第六章“运行实例”,以四个运行实例进行演示,验证系统实现了基于语义 的网络化制造资源的智能检索的目标; 第七章“总结与展望 ,对全文所进行的主要工作和研究成果进行总结,并 对还需要进一步研究的工作进行了展望。 9 浙江大学硕士学位论文 第2 章- i r i s s 总体结构 第2 章m r i s s 总体结构 2 1 功能分析 借鉴已有的基于语义网的智能检索系统,结合网络化制造资源的特点,本文 认为,m r i s s ,应该具有如下功能模块。 1 网络化制造资源智能获取模块,简称聚焦s p i d e r 模块 传统网络爬虫追求大的覆盖率,无目标性,如果应用于网络化制造资源信息 获取,将会影响抓取效率,浪费存储空间,加重后期信息处理的负担,不适合网 络化制造资源的智能获取。近年来人们提出了聚焦s p i d e r ,其与通用爬虫不同, 将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数 据资源。在m r i s s 中,设计一个定制的、适合网络化制造资源的聚焦s p i d e r ,对 网络化制造资源相关的网页进行自动的、智能的、高效的抓取。自动是指设定好 s p i d e r 配置参数后,无需人工干预。智能是指能对网络化制造资源进行判断,对 重复资源进行判断。高效指抓取策略高效,存储结构好,方便后期的访问。 2 网络化制造资源的本体建模模块,简称本体建模模块 对网络化制造资源进行本体建模使整个系统具有语义的基础。建立适用各个 领域的大本体,本体构建将十分复杂,各个领域的本体也失去灵活性;建立各种 小本体,增加灵活性的同时,却带来了本体间的异构,导致信息共享和交流困难。 因而构建适合网络化制造开放环境的共享领域资源本体十分有必要。其必须符合 网络化制造领域的特点,并具有清晰性、客观性、可扩展性、一致性。 3 网络化制造资源语义半自动标注模块,简称半自动标注模块。 在获取了网络化制造资源相关的网络信息,并且建立了网络化制造资源的本 体之后,所获取的网络信息还是不具有语义的,我们需要对其进行标注,使其具 有语义,为智能检索做基础。人工标注,工作量大,维护一致性难度高,工作效 率低;目前的标注工作存在一些缺陷,不适合本文的工作1 2 们。而基于网络化制造 资源这一领域的本体,针对一些有代表性的专业网站进行语义标注,是有可能的。 1 0 浙江大学硕士学位论文第2 章m r i s s 总体结构 本文将设计实现针对典型网络化制造资源门户网站的半自动化标注。 4 网络化制造资源智能检索模块,简称智能检索模块 针对传统搜索引擎主要针对用户提交的查询关键字进行匹配来返回搜索结 果,不具有语义性。提供具有智能检索能力的检索系统是十分有必要的。除了具 有一般的精确性查询功能外,还应具有语义查询、模糊查询、智能推理功能。 5 网络化制造资源智能检索语义查询前端模块,简称语义查询前端 b a i d u ,g o o g l e 经常对其搜索引擎主页页面进行升级、改版,使用户使用更 加方便、简洁,用户想要的信息更加直接的展现给用户,对颜色的设计也具有心 理学的分析。足见前端交互技术的重要性,其极大程度的影响用户的体验,从而 影响用户的粘度。基于语义网的网络化制造资源智能检索的语义查询前端,应适 用于网络化制造资源这一特定的领域,并且具有语义导向、界面直观、操作方便、 结果直接的特点。 2 2 总体结构 2 2 1m r i s s 总体结构 我们提出了m r i s s 系统的总体结构图,如图2 1 所示。整个系统分为5 部分, 即:本体建模、聚焦s p i d e r 、半自动化标注、智能检索和语义查询前端,系统处 理流程为:首先构建网络化制造资源本体和相关的领域知识和常识。本体建模得 到网络化制造资源本体库,领域知识建模得到领域知识库,常识建模得到常识库。 然后由聚焦s p i d e r 在i n t e m e t 中自动获取与网络化制造资源相关的网络信息。然 后利用本体库、领域知识库、常识库对聚焦s p i d e r 获取的网络信息进行解析和半 自动化标注得到个体库。智能检索基于本体库、领域知识库和常识库的指导下对 个体库进行语义检索和智能推理。 浙江大学硕上学位论文 第2 章b f r i s s 总体结构 2 2 2m r i s s 层次模型 层次结构模型是软件系统和协议工程中常用的重要分析手段,它采用了分而 治之的思想,使不同层次的功能明确、接口清晰,因此,对于复杂问题的解决可 以大大简化,i s o o s i 的网络协议7 层参考模型、语义网的层次模型以及w 3 c 的 w e bs e r v i c e 协议标准栈模型都采用了这种方法。 借鉴层次结构模型的思想,我们也采用层次结构模型描述m r i s s 系统功能 的逻辑关系。 如图2 1 所示,m r i s s 的层次模型共分为5 层结构,自下而,卜分别为数据层、 本体层、知识层、服务层和表示层,该层次结构遵循了由数据到语义,再到知识 和服务,最后到与用户交互的逻辑顺序,各层的具体功能及作用阐述如下: 浙江人学硕一l 学位论义第2 章m r i s s 总体结构 i 一 概念语义层次树 可编辑语义查询树 概念属性列表 相关概念列表 查询偏好设置 语义结果展示 。 智能检索1 国 h t m l ,a s p ,j s p ,x m l ,r d f s ,o w l 等 图2 2m r i s s 系统层次结构图 数据层:该层是以i n t e m e t 为载体,包括网络上所有的与网络化制造资源 相关的网络资源。从形式卜可能是文本、图片、视频资源;从结构上可能是结构 化数据、半结构化数据、非结构化数据;从网页的类型看,可能是静态网页如 h t m l ,可能是动态网页如j s p ;从是否具有语义来看,可能是一般的网页,可 能使已经标注过的网页,如r d f s 或o w l 等( 目前万维网上标注的网页相当的 少,如果已经标注也未必能直接使用,还要看其标注语言,看其本体构建) ;从 内容上,包括制造资源信息,生产、加工、销售制造资源的企业信息,同时还包 括领域知识信息和常识性信息也以网页形式在网络中存在。该层的数据特点是易 于人理解,而机器不可理解的。 本体层:该层是使得整个系统具有语义的基础,是整个系统的关键层。 其根据产品设计、制造开发过程中涉及的关键要素,将制造领域中的常用概念、 术语,通过概念、概念的属性、概念间的关联、概念的约束、属性的约束、概念 关联的约束,公理定义等,组织成具有网状结构的、可共享的形式化本体表示, 揭示概念间的本质联系。非语义化的原始数据经过本体的标注后,也就是实例化 后,可以实现数据的表现形式、结构和内容三者之f h j 的分离,成为一种机器可理 枣不层一服务层 知识层 本体层数据层 羹 ii 浙江大学硕士学位论文第2 章鹾r i s s 总体结构 解的信息,从而为语义互操作、智能推理提供可靠的保障。 知识层:建立在本体层之上,为实现基于语义的信息检索和智能推理提 供有力的支持。根据本体层构建领域知识库和常识性知识库。领域知识层通过提 供经验性的信息,对本体层中概念及其相互间关系进行补充和扩展。拥有领域知 识的支持,能够使系统具有领域特点,方便领域相关人员的使用,结合进领域权 威知识,可以使该系统具有专家系统的功能,同时领域知识是开放的,通过标注 得出的新的领域知识可以添加进入领域知识库中的。而常识性知识库则从更广泛 的角度出发提供深层的事实信息和知识,为推理提供基础。 服务层:建立在知识层之上,根据知识层所提供的领域知识和常识性知 识提供智能检索服务,包括精确检索、语义检索、模糊检索和智能推理的多层次 智能检索服务。同时,以领域知识和常识知识为引导,提供了面向网络化制造资 源的聚焦s p i d e r 服务和半自动化标注服务。 表示层:建立在服务层之上,将服务层的所提供的语义信息以用户易理 解、具有语义的形式展现给用户。包括概念语义层次树,把本体库中概念的语义 层次结构以树的形式展现;概念属性列表,展示当前概念的属性,包括属性名称 和属性的值域,用户可对属性值进行编辑;相关概念列表,把和当前概念有直接 关联的概念列出来;查询偏好设置,用户可以设置是否查询下位概念的等查询设 置;可编辑语义树查询,通过对属性和相关概念的编辑,用户将查询条件和结果 集挂载到语义查询树上;语义结果展示,准确表达用户所要查询的结果集,并且 结果和信息来源的u r l 相关联。这些语义结构是语义查询前端的基础。 2 3 本章小结 本章对m r i s s 进行了需求分析和功能设计,设计了系统总体结构,明
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中化金融业务管理办法
- ppp项目部管理办法
- 融资租赁定价管理办法
- 精装房安装管理办法
- 莲花湖夜间管理办法
- 装修装饰材料管理办法
- 业务限时办结管理办法
- 个人信息专项管理办法
- 芙蓉镇景区管理办法
- 个人转贷服务管理办法
- DBJ04T 447-2023 装配式农村住房建筑技术标准
- 慢性肾衰竭的护理课件
- 《抗菌药物概论课件》课件
- 2025年惠州市国资本投资集团限公司招聘29人高频重点提升(共500题)附带答案详解
- 医院未来人才培养与引进策略
- 医院感染管理制度培训
- 【MOOC】研究生学术规范与学术诚信-南京大学 中国大学慕课MOOC答案
- 宁德时代应聘笔试题库及答案
- 《甘特图制作》课件
- 冀少版(2024新版)七年级上册生物第一单元《生物体的结构层次》1.2《细胞的形态》教案
- 旅游公司与导游合作协议书
评论
0/150
提交评论