




已阅读5页,还剩67页未读, 继续免费阅读
(机械制造及其自动化专业论文)网络制造资源多层次智能检索模型的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
贵州大学硕七研究生毕业论文 网络制造资源多层次智能检索模型的研究 摘要 本文是在谢庆生教授主持的中国国家自然科学基金资助项目“面向协同商务制造资源管理 的关键技术研究”( 计划批准号:5 0 4 7 5 1 8 5 ) ,国家8 6 3 计划项目“面向机电行业的a s p 应用服 务平台开发与应用”( 课题编号:2 0 0 3 a a 4 1 4 0 1 3 、2 0 0 4 a a 4 1 4 0 7 0 ) ,国家8 6 3 计划项目“面向 a s p 平台的产品创新设计与制造资源管理构件的研究和应用”( 课题编号:2 0 0 2 a a 4 1 5 3 1 0 ) 等 项目的支撑下,以制造业信息化理论方法为基础,以区域汽车零部件等行业为应用背景,对网 络化制造系统建模及应用实现等进行的研究。 网络化制造资源检索是网络化制造的一个重要组成内容,是面向区域内制造资源的检索方 式。网络化制造资源检索就是通过计算机检索系统,使企业能够快速、准确地寻找到分布在不 同地点的制造资源,并高效地使用这些资源,是开放制造资源模式的一种实现。文本讲述了网 络化制造资源检索的基本模式和特点,并详细分析了系统总体结构中的用户界面、信息采集子 系统、信息反馈子系统、信息推送子系统的工作原理和设计要求。建立了基于a s p 制造资源 智能化检索系统知识库,该知识库模型按照时间、质量、成本、服务、敏捷性、领先性、 历史记录等多项指标来分类、描述、存储制造资源知识体系。在上述研究的基础上采用了 户建模、机器学习、w e b 网页识别、信息过滤、数据挖掘、人机交互等多项技术。信息推 送子系统是网络化制造资源检索系统的一个重要组成部分,而用户兴趣的挖掘则该子系统最为 关键的技术。首次把关联规则挖掘技术引入网络制造资源信息检索系统中,并提出一种基于网 络化制造资源检索的知识仓库g a 的用户兴趣挖掘方法。该挖掘方法把用户兴趣作为关联规则 的后件,采用前件固定的方式来进行挖掘。通过对网络化制造资源管理平台的检索系统、用户 行为记录以及两者之间的业务数据进行关联规则挖掘,得到了一些基于用户兴趣模型的关联规 则。提出了一种基于案例推理技术的动态联盟伙伴企业检索模式,并采用了灰色关联理论和模 糊集理论相结合的相似度计算方法,从而克服了多指标因素相互关联的情况。文中主要讨论了 企业层制造资源检索的重要意义,具体讲述了基于c b r 的方法,伙伴企业检索系统的实现,建立 了案例库等,为动态联盟伙伴企业的检索提供了高效的、客观的选择方法。本文还讲述了信息 提取技术、信息预处理技术、查询接口实现技术、基于朴素贝叶斯的信息过滤技术等关键技术。 网络制造资源多层次智能检索系统大大提高了网络制造资源获取的效率和准确性。 关键词:网络制造资源;信息检索系统;知识库;数据挖掘 贵州大学顺t :6 j f 究生毕业论丈 刚络制造资源多层次智能榆索模型的研究 a b s t r a c t n e t w o r km a n u f a c t u r i n gr e s o u r c e s ( n m r ) s e a r c hi sa ni m p o r t a n tc o m p o n e n to f n e t w o r km a n u f a c t u r i n gs y s t e ma n da na r e a o r i e n t e dm a n u f a c t u r i n gr e s o u r c e s r e t r i e v a lm e t h o d t h ea i mo fn m rr e t r i e v a li st oh e l pe n t e r p r i s e sf i n dm a n u f a c t u r i n g r e s o u r c e sf a s ta n da c c u r a t e yt h r o u g hc o m p u t e ri n f o r m a t i o nr e t r i e v a l ( i r ) s y s t e m r e t r i e v i n ga n du t i l i z i n gt h e s en m re f f i c i e n t l yi sp a r to fr e a l i z i n go p e n m a n u f a c t u r i n gr e s o u r c e sm o d e t h isp a p e rn a r r a t e sb a s ism o d e la n dc h a r a c t e r so f n m r a n da n a l y z e sd e s i g np r i n c i p l e so fu s e ri n t e r f a c e ,i n f o r m a t i o nc o l i e c t i n g s u b s y s t e m ,i n f o r m a t i o nf e e d b a c ks u b s y s t e ma n di n f o r m a t i o np u s h p u l ls u b s y s t e mi n d e t a i l a na s p b a s e dm rd a t a b a s ei se s t a b l i s h e dt oc l a s s i f y ,d e s c r i b ea n ds t o r e m a n u f a c t u r i n gr e s o u r c e sa c c o r d i n g t ot i m e , q u a l i t y ,c o s t ,s e r v i c e ,a g i l i t y , a d v a n c ea n dh i s t o r i e a lr e c o r d b a s e ds e v e ng u i d e l i n e b a s e do nt h e s er e s e a r c h e si y e a d o p tu s e rm o d e l ,m a c h i n el e a r n i n g ,w e b p a g ed i s t i n g u i s h ,i n f o r m a t i o nf i i t e r ,d a t a m i n i n ga n dm a n m a c h i n ei n t e r a e t i o ne t c p r e f e r e n c em i n i n gi sak e yt e c h n i q u ei n i n f o r m a t i o np u s h p u l is u b s y s t e m t h i sp a p e rf i r s tc o m e su pw i t ham e t h o do fa p p l y i n g u s e rp r e f e r e n c e b a s e da s s o c i a t i o nr u l e sm i n i n gt e c h n i q u et on m rr e t r i e v a ls y s t e m t h em e t h o do fg a b a s e du s e rp r e f e r e n c em i n i n gi sp r o p o s e da n du s e r sp r e f e r e n c e iss e ta st h ec o n s e q u e n to ft h ea s s o c i a t i o nr u l e ac a s e b a s e dr e a s o n i n g ( c b r ) m e t h o di sp r o p o s e dt os e a r c hd y n a m i cl e a g u ee f f i c i e n t l y ,a n dam o d e lo fp a r t n e r c h o i c es u b s y s t e mi se s t a b l i s h e d t h ew a yo fe s t a b l is h i n gc a s ea n di t se v a l u a t i o n v a l u ed a t a b a s e si sd i s c u s s e d am e t h o do fc a l c u l a t i n gt h es i m i l a r i t yd e g r e eb a s e d o ng r e y r e l a t i o n a lt h e o r ya n df u z z y s e tt h e o r yi sp u tf o r w a r d t h u s ,s i m i l a rc a s e s c a nb ef o u n do u ta c c u r a t e l y ,a n de f f i c i e n c ya n da c c u r a c yo fc h o i c ep a r t n e r e n t e r p r i s e s a r ep r o m o t e d o t h e r w i s e , i n f o r m a t i o ne x t r a c t i n g ,i n f o r m a t i o n p r e p r o c e s s i n gt e c h n i q u e ,i n q u i r yi n t e r f a c e ,a n di n f o r m a t i o nf i l t e rt e c h n i q u eb a s e d o nn a i v eb a y e si sp u tf o r w a r d n m rm u l t i l e v e li n t e l l i g e n tr e t r i e v a ls y s t e mh a s g r e a t l yi m p r o v e dn m rf e r r e t se f f i c i e n c ya n da c c u r a c y k e yw o r d s :n e t w o r km a n u f a c t u r i n g r e s o u r c e s :i n f o r m a ti o nr e t r i e v a ls y s t e m k n o w l e d g ed a t a b a s e :d a t am i n i n g 贵州大学顾t :f i j f 究生毕业论文 网络制造资源多层次智能检索模型的研究 第一章绪论 1 1 本课题研究的意义 网络化制造系统的制造资源包括满足中小制造企业开展网络化制造需求的 共享信息库、共享资源库、基础数据库等,同时也包括制造资源的分类、描述、 评价、搜索等。基于a s p 的网络化制造系统制造资源信息主要包括4 类信息:基 础信息、能力信息、业绩信息和辅助信息等。 有效而准确的检索制造资源是企业信息化的基础,也是实现网络化制造的 必备条件之一。然而,目前由于网络信息资源庞大、易变性极强、信息系统难 以获取主题信息需求、难以将信息需求转化为查询表示、通用搜索引擎相关性 排名体系难以满足精确检索制造资源的主题要求等原因,我们开发了针对制造 资源检索的智能化检索系统。 该网络制造资源多层次智能型检索系统是面向网络制造资源专业领域主题 搜索引擎,它通过建立相对固定的网络地址集合和搜索的关键词库,根据一定 的检索算法和有选择性的抓取网络信息。该搜索引擎与普通搜索引擎的最大差 别就是有选择性的抓取信息,而并非遍历w e b 。该系统引入个性化的知识推送系 统,通过不同的用户需求在信息海洋中搜索用户所需的信息,这种系统使用智 能化复杂的决策与推理反馈机制,帮助用户确定信息;它使得用户不必再次访 问固定的站点就能获取最新信息,它还弥补了搜索引擎及检索工具中查全率有 余、查准率不足的弊端,智能化的理解用户的信息需求,提高用户的检索效率, 从而实现真正意义上的提供制造资源个性化检索服务。 1 2 课题来源 本课题研究内容是贵阳市汽车零部件a s p 平台的关键技术及核心模块中的 重要部分,以构建贵阳市汽车零部件全球化产业链信息平台为切入点,以实现 贵阳市人民政府确定的以信息化带动贵阳地区汽车零部件产业跨越式发展为应 用目标,其研究成果将成为贵阳市汽车零部件a s p 平台原型系统的组成部分。 本课题根据以上应用目标开展了大量的调研工作、查阅了国内外现有的研究成 贵州大学硕卜研究生毕业论文刚络制造资源多层次智能检索模型的研究 果,根据本课题依托项目的应用目标确定了主要研究内容,并开始了相关前期 准备和预研工作。 本课题依托贵州工业大学谢庆生教授主持的国家科技攻关项目“制造业信 息化关键技术攻关及应用工程( 贵州省) ”( 2 0 0 1 b a 2 0 1 a 3 0 ) 、国家8 6 3 计划项目 “面向a s p 平台的产品创新设计与制造资源管理构件的研究”( 2 0 0 2 a a 4 1 5 3 1 0 ) 、 国家8 6 3 计划项目“面向机电行业的应用服务平台开发与应用”( 2 0 0 3 a a 4 1 4 0 1 3 ) 及贵阳市“十五”企业信息化重点项目面向中小企业的信息化服务平台”等研 究项目,重点研究基于a s p 的网络化制造资源管理的关键技术及软件实现。 由于地区之间经济发展水平的不平衡性,处于不同区域的制造企业之间在 资金、技术、人才、管理、观念等方面也表现出较大差异。因此,中国不同地 区的制造企业发展网络化制造的模式也将具有区域差异。区域或行业内具有一 批各具特色的企业,通过资源整合,促进优势互补,形成具备整体优势的供应 链、产业链,从而促进形成区域经济的整体优势。构建的a s p 区域信息平台向 区域内企业提供资源整合( 人力资源、技术资源、设计资源、制造资源、产品 资源、市场渠道) 的信息服务,加强区域内企业的协同,实现资源整合和优势 互补,形成具有竞争力的供应链、产业链、增值链。 基于a s p 的网络化制造平台将为区域、行业或产业链等相关企业群提供信 息服务,使企业用户能够通过该平台提升信息水平,形成适应网络化制造的信 息能力。通过a s p 平台提供的支持,能够加入到全球化的相关产业联盟。 以下是基于a s p 的网络化制造平台支持的种产业联盟的初级模式。企业 联盟通过a s p 平台提供的服务,实现定单企业的网络招标,通过动态供应链形 成虚拟企业。该模式的特点为:1 ) 快捷、方便、高效:2 ) 不受时空限制,便 于信息的迅速收集、反馈和处理。但由于所有信息需经网络来传递和存储,所 以网络招投标对于数据的安全性和保密性要求较高。网络化招投标的目的在于 通过制造资源的收索与配置,寻找适合的虚拟制造资源和合作伙伴,通过以定 单企业为盟主的虚拟企业动态联盟的足见,实现网络化制造。具体的解决方案 是通过定单企业( 盟主) 将制造任务分割到部件级或零件级进行招标,招标结 果构成该产品的初步资源配置信息,使用a s p 平台提供的评价工具对初步配置 信息的评价,从而形成最终的资源配置结果和合同信息,在合同确定以后,然 贵州大学坝i :6 j f 究生毕业论文嘲络制造资源多层次智能检索模型的研究 后利用a s p 平台网络化制造相关工具来进行动态联盟企业合同执行情况的监控、 跟踪和相关信息的动态管理。 基于a s p 的网络化制造系统一般由基础资源层、基础平台层、应用服务层 和系统门户等构成,平台应具有良好的通用性和可扩展性。基于a s p 的网络化 制造系统的共享信息库、资源库和基础数据库包括满足中小制造企业开展网络 化制造需求的共享信息库、共享资源库、基础数据库等,同时也包括共享资源 库的分类、描述、发现与链接等。典型的基于a s p 的网络化制造系统可实现面 向区域中小制造业企业网络化制造各种服务,通过为众多的尚不具备建立独立 企业信息系统的中小企业提供包括应用软件、技术支持、在线培训在内等一系 列相关的服务,来促进本地区企业的跨越式发展,并通过网络化协作的方式形 成整体竞争优势,为区域经济发展提供有力的支持。 选择好a s p 的商业模式及服务内容,是a s p 服务模式获得成功及获利的重 要因素。通过调查研究中小制造企业对网络化制造的需求,根据企业的需求和 市场规律,研究分析适合业务外包的、能提升企业核心竞争力和增强盈利水平 的a s p 服务内容,基于a s p 的网络化制造系统a s p 服务内容主要有:注册管理、 招标管理、投标管理、流程管理、网络化协同设计、网络订单管理、制造资源 管理等内容。 本项目的研究具有良好的实验环境与应用平台。“十五”贵阳市企业信息化 重点建设项目“面向中小企业的信息化服务平台”初步建立了原型系统“中国 西部制造网”( w w w g y a s p c o m ) ,完成了该系统规划和总体设计,其应用系统 已初步运行。该系统是一个面向中小制造企业网络化的a s p 应用服务平台,其 建设目标是,以西部地区制造企业为主要服务对象,构建一个社会化、专业化、 市场化、规模化的a s p 服务平台,为中小企业提供适合于外包的应用服务。 课题组所在实验室具有开展研究工作所需的软硬件环境,包括微机、服务 器、数据库软件、开发工作、实验室环境等,可保证为研究提供良好的支撑条 件。 1 3 网络化制造资源的概念 制造资源是“企业完成产品整个生命周期所有生产活动的物理元素的总 称”,制造资源贯穿产品生产全过程,包括企业的设备、材料、人员以及产品生 贵州大学硕士研究生毕业论文 州络制造资源多层次智能检索漠型的研究 命周期所涉及的其他所有硬件和软件。制造资源按其特征可以分为广义制造资 源和狭义制造资源。广义制造资源是企业完成产品整个生命周期所有生产活动 的物理要素的总称。广义制造资源可根据企业的组织结构分为5 个层次,即企 业层、车间层、单元层、工作玷层和设备层,每个层次所代表的制造资源都具 有一定的属性和功能。企业层完成企业经营决策和生产管理;车间层执行生产 任务调配和任务调配;单元层完成单元任务调度和监控;工作站层完成设备控 制与动作协调:设备层执行加工、传输和测量。狭义制造资源是指加工一个零 件所需要的物质元素,是面向c i m s 、c a p p 、n c 等系统所需的底层制造资源,这 些元素包括机床、刀具、夹具、量具材料和标准工艺术语等,也就是常说的企 业的机械制造工艺资源。 在网络经济环境下,制造资源不再是由单一企业的资源组成,企业仅靠自 己的资源已经不可能有效地参与市场竞争。基于网络化制造的制造资源是由不 同地域的不同企业的资源组成,如经营过程中的有关各方如供应商、制造工厂、 分销网络、客户等,将它们纳入一个紧密的供应链中,才能有效地安排企业的 产、供、销活动,满足企业利用全社会一切市场资源快速高效地进行生产经营 的需求,以期进一步提高效率和在市场上获得竞争优势。换句话说,现代企业 竞争不是单一企业与单一企业间的竞争,而是一个企业供应链与另个企业供 应链之间的竞争。由于网络化制造中的资源具有分布、异构和不确定的特点, 再加上网络安全性等其它因素,所以网络化制造环境下制造资源的管理是一个 急需解决的问题。基于a s p 的网络化制造资源主要包括企业层、车间层、单元 层、工作站层和设备层资源,也就是所说的广义制造资源。”1 1 网络化制造资源包括满足中小制造企业开展网络化制造需求的共享信息 库、共享资源库、基础数据库等,同时也包括制造资源的分类、描述、评价、 搜索等。网络化制造资源信息主要包括4 类信息:基础信息、能力信息、业绩 信息和辅助信息等。n 8 1 1 ) 基础信息 基础信息主要是指网络化制造a s p 平台中会员企业注册时,所必须提供的 基本信息。当定单企业( 盟主) 登录a s p 平台进行项目招标时,面对众多的制 造资源,选择的首要问题是将可选范围缩小,企业基础信息为定单企业发投标 4 贵州大学顽二 研究生毕业论文网络制造资源多层次智能检索模型的研究 邀请提供了评价信息。企业基础信息主要包括描述企业的大概情况的一些信息, 如企业的开业登记信息、变更登记信息、营业执照年检情况、税务登记信息、 设立登记信息、财务状况、人员构成、概要信息的评价确定企业是否有基本的 资格参加该项目的投标。 2 ) 能力信息 能力信息是网络化制造投标企业在参与该项目投标时技术能力与加工能力 的描述,它可以通过技术储备信息、产品信息、工艺能力信息、设备能力信息 等进行描述。其中技术储备信息是企业开展产品创新设计、同步设计及超f i 仃设 计能力的体现:产品信息是企业制造能力的直观体现;设备信息是企业制造能 力的基础,反映企业的潜在生产能力。 3 ) 业绩信息 业绩信息主要表现在企业的以往市场情况,包括产品的市场情况、产品质 量信息、售后服务信息和信誉度等信息等。其中市场情况可用该企业主流产品 市场占有率、销售金额、以往参与网络化制造中标情况,中标合同执行情况等 进行描述;质量信息可用合格率、退货率、返工率等信息来表达;售后服务信 息可用提供有效售后服务能力、交流与反馈能力、市场销售网络能力、技术支 持能力等来描述;信誉度包括按期交货、按质交货等情况信息。 4 ) 辅助信息 辅助信息作为对网络化制造投标企业基础信息、能力信息、业绩信息的补 充,在计算机评标或专家评标时也具有重要的参考价值。辅助信息主要包括企 业组织与管理模式、标准化信息、质量认证体系情况等。 1 4 网络检索工具介绍 随着因特网的迅猛发展、w e b 信息的增加,用户要在信息海洋里查找信息, 就象大海捞针一样,搜索引擎技术恰好解决了这一难题( 它可以为用户提供信 息检索服务) 。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、 开发的对象。因此,在m a t t h e wg r a y 的w a n d e r e r 基础上,开发者将传统的 “s p i d e r ”程序工作原理作了些改进,指导思想是所有网页都可能有连向其他 网站的链接,则从跟踪一个网站的链接开始,就有可能检索整个互联网。到1 9 9 3 年底,一些基于此原理的搜索引擎开始纷纷涌现,其中以j u m p s t a t i o n 、t h e 贵州大学顾i :研究生毕业论义嘲络制造资源多层次智能检索模型的聊f 究 w o r l dw i d ew e bw o r m ( g o t o 的前身,也就是今天o v e r t u r e ) ,和r e p o s i t o r y b a s e d s o f t w a r ee n g i n e e r i n g ( r b s e ) s p i d e r 最负盛名。 搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、 组织和处理,并为用户提供检索服务,从而起到信息导航的目的。搜索引擎提 供的导航服务已经成为互联网上非常重要的网络服务,搜索引擎站点也被美誉 为“网络门户”。搜索引擎技术因而成为计算机工业界和学术界争相研究、开 发的对象。随着互联网规模的急剧膨胀,一家搜索引擎光靠自己单打独斗已无 法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工执作,并有了 专业的搜索引擎技术和搜索数据库服务提供商。象国外的i n k t o m i ,它本身并不 是直接面向用户的搜索引擎,但向包括o v e r t u r e 、l o o k s m a r t 、m s n 、h o t b o t 等 在内的其他搜索引擎提供全文网页搜索服务。国内的百度也属于这一类,搜狐 和新浪用的就是它的技术。因此从这个意义上说,它们是搜索引擎的搜索引擎。 1 4 1 搜索引擎的分类 搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎( f u l lt e x t s e a r c he n g i n e ) 、目录索引类搜索引擎( s e a r c hi n d e x d i r e c t o r y ) 和元搜索 引擎( m e t as e a r c he n g i n e ) 0 1 。 ( 1 ) 全文搜索引擎 由一个称为蜘蛛( s p i d e r ) 的机器人程序以某种策略自动地在互联网中搜 集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询 输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索 服务。该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返 回信息过多,有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的 代表是:a 1 t a v i s t a 、n o r t h e r n l i g h t 、e x c i t e 、i n f o s e e k 、i n k t o m i 、f a s t 、l y c o s 、 g o o g l e ;国内代表为:“天网”、悠游、o p e n f i n d 等。 ( 2 ) 目录索引 目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅 仅是按目录分类的网站链接列表而己。用户完全可以不用进行关键词 ( k e y w o r d s ) 查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表 性的莫过于大名鼎鼎的y a h o o 雅虎。其他著名的还有o p e nd i r e c t o r yp r o j e c t 贵州大学顾七研究生毕业论文 州络制造资源多层次智能检索模型的研究 ( d m o z ) 、l o o k s m a r t 、a b o u t 等。国内的搜狐、新浪、网易搜索也都属于这一 类。 ( 3 ) 元搜索引擎( m e t as e a r c he n g i n e ) 元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将 结果返回给用户。著名的元搜索引擎有i n f o s p a c e 、d o g p i l e 、v iv i s i m o 等( 元 搜索引擎列表) ,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排 列方面,有的直接按来源引擎排列搜索结果,如d o g p i l e ,有的则按自定的规则 将结果重新排列组合,如v iv i s i m o 。 1 4 2 搜索引擎基本工作原理 ( i ) 全文搜索引擎 在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数 据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔 一段时间( 比如g o o g l e 一般是2 8 天) ,搜索引擎主动派出“蜘蛛”程序,对 一定i p 地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网 站的信息和网址加入自己的数据库。 另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一 定时间内( 2 天到数月不等) 定向向你的网站派出“蜘蛛”程序,扫描你的网站 并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生 了很大变化,主动提交网址并不保证你的网站能进入搜索引擎数据库,因此目 前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将 你的网站收录。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到 与用户要求内容相符的网站,便采用特殊的算法通常根据网页中关键词的 匹配程度,出现的位置频次,链接质量等计算出各网页的相关度及排名等 级,然后根据关联度高低,按顺序将这些网页链接返回给用户。 ( 2 ) 目录索引 与全文搜索引擎相比,目录索引有许多不同之处。 贵州大学硕 研究生毕业论文 网络制造资源多层次智能检索模型的研究 首先,搜索引擎属于自动网沾检索,而且录索引则完全依赖手工操作。用 户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判 标准甚至编辑人员的主观印象,决定是否接纳你的网站。 其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都 能登录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定 成功。尤其象y a h o o ! 这样的超级索引,登录更是困难。( 由于登录y a h o o ! 的难 度最大,而它又是商家网络营销必争之地,所以我们会在后面用专门的篇幅介 绍登录y a h o o 雅虎的技巧) 此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目 录索引时则必须将网站放在一个最合适的目录( d i r e c t o r y ) 。 最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以 用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写 网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网 站的目录、网站信息不合适,他可以随时对其进行调整“。 目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用 户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找“。如以关键 词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不 过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是 由标题字母的先后顺序决定( 也有例外) 。 目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文 搜索引擎现在也提供目录搜索,如g o o g l e 就借用o p e nd i r e c t o r y 目录提供分 类查询。而象y a h o o ! 这些老牌目录索引则通过与g o o g l e 等搜索引擎合作扩大 搜索范围“3 “1 。在默认搜索模式下,一些目录类搜索引擎首先返回的是自己目 录中匹配的网站,如国内搜狐、新浪、网易等;而另外一些则默认的是网页搜 索,如y a h o o 。 1 5 国内外研究现状 目前,国内外一些科研部门、高等院校、商业公司都在对智能化网络信息 检索进行研究,并且已经开发出了一系列成功的产品。 ( 1 ) a r t h u ra n d e r s e n 的内嵌特定领域知识和使用推断( 证明式自然语言理解技 贵州大学硕士研究生毕业论文 删络制造资源多层次智能检索模型的研究 术) 的f s a 和e 1 0 i s e 系统。 ( 2 ) i b m 的基于规则和知识,使用启发的策略和简单自然语言的g l o b e n e t 系统。 ( 3 ) 芝加哥大学开发的基于“问题库”的具体问答功能的智能搜索引擎 f a q f i n d e r 。 ( 4 ) 美国卡耐基一梅隆大学的基于机器学习的智能系统w e b w a t c h e r 。 ( 5 ) 美国m i t 大学开发的l e t i z i a 系统。 ( 6 ) 瑞典s i c s 实验室的p u s h 系统。 ( 7 ) c m u 的基于用户查询行为和兴趣的寻找特定信息的专用智能软件w e d o g g i e 。 ( 8 ) 南京大学研制的w e b a c c e s s 系统,它应用了机器学习、自然语言处理、超 文本等技术。 ( 9 ) 清华大学研制的p i n s 系统和b o o k m a r k 系统,它们能自动收集和记录用户 的习惯和兴趣,跟踪用户的信息需求。 ( 1 0 ) 首信采用的“以网对网”技术的智能搜索引擎。 ( 1 1 ) 浙江大学瞿海斌、王祥君、程翼宇等人针对现有中医药信息检索中存在 的某些问题,将基于词表的扩展检索、相似性检索等方法与数据挖掘技术相结合 提出了一类智能化中医药信息检索系统的构建思想,据此建立了相应的智能检 索系统 但国内的智能网络信息搜索系统大多只是支持简单的自然语言理解和概念 检索,对机器学习、智能代理、信息挖掘等技术的研究很少。 1 6 论文结构 本文主要由七个写作章节构成,其中第二、三、四、五章为本文的核心部分, 讲述了本系统的总体构架和相关关键技术。具体的每个章节的主要内容如下: 第一章绪论 第二章系统总体构架 第三章检索系统知识库设计 第四章基于用户兴趣挖掘推送机制 第五章基于动态联盟的伙伴企业检索 第六章系统其他功能模块介绍 第七章结论和进一步工作 贵州大学硕l 研究生毕业论文 网络制造资源多层次智能腧索模型的研究 第二章系统总体构架 2 1 网络化制造资源检索模式 网络化制造系统是一种面向区域、行业及产业链的信息系统模式,能促进 制造资源的优化与整合,形成具有竞争力的供应链、产业链、增值链。网络化 制造资源包括满足中小制造企业开展网络化制造需求的共享信息库、共享资源 库、基础数据库等,同时也包括制造资源的分类、描述、评价、搜索等。有效 而准确的检索制造资源是实现网络化制造必备条件之一“1 。然而,目前由制 造资源具有动态性、海量性、模糊性等特征,信息系统难以获取主题信息需求、 难以将信息需求转化为查询表示、通用搜索引擎相关性排名体系难以满足精确 检索制造资源的主题要求等。 网络化制造动态联盟作为一种崭新的企业组织模式,是企业进行生产和市 场竞争的主要模式,建立动态联盟的一个关键环节是选择敏捷的、具有竞争力 和相容企业文化的合作伙伴“7 ”1 ,因此,研究动态联盟中的制造资源检索与评 价策略与方法,具有很强的理论和现实意义,能否检索到合适的制造资源直接 关系到动态联盟合作效果和成败。 网络化制造资源检索是网络化制造的一个重要组成内容,是面向区域内制 造资源的检索方式。网络化制造资源检索就是通过计算机检索系统,使企业能 够快速、准确地寻找到分布在不同地点的制造资源,并高效地使用这些资源, 是开放制造资源模式的一种实现。 实现网络化制造资源检索的计算机软件系统称为网络化制造资源检索系统。 我国制造资源密集,制造力量较强,但是各行业、各部门都自成体系,区域内 制造资源往往重复投资,而现有资源利用率却不高,资源浪费现象严重。具体 表现在一些大型企业具有较雄厚的制造资源,如设备、软件、人力等等,而这 些资源由于各种原因未能得到充分利用,同时,一些中小型企业却因缺乏这些 资源而丧失市场竞争能力“。中小型企业不得不在购置昂贵的设备或者软件与 放弃市场之间做出选择,而任何一种选择都不利于企业的发展。因此,有效的 制造资源检索系统在我国有着尤为重要的作用。 0 贵州大学硕上研究生毕业论文 网络制造资源多层次智能陵索模型的研究 在网络化制造的制造资源搜索中,研究多层次信息智能检索模型,用户可 以一种统一的查询方式进行检索,系统内部处理过程对用户完全透明。该检索 模型可以分为四个层次,其智能化程度逐级递增,依次分别为: ( 1 ) 精确检索:实现与用户查询需求进行精确匹配的检索功能,并用于相 关实例信息处于分布状态的跨页面检索。 ( 2 ) 语义检索:能检索与用户查询中所表达的概念具有同义、上下位等语 义关系的实例信息。 ( 3 ) 模糊检索:可以接受用户查询中的模糊量,能检索与用户查询相符的 实例信息。 ( 4 ) 智能推理:能根据用户查询所表达的蕴涵信息进行检索。 上述各种检索技术并不互相排斥,是一种相辅相承的关系,如图2 - l 所示。 通过模糊扩展,对模糊查询量精确化,在此基础上根据语义信息,实现语义扩 展( 包括同义扩展、语义蕴涵、语义外延和语义联想等) ,采用精确匹配与智能 推理相结合,最终完成检索任务。 图2 - 1 网络化制造的制造资源搜索模型 2 2 网络化制造资源搜索系统的特点 网络化制造资源检索系统与传统搜索引擎相比,虽都是面向i n t e r n e t 环境 下异地异构信息的搜索,但由于网络化制造的制造资源本身的特点和用户的特 殊要求,以及考虑到网络化制造资源评价和动态联盟等多方面的因素,使得网络 化制造的制造资源检索系统和传统搜索引擎相比存在较大的差别,如表2 2 所 示。网络化制造资源搜索要求如下: 网络化制造资源检索系统的结构要求:由于网络化制造资源是广义的制造 资源,依次从大到小主要包括企业层、车间层、单元层、工作站层和设备层5 个层次的制造资源。因此,本系统要求具有能够检索到不同层次的制造资源, 贵州大学硕士研究生毕业论文网络制造资源多层次智能检索模型的研究 在结构设计时就从企业层、车间层、单元层、工作站层和设备层5 个层次上来 考虑。 表2 - i网络化制造资源搜索系统与传统搜索系统的性能对比表 基于a s p 网络化制造资源搜索系统 传统搜索引擎 搜索区域 i n t e r n e t 和网络化制造的制造资只有i n t e r n e t 源信息库 主要搜索目标网络化制造资源 任何包含检索词的网络信息 搜索目标层次企业层、车间层、单元层、工作站 不分层 层和设备层资源5 个层次 检索方式目标搜索方式过程检索和信息挖掘 信息处理方式首先进行信息规范化处理,然后根 只根据相关性进行排名,不进行任 据相关性进行排名何预处理 结果反馈精确和统一格式的制造资源信息大量的各式各样的i n t e r n e t 信息 表,以及信息推送装置的自动推送 信息 网络化制造资源检索系统对信息搜索的能力有着特殊的要求:多样化异 构信息搜索的能力。要求信息搜索系统能从i n t e r n e t 和本地数据库多样化的信 息中访问和搜索相关的信息,要求具备处理异构信息的能力。分布式信息搜索 的能力。要求虚拟企业的信息搜索系统具备对分布式信息源搜索的能力。异 构信息的统一性。不同虚拟企业成员的信息存在结构的多样性,而对用户而言需 要以一种统一的表达方式,因此要求信息搜索系统具备将检索到的信息进行抽 象并转换成统一通用的表示即异构信息统一化的能力。异构信息的集成性。 要求系统将已通用化表示的数据通过匹配关键词加以集成。 网络化制造资源检索系统对信息搜索的结果要求如下:信息的准确性要 求。用户的信息搜索范围是固定的,要求比传统的搜索引擎有更精确的搜索结 果。信息的关联性。传统的搜索引擎的反馈结果往往是大量散乱的无关信息, 而虚拟企业信息搜索要求反馈的信息之间存在关联性,从而便于用户从一系列 有序的信息中分析归纳总结。”检索范围的要求:网络化制造资源检索系统 仅仅搜索的结果都是网络化制造资源,而传统搜索引擎搜索的结果是包含检索 贵州大学硕士研究生毕业论文网络制造资源多层次智能检索模型的研究 词的任意网络信息。 网络化制造资源检索系统对信息搜索的模式要求:不同用户对信息搜索的 要求不周,因此虚拟企业的信息搜索系统应该能体现和满足不同用户的检索要 求,并能根据不同用户的操作模式准确反馈用户所需的信息。可见,基于w w w 的 虚拟企业产品信息搜索比传统w w w 搜索要求更高,但其一个优势在于搜索的范围 是确定的,因此可以通过建立以产品信息为纽带组成的临时动态关系,围绕产品 相关的信息发现内在的关联规则。 2 3 系统框架结构 网络化制造资源智能化检索系统是面向网络制造资源专业领域主题搜索引 擎,它通过建立相对固定的网络地址集合和制造资源检索知识库,根据一定的 检索算法和有选择性的抓取网络信息。该搜索引擎与普通搜索引擎的最大差别 就是有选择性的抓取信息,而并非遍历w e b 。该系统建立了个性化的知识推送模 块,使用智能化复杂的决策与推理反馈机制,使用户不必再次访问固定的站点 就能获取所关注的最新的制造资源信息,如图2 2 所示。 图2 - 2 智能检索系统结构 2 3 1 用户界面 用户登录到个性化搜索引擎网站,通过身份确认后,系统的用户知识库开 贵州大学硕士研究生毕业论文 刚络制造资源多层次智能检索模型的研究 始收集用户的基本情况,在检索界面输入检索词后,系统开始接受检索请求, 并跟踪用户的行为( 收集的信息一般包括用户点击的u r l ,s e a r c h 的关键字、表 单填写的情况、访问信息的类型等) ,然后进行用户信息的预处理和归一化,更 新、存储用户知识库。如果用户无法描述检索需求,可以通过用户检索界面的 分类检索列表来进行检索。整个用户界面的核心是用户模式特征提取模块。我 们认为用户对搜索软件的使用过程中所体现的个性可以“用户操作特征”的形 式体现出来,具备使用个性的重要前提之一是,它必须具备特征抽取或识别能力 而这些能力的实现又依赖于对用户操作数据的记录、存储、统计和分析。从数 据挖掘的研究角度看,从操作数据中提取用户操作特征实际上是一个从大量数 据中挖掘特定模式的过程,这个过程是在用户的参与下反复迭代递归化的过程, 我们可以归纳为用户操作模式特征的提取和知识表达、用户操作模式特征的分 析、信息搜索的自适应调整。查询界面模块接受并分析用户输入的初始查询信 息,用户特征提取模块记载和提取用户操作特征语义信息。 用户在注册时首先将自己的个人喜好、知识侧重进行手工输入,通过用户 的手工输入信息,为用户建立初级个性化模型,即将用户输入的主题词,主题 站点等信息加入到用户词典中,对其用户个性化模式数据库进行初始化。这种 方式能让用户首次使用系统就可获得个性化的知识服务。对于用户模式特征提 取模块而言,实现信息导引的关键技术在于信息分类知识的建立,实现相关性回 馈的关键技术在于对获取信息分析的精确度。由于触发感知是通过用户界面的 操作实现的,因此在制造资源智能化检索系统围绕网络化制造资源检索这样一 个核心,建立了多路径多层次的网络化制造资源信息分类以及相应的信息导引 关系,从而可以根据用户的操作过程获得精确的用户制造资源检索意图,由此可 以实现信息搜索的自适应调整,以最大程度地满足用户的检索需求。 2 3 2 信息采集子系统 信息采集子系统依据知识库限定的规则对用户查询需求进行分析,并进行 搜索。进行局部搜索和全局搜索判断,如果是局部搜索,确定搜索的信息源并针 对不同信息源采用相应的算法完成局部搜索,如果是全局搜索,在完成上述操作 的同时,触发远程搜索请求发送接收模块:远程搜索请求发送接收模块根据虚 拟信息库的注册信息,向异地企业成员搜索子系统发出搜索请求或接受异地搜 1 4 贵州大学硕士研究生毕业论文 网络制造资源多层次智能检索模型的研究 索子系统发出的搜索请求。远程搜索请求发送接收模块是根据搜索对象搜索算 法选择模块发出的请求,当本地搜索不能满足用户需求时,触发远程搜索。该模 块使系统可以向远程异地的搜索引擎发出要求,同时也可以接收远程异地的搜 索请求,并将请求交给本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 心理治疗策略方案研究总结制定方案调整规划实施规划
- 仪表工业安全管理手册
- 石化企业应急预案制定
- 会议组织制度
- 动画制作流程总结
- 企业级员工税务与财务服务协议
- 那一天我感受到了真情抒情作文14篇范文
- 办公文件管理电子化存档及检索模板
- 文化创意产业品牌承诺书(8篇)
- 专业人士保险购买及服务协议
- 机电设备安装材料采购流程及计划
- SYT 7653-2021 石油天然气钻采设备 耐蚀螺栓连接
- 教科版科学四年级上册第一单元《声音》大单元整体教学设计
- 幼儿园领域课程指导丛书:幼儿园美术领域教育精要关键经验与
- 贷款营销思路及措施
- 粤绣行业发展前景分析报告
- 高速公路施工方案安全评价报告
- 稀土知识讲座
- 河道堤防冲刷深度计算(新规范)
- 世界现代化理论
- 消防校外机构培训课件
评论
0/150
提交评论