(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf_第1页
(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf_第2页
(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf_第3页
(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf_第4页
(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf_第5页
已阅读5页,还剩68页未读 继续免费阅读

(计算机应用技术专业论文)电子商务语义搜索研究与应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

y 1 燃嶝 ad i s s e r t a t i o ns u b m i t t e dt og u a n g d o n gu n i v e r s i t yo ft e c h n o l o g y f o rt h ed e g r e eo fm a s t e ro fe n g i n e e r i n gs c i e n c e r e s e a r c ha n d a p p l i c a t i o no fe - c o m m e r c e s e m a n t i cs e a r c h m a s t e rc a n d i d a t e :z h a n gy u q i n s u p e r v i s o r :p r o f l iz h e n k u n m a y2 0 10 f a c u l t yo fc o m p u t e r g u a n g d o n gu n i v e r s i t yo ft e c h n o l o g y g u a n g z h o u ,g u a n g d o n g ,p r c h i n a ,5 1 0 0 0 6 摘要 摘要 万维网的诞生改变了人们彼此交流方法以及商业运作的模式。随着万维网的飞 速发展和广泛应用,w e b 上的信息变得愈来愈膨大,在这前提下,w e b 信息搜索系 统也变得越来越重要。传统的搜索手段是在信息的语法层次上,采用基于简单关键 字匹配的方法对信息进行搜索。在面对如此海量的w e b 信息面前,此方法变得越来 越无能为力,其缺陷也逐渐暴露出来。如何摆脱传统的仅停留在语法层次上的搜索 手段,设计一系列计算机可理解的语义表达形式,并支持语义知识网络的有效推理, 让机器能够实现对信息语义理解,实现语义搜索已经成为一个搜索领域很有挑战性 的研究课题。语义网的出现为解决这些问题带来了很好的支持。 语义网( s e m a m i cw e b ) 能够对信息语义描述提供良好的支持,使得w e b 上的信 息具有计算机可理解的语言,满足智能软件代理对万维网上异构、分布式和海量的 信息的有些访问和智能搜索。作为语义网的核心组成部分,本体具有良好的概念层 次结构和逻辑推理的支持性质,使得能够通过概念之间的关系来表达概念的语义, 最终实现语义信息表示、语义推理。 本文首先对传统的搜索技术进行了分析研究,发现导致当前搜索搜索质量低下 的根本原因在于传统的搜索技术都是基于语法层次上的匹配搜索,缺乏对信息的语 义理解。随着搜索技术的发展,此问题依然没有得到很好的解决。基于此原因,本 文深入研究了国内外对于这一问题的解决办法的研究现状,并探讨了采用新技术改 变这一现状的迫切性和可行性;接着,深入分析研究了语义网技术。包括他的定义、 框架体系结构、描述语言等。并重点分析了语义网的技术优势和应用现状。语义网 作为下一代互联网,其诞生的目的旨在让拥有丰富语义计算机信息能被机器理解, 并最终实现机器可以自动处理语义信息的能力。随着语义网技术研究的不断深入, 其已变得应用越来越广泛;然后,本文在结合语义技术的基础上,深入探讨了实现 电子商务语义搜索所需的关键技术。包括:语义提取技术、领域本体构建方法、本 体语义推理技术等,并重点研究了语义领域本体的设计和实现方法;最后,本文针 对传统电子商务搜索的无法理解信息语义的不足这一问题,将语义网技术引入电子 商务搜索领域,在成功设计实现电子商务领域本体的基础上,设计了基于电子商务 广东工业大学硕士学位论文 语义搜索系统,最后结合本体推理技术研究实现对电子商务信息的语义搜索。 关键词:电子商务;语义网;本体;语义搜索 a b s t r a c t a b s t r a c t t h eb i r t ho ft h ew o r l dw i d ew e bc h a n g e dt h ew a y sp e o p l es h a r ew i t he a c ho t h e ra n d t h em o d eo fb u s i n e s so p e r a t i o n s w i t ht h ew o r l dw i d ew e b sr a p i dd e v e l o p m e n ta n d w i d ea p p l i c a t i o n , w e bo nt h ei n f o r m a t i o nb e c o m e sm o r ea n dm o r es w o l l e n ,a n di nt h i s c o n t e x t ,w e bi n f o r m a t i o ns e a r c hs y s t e m sa r ea l s ob e c o m i n gi n c r e a s i n g l yi m p o r t a n t o n l y t h es y n t a xl e v e l ,b a s e do ns i m p l ek e y w o r dm a t c h i n gm e t h o d so ft r a d i t i o n a li n f o r m a t i o n s e a r c ht e c h n o l o g yi nf a c eo fs u c hv a s ta m o u n t so fw e bi n f o r m a t i o nb e f o r e ,b e c o m em o r e a n dm o r ep o w e r l e s s ,t h ed e f e c t sa r eg r a d u a l l ye x p o s e d h o wt og e tr i do fs e a r c ht o o l so n t h el e v e l so fg r a m m a r , d e s i g nas e r i e so fc o m p u t e r - r e a d a b l ef o r mo fs e m a n t i c r e p r e s e n t a t i o na n ds e m a n t i ck n o w l e d g en e t w o r k st os u p p o r te f f e c t i v er e a s o n i n g ,8 0t h e m a c h i n ec a nr e a l i z et h es e m a n t i cu n d e r s t a n d i n go fi n f o r m a t i o nt oa c h i e v es e m a n t i c s e a r c hh a sb e c o m eas e a r c hv e r yc h a l l e n g i n gr e s e a r c ht o p i ca r e a s t h ee m e r g e n c eo ft h es e m a n t i cw e bt os o l v et h e s ep r o b l e m ss o m ev e r yg o o d s u p p o r t s e m a n t i cw e b ,a i m e da tc h a n g i n gt h i ss i t u a t i o n ,m a k i n gi n f o r m a t i o no nt h e w e bw i t hac o m p u t e r - r e a d a b l el a n g u a g e ,t om e e tt h ei n t e l l i g e n ts o f t w a r ea g e n t so nt h e w o r mw i d ew e b ,h e t e r o g e n e o u s ,d i s t r i b u t e d ,a n ds o m ea c c e s st ov a s ta m o u n t so f i n f o r m a t i o na n di n t e l l i g e n c es e a r c h a sac o r ec o m p o n e n to ft h es e m a n t i cw e b ,h a sa g o o ds u p p o r ts t r u c t u r ea n dt h en a t u r eo fl o g i c a lr e a s o n i n g ,s o a b l et oe x p r e s st h e r e l a t i o n s h i pb e t w e e nt h ec o n c e p to ft h es e m a n t i cc o n c e p t ,a n du l t i m a t e l y s e m a n t i c i n f o r m a t i o nt h a tt h i sf e a t u r ec a nb ev e r yg o o du s e di n f o r m a t i o no ns e m a n t i cs e a r c h f i r s t l y , t h et r a d i t i o n a ls e a r c ht e c h n i q u e sa n a l y z e d ,a n dd i s c o v e r i e sh a v el e dt ol o w q u a l i t yo f c u r r e n ts e a r c hb e c a u s et h es e a r c ht e c h n o l o g yi st r a d i t i o n a lg r a m m a r - l e v e l b a s e ds e a r c h ,t h el a c ko fr i g h ti n f o r m a t i o no nt h es e m a n t i c so fu n d e r s t a n d i n g w i t ht h e d e v e l o p m e n to fs e a r c ht e c h n o l o g y , t h i si s s u eh a sn o tb e e ns o l v e d f o rt h i sr e a s o n , t h i s i n d e p t hs t u d ya th o m ea n da b r o a df o rt h es o l u t i o nt ot h ep r o b l e mo ft h es t a t u sa n d e x p l o r e n e wt e c h n o l o g i e st oc h a n g et h eu r g e n c yo ft h i ss i t u a t i o na n df e a s i b i l i t y ; i i i 广东工业大学硕士学位论文 s e c o n d l y , t h ei n d e p t ha n a l y s i so ft h es e m a n t i cw e bt e c h n o l o g y i n c l u d i n gh i sd e f i n i t i o n o ft h e 丘a m e w o r ka r c h i t e c t u r e ,d e s c r i p t i o nl a n g u a g e a n da n a l y z e dt h ea d v a n t a g e so f s e m a n t i cw e bt e c h n o l o g i e sa n da p p l i c a t i o ns t a t u s s e m a m i cw e ba st h en e x ti n t e r n e t ,t h e p u r p o s eo ft h eb i r t ho ft h ec o m p u t e rt oh a v ear i c hs e m a n t i ci n f o r m a t i o nt h a tc a r lb e m a c h i n eu n d e r s t a n d i n g ,a n du l t i m a t e l yt h em a c h i n ec a na u t o m a t i c a l l yh a n d l et h e s e m a n t i ci n f o r m a t i o n w i t ht h es e m a n t i cw e bt e c h n ol o g yd e e p e n i n g ,i th a sb e c o m e w i d e l ya p p l i e d ;t h i r d ,t h i sp a p e rc o m b i n e ss e m a m i ct e c h n o l o g yb a s e do nt h ed e p t h r e q u i r e dt oa c h i e v et h ek e ye c o m m e r c es e m a m i cs e a r c ht e c h n o l o g y i n c l u d i n g :s e m a m i c e x t r a c t i o n ,d o m a i no n t o l o g yc o n s t r u c t i o nm e t h o d ,o n t o l o g yr e a s o n i n gt e c h n i q u e sw i t ha n e m p h a s i so n t h es e m a n t i cd o m a i no n t o l o g yd e s i g na n di m p l e m e n t a t i o nm e t h o d s ;f i n a l l y , t h et r a d i t i o n a le - c o m m e r c es e a r c hc a nn o tu n d e r s t a n dt h i sl a c ko fi n f o r m a t i o ns e m a n t i c p r o b l e m ,s e m a n t i cw e bt e c h n o l o g i e si n t oe c o m m e r c es e a r c hf i e l d ,d e s i g n e dt oa c h i e v e as u c c e s s f u le - b u s i n e s sd o m a i no n t o l o g yb a s e do nt h ed e s i g no fs e m a n t i cs e a r c hs y s t e m b a s e do ne - c o m m e r c e ,o n t o l o g yr e a s o n i n gf i n a l l y , e c o m m e r c ei n f o r m a t i o nt e c h n o l o g y t oa c h i e v et h es e m a n t i cs e a r c h k e y w o r d s :e l e c t r o n i cc o m m e r c e ;s e m a n t i cw e b ;o n t o l o g y ;s e m a n t i cs e a r c h i v 目录 目录 摘要i a b s t r a c t i i i 第一章绪论1 1 1 选题背景1 1 2 国内外研究现状分析2 1 3 论文的研究内容4 1 3 1 研究的内容4 1 3 2 本文特色5 1 4 论文组织结构5 第二章语义网技术基础6 2 1 语义网6 2 1 1 语义网概述6 2 1 2 语义网体系结构6 2 1 3 语义网特征8 2 2 本体理论8 2 2 1 本体定义8 2 2 2 本体描述语言- o w l 9 2 2 3 本体应用1 2 2 3j e n a 语义网框架1 2 2 3 1j e n a 简介1 2 2 3 2j e n a 推理技术1 3 2 3 3j e n aa p i 结构1 4 第三章电子商务语义搜索关键技术研究1 6 3 1 语义分词技术1 6 3 1 1 中文分词1 6 3 1 2 分词算法1 6 v 广东工业大学硕士学位论文 3 1 3 分词词典1 7 3 2 领域本体构建研究1 8 3 2 1 本体构建原则1 8 3 2 2 本体设计方法1 9 3 2 3 本体信息获取2 0 3 2 4 本体构建工具2 1 3 3 5 领域本体构建研究2 3 3 3 语义推理技术2 8 3 3 1 语义推理基础2 8 3 3 2 本体推理机的理论基础2 8 3 3 3 本体推理机的体系结构2 9 第四章电子商务语义分析与研究3 l 4 1 电子商务语义搜索介绍3 1 4 2 电子商务语义搜索需求分析3 l 4 3 电子商务语义搜索功能分析3 2 4 3 1 用户搜索接口需求分析3 2 4 3 2 搜索预处理功能分析3 2 4 3 3 信息语义化功能分析3 2 第五章电子商务语义搜索的应用研究3 4 5 1 电子商务语义搜索基本框架3 4 5 2 电子商务语义搜索功能结构3 5 5 3 搜索预处理模块的设计3 6 5 3 1 用户接口设计3 6 5 3 2 用户查询预处理3 7 5 4 设计本体- 3 9 5 5 本体推理方式4 4 5 6 本体存储方案及实现4 5 5 6 1 存储方案设计原则4 5 5 6 2 文件系统存储方案4 5 v t 目录 5 6 3 关系数据库系统存储方案4 6 5 7 本体数据采集4 9 5 8 案例研究5 0 第六章结论与展望5 3 6 1 本文总结5 3 6 2 进一步工作5 4 参考文献5 5 攻读硕士学位期间发表的论文5 8 独创性声明5 9 致谢6 0 v i i 广东工业大学硕士学位论文 c o n t e n t s a b s t r a c t ( c h i n e s e ) i a b s t i 硷c t i i i c h a p t e r1i n t r o d u c t i o n 1 1 1r e s e a r c hb a c k g r o u n d 1 1 2t h er e s e a r c hs t a t u s : 1 3t h em e a n i n ga n dc o n t e n to ft h er e s e a r c h 4 1 3 1t h em e a n i n go ft h er e s e a r c h 4 1 3 2t h ec o n t e n to ft h er e s e a r c h 5 1 4o r g a n i z a t i o no ft h et h e s i s 5 c h a p t e r2t h es e m a n t i cw e b ( ; 2 1t h es e m a n t i cw e b 6 2 1 1s e m a n t i cw e bo v e r v i e w 6 2 1 2s e m a n t i cw e ba r c h i t e c t u r e 6 2 1 3s e m a n t i cw e bf e a t u r e s 8 2 2 o n t o l o g y 8 2 2 1o n t o l o g yd e f i n i t i o n 8 2 2 2o n t o l o g yl a n g u a g e o w l 9 2 2 3o n t o l o g ya p p li c a t i o n 1 :1 2 3j e n as e m a n t i cw e bf r a m e w o r k 1 : 2 3 1j e n ai n t r o d u c t i o n 1 : 2 3 2j e n ar e a s o n i n g 1 3 2 3 3j e n aa p is t r u c t u r e 1 4 c h a p t e r3t h ek e yt e c h n o l o g i e sr e s e a r c h 1 6 3 1s e m a n t i cs e g m e n t a t i o n 1 6 3 1 1c h i n e s ew o r ds e g m e n t a t i o n 1 6 3 1 2s e g m e n t a t i o na l g o r i t h m 1 6 3 1 3w o r dd i c t i o n a r y 乙1 7 v l i l c o n t e n t s 3 2o n t o l o g yc o n s t r u c t i o n 1 8 3 2 1o n t o l o g yc o n s t r u c t i o np r i n c i p l e s 1 8 3 2 2o n t o l o g yd e s i g n 1 9 3 2 3o n t o l o g ya c c e s st oi n f o r m a t i o n 2 0 3 2 4o n t o l o g yc o n s t r u c t i o nt o o l s 2 1 3 3 5t h ed o m a i no n t o l o g yc o n s t r u c t i o n 2 3 3 3s e m a n t i cr e a s o n i n g 2 8 3 3 1t h eb a s i so fs e m a n t i cr e a s o n i n g 2 8 3 3 2o n t o l o g yi n f e r e n c et h e o r y 2 8 3 3 3o n t o l o g yi n f e r e n c ee n g i n ea r c h it e c t u r e 2 9 c h a p t e r4a n a l y s i sa n dr e s e a r c ho fs e m a n t i ci ne c o m m e r c e 3 1 4 1i n t r o d u c t i o n 3 1 4 2t h er e q u i r e m e n ta n a l y s i s 3 1 4 3f u n c t i o n a la n a l y s i s 3 2 4 3 1u s e rs e a r c hi n t e r f a c er e q u i r e m e n t sa n a l y s i s 3 2 4 3 2s e a r c hp r e p r o c e s s i n ga n da n a l y s i s 3 2 4 3 3s e m a n t i cf e a t u r e so fi n f o r m a t i o n 3 2 c h a p t e r5r e s e a r c ha n da p p l i c a t i o no fs e m a n t i cs e a r c h 3 4 5 1t h eb a s i cs t r u c t u r e 3 4 5 2f u n c t i o n a ls t r u c t u r e 3 5 5 3t h ed e s i g no fs e a r c hp r e p r o c e s s i n g 3 6 5 3 1u s e ri n t e r f a c ed e s i g n 3 6 5 3 2p r e t r e a t m e n to fu s e rq u e r i e s 3 7 5 4d e s i g no n t o l o g y 3 9 5 5o n t o l o g yr e a s o n i n g 4 4 5 6o n t o l o g ys t o r a g es o l u t i o n 4 5 5 6 1d e s i g np r i n c i p l e so fo n t o l o g ys t o r a g e 4 5 5 6 2f i l es y s t e ms t o r a g es o l u t i o n s 4 5 5 6 3r e l a t i o n a ld a t a b a s es y s t e m ss t o r es o l u t i o n s 4 6 5 7o n t o l o g yd a t aa c q u i s i t i o n 4 9 i x 广东工业大学硕士学位论文 5 8c a s es t u d i e s 5 ( ) c h a p t e r6c o n c l u s i o na n do u t l o o k 5 3 6 1c o n c l u s i o n 5 3 6 2f u r t h e rw o r k j 5 4 r e f e r e n c e s 5 5 p a p e r sp u b l i s h e dd u r i n gt h em a s t e rd e g r e e 5 8 p r o m e t h e a nd e c l a r a t i o n 5 9 a c k n o w l e d g e m e n t 6 0 x 第一章绪论 1 1 选题背景 第一章绪论帚一早 三百下匕 自从万维网( w o r l d w i d e w e b ) 在上世纪8 0 年代建立以来,人类便进入了一个崭 新信息时代。伴随着互联网技术的迅速发展、计算机的普及,各种各样的互联网应 用层出不穷。随之而来的是i n t e r n e t 上w e b 信息空间呈几何级速度增长。为了帮助 人们在拥有海量数据的万维网上找到自己想要的信息,便诞生了基于关键字的搜索 引擎。通过基于关键字的搜索引擎,用户只需输入简单的目标关键字,搜索引擎便 可以在海量的数据库中,找出大量比较接近用户想要的相关信息数据。但是面对如 此巨大的信息库,仅仅基于语法层次上的传统的基于关键字的搜索引擎的面临严重 挑战。一方面是由于当代互联网先天性的缺陷:“结构简单、语义缺乏 导致搜索困 难;另一方面,因为互联网信息的异构性、易变性、非语义性等特点,使得用户越来 越难通过传统的搜索引擎从海量的数据中查找到自己需要的资源。于是互联网创始 人t i mb e r n e r s - l e e 于2 0 0 0 年1 2 月1 8 日在x m l 2 0 0 0 的会议上正式提出了语义网。 语义网的目标在于使得w e b 上的信息具有计算机可以理解的语义,它主要基于x m l 和r d f r d f s ,并在此之上构建本体和逻辑推理规则,以完成基于语义的知识表示和 推理,从而能够为计算机所理解和处理。语义网一经提出,就一直成为人们讨论和 研究的热点。由于语义网语义网具有对网络信息的“理解和处理 能力的优点,使 得语义网不单被看成是第三代w e b ,而且它的理论正被应用于越来越多的领域。 电子商务是互联网上的一个新兴行业,在计算机大量普及和信息技术发展的推 动下,近几年有了迅猛的发展。根据易观国际( a n a l y s y si n t e r n a t i o n a l ) 的0 8 年底 的研究数据表明,2 0 0 8 年第3 季度国内b 2 b 电子商务市场规模达到1 2 9 9 亿,同比 增长8 1 7 、环比增长5 8 ,其中内贸市场规模为5 7 亿,外贸市场7 2 9 亿。预计 2 0 0 8 年全年b 2 b 电子商务市场规模可以达到5 0 5 亿,比2 0 0 7 年增长4 0 2 。虽然 国内的电子商务规模如此大。但是当前的电子商务网站搜索给用户带来的体验却不 尽人意。主要体现在: 1 ) 大部分电子商务网站的搜索都是基于商品标题或商品描述的搜索,不能 广东工业大学硕士学位论文 有效的搜索商品的有关属性信息,一旦无法在商品标题或者商品描述中无法找到 相关关键字,则返回空记录给用户。如果是基于全文搜索,则往往返回很多不相 关的信息; 2 ) 在用户进行商品搜索的同时,要么没有相关信息的友好提示,要么就是 无语义关联的信息推荐; 3 ) 无法根据用户的搜索进行推理、延伸,挖掘用户潜在需求; 4 ) 只能支持关键字的搜索,不能有效的实现整句的搜索。即便当前的分词技术 已经相当完善,但是当前的搜索,仍然是基于关键字来搜索,不能进行句易理解搜 索,原因是当前的w e b 信息组织结构不能让计算机有效理解句子的语义。 1 2 国内外研究现状分析 随着信息化的发展,网络上的信息量也会倍增,如果缺乏有效的信息搜索手段, 最终必将影响网络的应用。当前的搜索方法主要有: 1 ) 利用基于关键字的搜索引擎,也可以称之为第一代搜索引擎和第二代搜索 引擎。 第一代搜索引擎是使用网站分类技术。通过把网站进行树状的归类,即对网站 分目录管理。登录的网站属于至少一个类别,对每个站点都有简略的描述。比较典 型例子的就是:雅虎最初的搜索引擎。通过此种方法,在当时万维网数据量相比当 前小得多的情况下,为用户搜索信息提供了便利、比较准备的搜索服务,这帮助雅 虎在互联网发展初期聚集了大量的用户。 第二代搜索引擎是使用全文检索技术,也即是当前绝大部分搜索引起采用的技 术。全文检索技术处理的对象是文本,它能够对大量文档建立由字( 词) 到文档的 倒排索引,在此基础上,用户使用关键词来对文档进行查询时,系统将给用户返回 含该关键词的网页。 第一、二代搜索引擎总结起来主要如下缺点: 第一代搜索引擎指主要依靠人工分拣的分类目录搜索,这种目录的划分过份依 赖于人为定义的好坏,同时这种方式是被动的搜索,更新慢、搜索能力不足,这些 缺点导致了第一代搜索引擎技术已经无法满足当前互联网发展的需要,基本已经被 淘汰。 基于全文检索的第二代搜索引擎在g o o g l e 的带动下,经过近十年的发展, 已经发展相当成熟,无论在搜索结果的数量上,还是搜索结果的质量上都有质的飞 2 第一章绪论 跃。但是由于本身万维网上的数据绝大部分是h t m l 语言所写,其结构过于简单, 内容之间缺乏语义相关性,导致了在面对海量w e b 信息面前,对于用户简单输入的 几个关键字,基于关键字的搜索引擎越来越变得无能为力。 从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹 配把该网页查出来,但是由于面对的是海量w e b 数据,这就导致了一个致命的缺陷: 返回的无用信息太多。例如,用户希望查找关于熊猫的知识,使用关键词搜索法, 键入“熊猫 ,搜索结果可能带来一些有用的信息,但同时也有大量不相关的文章, 如“熊猫出版公司、“熊猫牌服装 等。 造成上述信息检索困难的原因在于搜索引擎对要检索的信息仅采用机械的关键 词匹配来实现,缺乏知识处理能力和理解能力,因此造成搜索结果往往不符合用户 的需求。 2 ) 基于数据库的检索检索。这个技术是当前大多数电子商务网站的搜索方法。 特点是可以定制搜索内容,比较有针对性,但是由于此种方法多是基于数据库字段 的模糊查询方法,因此很难满足用户的语义关联查询等高级功能。 针对传统搜索引擎的缺陷,t i mb e r n e r s - l e e 提出了语义网技术。通过在互联 网上建立语义知识网络使得w e b 上的信息具有计算机可以理解的语义。它主要基于 x m l 和r d f r d f s ,并在此之上构建本体和逻辑推理规则,以完成基于语义的知识表示 和推理,从而能够为计算机所理解和处理。语义网一经提出,就一直成为人们讨论 和研究的热点。由于语义网具有对网络信息的“理解和处理”能力的优点,使得语 义网不单被看成是第三代w e b ,而且它的理论正被应用于越来越多的领域:把语义 网应用在信息抽取、搜索、构建数字图书馆上、在生物医学上应用、运用语义网理 论来建立于地理信息查询系统等等【2 _ 5 】。 随着互联网技术的发展,到目前为止,电子商务的发展已经经历了传统的电子商 务、e d i ( e l e c tr o n i cd a t ai n t e r c h a n g e ) 电子商务、现代电子商务和动态电子商务,并开 始全面进入智能电子商务( i n t e l l i g e n te 2 c o m e r c e ,i e c ) 时代【6 。9 】。i e c 是电子商务 发展的一个新阶段,虽然目前i e c 还没有明确的定义但是普遍的观点是:运用信 息技术、管理思想、计算机技术和人工智能,实现商务信息处理的自动化和智能化。 国内外学者对通过w e b 使用挖掘来发现规律、模式和知识从而支撑电子商务的智 能进行了大量的研究【1 0 川1 。 随着语义网技术的发展,目前国内外。已有不少的学者在进行把语义网技术应用 3 广东工业大学硕士学位论文 到电子商务领域的研究【1 2 j6 1 。r o b e r tt o l k s d o r f 等人认为,由于现有w e b 技术的缺 陷,影响了电子商务的进一步发展。对客户所需的产品,由于当前w e b 信息描述结 构简单,存在歧义大等特点,导致用户在网上往往很难找到质量、价格、服务都合 适的提供者,作出购买决定仅仅是基于在网上可获得的不完整的相关信息的部分。 他们提出一种设想描述了在电子商务中使用语义网这一新技术的潜力。d i e t e r f e n s e l 介绍了语义网中本体层的本体概念及其目前的研究进展情况,并针对本体在 知识管理、企业应用集成和电子商务中的应用作了论述。他认为:本体是语义网的 主干技术,本体提供了必要的术语词汇表以及这些词汇之间的关系,本体和语义网 的其他基本技术一起支持访问无结构的、各种各样的以及分布式的信息和知识源, 它们现在的地位就如同二十世纪的六十年代和七十年代中的程序设计语言一样重 要。语义网在知识管理中的应用可分为搜索信息、抽取信息等方面,上述的各种信 息必须是机器可访问的和机器可处理的,即必须采用正式的本体表示。在企业应用 集成方面,d i e t e rf e n s e l 提出了可扩展性和可重用性原则。在电子商务应用方面,提 出了开放性、灵活性和动态性的问题。而两者都需要有本体和其他语义网技术的支 持。 1 3 论文的研究内容 1 3 1 研究的内容 一、改进搜索的两种方法。 针对当前w e b 搜索质量不尽人意的问题,目前改进的方法主要有两个方面: 1 ) 在原来搜索技术的基础上改进。如:改进分词技术、完善分词词典等;采 用此方法的优势是在原有的平台上改进,成本较小;缺点是现有技术经过十几年的 发展,改进的空间相对较小,难有新的突破。 2 ) 采用新技术,从底层开始重构新的平台彻底解决当前面临的难题。缺点是 新技术仍然处于研发阶段,离完全普及还有段距离;优势是容易解决传统技术难于 解决的难题,如:让计算机可以像人一样理解信息等。 二、本文采用的方法。 虽然新技术仍然处于研发阶段,但是新技术带来的潜力是无限的,因此,本文 工作的重点是在深入研究语义网基础上,将其引入电子商务领域,解决当前电子商 4 第一章绪论 务搜索无法实现语义搜索的问题。本文所做的工作主要包括如下几个方面: 1 ) 深入分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论