(计算机应用技术专业论文)电子商务语义系统研究.pdf_第1页
(计算机应用技术专业论文)电子商务语义系统研究.pdf_第2页
(计算机应用技术专业论文)电子商务语义系统研究.pdf_第3页
(计算机应用技术专业论文)电子商务语义系统研究.pdf_第4页
(计算机应用技术专业论文)电子商务语义系统研究.pdf_第5页
已阅读5页,还剩61页未读 继续免费阅读

(计算机应用技术专业论文)电子商务语义系统研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电了= 商务语义系统研究 摘要 突飞猛进的全球信息化使得各个应用领域所产生的信息资源在飞速增长。 电子商务爆炸式的发展为人们提供了丰富的商品信息和便捷的购物方式,同时 也将人们淹没在商品信息的海洋中,难以选择合适的商品。这些信息形式多样、 缺乏统一的描述方式,用户难以查找到与需求相关的信息。 语义技术是当代万维网最热门的技术,代表着下一代万维网技术的发展方 向。语义技术的发展为解决电子商务信息查询和管理的难题提供了新思路。本 体是共享概念模型的明确形式化规范说明。o w l 是w 3 c 推荐的网络本体语言, 以描述逻辑为基础,能对本体作有效的描述和推理,是将网络环境下的大量非 规范性知识进行概念化表示的一种有效手段。 本文提出了基于o w l 电子商务本体( e c o m m e r c eo n t o l o g y ,e c o ) 以及相应 的开发过程和方法,开发了以“计算机产品销售 为核心的知识本体。并提出 了本体概念匹配算法、基于领域本体的语义距离和相关性算法以及基于本体概 念语义相关性的语义搜索方法,这些方法有效提高了电子商务系统效率。最后, 基于j 2 e e 架构探讨了本体在电子商务领域的应用模式和电子商务语义系统框 架的实现方法。 关键字:本体,电子商务,语义相关性,概念匹配,语义查询 电了商务语义系统研究 a b s t r a c t r a p i dd e v e l o p m e n to fg i o b a li n f o r m a t i o nc a u s e si n f o r m a t i o nr e s o u r c e sc r e a t e d i nt h ev a r i o u sa p p l i c a t i o n sf i e l d st od e v e l o pr a p i d l y e x p l o s i v ed e v e l o p m e n to f e - c o m m e r c ep r o v i d e ss u f f i c i e n tp r o d u c t si n f o r m a t i o na n dc o n v e n i e n tw a yt os h o p b u ta l s om a k e sp e o p l ed r o w ni nt h eo c e a no fi n f o r m a t i o ng o o d s w h i c hl e a d st o d i f f i c u l t yt oc h o o s et h ep r o p e rp r o d u c t s t h i si n f o r m a t i o nt a k e sm a n yf o r i l l s a n d l a c k su n i t yo fd e s c r i p t i v ew a y ,w h i c hm a k e su s e r sh a v ed i f f i c u l t yi nf i n d i n go u t i n f o r m a t i o nw h i c hh er e q u i r e s s e m a n t i ct e c h n o l o g yi st h em o s tp o p u l a rt e c h n o l o g yi nm o d e mw o r l dw i d e w e b a n dr e p r e s e n t st h ed e v e l o p i n gd i r e c t i o no fn e x tg e n e r a t i o nw o r l dw i d ew e b t e c h n o l o g y t h ed e v e l o p m e n to fs e m a n t i ct e c h n o l o g yp r o v i d e san e ww a yw h i c hc a n s o l v ep r o b l e m so fs e a r c h i n ga n dm a n a g i n go fe - c o m m e r c ed i f f i c u l t q u e s t i o n s o n t o l o g yi sac l e a rf o r m a la n ds t a n d a r ds p e c i f i c a t i o no fs h a r i n gc o n c e p t u a lm o d e l o w li st h ew e bo n t o l o g yl a n g u a g er e c o m m e n d e db yt h ew 3 c ,a n di ti so nt h e b a s i so fd e s c r i p t i v el o g i c ,a n dc a nm a k ee f f e c t i v ed e s c r i p t i o no fo n t o l o g y ,a n di ti s a ne f f e c t i v em e a n sw h i c hc a ne x p r e s si n c o n c e p t u a lw a yt h el a r g en u m b e ro f n o n n o r m a t i v ek n o w l e d g eu n d e rt h en e t w o r ke n v i r o n m e n t t h i sp a p e rp u t sf o r w a r de c o m m e r c eo n t o l o g yb a s e do no w la n dt h e c o r r e s p o n d i n gd e v e l o p i n gp r o c e s sa n dm e t h o d s ,a n dd e v e l o p so n t o l o g yw i t h ”c o m p u t e rs a l e s ”a st h ec o r e t h ep a p e ra l s op u t sf o r w a r dm a t c h i n ga l g o r i t h mo ft h e c o n c e p to ft h eo n t o l o g y ,t h es e m a n t i cd i s t a n c ea n dr e l e v a n ta l g o r i t h mo fb a s e do n t h ed o m a i no n t o l o g y ,a n dt h es e m a n t i cr e l e v a n c es e a r c h i n gm e t h o d s t h e s em e t h o d s e f f e c t i v e l yi m p r o v et h eu s i n ge f f i c i e n c yo fe - c o m m e r c e f i n a l l y ,t h i sp a p e rd e s c r i b e s a p p l i c a t i o nm o d e l o fo n t o l o g yb a s e dj 2 e ea r c h i t e c t u r ei ne - c o m m e r c ea n da c h i e v i n g m e t h o d so fe c o m m e r c es e m a n t i cs y s t e mf r a m e w o r k k e y w o r d s :o n t o l o g y ,e c o m m e r c e ,s e m a n t i cr e l a t e d n e s s ,c o n c e p t sm a t c h i n g , s e m a n t i cq u e r y i n g 玎 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下 独立进行研究所取得的成果。学位论文中凡引用他人已经发表或 未发表的成果、数据、观点等,均己明确注明出处。除文中已经 注明引用的内容外,不包含任何其他个人或集体己经发表或撰写 过的科研成果。对本文的研究成果做出重要贡献的个人和集体, 均己在文中以明确方式标明。 本声明的法律责任由本人承担。 论文作者签名:雠 日 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权 归属兰州大学。本人完全了解兰州大学有关保存、使用学位论文的 规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和 电子版,允许论文被查阅和借阅;本人授权兰州大学可以将本学位 论文的全部或部分内容编入有关数据库进行检索,可以采用任何复 制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或 与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州 大学。 保密论文在解密后应遵守此规定。 论文作者签名:雏导师签名:垄盔么日期:塑乒上卯 电了商务语义系统研究 1 1 研究背景与意义 第一章绪论 1 1 1 互联网和电子商务发展状况 据中国互联网络信息中心统计,截至2 0 0 8 年1 2 月3 1 日,中国网民规模达到 2 9 8 亿人,普及率达至1 j 2 2 6 ,超过全球平均水平;网民规模较2 0 0 7 年增长8 8 0 0 万人,年增长率为4 1 9 ;宽带网民规模达到2 7 亿人,占网民总体的9 0 6 ;手 机上网网民规模达到1 1 7 6 0 万人,较2 0 0 7 年增长了1 3 3 ;中国的i p v 4 地址资源依 然保持快速增长,达至01 8 1 2 7 3 3 4 4 个,较去年增长3 4 ;中国的域名总量达到 1 6 ,8 2 6 ,1 9 8 个,较2 0 0 7 年增长4 1 ;中国的网站数,即域名注册者在中国境内的 网站数( 包括在境内接入和境外接入) 达至1 1 2 8 7 8 万个,较2 0 0 7 年增长9 1 4 ;中 国网页总数超过1 6 0 亿个,较2 0 0 7 年增长9 0 。尽管中国的网民规模和普及率持 续快速发展,但是由于中国的人口基数大,互联网普及率在全球各个国家和地区 中只能排在第8 7 位,还有很大上升和发展的空间。 2 0 0 8 年1 月2 9 日世界互联网媒体测评机构“尼尔森在线 公布的研究数据显 示,在过去的两年中,全球在线购物的网民比例已经从1 0 增力n n 8 5 ,中国网 络市场购物成交额达到5 9 0 亿元。据淘宝网监测数据发现,截至2 0 0 7 年1 2 月3 1 日, 中国的网购人数超过5 5 0 0 万,与2 0 0 2 年相比增长近7 倍。到2 0 0 6 年底,中国网银 用户已经达到7 4 0 0 万户,交易量达至1 j 9 5 万亿。目前中国所有全国性商业银行已推 出网上银行服务,比较国外的发展状况,韩国网民的网络购物比例为6 0 6 ,美 国为7 l ,中国网民的网络购物比例为2 4 8 ,还有巨大的增长空间瞳1 。 1 1 2 互联网设计的不足 随着互联网广泛应用于各领域和社会信息化程度的提高,各个应用领域所 积累的信息资源在飞速增长。这些信息资源包括音频、视频、网页、文本、表 格、数据、应用系统、源代码、服务等多种形式。这些信息形式多样,并且缺 乏统一的描述方式,给各领域信息管理和信息共享带来诸多不便。 1 电了商务语义系统研究 电子商务规模的迅速增长一方面使用户拥有越来越多的信息,另方面用 户被大量的信息所淹没,变得不知所措。成倍增长的商品信息使用户找到自己 最合适的商品信息越来越困难,重复和无关的商品信息充斥着屏幕,急迫需要 的信息却隐藏在巨大信息量的背后。商家也面临商品信息推广与描述的难题, 同样语义的商品信息,比如“计算机与“电脑”,如果商家使用“电脑”作为 名称,而用户使用“计算机 作为搜索关键字,那么商家的商品是不会被搜到 的。出现以上问题的根本原因在于万维网设计之初所存在的不足。 1 9 8 9 年,t i mb e m e r s l e e 结合前人有关超文本和因特网研究成果发明了万 维网,在欧洲粒子物理实验室( c e r n ) 首次实现了基于因特网的超媒体全球信息 共享。1 9 9 0 年他写了第一个万维网的客户端和服务器,明确说明和修订了统一资 源定位符( u n i f o r mr e s o u r c el o c a t o r , u r l ) 、超文本传输协议( h y p e rt e x tt r a n s f e r p r o t o c o l ,h r r p ) 和超文本标记语言( h y p e rt e x tm a r k u pl a n g u a g e ,h t m l ) 作为互 联网的基础1 。u r l 用来对全球互联网范围的每一个信息对象或地址用字符串 的形式进行编码;h 1 曙是一个客户端和服务器端请求和应答的标准,提供一 种发布和接收网页的方法;h t m l 被用来结构化信息,也可用来在一定程度上 描述文档的外观和语义。 自1 9 8 9 年万维网产生之后,网络技术和网络应用飞速发展,一方面体现在 网络上的信息量和使用人数的飞速增长以及网络应用领域的增多,另方面体 现在网络应用方式从c s 向b s 、中间件以及智能化、复杂程度更高的应用集 成方向转变。 网络信息量的成倍增长,用户与网络应用越来越多,万维网的初始设计已 经无法满足应用增长的实际需求。万维网初始设计主要是方便人对信息的浏览 而不是为了实现计算机对信息的自动处理和智能推理,因此它的局限性主要体 现在以下几个方面: ( 1 ) 信息搜索质量很难提高 海量信息的搜索,需要较高的查准率和查全率,h t m l 页面中的数据和显 示标签揉合在一起,缺少对数据内容进行描述的元数据,计算机很难理解这些 数据的意义,即使借助功能强大的搜索引擎,查准率也比较低。搜索引擎在帮 助网民得到成批相关网页的同时,也夹杂了许多用户不需要的信息垃圾。虽然 2 电子商务语义系统研究 自然语言处理技术( n a t u r a ll a n g u a g ep r o c e s s i n g ,n l r ) 的研究者在处理h t m l 文 档这个领域展开了深入的研究,但是依然面临着巨大的困难,信息的准确率和 查全率很难有进一步提高。 ( 2 ) 宏观信息管理困难 因为万维网当初是为了传输和显示信息而非为管理和处理信息设计的,所 以目前万维网的信息量和数据量正在失去控制,重复无用的信息淹没了有效信 息,目前还没有出现能对全球万维网信息进行有效管理的工具。由于万维网是 分散互联的,相关主题信息分散在全世界许多不同的服务器上,除了通过搜索 引擎搜索到部分信息外,还没有其他的有效方式对信息进行搜集和处理。 ( 3 ) 异构系统间的信息集成困难 大量数据和信息分布在不同的系统平台上,通过网络和各种信息集成系统 进行处理和交换。信息系统的集成方式也大多采用点对点的数据格式转换的方 式实现,当转换规模逐渐扩大,点对点数据转换的复杂程度会呈指数级别上升, 其结果必然导致机器根本没有能力处理这些复杂度极高的数据转换。 ( 4 ) 万维网的信息不具备良好的计算机可读性 万维网现在采用的超文本标记语言,将网页上的内容设计成方便人类浏览 的,而非计算机容易理解和处理的信息格式,因此无法提供自动处理网上数据 的功能。此外,万维网是按“网页的地址 而非“内容的语义 来定位信息资 源的,网上所有信息都是由不同的网站发布的,相同主题的信息分散在全球众 多不同的服务器上,并且缺少有效工具能将不同来源的相关信息综合起来,因 此形成了一个个信息孤岛,很难实现信息的跨平台应用和被计算机自动处理。 ( 5 ) 没有计算机可理解的语义标记 面向人的信息本身不需要有语义标记,其语义的提取由人自身来实现。面 向计算机的信息,应该按照能够帮助计算机理解其语义信息的方式来组织,即 计算机可理解的描述方式。 1 1 2 语义网的发展状况 为了使人们能够按信息的语义表达需求,迅速准确地从成千上万的网页中 找到自己所感兴趣的信息,同时使计算机能够理解网页信息,t i mb e m e r s l e e 3 电了商务语义系统研究 于2 0 0 1 年正式提出了语义万维网( s e m a n t i cw e b ) 。语义万维网是当前万维网 的变革和扩展,其信息具备良好的定义,这些定义能帮助人类和计算机更好地 协同工作。 语义网被认为是下一代互联网,通过语义网人们能够轻松链接任何信息、 任何的事物和人。它使“理解网页信息的含义”不再是只有人才能做到的事情, 计算机在一定程度上也同样可以做到,从而大大增加了信息的共享程度,并使 网络有能力提供动态与主动的服务,更利于人机之间的对话和协同工作。例如, 人们看到网页上的电脑配置数据,自然就会知道这个电脑的性能,但计算机并 不知道每一个数字所表达的含义,哪一个是c p u 的参数,哪一个是内存的参数。 而语义网的意义就是要挖掘隐藏的信息含义,指明哪个数字是在讲c p u 的处理 能力,哪个数字讲内存的大小,并且说明c p u 和内存的含义。 语义网可以让计算机具有对网络空间所储存的数据进行智能评估的能力。 这样,计算机就可以像人脑一样“理解 信息的含义,对信息进行“推理 ,完 成智能代理畴1 的功能。使用语义网搜索的结果也将比万维网拥有更加好的查准 率和查全率。另外,科技的创新和突破,都是对前人的知识的重新组合和发展, 因此语义网的实现也为科技创新提供了丰富的资源和便捷的工具,它可以在很 短的时间内,完成一个人花很多时间都完不成的信息和知识的收集与整合。 语义网为了使计算机能够自动识别和处理网上信息,需要在网页内容中加 入计算机能读懂的“标记 。一般地,不同应用领域的标记符或规则是不一样的, 而且不同的人对同样的事物会有不同的认识,这为网页的“标注 增加了巨大 的困难。因此“标记语言 必须是灵活的、可扩展的,以便给使用者提供自定 义功能,这样的“标记语言”称为“可扩展标记语言”。 但是目前我们使用的万维网,实际上是一个存储和共享音视频、图像和文 本的媒介,电脑所能看到的只是大小和名称等,对其内容无法进行识别。万维 网中的信息,如果想让电脑进行自动处理的话,就必须首先将这些信息加工成 计算机可以理解的原始信息后才能进行处理,这对处理全球数万亿的网页来说, 是几乎不可能完成的。 , 因此,语义万维网技术距离实际应用尚有一段差距,实现语义万维网所面 临的主要问题体现在: 4 电子商务语义系统研究 ( 1 ) 缺乏丰富的领域本体和合适的构造本体方法 传统信息系统开发很少在设计阶段就考虑信息的广泛共享和集成。在这种 情况下,设计人员很少对一些领域内的共享概念达成共识,更不用说形成相关 的数据标准。并且本体驱动的应用系统开发需要领域专家的参与才能取得良好 效果,但是目前缺乏针对领域专家的比较方便实用的本体开发工具和丌发方法。 ( 2 ) 缺少本体概念之间关系分析的标准 本体的目标是实现知识重用和共享,在实际应用过程中,即使在同一个本 体体系之内,概念之间也存在着各种关系。如何针对具体的应用来量化分析概 念间关系,目前还没有统一的标准和方法。异构本体之间的概念关系分析,更 是一项具有挑战性的研究课题。 ( 3 ) 缺乏通用的语义搜索系统和方法 网络和数据库中存储着丰富的信息资源需要共享给广大的用户,这就需要 有良好的语义搜索的系统,才能将信息库中的语义知识展现出来。目前大部分 倾向于研究专用某个领域的信息搜索系统和方法,还没有通用的搜索系统和方 法,不利于语义技术的推广应用。 1 2 本文的研究内容 ( 1 ) 介绍电子商务、语义网技术 电子商务作为一种先进的生产力,有力地推动着国民经济和社会信息化的 发展。它对于世界各国来说既是一次难得的机遇,又是一次严峻的挑战。为了 有效的解决电子商务在理论和应用中的诸多问题,电子商务的专家、学者和企 业进行了大量的研究和实践,提出了许多应用于电子商务的策略、方法和技术。 虽然目前电子商务系统已经取得了巨大的成就,但是已有的绝大多数电子商务 系统不支持语义,在今后商品信息种类与数量的与日俱增的情况下,想改善用 户搜索信息的查准率和查全率很难有大的突破。 本文采用语义技术来描述电子商系统,它的核心是:通过给万维网和数据 库上的信息添加和转换能够被计算机所理解的语义标签和概念,从而使整个互 联网成为一个通用的信息交换媒介和计算机能自动处理的信息库。本文采用语 义技术来构建电子商务系统,实现电子商务的智能化、自动化,提高商品信息 5 电了商务语义系统研究 搜索的查全率和查准率。 ( 2 ) 构建电子商务领域本体 在建设电子商务语义系统的过程中,不仅要将商品、商家、顾客的信息搬 上网络,而且要实现信息的语义表示。这就需要以本体概念为中心,建立商品 之i t , 】的关系,明确每个名称所包含的语义,以便搜索和计算机自动处理。 领域本体可以精确地描述领域内的各种概念以及它们之间的关系,可以从 一个概念通过关系网络推理到另外一个概念,揭示信息之间的关联度。本体可 以实现独立于人工干预的信息操作,采用计算机可读的方式进行领域概念的表 示,应用逻辑描述概念之间的关系,使计算机能够进行独立的知识推理和自动 化的信息处理。 本文将深入分析领域信息语义的内涵及其与领域本体的关系,探讨本体的 构建方法与过程,提出基于o w l 的电子商务本体( e c o m m e r c eo n t o l o g y , e c o ) 以及相应的开发过程和设计原则,并开发以“计算机产品销售 为核心的本体。 ( 3 ) 本体概念间的匹配和语义相关性计算 社会信息化程度的加深使得信息量呈指数级别的增长,信息交换和搜索的 潜在需求随之不断加大,于是改进查询机制实现查询的高准确率( 即查询所得 的结果是与需求相关的) 和高查全率( 即与需求相关的信息不会被遗漏) 成为 获得高效和友好查询的关键问题所在。 对于目前普遍使用关键字查询导致查全率低的情况,本文采用两种改进方 法:一种采用基于本体的语义标注来对信息源进行描述,它能有效地解释和涵盖 信息源所包含的信息内容;另一种采用概念匹配的方式,对关键词进行相关语 义匹配,相同相近的语义概念可以扩充关键字为搜索查询提高查全率提供帮助。 对于一个关键字有多个概念引起的搜索查准率低的问题,本文采用基于本体概 念的语义相关性计算来分析用户给定的概念词组,揭示这几个关键词所指向的 准确语义,避免词汇歧义,提高搜索查询的准确率。 ( 4 ) 基于本体的语义搜索 针对将主要存放在数据库中的电子商务信息一条一条转换成本体形式需要 巨大工作量这一问题,本文提出了从大量异构商品数据库中获取商品语义信息 的有效的方法。首先将商品数据库模式映射到x m ls c h e m a ,然后将x m l 6 电了商务语义系统研究 s c h e m a 映射到本体定义,将商品个体数据转换成相对应的本体实例,生成的 o w l 文件可以直接用于本体推理。 本文结合数据库技术和描述逻辑推理技术提出了一种新的语义搜索方法。 这种新的搜索方法的特点是尽量减少本体推理机的使用,而将大量需要的本体 概念匹配转化成数据库的查询,充分利用数据库查询的高效性和稳定性提供持 久的、可伸缩的、安全的及并发可控的语义查询。将依赖于本体推理机的个体 实例的推理可能导致的长时间推理以及不能提供并发查询的弊端有效避免。确 保了语义搜索的健壮性和完备性( 即所有的查询都能够保证在有限时间内被系 统计算出来) 。 ( 5 ) 电子商务语义系统的实现 伴随着电子商务的快速发展,国内外的学者对电子商务的研究已经变得日 益火热,从各方面的文献资料可以看出,目前大家更多的侧重于对电子商务的 定义、目标和内容、策略与原则以及电子商务技术等方面的研究,而对于电子 商务系统关于语义实现的深入研究还较少,现在还不能较为完整的提供一套操 作性强的具有语义功能的电子商务智能系统构建方案。 本文将提出基于e c o 的电子商务语义系统,作为语义系统在电子商务实践 和发展中一种试验。该系统的设计目标是通过e c o 对有关电子商务相关的信息 资源进行语义描述,并利用e c o 实现针对这些资源的语义搜索。该系统包括领 域本体建模、本体的形式化与存储、信息的提交与处理、资源语义描述与存储、 语义搜索界面w e b 用户接口、本体概念语义距离相关性计算、概念匹配、语义 推理等多个组件。通过这些组件的有机结合,知识工程师可以利用e c o 中的词 汇来描述x m l 文档、h t m l 文档等多种形式的资源;用户可以通过语义搜索 接口,基于本体进行语义搜索。 7 电了商务语义系统研究 2 1 电子商务概述 第二章电子商务语义技术 电子商务来源于英文e l e c t r o n i cc o m m e r c e ,简称e c 。顾名思义,其内容包 含两个方面,一是电子方式,二是商贸活动。电子商务是指在全球各地的商业 贸易活动中,基于浏览器朋艮务器应用方式,通过万维网买卖双方进行各种商贸 活动,实现消费者的网上购物、商家之间的网上交易和在线电子支付等应用的 一种网络商务活动。 电子商务涵盖的范围很广,主要的商业模式有企业对企业 ( b u s i n e s s t o b u s i n e s s ) ,企业对消费者( b u s i n e s s t o c u s t o m e r ) ,消费者对消费者 ( c u s t o m e r - t o c u s t o m e r ) - - 种。随着i n t e r n e t 使用人数的增加和社会网络信息化步 伐的加快,利用i n t e r n e t 进行网络购物并以网上银行付款的消费方式逐渐流行, 占贸易总额的比例逐年增长,电子商务网站的数量飞速增长,服务内容也越来 越呈现多元化和专业化。 从贸易活动的角度分析,贸易是由多个环节共同构成的,而电子商务可以 实现其中的几个或全部环节,由此也可以将电子商务分为两个层次:较低层次 的电子商务如电子商情、电子贸易、电子支付等;最完整的也是最高级的电子 商务应该是利用i n t e r n e t 网络能够进行全部的贸易活动,即在网上将信息流、商 流、资金流和物流管理完整地实现,也就是说,从发布商品信息或寻找商品信 息开始,到洽谈、订货、在线付( 收) 款、电子发票、电子报关、电子纳税等都 通过i n t e r n e t 来完成。要实现完整的电子商务还会涉及到很多方面,除了买家、 卖家外,还要有银行、政府机构、认证机构、物流配送、网络服务提供商、独 立支付平台等的加入才行。由于参与电子商务中的各方并不是实地见面,因此 在整个电子商务过程中,商品质量、交易安全、网络诚信、管理规范能付得到 保证是电子商务继续发展的根本。 2 1 1 电子商务发展过程 电子商务最早产生于2 0 世纪6 0 年代,发展于2 0 世纪9 0 年代,发展过程 8 电子商务语义系统研究 分为两个阶段,第一阶段是6 0 年代到9 0 年代的基于e d i 的发展阶段,第二阶 段是9 0 年代后基于i n t e m e t 的发展阶段。 ( 1 ) 6 年代基于e d i 的电子商务 人类利用电子通讯的方式进行贸易活动己有几十年的历史了。早在2 0 世纪 6 0 年代末期人们就开始采用e d i ( r 乜子数据交换) 作为企业间电子商务的应用技 术,这也就是电子商务的雏形。e d l ( e l e c t r o n i cd a t ai n t e r c h a n g e ) 是指将业务文件 按一个公认的标准从一台计算机传输到另一台计算机上去的电子传输方法。由 于e d i 大大减少了纸张票据,因此e d i 一经出现便显示出了强大的生命力,迅 速地在世界各主要工业发达国家和地区得到广泛的应用。7 0 年代,数字通信技 术的发展大大加快了e d i 技术的成熟和应用范围的扩大,也带动了跨行业e d i 系统的出现。8 0 年代e d i 标准的国际化又使e d i 的应用跃入了一个新的里程。 而我国九十年代开始开展e d i 的电子商务应用。 ( 2 ) 9 0 年代以后基于i n t e r n e t 的电子商务 2 0 世纪9 0 年代中期后,万维网迅速走向普及化,逐步地从大学、科研机 构走向企业和百姓家庭,电子商务也成为力维网应用的最大热点。2 0 0 8 年1 月 2 9 日世界万维网媒体测评机构“尼尔森在线”公布的研究数据显示,在过去的 两年中,全球在线购物的网民比例已经从1 0 增加到8 5 。中国电子商务发展 迅猛,2 0 0 7 年全国电子商务交易总额达2 1 7 万亿元,比2 0 0 6 年增长9 0 。 2 1 2 电子商务的作用 一般能在网络上获得供求信息( 如r r 、服装等行业产品信息等) 从而达成 交易的行为活动都可以称之为电子商务,如具体的各类产品的供求信息网站也 都可以称之为电子商务网站,并非所有模式都必须完全相同,电子商务真正的 目的是双方不曾谋面从而以低成本的电子通讯方式成功从事各种商贸活动。电 子商务是因特网爆炸式发展的直接产物,是网络技术应用的全新发展方向。因 特网本身所具有的开放性、全球性、低成本、高效率的特点也成为电子商务的 内在特征,并使得电子商务大大超越了作为一种新的贸易形式所具有的价值, 它不仅会改变企业本身的生产、经营、管理活动,而且将影响到整个社会的经 济运行与结构。 9 电了商务语义系统研究 ( 1 ) 电子商务将传统的商务流程电子化、数字化,一方面以电子流代替了 实物流,可以大量减少人力、物力,降低了成本;另一方面突破了时间和空间 的限制,使得交易活动可以在任何时间、任何地点进行,从而大大提高了效率。 ( 2 ) 电子商务所具有的开放性和全球性的特点,为企业和商家创造了更多 的贸易机会,为顾客提供了更多的选择。 ( 3 ) 电子商务使各类企业可以以相近的成本进入全球电子化市场,使得中 小企业有可能拥有和大企业一样的信息资源,提高企业的竞争公平性。 ( 4 ) 电子商务为物流企业提供了良好的运作平台,大大节约了社会总交易 成本,并且极大地方便了物流信息的收集和传递。 ( 5 ) 电子商务一方面破除了时空的壁垒,另一方面又提供了丰富的信息资 源,为各种社会经济要素的重新组合提供了更多的可能,这将影响到社会的经 济布局和结构。 ( 6 ) 通过万维网,商家之间可以直接交流、谈判、签合同,消费者也可以 把自己的反馈建议反映到企业或商家的网站,而企业或者商家则可以根据消费 者的反馈及时调查产品种类及服务品质,做到良性互动。 2 2 语义网研究 语义w e b 是对当前w e b 的一种扩展,其目标是通过使用本体和标记语言, 如x m l 、r d f 、d a m l 和o w l ,使w e b 信息的内容能被计算机理解,为用户提 供智能索引、基于语义的信息搜索等智能服务。语义w e b 的层次结构如图2 1 所示 6 1 : l o 电子商务语义系统研究 2 2 1u r i i r i 资源标识层 图2 1 语义w e b 体系结构 u r i :u n i f o 阳r e s o u r c e i d e n t i f i e r s ( 统一一资源标识符) l r i :i n t e r n a t i o n a i i z e dr e s o u r o e d e n t i f i e r s ( 国际化资源标识符) x m l :e x t e n s i b l em a r k u pl a n g u a g e ( 可 扩展标记语言) r d f :r e s o u r c ed e s e r i p t i o n f r a = e w o r k ( 资源描述框架) r d f s :r d fs c h e m a ( 资源描述艋架模式) o w l :w e bo n t o l o g yl a n g u a g e ( 网络本体 语占) r i f :r u l ei n t e r c h a n g ef o r = a t ( 规则交 换格式) s p a r i l :s p a i :q lp r o t o c o la n dr d f q u c r yl a n g u a g e ( s p a r q l 协议和 r d f 直询语言) u n i f y i n gl o g i c ( 统一的逻辑) p r o o f ( 推理证明) c r y p t o ( 密码) t r u s t ( 可信性) u s e ri n t e r f a c eta p p l i c a t i o n s ( 用户 界面与应用) u r i i r i 层是整个语义万维网的基石,它着眼于解决万维网上资源的定位和 跨地区跨语言字符编码格式标准的问题。网络应用程序之间需要相互通信,以 计算机可读的格式传递或发布信息,这些信息应该以明确的方式来标识。 语义万维网采用统一资源标识符( u n i f o r mr e s o u r c ei d e n t i f i e r s ,u r i ) 来标识 资源及其属性,u r i 是一个i n t e r n e t 标准,记载于r f c 2 3 9 6 n 1 ,提供了一种简单、 一致且可扩展的方式来标识和查找网络上存在的资源。这些资源包括h t m l 页 面、x m l 文档、图像、多媒体文件、数据等。它和万维网常用的统一资源定位 符( u n i f o r mr e s o u r c el o c a t o r , u r l ) 以及统一资源名称( u n i f o r mr e s o u r c en a m e , u r n ) 的区别在于u r i 泛指所有以字符串标识的网络资源,包含了u r l 和u r n 。 u r l 是i n t e r n e t 上用来描述信息资源的字符串,主要用在各种w w w 客户 程序和服务器程序上。采用u r l 可以用一种统一的格式来描述各种信息资源, 包括文件、服务器的地址和目录等。u r l 的格式由下列三部分组成:第一部分 是协议( 或称为服务方式) ;第二部分是存放该资源的主机i p 地址( 有时也包 括端口号) ;第三部分是主机资源的具体地址,如目录和文件名等。 第一部分和第二部分之间用“:符号隔开,第二部分和第三部分用“ 符号隔开。第一部分和第二部分是不可缺少的,第三部分有时可以省略。u r l 1 1 电了商务语义系统研究 目前最大的缺点是当信息资源的存放地点发生变化时,必须对u r l 作相应的改 变。 u r n 是唯一标识一个资源的标识符,但是不能给出资源的位置。系统可以 先在本地指明一个资源,它也允许w e b 位置改变,然而这个资源却还是能够被 找到。与u r l 不同,u r n 与地址无关。u r n 在w e b 中主要应用是下拉菜单的 制作或者相对位置的应用。 区分绝对u r i 和相对u r i 的概念非常重要,假设在浏览w e b 时,将当前的 w e b 页面作为起点页面请求下一个页面,绝对u r i 标识相同的新资源与起点页 面无关,而相对u r i 需要根据起点页面标识新资源。 由于语义万维网的信息资源的最终目的是要构建一个全球信息的网络,在 这个网络上应该涵盖各种语言和文字,而u r l 只允许a s c i i 字符集中的字符,即 只包含基于英语用户需求的1 2 7 个字符,这为非英语用户造成了很多不便。国 际化资源标识符( i n t e r n a t i o n a l i z e dr e s o u r c ei d e n t i f i e r , i r i ) 与u r i 类似,不同之 处是i 刚可以使用全部的u n i c o d e 字符,记载于r f c 3 9 8 7 陋1 。i r i 作为u r i 的泛化 形式,提供对语义网资源加以唯一标识的手段。为了能够在顶部层面之中实现 对于资源的可验证的操作处理,语义网需要唯一性标识机制。因为u n i c o d e 为 每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨 平台进行文本转换、处理的要求,所以采用支持u n i c o d e 的i r i 作为唯一资源标 志的语义网在不同人类语言的文档之间建立桥梁和纽带。 2 2 2x 儿和r d f 数据层 可扩展标记语言( e x t e n s i b l em a r k u pl a n g u a g e ,x m l ) 它与h t m l 一样,都 是标准通用标记语言i s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,s g m l ) 。x m l 是 i n t e r n e t 环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有 力工具。x m l 与数据库不同,数据库提供了更强有力的数据存储和分析能力, 例如:数据索引、排序、查找、相关一致性等,x m l 仅仅是展示数据。x m l 与 h t m l 的设计区别是:x m l 是用来存储数据的,重在数据本身,而h t m l 是用来 定义数据的,重在数据的显示模式。x m l 独立简单的特性很快使它成为唯一的 公共数据交换语言。 电了商务语义系统研究 x m l 允许用户根据需要自定义一些“有意义的标签,对所发布信息的内 容进行标记,并使用文档类型定义( d o c u m e n tt y p ed e f i n i t i o n ,d t d ) 或x m l s c h e m a 来约束这些标签的结构。由于x m l 标签可以由用户根据自己的需要来 定制,这样不可避免地会造成标签同名的情况,为了避免这样的冲突,w 3 c 采 用了n a m e s p a c e s 机制口1 。 比如在一个x m l 文档 m o u s ed e v i c e 中 表示鼠标, 而在另一个文档 b u r r o w i n gm o u s e 中 表示老鼠。如果 我需要同时处理这两个文档,就会发生名字冲突。而n a m e s p a c e s 通过给标识名 称加一个u r l 定位的方法来区别这些名称相同的标识。示例如下: 其中y o u r n a m e 是由你定义的n a m e s p a c e s 的名称,u r l 就是名字空间的网址。假设上面的“鼠标 一文档来自 h t t p :w w w s h u b i a o c o m ,我们就可以声明为 然后在后面的标识中使用定义好的名字空间: m o u s ed e v i c e 这样就将这两个 区分开来。注 意的是:设置u r l 并不是说这个标识真的要到那个u r l 去读取,仅仅作为一种 区别的标志而已。 资源描述框架( r e s o u r c ed e s c r i p t i o nf r a m e w o r k ,r d f ) 是用来描述万维网上各 类信息的一种语言,本身并没有规定语义,但是它为每一个资源描述体系提供一 个能够描述特定需求的语义结构的能力。它专门用于表达关于w e b 资源的元数据, 比如w e b 页面的标题、作者和修改时间,w e b 文档的版权和许可信息等。然而, 将“w e b 资源”这一概念一般化后,r d f 可被用于表达关于任何可在w e b 上被标 识的事物的信息,即使有时它们不能被直接从w e b 上获取。比如关于一个电子商 务网站的某项产品的信息( 例如关于规格、价格、参数和顾客的评价) 。从这个 意义上来说,r d f 一个开放的元数据框梨l o 】。这个元数据框架定义了一种数据模 型,可以用来描述计算机能理解的数据语义。采用 - - 元组表 达形式,数据模型形如 。 r d f 用w e b 标识符i r i 来标识事物,用简单的属性( p r o p e r t y ) 及属性值来 描述资源。这使得r d f 可以将一个或多个关于资源的简单陈述表示为一个由节 点和连接弧线组成的图,其中的节点和弧线分别代表资源、属性值和属性。假 1 3 屯了商务语义系统研究 设张三有个笔记本电脑t h i n k p a dt 6 1 ,要7 6 0 0 元出售。可以用图2 2 表示: 图2 2 一个计算机产品出售的r d f 图 上图显示r d f 可以用i r i 来标志,具体的对应为:个体t h i n k p a dt 6 1 属性有 h o l d 和p r i c e 两种,属性的值分别为张三和7 6 0 0 元。 r d f 提供了一种基于x m l 的语法( 称为r d f x m l ) 用于保存和交换r d f 图。 上图用r d f x m l 表达如下: 张- - 7 6 0 0 元 r d f x m l 是计算机可处理的语言,r d f 除了能够描述像网页这类事物以外, 还可以描述每个事物、产品、活动等。此外,r d f 中的属性本身有i r i ,可以用 来准确标识被链接的事物之间的关系。 2 2 3s p a r q lr d f so w lr if 本体层 ( 1 ) 本体综述 o n t o l o g y 最早是一个哲学上的概念,是客观存在的一个系统的解释或说明。 在计算机领域,最早n e c h e s 等认为本体定义了组成主题领域的词汇表的基本术 语及其关系,以及结合这些术语和关系来定义词汇表外延的规则n 。之后本体 1 4 电子商务语义系统研究 研究者给出了许多不同的定义。最全面的是s t u d e r 认为o n t o l o g y 是共享概念模 型的明确的形式化规范说明n 射。 在具体的应用中,o n t o l o g y 的表示方式可以多种多样,可以用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论