




已阅读5页,还剩38页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 因特网的迅速发展,促使其访问方式的多元化发展。人们已经不再满足于仅仅通过 计算机浏览器浏览因特网,越来越多的人希望可以使用电话,手机等通讯设备浏览网页。 相对于表达能力有限的图像和文字,人们更倾向于使用自然语言交流。因此友好的语音 交互越来越受到人们的青睐。v o i c e l 建立在x m l 规范基础之上,是一种语音数据 交换标准。给用户提供了通过语音工具访问网络资源的平台。v 0 i c e l 作为一种语音 数据的交换标准,它能够与数据库,以及其他建立在x m l 标准之上的其他数据文档进 行无缝数据交换,从而把因特网和电话网紧密的结合起来。 v o i c e l 语音网关把用户文档提交给服务器,随着用户提交的信息量的增长,服 务器在处理这些海量文档时,面临巨大压力,迫切的需要对信息进行自动分类,再对每 个类别的文档分别处理。以往仅通过关键字本身对信息进行检索和分类,准确率和效率 不是很理想,因为计算机不能理解关键字所蕴含的语义信息。为了能够更好地获得语义 信息,在此引入本体的概念。可以借助本体来描述和分析关键字的语义。通过本体建模 可以表达更深层次的语义信息。传统检索算法所采用的只是基于语法层面上字、词的简 单匹配,而缺乏对知识的表示、处理和理解等能力。解决这些问题的关键在于把信息检 索从基于关键字的语法匹配提升至基于知识( 或上下文) 层面的语义匹配。 本体是一种知识表示工具,在实际应用中可能需要根据规则进行逻辑推理。本体的 推理是指把隐含在显示定义和声明中的知识提取出来。本体是对共享概念模型的规范说 明,是对知识的一种描述,如果要把本体应用在语义分析上就必须使用规则,在规则上 进行推理。谓词逻辑是知识推理的重要表现手段。可以在本体表示知识库的基础上构建 规则库,用来分析文本的语义信息。 文中使用o w l 语言来描述领域知识,使用规则系统来表示推理规则。目f j 编辑和 开发本体的工具很多,本文采用了美国斯坦福大学的p 胀酌3 2 1 作为构建本体的平 台。在这个平台上我们模拟构建了一个学校后勤管理的部分本体。并在该本体的基础上 构建规则集合,用来对文本信息进行推理。为了解决文本自动分类的问题,本文提出了 基于本体的电话内容的分类。本体是一种能在语义和知识层次上描述知识模型的建模工 具,被人们应用到文本分类中,提高了分类的精度和速度。 关键词:分类;本体;v o i c e 订l a b s t r a c t t h ei n t e r n e td e v e l o p sr a p i d l ya n dt h em 刊d so fa c c e s s m gt h ei n t e m e ta r em u l t i f 撕o u s p e o p l eh a v eb e e nn o ts a t i s f i e dw i t h 仕屺o n l yw a yt os u r fo nl i i l e w i t hm eb r o w s e r so f c o m p m e r s ,i n t e m e te x p l o r e rf o re x 锄p l e a n dt h eu s e r s 丽s ht 0v i e wt h ew e bp a g e sb y t e l e p h o n eo rm o b i l et e l e p h o n em s t e a do f t h ec o n l p u t e rs c r e e i l s p e o p l ep r e f 旨t 0c m m m m l c a t e w i t hn a t u r a ll a n g u a g e s 硎h e rn 啪廿l ef i g u r e sa n dm el e t t e r s s om em u c h 衔e n d l ya u d i o i n t e r f a c ei sb e c o m i n gm o r ep o p u la r v o i c e x m li sas t a i l d a r do fe x c h a l l g i n ga u d i od a 协,w l l i c h i sb a s e do n l v o i c e x m li sap l a t f o n nw l :l i c hp r o 访d e sa i la u d i om e t h o dt oa c c e s sm e i n t e m e t v o i c e lc a i lc o i l l l e c ta i l de x c h a l l g ed a t as e 锄l e s s l y 晰t hd 犹出a s e sa 1 1 do t h e r d a t a d o c 砌e n t sb a s e do nx m ls t 眦d a r d s oi tc a l lc o r l e c tt h eh l t e m e t 谢t ht e l e p h o n e n e tc l o s e l y t h ea u d i og a t e w a yb a s e do nv o i c e x m ls u b 血t st h eu s e r s d o c u m e n t st ot h es e e r i h e s e r v e rf a c e sm eh u g ep r e s s u r ew n e nt h ed o c u m e n t sg r o wr 印i d l ya n d i ti sn e e d e dt oc l a s s 晦 t 1 1 ei n f o m a t i o na u t o m a t i c a l l y a m dm e n m ec l a s s i f i e dd o c 眦l e n t s 丽nb eh a n d l e dr e s p e c t i v e l y nu s e dt os e a u r c ho rc k s 遗t 1 托谊f o m a t i o nb yk e y w o r d s ,b u ti t d o e s n tw o r k 、e l l ,b e c a u s e t l l ec o m p u t e rc a n ,tu n d e r s t a n dt h ei m p l i e ds e m a n t i cm e 痂g o fm ek 州o r d s o n t o l o g yi s 印p r o a c h e dt 0s o l v et h es e m a l l t i cp r o b l e m o n t 0 1 0 9 yc a n b eu s e dt od e s c r i b ea n d 觚a l y z et l l e s e m a n t i cm e a i l i n go f 1 ek e ) 哪r d s t h ei m p l i e ds e m a n t i ci 幽m a t i o nc a nb ee x p r e s s e db y t h eo n t o l o g ym o d e l s t 1 1 ec l a s s i cs e a r c ha l g o r i n u n sw h j c hm a t c h t h ew o r d sb y 舭s y n t a x 孤d t h e yl a c kt h ea b i l i t i e so fe x p r e s s i n g ,t l a l l d l i n ga n dc o m p r e h e n d i r 培o ft h ek n o w l e d g e t h e m 血m 弛o dt os o l v e 缸s ep r o b l 锄si st 0m a t c hm e w o r d sb ys e m a n t i c si n s t e a do fs y “嗽 o n t o l o g yi s ak mo ft o o lt od e s c r i b ek 1 1 0 w l e d g e ,a r l di t i saf o mo fk n o w l e d g e r e p r e s e m t i o n a n di tc a l lb et h eb 撕so ft h el o g i c a lr e a s o 血g 碱c hw o r k so nm l e s n e r e a s o i l i i l go fo n t o l o g ym e a n st oe x 仃a c tt h ei n l p l i e dk n o w l e d g e 舶m t h ee x p l i c i td e f i m t i o i l so r s t a t e m e n t s o n t o l o g yi sa i le x p l i c i ta n ds p e c i & a t i o no fac o n c 印嘲i z a t i o n ,w t l i c hi sa k i l 越 o fd e s c r i p t i o no fk n o w l e d g e ,i fo n t o l o g yi s u s e df o rs e m a n t i ca i l a l y z e ,m l e s m s tb e a p p r o a c h e d a n dm em l e sa r eu s e df o rr e a s o i l i n g p r e d i c a t el o g i ci sa i l 却o n a n tf o n no 。 k n o w l e d g er e p r e s e n t a t i o n n l em l es y s t e m 、) 恤c hi su s e d t 0a m l y z et 1 1 es e m a n t i ci n f o 衄a t l o n o ft e x tc a l lb ec o n s 臼m c t e do nm ek 舯1 w l e d g er e p o s i t o 巧w h j c hi sb a s e do no m o l o 黟 o 、li su s e dh e r et 0d e s c r i b et h ek n o w l e d g ei nm ed o m a i l la 1 1 dt h em l es y s t e mi su s e dt o e x p r e s sr e a s o i l i n gm e c h a n j s m ,n l e r ea r e1 0 t so ft o o l sf o re d i t i n g 棚1 dd e v e l o p i n go n t o l o 黟 p r o t 6 9 63 2 1w t l i c hi sd e v e l o p e db ys t a n f o r du i l i v e r s 埘i s t l l ep l a t f o m lt oc o i l s t 九l c t o n t o l o g ) rh e r e p r o t 6 酌i s 锄o p e no n t o l o g ye d i t o ra n d i ti se x p a n d e db a s e do nj a v a p r o t 6 酌 p r o v i d e sal o tp l u g i na n da p i s w es i m u l a t et 0b u i l dt h eo n t o l o g yo fa 缸i n i s 僦i o no f a c 0 1 1 e g e a n dam l es y s t e mi sb u i h0 n 让i eo n t o l o g y 讹c hi s l l s e dt om a i l i p u l a t e 也et e 】【t i i d o n n a t i o n w - ea d v 觚c et 0c l a s s i 矽t i l et e x tc o n t e n to f 此t e l e p h o n eb yo n t o l o g ) ,t os o l v et h ep r o b l e m d i s c o u r s e da _ b o v e o n t o l o g yi sam o d e l i i l gt o o lt 0e x p r e s st h es e m a m i cm e a 血n ga 1 1 dm e k n o w l e d g e i ti su s e di nt a x o n o m yt 0i i l c r e a s et h ep r e c i s i o na i l d 也ew o r k i l l gs p e e d k e yw o r d s :t 奴o n o m y ;o m o l o g ) r ;v o i c e x m l 独创性声明 本人郑重声明:所提交的学位论文是本人在导师指导下独立进行研究工作所取得的 成果。据我所知,除了特别加以标注和致谢的地方外,论文中不包含其他人已经发表或 撰写过的研究成果。对本人的研究做出重要贡献的个人和集体,均已在文中作了明确的 说明。本声明的法律结果由本人承担。 学位论文作者签名: :茎j 盆 嗍 学位论文使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的规定,即:东北 师范大学有权保留并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文 被查阅和借阅。本人授权东北师范大学可以采用影印、缩印或其他复制手段保存、汇编 本学位论文。同意将本学位论文收录到中国优秀博硕士学位论文全文数据库( 中国 学术期干i j ( 光盘版) 电子杂志社) 、中国学位论文全文数据库( 中国科学技术信息研 究所) 等数据库中,并以电子出版物形式出版发行和提供信息服务。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:潋 指导教师签名: 日期: 拿盟;5 。7 日 期: 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 东北师范大学硕士学位论文 第一章绪论弟一早瑁 下匕 1 1 研究背景及意义 i n t e m e t 的快速发展,使世界发生了翻天覆地的变化。伴随着因特网的迅速发展, 人们访问网络的方式朝着多元化方向发展。传统计算机浏览器浏览因特网的方式已经不 能满足用户的需求,越来越多的人希望可以使用电话,手机等通讯设备浏览网页。人们 需要通过更便捷,更符合自己生活工作习惯的方式来访问因特网。 图像和文字的表达能力有限,表现方式也远不如自然语言更符合人类的需求,所以 人们更倾向于使用自然语言交流。因此友好的语音交互越来越受到人们的青睐,这就需 要i n t e m e t 提供一个供人们通过语音访问网络的平台。 v o i c e l ( 语音扩展标记语言) 是建立在x 】l 规范基础之上的h l t e m e t 标记语 言,是一种语音数据交换标准,给用户提供了通过语音工具访问网络资源的平台。可以 在v o i c e ) a l 的基础上建立语音浏览器,用户通过语音浏览器访问网络资源。v o i c e 舭 作为一种语音数据的交换标准,它能够与数据库,以及其他建立在x m l 标准之上的其 他数据文档进行无缝数据交换,从而把因特网和电话网紧密的结合起来。目前基于 v o i c e x 】l 的语音应用系统有很多,很多学者和研究机构都在这方面做了大量工作和实 践。 用户可以通过语音等越来越多的途径访问因特网,这就给网络服务器和文档处理人 员带来巨大压力。服务器要处理的数据和文档成爆炸状生长,因此迫切需要对信息进行 自动分类,再对每个类别的文档分别处理。以往仅通过关键字对信息进行检索和分类, 准确率和效率不是很理想,因为计算机不能理解关键字所蕴含的语义信息。为了能够更 好地获得语义信息,引入本体的概念,可以借助本体来描述和分析关键字的语义。 传统检索算法所采用的只是基于语法层面上字、词的简单匹配,而缺乏对知识的表 示、处理和理解等能力。解决这些问题的关键在于把信息检索从基于关键字的语法匹配 提升至基于知识( 或上下文) 层面的语义匹配。而本体正是一种用来描述知识的工具。 对本体的研究由来已久,本体是一个起源于哲学的概念,在哲学上来讲,本体论是指存 在论。在人工智能界,对本体看法是“共享概念模型的明确的形式化规范说明”。 因特网发展到一个新的阶段:s e m 觚t i cw r e b ,不仅要让人们能够读懂网络资源信息, 而且要让机器也能读懂这些信息,要让机器明白这些数据包含的语义信息。本体只是对 知识的一种描述,因此仅有这些知识描述还是远远不够的。基于语义的w e b 还需要通 过一定的规则从这些描述性的知识中进行推理。通过规则的推理,使得机器可以抽象出 知识中蕴含的语义信息。基于本体的文本分类,比基于关键字的分类能捕获更深层次的 语义信息,对于信息语义研究有很重要的作用。 东北师范大学硕士学位论文 1 2 基于v o ic e x m l 的语音应用和本体介绍 v 0 i c e l ( t h ev o i c ee x t e n s i b l em a r k u pl a i l g u a g e ) 是一种语音数据交换标准,给用户 提供了通过语音工具访问网络资源的平台。v o i c e x m l 语音应用具有以下几个特点:以 应用、会话、文档为单位建立应用结构;以对话为交互单位,逐个完成对话,确定流程 导向;与作用域相关的语法激活禁止机制;以语音网页为单位,构建复杂的应用层次。 基于v o i c e x m l 的语音网关主要实现两个功能:自动语音识别和语音合成。自动 语音识别:是一种使应用程序能够理解语音输入的技术。计算机系统把语音输入转化成 计算机可以理解和处理的文本。自动语音识别技术使得用户可以通过使用自然语言来代 替按键输入;实现对计算机的操作。语音合成:是将文本数据转换成人类语言的过程。 文本数据被转换成语音形式后,就可以通过电话传递给用户。 有学者把万维网的发展分成两个阶段,第一阶段,万维网应该是人们进行信息交换 和互相合作的强大工具。这个目标基本实现:目前网络以h t m l 页面的方式向人们提 供大量可阅读的信息。第二阶段,这种合作应该延伸到机器。机器应该能够分析使用万 维网上的数据。这是目前的一个研究热点。然而由于h t m l 本身固有的缺陷,使得它 难以胜任,因此x m l 应运而生。x 】l 最大的特点就是它描述的是数据的内容而不是 数据的表现形式。为了满足机器能够自动处理网络信息的迫切需求,有人提出下一代万 维网的构想语义网络。t i mb e m e r sl e e 在x m l 2 0 0 0 大会上提出了语义网络的基本 体系结构。本体层在语义网络中,处于核心支配地位,为其他各层提供基础服务。但是 本体只是对知识的一种描述,仅有这些知识描述还是远远不够的,基于语义的w - e b 还 需要通过一定的规则从这些描述性的知识中进行推理。而语义网络中的逻辑层就是用来 完成这项任务的。通过规则的推理,使得机器可以抽象出知识中蕴含的语义信息。 本体的概念起源于哲学领域,被定义为“对世界客观存在物的系统地描述,既存在 论”。本体这个哲学概念,被人工智能界赋予了新的定义,从而被引入信息科学中。n e c h e s 等人最早给出本体定义“给出构成相关领域词汇的基本术语和关系,以及利用这些术语 和关系构成的规定这些词汇外延规则的定义”。目前对本体概念的统一看法是“共享概 念模型的明确的形式化规范说明”。p e r e z 等人给出了本体的建模原语,包含五个基本 的建模原语:类( c l a s s e s c o n c e p t s ) ,关系( r e l a t i o n s ) ,函数( 矗m c t i o i l s ) ,公里( a x i o m s ) ,实 例( h l s t a m c e s ) 嘲。 本体的表示方式可以多种多样,本文使用w 3 c 制定的0 w l 语言来描述本体。它 是d a m l + o i l 的修订版本。o w l 相对于x m l 、r d f 和r d fs c h e m a 拥有更多的机制 来表达语义。o w l 提供了三种表达能力递增的子语言0 w ll i t e 、o w ld l 和0 w lf u l l 。 o w l 语言可以看成是谓词逻辑的一种特殊化形式,它是通过公理来表示谓词逻辑。 对于逻辑语言,表达能力和计算复杂性之间存在着一种制衡关系,表达能力越强,效率 越低。o w ll i t e 和o w ld l 能够粗略的表达谓词逻辑的一个子集,描述逻辑。而规则 系统,又称h o ml o g i c ,是谓词逻辑的另一个子集。 描述逻辑和h o ml o g i c 是正交的,二者没有交集。o w l 可以表达描述逻辑,但是 4 东北师范大学硕士学位论文 如果需要在知识上进j j :更进一步的逻辑推理,就需要在本体的基础上建立规则系统,使 用规则来进行逻辑推理。描述逻辑和规则系统二者相辅相成,结合起来能够实现更全面 的推理。 目前编辑和开发本体的工具很多,本文采用了美国斯坦福大学的p r o t 6 酌3 2 1 作为 构建本体的平台。p r o t 6 9 6 是一个开源的本体编辑器,它是基于j a v a 的可扩展平台,提 供了很多p l u g - i n 和a p i 函数。p r o t 6 酌平台主要提供两种构建本体的方法:p r o t 6 9 6 f r a m e s 和p r o 琵9 6 o w l 。 1 3 基于本体的应用 本体是一种知识表示方法。知识表示方法通常可以分为基于符号的表示方法和基于 连接机制的表示方法。基于符号的表示方法主要是面向逻辑知识的表示,如一阶谓词逻 辑表示法、产生式表示法、框架表示法等;而基于连接机制的表示方法主要是面向形象 知识的表达,如语义网络等。由于在知识表示方法中存在很多问题,有人提出了知识本 体的概念。所谓知识本体是指对领域知识的共享概念模型和明确的形式化规范说明。 本体的应用主要有两个方向:概念以及概念分类;本体上的代数。其中最有代表性 的是g u a r i i l o 等人对概念以及概念分类的研究。本体的本质是描述知识的概念模型,以 及概念之间的关系。本体在应用的过程中一直受到一个问题的困扰,即分类的标准不统 一,没有一个很好的分类理论。不同的应用导致了对概念的不同分类,使得概念分类很 难保持一致性和合理性。g u a m o 等人对概念分类做了深入细致的研究,对本体分类进 行了详细的分析,提出了有效的概念分类理论。 g 1 l a r i n o 等人从概念的本质出发,归纳出概念的元特性,并用逻辑公式给出元特性 的严格形式定义。在此基础上,他们讨论了元特性之间的关系和约束,最终把研究结果 作为概念分类的基础理论工具,由此提出一套完整的概念分类体系结构。在该理论体系 机构中,概念分类的基础是概念的元特性。在分类过程中,以元特性为基准,按照一定 的规则,把具有相同元特性概念分为一类,进而给出一般意义上的概念分类体系。概念 的基本元特性包括:持久特性、非持久特性、反持久特性、半持久特性、载体表示特性、 支持标识特性以及外部依赖特性。 在g u 撕n o 的理论体系结构中,概念的差别体现在概念的元特性上。对于持久特性 概念,它的定义表示该概念的所有实例永远都是它的实例。而非持久性概念表示概念的 某些实例不会永远属于该概念。 随着计算机以及计算机网络的迅速发展,越来越多的数字信息在给人们提供服务的 同时,也使人们觉得处理大量的信息是件让人觉得力不从心的事情。因此,如何组织和 利用信息就成了信息系统要解决的关键问题。 目前信息检索技术可分为三类:全文检索、数据检索和知识检索。全文检索并不考 虑语义匹配,虽然可以保证查全率,但是查准率却很低。数据检索由于要求数据要匹配 一定的字段格式,也有很大局限性,而且对语义匹配支持能力较差。而知识检索强调是 东北9 币范大学硕士学位论文 基于知识、语义上的匹配,因此在查准率方面有更好的保证。以往基于关键字的信息检 索技术已经不能满足用户在语义和知识上的要求,因此研究人员不断的探索新的方法。 本体的本身特点决定了它会在知识检索中得以广泛应用。 1 4 本文主要工作 本文的主要目标是在相应领域构建本体,在本体的基础上构建规则系统,把本体和 规则系统应用到文本分类中。 本文介绍了基于i c e x m l 的语音网关主要实现的功能。由于以往以关键字为基础 的分类不再能够满足目前的需求,所以提出了通过本体进行分类。 本文讨论了本体在语义网络中的作用,介绍了本体的概念,表示方法等。本体是对 知识的一种描述,但是仅有这些知识描述还是远远不够的,因此需要在本体的基础上对 知识进行推理。通过规则系统的推理,使得机器可以识抽象出知识中蕴含的语义信息。 本文主要讨论了本体在文本分类中的作用,本体是一种知识表示方法。通过本体建 模,使用推理规则,推导出文本中蕴含的语义信息。 本文提出了基于本体和规则系统的分类算法。并根据该算法进行了实验,通过实验 来验证该分类算法的分类效果。 1 5 论文的组织结构 本文主要讨论了基于v 0 i c e x m l 的语音应用和本体在文本分类中的作用。基于 v o i c e x 】l 的语音系统给用户提供了通过电话系统访问网络资源的语音平台。本体能够 描述领域内的知识结构。规则系统可以推导出蕴涵在数字信息中的知识。本体能够通过 使用推理规则,推导出文本中蕴含的语义信息。 本文的第二章介绍基于v o i c e l 的语音应用,介绍了v o i c e ) a l 文档规范,详细 地描述了基于v o i c e l 的语音网关的结构和工作原理;第三章介绍本体和规则,叙述 了本体的定义,建模原语,在语义网络中的作用以及表示方法,介绍了基于本体的规则 和规则系统;第四章介绍基于本体的分类算法,介绍了构建本体的平台以及规则在分类 算法中的应用;第五章介绍实验结果;最后对全文予以总结以及下一步研究计划。 6 东北师范大学硕士学位论文 第二章基于v o i c e x m l 的语音应用 2 1v oic e x m l 介绍 、b i c e x m l ( t h e 、b i c ee x t e l l s i b l em a r k u pl a l l g u a g e ) 是由i b m ,l u c e n t ,m o t o r o l a 和 a t & t 于2 0 0 0 年提出的用来创建音频对话的可扩展标记语言。v o i c e x m l 的起源可以追 溯到1 9 9 5 年,朗讯和a t & t 分别开发了不同版本的电话标记语言。而摩托罗拉公司开 发了v o x 池,i b m 公司开发了s p e e c h 语言。这些公司最终提出了一种基于语音浏览的 标记语音v o i c e x m l 。2 0 0 4 年3 月发布了v 0 i c e x m l 的最新版本是2 0 。v o i c e ) m 也 以l 语言规范为基础,为电话语音用户提供使用界面。 2 1 1v o i c e x m l 文档规范 一个v o i c e x l l 文档( 或一系列相关的文档a p p l i c a t i o n ,即应用) 构成了一个 有限的会话状态。用户一次只能在一个会话状态或d i a l o g 中。而每个会话都会确定要跳 转的下一个会话。跳转通过统一资源标识符u m 来确定,u 如果没有指向一个文档, 则默认它指向当前文档。如果会话没有指定它的下一个会话,或者它有明确退出会话的 元素,则进入中断。在v o i c e l 应用系统中,会遇到下面几个概念。 1 对话和子对话( d i a l o g s 和s u b d i a l o g s ) 。、b i c e x l v i l 定义了两种类型的对话:表单 ( f o m l ) 和菜单( m e n u ) 。f o m 用来输出提示信息和收集输入信息,m e n u 向用户提供选择, 决定下一步要做什么。f i e l d 是一个输入域,用户必须给矗e l d 提供一个值,否则就不可 能进行到f o n n 中的下一个元素。子会话类似于函数调用,它提供了一种调用一个新的 会话的方法,首先保存类似函数调用的中断现场,保存一系列的相关参数和变量,调用 结束后返回文档。 2 s e s s i o n 开始于用户开始和v o i c e l 解释器环境交互,伴随着用户请求结束而 结束,包括了加载和执行文档的过程。 3 a p p l i c a t i o n 是由共享同一应用根文档的一系列文档组成的。在一个请求中,用 户和文档的交互总是工作在请求根文档下,请求根文档总是被加载。当用户在统一应用 的其他文档中跳转时,请求根文档总是被加载,直到用户跳到下一个不在这个 a p p l i c a t i o n 里的文档。当a p p l i c a t i o n 的根文档被加载时,它的变量就像这个a p p l i c a t i o n 的应用变量一样,这个a p p l i c a t i o n 里的所有文档都可以使用它的变量。图2 1 展示了 一个a p p l i c a t i o n 中,共享同一根文档的几个文档之间的跳转。 7 东北师范大学硕士学位论文 图2 1 在a p p l i c a t i o n 中文档的转换 4 g r a m 瑚a r ,每个d i a l o g 都有一个或多个语音或d t m f 语法。每个d i a l o g 的语法只 有当用户在那个d i a l o g 中的时候才激活。在混合主动式对话中,用户和系统交替控制下 一步操作,系统会标记其中的一些会话,使得这些会话的文法能够在同一文档的其他会 话时也起作用。 5 e v e n t ,v o i c e x m l 提供了填充f o m 的机制来处理正常的用户输入,v o i c 僦 也定义了一种机制来处理异常,当遇到异常时系统就抛出事件。假如用户在一定时间内 没有应答,或者v r o i c e x m l 文档中发现语义性错误等情况下,应用平台会生成事件。 6 l i n k ,支持混合主动式。它可以指定一个语法,无论何时,只要用户在这个l 址 的作用域内,这个语法都是激活的。如果用户的输入匹配了这个1 珧的语法,控制就跳 转到该l h l l 【指定的u 。 2 1 2v o i c e x 地文档的解析 要对v o i c e x m l 中的语义信息进行分析,就要对v 0 i c e l 文档进行解析。 v o i c e 订l 文档首先是一个咀。文档,因此在对、b i c e x l v 几解析前现要对它进行v i l 解析。现有的x m l 解析器有两种:d o m ( d o c u i i l e n t0 b j e c tm o d e l ) 接口解析器和 s a x ( s i n l p l ea p p l i c a t i o nm 血c e f o rx m l ) 接口解析器。 d o m 即文档对象模型,是h t m l 文档以及x m l 文档的应用程序接口。d o m 提 供了一种标准的程序接口,可以应用于不同环境和应用程序。d o m 定义了文档的逻辑 结构,提供了对文档进行访问和操作的方法。d o m 给开发人员创造良好的处理文档的 机制,可以动态创建文档,遍历文档结构,添加、修改和删除文档内容,改变文档显示 方式等等。d o m 可以使得应用程序以分层次对象模型来访问存储在x m l 文档中的信 息,d o m 根据x m l 文档生成一棵节点树,通过访问树中的节点来添加、修改和删除 文档的内容。 s a x 接口规范是x m l 分析器和x 1 l 处理器提供的比x m l 更底层的接口。它给 应用提供了较大的灵活性。s a x 是通过事件驱动来访问x m l 文档的,而不是根据x m l 文档结构生成一个树型结构,不必像d o m 一样给每个要处理的x 胤文档在内存中生 成一个对象树。而s a x 在解析x m l 文档时,并不需要全部读入v i l 文档。因此s a x 8 东北师范大学硕士学位论文 在解析x m l 文档时,速度更快口刮。 v o i c e l 解释器需要具备以下功能:对话管理,主要就是f 认算法的实现;事件 处理,主要是非正常对话流程的管理;语法管理,在搜集用户输入的过程中需要激活相 应的语法。 针对v o i c e x m l 语言解释的过程中,需要反复浏览不同节点元素,因此采用d o m 树结构会更加便利。在解析v o i c e x m l 文档是,需要生成d o m 树,经、b i c e x 】l 解析 器的解析,形成对象生成树。生成树是根据v o i c e l 文档中各个标记的相互关系生成 的,生成树的结构实际上表示了v o i c e x m l 文档的层次结构。生成树中元素分成四个层 次:根d o c u m e n t 层,d o c u m e n t 层,d i a l o g 层和i t e m 层。在对象树中,每个节点元素 都和其子节点之间有一对双向指针。v o i c e l 文档与生成树的结构对照关系如图2 2 和图2 3 所示。 图2 2 、,o i c e x m l 文档结构 对象树是采用标准的d o mp a r s e r 来分析流程文档而生成的。通过驱动a s r ,把 v 0 i c e x m l 文档所包含的语音数据转换成文本数据。根据生成的对象树,生成一个儿 文档。对象树的节点对应x m l 文档的各层次节点。对生成的l 文档进行基于本体 的分类。用户输入的语音数据被转化成连续的文本数据,因此在对x m l 文档进行分类 之前,还要对这些文本数据做进一步处理。 9 东北师范大学硕士学位论文 v o i c e x m l 文档对象树 图2 3 、,o i c e x m l 文档结构树 例子:要求用户选择一种饮料,然后把它提交给服务器端的一个脚本。 w o u l dy o uli k ec o f f e e ,t e a , il k ,o rn o t h i n g ? 下面是这个例子的一个简单的人机交互: c ( c o m p u t e r ) :w o u l dy o ul i k ec o f f e e ,t e a ,m i l k ,o rn o t h j n g ? h ( h u m a l l ) :o r a l l g ej u i c e c :id i dn o tu n d e r s t a n dw h a ty o us a i d ( ap l a t f o m s p e c i f i cd e f 砌tm e s s a g e ) c :w o u l dy o ul i k ec o f f e e ,t e a ,m i l l 【jo rn o m i n g ? h :t e a 2 1 - 3 基于v o i c e x m l 语音应用的结构 v o i c e l 是用来创建音频对话的,主要包括语音合成、数字化音频、语音识别、 1 0 东北师范大学硕士学位论文 d t 按键输入识别、录音、通话、混合主动式会话。基于v o i c e ) ( 1 l 的语音应用都是 建立在图2 4 所示的结构模型上。 这个结构模型主要由d o c u i i l e n ts e e r ,即文档服务器,v o i c e x 】li n t e r p r e t e r c o n t e x t ,即v o i c e ) 刚l 文档解析环境,以及应用平台构成。v o i c e x 】l 文档解析环境给 文档解析器提供了一个和服务器以及应用平台进行交互的环境,对解析器起到支撑作 用。而具体的实现平台包含了a s r ,t t s ,a u d i o 和d t m 等等。用户通过应用平台提 交自己的文档,文档被v 0 i c e x l 儿解析器解释后,通过解析器环境向文档服务器提交请 求( r e q u e s t ) ,文档服务器根据相应的语法对用户的请求给予响应s p o n d ) 。 图2 4v o i c e 舭结构模型 用户通过客户端应用程序向服务器提出请求,v o i c e ) 洲l 解析器环境监听客户端应 用程序输入,并把用户请求发送给文档服务器处理。用户和服务器之间通过v o i c e x m i , 解析环境进行交流。交流的载体就是v o i c e l 文档m 。 2 2v oic e x m l 的目标和特点 2 2 1v o i c e ) 【m l 的目标 v o i c e ) ( 1 l 有三个主要目标:最大限度地将w e b 开发和w r e b 数据内容传输的能力 引入到语音应答系统中,在i n t e m e t 的平台上把计算机网络和电话网络整合到一起;将 该领域的程序员从底层代码解脱出来,程序员不必再考虑应用程序底层接口的问题,在 v o i c e x 】l 的基础上进行应用层面的设计;资源管理。语音服务和数据服务可以通过 c s ( c l i e 州s e e r ) ,即客户服务器模式结合起来。用户通过和执行平台之间的一系列的 交互对话,就可以浏览语音服务了。文档服务器提供这些对话,但文档服务器和执行平 台可能不在同一台机器上。文档服务器负责提供全部的服务逻辑、数据库、相应的系统 操作、生成对话框。 v o i c e v i l 文档会明确说明每一个交互式对话,v o i c e x m l 解释器负责解析这些对 1 1 东北师范大学硕士学位论文 话。用户的输入会影响到对话的解释,并且这些输入也会被提交给文档服务器。文档服 务器提供另一个v o i c e x m l 文档以继续用户和其他d i a l o g 之间的会话。 2 2 2v o i c e x m l 的特点 v o i c e l 是一种标记语言,它有以下优点: 1 可以在每个文档中指定多个交互式对话,最大限度地减少客户机和服务器之间的 交互; 2 给不同的应用平台提供统一的接口,使得程序员可以忽略底层和平台特有的细 * 印; 3 使得用户交互的代码( 在v o i c e l 中) 和业务逻辑( 例如c g i 脚本) 分离; 4 提高业务在不同平台的可移植性。v o i c e x m l 对内容提供商、工具提供商和平台 提供商来说是一种通用的语言; 5 它可以很容易地应用到简单的交互中,也可以通过提供一些语言特性来支持复杂 的对话。 v o i c e l 文档描述的是由语音应答系统提供的人机交互的语音信息。v 0 i c e x m i , 包括以下几个方面。语音合成( t e x t - t 0 一s p e e c h ) ;声音文件的输出;语音输入的识别;d t m f 输入的识别;对话流的控制;以及电话的一些特性,如呼叫转移和挂机。 2 3 基于v o i c e x m l 的语音网关 基于v o i c e l 的语音平台主要实现两个功能: 1 自动语音识别 自动语音识别o 址o m a t e ds p e e c hr c o g m t i o n ,a s r ) 是一种使应用程序能够理解语 音输入的技术,计算机系统把语音输入转化成计算机可以理解和处理的文本。自动语音 识别技术使得用户可以通过使用自然语言来代替按键输入,实现对计算机的操作。 2 语音合成 语音合成( t e x tt os p e e c h ,t t s ) 是将文本数据转换成人类语言的过程,文本数据被 转换成语音形式后,就可以通过电话传递给用户。 用户通过语音网关访问网络,语音网关通过驱动a s r 和t t s 实现和用户的语音交 互。语音网关通过语音语法来检查用户输入,把和用户之间的交互信息形成v o i c e x m l 文档,并通过该文档和w e b 服务器进行交互。w e b 服务器接收到用户的请求,通过脚 本语言,提取用户的请求,把满足用户请求的文档返回给语音网关。这样语音终端用户 就可以像计算机终端用户一样,方便地访问网络资源了。不同的是,w e b 服务器返回 给计算机终端的文档是h t m l 文档,而返回给电话用户的文档则是v o i c e x m l 文档。 其过程如图2 5 所示 1 2 东北师范大学硕士学位论文 图2 5 语音网关结构模型 语音网关主要由两部分组成,语音浏览器和语音解释器。当语音网关接收到用户的 请求时,语音浏览器使用网络协议提取相应的v 0 i c e x m l 文档,并对其进行解析,向文 件服务器发出请求,接受服务器反馈信息,把反馈信息转化成v o i c e x m l 文档。语音网 关通过驱动a s r ,t t s 等来完成和用户之间的交互。 2 4 小- 结 基于v o i c e l 的语音网关帮助用户通过电话终端访问网络。语音网关主要有两个 功能:自动语音识别和语音合成。语音网关主要由两部分i 语音浏览器和语音解释器。 语音解释器负责解释v o i c e l 文档。通过对比d o m 接口和s a x 接口的异同以及各 自的优缺点,在v o i c e l 解析器中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年曲靖师范学院辅导员考试真题
- 以业绩为导向的工作规划计划
- 2025届浙江省新昌县联考七下数学期末预测试题含解析
- 手术室流程优化与反思计划
- 2024年宁波市附海镇招聘工作人员笔试真题
- 2024年国务院国资委研究中心招聘笔试真题
- 软件更新管理测试题及答案分析
- 避开雷区2025年法学概论考试试题及答案
- 2025届吉林省延边七年级数学第二学期期末统考模拟试题含解析
- 客户端与服务器设计考察试题及答案
- 公安情报学试卷附有答案
- 西方影视欣赏智慧树知到期末考试答案章节答案2024年济宁医学院
- 新生儿消化道出血的护理查房
- 2024年贵州省贵阳市南明区中考一模考试物理试题
- 电梯维护保养规则(TSG T5002-2017)
- 六年级择校考试卷
- 髂总动脉瘤的护理查房
- 红色美术鉴赏智慧树知到期末考试答案2024年
- 量化考研-2024中国大学生考研白皮书-新东方
- 施工固定总价合同
- 《施工现场消防》课件
评论
0/150
提交评论