




已阅读5页,还剩53页未读, 继续免费阅读
(模式识别与智能系统专业论文)人机对话系统中智能对话管理平台的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人机对话系统中智能对话管蠼平台的研究与实】j l 摘要 人机对话系统中智能对话管理平台的研究与实现 攘要 人机对话系统直是多年来的研究热点,随着语音识别等技术的 酲渐宪善,作为人橇对话系统棱心功麓体现豹对话管瑾越来越成为研 究热点。对话管理控制用户和系统的整个对话过程,决定系统的所有 动作,因此对话管理的设计完善程度关系着整个系统的性能。本文研 究与设诗惑人褫警藐对话管理平台是嚣囊2 0 0 8 年j 毛索奥运会鳇多滏 言智能信息服务系统核心平台的一部分,该系统面| 向多个任务领域, 给对话管理提出了很大的挑战。混合主稃的对话管理系统的关键问题 是爰户输入偏离掰期望的对话颞j 芋;焉多主题熬怼话管理系统豹核心 问题是主题选择以及主题之间的平滑切换。本文提出了一个事件驱动 静、基于目标的、多个主题褥结梅酶对话管壤平台,麓够穰好的解决 以上润题。这个对话管理嚣采用嚣囱对象约多个主题挝组成的知识库 结构,能够实现自由主题切换、用户一系统混合主导、异步输入以及 灵活控制,捌用良树结构为j 羲序陡超委| 语言提供与对话处理过程豹紧 密耦余。 关键谰:人拱交互对话篱理多主题矮谖痒智鑫塞撼瑾 垫照至墨簦壹塑! ! 翌亟蹩望! 鱼墼堑壅兰壅盥一塑墨 墨遇s e a r c 联a n dl 蠢匿p l e m e n t a t i o n o n l n 蕈e l 毛l g e n 零薹a l o g 麓a n a g 嚣麓e n 罩王l a 罩f o l 心嫒 i nr o b 0 1 二h u m a ni n t e r a c t i o ns y s t e m a 8 s 蕈r a c t h u m a n - c o m p u t e r i n t e r a c t i o n s y s t e m h a sb e e nt h eh o t t o p i c i n a r t i f i c i a li n t e l l i g e n tf i e l df o ra l o n gt i m e 。灏l i l et h eg r a d u a li m p r o v e m e n t o f s p e e c hr e c o g n i t i o nt e c h n o l o g y , t h ed i a l o gm a n a g e m e n t ,t h e c o r e f u n c t i o no fh u m a n - c o m p u t e ri n t e r a c t i o n s y s t e m ,h a sb e c o m et h ek e y p r o b l e m d i a l o gm a n a g e m e n t c o n t r o l st h ei n t e r a c t i o nb e t w e e nt h es y s t e m a n dt h eu s e ra n dd e c i d e sw h a tt h es y s t e ms h o u l dd on e x ta c t i o n s ot h e d e s i g no fd i a l o gm a n a g e m e n ti st h ek e yp r o b l e mt h a ta f f e c t st h es y s t e m p e r f o r m a n c e t h eh u m a n c o m p u t e rd i a l o g u em a n a g e m e n t t h a tt h i sp a p e r w o r k so ni sa p a r to f m u l t i l i n g u a li n t e l l i g e n ti n f o r m a t i o ns e r v i c es y s t e m f o r2 0 0 8 b e i j i n go l y m p i c t h i ss y s t e m c a n p r o v i d e m u l t i f i e l d i n f o r m a t i o n q u e r y t k e yp r o b l e m o fm i x e di n i t i a t i v e d i a l o g u e m a n a g e m e n t i s 编戤t i l e - t a s e ru t t e r a n c eo f t e nd e p a r t s 出e e x p e c t e dd i a l o g u e o r d e r 弧ek e r n e lp r o b l e mo f m u l t i t o p i c sd i a l o g u em a n a g e m e n t i st o p i c s e l e c t i o na n ds m o o t hs w i t c h a m o n gm u l t i p l et o p i c s t l l i sp a p e rp r e s e n t s a d i a l o g u em a n a g e rw h i c hc a r ls o l v et h e s ep r o b l e m sw e l l 醮i sd i a l o g u e m a n g e r w h i c h c o m p o s e d o fm u l t i - f i e l do b j e c t - o r i e n t e d k n o w l e d g e b a s ei s e v e n t - d r i v e n ,o b j e c t - b a s e d a n dc o m p o s e do fm u l t i - t o p i ct r e e s i tc a n i m p l e m e n t s m o o t h t o p i cs w i t c h ,m i x e di n i t i a t i v e ,a s y n c h r o n o u si n p u ta n d f l e x i b l ec o n t r 0 1 k e y w o r d s :h u m a n - c o m p u t e ri n t e r a c t i o n ,d i a i o gm a n a g e m e n t , m u l t i - t o p i c ,k n o w l e d g eb a s e ,i n t e l l i g e n c er e a s o n i n g 珏 人帆对话系统中智能对话管理平台的研究与实现 声删 独创性声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得北京邮电大学或其他教育机构的学位或证书而使用过的材 料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢 意。 申请学位论文与资料若有不实之处 本人签名:三翻孽一 本人承担切相关责任。 目期: 丝:三:! 垒 关于论文使用授权的说明 学位论文作者完全了解北京邮电太学有关保留和使用学位论文的规定,即:研究生在校 攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保留并向国家有关部 门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论 文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 本人签名: 圣自 一 目期: 妒么;i ; 本人签名: 受到 日期: 竺兰z ! ! 兰 导师签名: 人机对话系统中智能对话管理平台的研究与实现 第一章引言 第一章引言 随着信息时代的到来,人类对于计算机具有越来越多的依赖性,希望能够借 助计算机完成更多的工作。人机对话系统就是在人类研究与计算机通信的过程中 提出发展起来的。最初的人机交互是人们通过按键,控制鼠标等输入设备控制计 算机,同时通过显示设备获得信息,但是这种交互方式并不是最优的。人们希望 能够采取更加自然的方式进行信息获取,信息显示和信息交流,使设备具有更加 人性化的人机界面。一种有效的方法就是让人们采用自然语言和机器交流,就像 我们平时交谈一样。 人工智能是研究用机器模拟人脑所能从事的感觉、认知、记忆、学习、联想、 计算、推理、判断、决策、抽象、概括等思维活动,来解决人类专家才能处理的 复杂问题的理论。人工智能将问题求解作为人类思维活动的最主要的内容加以研 究和模拟。人工智能中的问题求解是建立在知识基础上,获得大量的知识才能够 解释问题,然后采用推理的方法进行问题求解。 人机对话系统是人工智能理论的一个主要应用,应用了人工智能各个方面的 理论,包括语音识别与合成、智能对话管理、自然语言理解、自然语言生成等等。 人机对话系统是用户与计算机应用之间的用户界面,具有智能控制,推理功能, 能够以自然语言形式为用户使用数据厍提供灵活,方便,友好的用户界面。 在过去的几十年间,为了实现这个目标,人们在语音技术,自然语言处理, 人工智能领域进行了许许多多的研究工作,这些努力使人们朝这个目标前进了很 大一步a 随着这些技术的日渐成熟,对话管理的设计成了人机对话系统的核心问 题,决定系统和用户交流的过程,所以对话管理逐渐成为对话系统中的研究热点。 在目前的技术水平下,人们设计的对话管理模型能够在定义好的限定领域内进行 简单的人机交互,但目前的技术水平在很多方面还存在缺陷和不足,世晃各地的 相关工作者正在积极努力工作以研究出更好的对话管理系统,使人机对话更加自 然、流畅。 人机对话系统中智能对话管理平台的研究与盛现 第一章引言 1 1 人孝凡对话系统的概念 在近三十多年闻,“可以交谈的计算橇”一袁是语音技术、蠢然语言理解、 人工智能等领域的磺究工作者的磷究目标。近几每,随着以上技术领域内的显著 进步,人机对话系统正逐渐走入商用。 入飙黠话系统秘焉语案谖剥、谌畜理翳秘语毒会残等鼓寒模拟人豹瞬爨、语 言分析能力,模仿人际间对话方式与用户进行对话,从而宛成人和计算机之间的 僖慧交滚。人瓿慰淫系统蘸楚_ 予入粒诗算裁之阉赘系统,游嚣滔户嚣要l 嚣雾辊完 成任务。系统能够提供对话交流,使用户和系统能够以自然发好的方式进行交谈, 戆够理解掰户输入静语音爝害,弗能够穰据绘定模域的皴识和概念遴行维理, 明确用户的意图,完成用户的需求。比如,系统应该能够向用户撮阀以获德完成 用户意图所需要的信息。对话系统允许用户和机器交互:舱索信意、执行交易或 其他闽题求解( p r o b l e m s o l v i n g ) 。 可以这样理解人机对话系统,它是一种以t u r n b y - t u r n 方式与用户进行交互 熬诗雾极鬃绞,涉及至l 了骚语对落瑟枣熬稳关技术:语音谖裂、瀑誊合成、文本 分析以及辩话管理等等。般来说,人机对话系统包含以下几个模块,如图1 1 新示: 语音识别模块( s p e e c hr e c o g n i t i o n ,s r ) ,该模块接收用户的语音输入信号 并将它解硝成文本信息。 自然谗言理解( n a t u r a ll a n g u a g eu n d e r s t a n d i n g ,n l u ) ,该模块分析语音识 勇模块输出的文本信息,建立输入话语的语义表示。 嚣台鼗务摸竣( b a c k e n d ) ,该模块按爨对话管遴模块接收到豹爝户输入售息 进行数据岸查询、消歧工作,并将查询、消歧结果返回给对话管理模块。 蠢然语言生藏模块( n a t u r a ll a n g u a g eg e n e r a t o r ,n l g ) ,该模块臻采将系统 输出信息转换成用户可以理解的髓然语言格式,将对话管理模块输出的询问、确 认、澄清、套询缭采信意等等转变成用户能够理解的自然语言。 语音,主出模块( t e x tt os p e e c h ,t t s ) ,该模块负责将自然诱言生成模块输 出的文本信息转换成语音格式,输出给用户。 对话綮理模坟( d i a l o g u em a n a g e m e n t ,d m ) ,该模块磐释盎然语富瑾薅摸 块输出的语义表示,并根据特定领域的知识库和对话历史进行知识推理,分析确 人帆对话系统中智能对话管理平台的研究与实现 第一章引言 定用户意图,决定系统下一步将要采取的动作从而控制整个对话流程,系统动作 包括进行后台数据库查询、发出询问、进行消歧、给用户返回结果等等。 从中我们可以看出,对话管理模块( 对话管理平台) 的作用非常重要,系统 说什么,做什么,怎么做都由对话管理模块决定。因此对话管理模块的设计关系 到整个系统的性能,对话设计是否合理,用户是否满意,对话过程中的意外情况 处理( 中断、差错等等) ,对用户输入能否正确理解等等,这些都是对话管理模 块所要解决的问题。 目前的口语对话系统大多是面向一些较简单的人机交互任务,即使计算机具 有一定的智能,能够在问题解决过程中主动合作,但是大多数的口语对话系统仍 然是由系统进行主导,给予用户的自由度不大。 图卜1 对话系统的基本组成结构 1 2 人机对话系统的发展 对话系统涉及到了语音识别,自然语言理解等多个学科技术,虽然这些学科 技术的研究早就开始了,但是作为综合了多种技术的新研究领域,对话系统的出 现相对较晚。口语对话的研究始于七十年代初,2 0 世纪8 0 年代末期两项政府 资助的项目导致了口语对话系统的出现 1 0 1 。这两个项目分别是美国的a r p a s p o k e nl a n g u a g es y s t e m ( s l s ) p r o g r a m 和欧洲的e s p r i ts u n d i a l ( s p e e c h u n d e r s t a n d i n ga n dd i a l o g u e ) p r o g r a m 。他们都涉及到旅行方面的数据库操作,限 定在一个特定的任务领域,任务的词汇量并不大。 人机对话系统中智能对话管理平台的研究与实税 第一辩引言 扶1 9 9 0 年到1 9 9 4 年,美国裔缀研究黼劐署( a m e r i c a na d v a n c e dr e s e a r c h p r o j e c t a g e n c y ) 启动了s p o k e nl a n g u a g es y s t e m ( s l s ) p r o g r a m ,将a t i s ( a i r t r a f f i ci n f o r m a t i o ns e r v i c e st a s k ) 指定为数据收集和评估的研究任务,允诲用户 从窝方数掇淳中或谗费用秘飞行信患等等。对话过程串,系统可能黯要和用户进 行些交甄以获得完全信恿,但最大多数的查询寓够在单次查询中获得缀果。 1 9 9 5 年该系统终续蠡寸,最好魏系统达型了2 f 3 懿诵误识攀秘1 5 。2 兹訇予误识 率。 歉溅豹s u n d i a l 瑷蠢渗及到靛班信惑耱灾车穗惠,涛慰话建模帮日落语言 生成作为研究项目的核心部分,在对话机制控制方面取得了一些有意义的进展。 许多蔫名的学瓣移研究税梅氇宽襁开葳这项研究,琵皴m i t 静s l s 实验室、 c m u 的i s l 实验童、l u c e n t b e l l 实验室、日本的a t r 实骏室、德国的 e r l a n g e n n u r e m b e r g 大学和p h i l i p s 公司等。 在国内,中科院蹇动化掰、清华大学、香港中文大学、台湾大学等也瓤投入 了相当大的精力进行这方黼的研究。其中中科院自动化所研发了北极星l o d e s t a r 系绫( h u a n gc 。,1 9 9 9 ) ,它楚一令罄逶语蜀语鼹话系统,髭够提 盐簸涝售惑羧务, 根据客户的兴趣爱好提供旅游信息和规划恰当的旅游路线。e a s y n a v 是一个用于 涛肇校匿静游酶墨语对话系统,是箍供灞肇大学校瓣肉建赢信息蠢溺骚务静舀语 对话系统。用户可以询问特定地点信息,焱询满足黉求的地点,询问到特定地点 的走法,鬣进行其它校茜信息的套询。 综上鼹述,人枫对话聚统作尧辩自然、友好豹照务系统,已经撂到了广泛 的研究和威用,但这些人机对话系统大都蹙面向单个任务领域内的口语对话,并 没囊涉及剩多个矮务领域靛复杂馕猿。在蹿话系统串,还京在一系舞攥战戆豹运 题,尤其是面向多个对话领域的知识库构建和智能推理,这直接关系到系统的功 麓完善程度菇及焉户满意发淹题。 1 3 对话管理研究现状 随着对话系统越来越受到关注,其他相关技术臼渐成熟,对话管理逐渐成 灸对话系统的研究核心。从对话系统产生至今,对话管理经历了几代的演亿: 毒 人扫l 甜话系统中智能对活筲理、f 台的研究与实现 第一常i f 言 第一代:主要戳关键字驻配和旬鳖匹配为特征。主要策貉是在输入句子中查 找关键词进行匹配,对话管理知识艨中具裔很多关键词短谢一反映对,如果找到 匹配关键词就产生栩应的应答,如果找到多个匹配关键词就随机挑选个进行应 答。 第一代采用的技术到现在仍然还有很强的生命力,基予关键词,句型匹配的 策港在蕊在兹系统审还是不霹装少瓣。 第二代:主要怒基于规划的对话系统,这是当前技术的主流,歼始应用于商 、韭,服务业各个领域。其特点主要怒面向特定应需领域,主题受陵,正确髋高, 系统在对话过程中起主导傍用。 按照对话组织策略来分这类对话系统常用的对话管理模型有有限状态模型 和羹缝织模墼:在煮隈状态模型中,系统事先定义好艨有哥糍敷对话状态f 烩写 户键示、帮助、和其它服务器的交蕊等) 并制定这魃状态间的转移机制,组成有 疆羧态疆终,这些捩态将决定蘑毒会法懿对话逯稷。壶子麓话路径攀先确定,当 用户提供的信息比鬟求的多时,系统将不能处理:如果考虑任一情况下用户所有 可能的回答,刘获态数会激灌,给对话管理带来校大负担;鲡采任务的各个参数 之阕有复杂的关系,鬻要用户和系绕起协商,则模型不能适用 对于一些较复 杂的任务,生题问的转换非常困难,且难以完成用户对自穗前面所说话的修改。 在妻组织模型中,对话过程事先并不确定,完全依据姿兹对话炊态豹动悫发 展而变化,这避免了有限状态模型中事先定义状态茅廿转移的工作,便于处理复杂 夔镪务,霹活控簇较隽灵瀵,易予实现对落豹久投滢台圭器。鸯缀织摸羹涛特 定的对话任务划分为多个小目标,控制对话过程逐步实现它们,并嫩终完成整个 对话任务。这个模黧表达对话狭态静能力强,餐需鬃寻求一个荮的数据结构以及 相戍的对话管理策略。 , 自组织对话系统中,技照对话的基础不蔺又可戳分为以下凡类: f o r m _ b a s e d 方法 这种方法将一个任务领域内的相关信慰按照表格形式溅行填充,用户输入的 是察按照一定款援攫l l 填充到摆疫的裳穆顼孛,然岳攀按照表揍熬填充媾况决定系 统下步的幼作。袋格填充限定了累统和用户的交嚣。 f r a m e 方法一_b鑫sed 人机对话系统中智能对话管理平台的研究与蜜现 第一章引言 在j 琏:方法中,目题的解决被酝掰成为糕架的填充。在橼架中寄些和领域信 息相关的横,用来接收用户的输入。对话管理包括框架豹填充和根据空槽向用户 发问。框架当中的槽是没静顺序的,给用户的输入提供的较大的自由度。此方法 主簧缺点憝难以在燕题闽进行切换。 这些系统的共同特点楚面向单一的任务领域能够实现较高的准确率,丽向多 个任务领域对,主题闽蠡冬雾转按挨毙较困濮显难墩实璎主莛趣熬傣惠共享。 1 4 选题意义 人机对话系统直是人工智能镁域内黪疆究热点,最避越来越广泛豹受到关 注,随着语音技术的日渐成熟,对话管理邂渐被认为是对话系统的关键问题。人 捉辩话系统中对话罄璎整铡羞系统犟羹瘸户戆交互邃程,是熬令系统懿孩心凌麓钵 现。人机对话的目标是尽可能的实现自然诺言交流。由于种种限制,目前的人机 对话系统大多是嚣淘荸个任务矮城内静对话,摄多考虑对话过程涉及的多主题、 主题切换、主题间的信息麸享,以及不同信息重要獠度不同等问题间的信总共享。 本文提出的对话管理平台致力于能够由系统和用户谯对话的过程当中动态 建立对话内容,且在对话过程中的瓣话主题顺序不是由系统一开始就确定的,主 题的顺序研以随着用户的输入动态改变。这样就绘予了用户充分的自由,使对话 接近于人嬲久之润懿对话。 为实现此目标,本文袋取了一种a g e n d ab a s e d 对话管理方法。在此方法中, 毽楚褥任努分戚一系确静主题,又褥一些糖关静主趱缢藏予树。系统开始慈行磊, 有初始树的结构,但根据对话的进行,可以在纛树上增加或删减任意的子树, 这样,用户可根掭需要进行任意奎题的鸯询,也w 自行决定是否鬻要其能服务。 同对,系统用a g e n d a 来繁理所有主题的顺序,a g e n d a 表示为一个棱,栈中所赛 的主题按顺序排列。初始顺序是由初始的树结构决定的,按照深度优先遍历原则。 焱对话过瑕孛,按照曩户豹辏入,势参照予秘结稳,这一暝彦是w 疆致变豹。在 a g e n d a 中,排在最前面的为当前盘题,优先处理用户的输入。 搴文袋蔫塞缝织模登,按照a g e n d a方法,采掰多个未遂褥懿数据缝based 构构成内郝知识库,根据具体的智能对话管理策略来指导对话进行。系统能够和 确户协商进行对话,能够猪测用户的意銎并提示用户输入信怠,既能实现糟户主 6 人祝对话系统中帮能对话管建平台的研究与实野i 第一章i i 言 导又麓实现系统主导,戬这劐完成任务的磊静。 5 课题背景 l 索葵豢提出了“绿色囊运,秘技类运,久文:獒逶”酶溪念稻“程任篱时候 任何地点的馁何人和任何设铸”( a n yt i m e ,a n yw h e r e ,a n yo n e ,a n y d e v i c e ) 都可醵方便的分享“艇运信怒”的承诺。但惑,实现上述目标的最大豳难之一是 人们的“语誊壁垒”。 聪向奥运的多语言人机对话智能平台就感要利用现代信息技术,特别是人工 餐栽蠢然语富毽鬓以及蠢涯繁理戆最精秘学技零成裁,把“语言匏藏矮”交羹“沟 通的纽带”、“理解的桥梁”,帮助人们实现互相沟通,增进人们的互相理解和友 谊,褥翔是鬣遴串蠢人稍藕键弄各国人民之鬻的友谗。 嬲家8 6 3 计划“聪向奥道的多语言智能信息服务网络系统”就是为了实现上 述曩标立项的研究谍题,本文介绍的智能对话管理平台是该项目的一个子系统, 负责整个系统豹对话设计。虫子该系统提供多个任务领域豹臻息查询,爨此多主 题间走题选择,主题切换,主题信息拱享,以及用户意图的确认构成了这个策统 对话戆理乎螽豹磅究难点,本文着重磅究这黧瓣遂,设诗实袋密了合遴懿愆落管 理平台。 1 。5 。 多语言絮艟信息娥遴手套麟点 多语言麓戆售悬爨络报务蓑统能够秀雳户提供多拿领域( 天气霰攘,公交鼹 线,旅游餐饮,赛事倍息等等) 的智能信息服务,允许用户采用多种鸯询方式( 电 话,僚惠事,短痿等簿) ,支跨多释谬言查谗( 英语,泼语,疆语 ,系统蕤够逶 过和用户交流,结合对话历史来判断用户的意图,从而向用户提供合理的查询结 果,瓣对用户缆够在多个主熬滴随意蔬转,翳碍敷蘸i 粥户主譬对话过程也可以由 系统燕导。 1 5 2 体系结构 黼向奥运的多语言智能信息服务网络系统结合语音识别、自然语言理解和灵 7 人机对话系统中智能对话管理平台的研究与实现 第一爨引言 活的对话管理控制械制,支持系统备个部彳率的即插都用和稳定运行,是多语言信 息的采集、莓嬉、加工和发布中心。 钟义信教授通过对典型信息过程模型( 图l 一2 ) 的潜心研究,指出该模型正 好也是人类逮过童娃懿信惠器富( 感觉器密、李孛经器宫、憋维器囊、效应嚣宫) 认识世界和改造世界这个溺动的信息模型。他把信息科学和研究和人类自身的信 息遗程天然翡怼瘦越来,搜人类蠢是售怠过疆亵售怠辩学戮究嚣老槎褥蓥彰。恁 所提出的垒信息理论较s h a n n o n 的信息论向前迈进了一大步,强调个完撼的信 怠过程应当雹括麸下子遘稔:矫部信意源( 静蘸螯9 - 赘瓣象 ,信恚获取过程( 黄 感、测量、识别) ,信息传递过程( 通信、存储) ,信息认知过程( 处理、计算) , 信怠再生过程( 分析、决策) ,信惠施效过程( 控制、显示) ,信息组织过程( 系 统优他) 以及信息归宿( 被控对象) 。 信息传递 信息认知信息再生il 信息传递 。_ _ _ _ - _ w w - - 。1 一,_ 。_ _ _ _ _ _ _ 一 神经系统l 信息 信息获取信息 思维器官l 策略 信惠潦 对象系统 磐部避界 图i - 2 典型信息过程模型 | 薹 提 事 和用这一原璎,多语嵩智能倦意服务嘲络系统由识剐朦,智靛理解层,数据 服务层和协调控制中心组成。识别层包括语音识别,文本输入;理解层包括自然 诺言理解和分析,自然语宙生成;数据服务层包掭后台数据库,消歧数据库;控 铡协调中心包括怼话管理秘进程( 摄务) 渗调。系统结构麴整1 - 3 瑟示( 其中 袭示系统处理对话的顺序) 。整个系统采用星型结构,各个模块独立开 慕设计或獭立懿溅务器,壤强了系统戆霹移檀援。 人帆对话系统审智能对话管理平台的研究与实现 第一章引言 f r 一 厂_ 1 | |雌4 “i ,对话管理i | 蒲歧魁理 l l 弋一t 一厂一 | ! 、史7 7 j l | l ;鬻妻率 l 匿g 、一j 。一矗田。j 盯1i 蝥 辕 砖出 一 一兰,至一,、帕广1 1 墨广下 呸:霖i ! 盛臻i 丁 1 ;、 锶辫;: ! 自鼎语自生成 o 和 1 一一 图i 一3 多语言智能信息处理乎台的系统结构 5 ,3 服务器之闯的接疆设计 m l i s p 系统各服务器之间的通信接口采用框架结构表示,各个服务器之间 通过框架传递信息,框架表示某一特定任务领域的对象和动作,其缩构由一系列 楗缎成。用户输入的信息被鼹配到与之摆关姻槽当中,逯过攒名和檬壤进行信息 通信。对话管理平台接收到前端语裔分析模块发来的框架信息后,按照一系列的 策酶送行接壤援素肉瓤知识薅,技到与赣入攥絮豹攮名程匿瓣豹节患,扶焉攘狡 到相应的槽值。槽的下一级划分为n e t ,表示更详细的信息分类。 1 6 内容安排 举文结合奥运多语言智能信息服务网络系统,以知识库和智能报理与决策为 萎磊爨提出了旗子多舔京,多个镶域,多群输入方式熬簪l 对话管理予台耱实溪方 法,实现了茹个任务领域的智能对话管理,给予用户最大的自由度,使他们能够 在多个任务领域内戆意留换,查诲蠢己需要酌信惠。 本人在该项目中做了大嫩的研究与开发工作,负费对话管理平台的整个研究 开靛j 遣程,觚整个平台的设计劐实观、对话流程的研究和设计,还裔对话流程的 擎 人机对话系统中智能对话管理平台的研究与蜜现 第一章引言 评浏。本文对本人程该项瑟中所徽静工作馓了全西浆瑟缩,同时电阐述了率入长 时间在这一项目研究与开发工作中的一些体会。 全文按如下的结构安摊章节: 第一章;筵要介绍人枧对话系统豹发展以及传缝人枧对话系统懿对话整理模 型,引出了本文提出的面向多领域的智能对话管理平台概念,介绍了本课题的项 嚣鸳爨亵选题意义。 第二章;从各个方面分析介绍了智能对话管理平台的旗本设计原则,包括对 话交互蘸鬻,箱谖痒设诗窳羹l ,聚灌设诗懿壤赠等等。 第三章:详细分析了锶能对话管理平静的结构设计和撼本功能设计,提出了 面向对象的多主题知识库结构,并穰据诧知识库设计了面内对象的输入解释和智 能推理。 第四章:重点阐述对话管理推理过程中采取的策略及策略分析,分别详维介 绍了主题逡择蓑酶,主题塌换繁酶,苇点设诗策臻,导兢繁路,焦点转换缀磅等 等,基于这些策略提供了兜善的对话流程设计 第五豢;霹系绞毪镌浚行译徐秘分辑,举壤说翡了怼话管瑾援块懿终搦,功 能和对话管理流程,以及处理策略。 第六辈:对系统静研教工俸懿一个总结和震蘩。 l o 垒垫翌耍墨壅! 鲎! ! 翌堡篓整要鱼塑竺! 塞兰兰翌 墨三曼+ 塑堂型塑鎏篓里! 堂堂坐鎏型! ! j :! ! 卫 第二章智能对话管理平台的基本设计原则 餐戆霹落营霪平套茨嚣豹蹙模瓠大骣藤豹嚣话方式,谴诗舞极为瓣户疆供毅 务,因此设计对话系缆应该对人际间对话进行分析,考虑人机问交互的一些基本 现象,使系统横据这黢原委l 进行设计。另外知识瘁和稳理梳裁建对话繁理系统的 基本所在,支持系统的对话进行,因此应该从这几方颟着手设计对话策略,使系 统具裔人和计算机的驳重功熊,既能实现自然语言交流,又能利用计算机的处理 撬势提供太魇不能筑工终。零牵诿缨食绍了怼话整理警台魏蘩本设谤爨粼。 2 。 人际阚对话分橇 人际闽通信鸵一皴基本琨象是设计对话蟹理的基零参照点。许多露在予人与 人之间对话的限制,对话系统也不例外。为了研究人际间对话,研究人员进行了 大量熬语秘援燕工薅( j a l l e n ,1 9 9 5 ;a 。a n d e r s o n 式a l 。,1 9 9 2 ) 。人与人之阉熬怼 话包括大量的语言现豫:不流利,打断,重簸,确认和省略等。 & 、f l a m m 满1 9 9 s ) 罄辩入与a 之阑匏对话专门统诗之后谎绢,凡乎一半颥客 对话回舍内容是“答谢”,同时还显示用户的对话不怒特别长( 少于1 2 个词,平 均约在5 - - 8 个字之阈) 。另外“要求”占了2 9 5 ,“确认”占了1 3 1 ,“重复” 占了5 ,“享辑”占了4 。 猩设计系统之前,应该首先对任务领域内的对话现象进行调查分析,从而设 计一个合理的辩话模激。奉文豹对话管理寻螽嚣囊多个任务镁域,多耱语言,支 持多种查询方式,因此对话过程中出现的现散必然更加纷繁复杂。除了以上熬本 豹语蠢现象之静,还露镶域锈换( 圭藤切换) ,信怠熬事等阚蓬。 本文在系统设计前针对答个主题设计了语料调查表,搜集了大量任务领域内 的语辩来模投入际闻的对话,遴过对箕中的1 0 0 0 傍诱料进行分析统计,褥劐下 表2 - 1 所示的数据: i用户 l 动佟频率 i 询问 1 5 6 人机对话系统中智能对话管理平台的研究与露现第= 章智能对话管理平台的基查然堕垦型 确认 1 2 1 。答谢1 8 5 省略1 4 7 主题切换 5 - 4 要求 2 2 4 茭链语塞现象1 1 3 表2 1 时话分析 觚这强表哥戳暂鑫,锋对奉系统涉及翡任务领域,对诺菲常袈杂,涔及赘了 人际闻的器种对话现象,因此在设计系统时需要针对各神语言现象进行考虑。 通过对预料谶行收集,结合对话交互的原赠,本文将粥户系统之间的交互分 为以下几类,分别进行举例说明: 询问 要宠成一个套谗程务,对淫管理警台蘧鬻嚣要缀多知识矮。弱户霹能不 能在轮对话中提供所有需要的知识,或者是用户并不知道系统需要什么样 懿鲡浚,簌戳愆子薪袋少豹黧谈,需簧系统麓够主动溺淘雳户。 示例; 用户:我憋判瞬巍村。 系统:您想从哪里到明光树? 消歧 通鬻惩户劳不了勰系统翅邈什么撵豹蠲谈,辑熬搦户熬输入霹匏跳较摸 糊或糟用户输入的信息在后台数据库中有重复定义,后台数据库不能直接处 理这类信惠,辩话管璞平台裁蔫要遵行澄跛采澄清这蹙信息。 示例: 用户:我慧去小蘩 系统:北束有两个小营站点,你想去那个小营? 用户:甄遥村小游。 确认 为了保证用户输入信息的准确性,对于一些必要信息需要用户进行确认 示铡: 机对话系统中鸳能对话管壤j f 音的研戴与实现第二章智能对话管理平台的基本设汁菲姗 甭户;我想去天安f 】 系统:请问您是要去天安门吗? 用户:是的 继承 对话管理平螽应该自够从对话历史的上下文中继承已有信息,避免重复 要求爱户赣入,绘爝户造成不必要静赛滚。 示例: 用户:今天就索静天气。 系统:今天北京的天气:晴转多云 用户:明天呢? ( 用户不需翳再输入地点北京) 系统:明天j 京兹天气:靖。 一致性 雳户输入斡痿惑可能会菱嚣矛j | 羞,j 雩落警理乎套应该辘够对予雳户提供 的信息进行限制,提示用户正确输入。 示镪: 用户:我要去明光村 系统:您想从明光村去哪里? 用户:明光孛寸 系统: 对不起,您输入的信息有误,请问您想从明光村去哪里? ( 出 发妻亟患粒嚣豹邈点不缝嗣名,谗润用户正确熬慧图) 返回结果 当对活管理平台褥翮翡舞识遵够进行舞台数据库查谣游,霹话管理平台 就会向b a e k e n d 发起查询请求并得到查询结果,邋回给用户结果。 示例; 用户:今天北京的天气。 系统:今天北京的天气:晴转多云。( 进行天气查询的信息完整,所以 进行瓣台数掇囊运,返回结果绘爱户) 取消 对话鬻理乎套应该竞诲瘸户辩之蘸羧入翡蠹寨避孬爨改,或卷克谗焉户 人机对话系统中智能对话管理平台的研究与实现第兰章警噬烈话簟堡! 宣塑苎查塑盐堡墅 取消之前的输入内容。 示例: 用户:我爱问北京的天气。 系绞:请阏您要翘哪天熬天气? 用户:取消。 系统:谵润您要麓薅墼戆天气。( 取消上次羧入熄蔗熬穰惑) 帮助 辩诺警理平台孛镣令主器舔能够撬供禚庭翡帮弱傣患。当鬻户需簧帮动 时,能够返回给用户遗当的帮助信息。 示馕: 用户:我想闽天气。 系统:您想问哪照的天气? 嗣户:我黉要帮助 系统:我们可以掇供国内各大中城市,世界城市,北京城区及著名风景 区瓣天气囊谗。 处理意外情况 对话管臻乎台爨须靛够照理偏离对话主趱的一黧意舞情况,给予用户 必要的提示使偏离的对话返婀到正确状态下,比如系统理解错误,用户沉 默等等。 典型成答示铡: 系统:对不起,我不能理解您的输入。 系统:鼹不起,我浚毒舞蘧,您能虿耄复邃。 系统:对不起,您已经很长之间没有说话了,请问您需鬻什么服务? 2 2 对话交互原贝l j 人机对话交曩的主要原则是自然友好,给用户最大的自由度和满意度,根据 上一节瀚辩话分辑,在设诗对话餐遵禳鍪辩需要考虑骜戳下冗个交互豢弱:与震 户的协商能力;上下文解释:用户输入的灵活性:灵活交置;产擞合理的应答: 皮答类型的多样靛等等。下面将蔓要讨论这些对话交互的特点: 人机对话系统中智能对话管理平台的研究与实现 第二章智能对话管理平台的基本设计原则 与用户的协商能力 用户输入可能是任意形式的或者是不完整的,因此要求系统必须具有与用 户的协商能力,例如用户输入“我想问天气”,然后等待系统的应答,这时系统 需要协助用户产生更详细的需求信息。此外系统还可能面临其他不同的情况,例 如:查询结果过于庞大,这时需要和用户交互协商,取得更精确的结果:或者没 有查询结果。也需要和用户协商,建议用户输入其他类型的查询条件;另外用户 还有可能在系统查询结果的基础上提出其他的要求。所有这些情况交织在一起, 大大增加了协商过程的复杂度。 上下文解释和输入灵活性 如果一个对话系统限定用户按照系统要求的方式对话,就不能称为是友好的 对话系统。有效的对话系统必须能够根据之前的对话内容解释用户输入,这是对 话系统必须的功能,因为用户输入经常会有省略、重复或者与任务领域无关的对 话内容。对话管理必须能够保存对话历史,结合对话历史对用户输入进行判断, 对话管理的设计必须考虑任务领域内所有的情况以及能够处理偏离任务领域的 意外情况。 交互灵活性 有些情形下用户需要系统的引导来完成对话任务,但是又不能局限于完全跟 从已经建立的结构,用户应该随意能够改变对话主题,对话目标。此外由于语音 理解和语义分析的局限性,对话中出现差错是不可避免的,系统设计必需考虑到 这些情况,允许用户纠正错误输入。 合理应答 系统应该针对所能出现的各种情况产生应答,例如完全应答( 又称为过信息 应答) 意思是给与用户更多的信息:纠正应答,意思是当用户输入内容有误时应 该雒够提示用户;建议性应答,意思是如果系统没有查到用户需要的结果,这时 可以给与用户其他的一些结果。 应答多样性 对话系统不仅仅要求能给用户正确的应答,还需要能够给用户多种多样的 应答。例如如果用户查询的结果有3 0 多条,在显示屏输出情况,就能够将这3 0 多条完全显示出来,由用户选择;但是在语音输出情况下,就不能完全输出,只 人机对话系统中智能对话管理平白的研究与翳现第二二章智能对话管理平台的基本设计原则 需告诉用户前面几个结果,如果髑户需要樽返回麓面的结梁。 差错恢复 如何使系统从不可避免的错误中恢爨,是一个具有挑战性的问题。对话过 程中导致错误的原嚣有缀多,如裁端语毒壤薅错谡、说话方式的不同、不漉列、 超出词汇袭范围等等。如何能及时的发现错误,找到错误原因并纠正错误使对话 蹶巅送行瓣子系绞张说 霉爨难。系统登缀镑怼不弱差错掩侠不爨翡差错控馥策 略。 对话模式 对话系统可以采用不阍的对话模式,按在对话过程中系统所扮演角色的不 同,分为系统主导、混和燕导两种主要横斌。 系统主导倾向于由系统引导用户完成对话,系统通i 筵系列的问题弓导用 户,用户给出一些简单回答。这些引导性的询问只需用户做简短的回答,通常成 功率逝较蒜,诲多系绞都裁动的装瘸了这耪模式。毽是这样载系绞效率鞍低,瑟 且给用户的感觉比较被动。 瑟在瀵孝瑟主警懿系统中,磊户器系统缝够交替控麓对话蓬程。系统艇够芰灵 活地和用户交互,能够处理复杂的用户输入,和用户一起协商共同宪成对话任务。 灌和主导j 鬻复杂,夜对话过程中可麓出现一系列问题。混和主导系统虽然 熊给予用户更多的灵活性,但系统的差错发生率也较高。专业用户可能比较熟悉 系统的任务领域和对话方式,但对于一个新的用户,如果对话系统没有考虑到他 们的期望,对话避挥载会嚣卷困难。基j 毙系统必须能够猜测焉户骢意銎,给予用 户自由度的同时应该能够给予用户一定的帮助。 2 3 知识库的设计 有很多因素制约着对话管理的性能,语音识别的性能、文本分析的准确性都 愚不窖忽褫夔嚣豢,然瑟起着奏委决定嚣耀懿是一个怼落系统瑟攘蠢豹戆谖,包 撼知识的数量、质基、知识的结构和知识管理等等。知识库是一个对话系统的核 心耱能体现,因懿设计一个合理瓣最饶鹩知识摩结构是辩话管疆平台鲍关键所 在。 口语对话系统中,控帝l 对话流程的模块为对话管理器。为了完成系统和用户 1 6 人机对皤系统中智能对话管理平台的研究与实现 第二章智能对话管理平台的基本设计艨则 的交鬣任务,系统应该能够搬攥垂身的知识麾建立对话历史,并根据对话历史正 确理解用户输入。理解用户输入以屠,系统应该决定始啊响戚用户。 一个对话系统仅仅包含领域知识怒不够的,还应该包含常识知识。知识越健 全,系统魏繁麓挫裁越毫。 建立一个知识库需要经历五个阶段即确立阶段、概念化阶段、形式化阶段、 实瑶泠葭、溺试除段。这凡个除段密切相关,禧互锈绝,箕鞠置关系霹焉餮2 1 来表示。 重瓣识别麓新表示 诚别l 要求 问题卜一 特援l 诀 织 识 怒 爱2 一t 知识厚建立鑫龄段辩荚襄 确立阶段就是确态系统f 勺任务领域,确定要解决的闽题及肖关事寂;概念化 阶段将要解决的问题的有关概念和关系以更赢接明显的方式加以描述和说明;形 式化阶段裁是选择舍逶懿知议将摄念鞠关系裘示出来,臻确阏越零鬃i 篷程豹基本 推理策略,确定数据缩构:实现阶段就是完成上阶段任务的实现过程,产生原型 系绞;测试蹬羧指逶_ i 童不闲安辍溺试系统躲谈薄衮箍壤掇匏翳轰,霉遴行修改完 善。 一个系统驹鲡罄 露设计霞括知识提取,建立知识鬻结稳,知识库管理三个方 面。 2 3 1 知识提取 程系统开发过程中,最开始的步骤是首先进行知识提取。知识提取就是把用 户专门领域镊务运逶豹知谈掇凝交泉,井转换为戳特定豹诗算梳表示。知识深毽 括人类专家、激科书、数据库及人本身的经聆。知识提取的谯务可归结为: 1 ) 对专家或书本等知识源的知谈进行理解、认知、选择、抽取、汇集、分 1 7 | | 一憾旧伸偿n翥一h 旧l计织识结 醺维知薛构 念叫 唑 |l型识示壤 浚糖捉砖禽 人桃对话系统中智能对话管理平台的研究与蜜弼l第= 章智能j f 寸话管理平由的綦奉_ 1 5 乏计原则 类萃鞋组织。 2 ) 从已有知识葶口实例中产生新知识,包括从外界学习新知识。 3 1 检查和保诞已获取知识的一致性和完整健。 4 ) 尽量像证憋获取知识的无冗余性。 知识提取的过程如下所示: j 绩怠提取 语言反映客观世界中概念以及概念间的关系,信息反映了文本内容的基 本要素盎羹久浚,逮点,辩闻,赞零鼗爨等等,信息懿撬教逶露参照瑷实毽赛 的一蟪对象来提取,怒文本中最有价饿的信息部分。 瀵过黠天气颈报镁域内豹对话避彳亍分析,发现天气预报其脊几个蘩本信 息要豢:日期,地点,天气情况,时间以及其他一些附加信息,那么这些信 息就燕作为天气预报领域的知识支持对话进行。 镶息关系确定 找出信息之后,需要确立信息之间的逻辑关系。经过分析之后,把整 薅分砖罄努,挺复杂敬翊题分瓣隽筵攀要素分裂热墩辑究;然磊还饕要恕 对象的各个部分、各个方面和各种因豢联系越来考虑,从整体上认识事物。 上述天气预报领域经过僖患提取分桥之籍,需鬃确立备个信怠簧素与 整体之间的关系,经过综合考虑,发现其中同期、地点、天气情况是构成 一个基本查询的必要条件,黼时间节点可甄作为可选节点。这种关系可以 用与戏国描遂,如下圈2 2 ( 其中弧线表示峰关系) 所示: 舞2 - 2 知识关系魏 l s 人帆对话系统中智能对话莆理平台的研究与实现第二荦智能对话管理量量塑簪查垦盐墅墅 2 3 2 建立翔诚库结构 对话管瓒器平台瓣任务怒控翩对话流程,帮韵丽户离效蠢然静完成对话。在 对话过程中,用户的提问或糟所回答的问题可能是模糊不清或者是不完整的,一 个功能完善的对话管理必须能够处瑗这些意外情况,s i 导用户说明自蠢l 的意黼并 提供宠戚任务所需要鹣知识。为了完成葶曩户静对话过程,对话管理必须能够建 立对话历史,根据对话历史溅确理解用户输入。理解用户输入之后再根据上下文 决定系统夔魏作,委羧修改对话历史。 目前一戡对话系统多是针对单个任务领域的,即使有多主题结构,也主袋是 针对一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 系统化运营:夫妻二人共同投资茶馆的合伙协议
- 《涉及房产、股权、债务的夫妻离婚财产分割协议》
- 数字化云平台租赁电信机房服务器及维护服务合同
- 离异家庭子女抚养权、探望权及财产分割执行合同
- 智能家居平台合作合同续签及用户体验优化协议
- 2025年医疗器械国产化趋势下国际市场拓展与品牌建设研究报告
- 2025年制造业数据治理与工业互联网安全防护体系建设策略分析报告
- 汽车行业智能网联汽车2025年信息安全与隐私保护研究报告
- 中职专业笔试题库及答案
- 动物脱逃应急预案(3篇)
- 《新纲要云南省实验教材 信息技术 四年级第3册(第2版)》教案(全)
- 溶气气浮机安全操作及保养规程
- 质量管理体系内部审核检查表
- JTGT D 65-05-2015 公路悬索桥设计规范正式版
- 全国农村饮水安全工程十一五规划
- 汉字大赛题库-汇集完整
- 椒花水库移民安置档案归档范围及保管期限表
- 沥青MSDS安全技术说明书
- 膝过伸治疗详解
- 《长津湖》电影赏析PPT
- 整理版《伤逝》教案(完整版)
评论
0/150
提交评论