版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
对话系统简介/封闭域任务型对话/开放域对话系统/基于预训练大模型的对话系统2026/6/11第九章对话系统简介对话系统任务介绍、对话系统模型架构封闭域任务型对话自然语言理解模块、对话管理模块、对话状态追踪、自然语言生成开放域对话系统开放域对话背景、开放域对话系统框架、检索式对话、生成式对话基于预训练大模型的对话系统ChatGPT的发展历程、ChatGPT的技术和基本原理2026/6/129.1简介图灵测试:若人类无法区分与其对话的是机器还是另一个人类,则认为人工智能达成其终极目标——实现类人智能。对话系统:作为人机交互的重要接口之一,当今对话系统越来越受到人们的重视,产生了一代又一代的技术更新。2026/6/139.1.1对话系统任务介绍对话系统的演化第一代对话系统:基于规则,预先定义的规则和模板来生成对话回应优点:简单直接,易于分析缺点:编写规则需要大量的人力,系统的灵活性较差,难以适应新的场景和需求2026/6/149.1.1对话系统任务介绍对话系统的演化第二代对话系统:基于统计学方法,以数据驱动和强化学习为代表。系统首先维护每轮对话状态,再根据对话状态选择合适对话策略,从而生成自然语言回复优点:避免了对专家知识的高度依赖缺点:难以维护和扩展2026/6/159.1.1对话系统任务介绍对话系统的演化第三代对话系统:运用深度学习技术,可以利用大量数据来学习良好的特征表示和响应生成策略分类聊天型任务导向型问答型2026/6/169.1.2对话系统模型框架任务型对话:完成用户的特定任务需求,如天气查询,酒店预定等,从对话系统结构上可以分为pipeline模块化结构与端到端(End-to-End)结构两种方式2026/6/179.1.2对话系统模型框架pipeline模块化结构:以POMOP框架为例,包含四个模块自然语言理解:用于理解用户输入中的语义和语用信息。2026/6/18pipeline结构-POMDP框架9.1.2对话系统模型框架pipeline模块化结构:以POMOP框架为例,包含四个模块对话状态跟踪:通过根据每轮对话中的信息逐步完善用户的完整需求信息。2026/6/19pipeline结构-POMDP框架9.1.2对话系统模型框架pipeline模块化结构:以POMOP框架为例,包含四个模块对话决策:根据对话状态跟踪(DST)的输出结果,决策系统的回复动作:槽位询问、槽位澄清或结果输出。2026/6/110pipeline结构-POMDP框架9.1.2对话系统模型框架pipeline模块化结构:以POMOP框架为例,包含四个模块自然语言生成:根据对话策略(Policy)输出的系统动作,生成自然语言语句,回复用户。2026/6/111pipeline结构-POMDP框架9.1.2对话系统模型框架端到端(End-to-End)结构:端到端模型对数据的数量和质量要求很高,并且对于填槽、API调用等过程的建模不够明确,现阶段业界应用效果有限,仍处在探索中2026/6/112End-to-End结构9.1.2对话系统模型框架闲聊型对话:用于满足用户情感倾诉和对话衔接需求。与另外两种对话类型不同,这种对话是开放性的,用户输入和系统输出都是自由、非限定性的自然语言句子,用户可以自由表达,系统也以开放性方式回应解决方案检索生成2026/6/1139.1.2对话系统模型框架闲聊型对话检索:使用信息检索技术,分为候选回复召回和候选回复排序两个阶段候选回复召回:对话语料被离线建立为倒排索引库,在在线对话时,根据用户输入从索引库中检索候选回复候选回复排序:根据对话上下文进一步计算候选回复的相关性,以选择最佳候选回复为系统输出2026/6/1149.1.2对话系统模型框架闲聊型对话检索:使用信息检索技术,分为候选回复召回和候选回复排序两个阶段2026/6/115检索式对话结构9.1.2对话系统模型框架闲聊型对话生成:通过模型生成全新的回复序列到序列(Seq2Seq)的对话框架:将对话上文作为模型输入,输出为对应下文回复,首先将文本序列输入到Encoder中编码出文本向量,再通过Decoder依次解码出预测语句基于GAN和强化学习的对话框架:GAN模型中生成器模型用于生成回复,discriminator模型用于判断输入回复是标准回复还是预测回复;而在强化学习框架中,奖励(Reward)通常设置为语义相关性、句子流畅性等,动作(action)则为生成的回复句子。2026/6/1169.1.2对话系统模型框架闲聊型对话生成:通过模型生成全新的回复2026/6/117生成式Seq2Seq方案9.1.2对话系统模型框架闲聊型对话生成:通过模型生成全新的回复序列到序列(Seq2Seq)的对话框架基于GAN和强化学习的对话框架生成任务适配的预训练语言模型:GPT、BART、DialoGPT、ERINE等2026/6/1189.2封闭域任务型对话任务型对话系统:目前主要分为管道模型以及端到端模型,其中管道模型为当前工业界与学术界主流方法,而端到端模型则局限于学术研究领域。本章重点介绍管道模型,简略介绍端到端结构管道模型自然语言理解模块对话状态追踪模块对话决策模块自然语言生成模块2026/6/1199.2封闭域任务型对话管道模型2026/6/120基于管道的任务型对话系统9.2.1自然语言理解模块管道模型:自然语言理解模块目的:把用户的自然语言输入转化为结构化语义(Semanticframe)形式的输出,一般涉及领域分类(Domainclassification)、意图分类(Intentclassification)和语义槽填充(Slotfilling)领域分类和意图分类:前者旨在识别当前对话所属的具体领域,而后者则旨在识别用户当前轮的对话意图层次化分类方法:先进行领域分类,再在相应的领域下进行意图分类扁平化分类方法:将领域和意图标签组合在一起,一次性确定用户输入涉及的领域和意图2026/6/121管道模型:自然语言理解模块语义槽填充:从用户输入中提取属性信息联合模型:采用了多任务学习(Multi-tasklearning)的思想对这几个任务进行联合建模,从而加强了表示层的语义信息新视角:跳过传统的NLU模块中的ASR模块,直接使用音频信号作为NLU的输入,通过减少管道系统的模块数量,预测更加稳健,因为播出的错误更少。2026/6/1229.2.1自然语言理解模块9.2.2对话管理模块管道模型:对话管理模块组成:由对话状态追踪模块(DST)和对话策略模块(PL)组成DST模块:负责记录和更新对话过程中所涉及的变量及其相应的属性值PL模块:选择某一对话策略决定系统行为方法分类基于状态机的对话管理方法基于部分可观测马尔科夫决策过程的对话管理方法2026/6/1239.2.2对话管理模块管道模型:对话管理模块组成:由对话状态追踪模块(DST)和对话策略模块(PL)组成2026/6/124对话状态转移图9.2.2对话管理模块管道模型:对话管理模块基于状态机的对话管理方法:早期方法,开发者需要列举所有可能的对话状态、状态跳转规则和对话策略。用户输入后,系统根据预定义规则进行状态转移,并执行相应的系统行为优点:具有良好的可解释性缺点:随着对话任务复杂性增加,对话状态急剧增多;对话策略设计依赖开发者经验;设计成本高且难以在复杂对话任务中实用2026/6/125管道模型:对话管理模块基于部分可观测马尔科夫决策过程的对话管理方法:该框架下的对话状态是一个随机变量而非一个确定值,通过信念状态(Beliefstate)建模对话状态的不确定性2026/6/1269.2.2对话管理模块9.2.3对话状态追踪管道模型:对话状态追踪对话状态追踪:准确跟踪用户需求,实现一致和有效的对话,使用对话状态跟踪器(DialogueStateTracer)组件来跟踪此类信息相关概念对话状态对话状态跟踪器对话策略学习2026/6/127管道模型:对话状态追踪对话状态:对话中任一轮次的对话状态st包括直到轮次t的对话历史总结,st以(slot,value)对的形式捕捉对话中的用户目标,可能出现的槽的集合是在本体(Ontology)O中预定义的,通常是与领域相关的,每个槽s所承担的值value是由用户提供的对话目标。<餐厅>领域的对话状态追踪如下图所示2026/6/1289.2.3对话状态追踪管道模型:对话状态追踪对话状态追踪器(DialogueStateTracer,DST):通过预测轮次t的槽位值对来估计当前的对话状态,可以通过两种方式进行轮次级(Turn-level)预测:预测每个轮次表达的槽位值,然后使用更新机制来结合之前的对话状态和当前轮次的预测对话级(Dialogue-level)预测:预测每个轮次的完整对话状态2026/6/1299.2.3对话状态追踪管道模型:对话状态追踪对话策略学习:以对话状态为条件,对话策略产生了下一个系统动作。由于对话中的行为是按顺序产生的,这一过程通常被表述为马尔科夫决策过程(MarkovDecisionProcess,MDP),可以通过强化学习(RL)来解决非模型依赖(Model-free)的强化学习方法基于模型(Model-based)的强化学习:环境被建模以模拟对话的动态。然后在强化学习训练阶段,通过向真实用户的学习和与环境模型的交互来交替训练对话策略2026/6/1309.2.3对话状态追踪管道模型:对话状态追踪对话策略学习2026/6/1319.2.3对话状态追踪马尔科夫决策过程的框架9.2.4自然语言生成管道模型:自然语言生成目的:将对话行为映射为自然语言语句,这通常被建模为条件生成任务(Conditionedlanguagegenerationtask)生成预料应满足的特征:充分表达对话行为的语义,以完成任务自然、具体、富有信息且类似于人类语言,使模型看起来更加拟人化2026/6/1329.3开放域对话系统开放域对话背景目的:最大限度地提高长期用户参与度,需要深度了解对话上下文和用户的情感需求,以便在正确的时间选择正确的技能,并产生一致的对话响应相关方法:大多数基于深度神经网络的方法将对话表述为在给定用户输入和对话上下文的情况下生成输出响应的任务,遵循文本生成框架如序列到序列(Seq2Seq)、条件变分自动编码器(CVAE)和生成对抗网络(GAN)2026/6/1339.3.1开放域对话背景开放域对话背景关键挑战语义理解:理解对话的内容,并通过识别对话内容之外的信息来理解用户对话一致性:在给定用户输入和对话历史的情况下呈现一致的行为并做出一致的响应,包括角色一致性、文体一致性、上下文一致性交互性:满足用户的社交需求,如情感情感和社会归属感2026/6/1349.3.2开放域对话系统框架开放域对话系统框架分类检索模型:试图从某个响应集中找到预先存在的响应生成模型:应用序列到序列模型将用户消息和对话历史映射到可能不会出现在训练语料库中的响应序列中集成模型:以两种方式结合了生成方法和基于检索的方法:检索的响应可以与生成的响应进行比较,以从中选择最好的。生成模型也可用于细化检索到的响应2026/6/1359.3.2开放域对话系统框架
2026/6/136基于检索的方法框架开放域对话系统框架检索模型:给定一个对话语料库和用户输入,使用检索算法从语料库中选择适当的响应匹配过程:分为浅层交互网络和深度交互网络2026/6/1379.3.2开放域对话系统框架检索模型浅层交互网络:候选和用户输入首先被独立编码为两个向量,然后进行一些浅交互,例如在输入分类层之前进行减法或逐元素乘法2026/6/1389.3.2开放域对话系统框架浅层和深层交互网络的框架检索模型深层交互网络:候选和用户输入通过交互网络进行交互以形成融合表示,然后将其馈送到分类层。2026/6/1399.3.2开放域对话系统框架浅层和深层交互网络的框架生成模型:采用编码器-解码器框架相关方法序列到序列(Seq2seq)模型使用条件变分自动编码器(CVAE)和生成对抗网络(GAN)使用大规模语料库预训练的基于Transformer的语言模型2026/6/1409.3.2开放域对话系统框架生成模型:采用编码器-解码器框架2026/6/1419.3.2开放域对话系统框架基于生成的模型的典型编码器-解码器框架9.3.3检索式对话检索式对话挑战:对话数据通常是分层结构的,并呈现出更复杂的语义对话回应通常以简短和非正式的形式表达,语义取决于上下文回应的逻辑一致性和连贯性缺乏高质量的训练数据分类:基于表征的模型基于交互的模型基于PLM的模型2026/6/142检索式对话基于表征的模型:由表示层和匹配层组成。在表示层中,语境信息和候选响应被一个表示函数单独表示为向量,然后应用一个聚合函数来融合这些数据,语境中所有语词的表达都被纳入语境级别的向量,最后,匹配层使用一个匹配函数来计算两个向量的最终匹配分数。基于交互的模型:遵循表示-匹配-聚合的范式,使用编码函数编码两个句子,得出上下文和反应的表示矩阵,然后使用交互函数来计算两个表征之间的相互作用矩阵,再用一个特征提取函数将其转换为匹配向量,最后利用聚合函数对上下文匹配特征的顺序关系进行建模并计算得分代表:顺序匹配网络2026/6/1439.3.3检索式对话检索式对话基于PLM的模型:通过将上下文中的所有语料和响应候选者的串联送入预先训练好的多层自我注意力网络(如BERT),可以通过注意力机制在一个统一的模型中进行表示、交互和聚合操作。2026/6/1449.3.3检索式对话9.3.4生成式对话生成式对话讨论模型分层递归编码器-解码器(HRED)记忆网络pointercopy-netTransformer深度强化学习模型生成对抗网络知识图谱增强神经网络2026/6/1459.3.4生成式对话生成式对话分层递归编码器-解码器(HRED):用两级RNN对标记级和转折级序列进行分层建模:由编码器和解码器组成的标记级RNN,以及转折级语境RNN。编码器RNN将每个转折点的话语逐一编码为一个隐藏状态。回合级语境RNN迭代地跟踪历史语料2026/6/146生成式对话记忆网络:包含有五个模块:一个存储记忆事实表征的记忆模块;一个将输入的记忆事实映射为嵌入式表征的模块;一个决定记忆模块更新的模块;一个根据输入表征和记忆表征生成输出条件的模块;一个根据输出模块的输出来组织最终响应的响应模块pointercopy-net:将复制机制纳入传统的序列到序列模型,解决了直接从输入句子中复制令牌的问题,在每个解码阶段决定是否从源句中复制或生成一个不在源句中的新标记2026/6/1479.3.4生成式对话生成式对话Transformer深度强化学习模型生成对抗网络知识图谱增强神经网络2026/6/1489.3.4生成式对话9.4基于预训练大模型的对话系统ChatGPT:ChatGPT是OpenAI研发的一种大型预训练语言模型,它于2022年11月30日推出,是基于GPT-3模型的改进版本,一经推出,仅在两个月内就达月活过亿,成为历史上增长最快的消费者应用程序。经过训练,GPT-3能够生成类似于人类的文本内容,对多种不同的任务都有很好的表现,因此ChatGPT作为一个聊天机器人应用,它能够很好的适用各种NLP任务场景,如回答问题、提供信息或参与对话。2026/6/1499.4.1ChatGPT的发展历程ChatGPT的发展历程GPT-1:OpenAI发布,基于Transformer架构,参数量1.17亿,预训练数据量约5GB,采用“预训练+微调”GPT-2:参数量15亿,能够生成更长的语句,完全变成无监督训练GPT-3:参数量1750亿,展示了强大的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 多模态生物识别白皮书2026
- 第七章 了解地区 单元练习 湘教版地理七年级下册
- 县医院精神文明活动总结
- 果树种质资源普查技术规程
- 音乐专业技能教学标准
- 农业技术推广对农户农业收入多样化的影响研究意义
- 包装倾翻试验台挡板高度调节作业指导书
- 家庭铜火锅(景泰蓝)保养指南
- 《Linux系统管理与服务配置》教学大纲
- 2026年中国研学旅游市场景气调查报告
- (正式版)T∕CPCPA 0017-2026 托育机构婴幼儿回应性照护服务规范
- 悬灸技术课件
- 在线网课知道智慧《无人驾驶车辆(北理)》单元测试考核答案
- 小学三年级下册数学每日计算练习
- 求欧普照明员工手册
- 小学语文文言文教学策略研究
- 中医肺病科普养生知识讲座
- ECMO基础讲课课件精
- JB-T 4088.1-2022 日用管状电热元件 第1部分:通用要求
- 钢管材质证明书
- 2022年张掖市甘州区招聘中小学幼儿园教师笔试试题及答案
评论
0/150
提交评论