对话机器人语音识别之语义分析技术(计算机自然语言文字理解)的结构思路_第1页
对话机器人语音识别之语义分析技术(计算机自然语言文字理解)的结构思路_第2页
对话机器人语音识别之语义分析技术(计算机自然语言文字理解)的结构思路_第3页
对话机器人语音识别之语义分析技术(计算机自然语言文字理解)的结构思路_第4页
对话机器人语音识别之语义分析技术(计算机自然语言文字理解)的结构思路_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、汉语语义分析技术的初步结构思路语义分析技术需要实现的技术目标: 使对话机器人软件能够理解人类对他输 入的句子的意思。这里需要强调的是“理解” ,而不是“识别”。本文所认为的文 字“识别” 是由专门的识别技术实现, 包括使用光感扫描、 语音识别或直接键盘 输入等一切可能的手段得到的文字符号, 而本文所指的语义分析技术是指对文字 识别技术( 不仅包括语音识别 )所识别出的文字符号的 理解力 。本文思路是通过对某一个语种的语法结构进行分析, 进而使对话机器人软件 实现基本的语义理解能力。本文对机器人软件的智能程度理解如下:人类之间对话交流以 话题 为核心,一对一答可以形成一个基本的 对话单元 , 各

2、个对话单元逻辑上相互衔接就形成一个话题。对话单元基本可分为:1 问答式对话。如:甲:你在哪里?乙:我在家里2 命令式对话( 包括要求或请求 )。如:甲:请不要吸烟。乙:好的乙:你说的对 乙:哦。3 陈述式对话。如: 甲:这是个陷阱。 甲:我今天好伤心! 甲:今天天气真好!。乙:是啊!对话机器人软件想要具备人机对话功能, 则必须首先具备完成一个对话单元 的能力。因此,对上述 3 种对话类型的语义分析是实现对话机器人软件的重要途 径。对上述 3 种对话单元的实现,可以使对话机器人实现不同层次的智能程度。 完成命令式对话单元可以使对话机器人具备基本的商业功能, 如: 命令: 开 灯。机器人答:好的,

3、然后执行。 但本文认为这种简单的命令对答并不具备实用的商业功能,女口,对机器人命令:开灯,机器人可以听懂,如果说:“把等打开”, “把灯开开”或“打开灯”等其他命令方式,则机器人就很容易听不懂。如换成 另外一种设备,命令可能变为:“烧开”、“加满”、“烘干”等,则出现的命令格 式会更加多变,机器人更加无法理解。这样需要人类按照固定的文字向机器人输 出命令它才能听懂,因此严重限制了智能设备的实用性, 消费者体验较差,这种 情况下智能设备必将逐步沦为鸡肋产品。因此要让对话机器人具备较好的实用性, 则必须让对话机器人能够对人类输入的句子实现语义分析与理解。(下文将详细阐述实现思路)另外,对话机器人即

4、便实现了对命令句的语义理解, 本文认为也只是实现了基本 的实用功能,算不上实现了基本的智能。要想实现基本的智能,则需要对话机器 人能够听懂人类的问句。完成问答式对话单元可以使对话机器人具备基本的智能程度。 即具备了与人 类进行最基本的沟通能力(命令式对话属于单向性质,而问答式属于双向性质)。让对话机器人具备完成陈述式对话单元的能力,是机器人具备初级智能程度 的更高层次表现。能够完成陈述式对话可以让对话机器人实现与人类闲聊和初级 的感情互动功能。高级智能程度的机器人,可以让对话机器人具备将各个对话单元形成上下逻 辑关系的能力,即完成一个基本的话题。女口:问:你打篮球了吗?答:是的。问: 在哪打的

5、?答:球场。第二个问句在逻辑上承接了第一句问句,指的是在哪打球, 而不是在哪打架,因为“打”字可以形成很多种行为动次。另外,还可以不但实 现对汉语中单句的语义分析能力,而且要实现对复句(如果。就0 0 0)的语义 分析能力。高级智能程度的机器人还可以建立一个事物与另一个事物之间的联系,(如人与衣服之间可以建立穿、保暖、美观等联系 )。还可以实现对话题中岔开 话题行为的处理及多人对话能力等等更多功能。然而,以上这些智能程度对机器人来讲, 依然只处于智能阶段,他们只具备 记忆和学习能力(记忆和学习方法下文阐述),而机器人最终必将走向智慧阶段,即具备逻辑思维能力。例如,如下思路可以实现最初级的逻辑分

6、析能力,即有利或有害的分析判断能力,机器人接收到一句话,会先判断这个句子的信息是积极 还是消极,当人类告诉机器人一个积极的信息, 机器人的回答则积极,遇到消极 信息则回答比较消极。上述总结:机器人对语言的理解力是机器人智能程度的衡量标准,因此语义分析系统才是机 器人领域的核心与灵魂部分。语义分析系统对话单元1话题.。(单元与单元之间成逻辑关系)对话单元2对话单元3陈述式对话命令式对话问答式对话具备实用性初级智能其他高级功能逻辑分析能力逻辑分析能力高级智能语义分析的部分思路阐述(略去命令式和陈述式语义理解部分)以问答式对话单元为例:人问机答:(以第二人称“你”为例),女口:你叫什么?你是谁?你在

7、干啥?思路如下:1建立动次数据库、形容词数据库、代名词数据库等等各种词类数据库(人类的 语言句子是千变万化的,但是组成句子的常用词汇是有限的 )2建立疑问词数据库(汉语疑问词数量有限,仅有几十种,包括动次/形容词+不/没+动次/形容词(如去不去、走没走)等等有规律的疑问词结构)3建立公共属性数据库、机器人自身属性数据库和动态词数据库,用来代表世界万物及机器人自身所有信息。所需要的数据量并不大,因为人类常用的属性是有 限的,高度、长度、密度、湿度、社会关系、所属、功能等等属性约上千种左右(常用几百种)。动态词数据量也是有限的,因为人类常用行为动作及动态词约几万种左右(常用约1万种,如打球、打架、

8、跑步、呼吸、倒塌、滚动等等 ), 而并非海量级数据,实现难度较小机器人自身属性数据库如下:小宝(机器人名)属性名属性值参数(过去时)参数2 (进行时)参数3 (将来时)O O O O O O身高1没有身高多高1没有高度高度1没有高度姓名1叫小宝是谁1是小宝叫什么1叫小宝功能1可以说话会干什么1会说话会做什么1会说话能干啥1会说话干啥2关机了在陪你聊天要给你放一首歌听干什么2关机了在陪你聊天要给你放一首歌听做什么2关机了在陪你聊天要给你放一首歌听O O O O O O举例你叫什么名字机器人需要先确定句子性质,扫描句子内容并搜索疑问词库找到句子里有“什么”这个词,确定为疑问句( 特殊句子另行判断,

9、在此仅做举例 ) 扫描公共属性库确定句子里有“叫什么”这个属性词从属性词向前扫描( 向前或向后这些人为规则的确定,每个语种各不一样 ) 搜索代名词库,找到句子里有代词“你” (仅作举例,特殊句子另行考虑 ),即句 子的主语是“你”,确定下一步扫描对象为自身属性库 (如果扫描到主语是 “我”, 则下一步将扫描主人的属性库, 早期机器人主要是主人和机器人的人机对话, 因 此早期机器人只需要建立第一人称 “我”<即主人 >的数据库和第二人称 “你”< 机器人自身 > 的数据库,第三人称数据库则可囊括世界万物,只需要不断扩充即 可,扩充量越大,知识面越广,并且和人类一样学无止境

10、 < 通常会先建立常用的 第三人称数据库 >)。从自身属性库中找到 “叫什么”这个属性词, 从属性词后面的参数中调出回 答内容:“叫小宝”。根据汉语语法规则,输出:我 +“叫小宝” =我叫小宝 注:句子里的“名字”这个词,属于名词,是第三人称,未来将随着数据库不断 扩充,将会像机器人自身属性库一样为“名字”这个词建立属性库, “名字”这 个词即可以被机器人所“认识” ,机器人在高级智能程度下,将可以建立人与名 字之间的联系。 另外,机器人一般会先建立常用的第三人称数据库, 如车载系统 会先建立车、 空调、后备箱、 音响等数据库。 不常用的第三人称通常不需要建立 数据库就可以理解句子

11、的意思, 如,你叫什么和你叫什么名字两句话, 机器人不 理解“名字”为何物并不重要,因为“叫什么”已经成为了一种常用属性名。举例你想干什么?机器人先扫描句子并搜索疑问词库, 找到句子里有 “什么”这个疑问词, 判 断为问句。扫描公共属性词库,找到句子里有“干什么”这个属性词,判断属性值为 2 ( 假设 2 表示为动态属性 ),从属性词向前扫描,搜索时态词库,找到动态属性 词前面有时态词“想” ,确定为将来时,在读取属性库内容时将读取参数 3。 扫描时态词前面并搜索代名词数据库, 找到主句是 “你”, 确定下一步扫描 对象为机器人自身属性库。读取自身属性库中“干什么”属性名后面的参数 3 的值

12、根据汉语语法规则, 输出:我+“要给你放一首歌听” =我要给你放一首歌听 (如果搜索到动态属性词前面有个时态词为 “在”,即“你在干什么”,则确定为 进行时,读取参数 2,即回答:“我在陪你聊天”)注:以上思路仅为举例,先搜索哪类词库需要设计一套不断完善的语法分析结 构,用来依次分辨出句子性质、属性值、词性、时态、主语、谓语、宾语、及 其他词类,最终确定需要读取哪个对答内容进行输出。 这样可以让对话机器人 实现对答内容的高度智能化。 且因为每个语种的语法结构各不相同, 因此这套语 义分析结构只能用来分析一种语言, 如,根据汉语语法规则设计出的语义分析结 构无法理解英语句子,即便数据库里有英文单

13、词。机问人答:机器人:你是什么颜色?答:红色。 机器人:哦!(并同时将红色这个参数值保存到主人属性数据库的颜色参数值里, 这个功能可以使机器人具备了基本的记忆与学习能力 )思路如下:1机器人根据条件的设置,自动向人类发出提问2 人类做出回答3 机器人扫描人类回答的句子,搜索所问问题中属性名所对应的参数值数据库 (机器人提问的每个问题都有对应的属性名, 每个属性名都对应着一个参数数据 库,如,颜色这个属性,对应着保存有红黄蓝绿等颜色参数的数据库 ) 4找到人类回答的句子中有与参数数据库中匹配的“红色” ,将红色保存到主人 属性数据库中的颜色属性的参数值位置(仅做举例,特殊回答另行考虑)。等于 机器人记住了主人的一个属性或信息,即:主人的颜色为红

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论