下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第7章语音识别思考题答案语音识别的目的是什么?语音识别系统可以怎样进行分类?当前,语音识别的主流方法是什么?语音识别主要指让机器听懂人说的话,即在各种情况下,准确地识别出语音的内容,从而根据其信息,执行人的各种意图。一般语音识别系统按不同的角度有下面几种分类方法:(1)孤立词、连接词、连续语音识别系统以及语音理解和会话系统;(2)大词汇、中词汇量和小词汇量语音识别系统;(3)特定人和非特定人语音识别系统。语音识别方法一般有模板匹配法、随机模型法和概率语法分析法三种。为什么影响语音识别技术实用化的困难是不可低估的?实用语音识别研究中存在哪些主要问题和困难?从语音识别的角度看,语音信号是随机的、多变的,其语法规则既复杂又不完全确定,这给获取完备的规则以及执行高效的算法都带来了极大的难度。实用语音识别研究中仍存在如下问题和困难:(1)语音识别的一种重要应用是自然语言的识别和理解;(2)语音信息的变化很大;(3)语音的模糊性。(4)单个字母及单个词语发音时语音特性受上下文环境的影响,使相同字母有不同的语音特性。(5)环境的噪声和干扰对语音识别有严重影响。一个实用语音识别系统应由哪几个部分组成?语音识别中常用的语音特征参数有哪些?什么是动态语音特征参数?怎样提取动态语音特征参数?语音识别模块是语音识别系统的核心部分,其除了包括语音的声学模型以及相应的语言模型的建立、参数匹配方法、搜索算法、话者自适应算法,还包括增添新词的功能、数据库管理和友好的人机交互界面等。识别参数可以选择下面的某一种或几种的组合:平均能量、过零数或平均过零数、频谱、共振峰、倒谱、线性预测系数、偏自相关系数、声道形状的尺寸函数,以及音长、音高、声调等超声短信息函数。此外,Mel倒谱参数也是常用的语音识别特征参数。上述参数的时间变化反映了语音特征的动态特性就是动态语音特征参数。提取的语音特征参数有时还要进行进一步的变换处理,如正交变换、主元素分析、最大可分性变换等,以达到进一步的压缩处理和模式可分性变换,节省模式存储容量和识别运算量,提高识别性能的目的。给定一个输出符号序列,怎样计算HMM对于该符号序列的输出似然概率?对于任一待识别的语音,首先将其进行预处理和特征提取,得到对应的特征矢量序列(如果选用的是离散型HMM,则需要进行矢量量化)。然后利用HMM的基本算法—前向-后向算法计算该特征矢量序列在训练好的每个孤立字(词)HMM上的输出概率。什么是孤立字(词)语音识别?孤立字(词)语音识别有哪些有效方法?简要说明它们的工作原理。孤立字(词)识别系统,顾名思义是识别孤立发音的字或词。常用识别方法包括:(1)采用判别函数或准则的方法。最典型的是贝叶斯准则,它是一种概率统计的方法。(2)采用动态时间规整的方法。字音的起始点相应于路径的起始点。最优路径起点至终点的距离即为待识别语音与模板语音之间的距离,与待识语音距离最小的模板对应的字音即判为识别结果。这种方法运算量较大,但技术上较简单,识别正确率也较高。在各点的匹配中对于短时谱或倒谱参数识别系统,失真测度可以用欧氏距离;对于采用LPC参数的识别系统,失真测度可以用对数似然比距离。决策方法一般用最近邻准则。(3)采用矢量量化技术的方法。矢量量化技术在语音识别的应用方面,尤其是在孤立字(词)语音识别系统中得到了很好的应用。特别是有限状态矢量量化技术,对于语音识别更为有效。决策方法一般用最小平均失真准则。(4)采用HMM技术的方法。HMM的各状态输出概率密度函数既可以用离散概率分布函数表示;也可以用连续概率密度函数表示。一般连续隐马尔可夫模型要比离散隐马尔可夫模型计算量大,但识别正确率要高。(5)采用人工神经网络技术的方法。(6)采用混合技术的方法。为了弥补单一方法的局限性,可以采用把几种方法组合起来的办法。如用矢量量化作为第一级识别作为预处理,从而得到若干候选的识别结果,然后再用DTW或HMM方法做最后的识别。因此,混合技术包括VQ/DTW和VQ/HMM等识别方法。为什么在语音识别时需要做时间规整?因为语音信号具有相当大的随机性,即使是同一个人在不同时刻所讲的同一句话、发的同一个音,也不可能具有完全相同的时间长度。在进行模板匹配时,这些时间长度的变化会影响测度的估计,从而使识别率降低,因此时间伸缩处理必不可少。为什么概率尺度的DP方法可以适用于非特定人的语音识别?在概率尺度的DP中,条件概率和状态转移概率分别应怎样求得?概率尺度DP方法,实际上相当于把语音样本的每一帧看作一个模型状态的连续状态HMM。因为如果参考样本是Y=Y1,Y2,…,YJ,则其特征矢量的时间序列是一个马尔可夫过程,如果把每一个特征矢量看作马尔可夫过程的一个状态,同时把输入信号X=X1,X2,…,XI看作观察时间序列并应用Viterbi算法,则HMM方法和概率尺度DP方法具有同一关系式。由于连续状态HMM能较好地描述语音特征矢量的帧间相关信息,改善HMM的动态特性,可望得到较好的识别性能。条件概率:状态转移概率:连续语音识别比孤立语音识别应该多考虑些什么问题?有哪些难题?应该如何去加以解决?为什么连续语音识别一般要利用语言文法信息?连续语音识别需处理语音连贯性、背景噪声、上下文理解,以及复杂的语法和语义结构,同时确保实时处理的准确性。难题:(1)语音处理和语言处理相互之间不施加约束,必然增加许多不必要的中间结果,从而既增加计算量又增加误识别的可能;(2)两个非紧密结合的模块之间传递信息时,一般要产生信息丢失,因而影响识别精度。因此,比较好的方法应该是把句法分析的语言处理过程结合进语音识别过程中,实现帧同步的语音-语言处理的统合。语言文法信息在连续语音识别中被用来提高识别准确率,减少搜索空间,并帮助纠正错误,从而增强系统的整体性能。为什么语音识别系统的性能评价研究很重要?应怎样评测一个语音识别系统的性能好坏?语音识别系统的性能评价研
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 气管插管操作步骤详解
- 施工现场人员工作环境改善方案
- 2026年合肥庐江县人民医院社会化用人校园招聘27名笔试参考题库及答案解析
- 15.3 电热器 电流的热效应 教学设计 2023-2024学年苏科版物理九年级下册
- 施工质量检测与控制方案
- 中国兵器工业第二〇六研究所2026届春季校园招聘考试备考题库及答案解析
- 电击伤急救与医疗资源分配
- 施工劳动力安排方案
- 气切护理基础知识
- 钢结构抗震设计计算方案
- GB/T 42706.1-2023电子元器件半导体器件长期贮存第1部分:总则
- 传染病学教学课件:登革热
- 综合实践活动劳动与技术八年级下册教案
- TCSAE 178-2021 电动汽车高压连接器技术条件
- GB/T 17780.5-2012纺织机械安全要求第5部分:机织和针织准备机械
- FZ/T 73001-2016袜子
- 远景变桨控制系统介绍及典型故障案例讲解
- 试验8家鸽解剖课件
- 洪湖姓氏志-黎氏的迁徙分布
- 《小小鞋店》 教学课件
- 全绝缘铜管母线安装方案
评论
0/150
提交评论