注册 |

微信扫一扫登录

x

人人文库网 > 图纸下载 > 毕业设计 > 基于连续隐马尔科夫模型的语音识别

毕业论文(金微）.doc

基于连续隐马尔科夫模型的语音识别

资源目录

基于连续隐马尔科夫模型的语音识别.rar

基于连续隐马尔科夫模型的语音识别

毕业论文(金微）.doc---(点击预览)

基于连续隐马尔科夫模型的语音识别.doc---(点击预览)

压缩包内文档预览：(预览前20页/共90页)

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

预览图

编号：619507 类型：共享资源大小：811.10KB 格式：RAR 上传时间：2016-03-07 上传人：追****机 IP属地：河北

12
积分

版权申诉

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

关键词：: 基于连续隐马尔科夫模型语音识别辨认

资源描述：: 基于连续隐马尔科夫模型的语音识别,基于,连续,隐马尔科夫,模型,语音,识别,辨认

内容简介：: 业设计（论文）题目 : 基于连续隐马尔科夫模型的语音识别学院机自专业自动化学号 03122669 学生姓名金微指导教师李昕起讫日期上海大学毕业设计 (论文 ) 1 目录摘要 :. 绪论 . 第一章 . 第二章 . 第 . 第 . 第 . 第 .海大学毕业设计 (论文 ) 2 论文题目摘要摘要正文（注：简要介绍本论文的主要内容，主要为本人所完成的工作和创新点）关键词：（注：不宜多，最好不超过 5 个）上海大学毕业设计 (论文 ) 3 上海大学毕业设计 (论文 ) 4 绪论计算机技术的飞速发展，使人与机器用自然语言进行对话的梦想逐渐接近现实。人类的语言在人类的的智能组成中充当着极其重要的角色，人与人之间的交流和沟通 70%意商是通过语言的方式有效的完成。作为人与人之间交流最方便、自然、快捷的手段，人们自然希望它成为人与计算机交流的媒介。语音识别就是研究计算机听懂人类语言的一门科学。也是人机交互最重要的一步。进入九十年代之后，出现了诸多实用化的研究方向。语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已大于 98%，对特定人语音识别系统的识别精度就更高。这些技术已经能满足通常应用的要求。由于大规模集成电路技术的发展，这下复杂的语音识别系统也已经完全可以制成芯片，大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些电话机、手机已经包含了语音识别拨号的功能，是有语音记事本、语音智能玩具等产品也包括了语音识别与语音合成的功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好的结果。调查统计表明多达 85%意商的人对语音识别信息查询服务系统的性能表示满意。可以预测在近五十年内，语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统，我们只能朝着改进语音识别系统的方向逐渐地前进。我国语音识别研究工作起步于五十年代，但近年来发展很快。研究水平也从实验室走向实用。从 1987 年开始执行国家 863 计划后，国家 863 智能计算机专家组为语音识别技术研究专门立项，在汉语语音识别技术上还有自己的特点与优势，并达到国际先进水平。第一章语音识别基础第一节语音识别的基本内容语音识别是一种集声学、语音学、计算机、信息处理、人工智能等于一身的综合技术，可广泛的应用在信息处理、通信与电子系统、自动控制等领域。上海大学毕业设计 (论文 ) 5 语音识别主要包括语音单元的选取，特征提取技术，模式匹配准则及模型训练技术三方面内容。语音识别的原理框图如图 1示：图 1音识别的原理框图一、识别单元的选取选择识别单元是语音识别研究的第一步。语音识别单元有单词、音节和音素三种，具体选哪种，由具体的研究任务决定。单词单元广泛应用于中小词汇语音识别系统，但不是和大词汇系统，原因在于模型库规模太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，数量相对较少，并且汉语虽然有大约 1300个音节，但若不考虑声调，约有 408 个无调音节，数量相对较少。因此，对于大、中词汇量汉语语音识别系统来说，以音节为识别单元基本是可行的；音素单元以前多见于英语语音识别系统的研究中，但目前大、中词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母和韵母构成，且声韵母的声学特性相差很大。实际应用中常把声母的不通而构成细化声母。由于协同发音的影响，音素单元的不稳定，所以如何获得稳定的音素单元，还有待研究。二、特征参数提取技术语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息是由特征提取完成的。特征参数提取的目的是对语音信号进行分析处理，提取对语音识别有用的信息，同时对语音信号进行压缩。在实际应用中，语音信号的压缩率介于 10音信号包含了大量各种不同的信息，提取哪些信息，用哪种方式提取，需要综合考虑个方面的因素，如成本、性能、响应时间、计算量等。非特定人语音识别系统一般侧重提取反应语义的特征参数，尽量去除说话人的个人信息；而特定人语音识别系统则希望在提取反映语义的特征参数的同时，尽量也包含说话人的个人信息。线性预测分析技术是目前应上海大学毕业设计 (论文 ) 6 用广泛的特征参数提取技术，许多成功的应用系统都采用基于术提取的倒谱参数。但线性预测模型是纯数学模型没有考虑人类听觉系统对语音的处理特点；数和基于感知线性预测分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果。实验证明采用这种技术语音识别系统的性能有一定提高。三、模式匹配和模型训练技术模型训练是按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数，而模式匹配则是根据一定准则，使未知模式与模型库中的某一个模型获得最佳匹配。语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术（隐马尔科夫模型（人工神经元网络（较早的一种模式匹配和模型训练技术，它应用动态归划方法成功解决了语音信号特征参数序列比较时时长不等的难题，在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统，目前已被型和替。型是语音信号时变特征的有参表示法。它由相互关联的两个随即过程共同描述的统计特征，其中一个是隐蔽的具有有限状态的，另一个是与的每一个状态相互关联的观察矢量的随即过程。隐含的特征要依靠可观测到的信号特征表示。这样，语音等时变信号某一段的特征就由对应的观察符号的随即过程描述，而信号随时间的变化由隐蔽的转移概率描述。模型参数包括朴结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点，型。一般来说，在训练数据足够是，于型的训练和识别都已经研究出有效的算法，并不断完善，以增强型的鲁棒性。人工神经元网络在语音识别中的应用是现在研究的又一热点。质上是一个自适应非线性动力学系统，模拟人类神经元活动的原理，具有自学、联想、对比、推理和概括能力。这些能力是型不具备的，但型的动态时间归正性能。因此，现在已有人研究如何把二者的优点有机结合起来，从而提高整个模型的鲁棒性。结合以及结合是当前语音识别研究的一个方向。第二节语音识别的实现难点语音信号的声学特征随与之前后的语音不同而有很大变化，且连续语音流中各种语音单位之间不存在明显的界线。语音特征随发音人的不同、发音人生理和心理状态的变化而有很大的差异。上海大学毕业设计 (论文 ) 7 环境噪声电和传输设备的差异也将直接影响语音特征的提取。一个语句所表达的意思与上下文内容、说话时的环境条件及文化背景等因素有关，而语句的语法结构又是多变的，并且语境信息几乎是计算机语音识别无法利用的，所有这些都给语意的理解带来了和大的困难。第二章理论基础第一节一、信号模型隐马尔科夫过程是一个双重随机过程：一重用于描述非平稳信号的短时平稳的统计特征（信号的瞬态特征，可直接观测到）；另一个重随机过程描述了每个短时平稳如何转变到下一个短时平稳段，即短时统计特征的动态特性（隐含在观察序列中）。基于这两重随机过程，可有效解决怎样辨识具有不同参数的短时平稳信号段，怎样跟踪它们之间的转化问题。人的语言过程也是这样一个双重随机过程。因为语音信号本身是一个可观察的序列，而它又是由大脑里的（不可观察的）、根据言语需要和语法识别（状态选择）、所发出的音素（词、句）的参数流，同时，大量实验表明，确可以非成精确地描述语音信号的产生过程。第二节隐马尔科夫模型的数学描述一、马尔科夫链定义随机序列任何时刻 t，可以处在状态 1， 2， n，且在 t+qt+与它在 t 时刻的状态与 t 时刻以前它所处在的状态无关。 P（ Xt+k qt+k|， P（ Xt+k qt+k| K 步转移概率： t， t+k） P（ qt+k j| j）当 t,t+k）与 t 无关时，称马尔科夫链为齐次马尔科夫链。可写为： t,t+k） k）当 k 1 时， 1）为一步转移概率，记为 1i+ 。如在2-1(a)中， 2,表示不允许一次跳跃经过两个以上的状态。图 2-1(b)是一种更常用，更简单的马尔科夫链，与图 2-1(a)相比，它不存在跨越状态，因而成为无跨越由左至右模型。图 2型马尔科夫链示意图二、全连结或个态遍历种模型中从每个状态都可以一步到达其他状态。如图 2示：图 2连结这种模型中每个系数是正值。对应的转移矩阵如下：上海大学毕业设计 (论文 ) 10 虽然可将分为全连结和由左至右模型，但还存在很多种可能的变化和组合。如图 2示的右左至右交叉耦合连接的格的说，这种模型属于由左至右模型，因为它满足所有束；但它具有由左至右模型所不具有的灵活性。图 2至右交叉耦合连接的重估公式可以看出，如果任何参数造初始使设置为 0,那么在整个重新估计过程中它仍然保持为零，所以这些加在由左至右或约束跳转模型上的于无数并不影响模型的重估过程。此外，从构成上变体还包括空转移和状态绑定面介绍的观察响亮都是与模型状态相关，但也可考虑使观察向量与模型的弧相关联。这种类型的连续语音识别中被广泛使用。空转移是指这种模型中从一个状态转移到另一个状态不产生输出的转移，通常用表示输出的空值。如图 2示的具有空转移的由左至右图 2有空转移的由左至右数绑定成上的另一种变化。基本思想是在不同状态的数之间建立一个等价关系。这样不仅能够减少模型中独立参数的数量，还能简化参数估计。参数绑定应用于已知两个或更多状态的观察密度函数相同的情况，在刻画语音是这种情况经常发生。此外，在训练数据不足时，使用这种技术非常有效。从观察概率密度方面可以分为离散连续连续概率密度然通用形式的连续概率密度用于很多问题，但还存在其它非上海大学毕业设计 (论文 ) 11 常适合处理语音的其他种类自回归这类模型中，观察向量是通过一个自回归过程中提取的。第三节三个基本问题和解决的方法一、三个基本问题欲使建立的隐马尔科夫模型能解决实际问题，则必须首先解决以下问题。（ 1）已知观察序列 O 和模型（ A,B,），如何计算由此模型产生此观察序列的概率 P（ O|）。（ 2）已知观察序列 O 和模型，如何确定一个合理的状态序列，使之能最佳的产生 O，即如何选择最佳的状态序列 q ，（ 3）如何根据观察序列不断修正模型参数（ A,B,），使 P（ O|）最大？问题（ 1）实质上是一个模型评估问题，因为 P（ O|）反映了观察序列与模型吻合的程度。在语音识别中，我们可以通过计算、比较 P（ O|），从多个模型参数中选择出与观察序列匹配得最好的那个模型。为了解决这个，已经研究出“ 前向后向”算法。问题（ 2）关键在于选用怎样的最佳准则来决定状态的转移。一种可能的最佳准则是：选择状态 q*t，使它们在各 t 时刻都是最可能的状态，即这里存在一个问题：有时会出现不允许的转移，即 0,那么，对这些 i 和 j 所得到的状态序列就是不可能的状态，而没有考虑整体结构、相邻时间的状态和观察序列的长度等问题。针对这个缺点要求人们研究一种在最佳状态序列基础上的整体约束的最佳准则，并用此准则找出一条最好的状态序列。目前，解决这个问题的最好方案是法。问题（ 3）实质上就是如何训练模型，估计、优化模型参数的问题。这个问题在这三个问题中是最难的，因为没有解析法可用来求解最大似然模型，所以只能用迭代法（法）或使用最佳梯度法。二、“ 前向后向”算法问题 1 的解决方案从定义出发计算概率 P（ O|），可得下式：显然，按上式计算 P（ O|）是不现实的，因为它的计算量相当大。为上海大学毕业设计 (论文 ) 12 了有效地解决这个问题，引入了向前概率和向后概率来简化计算。它们的定义及有关的递推公式如下。前向概率定义为 i） P（ i|）即是在给定模型的前提下，前 t 个时刻的观察序列为且在 t 时刻处在状态 i 的概率。计算公式如下：后向概率定义为 t（ i） P( i|)，即是在给定模型下，从 t+1 时刻开始到观察结束这一段的观察序列为且在 t 时刻处在状态 i 的概率。计算公式如下：根据前向及后向的概率定义可推倒出：或二、法问题 2 的解决方案前面已经提到，如何确定一个最佳状态序列的关键在于选用怎样的最佳准则。考虑到状态序列的整体特性，法采用如下的最佳准则。即在 t 时刻选择状态 i，使模型沿状态序列动产生观察序列概率最大。根据定义，可以得到 t（ i）的递推计算公式。其中 t+1（ j）的物理含义是若 t+1 的最佳状态为 j，则 t 时刻的最佳状态为t（ j）。上海大学毕业设计 (论文 ) 13 基于此最佳准则，我们可以通过下面的递推得到最佳状态序列 q* q*1 q*T和 P O， q*| （在模型下，按照最佳状态序列路径产生观察序列 O 的概率：三、法问题 3 的解决方案在介绍法之前，首先引入两个相关的概率定义 t（ i,j）和 t（ i）。 t（ i,j）表示在已知观察序列 O 和模型的情况下， t 时刻处于状态 i， t+1 时刻处于状态 j 的概率， t（ i,j） P（ i， j|O，）。通常t（ i,j）采用归一化形式，即式中 t（ i）， t（ j）为前面提到的前向和后向概率。 t（ i）为给定观察序列和模型的条件下， t 时刻处于状态 i 的概率。根据定义有：结合 t（ i,j）和 t（ i）的定义，可知：为观察序列中，从状态 i 出发的状态转移次数的期望。为观察序列中，从状态 i 到 j 的状态转移次数的期望。法的基本思想是：按照某种参数重估公式从现有的模型估计出新的模型 ,使得 P（ O|） =P（ O|）。用替换，重复上述过程直到模型参数处于收敛状态，使得 P（ O|现有模型） =P（ O|新估计出来的模型）。因为上海大学毕业设计 (论文 ) 14 观察上式乐意看出辅助函数的各个单项都具有以下形式：变量 y 满足。通过数学推导可知，在满足约束条件的情况下变量 y ，时，各单项取值最大。对辅助函数的各个单项 Q（ |）求最大值，即可推导出 Q（ |）最大化的模型的参数重估公式。上海大学毕业设计 (论文 ) 15 根据前面对和的分析，可以看出重估公式也具有明显的物理含义。（ 1）为在 t 1 时刻状态 i 的概率；（ 2）（ 3）第四章法实现的问题解决三个基本问题以后，在实际应用决问题时还有很多问题需要解决，如初始模型的选取、数据下溢、间距离的度量等等。第一节态类型及 B 参数的选择一、态类型的选择当实际信号相结合时，首先需要解决的问题是状态类型的选择。在描述实际语音信号是一般都要对的状态数及转台转移规律作一定的限制，而状态转移结构达多为“无跨越由左至右类型”和“有跨越由左至右类型 ” 。这两种结构除了都要满足外，状态“ 1”与状态“ 4”分别为源状态和吸状态，这意味着语音必须从状态“ 1”开始到状态“ 4”结束，这正好与人的发音过程对应。二、 B 参数类型的选择为了采用连续观测密度，必须对模型的概率密度函数（形式作某些限制，以保证能够对参数进行一致的估计。当然，不同形式的由不同的参数来描述的，而估计这种参数的重估公式也是不一样的。这里采用一种广泛应用的斯 j）为例。 B 参数是非常重要的一个参数，它描述在某种状态时观察值序列上海大学毕业设计 (论文 ) 16 的概率分布。在前面的讨论中它都是离散的。然后，为了更好地描述语音信号的时变性，在实际的关键检索系统中通常采用连续的概率分布，即用 o）表示在 o 与 o+间观察矢量的概率。这里 o）称为参数的概率密度。目前采用最多的 o）形式为高斯 M 元混合密度，可以用它无限逼近任意一个有限连续概率密度函数，其定义为：式中： o 为观察矢量；状态 j 中第 k 个混元的混合加权系数， N是正态密度，状态 j 中第 k 个混合分量的均值矢量和协方差矩阵。注意，须满足下式。因为只有这样概率密度函数才能满足归一条件，即满足在这种定义下，重估 B 参数的公式转化为对重估计算。如下式所示：式中， t（ j， k）是 t 时刻的观察矢量状态 j 中的第 k 个混合分量产生的概率，即、第二节练时需要解决的问题上海大学毕业设计 (论文 ) 17 一、初始模型的选取根据法由训练数据得到数时，一个重要问题就是初始模型的选取。不同的初始模型将产生不同的训练结果，因为算法是使 P（ O|）局部极大时得到的模型参数，因此，选取好的初始模型，是最后求出的局部极大与全局最大接近是很有意义的。但是，至今这个问题仍没有完美的答案。实际处理是都采用一些经验方法。一般认为，和 A 参数初值选取影响不大，可以随机选取或均匀取值，只要满足概率要求即可。但 B 的初值对训练出的般倾向采取较为复杂的初值选取方法。比较典型的数估计算法是“ K 均值分割”算法。“ K 均值分割”算法训练框图如图 3示：图 3K 均值分割”训练框图假定我们已有一组训练观察和所有模型的初始估计。这些初始估计是随机给出或建立在相应数据的已有模型基础之上的。模型初始化后，根据当前模型将训练观察序列集分割成状态。这种分割是借助法找到最优状态序列实现的。对模型中每个状态来说，每个训练序列分割的结果就是出现在当前模型中任何一个状态观察集的最大似然估计。在使用离散符号密度时，每个状态中的任意一个观察向量是使用具有 M 码字的码书编码的， k）参数估计的更新公式如下： k）状态 j 中码书索引为 k 的观察向量数量 /状态 j 中所有观察向量数量。在使用连续观察密度的情况下，分段 K 均值过程用于每个状态的过程向量聚类为 M 簇，每簇表示度的 M 个混合的一个。根据生成的聚类，得到的一组模型参数的更新公式如下：根据这种状态分割，数的更新估计可通过从状态 i 到 j 的转移计数除上海大学毕业设计 (论文 ) 18 以从状态 i 出发的所有转移（包括转移到自身）计数实现。根据这些更新后的模型参数得到了新模型。然后开始使用真正的重估过程重新估计所有模型参数。将产生的模型与先前的模型进行比较，如果模型距离打分超过设定的域值，那么用新模型取代先前的模型；如果模型距离打分小于或低于设定的域值，那么判定模型收敛并将保存作为最终得到的模型参数。当然，很多类型。因此，针对不同形式的采取不同有效的初值选取方法。二、比例因子的问题在前向后向算法和法中，都有 t（ i）和 t（ i）的递归计算，因为所有量都小于 1,因此， t（ i）和 t（ i）都迅速趋向于零，为了解决这种下溢的问题，必须采取增加比例因子的方法，对有关算法加以修正，处理过程如下：（ 1）对的处理上海大学毕业设计 (论文 ) 19 也就是说 t（ j）的比例因子实际上是所有状态的 t（ i）之和的倒数。（ 2）对的处理由于每个比例因子实际上使的模恢复到 1,而和模相近，所以，让和采用相同的比例因子是保持计算总是在合适的界限内进行的有效方法，在对和做上述处理之后，再来看看重估公式，不过之前，需亚对重估公式改写。上海大学毕业设计 (论文 ) 20 显然，上述比例因子也可用于和 B 参数的重估计算。如果在某个时间 t 不需要比例因子，可令比例因子为 1,不影响重估公式。增加比例因子所引起的唯一实际变化是 P（ O|）的计算，不能简单地把进行求和，因为这些值已经引入了比例因子，不过可以利用如下性质。这样可以计算 P 的对数，但不能计算 P，因为不管怎样它都会越界。最后，当采用法求最佳状态序列时，如果按如下方法，就不需要比例因子。最后得到的值是不是 P*，但是计算量却少得多且不会产生越界。三、使用多个观察值序列训练实际中，训练一个常要用到不止一个观察值序列，那么，对于 K 个观察值序列训练，要对法的重估公式加以修正。设 K 个观察值序列为 O(k)（ k 1,2, K），其中 O(k) o(k)1， o(k) 个观察序列，假定各个观察值序列独立，第 k 个观察序列出现的概率，此时，由于重估公式是以不同事件的频率为基础的，因此，对 k 个训练序列，重估公式修正为：上海大学毕业设计 (论文 ) 21 四、克服训练数据不足的方法根据定义，一个（ A,B，）含有很多个待估计的参数，因此，为了得到最满意的模型，必须要有很多的训练数据。这个问题的一种解决方法是增加训练数据，这往往是难以办到的。另一方面可能的解决方法是选择规模更小的模型，但是采用一个给定模型总是有其具体理由的，因此规模大小也不能改变。第三种可能的解决办法是合并两个模型的参数，即对两个针对同一事件的表示不同程度的细节和隐健性的模型进行合并。比如说，通常一些出现次数很少的观察值矢量没有包含在整个训练数据中，这样训练出来的数中就会有不少为零的概率值。而事实上，在实际语音识别测试时，这些观察值矢量又可能出现，因而需要对训练好的模型进行平滑处理，而一般为了避免过分平滑。总是要合并平滑前后的模型参数，以获得较好的结果模型。合并两个问题可以表述为 1（ 1 ） 2。式中（ A,B,）为结果模型， 1（ 1）和 2（ 2）为两个待合并的模型，0=1 为合并时的系数。因此，问题的关键就是合并权值的估计。一种可能的方法是人工选取权值，人就是根据训练量的多少和每个模型中概率分布的合适程度来人工选择权值的，并在语音识别中取得了成功。但这中方法的局限也是很明显的：过分依赖于人的经验判断，而且工作量也很大。另一种估计的方法就是著名的消去内插法。这种方法最早是由出，随后被广泛使用在基于语音识别系统中，它的基本思想为：设 1 和 2 模型中状态 j 对应的观察值概率，中状态 j 对应的观察值概率，那么，由上式有： 1式可以理解为模型中状态 j 被 3 个状态 j*、取代。如图 3示，其中状态 j*无输出观察值概率，状态输出观察值概率分别为状态 j*由状态移的概率分别为和 1上海大学毕业设计 (论文 ) 22 不占用时间。那么，估计权值的问题就转化为一个典型的题，因此，由练算法就可直接估计出权值。图 3去内插法的示意图但消去插值的核心是使权值的估计对未来的数据仍然有价值。因此，要求用以估计 1 和 2。由于这种对总的训练数据的划分有很多种方式。由此得到很多的值，再用一个循环递归处理，可以求出多由的权值。由上述讨论可知，消去插值法计算量很大，这是其不足之处。虽然进来有人给出了其快速算法，但在实际应用中完整地实现消去插值法来估计权值仍然相当困难。事实上，实际应用消去插值法时，也是将它修正简化，一方面减少计算量；另一方面，对每个状态都估计出一个权值。另外，从法的重估公式可以看出推导出一种对可靠性度量方法。这样，就可以得到待合并的两个或多个模型各自的相对可靠程度，由此确定合并时的权值。这种估计权值的方法可以简述如下。根据重估公式，考虑 K 个观察值序列训练模型（ A,B,），于是有上海大学毕业设计 (论文 ) 23 分析上式可知，当用 K 个训练序列获取数时，在每次迭代时，可以分别用每个训练序列获取相应的数，再加以合并，而且，合并的权值仅仅取决于状态数目。由此，可以认为，正是状态数目描述了相对可靠程度。因此，当需要合并 L 个，对任一状态 j，合并的权值可由出。由于这种估计权值的方法由法中重估公式导出，因而在最大似然意义上是最佳的，而其，对每一个状态都选取一个合并的权值，而不是对整个待合并的取权值，除了保存模型参数之外，还应保存相应的状态数目，因此，需占用较多的存储空间。第四章上海大学毕业设计 (论文 ) 24 上海大学毕业设计 (论文 ) 25 致谢参考文献【 1】 . 作者姓名 , 书名类型标识 , 版次（第 1 版略），出版地，出版者，出版日期 , 起讫页码【 2】 . 作者姓名，文题类型标识，刊名，出版日期，卷（期），起讫页码【 3】 . 作者姓名，文章名，网址，日期（网上资料类）上海大学毕业设计 (论文 ) 26 附录： 1. 业设计（论文）论文题目基于连续隐马尔科夫模型的语音识别学院机自专业自动化学号 03122669 学生姓名金微指导教师李昕起讫日期 2007 1 目录摘要论一章语音知识基础一节语音识别的基本内容二节语音识别的实现难点二章理论基础一节二节隐马尔科夫模型的数学描述三节四节三个基本问题和解决的方三章法实现的问题一节态类型及参数 B 的选择二节题四章语音识别系统的设计一节语音识别系统的开发环境二节基于别系统的设计三节实验结果五章结束语谢考文献 2 摘要语音识别系统中最重要的部分就是声学模型的建立，隐马尔可夫模型作为语音信号的一种统计模型，由于它能够很好地描述语音信号的非平稳性和时变性，因此在语音识别领域有着广泛的应用。隐马尔可夫过程是一个双重随机过程 :一重随机过程用于描述非平稳信号中短时平稳段的统计特征 ;另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段，即短时统计特征的动态特性。为了能够对一个全面的认识并能够将其应用于解决实际问题当中，本文介绍了基本理论以及其如何将其应用于语音识别中，在解决三个基本问题以后，还谈论了在具体应用时需要考虑的其他问题，如初始模型参数的选取、数据下溢、间距离的度量等等，并给出了相应的解决方法。这个语音识别系统是用型来实现的，用做语音识别的识别率是很高的，其中用到了三个算法。关键词：语音识别， 3 he of a is As a of MM it to MM to it in in of In it of MM It is to MM 4 绪论计算机技术的飞速发展，使人与机器用自然语言进行对话的梦想逐渐接近现实。人类的语言在人类的的智能组成中充当着极其重要的角色，人与人之间的交流和沟通 70%意商是通过语言的方式有效的完成。作为人与人之间交流最方便、自然、快捷的手段，人们自然希望它成为人与计算机交流的媒介。语音识别就是研究计算机听懂人类语言的一门科学。也是人机交互最重要的一步。进入九十年代之后，出现了诸多实用化的研究方向。语音识别技术发展到今天，特别是中小词汇量非特定人语音识别系统识别精度已大于 98%，对特定人语音识别系统的识别精度就更高。这些技术已经能满足通常应用的要求。由于大规模集成电路技术的发展，这下复杂的语音识别系统也已经完全可以制成芯片，大量生产。在西方经济发达国家，大量的语音识别产品已经进入市场和服务领域。一些电话机、手机已经包含了语音识别拨号的功能，是有语音记事本、语音智能玩具等产品也包括了语音识别与语音合成的功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息，并且取得很好 5 的结果。调查统计表明多达 85%意商的人对语音识别信息查询服务系统的性能表示满意。可以预测在近五十年内，语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统，我们只能朝着改进语音识别系统的方向逐渐地前进。我国语音识别研究工作起步于五十年代，但近年来发展很快。研究水平也从实验室走向实用。从 1987 年开始执行国家 863 计划后，国家 863 智能计算机专家组为语音识别技术研究专门立项，在汉语语音识别技术上还有自己的特点与优势，并达到国际先进水平。 6 第一章语音识别基础第一节语音识别的基本内容语音识别是一种集声学、语音学、计算机、信息处理、人工智能等于一身的综合技术，可广泛的应用在信息处理、通信与电子系统、自动控制等领域。语音识别主要包括语音单元的选取，特征提取技术，模式匹配准则及模型训练技术三方面内容。语音识别的原理框图如图 1示：图 1音识别的原理框图一、识别单元的选取选择识别单元是语音识别研究的第一步。语音识别单元有单词、音节和音素三种，具体选哪种，由具体的研究任务决定。 7 单词单元广泛应用于中小词汇语音识别系统，但不是和大词汇系统，原因在于模型库规模太庞大，训练模型任务繁重，模型匹配算法复杂，难以满足实时性要求。音节单元多见于汉语语音识别，主要因为汉语是单音节结构的语言，而英语是多音节，数量相对较少，并且汉语虽然有大约 1300 个音节，但若不考虑声调，约有 408 个无调音节，数量相对较少。因此，对于大、中词汇量汉语语音识别系统来说，以音节为识别单元基本是可行的；音素单元以前多见于英语语音识别系统的研究中，但目前大、中词汇量汉语语音识别系统也在越来越多地采用。原因在于汉语音节仅由声母和韵母构成，且声韵母的声学特性相差很大。实际应用中常把声母的不通而构成细化声母。由于协同发音的影响，音素单元的不稳定，所以如何获得稳定的音素单元，还有待研究。二、特征参数提取技术语音信号中含有丰富的信息，但如何从中提取出对语音识别有用的信息是由特征提取完成的。特征参数提取的目的是对语音信号进行分析处理，提取对语音识别有用的信息，同时对语音信号进行压缩。在实际应用中，语音信 8 号的压缩率介于 10间。语音信号包含了大量各种不同的信息，提取哪些信息，用哪种方式提取，需要综合考虑个方面的因素，如成本、性能、响应时间、计算量等。非特定人语音识别系统一般侧重提取反应语义的特征参数，尽量去除说话人的个人信息；而特定人语音识别系统则希望在提取反映语义的特征参数的同时，尽量也包含说话人的个人信息。线性预测分析技术是目前应用广泛的特征参数提取技术，许多成功的应用系统都采用基于术提取的倒谱参数。但线性预测模型是纯数学模型没有考虑人类听觉系统对语音的处理特点；数和基于感知线性预测分析提取的感知线性预测倒谱，在一定程度上模拟了人耳对语音的处理特点，应用了人耳听觉感知方面的一些研究成果。实验证明采用这种技术语音识别系统的性能有一定提高。三、模式匹配和模型训练技术模型训练是按照一定的准则，从大量已知模式中获取表征该模式本质特征的模型参数，而模式匹配则是根据一定准则，使未知模式与模型库中的某一个模型获得最佳匹 9 配。语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术（隐马尔科夫模型（人工神经元网络（较早的一种模式匹配和模型训练技术，它应用动态归划方法成功解决了语音信号特征参数序列比较时时长不等的难题，在孤立词语音识别中获得了良好性能。但因其不适合连续语音大词汇量语音识别系统，目前已被替。型是语音信号时变特征的有参表示法。它由相互关联的两个随即过程共同描述的统计特征，其中一个是隐蔽的具有有限状态的，另一个是与的每一个状态相互关联的观察矢量的随即过程。隐含样，语音等时变信号某一段的特征就由对应的观察符号的随即过程描述，而信号随时间的变化由隐蔽型参数包括朴结构、状态转移概率及描述观察符号统计特性的一组随机函数。按照随机函数的特点，型可分为离散隐马尔科夫模型和连续隐马尔科夫模型以及半连续隐马尔科夫模型。一般来说，在训练数据足够是， 10 于型的训练和识别都已经研究出有效的算法，并不断完善，以增强型的鲁棒性。人工神经元网络在语音识别中的应用是现在研究的又一热点。质上是一个自适应非线性动力学系统，模拟人类神经元活动的原理，具有自学、联想、对比、推理和概括能力。这些能力是型不具备的，但不具有型的动态时间归正性能。因此，现在已有人研究如何把二者的优点有机结合起来，从而提高整个模型的鲁棒性。结合以及结合是当前语音识别研究的一个方向。第二节语音识别的实现难点语音信号的声学特征随与之前后的语音不同而有很大变化，且连续语音流中各种语音单位之间不存在明显的界线。语音特征随发音人的不同、发音人生理和心理状态的变化而有很大的差异。环境噪声电和传输设备的差异也将直接影响语音特征 11 的提取。一个语句所表达的意思与上下文内容、说话时的环境条件及文化背景等因素有关，而语句的语法结构又是多变的，并且语境信息几乎是计算机语音识别无法利用的，所有这些都给语意的理解带来了和大的困难。 12 第二章理论基础第一节定义一、信号模型隐马尔科夫过程是一个双重随机过程：一重用于描述非平稳信号的短时平稳的统计特征（信号的瞬态特征，可直接观测到）；另一个重随机过程描述了每个短时平稳如何转变到下一个短时平稳段，即短时统计特征的动态特性（隐含在观察序列中）。基于这两重随机过程，可有效解决怎样辨识具有不同参数的短时平稳信号段，怎样跟踪它们之间的转化问题。人的语言过程也是这样一个双重随机过程。因为语音信号本身是一个可观察的序列，而它又是由大脑里的（不可观察的）、根据言语需要和语法识别（状态选择）、所发出的音素（词、句）的参数流，同时，大量实验表明，第二节隐马尔科夫模型的数学描述一、马尔科夫链定义随机序列任何时刻 t，可以处在状态 1， 2， 13 n，且在 t+k 时刻的状态 qt+与它在 t 时刻的状态与 t 时刻以前它所处在的状态无关。 P（ Xt+k qt+k|， P（ Xt+k qt+k| K 步转移概率： t， t+k） P（ qt+k j| j）当 t,t+k）与 t 无关时，称马尔科夫链为齐次马尔科夫链。可写为： t,t+k） k）当 k 1 时， 1）为一步转移概率，记为 1i+ 。如在 2-1(a)中， 2,表示不允许一次跳跃经过两个以上的状态。图 2-1(b)是一种更常用，更简单的马尔科夫链，与图 2-1(a)相比，它不存在跨越状态，因而成为无跨越由左至右模型。图 2型马尔科夫链示意图 17 二、全连结或个态遍历种模型中从每个状态都可以一步到达其他状态。如图 2 图 2连结这种模型中每个系数是正值。对应的转移矩阵如下：虽然可将分为全连结和由左至右模型，但还存在很多种可能的变化和组合。如图 2示的右左至右交叉耦合连接的格的说，这种模型属于由左至右模型，因为它满足所有束；但它具有由左至右模型所不具有的灵活性。 18 图 2至右交叉耦合连接的重估公式可以看出，如果任何参数造初始使设置为 0,那么在整个重新估计过程中它仍然保持为零，所以这些加在由左至右或约束跳转模型上的于无数并不影响模型的重估过程。此外，从构成上变体还包括空转移和状态绑定面介绍的观察响亮都是与模型状态相关，但也可考虑使观察向量与模型的弧相关联。这种类型的连续语音识别中被广泛使用。空转移是指这种模型中从一个状态转移到另一个状态不产生输出的转移，通常用表示输出的空值。如图 2示的具有空转移的由左至右 19 图 2有空转移的由左至右数绑定成上的另一种变化。基本思想是在不同状态的数之间建立一个等价关系。这样不仅能够减少模型中独立参数的数量，还能简化参数估计。参数绑定应用于已知两个或更多状态的观察密度函数相同的情况，在刻画语音是这种情况经常发生。此外，在训练数据不足时，使用这种技术非常有效。从观察概率密度方面可以分为离散连续然通用形式的连续概率密度还存在其它非常适合处理语音的其他种类自回归这类模型中，观察向量是通过一个自回归过程中提取的。第四节三个基本问题和解决的方法一、三个基本问题欲使建立的隐马尔科夫模型能解决实际问题，则必须首先解 20 决以下问题。（ 1）已知观察序列 O 和模型（ A,B,），如何计算由此模型产生此观察序列的概率 P（ O|）。（ 2）已知观察序列 O 和模型，如何确定一个合理的状态序列，使之能最佳的产生 O，即如何选择最佳的状态序列q ，（ 3）如何根据观察序列不断修正模型参数（ A,B,），使 P（ O|）最大？问题（ 1）实质上是一个模型评估问题，因为 P（ O|）反映了观察序列与模型吻合的程度。在语音识别中，我们可以通过计算、比较 P（ O|），从多个模型参数中选择出与观察序列匹配得最好的那个模型。为了解决这个，已经研究出“ 前向后向”算法。问题（ 2）关键在于选用怎样的最佳准则来决定状态的转移。一种可能的最佳准则是：选择状态 q*t，使它们在各 t 时刻都是最可能的状态，即 21 这里存在一个问题：有时会出现不允许的转移，即 0,那么，对这些 i 和 j 所得到的状态序列就是不可能的状态，而没有考虑整体结构、相邻时间的状态和观察序列的长度等问题。针对这个缺点要求人们研究一种在最佳状态序列基础上的整体约束的最佳准则，并用此准则找出一条最好的状态序列。目前，解决这个问题的最好方案是法。问题（ 3）实质上就是如何训练模型，估计、优化模型参数的问题。这个问题在这三个问题中是最难的，因为没有解析法可用来求解最大似然模型，所以只能用迭代法（法）或使用最佳梯度法。二、“ 前向后向”算法问题 1 的解决方案从定义出发计算概率 P（ O|），可得下式：显然，按上式计算 P（ O|）是不现实的，因为它的计算量相当大。为了有效地解决这个问题，引入了向前概率和向 22 后概率来简化计算。它们的定义及有关的递推公式如下。前向概率定义为 i） P（ i|）即是在给定模型的前提下，前 t 个时刻的观察序列为且在 t 时刻处在状态 i 的概率。计算公式如下：后向概率定义为 t（ i） P( i|)，即是在给定模型下，从 t+1 时刻开始到观察结束这一段的观察序列为且在 t 时刻处在状态 i 的概率。计算公式如下：根据前向及后向的概率定义可推倒出：或 23 三、法问题 2 的解决方案前面已经提到，如何确定一个最佳状态序列的关键在于选用怎样的最佳准则。考虑到状态序列的整体特性，法采用如下的最佳准则。即在 t 时刻选择状态 i，使模型沿状态序列动产生观察序列概率最大。根据定义，可以得到 t（ i）的递推计算公式。其中 t+1（ j）的物理含义是若 t+1 的最佳状态为 j，则 t 时刻的最佳状态为 t（ j）。基于此最佳准则，我们可以通过下面的递推得到最佳状态序列 q* q*1 q*T和 P O， q*| （在模型下，按照最佳状态序列路径产生观察序列 O 的概率： 24 四、法问题 3 的解决方案在介绍法之前，首先引入两个相关的概率定义 t（ i,j）和 t（ i）。 t（ i,j）表示在已知观察序列的情况下， t 时刻处于状态 i， t+1 时刻处于状态 t（ i,j） P（ i， j|O，）。通常 t（ i,j）采用归一化形式，即式中 t（ i）， t（ j）为前面提到的前向和后向概率。 t（ i）为给定观察序列和模型的条件下， t 时刻处于状态 i 的概率。根据定义有：结合 t（ i,j）和 t（ i）的定义，可知： 25 为观察序列中，从状态期望。为观察序列中，从状态 i 到 j 的状态转移次数的期望。法的基本思想是：按照某种参数重估公式从现有的模型估计出新的模型 ,使得 P（ O|） 0); = if ( 5收敛 !n); 63 迭代 40 次仍不收敛 , 退出 ); 程序中，输入参数有两个，结构数组包含了观察序列的信息，每个 k)都包含两个成员 k)k)别为该观察序列的原始语音和参数。其中成员以在调用之前计算，也可以由序内计算。数组 M 包含了各状态对应的高斯混合数。七、测试程序利用训练函数识别函数可以对观察序列进行训练和识别了。 i=1:11 ; k=1:10 c:%d%i,k); ik= k)ik; k); 64 i=3 3 3 3); ; 识别结果一个组，每个元素为一个构，下面一段识别程序。首先用函数其读入，再用函数行端点检测，计算出数后，算得到其对数形式的输出概率，最后用数找到识别结果。下面是识别程序代码： re=,11); i=1:11 k=1:10 c:%d%i,k); % x = x1 =x); m = x); m = m(); j=1:11 j)=j, m); 65 d,n = % 第 %d识别为类型 %dn,i,n) 词汇类别： %d; 第 %d 识别为类型 %dn,i,k,n) if i=n re(i)=re(i)+1; 66; 系统识别率： %dn, 第三节实验结果本语音识别系统所用的语音库是十个足球术语的语音，它们分别为铲球、冲撞、点球、防守、红牌、加速、进球、起动、手球、暂停。一、训练结果第一次：正在计算语音参数第 1 遍训练 66 计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 67 第二次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 68 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第三次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 69 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第四次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 70 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第五次：正在计算语音参数第 1 遍训练重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 71 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第六次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 72 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第七次：正在计算语音参数第 1 遍训练 73 计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 74 第八次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 75 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第九次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 76 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第十次：正在计算语音参数第 1 遍训练 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 77 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 第十一次：正在计算语音参数第 1 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 78 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 第 2 遍训练计算样本参数 . 1 2 3 4 5 6 7 8 9 10 重估转移概率矩阵 A. 重估混合高斯的参数 . 1,1 1,2 1,3 2,1 2,2 2,3 3,1 3,2 3,3 4,1 4,2 4,3 总和输出概率 (04 收敛 ! 二、识别结果词汇类别： 1;第 1 次识别为类型 9 词汇类别： 1;第 2 次识别为类型 11 词汇类别： 1;第 3 次识别为类型 4 79 词汇类别： 1;第 4 次识别为类型 10 词汇类别： 1;第 5 次识别为类型 11 词汇类别： 1;第 6 次识别为类型 8 词汇类别： 1;第 7 次识别为类型 4 词汇类别： 1;第 8 次识别为类型 4 词汇类别： 1;第 9 次识别为类型 4 词汇类别： 1;第 10 次识别为类型 8 词汇类别： 2;第 1 次识别为类型 9 词汇类别： 2;第 2 次识别为类型 11 词汇类别： 2;第 3 次识别为类型 4 词汇类别： 2;第 4 次识别为类型 10 词汇类别： 2;第 5 次识别为类型 11 词汇类别： 2;第 6 次识别为类型 8 词汇类别： 2;第 7 次识别为类型 4 词汇类别： 2;第 8 次识别为类型 4 词汇类别： 2;第 9 次识别为类型 4 80 词汇类别： 2;第 10 次识别为类型 8 词汇类别： 3;第 1 次识别为类型 9 词汇类别： 3;第 2 次识别为类型 11 词汇类别： 3;第 3 次识别为类型 4 词汇类别： 3;第 4 次识别为类型 10 词汇类别： 3;第 5 次识别为类型 11 词汇类别： 3;第 6 次识别为类型 8 词汇类别： 3;第 7 次识别为类型 4 词汇类别： 3;第 8 次识别为类型 4 词汇类别： 3;第 9 次识别为类型 4 词汇类别： 3;第 10 次识别为类型 8 词汇类别： 4;第 1 次识别为类型 9 词汇类别： 4;第 2 次识别为类型 11 词汇类别： 4;第 3 次识别为类型 4 词汇类别： 4;第 4 次识别为类型 10 词汇类别： 4;第 5 次识别为类型 11 81 词汇类别： 4;第 6 次识别为类型 8 词汇类别： 4;第 7 次识别为类型 4 词汇类别： 4;第 8 次识别为类型 4 词汇类别： 4;第 9 次识别为类型 4 词汇类别： 4;第 10 次识别为类型 8 词汇类别： 5;第 1 次识别为类型 9 词汇类别： 5;第 2 次识别为类型 11 词汇类别： 5;第 3 次识别为类型 4 词汇类别： 5;第 4 次识别为类型 10 词汇类别： 5;第 5 次识别为类型 11 词汇类别： 5;第 6 次识别为类型 8 词汇类别： 5;第 7 次识别为类型 4 词汇类别： 5;第 8 次识别为类型 4 词汇类别： 5;第 9 次识别为类型 4 词汇类别： 5;第 10 次识别为类型 8 词汇类别： 6;第 1 次识别为类型 9 82 词汇类别

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人人文库网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：基于连续隐马尔科夫模型的语音识别
链接地址：https://www.renrendoc.com/p-619507.html

官方联系方式

网站客服

网站客服

侵权投诉

1:下载资料失败解决办法

2:不支持迅雷下载,请使用浏览器下载

3:不支持QQ浏览器下载,请用其他浏览器

4:下载后的文档和图纸-无水印

5:文档经过压缩，下载后原文更清晰

点击下载此资源

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ：2881952447

copyright@ 2020-2025 renrendoc.com 人人文库版权所有联系电话：400-852-1180

备案号:蜀ICP备2022000484号-2 经营许可证: 川B2-20220663 川公网安备: 51019002004831号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知人人文库网，我们立即给予删除！