(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf_第1页
(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf_第2页
(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf_第3页
(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf_第4页
(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(系统工程专业论文)基于声韵母基元的汉语语音识别系统.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京埋工大学硕士学位论文基于声韵母基元的汉语语音识别系统 摘要 语音识别是人机语音通信的关键技术之一,有着很大的应用前景。大词汇量汉语 语音识别技术是语音识别研究的一个重要方面,具有比较强的研究价值和广泛的实际 应用背景。 本文主要研究了大词汇量汉语语音识别技术,针对汉语语音识别的特点,采用声 韵母基元作为识别基元。并且实现了以语音识别为主要目的的语音分析系统。本文主 要工作包括以下三个部分: ( 1 ) 建立基于声韵母基元的特定人大词汇表孤立词汉语语音识别系统。由子在该 系统建立之前,对基于音节的识别算法已经有了一定的研究,所以这部分需要完成的 主要任务是:声韵母基元的选取、声韵母分割、声母识别算法的研究和实现以及基于 声韵母基元的汉语语音识别算法的研究和实现。 ( 2 ) 建立声母识别系统。这是一个针对特定人的所有汉语音节的声母识别系统。 着重讨论声韵母识别中难度较大的声母基元的识别。对特定人3 7 3 0 个声母类基元的发 音长度进行统计,给出了适当的声母长度预分类算法。声母识别率达n 8 5 0 7 。 ( 3 ) 建立以语音t 别为主要目的的语音分析系统。主要实现以下功能:语音的实 时操作、时域分析、频域分析以及基于声韵母基元的汉语语音识别。 关键字:语音识别、隐马尔可夫模型、声韵母基元 南京理工大学硕士学位论文基于声韵母基元的汉语语音识别系统 a b s t r a c t s p e e c hr e c o g n i t i o ni so n e o f i m p o r t a n tt e c h n o l o g i e sf o rs p e e c hc o m m u n i c a t i o n b e t w e e nm a na n dc o m p u t e r s ,w h i c ha r ei ng o o dp r o s p e c t s l a r g e v o c a b u l a r yc h i n e s e s p e e c hr e c o g n i t i o n ,a sas i g n i f i c a n tb r a n c hi ns p e e c hr e c o g n i t i o ni sw o r t h w h i l et or e s e a r c h b e c a u s eo fi t sp r a c t i c a la p p l i c a t i o n 7 l h i sp a p e rs t u d i e ss o m et e c h n o l o g i e s ,w h i c hm a i n l ye x p l o i ti n i t i a l f i n a lu n i t sa s r e c o g n i t i o nu n i tf o rl a r g e v o c a b u l a r yr e c o g n i t i o n as p e e c ha n a l y s i ss y s t e mi sa l s o p r o g r a m m e d t h et a s k sc a l lb ed i v i d e di n t ot h r e ep r i m es e c t i o n sa sf o l l o w i n g s : ( 1 ) as y s t e mo f l s o l a t c d m a n d a r i ns p e e c h r e c o g n i t i o no f a m o d e r a t er a n g e o f w o r d v o c a b u l a r y ( 5 0 0w o r d s ) b a s e do nt h eu n i to f i n i t i a l f i n a lh a sb e e ne s t a b l i s h e d “i n i t i a l ”m e a n st h ei n i t i a lc o n s o n a n to f t h es y l l a b l e ,w h i l ef i n a lm e a n st h ev o w e lo r d i p h t h o n gp a r tb u ti n c l u d i n gp o s s i b l em e d i a lo rn a s a ie n d i n g t h em a i nt a s k sa r e :c h o o s e p r o p e ri n i t i a la n df i n a lu n i t s ;s p l i ts y l l a b l ei n t oi n i t i a lu n i t sa n df i n a lu n i t s ; s t u d ya n d r e a l i z e da l g o r i t h mo f t h ei n i t i a lr e c o g n i t i o n ;s t u d ya n dr e a l i z e da l g o r i t h mo f t h em a n d a r i ns p e e c hr e c o g n i t i o nb a s e do nt h eu n i ! o f i n i t i a l f i n a l i nw h i c hb o t h i n i t i a lr e c o g n i t i o na n df i n a l r e c o g n i t i o nu s et h el p c ( l i n e a rp r e d i c t i o nc o e f f i c i e n t s ) c e p s t r u ma st h es p e e c hf e a t u r ea n dt h eh m m a ss p e e c hm o d e l ( 2 ) as y s t e mo fi n i t i a lr e c o g n i t i o ni se s t a b l i s h e d i n i t i a lr e c o g n i t i o n e x p e r i m e n t sa r ef o rt h ei n i t i a lp a r to fa l lc h i n e s es y l l a b l e s 、i t l ls p e c i a lp e r s o n e x p e r i m e n t sa r ed o n e t od i s c u s st h em o s td i f f f i c u l tp a r to fs y l l a b l er e c o g n i t i o nb a s e do nt h e u n i to fi n i t i a l f i n a l 一一i n i t i a lr e c o g n i t i o n t h el e n g t ho fi n i t i a lu n i ti sc o u n t e db y u s i n g3 7 3 0t n i t i 。t lu n i t s a c c o r d i n gt ot h er e s u l t so f t h es t a t i s t i c s a na l g o r i t h mo f p r e s e l e c t i o ni sp r e s e n t e d ,w h i c hc a nr e d u c eu pt oh a l fo ft h ec o m p u t a t i o n ,a n dt h ec o r r e c t r e c o g n i t i o ni ni n i t i a lu n i t sc a n b ei na na c c u r a c yo f8 5 0 7 ( 3 ) as y s t e ma i m i n ga ts p e e c hr e c o g n i t i o nh a sb e e nr e a l i z e d ,i nw h i c ht h ef u n c t i o n c o n t a i n s :r e a l t i m eo p e r a t i o n ,t e m p o r a lf e a t u r e sa n a l y s i sa n ds p e c i a lf e a t u r e sa n a l y s i so f w a v ef i l e ,s p e e c hr e c o g n i t i o nb a s e do nt h eu n i to fi n i t i a l f i n a l k e y w o r d s :r e c o g n i t i o n ,h i d d e nm a r k o vm o d e l ,i n i t i a l f i n a l 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谓拊部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:雎园臣 沙r 年f 月桫日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:隘西库 k 脾f 月髟日 南京理工大学硕士学位论文 基于声韵母基元的汉语语音识别系统 1 绪论 1 1 引言 与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事 情。例如:当我们深夜回到家中,为床上熟睡的孩子盖好被角后,我们将大声向p c 发出指令:“计算机,请关闭电灯和车库门。明早7 点钟播放我所喜爱的歌曲以唤 醒我。提前为我煮好咖啡。8 点钟打电话给我的老板提醒他出席今天的会议。”但是, 到目前为止,这种功能尚未完全实现,而这正是语音识别所追求的目标。 语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的一项技术。语音识别的目的就是使计算机在一定情况下能够有效地了解、 识别语音或其他声音,继而对其所包含的信息作出正确的反应。 语音识别的研究涉及到语言学、语音学、心理学、信号处理、人工智能、模式 识别、信息论和计算机等诸多学科领域。 1 2 语音识别发展简史及现状 语音识别的研究起点可以回溯到四十年代末。随着各种声学仪器和技术的出现, 如示波器、频谱分析仪等,为语音信号的分析提供了有力的工具。五十年代,语音 识别技术有所进展,1 9 5 2 年b e l l 实验室的d a v i s 等利用语音第一、第二共振频率 的位置作为语音特征进行匹配,研制成功了能识别十个英语数字的实验系统,识别 率高达9 7 一9 9 ;1 9 5 8 年d u d l e y 等利用1 0 个带通滤波器的输出研究了英文数字 识别系统。但由于语音信号的复杂性,在当时的技术条件下,很难提取有效的特征 参数,语音识别仍处于初级阶段。 六十年代,计算机和数字信号处理技术的发展大大促进了语音识别的研究。1 9 6 0 年d e n e s 和m a t h e w s 首次提出了时间规正的概念:1 9 6 3 年b o g e r t 等提出了倒谱算 法;1 9 6 5 年c o o l y 和t u k e y 提出了快速傅立叶变换( f f t ) ;1 9 6 8 年o p p e n h e i m 把 倒谱应用于语音信号处理,并由此建立了同态处理。这些成果为语音识别技术的进 一步发展提供了可能。与五十年代相比,六十年代语音识别的研究前进了一大步, 但是由于缺少有效的语音模型和算法,语音识别的研究仍处于实验室阶段。 七十年代,语音识别技术取得了突破性进展。1 9 7 1 年s a k o e 和c h i b a 等人提出 用动态规划方法( d y n a m i cp r o g r a m m i n g ,d p ) 来匹配两个音长不等的语音特征模 式,把语音的特征序列在时间轴上进行线形或非线形规正,从而形成动态时间规正 算法( d t w ) 。d t w 算法解决了发音速度不一致的问题,使特定人孤立字识别系统 性能有了明显提高。另一个重要的成果是线形预测编码( l p c ) 在语音识别中的应 绪论硕士论文 用,线形预测编码表征了语音信号的产生模型,而线形预测编码系数则形成了有效 的语音特征参数。d t w 和l p c 大大推动了语音识别的发展和应用。这一阶段在语 音识别的实用化方面也取得了很大成果。七十年代初,美国国防部高级研究计划局 ( a r p a ) 制定了一个为期5 年的大规模的语音识别和发展研究计划,共有5 个单 位参加。研究的最终结果表明,卡内基梅隆大学( c m u ) 完成的h e a r s a y - 1 i 系统 和h a r p y 系统效果最好,其中h a r p y 系统几乎全面达到或超过了预定的指标,能理 解1 0 0 0 多个单词组成的一万多个句子,识别率达到9 6 。这时的语音识别系统已 不再局限在实验室了。 八十年代以来,语音识别的发展迅速,矢量量化( v q ) 、隐马尔可夫模型( d m ) 和人工神经网络等理论相继被应用到语音识别的研究中,语音模型进一步细化,方 法进一步多样化。其中隐马尔可夫模型理论在七十年代就由b a u m 等人建立起来, 随后被应用到语音识别中。h m m 是一种适合于语音信号序列的概率参数模型,它 不仅可以表征各种语音基元,还有一套有效的算法计算参数,因此它逐渐成为语音 识别研究的热点。目前许多研究人员仍继续着对h m m 的精细化工作。这期间,以 h m m 统计方法为基本框架的识别系统层出不穷,虽然仍有不少缺陷,但所取得的 成果是以前任何一个时期都无法比拟的。 进入九十年代后,由于识别要求的提高,小波变换等新的理论和工具也逐渐被应 用到语音识别领域。到现在为止,语音识别的理论基础和研究方法可以概括为以下 两方面。一是将语音看作一种纯粹的短时信号来处理,这一方法的主要研究方向是 建立更全面、包含更多细节的语音模型。另一方面,是结合小波变换、神经网络理 论,对人的听觉感知原理进行分析和模拟。 语音识别技术发展的同时,语音识别产品也逐步实用化。早在八十年代中期, 一些较简单的语音识别系统就已进入商品化阶段;九十年代随着高速d s p 芯片的速 度日益提高和技术的日臻成熟,涌现出许多较实用的语音识别系统,如d r a g o n 公 司的n a t u r es p e a k i n g ;i b m 公司的中文连续语音识别产品v i a v o i c e 。微软也已经把 语音识别技术集成到多个领军产品中,包括o f f i c ex p 和w i n d o w sx p 。 国内语音识别的研究始于五十年代末,1 9 5 8 年中科院声学研究所用电子管电路 实现了十个元音的识别。从那以后,国内许多单位陆续加入到语音识别研究行列。 近十多年来,国内研究单位结合汉语语音特点,在汉语语音识别系统的基础理论、 数学模型及算法、实用系统开发等方面作了大量工作,取得了一系列成果。我国的 语音识别研究在某些领域结合汉语的特点有一些独创。目前我国对大词汇量连续语 音识别系统的研究已经接近国外最高水平酬。 语音识别的发展趋势:随着语音识别研究的深入,对语音识别系统的要求也越 来越高,主要的难点有:词汇表扩大引起的困难,由孤立词语音转为连续语音引起 2 南京理工大学硕士学位论文 基于声韵母基元的汉语语音识别系统 的困难以及由于非特定人引起的困难。随着对语音识别系统产品化市场化的要求, 有噪声的语音识别系统的研究、口语输入的语音识别系统的研究也成为今后语音识 别研究的热点。 1 3 语音识别系统的分类 由于实际需要的不同,语音识别系统的设计和实现也各不相同,因而按不同的 标准可分为不同的类型。 1 孤立语音和连续语音识别系统 待识别音按照述说方式的不同可分为孤立语音和连续语音。孤立语音字、词之 间必须略有停顿。孤立语音识别系统识别率较高,算法也比较简单。连续语音符合 人的自然说话方式,但连续语音识别系统算法复杂,对语音建模要求高,难度也大。 2 大词表、中词汇表和小词表语音识别系统 每个语音识别系统都必须有一个自己的词汇表,系统只能识别表中词条,可以 想象,词汇量越大,系统困惑度越大,识别越困难。而且,词表越大,计算量也越 大,对系统要求也就越高。一般认为,词条数小于1 0 0 时为小词表,1 0 0 至5 0 0 称 为中词汇表,超过5 0 0 时称为大词汇表| :1 【”。 3 特定人和非特定人语音识别系统 这是根据服务对象范围而分的。特定人系统只针对某个特定人,使用前必须先 由本人输入大量发音数据进行训练;非特定人系统则是针对任何人,用户不需训练 便可直接使用。由于语音信号复杂多变,非特定人语音识别难度很大。识别系统要 从大量的不同人的发音样本中学习到非特定人语音的基本特征,其学习和训练过程 相当复杂。 1 4 本文的主要工作 本文工作得到了江苏省自然科学基金项目“多媒体视听信息分类检索技术研究” ( 项目编号:b k 2 0 0 4 1 3 7 ) 的支持,主要研究并实现了基于声韵母基元的汉语语音 识别,并建立了一个以语音识别为主要目的的语音分析系统。所做的主要工作如下: 1 建立基于声韵母基元的大词汇表特定人孤立词汉语语音识别系统。 由于在该系统建立之前,对基于音节的识别算法已经有了一定的研究,所以这部 分需要完成的主要任务是:声韵母基元的选取、声韵母分割、声母识别算法的研究和 实现以及基于声韵母基元的汉语语音识别算法的研究和实现。其中声母识别和韵母识 别中,特征参数选用l p c 倒谱特征参数,h m m 采用自左向右无跳转的形式,状态数 取为3 。实验结果表明:针对于某个特定人,词汇量在5 0 0 左右的情况下,本系统达到 较好的识别效果。 3 1 绪论硕士论文 2 建立声母识别系统。 这是一个针对特定人的所有汉语音节的声母识别系统,也就是说能识别特定人 的所有声母。声母识别实验着重讨论声韵母识别中难度较大的声母基元的识别。选 用声母段和声韵过渡段作为声母类基元,对特定人3 7 3 0 个声母类基元的发音长度 进行统计,给出了这种声母类基元情况下的声母长度预分类算法;给出了特定的训 练语料选择方法,大大减少了训练的运算量。声母识别率达到8 5 0 7 。 3 建立以语音识别为主要目的的语音分析系统。 主要实现了提供语音的实时操作,时域分析、频域分析以及基于声韵母基元的 汉语语音识别。功能包括:( 1 ) 进行数据提取、播放、录制、语音格式设置和显示。 以方便语音的实时处理。( 2 ) 能够对语音进行时域特征分析和频域特征分析。其中时 域特征分析包括:短时能量分析、短时平均幅度分析、短时过零率分析、端点检测 和基音检测;频域特征分析包括一系列基于l p c 的特征分析。特征分析是语音识别 的重要一环,特征分析可以帮助语音识别算法进行进一步的研究。( 3 ) 能够实现声母 训练,韵母训练;声母识别,韵母识别,声调识别和基于声韵母模型的单字识别。 1 5 本文的内容安捧 本文的内容安排如下: 第一章介绍语音识别发展简史及现状,语音识别系统的分类,本文所作的工 作及内容安排等。 第二章介绍并分析语音识别技术基本原理。主要包括语音信号特征提取的相 关理论及算法和h m m 的基本知识。 第三章介绍基元选取的知识和本文基元选取的方法。 第四章介绍声母识别实验。 第五章介绍基于声韵母模型的汉语语音识别实验。 第六章介绍系统软件的设计和实现。 第七章结束语,总结全文。 南京理工大学硕士学位论文基于声韵母基元的汉语语音识别系统 2 语音识别基本技术 2 1 引言 语音识别的基本结构如图2 1 1 所示,其中各部分的功能综合起来可以完成语音 识别的基本功能。学习时“特征提取”部分将数字语音信号按短时段( 帧) 分组, 然后计算出每帧的特征矢量,得到该语音的模板并存储起来,识别前要生成所有要 识别的字的模板;识别时,待识别的语音信号经特征提取后,在“识别判决”部分 中将输入的识别样本序列与各字的模板序列分别比较,按一定准则以差异最小者判 为识别结果。 训练语音( 训练时) 一 待识别语音( 识别时) 2 2 特征提取 图2 1 1 语音识别基本过程 语音识别中,特征提取是一个重点也是一个难点。识别系统的一个最根本的问 题就是合理地选用特征。 实际语音信号都是有关信息和无关信息的混合体,它既包含了所说词语的语义 信息,又包含了说话人本身的个人特征信息,还包含了基于声学环境、话筒、信道 等可变性因素的信息。特征选取时应尽可能摈弃无关信息,并以严密而合理的形式 描述有关信息。语音特征选取的原则应兼顾有效性和实时| 生两方面。 特征提取包括时域特征提取和频域特征提取,下文频域特征部分将详细介绍本 文所使用的特征提取方法一一线性预测分析及其一系列特征分析方法。 2 2 1 时域特征 时域特征是提取特征参数的一种传统方法,也是应用最广的一种方法。因为语 音信号本来就是一种时域信号,采用时域分析法提取语音特征比较直观,实现简单, 2 语音识别基本技术硕士论文 可以得到语音信号的一些重要特征。常用的时域特征参数主要有短时能量、短时平 均幅度、短时平均过零率、端点检测和基音检测。以上这些时域特征参数的理论较 为简单,将在本文6 3 节提及。 2 2 2 频域特征 语音信号的频域分析就是分析语音信号的频域特征。从广义上讲,语音信号的 频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络分析等,而常用的频域 分析方法有带通滤波器组法、傅立叶变换法、线性预测法等几种强l 。本节将详细介 绍本文所使用的特征提取方法一一线性预测分析及其一系歹4 特征分析方法。 线形预测分析,简称l p c 分析,是目前最有效的语音分析技术之一。它的重要 性在于【4 :提供了一组简洁的语音信号模型参数,这一组参数较精确地表征了语音 信号的频谱幅度,而分析它们所需的运算量相对来说却并不大。应用这组模型参数 可以降低编码语音信号时的数码率;将l p c 参数形成模板储存,在语音识别中也能 提高识别率和减少计算时间。 线形预测分析的基本概念是1 3 】:一个语音采样能够用过去若干个语音采样的线 形组合来逼近,通过使实际语音采样和线形预测采样间差值的平方和最小,能够决 定唯一的一组预测系数。 2 2 2 1 语音信号的线形预测分析 1 1 语音信号序列是一个随机序列,它也可以由上述信号模型化来进行分析,其稳 态系统函数为: 刚2 粥。而g ( 2 2 i ) 管 从而,把s f n ) 模型化为一个p 阶自回归过程序列,对于浊音语音,系统由脉冲序列 激励,对于清音语音,则由白噪声序列激励,其中浊清音判决,浊音的音调周期, 增益g 及滤波器参数d ,都是缓慢时变的。根据这一简化模型能够对g 和系数a ,进 行直接和高效的运算。 求解g 和a ,的过程就称为语音信号的线性预测分析。要注意的是由于语音的时 变特性,预测系数估计值必须按帧进行。 全极点模型的线性预测分析的两个主要缺点是:一根据语音信号产生机理,声 道响应应含有零点的影响,不只是简单的全极点模型;二浊音语音不符合模型中自 噪声源的假设。 南京理工大学硕士学位论文基于声韵母基元的汉语语音识别系统 2 2 2 2l p c 解法1 1 经典的解法有两种:一是自相关法,二是协方差法。两种解法相比,协方差法 优于自相关法。这是因为当预测阶数p 与s ( n ) 序列长度n 近似时,协方差算法给出 的参数值更精确,但由于语音信号处理中,大部分情况下都能满足n p 的条件, 所以协方差法误差小的优点不再突出,而自相关的高效递推算法成了突出的优点, 现在语音信号数字处理中大部分情况采用自相关算法。 设f s ( n ) ) 为语音信号时间序列,第n 个语音采样值可用前p 个语音采样值来预 测,即s ( n ) 的预测值 f g ) = 一q s 0 一i ) ( 2 2 2 ) i = 1 其中“。( f = 1 p ) 称为线形预测系数,预测误差为 e 0 ) = s o ) 一;0 ) =s 0 ) + 艺即0扣口,s ( n - - i ) 其中a = 1 为固定常数。 记一帧内误差的平方和为e ,则对于具有n 个采样点的帧而言,就有: e :笠1 + 蜘。一r ) 2= ls o ) + 印0 一f ) f n = oll m l j 令e 最小,即有a f 。o a ,= o ( i = 1 p ) ,于是可以得到一组线形方程 a , r ( i 一,) = 一r ( ,) ( 2 2 3 ) 一l 一 其中月o ) = s o b 0 + ) 称为语音短时自相关系数。n 为一帧语音中的采样点数 n = o p 为预测器阶数。解方程组( 2 2 3 ) 就可得到一组线形预测系数:( j - l p ) 。 求解线形预测系数有很多算法,其中较常用的一种解法是d u r b i n 递推算法,它 是一种“阶”递归算法,具体步骤如下: 给定预测器阶数p : 一】一 计算月( ,) = s o b g + ) ,0 = o ,1 p ) ; n = 0 2 语音识别基本技术硕士论文 计斛= 器; 计算甜1 = k ”; 2 ) = 1 一沁m ) 2j r ( 0 ) 令m = 2 ; m 一1 k ”= _ 肺”) + 口;”1 五( 1 f mi ) e 7 。; 西孑= k ”1 ; 西,= 西,一+ 世”西m ”- i ,i = 1 , 2 ,( m 一1 ) 计算旁1 = i 1 - k ) 2 箩1 ; 如果m r 则令m = m 十l ,转入7 继续运行;否则停止运行并输出斛“, 西r ,西作为计算结果 结束。 在选择l p c 模型阶数p 时,首先要保证有足够多的极点来模型声道响应的谐 振结构,在1 0 k h z 采样频率下,一般要求阶数p 值约为1 2 到1 4 ;其次,虽然p 增 加时的预测误差趋于下降,但p 值选得过大时,其改善逼近效果的作用变得不明显, 而会带来一些负作用,所以模型阶数p 一般取为1 2 到1 4 就可以了。 2 2 2 3l p c 倒谱特征1 l 【1 7 1 实际对语音信号进行处理时,常用到的另一种特征是复倒谱特征。下面给出了 由l p c 系数求复倒谱系数的递推算法。 实际声道的全极点模型传递函数为: 荆= 器= 高 :m 其中j ( z ) = 西;一z “是最佳线形预测滤波器( 也可称为最佳前向逆滤波器) ,且 有彰= 1 ,西f “,西,拉矿是可由d u r b i n 算法求出的线形预测系数。 h ( z ) 的单位取样响应为h ( n ) ,有: 南京理工大学硕士学位论文 基于声韵母摹元的汉语语音识别系统 i a ( h ) = 0 , 玎 0 i,( 2 2 5 ) i 自( ) = 一h ( n f ) + d ( 胛) ,h o if = l ( n ) 复倒谱定义为:五( ) = z - m 1 2 ( z ) ) 】 p 设吃( ”) 是滤波器j ( z ) = 舀r z 1 的单位取样响应ah o ( n ) 的复倒谱为 胆o 砭( ”) ,同样可得瓦( n ) = z 一1 陋 j 一( z ) ) ) ,因此五( 砷= 一茏( 叻。由于j ( z ) 的根 全部在单位圆内,所以可以采用下面的递推算法: 觅( n ) = 0 ,” 从豸i3 练数据上看:由于需要为每个词准备相应的训练语音,词汇量大意味着 需要大量的训练语音量,这使得训练的数据量非常大,训练所花费的时间是惊人的。 汉语的每个字都是单音节字,全部一万多汉字仅对应约1 3 0 0 个左右的有调音 节,4 0 0 个无调音节。汉语每个音节是由声母和韵母构成,其中声母有2 2 个( 包括 1 个零声母) ,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论