




已阅读5页,还剩69页未读, 继续免费阅读
(交通信息工程及控制专业论文)基于DSP平台的语音识别算法的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京航空航天大学硕士学位论文 i 摘 要 摘 要 自动语音识别系统(简称 asrs)的实用化研究是近十年语音识别研究的 一个主要方向,目前在嵌入式系统中的应用主要为语音命令控制,它使得原 本需要手工操作的工作用语音就可以方便地完成。使用语音作为人机交互的 途径对于使用者来说是最自然的一种方式,同时设备的小型化也要求省略键 盘以节省体积。 本文论述了一种 asrs 由计算机辅助的设计方案, 并给出了具 体的实现方法。 本文采用的识别方法类属于小词汇量孤立词语音识别,主要应用根据文 献设计的算法进行语音信号的采集、特征抽取、概率计算、建立数学模型并 处理,最终获得识别结果。 本文实现的 asrs 在功能上主要由硬件设备和相应的算法软件组成。 硬件 设备构成该系统的硬件平台,通过麦克风实现语音信号的采集,然后由高性 能 a/d 转换芯片接收,并将采集的信号传送至数字信号处理器的存储器,按 照复杂可编程逻辑器件输出的时序进行处理,得到最终的识别结果输出。软 件部分主要由语音信号的采集算法、预处理算法、前向后向算法、训练算法 及维特比算法组成,先将编写的算法在数学运算软件 matlab 环境下仿真成 功, 然后将代码移植到基于 ti 公司的 dsp 开发软件 ccs 平台, 实现了硬件仿 真。 为了满足语音识别在实际应用环境中的抗噪声需要,本文还探讨了基于 盲信号分离思想的语噪分离算法,并在 matlab 平台下仿真成功。 关键词:关键词:语音识别;数字信号处理器;美尔频标倒谱系数;连续隐马尔可夫 模型;盲信号分离 基于 dsp 平台的语音识别算法的研究与实现 ii abstract abstract auto speech recgnition system (asrs)s utility research has been a leading direction in the research of speech recognition for 10 years.nowadays,most of its appliances on embedded-systems are speech controling,which makes the complex manual operation easy and convenient.its one of the most natual mode of communication between human and computer.meanwhile,the miniaturization of equipment also requests omitting the keyboard to save volume.in this paper,a kind of asrs design project is dissertated and put forward. the method applied in this paper belongs to the small glossarys isolated words speech recognition,mainly bases on the algorithm proved by the reference literature,which accomplished the assignment of sampling,extracting,computing,modeling and marking,finally,the result is obtained. the function of this asrs primarily formed by the software and the hardware.the hardware structured the hardware platform,first,it samples the speech signal through a microphone,then receives the sampled data by a high performance a/d,and transmits the data to the ram of the dsp.these sampled data,will be processed by the programed algorithm here to output the final result.on the other hand,the software includes programes to implement the algorithm of sampling,pre-processing,forward and backward,training,viterbi and so on.firstly,these algorithms are simulated in the matlab,then transplanted to the dsps ccs platform,to emulated the code on the dsk board. to meet the requirement of the anti-noise property, this paper also discusses a kind of algorithm based on the bss,and triumphantly simutates the founctions in matlab. keywords:asr;dsp;mfcc;chmm;bss 南京航空航天大学硕士学位论文 v 图表清单 图 2. 1 语音信号预处理.7 图 2. 2 预加重幅频特性.8 图 2. 3 利用短时平均能量进行端点检测效果图.10 图 2. 4 原始一帧语音信号的时域及频域图形.13 图 2. 5 通过训练得到的预测误差滤波器的频域模型.13 图 2. 6 随机白噪声预测的原语音信号的时域及频域波形.14 图 2. 7 利用人耳仿生学特性设计的 mel 尺度滤波器组.16 图 3. 1 缸球模型n 状态离散 hmm.18 图 3. 2 几种典型的 markov 链.27 图 3. 3 cdhmm 的训练及识别过程.28 图 3. 4 语音的特征参数截选.31 图 3. 5 高斯混合法聚类结果.31 图 4. 1 tms320vc5416 的存储器结构.35 图 4. 2 系统外扩存储器电路接线.37 图 4. 3 mcbsp 内部结构框图.38 图 4. 4 关于寄存器 mcbspxsel 对 mcbsp 的控制.39 图 4. 5 vc5416 和 tlv320aic23 的引脚连接示意图.39 图 4. 6 cpld 原理图程序 .40 图 4. 7 cpld 时序仿真 .41 图 4. 8 系统总体硬件组成框图.42 图 4. 9 孤立词语音识别系统数据流程图.42 图 4. 10 系统运行流程框图.43 图 4. 11 ccs 功能图.44 图 4. 12 tms320c54x 软件开发流程.45 图 4. 13 dsp 的 c 语言编制程序示意图.45 图 4. 14 lpc 系数.47 图 4. 15 识别正常.47 图 4. 16 拒识别处理.48 图 5. 1 瞬时线性混叠的盲分离.49 图 5. 2 单声道含噪混合语音.52 图 5. 3 分离出的语音背景噪声.53 图 5. 4 主要讲话者语音信号.53 表 2. 1 汉明窗与矩形窗的比较.9 基于 dsp 平台的语音识别算法的研究与实现 vi 表 3. 1 迭代收敛过程.32 表 4. 1 is61lv12816 引脚描述.36 表 4. 2 am29lv800b 引脚描述.36 承诺书 本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立 进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容 外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本 论文所涉及的研究工作做出贡献的其他个人和集体, 均已在文中以明 确方式标明。 本人授权南京航空航天大学可以有权保留送交论文的复印件, 允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或其他复制手段保存论文。 (保密的学位论文在解密后适用本承诺书) 作者签名: 日 期: 南京航空航天大学硕士学位论文 1 第一章 绪 论 第一章 绪 论 1.1 课题研究的背景和意义 1.1.1 国外研究历史及现状 语音是人类相互间进行通信的最自然和最方便的形式,语音通信是一种理想的 人机通信方式。语音通信的研究涉及到人工智能、模式识别、数字信号处理、微机技 术、语言声学、语音编码 23和认知科学等许多学科领域,是一个多学科的综合性研究 领域,其研究成果具有重要的学术价值和应用价值。 语音识别 asr(automatic speech recognition) 研究工作可以追溯到 20 世纪 50 年代 at ij 是概率密度的均值向量; ij 是概率密度的协方差矩阵。则连续型hmm的参数重估公式如下: 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijt t ijt ijijt jt i ta bxj t a i ta bxj t = = = 1 1 ( ,1)() ( , ) ( ,1) ( , ) t ijijt t t t i ta bxj t i tj t = = = (3-6) 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijtt t ijt ijijt t i ta bxj t x i ta bxj t = = (3-7) 南京航空航天大学硕士学位论文 21 1 1 ( ,1)() ( , )()() ( ,1)() ( , ) t t ijijttijtij t t ij ijijt t i ta bxj txx i ta bxj t = = = (3-8) 对于对角协方差矩阵的 cdhmm 的训练,则先假定对角协方差矩阵的 gaussian 分 布(diagonal gaussian distribution)如下式所示: 1 2 2 22 11 ()()exp() 22 ijkijk kk ijkijk bxx = (3-9) 其中,k 表示第 k 维元素。则对角协方差矩阵连续型 hmm 的参数重估公式如下: 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijt t t ijijt jt i ta bxj t a i ta bxj t = = = 1 1 ( ,1)() ( , ) ( ,1) ( , ) t ijijt t t t i ta bxj t i tj t = = = (3-10) 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijtt t ijt ijijt t i ta bxj t x i ta bxj t = = = (3-11) 2 2 1 1 ( ,1)() ( , )() ( ,1)() ( , ) t ijijtikijk t ijkt ijijt t i ta bxj tx i ta bxj t = = = (3-12) 连续型hmm训练的具体步骤和离散hmm相同。 初始输出概率密度, ij n 的选择,可以采用把所有训练数据按状态数分段,然后求取某段(对应于某状态)数 据集的均值向量和协方差作为该状态初始值的方法解决。 对于连续混合密度hmm参数估计问题,设在连续混合密度的hmm中,采用下 列形式的概率密度函数: 11 ()(), mm ijijm ijmijmijm ijm mm bxbxn x = = (3-13) 基于 dsp 平台的语音识别算法的研究与实现 22 其中,x是输入向量, 即观察值向量; ijm 是第m个混合密度的混合系数; ijm 是 第m个混合密度的均值向量; ijm 是第m个混合密度的协方差矩阵。() ij bx概率密 度特性如下: 1 1,0,1 m ijmijm m mm = = 。由于 ijm 满足上面的条件,则有:( )1 ij bx dx = 根 据 上 面 的 假 定 , 并 设为 连 续 混 合 密 度 hmm 的 参 数 集 合 , 即 () iijijmijm abx=,则连续混合密度 hmm 的参数重估公式如下: 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijt t t ijijt jt i ta bxj t a i ta bxj t = = = 1 1 ( ,1)() ( , ) ( , ) ( , ) t ijijt t t t i ta bxj t i tj t = = = (3-14) 11 1 11 1 (,| ) (,| ) t t tttm t ijmt t tt t p xsi sj x p xsi sj = = = = = 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijm ijmt t t ijijt t i tabxj t i ta bxj t = = = 1 11 ( , ,) ( , ,) t t t tm r tm i j m i j m = = = (3-15) 11 1 11 1 (,| ) (,| ) t t tttmt t ijmt t tttm t p xsi sj xx p xsi sj x = = = = = 南京航空航天大学硕士学位论文 23 1 1 ( ,1)() ( , ) ( ,1)() ( , ) t ijijm ijmtt t t ijijm ijmt t i tabxj t x i tabxj t = 1 1 ( , ,) ( , ,) t tt t t r t i j m x i j m = = = (3-16) 11 1 11 1 (,| )()() (,| ) t tt tttmtijmtijm t t ijm t tttm t p xsi sj xxx p xsi sj x = = = = = 1 1 ( ,1)() ( , )()() ( ,1)() ( , ) t t ijijm ijmttijmtijm t t ijijm ijmt t i tabxj txx i tabxj t = = = 1 1 ( , ,)()() ( , ,) t t ttijmtijm t t r t i j m xx i j m = = = (3-17) 这里, 112 , t t xxxx=?表示训练矢量序列; 1t s 表示在 t-1 时刻的状态; tm x是 表示从 i 到 j 状态转移时, t x是由第 m 个混合密度输出的。公式中( , ,) r i j m表示在 t 时刻,系统在从 i 到 j 状态转移时,第 m 个混合密度函数产生向量 t x的概率,其计 算公式如下: 11 , ( )( ) ( , ,) ( )( ), ijmijm ijm tt r nm ttijmijm ijm jm n x jj i j m jjn x = = (3-18) 另外,对于公式(3-13),计算也可以采用类似于 viterbi 的算法来简化计算,其 计算公式如下: ()max() ijijm ijm m bxbx= (3-19) 连续混合密度 hmm 为多个正态分布线性相加的 hmm 系统,当 m 值较大(如 m 为 4 或 5)时,系统的识别率较高,但是运算量较大。另一方面,每个模型中每个状态的 基于 dsp 平台的语音识别算法的研究与实现 24 概率密度由 m 个正态分布函数叠加而成,它比前者有更多的自由度,因而逼近实际分 布的效果好一些,这样识别效果也会更佳,随着词汇量的增加,这一优点更加突出, 因而,对一些大词汇量的与说话人无关的语音识别系统,连续混合密度 hmm 更受到重 视。 3.3 算法中要考虑的问题 3.3.1问题的提出 1)给定观察序列 t oooo. 21 =和模型),(ba=,计算)|(op。这是评估问题,也 就是给定模型和输出观察序列,如何计算从模型生成观察序列的概率。可以用来 在一系列候选对象中选取最佳的匹配。这就是前向后向算法。 2)给定观察序列 t oooo. 21 =和模型),(ba=, 求在某种有意义的情况下最优的相 关状态序列 t qqqq. 21 =。这个问题可以理解为对输出观察的最佳“解释” ,它试 图揭示模型的隐藏部分,比如说查找“正确”的状态序列。必须弄清楚的就是几 乎所有的退化模型都没有所谓“正确”的状态序列。所以在应用中,通常都使用 一个优化策略来最大可能的解决这个问题。关于这个问题的应用有研究模型的结 构,查找连续语音识别中最优的状态序列,或者计算单独状态的平均统计数据等 等。常用的是维特比(viterbi)计分算法。 3)如何调整模型参数),(ba=,使得)|(op最大?这是模型的训练问题,它试图 优化模型的参数来最佳的描述一个给定的观察序列是如何得来的。 3.3.2重估公式的修正 为了建立尽量精确的模型来描述某个语者的信息,在实际应用中我们需要采集多 个真实样本,从中获得多个观察值序列,用这多个观察值序列训练hmm。因为模型 状态的瞬时性质决定了对于任意状态只能出现很少数目的观察 (直到转移到一个后继 状态) ,为了得到足够多的数据来进行可靠的评估,必须使用多观察序列。 当用l个观察值序列训练hmm时, 要对baum-welch算法的重估公式(3-14)加以 修正。设l个观察值序列为llo l , 1, )( ?=,其中 l t ll l ooo, )( 1 )( ?=,假定各个观察值 序列独立,此时 = = l l l opop 1 )( )/()/( (3-20) 由于重估公式是以不同事件的频率为基础的,因此l个训练序列重估公式相应修正 为: 南京航空航天大学硕士学位论文 25 = = l l lll i niopii 1 )()( 1 )( 1 1),/(/ )()( (3-21) nji opii opjobai a l l t t ll t l t l l t t ll t l tjij l t ij l l = = = = = + ,1 , )/(/ )()( )/(/ )()()( 1 1 1 )()()( 1 1 1 )()( 11 )( (3-22) mknj opjj opjj b l l t t ll t l t l l t vo t ll t l t ik l l kt = = = = = = 1 ,1 , )/(/ )()( )/(/ )()( 1 1 1 )()()( 1 1 1 )()()( (3-23) 3.3.3 计算中的下溢问题 在前后向算法和baum-welch算法中, 都有前向变量)(i t 和后向变量)(i t 的递推 计算, 因为所有的量都小于1, 所以)(i t 和)(i t 分别随着t的增加和减少迅速趋向于 0,产生下溢(underflow)问题。解决这种问题的方法是增加缩放(scaling)因子,对前 后向算法加以修正。 (1)前向算法的修正 4 a)初始化: 11 ( )(),1 ii ib oin= (3-24) 11 1 1 1 1 ( )( ) ( ),1 ( ) n i ii iin i = = (3-25) b)递归: 11 1 ( )( )(),1,11 n ttijjt i ji a b ojntt + = = ? (3-26) 11 1 1 1 1 ( )( ) ( )1,11 ( ) tt t n t t j jj jjntt j + + + + = = ? ? (3-27) c)终结: 12 1 (|)( ) n tt j p oj = = ? (3-28) (2)后向算法的修正4 a)初始化: 基于 dsp 平台的语音识别算法的研究与实现 26 1 ( ),1 t t iin = (3-29) b)递归: 11 1 ( )()( ),1,1,1 n tjiitt i ja b oijn tt + = = ? ? (3-30) 1 ( ) ( ),1,1,1 t t t i iin tt + = = ? ? (3-31) c)终结: 1112 1 (|)()( ) n jjt j p ob oj = = ? (3-32) 3)viterbi算法的修正4 为了避免计算的概率值(| )p o太小而产生零值的情况,一般在原来的传统 viterbi算法中加入对数处理 13: 定义 121 1212 , ( )max lg( ,|) t tttit s ss ip s ss ss o oo = ? ? (3-33) 初始化: 11 ( )lglg(),1 ii ib oin=+ (3-34) 循环计算: 1 1 ( )max( )lg)lg() ttijjt i n iiab o =+ (3-35) 结束: 1 lgmax( ) t j n pj = (3-36) 3.3.4 markov链类型的选择 几种典型的markov链形状如图3.2所示。图3.2(a)所示markov链从任意状态出 发,在下一时刻可以到达其它任何状态,对应的a矩阵没有零值。图3.2(b)则不同, a矩阵含有零元素。3.2(c)和3.2(d)是两种特殊形式的markov链,其特点为:必定从 状态1出发,沿状态序号增加的方向转移,最终停在状态4。这种markov链构成的 hmm一般称为左右模型(left-to-right models) 5。很明显,自左到右的模型很适 合描述随着时间变化的语音信号。 这样在建立实际hmm系统时就应该选择左右型 hmm。在实际的语音处理应用中左右模型也被广泛采用,尤其是在孤立词识别中 取得了较好的效果。 关于模型状态数的选择、观察符号选择(离散的还是连续的,单个的还是多个混 合的,观察参数的选取)这些工作,并没有一个简单的、理论上的正确的方法。实际 南京航空航天大学硕士学位论文 27 应用中只能根据具体问题做出决定。 图 3. 2 几种典型的 markov 链 (a) a 矩阵没有零值的(全连接)markov 链 (b) a 矩阵有零值的 markov 链 (c) 左右形式的 markov 链 (d) 左右形式的 markov 链 3.4 本文使用的基于连续隐马尔可夫链的语音识别算法 3.4.1训练 语音信号预处理之后进行特征参数提取, 然后把特征参数用于语音识别的训练和 识别两个阶段。本文研究噪声环境下孤立词识别方法,采用了 cdhmm,运算开销较小, 可获得较高的识别率。cdhmm 的训练及识别过程如图 3.3 所示,与 dhmm 相比,cdhmm 不必将训练样本矢量量化,而是直接把特征矢量作为训练数据来对模型参数进行优 化,同时它假定一段语音的特征矢量按某种概率分布,本文采用零跨越的左-右 hmm, 状态数为 3,每个状态由 3 个连续混合高斯分布组成。 基于 dsp 平台的语音识别算法的研究与实现 28 图 3. 3 cdhmm 的训练及识别过程 1.模型参数初始化 cdhmm 训练过程的实现以及性能的好坏主要取决于模型的表示、参数初始化以及 参数优化等环节。根据 baum-welch 算法由训练数据可得到 hmm 参数 ),(ba=。其训练思想为通过对模型参数的不断优化这样一个递归过程,从而最终 接近全局最优。该算法中一个关键问题是初始模型的选取,即需要设定各组参数的初 值。不同的初始模型将产生不同的训练结果,关系到算法能否收敛至全局最优,即关 系到hmm参数是否接近全局最优;此外,初值选择关系算法的效率,好的初值选择 还可以保证达到收敛所需的迭代次数较少。因此,初值选择是个很重要的问题,也是 一个较难解决的问题。目前该问题尚没有完美的答案,实际处理往往都是根据经验。 在、a、b这三个hmm的参数中,前两个参数初值的选取对算法的收敛影响 不大,通常设为满足相应约束条件的均匀分布值或非零随机值。为了计算方便,本文 设定为: 1 0 0 = , 0.50.50 00.50.5 001 a = 参数b的初值设定至关重要,也很困难。对dhmm系统,可采取均匀或随机设置每 一组标号的出现概率来设定初值;对cdhmm,如果语音单位较小,如音素,可手工 对输入语音进行状态分割,以统计出相应概率分布作为初值。本文的语音单位是词, 故采用了“分段k平均法” 。本文采用的是多样本训练,在提取30个语音样本的特 南京航空航天大学硕士学位论文 29 征参数之后把每个语音样本的特征矢量的帧数平均分为3个状态, 对属于同一状态的 特征矢量进行k均值聚类,得到连续混合高斯分布。过程如下: (1)把相同状态的特征矢量组合到一起。 (2)聚类。特征矢量的距离量度用欧式距离,即: 0 2 1 1 ( )( ) ,11 d ttt i dc icitt = = (3-37) 其中( ) t c i表示第t帧特征矢量对应的第i阶系数, 0 d为特征矢量的阶数, t d为第t 帧特征矢量与其前一帧特征矢量之间的距离。分段k平均算法聚类的具体过程如下: (a)初始化聚类中心。 (b)重聚类。依据上述初始化的聚类中心 i z对同一状态中所有特征矢量重新聚类, 聚类根据最小距离原则进行,即对于某一特征矢量 c,若有( ,)( ,) ij d c zd c z,ji, 则特征矢量 c 属于第i类。 (c)求聚类中心。 根据步骤二的聚类结果, 将属于同一聚类的特征矢量搜集在一起, 重新求对应各个的聚类中心 i z,() ii zcent c=,1ki 。k为状态中高斯分布的个数。 (d)判断结束与否。当前后两次聚类中心不再改变时,即可结束,否则退回到步骤 (b)。 (3)根据聚类后的结果计算每个聚类的均值与方差(只保留对角线上的元素)。 (4)计 算 每 个 聚 类 中 的 语 音 帧 数 , 归 一 化 为 各 概 率 密 度 函 数 的 权 重 : jk j jk = 第 个状态第 类所包含的语音段数 第 个状态所包含的语音段数 (3-38) 2模型参数优化 参数优化问题实际上是针对hmm的训练过程,即hmm参数重估问题,利用参 数优化算法使得对于给定的观察序列 12 (.) t oooo=和最终估计的参数( , , )a b=, 可以找到(| )p o的一个极大值。 求取使(| )p o最大的是一个泛函极值问题, 但是 由于给定的训练序列有限,因而不存在一个最佳的方法来估计。本文参数重估采用 传统的baum-welch算法。这个算法利用递归思想,找到使(| )p o的局部最大的参 数。 (1)给定输出序列o, 根据式 (3-24)和式(3-25)对进行初始化和标定。 根据式(3-26) 和式(3-27)对进行递归计算和标定。 (2)给定观察序列o,根据式 (3-29)对进行初始化,根据式(3-30)和式(3-31)进行 递归运算。 (3)根据式(3-21)计算 i 。 (4)根据式(3-22) 重估转移概率矩阵a。 (5)重估混合高斯参数,其中包括各概率密度函数的均值(3-16)、方差(3-17)和权重 (3-15)。 基于 dsp 平台的语音识别算法的研究与实现 30 3模型收敛性判决 模型趋于收敛,顾名思义就是前后两次计算所得的模型参数的差逐渐减小,当 其小于某一特定值时,可认为模型收敛而结束迭代过程,此时的hmm参数便是最 终的模型参数。由于cdhmm中: ( , ,) jkjk jk a= (3-39) hmm参数表示复杂,且每个参数的距离量度表示不同,很难找到一种统一的标准判 断前后两次迭代产生的之间的差异, 因此直接比较前后两次迭代过程中的差值来 判断模型是否收敛比较困难。 由于hmm参数的变化可以直接地反映在产生观察矢量 的输出概率(| )p o中,而(| )p o可根据viterbi算法快速求解,因此可以认为当前 后两次计算所得的(| )p o之差逐渐缩小时,说明模型趋于收敛。当其差值小于给定 值 时,可认为模型收敛至最终状态。本文设: (|)(|)viterbi viterbi(|) currentlast last p op o e p o = 前后两次计分之差 前一次计分 (3-40) 且规定当e 时,即可认为模型收敛,本文 取0.005 12。 3.4.2模型训练的matlab仿真 仿真目的:实现mfcc语音特征参数的计算和按照高斯混合法得到的聚类输出, 得到n帧语音的特征参数的学习过程实验数据。 如图3.4所示,16.75帧输入语音信号训练数据经抽取计算所得的mfcc样点, 用“*”表示其位置,对其按照高斯混合法聚类,最后模型输出概率密度收敛于三条 红线所在位置,如图3.5所示。红线标示的三个值为hmm聚类后的三个观察值。 南京航空航天大学硕士学位论文 31 图 3. 4 语音的特征参数截选 表3.1描述了应用baum算法训练需要的迭代次数,和每次迭代产生的似然概率 的对数值,收敛条件为 =0.005,本次实验收敛次数为17次。 图 3. 5 高斯混合法聚类结果 基于 dsp 平台的语音识别算法的研究与实现 32 表 3. 1 迭代收敛过程 3.4.3识别 语音识别根据提取到的语音特征参数,在一组参考模板中轮流进行匹配,从而判 断其中哪个具有输出该观察矢量的最大可能性。本系统根据式(3-34) 式(3-35)和式 (3-36)采用viterbi计分识别。识别程序串起了整个系统的运行过程,故实验结果演示 放在第四章的系统联调中进行。 cycle number log likelihood 1 -601.465729 2 -542.671631 3 -492.829913 4 -487.164879 5 -486.777298 6 -485.912026 7 -483.575206 8 -476.617572 9 -458.263842 10 -431.649234 11 -415.110586 12 -412.398813 13 -412.322430 14 -412.296771 15 -412.278349 16 -412.264510 17 -412.253775 南京航空航天大学硕士学位论文 33 第四章第四章 系统总体设计系统总体设计 4.1 系统关键硬件模块功能介绍 4.1.1 dsp系统的硬件概述 tms320vc5416(简称vc5416)是ti公司的c54x家族的成员之一,它是基于先 进的改进哈佛结构的16位定点dsp。具有c54x的共同特点,就是高性能低功耗, 它具有高达160mhz的主频,核心电压1.5v,运行于此频率时功耗仅90mw。拥有 一条程序总线和三条数据总线,片内集成有一个具有高度并行性的算术逻辑单元 (alu)专有硬件逻辑、 片内存储器和片内外设等几部分。 vc5416其他主要特征如下: ? 先进的多总线结构:包括一条程序总线和三条16位数据总线、四条地址总线。 ? 40位逻辑运算单元(alu)包括一个40位桶形移位寄存器和两个独立40位累加器。 ? 17bit 17bit并行乘法器和一个40位专用的加法器, 用于非流水线的单周期乘法 /累加(mac)操作。 ? 比较、选择、存储单元(cssu),用于维特比算子的比较选择。 ? 指数编码器e,用来在一个单周期内完成一个40位累加器中数值的指数运算。 ? 两个地址产生器,包括八个辅助寄存器和两个辅助寄存器算术单元。 片内外设包括: ? 软件可编程的等待状态发生器。 ? 软件可编程的锁相环(cpll)。 ? 三个多通道缓冲串口(mcbsp )。 ? 增强型8位主机接口(hpi8 )。 ? 一个16位可编程定时器。 ? 由软件设置进入省电模式。 片内可屏蔽rom中固化有启动装载程序(bootloader)和中断向量表等。 系统上电时,bootloader自动把用户代码从外部存储器搬移到程序空间。 复位以 后,中断向量表可被重新映射到程序空间的任何页(128word)的开始处。为了和慢速 的外设通信,vc5416提供了等待状态发生器,通过软件设置等待周期的个数,不仅 降低了系统硬件设计的复杂性,而且为系统带来了很大的灵活性。 vc5416片内集 成了软件可编程的锁相环时钟电路,它只需要一个参考时钟输入就可以得到31种不 同频率的输出时钟, 最大的乘率因子(在寄存器clkmd中设置)为15, 最小的为0.25。 这样,一方面可利用较低频率的外部时钟源产生较高频率的cpu时钟,另一方面在 不工作时可降低cpu时钟频率到外部频率的四分之一,从而降低了cpu的功耗。 本系统主要由 dsp 的供电电路、时钟电路、复位电路、存储器接口、a/d 接口、 基于 dsp 平台的语音识别算法的研究与实现 34 多通道缓冲串口以及仿真接口组成。 4.1.2 音频采集模块 语音采集模块采用 ti 公司推出的一款高性能立体声音频 codec 芯片 tlv320aic23b,内置耳机输出放大器,支持 mic 和 line in 两种输入方式,且对输入 和输出都具有可编程增益调节。其最主要的优点是和 ti 公司的 dsp 芯片的 mcbsp 接 口完全兼容,和本设计中使用的 dsp 芯片能够实现无缝接口。 aic23 的模数转换(adcs)和数模转换(dacs)部件高度集成在芯片内部,采用了先 进的 sigma-delta 过采样技术,可以在 8k 到 96k 的频率范围内提供 16bit、 20bit、 24bit 和 32bit 的采样,adc 和 dac 的输出信噪比分别可以达到 90db 和 100db。与此 同时,aic23 还具有很低的能耗,回放模式下功率仅为 23mw,省电模式下更是小于 15w。由于具有上述优点,使得 aic23 是一款非常理想的音频模拟 i/o 器件,可以 很好的适用于随声听(如 cd, mp3), 录音机等数字音频领域。由 tlv320aic23 组成的 语音输入与输出模块不仅采样率高最高可达 96khz,且外围电路简单,性价比高。最 方
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年公务员考试面试模拟题集管理学专业及答案解析
- 2025年威高安全意识培训题及答案
- 2025年财务审计实务政府会计准则制度模拟题解
- 2025年汽车维修技师技能考试试题及答案解析
- 2025年汽车安全技术员专业水平鉴定试题及答案解析
- 2025年绿色建筑设计师资格考试试题及答案解析
- 2025年建筑嵌缝工程师资格考试试题及答案解析
- 2025年建筑电气安装施工员职业资格考试试题及答案解析
- 2025年AR工程师笔试模拟题及答案集
- 2025年航空运输调度员职业知识考核试题及答案解析
- (2025年标准)动火安全协议书
- 2026届广州市高三年级阶段训练(8月市调研摸底) 数学试卷(含答案解析)
- 动物防疫检疫试题(附答案)
- 沙石码头经营方案(3篇)
- 2025年粉笔辅警考试题库
- 2025个人房屋租赁合同范本下载
- 水声传感器技术研究与应用
- 能源环保管理办法
- 锂电行业仓储管理办法
- caac理论考试题库及答案
- 《校园安全指导》职业院校安全教育全套教学课件
评论
0/150
提交评论