(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf_第1页
(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf_第2页
(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf_第3页
(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf_第4页
(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(信号与信息处理专业论文)基于fpga的嵌入式语音识别系统研究与设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 语音识别技术是信息技术领域的重要发展方向之一,小词汇量孤立词语音识别是语 音识别领域中一个具有广泛应用背景的分支,在家电遥控、智能玩具、人机交互等领域 有着重要的应用价值。 基_ 丁f p g a 的片上可编程系统s o p c ( s y s t e m0 1 1ap r o g r a m m a b l ec h i p ) 具有设计灵活、 可裁剪、可升级,和软硬件协l 刊实现的特点,随着f p g a 技术的不断发展,其性能也存 不断地提高。m i c o b l a z e 是专l 、j 为s o p c 设计的一种3 2 位可配置软核处理器。将其嵌入 到f p g a 中,可以灵活的配置i o 接口,存储器,控制器等功能模块,使得基于f p g a 的嵌入式系统具有较强的适应性。因此借助于m i c o b l a z e 软核在f p g a 开发平台卜- 完成 嵌入式系统设计,为嵌入式系统的设计与丌发提供了一个全新的探索方向。 本文首先存对语音信号时域处理方法进行研究的基础上,对常用特征参数提取原理 和特点进行研究,其中重点研究了双门限端点检测方法和美尔倒谱系数的原理和特点, 设计和实现了特征系数的提取。然后,在主流模式匹配方法的研究基础上,根据小词汇 量孤立词识别的特点,重点研究了动态时间规整算法,并进行合理的改进。接着,结合 f p g a 片上可编程技术,对基丁f p g a 的嵌入式语音识别系统的设计实现进行了研究和 探索。提出了一个可行的系统架构方案,设计和实现了硬件接口控制模块,并且设计了 以m f c c 为特征参数模板的提取算法、以改进的动态时间规整算法为模式匹配方法的语 音识别算法。 奉文主要包含以下内容: 第一,研究了语音识别技术的现状和发展情况。深入探究了基于f p g a 嵌入式语音 识别系统设计的意义和价值。 第二,介绍了语音信号处理的相关技术。给出了语音预加重、加窗处理、短时能量 计算、短时平均过零率计算、端点检测,以及语音特征值提取的基本原理,j i :详细说明 了这些算法的实现过程。 第三,对主流的语音识别方法进行了研究,重点分析了动态时问规整算法、矢量量 化算法、隐马尔可夫算法以及人工神经网络算法。在对各个算法的优缺点进行比较后, 结合本文设计的语音识别系统特点,选择了动态时间规整算法作为本系统的识别算法。 第四,对语音特征值提取和语音识别算法进行了设计。详细分析了动态时间规整算 l 摘要 法的不足,在此基础上提山了对整体约束和搜索路径的改进方法。改进的动态时间规整 算法有效提高了语音识别系统的识别率和识别速度。 第五,结合m i c o b l a z e 嵌入式软核的特点,以及开发平台的资源,对本文设计的语 音识别系统进行功能分析和总体方案设计。详细阐述了语音识别系统的外部接l j 控制模 块的设计与实现,完成语音识别系统的硬件接口设计。 第六,分析基于f p g a 嵌入式语音识别系统的软件实现过程,对语音数据的传输过 程、端点检测、m f c c 参数提取以及改进的动态时间规整算法等实现进行了详绌分析和 说明,并验证识别系统软件程序的正确性。 最后对本文提出的方案进行总结分析,结合系统在实现时体现的不足,以及算法识 别降能和系统运算的缺点,指出其有待进一步研究方向。 关键词:i - g 音识) j i j ;语音特征提取; 改进的d t w 算法;嵌入式系统;f p g a a b s t r a c t a b s t r a c t s m a l l - v o c a b u l a r yi s o l a t e d w o r dr e c o g n i t i o ni sa p r o m i s i n gb r a n c h i n s p e e c h r e c o g ni t i o nt e c h n o l o g ya ss e e nf r o mi t sm a n yc o n t r i b u t i o n si na p p li c a t i o n ss u c ha sh o m e a p p l i a n c e st e l e c o n t r o l ,i n t e l l i g e n tt o y , a n dh u m a nc o m p u t e ri n t e r a c t i o nt e c h n i q u e s t h es y s t e mo nap r o g r a m m a b l ec h i p ( s o p c ) b a s e do nf p g ah a ss e r v a lc h a r a c t e r i s t i c s , s u c ha s f l e x i b i l i t y i nd e s i g n ,u p g r a d ea b i l i t y , s c a l a b l ea b i l i t ya n ds o f t w a r ea n dh a r d w a r e c o 。d e s i g n e d w i t ht h ed e v e l o p i n go ff p g a ,s o p c sp e r f o r m a n c eh a sg o t v e r yg r e a t i m p r o v e m e n t m i c o b l a z ei sak i n do fc o n f i g u r a b l es o i lc o r ep r o c e s s o rf o rs o p cs p e c i a l l y i n f p g a ,i tc a nc o n f i g u r et h ei 0i n t e r f a c e s ,m e m o r ya n dc o n t r o l l e rf l e x i b i l i t y , a n dm a k et h e e m b e d d e ds y s y t e mb a s e do nf p g ab e s t r o n ga d a p t a b i li t y t h e r e f o r e ,t h a tt h ed e s i g no f e m b e d d e ds y s t e mb a s e do nf p g ai s c o m p l e t e db yu s i n gm i c o b l a z es o f tc o r eh a so f f e r e da k i n do fb r a n d n e wt r a i no fe x p l o r a t i o nt oe m b e d d e ds y s t e md e s i g na n d d e v e l o p m e n t t h i sp a p e r , f i r s t l ys p e e c hi nt h et i m ed o m a i ns i g n a lp r o c e s s i n gm e t h o d so nt h eb a s i so f t h es t u d y , t h ec o m m o nf e a t u r ee x t r a c t i o n c h a r a c t e r i s t i c s ,f o c u s e so nt h ed o u b l et h r e s h o l d s e n d p o i n td e t e c t i o nm e t h o dt h em f c cf e a t u r ee x t r a c t i o n t h e n ,a c c o r d i n gt ot h ec h a r a c t e r i s t i c s o fs m a l lv o c a b u l a r ya n di s o l a t e dw o r d ,i nt h em a i n s t r e a mp a t t e r nm a t c h i n gm e t h o db a s e do n t h es t u d yf o c u s e so nt h ed y n a m i ct i m ew a r p i n ga l g o r i t h m ( d t w ) ,a n di m p r o v e st h ea l g o r i t h m t h e n ,c o m b i n e dw i t ht h et e c h n o l o g yb a s e do nf p g ac h i pp r o g r a m m a b l es y s t e m ,i td o e st h e r e s e a r c ho nt h ee m b e d d e ds p e e c hr e c o g n i t i o nb a s e do nf p g a t h ep a p e rp r o p o s e sam o r e f e a s i b l es y s t e ma r c h i t e c t u r ep r o g r a m ,a n dd e s i g n st h ee x t e r n a li n t e r f a c e sc o n t r o l l e r f i n a l l y , t h ep a p e rd e s i g n sas e to fa l g o r i t h mw hi c hu s e dm f c cp a r a m e t e r sf o rc o d e b o o kd e s i g n ,t h e d t wa l g o r i t h mf o rp a t t e r nm a t c h i n g t h ec o n t e n to f t h i sp a p e rm a i n l yi n c l u d e sf o l l o w i n gs e v e r a la s p e c t s : f i r s t l y , t h es t a t u sa n dd e v e l o p m e n to fs p e e c hr e c o g n i t i o nt e c h n o l o g yi ss t u d i e di nt h i s p a p e r a n dt h ed e s i g ns i g n i f i c a n c ea n dv a l u eo ft h ee m b e d d e ds p e e c hr e c o g n i t i o ns y s t e m b a s e do nf p g ai sp r o p o s e d 一 s e c o n d l y , i ti n t r o d u c e st h et e c h n o l o g yo fv o i c es i g n a lp r o c e s s i n g t h e ni tp r o p o s e st h e b a s i cp r i n c i p l e st h a ti n c l u d et h ev o i c es i g n a l p r e - e m p h a s i s ,f i l t e r i n gt r e a t m e n t ,s h o r t t e r m l l i a b s t r a c t e n e r g yc a l c u l a t i o n ,t h ea v e r a g es h o r t - t e r mz e r oc r o s s i n gr a t ec a l c u l a t i o n ,e n d p o i n td e t e c t i o n , a n ds p e e c hf e a t u r ee x t r a c t i o n a n di ta l s oe x p l a i n st h ei m p l e m e n t a t i o np r o c e s so ft h e s e a l g o r i t h m s t h i r d l y , s o m em e t h o d so fs p e e c hr e c o g n i t i o ni ss t u d i e d f o c u s i n go na n a l y s i so fd t w v e c t o rq u a n t i z a t i o na l g o r i t h m ,h i d d e nm a r k o va l g o r i t h ma n da r t i f i c i a l n e u r a ln e t w o r k a l g o r i t h m i nc o m p a r i n gt h ea d v a n t a g e sa n dd i s a d v a n t a g e s o f t h o s ea l g o r i t h m s ,a n di n t e g r a t i n g w i t ht h ec h a r a c t e r i s t i c so fs p e e c hr e c o g n i t i o ns y s t e mw h i c hi sd e s i g n e di nt h i sp a p er d y n a m i c t i m ew a r p i n ga l g o r i t h mi ss e l e c t e da st h es y s t e mi d e n t i f i c a t i o na l g o r i t h m f o u r t h l y , t h es p e e c hf e a t u r ee x t r a c t i o na n ds p e e c hr e c o g n i t i o na l g o r i t h m i sd e s i g n e d s i m u l t a n e o u s l yi ta n a l y z e st h es h o r t a g e so fd t wa l g o r i t h mi n d e t a i l t h e ni tp r o p o s e st h e i m p r o v e m e n tm e a n sw h i c hc o n t a i nt h eo v e r a l lc o n s t r a i n t si m p r o v e m e n ta n dt h es e a r c hp a t h i m p r o v e m e n t a n di ts h o w s t h a tt h ei m p r o v e dd y n a m i ct i m ew a r p i n ge f f e c t i v e l yi m p r o v et h e s y s t e mr e c o g n i t i o nr a t ea n ds p e e d f i f t h l y , a c c o r d i n gt ot h ef e a t u r e so f m i c o b l a z ee m b e d d e dc o r ea n dt h er e s o u r c e so ff p g a p l a t f o r m ,i ta n a l y z e st h ef u n c t i o n so ft h es p e e c hr e c o g n i t i o ns y s t e md e s i g n e di nt h i sp a p e r a n d p r o p o s e st h eo v e r a l ld e s i g n a n di te x p l a i n st h ed e s i g na n di m p l e m e n t a t i o no ft h ee x t e r n a l i n t e r f a c e sc o n t r o l l e ro ft h es p e e c hr e c o g n i t i o ns y s t e m t h e ni tf i n i s h e st h eh a r d w a r ed e s i g no f t h es p e e c hr e c o g n i t i o ns y s t e m s i x t h l y , t h es o f t w a r ei m p l e m e n t a t i o np r o c e s so f t h ee m b e d d e ds p e e c hr e c o g n i t i o ns y s t e m b a s e do nf p g ai sa n a l y z e d t h e ni tp r o p o s e st h ed e t a i l e da n a l y s i sa n dd e s c r i p t i o no ft h e s e f a c t o r st h a ti n c l u d et h ep r o c e s s i n go fs p e e c hd a t a ,e n d p o i n td e t e c t i o n ,m f c cp a r a m e t e r e x t r a c t i o n ,a n di m p r o v e dd t wa l g o r i t h ma n a l y z e di nd e t a i la n dr e a l i s t i cd e s c r i p t i o n a n dt h e c o r r e c t n e s so fs o f t w a r ep r o g r a mi sv e r i f i e d u l t i m a t e l y , t h i sp a p e ri ss u m m e r e da n dt h ep r o p o s e ds o l u t i o n si sa n a l y z e d c o m b i n e d w i t ht h es h o r t a g e so ft h es y s t e mi nt h er e a l i z a t i o n ,a n dt h es h o r t c o m i n g so f t h er e c o g n i t i o n a l g o r i t h m sp r o p e r t ya n dt h es y s t e mo p e r a t i o n a lc a p a c i t y t h eo t h e rd i r e c t i o n s f o rf u r t h e r r e s e a r c hi sp o i n t e do u t k e y w o r d s :s p e e c hr e c o g n i t i o n ;s p e e c hf e a t u r ee x t r a c t i o n ;t h ei m p r o v e dd t w ; e m b e d d e ds y s t e m ;f p g a 目录 目录 摘要i a b s t r a c t i i i 目 录i 第1 章绪论1 1 1 语音识别技术的发展现状1 1 2 语音识别系统的分类2 1 3 小训汇量孤立词识别技术的特点和应用2 1 4 基于f p g a 片上可编程系统的特点和研究意义3 i 5 课题的研究目的与意义4 1 6 本文研究的主要内容及章节安排5 第2 章语音信号处理的基本原理6 2 1 语音采样6 2 2 预加重7 2 3 加窗处理7 2 4 短时能量8 2 5 短时平均过零率9 2 6 端点检测l l 2 7 语音特征提取1 1 2 7 1 线性预测系数12 2 7 2 美尔倒谱系数13 2 8 本章小结1 4 第3 章主流的语音识别算法1 5 3 1 动态时间规整( d t w ) 算法_ l5 3 2 矢量量化( v q ) 算法18 3 3 隐马尔可夫模型( h m m ) 算法1 9 l 目录 3 4 人工神经网络( a n n ) 算法2 3 3 5 系统识别算法选择2 5 3 6 本章小结2 6 第4 章语音识别系统算法设计与改进。2 7 4 1 系统算法的基本构成2 7 4 2系统算法各模块的设计2 7 4 2 1 语音参数提取的设计2 8 4 2 2d t w 算法的改进与设计3 3 4 3 改进的d t w 语音识别系统分析3 7 4 3 1 改进的d t w 识别系统的识别率分析3 7 4 3 :2 改进的d t w 识别系统的性能分析一4 0 4 4 本章小结4 1 第5 章基于f p g a 语音识别系统的构建和接口设计4 2 5 1 x i l i n x 嵌入式软核m i c o b l a z e 介绍4 2 5 2 语音识别系统的功能分析和设计4 4 5 3 语音识别系统主要接口控制模块的设计4 7 5 - 3 1 语音采集控制模块4 7 5 3 2 l c d 显示控制模块51 5 3 3 键盘输入设备控制模块5 5 5 3 4串u 测试模块5 8 5 4 本章小结5 8 第6 章基于f p g a 的语音识别系统的软件设计5 9 6 1语音数据的处理过程5 9 6 2 语音端点检测6 l 。 6 3m f c c 参数提取- 6 2 6 3 1分帧的实现6 2 6 3 2 离散傅里叶变换的实现6 3 6 3 3 m e l 滤波器的实现:6 4 6 3 4 对数能量值和离散余弦变换的实现6 4 目 录 6 4 改进的d t w 识别算法实现6 5 6 5 改进的d t w 识别系统软什实现的测试6 6 6 6 本章小结6 8 第7 章总结与展望6 9 7 1 总结6 9 7 2展望6 9 参考文献7 1 攻读硕士学位期间成果7 4 致谢7 5 硕士学位论文 第1 章绪论 1 1 语音识别技术的发展现状 语音识别技术是计算机技术重要的发展方向,是2 0 0 0 年至2 0 1 0 年信息技术领域十 大重要技术之一。随着语音识别技术的理论研究的飞速发展,相应的应用已成为一个具 有竞争性的新兴高科技产业。 语音识别的研究上作开始于2 0 川:纪5 0 年代,a t & tb e l l 实验室d a v i s 等人成功研 制了第一个口j 以识别十个英文数字的语音识别系统a u d r y 系统,标志着语音识别研 究工作的开始:6 0 年代,计算机的应用推动了语音识别的发展。动态规划( d p ) 和线性 预测分析( l p c ) 技术就是这段期问重要的成果,为语音识别的发展产生了深远的影响;7 0 年代,随着线性预测技术得到进一步发展,动态时问规整技术( d t w ) 基木成熟,特别是 提山了矢量量化( v q ) 和隐马尔可夫模型( h m m ) 理论。有效的解决了语音的特征提取和1 i 定长匹配的动态时间对准问题。在实践上,实现了基于线性预测倒谱和特定人孤立语音 识别;8 0 年代,语音识别研究进。步走向深入,其显著特征是h m m 模型和人工神经元 网络( a n n ) 在语音识别中的成功应用。h m m 模型的广泛心用应归功于a t & tb e l l 实验 室r b a i n e r 等科学家的努力,把原本艰涩的h m m 纯数学模型工程化,从而为更多研究 者了解和认识,也使得h m m 和a n n 模型成为语音识别的主要方法;9 0 年代,随着多 媒体时代的来临,迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日 本、韩国以及i b m 、a p p l e 、a t & tb e l l 、t i 等著名公司都为语音谚 别系统的实用化开发 研究投以巨资i 1 】【2 】。 我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有 自己的特点与优势。我国已经将大词 l 量语音识别的研究列入“8 6 3 ”计划,由r f l 科院声学 所、自动化所及清华大学等单位研究丌发。如今我国的语音识别技术在细化模型的设计、 参数提取和优化以及系统的适应能力上取得了些关键性的突破,汉语语音谚 别技术进 一步成熟。 随着语音识别理论的不断发展,一些相关算法已经达到实用的要求。语音识别集成 电路以其价格便宜,使用方便,稳定性强,容易嵌入便携式产品等优势赢得了广阔的发 展空间。语音识别集成电路的发展主要经历了以下几个阶段3 h i : ( 1 ) 由多带通滤波器及线性匹配电路构成:由一组带通滤波器组成特征提取电路, 1 第1 章绪论 然后用线性匹配电路进行模式匹配。 ( 2 ) 由单片微控器( m c u ) 组成的语音识别专用i c :南8 位或1 6 位的微控制器,外围 接口电路以及存储器组成。由于m c u 的运算能力有限,+ 一般识别率不会太高。 ( 3 ) 由数字信号处理器( d s p ) 组成的语音识别系统:一般由定点的1 6 位d s p ,外加 数模转换芯片以及存储芯片组成。这类系统运算能力强,精度高,适于组成较高1 生能的 语音识别系统。 ( 4 ) 南人工神经网络构成的语音识别专用芯片:由于语音信号是一个时间区间动态 变化的信号,。般采用多层前向感知算法。但是,由于人工神经网络很难达到和语音信 号的最传匹配,识别性能还不很理想。 ( 5 ) 语音识别系统级芯片:将m c u 或d s p 结合外围接口电路,存储芯片集成在一 个芯片上, 要提供电源就可以实现语音识别、语音合成以及语音回放等功能,其性价 比高,功耗省。 1 2 语音识别系统的分类 语音识别系统的分类有三种依据2 】【5 】:词汇最大小,对说话人说话方式的要求和对 说话人的依赖程度。 ( 1 ) 根据词汇量大小,可以分为小词汇量、l 卜等词 厂量、大词汇量以及无限词汇量 识别系统。 ( 2 ) 根据对说话人说话方式的要求,口j 以分为孤立词( 字) 语音识别系统、连接字词语 音识别系统以及连续语音识别系统。 ( 3 ) 根据对说话人的依赖程度可以分为特定人和非特定人语音识别系统。 1 3 小词汇量孤立词识别技术的特点和应用 语音识别技术的应用分为两个发展方向:一个是人词汇量连续语音识别系统,这些 系统一般是基于p c 机平台;另外一个重要的发展方向是小词汇量孤立词语音识别系统。 无论从开发难度,还是应用前景来讲,小词汇量孤立词识别系统具有难度小、成本低、 识别率高、实用性强等优点。因此小词汇量孤立词识别系统的应用较为广泛。 ( 1 ) 在家电上的应用【3 】 语音控制在家电遥控领域有着广阔的前景。利用小词汇量孤立词识别技术实现家电 硕士学位论文 的语音控制,使得家电的操作更加方便自然,更为人性化。 ( 2 ) 在玩具上的应用 将小词汇量孤立词识别技术应用于玩具一 二,使得玩具具有互动功能,可以根据人的 指令,完成简单的互动,吸引更多的顾客。 ( 3 ) 在家具自动化中的应用 利用小词汇量孤立词识别技术,使得家具自动化系统更为安全和丰富。其功能可以 包括:身份识别,声音控制,语音命令,备忘提示等。通过声音i 口j 以简单地对日常使用 复杂的设备进行控制。 ( 4 ) 在通信领域的应用 基于通信领域的小词汇量孤立词识别技术,使计算机直接为客户提供实时新闻,金 融证券和天气预报等方而的信息查询及服务成为可能。 ( 5 ) 在自动控制领域中的应用 为了克服用户在陌生环境下,对电器、电机等设备控制开关的位置、甚至是对应关 系及特点的不熟悉。为了向用户提供更为便捷和人性的处理方式,将小词汇量孤立词识 别技术运用到白动控制领域中尤为必要。 1 4 基于f p g a 片上可编程系统的特点和研究意义 随着可编程逻辑电路( p r o g r a m m a b l el o g i cd e v i c e ,p l d ) 技术的发展,电路的门数与 密度急剧增加,成本不断降低。百万门级以上f p g a 的出现,使得在一片f p g a 上嵌入 微处理器( m c u ,m p u ,d s p ) ,并有效控制外围接口电路0 o ,1 2 c ,p s 2 等) 工作成为可 能。基于f p g a 的片上可编程系统( s o p c ) 设计就是在f p g a 中移植一个微处理器实现嵌 入式系统的设计【6 】。 基于f p g a 的s o p c 是一种特殊的嵌入式系统:首先,它是片上系统,即由单个芯 片完成整个系统的丰要逻辑功能;其次,它是- 口j 。编程系统,具有灵活的设计方式,可裁 剪性、可扩充、可升级,具备软硬件在系统可编程的功能。它具有如下特点: ( 1 ) 丰富的l p 核资源可供选择,包括通用l p 核和专用i p 核。 ( 2 ) 内置嵌入式软核处理器、存储器、外设接口控制器。 ( 3 ) 支持多种接口标准,和多种总线标准。 ( 4 ) 具有小容量片内高速r a m 资源。 ( 5 ) 大量可编程重构的逻辑资源。 3 第1 章绪论 ( 6 ) 设计灵活,可升级,可裁剪。 近年来,m c u 、d s p 和f p g a 在嵌入式系统中都扮演着非常重要的角色,它们都具 有各自的特点而又不能兼顾。在简单的控制和人机接口方面,以5 l 系列单片机和a r m 微处理器为代表的m c u 冈为具有全面的软件支持而处丁领先地位;在海量数据处理方 面,d s p 优势明显:在高速复杂逻辑处理方面,f p g a 凭借其超大规模的单芯片容量和 硬件电路的高速并行运算能力显示山突出的优势。运用f p g a 嵌入式技术,将嵌入式微 处理器集成在f p g a 内部实现片上n j 编程系统。它将m c u 技术、d s p 处理技术、f p g a 芯片设计与软硬件协同设计技术有机的结合起来,既可以灵活的配置嵌入式系统所需的 接u 控制模块,添加相关i p 软核【7 】,义可以发挥处理器强大的软件功能。冈此基丁f p g a 片上可编程系统将成为嵌入式系统发展的一个重要方向。 1 5 课题的研究目的与意义 嵌入式语音识别系统具有性能稳定,使用方便等特点,有广阔的发展前景。虽然它 己取得一定成就,但在面临实片j 化的时候还存在一定的提高空间:( 1 ) 技术成熟、性能 可靠的语音识别系统还有很大的研究空间和潜力;( 2 ) 在其识别的精度、速度、鲁棒性 与系统的小型化等方面还有很大改进的空问。冈此提高硬件性能,改进识别算法提高识 别速度和识别率成为语音识别系统必然的发展方向。 s o p c 是将微处理器、存储器、i o 接口等系统设计所需要的功能模块集成到一个 f p g a 上,构成的基于f p g a 嵌入式系统。它将f p g a 灵活的硬件设计和微处理器强大 的软件功能有效的结合起来。用户可以根据自己的实际要求,利用i p 核资源构建m 所 需的嵌入式系统,并通过软件编写完成系统的功能,从而实现软硬件的协同设计。s o p c 技术作为一种新技术,在国外已经有r 广泛的应用,但是在国内使用m i c o b l a z e 处理器 的嵌入式设计和开发还处于起步阶段。开发者大多使用已得到市场验证比较稳定的处理 器产品,对于m i c o b l a z e 的嵌入式应用丌发还需要进行大量的研究和探索。 本课题的研究e l 的是在对现有各种语音特征参数与语音彭 别模型进行研究的基础 上,根据小词汇量孤立词的特点选择适合的语音信号处理算法和语音识别算法。重点分 析动态时间规整算法,探索改进的动态时间规整算法在小训犷量孤立词识别中的应用。 以及结合f p g a 片上可编程技术,对基于x i l i n x 公司的m i c o b l a z e 软核的嵌入式语音识 别系统进行构建,f :在嵌入式语音识别系统设计实现方面进行探索和尝试。 4 硕士学位论文 1 6 本文研究的主要内容及章节安排 本文牛要研究对象为语音识别系统,实现甲台为x i l i n x 公司提供的v i r t e l 1 1p r o 开发 板,主要工作为: l 、研究语音预处理,语音特征提取和语音识别的算法。分析各种识别算法的优点与不足 之处。 2 、针对本文语音识别系统的性能要求选择合适的语音处理算法、语音识别算法。并且根 据选取语音识别算法的不足,进行算法的改进,j :通过仿真验证,分析其性能。 3 、根据开发板的特点,综合分析系统的功能与实际需求,对基于f p g a 的语音彭l 别系 统进行合理的构建。设计主要的硬件接u 控制模块以实现用户与系统交互,语音输入, 系统检测等功能。 4 、研究基于f p g a 嵌入式语音识别系统的软件实现方法,完成语音数据端点检测、 m f c c 参数提取以及改进的动态时间规整算法等程序编写。 论文主要分为7 章: 第一章绪论。主要介绍了语音识别技术的发展,以及小词汇量孤立词识别、基于 f p g a 片上可编程系统的特点,最后阐述了本文的研究工作和研究意义。 第章语音信号处理的基本原理。主要对口前常用的语音预处理,语音特征值以及 提取方法进行了介绍和分析,给出了相应的实现过程。 第三章主流的语音谚 别算法。介绍了常用的几种语音勘 别算法,主要分析了各个算 法的优缺点。根据本文设计的语音识别系统特点,选取动态时问规整算法为系统算法的 研究方向。 第四章语音识别系统算法设计与改进。奉章详细介绍了语音识别系统r f l 采用的语音 预处理,特征值提取算法。并根据现有动态时间规整算法的不足,提出了改进的动态时 问规整算法。接着对改进的动态时问规整语音动 别系统进行仿真和性能分析。 第五章基于f p g a 语音识别系统的构建和接口设计。研究了语音识别系统硬件平台 的搭建,主要介绍了系统中一些重要接口控制模块的设计、实现以及相关软件设计过程。 第入章基于f p g a 语音识别系统的软件设计。主要说明语音数据的处理过程,和提 出的算法如何通过软件编程实现,并且对程序进行了相关的测试。 第七章总结与展望。对全文进行总结,根据在语音识别系统设计过程中出现的问题 进行思考和分析,提出有待进一步解决的问题等。 第2 章语音信号处理的基本原理 第2 章语音信号处理的基本原理 语音信号处理是语音处理的一个重要内容,也是语音识别的基础。语音信号是典型 的非半稳信号,对非平稳信号需要采用短时半稳方法来分析。在1 0 m s 3 5 m s 内,人的 发声模型是相对平稳的,在这个短时间内可以采用平稳信号的分析方泫处理。 语音信号处理分为时域处理和频域处理。时域处理称为预处理,是指对语音信号在 时域内进行相关的数据处理。它是特征提取的基础,其主要功能是将语音信号从模拟量 转化为可用于计算的数宁量,并进行一定的数据加工,提取有效数据信息,便于后续操 作。频域处理称为语音特征参数的提取,是指对语音信号在频域内进行语音特征参数的 计算和提取,它是语音识别的一个重要环节。 2 1 语音采样 语音信号是随时间变化而改变的一维信号,它所占据的频率范罔可以达到l o k h z 以上,但是对语音清晰度和可懂度有明显影响的成分,最高频率约为5 7 k h z 。c c i t t ( 国 际电报电话咨询委员会) 提出的数字电话g 7 11 建议,采样率为8 k h z ,i 、i - 壬i 。i 用了3 4 k h z 以内的信号分量,虽然这样的采样频率对语音清晰度是有损害的,但受损害的只有少数 辅音,而语音信号本身冗余度是比较大的,少数辅音清晰度下降并不明显影响语句的可 懂度。在实际成用中,大多数情况选用8 k h z 的取样频率【j 【2 】【8 】。 要用计算机分析人的语音,就是要将从话筒中传来的语音信号转换成计算机能处理 的数字信号,臣u 将模拟语音信号转化为数字信号。这个从模拟量到数字量的转变过程称 为模数( a d ) 转换,在嵌入式系统中只需要正确的配置采集:卷片的参数,如采样率,采样 精度等,就能很容易地将模拟信号转换成数字信号。i 刊时,在s o p c 上设计一个用广模 块将采集到的数字信号存入指定的存储区域中,通过程序控制将其传送至c p u 进行后续 处理。语音信号的数字化处理流程如图2 1 所示: ;醋坠磊赢丽磊p 驾 f、一i一 罔2 1 语音信号的数字化 f i g 2 - 1 v o i c es i g n a ld i g i t a l 6 硕士学位论文 2 2 预加重 由于语音信号y ( ,1 ) 平均功率谱受到声门激励和口鼻辐射的影响,高频段( 8 0 0 h z 以上) 按6 d b 倍频程跌落,因此频率越高相应的成分越小,高频部分的频谱比低频部分难求【9 】。 为此在对信号灭刀) 处理前利用高通滤波器进行预处理( 预加重) 补偿语音信号的高频部分 的衰落。使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比 求频谱,以便于频谱分析或声道参数分析。预加重的公式如式2 1 所示。 歹( 刀) = y ( 珂) 一a 少( 玎- 1 ) 0 9 口1 0( 2 1 ) 其中口为预加重系数,它的值在0 9 和l 之间,常用的典型值为0 9 3 7 5 。其频率特 性如图2 2 所示。 2 3 加窗处理 舶 击苗广1 打葫厂r 1 手志茜广 n 嘲m 棚开蜀r 缸曩糟鞠i 删 一一一一一一- 一一一一一一一一一一一一一一一一一一一一一一1 一 一 一一一一一一一一一一一一一一一一一- = 一一一一一一一一一一 一1 - l ,。二二。2 ,j 一 、, - o 0 20 3 0 40 50 60 7 0 8 0 91 n a m e k mf 糟- l 印b 【耳

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论