(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf_第1页
(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf_第2页
(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf_第3页
(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf_第4页
(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf_第5页
已阅读5页,还剩86页未读 继续免费阅读

(检测技术与自动化装置专业论文)基于wince的嵌入式语音识别系统的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

f i l li ii ll l ll l ll l i ii ii y 17 4 5 5 3 7 ad i s s e r t a t i o ns u b m i t t e dt og u a n g d o n g u n i v e r s i t yo f t e c h n o l o g yf o rt h ed e g r e eo fm a s t e ro fe n g i n e e r i n gs c i e n c e r e s e a r c ho na ne m b e d d e ds p e e c hr e c o g n i t i o n s y s t e m m a s t e rc a n d i d a t e :c h e ny o n g x u a n s u p e r v i s o r :p r o f e s s o rb a oh o n g m a y2 0 1 0 f a c u l t yo f a u t o m a t i o n g u a n g d o n gu n i v e r s i t yo ft e c h n o l o g y g u a n g z h o u , g u a n g d o n g ,r r c h i n a , 5 10 0 9 0 摘要 摘要水 随着语音识别效果的逐步提高,语音输入输出正逐步成为人机交互的一种重要 方式。这种交互方式对语音识别技术和识别系统提出了更高的要求,尤其在系统的 便捷性,实时性和可移植性等方面。因此,在嵌入式系统中实现一个能识别较大词 汇量,具有较好实时性,并且具有足够高的识别率的语音识别系统,具有很高的理 论研究及实用价值。 本文首先分析语音识别技术研究的发展背景及国内外研究现状,并对本研究的 背景项目所要求的各项技术指标进行介绍和分析。在深入研究语音识别过程中各关 键模块,包括语音预处理,特征提取,关键识别算法及决策等的基础上,对各模块 的重点技术进行研究。在语音预处理模块中,重点对预加重、分帧、加窗、端点检 测的各种算法进行分析,通过实验比较各种算法的优劣;在特征提取模块中,通过 分析l p c c 参数和m f c c 参数的实现原理和差异,结合背景项目的要求,阐述选用 l p c c 参数的原因。 在对核心识别算法的研究中,本论文分别对三种经典的语音识别算法动态 时间规整算法( d t w ) 、隐马尔科夫模型( h m m ) 和人工神经网络算法( a n n ) 的算法思 想和识别原理进行分析,并在传统的d t w 算法基础上,对算法进行了简化改进, 从而减少了算法的运算量,实现了程序效率的提高。围绕改进的d t w 算法,提出 一种新的匹配方法二次匹配法,通过改变匹配流程,使用l p c c 参数与改进 d t w 算法的组合,实现了大词汇量的语音识别系统的设计,系统的识别率能够保 持在8 0 以上,达到背景项目的具体要求。 本文在对现有的嵌入式操作系统深入研究的基础上,选用可移植性较好的嵌入 式w i n d o w sc e 操作系统,成功地在以a r m l l 为核心的开发板上定制和移植了 w i n d o w sc e6 0 操作系统,通过跨平台的软件开发,成功在搭建好的嵌入式开发平 台上实现了大词汇的语音识别系统。实验结果表明,通过对系统的改进,在嵌入式 中能够实现一个具有识别率较高,实时性较好的大词汇量语音识别系统。 关键词:语音识别;改进的d t w 算法;二次匹配;w i n d o w sc e6 0 操作系统; 大词汇量 广东工业大学硕士学位论文 a b s t r a c t w i t ht h eg r a d u a li m p r o v e m e n to fs p e e c hr e c o g n i t i o ne f f e c t s ,v o i c ei n p u ta n do u t p u ti s b e c o m i n ga ni m p o r t a n tw a yo fh u m a n - c o m p u t e ri n t e r a c t i o n t h i si n t e r a c t i v ea p p r o a c ht o t h ev o i c er e c o g n i t i o nt e c h n o l o g ya n di d e n t i f i c a t i o ns y s t e m sp u tf o r w a r dh i g h e r r e q u i r e m e n t s ,e s p e c i a l l yi nt h ec o n v e n i e n c eo ft h es y s t e m ,r e a l t i m ea n dp o r t a b i l i t y t h e r e f o r e ,i nt h ee m b e d d e ds y s t e mc a ni d e n t i f yal a r g ev o c a b u l a r y ,g o o dr e a l t i m e ,a n d h a v es u f f i c i e n t l yh i g hr e c o g n i t i o nr a t eo ft h es p e e c hr e c o g n i t i o ns y s t e mw i t hh i g h t h e o r e t i c a lr e s e a r c ha n dp r a c t i c a lv a l u e t h i sp a p e ra n a l y z e st h ed e v e l o p m e n to fs p e e c hr e c o g n i t i o nt e c h n o l o g yb a c k g r o u n d a n dr e s e a r c hs t a t u s ,a n dt h eb a c k g r o u n do ft h i sr e s e a r c hp r o je c tr e q u i r e dt h et e c h n i c a l i n d i c a t o r sa r ed i s c u s s e da n da n a l y z e d s p e e c hr e c o g n i t i o np r o c e s si n - d e p t hs t u d yo fk e y m o d u l e s ,i n c l u d i n gv o i c ep r e p r o c e s s i n g ,f e a t u r ee x t r a c t i o n ,r e c o g n i t i o na l g o r i t h ma n d t h e k e yd e c i s i o n m a k i n gb a s e do nt h ef o c u so fe a c hm o d u l ew e r e u s e d i nt h ev o i c e p r e p r o c e s s i n gm o d u l ef o c u s e so nt h ep r e e m p h a s i s ,f r a m i n g ,w i n d o w , e n d p o i n td e t e c t i o n a l g o r i t h m st oa n a l y z et h ea l g o r i t h mb ye x p e r i m e n t sc o m p a r i n gt h em e r i t s ;t h ef e a t u r e e x t r a c t i o nm o d u l e ,t h ea n a l y s i sp a r a m e t e r sa n dm f c cl p c cp a r a m e t e r si m p l e m e n t a t i o n p r i n c i p l ea n dd i f f e r e n c e s ,c o m b i n e d 谢t ht h eb a c k g r o u n do ft h ep r o j e c t sr e q u i r e m e n t s a n dd e s c r i b e dt h er e a s o n sf o rs e l e c t i o nl p c cp a r a m e t e r r e c o g n i t i o na l g o r i t h mi nt h ec o r es t u d y , t h i st h e s i s ,t h et h r e e c l a s s i c a ls p e e c h r e c o g n i t i o na l g o r i t h m s d y n a m i ct i m ew a r p i n ga l g o r i t h m ( d t w ) ,h i d d e nm a r k o vm o d e l ( h m m ) a n da r t i f i c i a ln e u r a ln e t w o r ka l g o r i t h m ( a n n ) a l g o r i t h mi d e a sa n di d e n t i f y p r i n c i p l e sf o ra n a l y s i sa n dt h et r a d i t i o n a ld t wa l g o r i t h mb a s e do nt h ei m p r o v e m e n to f t h ea l g o r i t h mi ss i m p l i f i e d ,t h e r e b yr e d u c i n gt h ec o m p u t a t i o n a la l g o r i t h mt oa c h i e v et h e p r o g r a me f f i c i e n c y a r o u n dt h ei m p r o v e dd t wa l g o r i t h m ,an e wm a t c h i n gm e t h o d t h e s e c o n dm a t c h i n gm e t h o d ,b yc h a n g i n gt h em a t c h i n gp r o c e s s ,u s i n gt h el p c cp a r a m e t e r s a n dac o m b i n a t i o no fi m p r o v e dd t wa l g o r i t h mt oa c h i e v eal a r g ev o c a b u l a r ys p e e c h r e c o g n i t i o ns y s t e md e s i g n ,s y s t e mi d e n t i f i c a t i o nr a t ec a nb em a i n t a i n e da b o v e8 0 ,t ot h e s p e c i f i cr e q u i r e m e n t so ft h eb a c k g r o u n do f t h ep r o je c t i nt h i s p a p e r , t h ee x i s t i n ge m b e d d e do p e r a t i n gs y s t e mi n d e p t hs t u d yb a s e d o n a b s t r a c t p o r t a b i l i t y b e t t e ru s eo fe m b e d d e dw i n d o w sc e o p e r a t i n gs y s t e m ,s u c c e s s f u l l y d e v e l o p e db ya r m l 1c o r eb o a r dc u s t o m i z a t i o na n dp o r t e dw i n d o w sc e6 0o p e r a t i n g s y s t e mt h r o u g hc r o s s p l a t f o r ms o f t w a r ed e v e l o p m e n t ,s u c c e s s f u l l yb u i l tag o o dp l a t f o r m f o re m b e d d e dd e v e l o p m e n tt oa c h i e v eal a r g ev o c a b u l a r ys p e e c hr e c o g n i t i o n s y s t e m e x p e r i m e n t a lr e s u l t ss h o wt h a ti m p r o v e m e n to ft h es y s t e m ,e m b e d d e di nc a nb ea c h i e v e d i nah i g h e rr e c o g n i t i o nr a t e ,b e t t e rr e a l t i m el a r g ev o c a b u l a r ys p e e c hr e c o g n i t i o ns y s t e m k e y w or d s :s p e e c hr e c o g n i t i o n ;i m p r o v e dd t wa l g o r i t h m ;s e c o n dm a t c h ; w i n d o w sc e6 0o p e r a t i n gs y s t e m ;l a r g ev o c a b u l a r y i i i 广东工业大学硕士学位论文 目录 摘要i a b s t r a c t i i 目录 c o n t e n t v i i 第一章绪论1 1 1 研究背景1 1 1 1 语音识别技术的研究背景1 1 1 2 语音识别技术在嵌入式系统中应用的意义2 1 2 语音识别系统简介2 1 3 国内外语音识别技术的发展历史及其现状4 1 3 1 国内外语音识别技术的发展历程4 1 3 2 语音识别技术发展现状6 1 4 论文的研究背景及项目内容6 1 5 论文主要研究内容及构架7 第二章语音识别原理9 2 1 语音识别的声学原理9 2 1 1 语音信号的产生模型9 2 1 2 语音单元的选取1o 2 2 语音预处理。1 1 2 2 1 预加重1 2 2 2 2 分帧、加窗1 2 2 2 3 端点检测1 4 2 3 语音特征提取17 2 3 1l p c c 系数。1 7 2 3 2m f c c 参数18 2 3 3l p c c 参数和m f c c 参数的比较2 0 2 4 本章小结2 0 i v 目录 第三章语音识别系统的核心算法2 1 3 1 模板匹配2 l 3 2 隐马尔科夫模型( h m m ) 2 1 3 2 1h m m 模型的基本思想2 1 3 2 2h m m 模型的基本原理2 2 3 3 动态时间规整算法( d t w ) 2 3 3 3 1d t w 算法的基本思想2 3 3 3 2d t w 算法的基本原理2 4 3 3 3 改进的d t w 算法2 5 3 4 人工神经网络算法:2 7 3 5 系统核心算法的选用2 9 3 6 语音识别系统的性能评测3 0 3 6 1 识别率3 0 3 6 2 系统复杂度。3 0 3 7 本章小结3 1 第四章基于d t w 的语音识别系统的实现3 2 4 1 背景项目的技术指标3 2 4 2 声音采集模块软件设计3 3 4 3 语音预处理模块设计3 5 4 3 1 预加重,分帧,加窗模块3 5 4 3 2 端点检测模块3 5 4 4 训练模块的软件实现3 7 4 5 二次匹配算法的软件实现4 0 4 6 本章小结4 5 第五章嵌入式语音识别系统的设计与实现4 6 5 1 嵌入式语音识别的系统需求4 6 5 2 嵌入式硬件设计4 7 5 2 1 系统的外围硬件电路4 7 5 2 2 音频输入接口5 0 5 3 嵌入式软件系统5 1 5 3 1 嵌入式操作系统的选用。5 1 v 广东- r & 大学硕士学位论文 i m i 量皇置詈皇詈暑昌暑詈詈詈詈暑暑暑詈毫穹詈暑詈詈暑喜詈詈= 詈詈詈昌篁詈罩皇鲁詈昌皇暑葛詈暑詈暑鲁鲁暑皇詈詈量昔富詈詈詈暑詈= 詈暑鼍 5 3 2w i n d o w sc e 体系结构5 2 5 3 3w i n d o w sc e6 0 系统定制与移植5 4 5 4 嵌入式语音识别系统。5 8 5 4 1 音频驱动的原理5 8 5 4 2 嵌入式语音识别系统的调试与实现5 9 5 5 系统评测6 0 5 5 1 系统识别率一6 0 5 5 2 系统算法复杂度比较6 0 5 6 本章小结6 2 第六章总结与展望6 3 6 1 工作总结6 3 6 2 工作展望6 4 参考文献6 5 攻读硕士学位期间发表论文6 8 独创性声明6 9 致谢7 0 附录。7 l v i c o n t e n t c o n t e n t a b s t r a c t ( c h i n e s e ) “i a b s t r a c t ( e n g i i s h ) i i c o n t e n t ( c h i n e s e ) i v c o n t e n t ( e n g l i s h ) v i i c h a p t e r 1i n t r o d u c t i o n 1 1 1r e s e a r c hb a c k g r o u n d 1 1 1 1s p e e c hr e c o g n i t i o nt e c h n o l o g yr e s e a r c hb a c k g r o u n d 1 1 1 2t h ea p p l i c a t i o no fe m b e d d e ds p e e c hr e c o g n i t i o nt e c h n o l o g y 2 1 2t h ei n t r o d u c t i o no fs p e e c hr e c o g n i t i o ns y s t e m s 2 1 3s p e e c hr e c o g n i t i o ns y s t e md e v e l o pa n dr e s e a r c hs t a t u s 4 1 3 1s p e e c hr e c o g n i t i o ns y s t e m sp r e s e n ts t a t u so fd o m e s t i ca n df o r e i g n 一4 1 3 2d e v e l o p m e n to fs p e e c hr e c o g n i t i o nt e c h n o l o g y 6 1 4b a c k g r o u n dp a p e r sa n dp r o j e c tc o n t e n t 6 1 5t h e s i sf o c u s e do nt h ec o n t e n ta n ds t r u c t u r e 7 c h a p t e r2p r i n c i p l e so fs p e e c hr e c o g n i t i o n 9 2 1a c o u s t i ct h e o r yo fs p e e c hr e c o g n i t i o n 9 2 1 1s p e e c hs i g n a lg e n e r a t i o nm o d e l 9 2 1 2s e l e c t i o no fs p e e c hu n i t s 10 2 2v o i c ep r e t r e a t m e n 1 1 2 2 1p r e e m p h a s i s 1 2 2 2 2s u b f l a m e s 、w i n d o w 1 2 2 2 3e n d p o i n td e t e c t i o n 1 4 2 3s p e e c hf e a t u r ee x t r a c t i o n 1 7 2 3 1l p c cp a r a m e t e r s 17 2 3 2m f c cp a r a m e t e r s 18 2 3 3c o m p a r i s o no fl p c cp a r a m e t e r sa n dm f c cp a r a m e t e r s 2 0 2 4c h a 2 p t e rs u m m a r y 2 0 c h a p t e r 3t h ec o r eo fa l g o r i t h mf o rs p e e c hr e c o g n i t i o ns y s t e m 2 1 v i i 广东工业大学硕士学位论文 3 1t e m p l a t em a t c h i n g “2 1 3 2h i d d e nm a r k o vm o d e l ( h m m ) 2 1 3 2 1t h eb a s i ci d e ao f h m mm o d e l 2 1 3 2 2t h eb a s i cp r i n c i p l e so f h m mm o d e l 2 2 3 3d y n a m i ct i m ew a r p i n ga l g o r i t h m ( d t w ) 2 3 4 6c h a p c h a p t e r 5e m b e d d e ds p e e c hr e c o g n i t i o ns y s t e md e s i g na n di m p l e m e 5 1e m b e d d e ds p e e c hr e c o g n i t i o ns y s t e mr e q u i r e m e n t s 5 2e m b e d d e dh a r d w a r ed e s i g n 5 2 1s y s t e mp e r i p h e r a lh a r d w a r ec i r c u i t 5 2 2a u d i oi n p u ti n t e r f a c e 5 3e m b e d d e ds o f t w a r es y s t e m 5 3 1c h o i c eo f e m b e d d e do p e r a t i n gs y s t e m 5 3 2 晰n d o w sc ea r c h i t e c t u r e v i c o n t e n t 5 3 3w i n d o w sc e6 0s y s t e mc u s t o m i z a t i o na n dm i g r a t i o n 5 4 5 4e m b e d d e ds p e e c hr e c o g n i t i o ns y s t e m - 5 8 5 4 1p r i n c i p l e so f a u d i o d r i v e n :5 8 5 4 2e m b e d d e ds p e e c hr e c o g n i t i o ns y s t e md e b u g g i n ga n di m p l e m e n t a t i o n ”5 9 5 5s y s t e me v a l u a t i o n 6 0 5 5 1s y s t e mi d e n t i f i c a t i o nr a t e 6 0 5 5 2c o m p a r i s o no f t h es y s t e mc o m p l e x i t yo f t h ea l g o r i t h m - 6 0 5 6c h a p t e rs u m m a r y 一6 2 c h a p t e r 6s u m m a r ya n do u t l o o k 6 3 6 1w o r ks u m m a r y :6 3 6 2w o r kp r o s p e c t s 6 4 r e f e r e n c e s 6 5 p u b l i c a t i o nd u r i n gs t u d y i n gf o rm a s t e r ss t u d i e s 6 8 o r i g i n a l i t ys t a t e m e n to f a c a d e m i cd i s s e r t a t i o n 6 9 a c k n o w l e d g e m e n t 7 0 a p p e n d i x 7 1 i x 第一章绪论 第一章绪论 1 1 研究背景 1 1 1 语音识别技术的研究背景 语音是人类之间最有效、最方便的通信方式。语音识别技术( 又称自动语音识别, a u t o m a t i cs p e e c hr e c o g n i t i o n ,a s r ) 是从二十世纪五十年代才开始出现的一门新兴 的计算机智能技术。其研究目的就是一种让机器通过识别和理解过程把语音信号转 变为相应的文本或命令的技术。随着研究的深入,语音识别已经发展成一门广泛交 叉的综合学科,它与声学、语言学、信号处理、模式识别、人工智能、概率论和信 息论等诸多学科领域紧密联系,正逐步成为信息技术中人机接口的关键技术。尤其 是近二十年来,语音识别取得显着进步,开始从实验室走向市场,许多专家认为它 是2 0 0 0 年至2 0 1 0 年间信息技术领域十大重要的科技发展技术之一。 语音识别的应用范围极为广泛,可应用于各行各业,如医疗卫生服务、语音拨 号、智能玩具、智能家居、宾馆服务、军事监听、股票交易、翻译系统、汽车导航、 信息网络查询、工业控制等等。语音识别广泛涉及声学、语言学、语音学、生理科 学、数字信号处理、通信理论、电子技术、计算机科学、模式识别和人工智能等众 多学科,是一门新兴的交叉学科。 经过半个世纪的发展,语音识别技术经历了从孤立词、特定人、小词汇量到连 续语音、非特定人、大词汇量的进展历程,并一步步进入人们的日常生活中。2 1 世 纪,语音技术己渗透到各行各业,在科技界、工业界、国防界都有广泛的应用价值 和前景。早期人们在调整自己的说话方式以适应各种各样的识别系统,而语音技术 的不断进步也为市场提供更准确的识别效果和更自然的对话模式。在语音识别技术 发展的各个阶段,根据其技术成熟的程度,各个研究机构也充分开发了各种高性能 的语音识别系统如:声控电话交换、语音拨号系统、信息网络查询服务系统、订票 系统、声控智能玩具、医疗服务、银行服务、听写机、计算机控制、工业控制、语 音通信系统等等,p d a 、掌上电脑、复读机、移动电话都具有了语音识别功能,并 在电信与数字网络中得到广泛应用,这种交互式进步正是当前语音识别的发展模式。 广东工业大学硕士学位论文 语音识别技术的应用正在成为一个具有竞争性的新兴高技术产业,改变着人们的日 常生活,并且极有可能成为下一代操作系统和应用程序的用户界面【1 2 1 。 1 1 2 语音识别技术在嵌入式系统中应用的意义 随着微电子技术的飞速发展,嵌入式系统开始进入到i t 时代,并且稳步发展, 逐步形成一个主流。嵌入式系统早期主要应用于军事及航空航天等领域,后来逐步 应用于工业控制、仪器仪表、汽车电子、通讯和智能家居,尤其在消费电子产品的 应用尤为广泛。 由于许多嵌入式消费电子产品移植了操作系统,例如智能手机、数字个人助理 p d a ,功能更加强大、齐全。由于它们具有齐全的功能,用户需要进行很多的文档 读写操作,甚至通过网上聊天工具进行在线的沟通,而传统的小键盘或触摸屏设备 极大的限制了其操作的速度,市场需求一种更加便捷的人机交互方式。 作为人机交互最自然的方式,语音识别技术在嵌入式系统上应用也就成为了当 前的热点。但是,由于语音识别模型复杂度高,算法运算量大,过去各种微处理器 硬件集成的程度、可靠性、标准化不高,因此,语音识别技术一直只能应用于小词 汇量的命令控制操作中,例如应用于玩具等产品,一些系统虽然能够取得较好的识 别性能,但是一直没能妥善的解决模型复杂度与硬件资源之间的矛盾。近年来,微 处理器嵌入式设备飞速发展,其性能大大的提高,并且具有效率高、稳定性好、能 耗低、体积小、容易安装等特点,这也使得在其之上实现大词汇的语音识别成为可 能,因此,嵌入式语音识别系统( e m b e d d e ds p e e c hr e c o g n i t i o ns y s t e m ,e s r s ) 应运而 生【3 】。 随着市场的不断发展,需求的不断提高,识别率,实时性成为了评价嵌入式语 音识别系统性能的关键因素。因此,在算法实现时在保证识别效果的前提下尽可能 优化,以适应嵌入式平台存储资源少、实时性要求高的特点。如何在不同的嵌入式 系统中实现语音识别,以及如何解决嵌入式系统资源有限与语音识别系统的算法复 杂的矛盾,进而提升系统的性能,成为了当今嵌入式语音识别的最大难点。 1 2 语音识别系统简介 目前,大多数语音识别系统都采用了模式分类的原理,即通过学习,系统把能 2 第一章绪论 够输入的语音按一定模式进行分类。目前主流的语音识别技术有基于时间规划和基 于统计模式识别两种理论。对于不同的语音识别任务来说,尽管设计和实现的细节 不同,但所采用的基本技术都是相似的,一个典型的语音识别过程如图1 1 所示: 训练 模板库 预 域。i 产 处 理 目模式匹配h 识别决策l 图1 1 语音识别系统流程图 f i g u r e1 1s p e e c hr e c o g n i t i o ns y s t e mf l o wc h a r t 从图1 1 进行分析,待识别语音先经话筒变换成语音信号,然后从识别系统前 端输入,再进行预处理。预处理涉及语音采样,反混叠带通滤波,去除个体发音差 异和设备、环境引起的噪声影响等,还包括语音识别基元的选取和端点检测等问题, 有时还包括模数转换器。特征提取部分用于提取语音中反映本质特征的声学参数, 常用的特征有短时平均能量或幅度、短时平均过零率、短时自相关函数、线性预测 系数、清浊浊音标志、基音频率、短时自相关函数、倒谱、共振峰等。训练在识别 之前进行,是通过让讲话者多次重复语音,从原始语音样本中去除冗余信息,保留 关键数据,再按一定规则对数据加聚类,形成模式库。模式匹配是整个语音识别系 统的核心,是根据一定的准则以及专家知识( 例如构词规则、语法规则、语义规则等) , 计算输入特征与库存模式之间的相似度,判断出输入语音的语意信息。通过匹配处 理,语音信号信息跟模板匹配度得到确认,语音识别系统会有一个识别决策过程, 在这一过程中通过计算,排列把最相似的模板筛选出来,最后转换成所需的文本或 控制信息。 语音识别系统的分类方式及依据有如下几个: 第一,根据对说话人说话方式的要求,可以分为孤立字( 词) 语音识别系统,连 接字语音识别系统以及连续语音识别系统。孤立词识,j 1 ( i s o l a t e dw o r dr e c o g n i t i o n i w r ) 是对说话人每次只说一个字、一个词组或一条命令这样的孤立词进行识别;连 接词识 ) w j ( c o n n e c t e dw o r dr e c o g n i t i o nc w r ) 的典型实例是连接数字符串识别,有时 也可以加上少量操作命令;连续语音识另u ( c o n t i n u o u ss p e e c hr e c o g n i t i o n c s r ) 是对 广东工业大学硕士学位论文 说话人以日常自然的方式讲述而进行的识别。以上三种方式,其识别困难是依次递 增的。 第二,根据对说话人的依赖程度可以分为特定人( s p e a k e rd e p e n d e n t ,s d ) 和非特 定人( s p e a k e ri n d e p e n d e n ts i ) 的语音识别系统,显然,后者的实现难度较前者大得多。 第三,根据词汇量大小,可以分为小词汇量( 小于l o o ) 、中词汇量( 1 0 0 - - - 5 0 0 ) , 大词汇量( 大于5 0 0 ) 以及无限词汇量语音识别系统。语音识别系统实现中,最简单的 是特定人、小词汇量、孤立词的语音识别,最复杂最难解决的是非特定人、大词汇 量、连续语音识别。通常情况下,词条越多,则相似的词汇越多,其误识率也相应 增n t , ,5 1 。 1 3 国内外语音识别技术的发展历史及其现状 1 3 1 国内外语音识别技术的发展历程 国外从上世纪5 0 年代初就开始研究语音识别技术,世界上最早能够识别语音 的系统a u d r y 是1 9 5 2 年b e l l 实验室开发的,还有1 9 5 6 年普林斯顿大学r c a 实验 室开发的单音节词识别系统。早期的识别方法基本上都是用模拟电路实现待测语音 和参考语音的运算关系。 6 0 年代以后,各种语音识别的研究才开始展开,r c a 实验室的研究成果是解 决了语音在时间标尺上的非均匀问题。1 9 6 8 年,前苏联科学家v i m s v u k 首次将动态 规划算法( d p ,d y n a m i cp r o g r a m m i n g ) 应用于语音分析,后来发展起来的线性预测分 析技术( l p ,l i n e a rp r e d i c t i o n ) 解决了语音信号模型的问题,对语音识别的发展产生 了深远影响。 7 0 年代语音识别开始快速发展,研究重心是孤立词语音识别。时间归整技术 ( d t w ,d y n a m i c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论