(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf_第1页
(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf_第2页
(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf_第3页
(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf_第4页
(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf_第5页
已阅读5页,还剩92页未读 继续免费阅读

(模式识别与智能系统专业论文)智能机器宠物的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

t h ed esi g na n d i m p l e m e n l l a t i o no f i n t e l l ig e n tr o botp e t at h e s i ss u b m i t t e dt o s o u t h e a s t u n i v e r s i t y f o rt h ea c a d e m i c d e g r e eo fm a s t e ro fe n g i n e e r i n g b y x ux i a o 1 i s u p e r v i s e db y a s s o c i a t ep r o f e s s o rz h a n gg u o b a o s c h o o lo f a u t o m a t i o n s o u t h e a s tu n i v e r s i t y m a r c h2 0 1 0 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果, 也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本 研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名:立每! j :酗 e t 期: 圣里! ! :! 乏d研究生签名:1 聋! j :鲴 期: 圣里! ! :! 主。d 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电 子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相 一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括以电子信息形式刊登) 论文的全部内容或中、英文摘要等部分内容。论文的公布( 包括以电子信息形式刊登) 授权东南大 学研究生院办理。 研究生签名:她导师 摘要 论文题目: 硕士研究生姓名: 导师姓名: 学校名称: 摘要 智能机器宠物的设计与实现 许小丽 章国宝 东南大学 随着人工智能技术和嵌入式技术的快速发展,不仅对机器宠物的研究日益深入,而 且将其在嵌入式平台上实现也日趋流行。本文从工程应用的角度出发,设计和开发了一 款智能机器宠物。该机器宠物可以实现简单的人机会话,并通过语音识别出主人的几种 情绪;另外为了提高其实用价值,该机器宠物还具有m p 3 音乐播放、电子相册等功能。 本文首先阐述了课题研究的背景和意义,概括了体现机器宠物智能性的相关技术现 状,并介绍了国内外机器宠物的发展趋势。接着对本项目做了详细的需求分析,包括硬 件指标、软件功能和机器宠物外观需求;经过详细需求分析,给出了本机器宠物的总体 设计方案。 然后根据总体方案,分别介绍了智能机器宠物的硬件平台、系统软件、语音识别软 件模块和应用软件的设计与详细实现。对于硬件平台的设计,按照处理器模块、数据存 储模块、输入输出模块、语音内容识别模块和附加功能模块逐个介绍;在充分考虑了硬 件资源和系统功能需求的情况下,对操作系统内核进行了合理的裁剪和移植。接着对本 课题的重点语音识别模块的实现做了详细的介绍,首先介绍了基于s p c e 0 6 1 a 的语 音内容识别,给出了语音命令的训练过程、识别过程、实验语料和实验结果,识别效果 良好;然后介绍了基于w 9 0 p 7 1 0 的语音情感识别,包括定点运算的实现、m f c c 参数 的提取、g m m 算法在嵌入式平台的实现和语音情感识别实验。最后是应用软件的设计, 首先讲述了简易嵌入式g u i 和通讯模块的设计,接着是各个功能模块的具体实现,然后 介绍了应用程序的调试方法,并总结了本系统在调试时遇到的问题和解决方法。 最后,对本文的工作进行了总结,并针对现智能机器宠物存在的一些问题,对后续 的开发工作做了展望。 关键词:智能机器宠物,w 9 0 p 7 1 0 ,s p c e 0 6 1 a ,语音内容识别,语音情感识别,g c l i n u x , 嵌入式g u i ,m p 3 播放器 a b s t r a c t a b s t r a c t t i t l e :t h e d e s i g na n di m p l e m e n t a t i o no fi n t e l l i g e n tr o b o tp e t m a s t e rc a n d i d a t e :x ux i a o 1 i s u p e r v i s o r : o r i g a n i z a t i o n : z h a n gg u o b a o s o u t h e a s tu n i v e r s i t y w i t ht h e r a p i dd e v e l o p m e n t o fa r t i f i c i a l i n t e l l i g e n c et e c h n o l o g ya n de m b e d d e d t e c h n o l o g y , m o r ea n dm o r er e s e a r c hb e g i n st ob ec o n c e n t r a t e do nr o b o tp e t sa n dt h e i m p l e m e n to ne m b e d d e dp l a t f o r m t or e a c ht h ea i mo fe n g i n e e r i n ga p p l i c a t i o n ak i n do f i n t e l l i g e n tr o b o tp e ti sd e s i g n e da n dd e v e l o p e di nt h i sp a p e r t h i sr o b o tp e tc a nc o m m u n i c a t e w i t hi t sh o s ts i m p l y , a n dr e c o g n i z et h ee m o t i o no fi t sh o s t i na d d i t i o n i no r d e rt oe n h a n c et h e p r a c t i c a lv a l u e ,i ta l s oc a np l a ym p 3 ,s h o wp i c t u r e sa n ds oo n f i r s t l y , t h eb a c k g r o u n da n ds i g n i f i c a n c eo ft h i sr e s e a r c hi sd e s c r i b e d ,t h er e l a t e dt h e o r i e s e m b o d i n gt h ei n t e l l i g e n c eo fr o b o tp e t sa r es u m m a r i z e d ,a n dt h et r e n do fr o b o tp e t sa th o m e a n da b r o a di si n t r o d u c e d t h e nad e t a i l e dd e m a n do ft h i sp r o j e c ti sa n a l y z e d i n c l u d i n gt h e h a r d w a r ei n d e x ,t h es o f t w a r ef u n c t i o na n dn e e d so ft h ea p p e a r a n c e a f t e rt h ed e m a n da n a l y s i s t h eo v e r a l ld e s i g no ft h er o b o tp e ti so b t a i n e d s e c o n d l y , b a s e do nt h eo v e r a l ld e s i g n ,t h ed e s i g na n di m p l e m e n to fh a r d w a r ep l a t f o m s y s t e ms o f t w a r e ,s p e e c hr e c o g n i t i o ns o f t w a r em o d u l ea n da p p l i c a t i o ns o f t w a r ea r ei n t r o d u c e d s e p a r a t e l y f o rt h ed e s i g no fh a r d w a r ep l a t f o r n l ,p r o c e s s o rm o d u l e ,d a t as t o r a g em o d u l e s i n p u ta n do u t p u tm o d u l e s ,s p e e c hc o n t e n tr e c o g n i t i o nm o d u l ea n do t h e rf u n c t i o n a lm o d u l e s a r ep r e s e n t e do n eb yo n e i nf u uc o n s i d e r a t i o no ft h eh a r d w a r er e s o u r e sa n dt h ed e m a n d so f s y s t e mf u n c t i o n s t h eo p e r a t i n gs y s t e mk e r n e l i sc u ta n dt r a n s p l a n tr e a s o n a b l y t h e nt h ef o c u s o ft h i si s s u e 一t h er e a l i z a t i o no fs p e e c hr e c o g n i t i o ni si n t r o d u c e di nd e t a i l t ob e g i nw i t ht h e s p e e c hc o n t e n tr e c o g n i t i o nb a s e do ns p c e 0 61a ,t h et r a i n i n gp r o c e s s ,t h er e c o g n i t i o np r o c e s s , t h ee x p e r i m e n t a lc o r p u sa n dt h ee x p e r i m e n tr e s u l t sa r ed i s c u s s e d ,a n dt h er e s u l t ss h o wt h a t t h em e t h o di se 伍t i v e ;b e s i d e s ,t h es p e e c he m o t i o nr e c o g n i t i o nb a s e do nw 9 0 p 7 10i s p r e s e n t e d ,w h i c hi n c l u d e st h er e a l i z a t i o no ft h ef x e d p o i n to p e r a t i o n s t h ee x t r a c t i o no f m f c cp a r a m e t e r s ,t h ei m p l e m e n t a t i o no fg m m a l g o r i t h mi ne m b e d d e dp l a t f o i r i l la n dt h e s p e e c he m o t i o ne x p e r i e n c e a tl a s t ,t h ea p p l i c a t i o ns o f t w a r ei sg i v e n i nt h i sp a r t t h i st h e s i s s t a r t sw i t ht h e s i m p l ee m b e d d e dg u ia n dc o m m u n i c a t i o nm o d u l e f o l l o w sb yt h e i m p l e m e n t a t i o no fe v e r yf u n c t i o nm o d u l e ,t h e ni n t r o d u c e st h em e t h o d so ft h ea p p l i c a t i o n s o f t w a r e ,a n ds u m m a d z e st h ep r o b l e m si nd e b u g g i n ga n ds o l u t i o n s f i n a l l y , as u m m a r yi sg i v e na n dt h ef o l l o w - u pw o r ko ft h ed e v e l o p m e n ti sr a i s e d a c c o r d i n g t os o m ee x s i t i n gp r o b l e m so f p r e s e n ti n t e l l i g e n tr o b o tp e t k e y w o r d s :i n t e l l i g e n tr o b o tp e t ,w 9 0 p 7 10 ,s p c e 0 61a ,s p e e c hc o n t e n tr e c o g n i t i o n ,s p e e c h e m o t i o nr e c o g n i t i o n ,肛c l i n u x ,e m b e d d e dg u i ,m p 3p l a y e r i i 学校名称:东南大学 随着人工智能技术和嵌入式技术的快速发展,不仅对机器宠物的研究日益深入,而 且将其在嵌入式平台上实现也日趋流行。本文从工程应用的角度出发,设计和开发了一 款智能机器宠物。该机器宠物可以实现简单的人机会话,并通过语音识别出主人的几种 情绪;另外为了提高其实用价值,该机器宠物还具有m p 3 音乐播放、电子相册等功能。 本文首先阐述了课题研究的背景和意义,概括了体现机器宠物智能性的相关技术现 状,并介绍了国内外机器宠物的发展趋势。接着对本项目做了详细的需求分析,包括硬 件指标、软件功能和机器宠物外观需求;经过详细需求分析,给出了本机器宠物的总体 设计方案。 然后根据总体方案,分别介绍了智能机器宠物的硬件平台、系统软件、语音识别软 件模块和应用软件的设计与详细实现。对于硬件平台的设计,按照处理器模块、数据存 储模块、输入输出模块、语音内容识别模块和附加功能模块逐个介绍;在充分考虑了硬 件资源和系统功能需求的情况下,对操作系统内核进行了合理的裁剪和移植。接着对本 课题的重点语音识别模块的实现做了详细的介绍,首先介绍了基于s p c e 0 6 1 a 的语 音内容识别,给出了语音命令的训练过程、识别过程、实验语料和实验结果,识别效果 良好;然后介绍了基于w 9 0 p 7 1 0 的语音情感识别,包括定点运算的实现、m f c c 参数 的提取、g m m 算法在嵌入式平台的实现和语音情感识别实验。最后是应用软件的设计, 首先讲述了简易嵌入式g u i 和通讯模块的设计,接着是各个功能模块的具体实现,然后 介绍了应用程序的调试方法,并总结了本系统在调试时遇到的问题和解决方法。 最后,对本文的工作进行了总结,并针对现智能机器宠物存在的一些问题,对后续 的开发工作做了展望。 关键词:智能机器宠物,w 9 0 p 7 1 0 ,s p c e 0 6 1 a ,语音内容识别,语音情感识别,g c l i n u x , 嵌入式g u i ,m p 3 播放器 a b s t r a c t t i t i e : m a s t e rc a n d i d a t e : s u p e r v i s o r : o r i g a n i z a t i o n : a b s t r a c t t h ed e s i g na n di m p l e m e n t a t i o no fi n t e l l i g e n tr o b o tp e t x ux i a o 1 i z h a n gg u o - b a o s o u t h e a s tu n i v e r s i t y w i t ht h er a p i dd e v e l o p m e n to fa r t i f i c i a l i n t e l l i g e n c et e c h n o l o g y a n de m b e d d e d t e c h n o l o g y , m o r ea n dm o r er e s e a r c hb e g i n st ob ec o n c e n t r a t e do nr o b o tp e t sa n dt h e i m p l e m e n to ne m b e d d e dp l a t f o r n l t or e a c ht h ea i mo fe n g i n e e r i n ga p p l i c a t i o n ak i n do f i n t e l l i g e n tr o b o tp e ti sd e s i g n e da n dd e v e l o p e di nt h i sp a p e r t h i sr o b o tp e tc a nc o m m u n i c a t e w i t hi t sh o s ts i m p l y , a n dr e c o g n i z et h ee m o t i o no fi t sh o s t i na d d i t i o n i no r d e rt oe n h a n c et h e p r a c t i c a lv a l u e ,i ta l s oc a np l a ym p 3 。s h o wp i c t u r e sa n ds oo n f i r s t l y , t h eb a c k g r o u n da n ds i g n i f i c a n c eo ft h i sr e s e a r c hi sd e s c r i b e d t h er e l a t e dt h e o r i e s e m b o d i n gt h ei n t e l l i g e n c eo fr o b o tp e t sa r es u m m a r i z e d ,a n dt h et r e n do fr o b o tp e t sa th o m e a n da b r o a di si n t r o d u c e d t h e nad e t a i l e dd e m a n do ft h i sp r o j e c ti sa n a l y z e d i n c l u d i n gt h e h a r d w a r ei n d e x ,t h es o f t w a r ef u n c t i o na n dn e e d so ft h ea p p e a r a n c e a f t e rt h ed e m a n da n a l y s i s t h eo v e r a l ld e s i g no ft h er o b o tp e ti so b t a i n e d s e c o n d l y , b a s e do nt h eo v e r a l ld e s i g n ,t h ed e s i g na n di m p l e m e n to fh a r d w a r ep l a t f o r i l l s y s t e ms o f t w a r e ,s p e e c hr e c o g n i t i o ns o f t w a r em o d u l ea n da p p l i c a t i o ns o f i w a r ea r ei n t r o d u c e d s e p a r a t e l y f o rt h ed e s i g no fh a r d w a r ep l a t f o r m ,p r o c e s s o rm o d u l e ,d a t as t o r a g em o d u l e s , i n p u ta n do u t p u tm o d u l e s s p e e c hc o n t e n tr e c o g n i t i o nm o d u l ea n do t h e rf u n c t i o n a lm o d u l e s a r ep r e s e n t e do n eb yo n e i nf u l lc o n s i d e r a t i o no ft h eh a r d w a r er e s o u r e sa n dt h ed e m a n d so f s y s t e mf u n c t i o n s t h eo p e r a t i n gs y s t e mk e r n e l i sc u ta n dt r a n s p l a n tr e a s o n a b l y t h e nt h ef o c u s o ft h i si s s u e - t h er e a l i z a t i o no fs p e e c hr e c o g n i t i o ni si n t r o d u c e di nd e t a i l t ob e g i nw i t ht h e s p e e c hc o n t e n tr e c o g n i t i o nb a s e do ns p c e 0 6 1a ,t h et r a i n i n gp r o c e s s ,t h er e c o g n i t i o np r o c e s s , t h ee x p e r i m e n t a lc o r p u sa n dt h ee x p e r i m e n tr e s u l t sa r ed i s c u s s e d ,a n dt h er e s u l t ss h o wt h a t t h em e t h o di se 币t i v e ;b e s i d e s t h es p e e c he m o t i o nr e c o g n i t i o nb a s e do nw 9 0 p 710i s p r e s e n t e d ,w h i c hi n c l u d e st h er e a l i z a t i o no ft h ef i x e d p o i n to p e r a t i o n s t h ee x t r a c t i o no f m f c cp a r a m e t e r s t h ei m p l e m e n t a t i o no fg m ma l g o r i t h mi ne m b e d d e dp l a t f o r i l la n dt h e s p e e c he m o t i o ne x p e r i e n c e a tl a s t t h ea p p l i c a t i o ns o f t w a r ei sg i v e n i nt h i sp a r t t h i st h e s i s s t a r t sw i t ht h e s i m p l e e m b e d d e dg u ia n dc o m m u n i c a t i o nm o d u l e f o l l o w sb yt h e i m p l e m e n t a t i o no fe v e r yf u n c t i o nm o d u l e ,t h e ni n t r o d u c e s t h em e t h o d so ft h ea p p l i c a t i o n s o f t w a r e ,a n ds u m m a r i z e st h ep r o b l e m si nd e b u g g i n ga n ds o l u t i o n s f i n a l l y , as u m m a r yi sg i v e na n dt h ef o l l o w - u pw o r ko ft h ed e v e l o p m e n ti sr a i s e d , a c c o r d i n gt os o m ee x s i t i n gp r o b l e m so fp r e s e n ti n t e l l i g e n tr o b o tp e t k e y w o r d s :i n t e l l i g e n tr o b o tp e t ,w 9 0 p 7 10 ,s p c e 0 61a ,s p e e c hc o n t e n tr e c o g n i t i o n , s p e e c h e m o t i o nr e c o g n i t i o n ,l a c l i n u x ,e m b e d d e dg u i ,m p 3p l a y e r i i 目录 目录 摘要i a b s t r a c t i i 目录i i i 第一章绪论。1 1 1 课题研究背景及意义1 1 2 相关技术的研究概况1 1 2 1 语音内容识别1 1 2 2 语音情感识别3 1 3 智能机器宠物的发展现状4 1 3 1 国外发展现状4 1 3 2 国内发展现状6 1 4 本文研究内容和章节安排7 第二章智能机器宠物的总体设计8 2 1 智能机器宠物的功能需求分析8 2 1 1 系统需求8 2 1 2 硬件指标需求9 2 1 3 软件功能需求1 0 2 1 4 外观需求1 1 2 2 硬件整体框图及设计方案1 1 2 2 1 硬件整体框图1 1 2 2 2 主控制器选型1 1 2 2 3 语音识别专用芯片选型1 3 2 3 软件整体架构及设计方案1 3 2 3 1 软件整体架构1 3 2 3 2b o o t l o a d e r 解决方案1 4 2 3 3 操作系统方案1 5 2 3 4 语音情感识别模块实现方案1 5 2 3 5g u i 界面的设计方案1 7 2 4 外观设计方案1 8 2 5 本章小结1 8 第三章智能机器宠物硬件平台设计1 9 3 1 智能机器宠物硬件整体结构设计1 9 3 2 处理器模块设计1 9 3 2 1w 9 0 p 7 1 0 简介1 9 3 2 2w 9 0 p 7 1 0 外围电路设计2 0 3 3 数据存储模块设计2 2 3 3 1s d r a m 电路设计2 2 3 3 2n o rf l a s h 电路设计2 2 3 3 3n a n df l a s h 电路设计2 3 3 3 4u s b h o s t 接口电路设计2 4 3 4 输入输出模块设计2 4 i i i 目录 3 4 1 键盘电路设计2 4 3 4 2 音频电路设计2 5 3 4 3l c d 电路设计2 5 3 5 语音识别模块设计2 6 3 5 1s p c e 0 6 1 a 简介2 6 3 5 2s p c e 0 6 1 a 外围电路设计2 7 3 5 3m i c 输入电路设计2 8 3 6 其他模块设计2 9 3 6 1u a r t 总线电路设计2 9 3 6 2 电源及复位电路设计3 0 3 7 本章小结3 l 第四章智能机器宠物系统软件设计3 2 4 1 嵌入式系统软件开发流程3 2 4 2 交叉编译环境的建立3 3 4 3 智能机器宠物系统软件的定制与移植3 4 4 3 1b o o t l o a d e r 的定制3 4 4 3 2p c l i n u x 内核定制3 5 4 3 3 文件系统定制3 6 4 3 4 设备驱动定制3 7 4 3 5 交叉编译3 8 4 4 本章小结3 8 第五章智能机器宠物语音识别模块设计3 9 5 1 语音识别原理概述3 9 5 2 基于s p c e 0 6 1 a 的语音内容识别实现4 0 5 2 1 语音识别的a p i 函数4 0 5 2 2 语音命令的训练过程4 1 5 2 3 语音命令的识别过程4 2 5 2 4 语音命令语料4 3 5 2 5 实验结果4 4 5 3 基于w 9 0 p 7 1 0 的语音情感识别实现4 5 5 3 1 浮点运算转化为定点运算4 5 5 3 2m f c c 特征参数提取4 7 5 3 3 高斯混合模型g m m 5 1 5 3 4 语音情感识别实验5 6 5 4 本章小结5 8 第六章智能机器宠物应用软件设计5 9 6 1 智能机器宠物应用软件的整体构架5 9 6 2 嵌入式g u i 与通讯模块设计6 0 6 2 1 嵌入式简易g u i 设计6 0 6 2 2 通讯模块设计6 3 6 3 功能模块设计与实现6 5 6 3 1 音频播放模块实现6 5 6 3 2 电子相册模块实现6 7 6 3 3 文件管理模块实现6 9 6 3 4 附加功能模块实现7 0 6 4 应用程序的交叉编译7 1 i v 6 5 2 调试中遇到的问题及解决方法7 4 6 6 本章小结7 5 结束语7 6 致谢7 8 参考文献7 9 作者在攻读硕士学位期间发表的论文8 2 v 第一章绪论 1 1 课题研究背景及意义 第一章绪论 随着计算机、微电子、信息技术的快速进步,机器人技术的研发速度越来越快,智 能度越来越高,应用范围也得到了极大的扩展。在海洋开发、宇宙探测、工农业生产、 军事、社会服务、娱乐、紧急救援、医疗康复等各个领域,机器人都有着广阔的发展空 间与应用前景。机器人正朝着智能化和多样化等方向发展【j j 。 娱乐机器人以供人观赏、娱乐为目的,具有机器人的外部特征,可以像人或像某种 动物等,同时具有机器人的功能,可以行走或完成动作,有语音能力,会唱歌,有一定 的感知能力。近年来,随着人们经济水平的提高以及生活压力的增大,为了提高人们 的生活水平,国内外很多高校和企业都对娱乐机器人开始进行研究。在未来的生活中, 娱乐机器人必将同计算机和网络一样成为人们生活中不可缺少的重要组成部分。所以说 娱乐机器人不仅在学术研究上有很高价值,而且其市场前景也十分广阔。 智能机器宠物属于娱乐机器人中的一种。目前市面上流行的智能机器宠物大多针对 儿章设计的,用于儿章娱乐以及辅助儿童教育,如国内比较流行的智多熊和小草莓等; 此外针对成年人的智能机器宠物则价格昂贵,不适合大众消费,如日本s o n y 公司的 a i b o 机器狗,其单个售价最高可达2 0 0 0 美元;而国内针对成年人设计的智能机器宠物 还非常稀少。基于上述现状,开发一款具有独立自主知识产权、面向成年人的智能机器 宠物,是我国娱乐机器人领域急需解决的问题。 本文从生产和实用的角度出发,结合我国基本国情和人们的消费水平,也为了让智 能机器宠物早日走进千千万万个普通家庭,自主研发出这款智能机器宠物,结构简单、 功能强大,主要体现在:基于嵌入式平台的开发,可进行简单的人机会话并识别出主人 语音中的情感,播放m p 3 音乐,显示电子相册,语音与键盘结合的友好人机交互方式, 同时支持移动设备进行音乐和图片文件的扩展,此外其成本也相当低廉。因此,本课题 满足国内娱乐机器人不断进步发展的要求,具有十分显著的经济效益,对于我国娱乐机 器人的长远发展和语音识别技术的研究都具有重要意义。 1 2 相关技术的研究概况 1 2 1 语音内容识别 语音识别是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令 的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音, 理解人的意图,并做出相应的反应。从技术上看,它属于多维模式识别和智能接口的范 畴。语音识别技术是一项集声学、计算机、信息处理、人工智能等于一身的综合技术, 可广泛应用在信息处理、通信与电子系统、自动控制等领域【2 j 。 本文所提及的语音内容识别,属于语音识别的一种,特指特定人、小词汇量、孤立 词的嵌入式语音识别。在语音识别技术中,这种内容识别的研究开展得最早,也是目前 最成熟的技术之一。其历史可以追溯到2 0 世纪5 0 年代。1 9 5 2 年a t & tb e l l 实验室的 k h d a v i s 等人利用带通滤波器进行语音频谱的分析和匹配,并成功用于对1 0 个英文 东南大学硕士学位论文 数字的识别,识别率达到9 8 。1 9 6 0 年p d e n e s 等研制成功第一个计算机语音识别系统, 同年gf a n t 提出了语音产生的声源滤波器模型,对语音识别工作起到了巨大的推 动作用。2 0 世纪6 0 年代末、7 0 年代初线性预测技术和动态时间规整算法被成功引入到 语音信号处理中,有效地解决了语音的特征提取和不定长匹配的动态时间对准问题。2 0 世纪8 0 年代语音识别研究进一步走向深入,其研究重点已经偏向了连接词语音识别p j 。 也就是说,这时孤立词语音识别研究已经发展得相当成熟了。 嵌入式语音是在2 0 世纪六七十年代以来,科研人员一直致力于研究的热门课题。 但当时研究出来的嵌入式语音识别专用芯片大多数识别性能差,不能符合实用要求。直 到近1 0 年来,随着语音识别算法的深入研究和集成电路技术的发展,才出现了一些具 有实用价值和市场潜力巨大的语音识别专用芯片i 4 j 。 目前,在国外典型的嵌入式语音识别专用芯片已有多种,其技术也比较成熟。具有 代表性的专用芯片有以下几种【4 j : r s c 3 6 4 是美国s e n s o r yi n t e g r a t e dc i r c u i t 公司开发的,2 0 0 0 年开始生产的产品。 它是一颗为消费类电子产品应用的、低价位的语音识别专用芯片。r s c 3 6 4 使 用预先学习好的人工神经网络进行非特定人语音识别,不需要经过训练就可以 识别简单的语句;此外还可以识别特定人、孤立词命令语句,约6 0 条。它还具 有5 1 5 k b s 的语音合成速率,音质较好,具有改进的a d p c m ( 自适应差分脉 冲调制) 语音编码功能,用做语音回放。 u n i s p e e e h - s d a 8 0 d 5l 是德国i n f i n e o n 公司2 0 0 0 年开始生产的产品。它是一颗 高性能语音专用芯片,能够满足立体声处理和消除外界干扰等功能要求,在汽 车上使用时,可以消除发动机和轮胎转动产生的噪声干扰等。 i s d s r 3 0 0 0 是一个嵌入式语音识别器件,是i s d 公司开发的s i m o n 系列芯片的 第一个。手提电话和自动应答机等各种便携设备装备该器件后,用户就可以通 过说话来操作,不需要复杂的键盘输入。这项技术可进行与说话者无关的连续 语音识别,也提供了数字输入方式。这种芯片级的解决方案包括硬件、软件和 语音用户接口,适合于小型、低功耗的消费产品,如电话、家电和其他电器, 也可用于汽车和工业应用。 我国语音识别系统的研究起步比较晚,但也取得了很好的成绩,研究水平也从实验 室逐步走向实用。从1 9 8 7 年开始执行国家8 6 3 计划后,国家8 6 3 智能计算机专家组为 语音识别技术研究专门立项,每两年滚动一次。我国p c 机语音识别技术的研究水平已 经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,但独立开发的专 用汉语语音识别芯片还是较少,多数都是与国外研究机构合作开发研制的1 5 j 。 我国所研究的最有代表性的语音识别芯片由清华大学与华录集团合作研究开 发,是国内第一个具有自主知识产权的语音识别专用芯片。该芯片以8 位m c u 为核心,采用嵌入式芯片设计方法。芯片中包括8 位m c u 核、低通滤波器、 a d 、d a 、预放、功放、r a m 、r o m 及p w m 等模块,并载入语音识别、语 音压缩编码及语音合成算法,构成一个完整的高度集成语音识别片上系统。该 芯片能够识别2 0 - 3 0 条特定人语音命令,同时具有语音合成( 提示) 与语音编 码、解码( 回放) 功能,语音识别率为9 8 以上。由于优先考虑了语音识别技 术在玩具业的应用,与国际上同类芯片相比,其语音识别在基于汉语的s i ( 不 依靠说话者语音) 技术的应用方面有明显的优势。同时,它还增加了其他同类 芯片没有的自带l c d 驱动功能,更吸引人的是比其他的芯片的功耗低l 2 倍1 4 j 。 清华大学还与i n f i n e o n 公司合作开发了语音芯片u n i s p e e c h 。u n i s p e e c h 芯片是 为语音信号处理开发的专用芯片,采用o 1 8 1 a m 工艺生产。它将双核 ( d s p + m c u ) 、存储器、模拟处理单元( a d c 与d a c ) 集成在一个芯片中, 构成了一种语音处理s o c 芯片。这种芯片的设计思想主要是为语音识别和语音 2 第一章绪论 压缩编码领域提供一个低成本、高可靠性的硬件平台。u n i s p e e c h 芯片集成了2 路8 k h z 采样1 2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论