基于HMM的语音识别技术在嵌入式系统中的应用.doc_第1页
基于HMM的语音识别技术在嵌入式系统中的应用.doc_第2页
基于HMM的语音识别技术在嵌入式系统中的应用.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于HMM的语音识别技术在嵌入式系统中的应用 语音识别ASR(AutomaticSpeechRecognition)系统的实用化研究是近十年语音识别研究的一个主要方向近年来消费类电子产品对低成本、高稳健性的语音识别片上系统的需求快速增加语音识别系统大量地从实验室的PC平台转移到嵌入式设备中 语音识别技术目前在嵌入式系统中的应用主要为语音命令控制它使得原本需要手工操作的工作用语音就可以方便地完成语音命令控制可广泛用于家电语音遥控、玩具、智能仪器及移动电话等便携设备中使用语音作为人机交互的途径对于使用者来说是最自然的一种方式同时设备的小型化也要求省略键盘以节省体积 嵌入式设备通常针对特定应用而设计只需要对几十个词的命令进行识别属于小词汇量语音识别系统因此在语音识别技术的要求不在于大词汇量和连续语音识别而在于识别的准确性与稳健性 对于嵌入式系统而言还有许多其它因素需要考虑首先是成本由于成本的限制一般使用定点DSP有时甚至只能考虑使用MPU这意味着算法的复杂度受到限制;其次嵌入式系统对体积有严格的限制这就需要一个高度集成的硬件平台因此SoC(SystemonChip)开始在语音识别领域崭露头角SoC结构的嵌入式系统大大减少了芯片数量能够提供高集成度和相对低成本的解决方案同时也使得系统的可靠性大为提高 语音识别片上系统是系统级的集成芯片它不只是把功能复杂的若干个数字逻辑电路放入同一个芯片做成一个完整的单片数字系统而且在芯片中还应包括其它类型的电子功能器件如模拟器件(如ADC/DAC)和存储器 本识别系统是在与Infineon公司合作开发的芯片UniSpeech上实现的UniSpeech芯片是为语音信号处理开发的专用芯片采用0.18m工艺生产它将双核(DSPMCU)、存储器、模拟处理单元(ADC与DAC)集成在一个芯片中构成了一种语音处理SoC芯片这种芯片的设计思想主要是为语音识别和语音压缩编码领域提供一个低成本、高可靠性的硬件平台 该芯片为语音识别算法提供了相应的存储量和运算能力包括一个内存控制单元MMU(MemoryManagementUnit)和104KB的片上RAM其DSP核为16位定点DSP运算速度可达到约100MIPS.MCU核是8位增强型8051每两个时钟周期为一个指令周期其时钟频率可达到50MHz UniSpeech芯片集成了2路8kHz采样12bit精度的ADC和2路8kHz采样11bit的DAC采样后的数据在芯片内部均按16bit格式保存和处理对于语音识别领域这样精度的ADC/DAC已经可以满足应用ADC/DAC既可以由MCU核控制也可以由DSP核控制 2嵌入式语音识别系统比较 以下就目前基于整词模型的语音识别的主要技术作一比较 (1)基于DTW(DynamicTimeWarping)和模拟匹配技术的语音识别系统目前许多移动电话可以提供简单的语音识别功能几乎都是甚至DTM和模板匹配技术 DTW和模板匹配技术直接利用提取的语音特征作为模板能较好地实现孤立词识别由于DTW模版匹配的运算量不大并且限于小词表一般的应用领域孤立数码、简单命令集、地名

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论