基于单片机的语音识别系统设计-文献综述

上传人：机*** IP属地：河南上传时间：2018-01-01 格式：DOC 页数：4 大小：27.44KB 积分：12 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第1页开题报告（文献综述）1.引言语音识别是解决机器“听懂”人类语言的一项技术。作为智能计算机研究的主导方向和人机语音通信的关键技术，语音识别技术一直受到各国科学界的广泛关注。如今，随着语音识别技术研究的突破，其对计算机发展和社会生活的重要性日益凸现出来。以语音识别技术开发出的产品应用领域非常广泛，如声控电话交换、信息网络查询、家庭服务、宾馆服务、医疗服务、银行服务、工业控制、语音通信系统等，几乎深入到社会的每个行业和每个方面。广泛意义上的语音识别按照任务的不同可以分为4个方向：说话人识别、关键词检出、语言辨识和语音识别。说话人识别技术是以话音对说话人进行区别，从而进行身份鉴别和认证的技术。关键词检出技术应用于一些具有特定要求的场合，只关注那些包含特定词的句子。语言辨识技术是通过分析处理一个语音片断以判别其所属语言种类的技术，本质上也是语音识别技术的一个方面。语音识别就是通常人们所说的以说话的内容作为识别对象的技术，它是4个方面中最重要和研究最广泛的一个方向，也是本文讨论的主要内容。语音识别技术，也被称为自动语音识别AutomaticSpeechRecognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。2.语音识别的历史背景早在计算机发明之前，自动语音识别的设想就已经被提上了议事日程，早期的声码器可被视作语音识别及合成的雏形。而1920年代生产的RadioRex玩具狗可能是最早的语音识别器，当这只狗的名字被呼唤的时候，它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统，它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末，伦敦学院(ColledgeofLondon)的Denes已经将语法概率加入语音识别中。1960年代，人工神经网络被引入了语音识别。这一时代的两大突破是线性预测编码第2页LinearPredictiveCoding(LPC)，及动态时间弯折DynamicTimeWarp技术。语音识别技术的最重大突破是隐含马尔科夫模型HiddenMarkovModel的应用。从Baum提出相关数学推理，经过Labiner等人的研究，卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架。3.发展趋势1、神经网络用于训练韵律模型由于人工神经网络具备良好的自学习和自适应能力，将其应用于语音合成系统中的韵律模型研究具有很重要的意义。将神经网络模型与已有的文语转换系统有机结合，可以改变传统的文语转换系统的韵律模型，具有更强的适应性和可训练性，使合成语音的自然度得到显著提高，增加了系统的灵活性和风格的多样性。2、数据挖掘用于发现语音知识数据挖掘作为一种在大量数据库中发现隐藏新知识的计算技术方法，通过语音定性模型的建立，将数据分析和挖掘结果转化为逻辑规则或用可视化的形式进行表达。因此，将数据挖掘和人机交互接口紧密地联系在一起，将对计算机语音信号处理的研究工作产生巨大的推动力，为语音信号处理提供了一条崭新的研究途径。3、文本-可视语音转换系统研制成功文本-可视语音转换技术的出现是多媒体技术迅速发展的产物也迎合了社会发展的需求。它给人们的生活增添了新的色彩，使计算机更加人性化，人们与计算机的交流变得更为简单。相信在不久的将来，它会在众多的技术、商业和娱乐领域得到广泛的应用，并逐步进入我们每个人的生活。4.主要应用1、语音识别获得应用伴随着语音识别技术的不断发展，诞生了全球首套多语种交谈式语音识别系统E-talk。这是全球惟一拥有中英混合语言的识别系统，能听能讲普通话、广东话和英语，还可以高度适应不同的口音，因而可以广泛适用于不同文化背景的使用者，尤其是中国地区语言差别较大的广大用户。由于E-talk可以大大提高工作效率，降低运营成本，并为用户提供更便捷的增值服务，我们相信它必将成为电信、证券、金融、旅游等重视客户服务的行业争相引用的电子商务应用系统，并成为电子商务发展的新趋势，为整个信息产业带来无限商机。目前，飞利浦推出的语音识别自然会话平台SpeechPearl和第3页SpeechMania已成功地应用于国内呼叫中心，SpeechPearl中的每个识别引擎可提供高达20万字的超大容量词库，尤其在具有大词汇量、识别准确性和灵活性等要求的各种电信增值服务中有着广泛的应用。2、语音合成信息服务被用户接受语音合成技术把可视的文本信息转化为可听的声音信息，其应用的经济效益和社会效益前景良好。尤其对汉语语音合成技术的应用而言，全球有十几亿人使用中文，其市场需求、应用前景和经济效益等可见一斑。语音技术已逐渐在电信声讯信息服务领域智能电话查询系统中展开应用，并迅速推广。在电话高度普及的今天，如果打电话就能查询到所需信息，无疑将给人们的日常生活带来极大方便。汉语语音合成技术应用到声讯服务领域内，对现有的电话查询系统将产生革命性的影响。语音技术与互联网已成功地结合。电话Internet网关是一种用于实现电话网和Internet网之间信息互访的系统。简而言之，就是让电话用户能够轻松地通过电话网访问Internet网。利用语音合成技术的信息服务得到了用户的广泛接纳，给用户生活提供了极大的方便。3、面向对象的语音编码长期以来，在通信网的发展中，解决信息传输效率是一个关键问题，极其重要。目前科研人员已通过两个途径研究这一课题，其一是研究新的调制方法与技术，来提高信道传输信息的比特率，指标是每赫兹带宽所传送的比特数；其二是压缩信源编码的比特率，例如标准PCB编码，对3.4KHz频带信号需用64KHz编码比特率传送，而压缩这一比特率，显然可以提高信道传送的话路数。这对任何频率资源有限的传输环境来说，无疑是极为重要的，尤其是在无线通信技术决定今后通信发展命运的今天更显得重要。实际上，压缩语音编码比特率与话音存储、语音识别及语音合成等技术都直接相关。4、口语机器翻译受到重视口语翻译的一个重要目的就是帮助聋哑人与正常人交流，近来越来越受到人们的重视。首先，聋哑人要戴上一副特制的手套，计算机根据他打出的手语进行识别，然后，通过语音合成系统就可以把图像信息翻译成语言信息。同时，系统还能够完成将正常人的语言翻译成聋哑人的手语，只要将正常人说的话键入计算机，经程序分析处理之后，翻译成有表情、有动作的三维图像，从而最终达到聋哑人与正常人之间通过翻译机进行交流的目的。口语翻译的研究在其他很多方面都有重要价值，如用手势控制计算机，甚至用手势导航等。5.个人看法教学电路中用的主要芯片都是一些老产品，与当今流行的芯片想比，功能太单一，第4页体积大，电路及应用程序复杂，投入相对较大，现实中使用较少。现在学习的虽然是最基础的东西，但是与实际有很大差距，技术落后，跟不上科技的发展需求。参考文献1.李光飞，李光飞等著.单片机课程设计实例指导M.北京：北京航空航天大学出版社，20052.沈红卫著.单片机应用系统设计实例与分析M.北京：北京航空航天大学出版社，20023.张戬，杨腾飞车载语音识别系统M.上海:佳木斯大学报，20114.马龙华.车载环境下语音识别方法研究D.哈尔滨:哈尔滨工程大学.2008:235.罗俊光,汤荣江.基于DSP的非特人语音识别系统J.微计算机信息，2007,23(4):126.刘晓辉.基于语音识别的车载导航系统研究D.上海：同济大学.2008:37387.王立红,樊铭渠,李芳.基于

人人文库> 全部分类> 图纸下载 > 毕业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

基于单片机的语音识别系统设计-文献综述

文档简介

温馨提示

最新文档

评论

基于单片机的语音识别系统设计-文献综述

文档简介

温馨提示

最新文档

评论

相关文档