




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
河南理工大学本科毕业设计(论文)开题报告题目名称基于单片机的智能声控小车设计学生姓名专业班级学号一、选题的目的和意义:1设计(论文)的主要目的通过本次设计,可以对国内、外的智能声控发展趋势及应用背景有所了解,并通过一些书籍、期刊,掌握单片机及声控工作原理,同时对一些基于单片机的智能声控小车的软、硬件设计及相关仿真软件进行了实践应用。2. 意义机器人的应用越来越广泛,几乎渗透到所有领域。机器人的发展体现了一个国家技术水平的高低,现代机器人从其诞生到现在,己经发展到了第三代。第一代机器人是示教再现型机器人。它们装有记忆存储器,由人将作业的各种操作要求示范给机器人,使之记住操作的程序和要领。当它接到再现命令时,则自主地再现示教的动作。第二代机器人是装有小型计算机和简单传感器的离线编程的工业机器人。它能感知外界信息和进行“思维”,比第一代机器人更灵活、更能适应环境变化的需要。第三代是智能机器人。智能机器人是“具有感知、思维和动作的机器”。它装有多种传感器,能识别作业环境,能自主决策,具有人类大脑的部分功能,且动作灵活,是人工智能技术发展到高级阶段的产物。智能小车,也就是轮式机器人,具有广泛的用途,尤其适合那些人类无法工作的环境中工作,无人生产线,仓库,服务机器人,航空航天等 领域。作为20世纪自动化领域的重大成就,机器人已经和人类社会的生产、生活密不可分。应此为了使智能小车工作在最佳状态,进一步研究及完善其速度和方向的控制是非常有必要的。其次学习智能小车的制作也是对大学4年学习的一个很好的检测,对今后的学习和工作具有很大的帮助。二、国内外研究现状简述:机器自动语音识别的研究工作起始于上世纪50 年代,1952 年Bell 实验室的Davis,Biddulph 等人建立了第一个可以识别孤立英文数字的语音识别系统。六十年代对语音信号的研究主要是特征分析与特征提取,人们发现人耳对声音中不同的频率有不同的分辨率和反应强度,从而提出临界频带理论(Critical Band Theory)。当时由于计算机技术的限制,只能用专用硬件进行谱分析再由计算机识别。1966年MIT 的Gold等人用16通道滤波器组、基音检测器、浊音检测器和一台计算机构成一个语音识别系统。语音识别从这一时期开始起步。七十年代语音识别技术得到迅速发展,由于线性预测编码LPC (Linear Prediction Coding) 特征较好地解决了语音特征的提取问题,人们开始研究各种识别方法。人们把用于解决有序的优化问题的动态规划 (Dynamic Programming) 技术应用到语音识别中,由Sakoe(1972 ) 提出的动态时间弯曲DTW (Dynamic Time Warping) 算法有效地解决了语音两次发音间的时间变形问题。DTW算法对特定人的孤立词识别十分有效,从此基于LPC 分析及DTW算法的中、小字表孤立字特定人语音识别系统纷纷建立起来,语音识别开始走出实验室进入实用领域。八十年代,不论在语音特征表示、距离度量、还是识别方法上均有较大发展。八十年代初Y. Linde将信息压缩理论中矢量量化(Vector Quantization) 技术应用于语音识别。矢量量化的作用是进行数据压缩,将连续的语音特征空间量化为一些离散点,降低系统在时间及存储上的开销。矢量量化的另一个作用是通过聚类获取多个话者或一个话者的多次发音所共有的语音特征。Bell实验室的Rabiner(1983)等人将矢量量化与隐马尔可夫模型HMM (Hidden Markov Model) 结合起来,提出并建立了离散参数隐马尔可夫模型,从此采用离散参数隐马尔可夫模型的非特定人语音识别研究纷纷开展起来。日本AT R 的电话翻译研究实验室 (Interpreting Telephony Research Laboratory)是世界上最大的致力于语音识别研究的实验室,己经研制出语音翻译系统( 即SL-TRANS 系统) ,它能识别日语语音并翻译成英语再合成英语声音输出。1990年Nagata 和Kogure 介绍了 SL-TRANS 系统,SL-TRANS 由六部分组成。HMM 识别器生成多侯选词表,通过词和短语级的相关滤波操作将多余侯选词删除,然后由基于HPSG 的表达文法分析器生成一个文法分析表,再用一个转换模型重写该表,用基于规则的生成器生成英语句子,发音由语音合成器生成。整个系统能翻译测试句子的69% ,语法是特别为口语设计的,它包括一些实用的约束,如敬语的语法规则。语音识别部分的精度比整个翻译系统的高,非特定人的识别率为81.6% ,特定人为88.4% 。 ATR将神经元网络用于语音识别,1988年Waiter 用时延神经网络 TDNN 解决了难于区分的“B ”,“D ”和“G ”的问题。网络能自学一些特征,神经元的识别率是98.5% ,而HMM 方法的识别率为93.7% 。1989年NEC的Sokoe 将神经元用于孤立词非特定人的语音识别,它利用动态 规划技术DTW (Dynamic Programming Technique)优点,通过自学习改进性能,其识别日语数字的识别率是99.3% 。东京的NTT 人机接口实验室 (The NTT Human Interface Lab) 用HMM匹配音节和DTW 匹配基音轮廓的混合技术识别孤立字,音节匹配法易于混淆的相似音节,用基音轮廓就很容易区分。NTT 使用HMM 方法,用三元音节作为语音基元研制出语音听写机,对特定人的279 个语调的测试其识别率为94.9% 。1990 年Matsunaga使用HMM 和二级语法:单个短语的短语结构语法和组合短语的语法研制出连续语音识别系统,短语识别率可达86.8% ,对216 个词的识别率为98.4% 。1985年东京的Matsushita研究所研制了非特定人孤立词语音识别系统、该系统包括:LPC 倒谱系数、辅音分段、辅音识别、元音和半元音识别、音节序列生成和词的匹配。根据1985年Morii的报导,系统对274 个词的识别率为95.6% 。另外,Matsushita研制出 15个词组成的非特定人孤立词识别的商业用接插板,并己经用于VCR,视频通信系统。在Yamatokoriyama 的夏普信息系统实验室,根据日本语的特点:日语总共有大约100 个音节,并且语音是以音节为基础,用音节作语音识别基元,用音韵规则得到每个音节间的关系,并用 DTW方法作语音识别,对 300 个孤立字的特定人的识别率是94% 。 1985 年sharp 在超级市场放置了一个用声音操作的字处理系统,并引起人们对这一领域的关注。 1990年在kawasaki的Fujits。实验室的信息处理分部,将DP(Dynamic programming) 方法用于100, 000 字的字典( 大部分是名字) 的语音识别,由于词汇量大,计算时间极长,通过预处理完成快速选择。在 20个侯选字中,每次所选字的正确率为93.5% 。整个系统的性能比较差,第一侯选字的正确率只有55% 。 1989年DECIPHER 用25个Mel 滤波器,带宽为 100-6400Hz ,得到每帧12位的Mel CEP 系数(Mel-cepstra coefficients) ,使用矢量量化 VQ方法将特征压缩到每帧4 位:能量(energy) 、能量导数(energy derivative) 、Mel倒谱(Mel-cepstra) 和Mel倒谱导数(Mel-cepstra derivative) 。在字的结构中使用了音韵规则,使用混合的 HMM方法(The tied mixture HMMs) 锐化训练数据的音素,并能很好地将男人和女人说话者分成二组模板,所需的训练时间大约为 2-3 小时,混合的 HMM 能根据每个说话人的特点来修改参数。该系统用20 句作为自适应训练句子,可以使误识率从 7.4%降到6.1%。1987 年Cambridge 的BBN系统和技术实验室(Bolt Beranick and Newman Systems and Technologies Laboratory) 研制出BYBLOS语音识别器,该系统与DECIPHER 相类似,它用混合的高斯HMM 作识别器,在 DARPA组织的测试中,困惑度为60的识别率为96.2% ,困惑度为1000的识别率为81.2% 。BNN能够对带有方言的说话者具有自适应能力。CMU ( Carnegie Mellon University) 计算机学院是语音识别研究的先驱,从七十年代就开始了语音识别的研究。SPHINX 是第一个最大的基于HMM 模型的系统,1989年Lee 介绍了一些革新方法使整个系统有重大改进,在 SPHINX 中的许多特征成为现代HMM 系统的标准,例如:Mel倒谱 (Mel scaleecpstra) 、差分系数(differential coefficients) 、多维矢量量化码本(multiple vector-quantized codebooks) 、音韵规则 (phonological rules) 等。在对 1000字非特定人连续语音的测试中,对困惑度为60的识别率为94.7% ,困惑度为1000的识别率为73.6% 。1989年Wa i b e l开始使用神经元模型,特别是时间延迟神经元 TDNN (Time-Delay Neural Nets)。当大部分系统均限定在小词汇量时,Wa i b e l 就己经用神经网络和动态规划相结合的方法研制大词汇系统.IBM 于1972年研制出利用统计方法进行语音识别的工具和技术,主要研究超大词汇的实时识别。1984年首次展示了有5000词汇的基于HMM 的孤立字语音识别系统,其识别率为94.3%-98.0%。1986年推出了基于个人计算机的能识别5000词汇的语音识别系统TANGORA ,1987年研制出20,000 字的孤立字识别器。1993年IBM 推出了特定人的个人口述系统,一年后推出了IBM 个人口述系统的新版本,命名为VTD (Voice Type Dictation) 1.1 版。1996年推出了用于Windows95 的VTD3.0 版。IBM 的个人口述系统可以识别的语言有:美国英语、英国英语、阿拉伯语、法语、德语、意大利语和西班牙语,1997年IBM 推出了用于汉语语音识别的个人听写系统ViaVoice。AT T 作为一个通讯公司一直对语音识别及相关技术很感兴趣。1998年Rabiner报导了一个实时的HMM 系统用来识别数字,1991年Riley和Ljilje使用词典和统计技术,通过词汇匹配将音素序列转成词。 在1988年MIT 的Lincoln实验室完成了基于神经元网络的孤立字的识别,1991 年完成了基于HMM 的连续语音识别。Boston 的Dragon systems 研制出特定人的自动听写系统,系统用486PC 机几乎实时地完成844 个字的记录任务,识别方法是基于HMM 的音素识别。在 Montreal的工 NRS 电话通讯研究所已经研制出大词汇特定人听写系统,它由 60,000 词的Merriam字典和由名字组成的26,000 附加词组成系统使用具有宽度约束的矢量码本的 HMM 方法,INRS 只要能够完成实时处理就可以进入市场,为了这一目标他们正在研制并行处理的硬件。 1991年的SUNDIAL 计划主要处理电话信息,有英语、法语、德语和意大利语,每种语言包括 1000-2000 词。系统分别使用了连续密度和离散密度的 HMM 模型,并通过对 1000词意大利词汇的识别比较了两种模型的好坏,其识别率分别为75.8% 和67.1% ,该系统对31个字模板的非特定人的识别率是95.6% 。 我国的语音识别研究的起步要比先进国家晚一点,但是进步很快,成果突出。无限词汇的汉语听写机的研制首先由清华大学、中国科学院声学所于 1988年取得突破,四达公司等单位于90年代初推出了首批汉语听写机产品。在国家“863”计划的支持下,近几年来清华大学和中国科学院自动化所等单位研制的听写机原理样机,可用于非特定人连续语句读入,将有望开发成产品。三、毕业设计(论文)所采用的研究方法和手段:1.查阅相关文献,收集资料;2.与日常学习和实际生产相结合,合理设计、分析、计算;3.利用单片机编程软件,模拟软件proteus以及protel进行编程及实验;4.整理数据,借助单片机及C语言编程等相关知识完成软硬件设计;5.检查、分析、汇总。四、主要参考文献与资料获得情况:1李静,程安宇,陈卓. 51单片机C语言程序设计,20102陈海宴. 51单片机原理及应用,20103陈龙三. 声控计算机制作与入门,20014侯宝玉,陈忠平,李成群等. 基于proteus51系列单片机设计与仿真,2008 5张震字,王华. 基于凌阳单片机的语音识别技术及应用中文核心期刊,徽计算机信息(嵌入式与SOC)2007年第23卷第8-2期6刘少强,张靖.传感器设计与应用实例. 中国电力出版社 2009年1月7全国大学生电子设计竞赛组委会.第五届全国大学生电子设计竞获奖作品选编8雷思孝、李伯成、雷向丽编著. 凌阳16位单片机原理及应用.2004年1月9胡航. 语音信号处理.200010谭浩强. C语言设计(第三版).200711罗亚非等. 凌阳16位单片机应用基础.200312卢艳,黄云龙.一种声控车模系统的设计.201013徐理英.基于语音辨识的遥控小车
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 认购返利合同模板8篇
- 租房转租合同模板6篇
- 理货员岗位安全培训课件
- 迪庆木栈道工程方案(3篇)
- 玖龙纸业岗位安全培训课件
- 猫造型雕塑专业知识培训课件
- 德利矿业年产400万吨氧化钙、70万吨炼钢专用石项目(二期工程)环境影响报告表
- 防盗工程门加工方案(3篇)
- 狼崖山五壮士课件
- 顶梁美化改造工程方案(3篇)
- 血常规室内质控模板
- Welcome+unit +and+Expressions+单词讲解课件 【知识精讲精研】高中英语人教版必修第一册
- GB/T 43950-2024工业浓盐水回用技术导则
- 2024年出租车网约车司机从业资格证考试题库附参考答案【模拟题】
- “1+X”幼儿照护技能等级证书(中级)考试题库(多选、判断题)
- T-CUWA 20059-2022 城镇供水管网模型构建与应用技术规程
- 火电厂检修培训课件
- 核医学医学影像医技科室质量评估细则
- 观看《中国乒乓之绝地反击》观后感600字三篇
- YY/T 0698.5-2023最终灭菌医疗器械包装材料第5部分:透气材料与塑料膜组成的可密封组合袋和卷材要求和试验方法
- 小学生班干部竞选PPT模板
评论
0/150
提交评论