版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE28 基于单片机的声控灯的设计摘要随着时间的推移,随着越来越多的人对外部物质的需求量的增多,各种电器的使用量也在逐渐加大;而相对的对人们的动手能力以及创新能力的要求也就更高,各种仪器的灵活性也就越来越被人们广泛关注。虽然,变化骤然加剧了产品功能的多变性和方便性;但是却始终停留在人与机器之间手动交互的基础上,因此在功能上,虽然种类繁多,但始终是没有脱离手动的领域,从而限制了人与机器之间沟通的渠道。为了提高家电的应用性,同时也为了老人、残疾人对家电应用的方便性,就需要更好的信息交互手段。语言就是最好的交互手段,现阶段,随着对语音处理技术的日趋成熟,越来越多的人将发展的方向放在实现语音与机器交互的方面,而且已经获得了显著地成就。语音交互已经迈向了实用化的阶段,因此本文根据实际应用提出了一个以语音作为实现人机交互的方式,并简单设计了一套灯光控制的系统。本文重点阐述了系统的硬件构成、技术指标和功能要求,并给出了系统的总体设计结构,同时研究了关于DSP的硬件系统,并绘制了整个系统的设计图,详细说明了系统中的MCU模块,数据采集模块,电源管理模块和系统硬件复位模块的组成原理和设计思路。以上图形绘制均在protel99se软件上完成,结合实际芯片板对照排布,设计结束后可对灯光进行亮度调控。从而达到接受语音控制调控的目的。关键词:语音控制、数字信号处理ABSTRACTInrecentyears,themanualmeanswasusedforthehuman-computerinteraction,thenthecommunicationflexilitywaslimitedforcomputersystemandmachinesystem.Inordertoreformintercommunicationflexility,andmeettheelder’sorhandicapped’sneed,thebestmeansoftheinformationcommunicationwasneeded.Becauselanguageisthemainandbasiccommunicationmodeinpeoplesandthedigitalsignalprocessingsoftwareandhardwarehavebeendeveloped,uptonowthetechnologyoflanguageoperationhasbecomematurityandmaybeemployedinpractice,thenthispapergivethemodeaboutthehuman-computerinteraction,andthespeechcontrolsystemwasdesignedandusedfortheintelligencehouseholdelectricalappliances.Firstly,afterstudyingspeechsignalandaccordingtothedifferentpurposeanddesireforthesignalprocessing,themethodofthespeechsignalprocessingwasadvanced.Thenthepaperfinishedthedigitalsampling,thefront-endprocessingandtheblindsignalseparation.andallkindsofarithmeticweresimulated.Secondly,Thehardwareform,thetechnologyguidelineandthefunctionrequestareexpatiated,andthesystemcollectivityframewaspresented,thenthehardwaresystemwasdesignedbasedonDSPandthehardwarecircuitdiagramwasdescribed.TheMCUmodule,datacollectionmodule,thepowersupplymoduleandthesystemhardwarereplacementmodulewerediscussedindetails.Thirdly,thesystemsoftwarewasdesignedanddeveloped,andthetotaldesignideasofthesoftwarewereexpanded.Thesoftwaredesignandrealizedwerediscussedindetails,includingthedigitalofspeechsignal,theendpointdetectionandtheblindsignalseparation.Fourthly,basedonthespeechsignalprocessing,thecontrolrealizationofthespeechwasdesigned.Thesoftwareandhardwaremethodofcontroloperationwerepresented,andresolvethecommunicationandtheconnectioncircuitbetweenthecontrolpartandthesignalprocessingpart.InordertovalidatethenicetyandthevalidityofthearithmeticforthetotalcontroIsystem,thesoftwaetestwasfinishedbasedonemluatorandtheemulationalboardinCCSsoftware.Thedesignofthesoftwareandhardwarecancommonlybeusedforthespeechcontrolsystem,andthehouseholdelectricalappliancecanfreelyapplythisspeechcontrolsystem.Keywords:speechcontrol:digitalsignalprocessing
目录第一章绪论 41.1选题背景 41.2语音控制技术的研究现状 51.3单片机控制电路的设计 61.3.1单片机的概述 61.3.2单片机的特点 61.3.3单片机串行通信技术 71.3.4硬件电路板制作 71.4项目主要内容和实施技术路线 81.4.1、项目的主要内容和整体设计思路 81.4.2、作者承担的主要设计工作 91.4.3、本文主要研究内容 9第2章语音控制系统的总体设计 102.1语音控制应用的难点分析 102.1.1、语音控制的可靠性问题 102.1.2、实用化的解决 112.1.3、界面的有好程度 112.2系统总体设计 112.2.1、系统设计的基本要求 112.2.2、系统总体设计方案及硬件系统设计 112.3语音处理系统总体软件设计 142.3.1、软件设计的基本思想 142.3.2、软件设计总体结构 15第3章语音控制器硬件设计 183.1MCU模块 183.1.1、数字信号处理器选择 183.1.2、TMS320VC5402主要功能和外围电路 193.2数据采集模块 213.2.1、模数转换实现的硬件基础 213.2.2、数据采集硬件电路设计和主要功能描述 223.3、隔离模块设计 24第4章总结 264.1课题研究的主要成果 264.2课题展望 26参考文献 27第一章绪论1.1选题背景随着科学技术的进步,随着人们对物质需求的加大,越来越多的科学产品也推陈出新,针对满足消费者方便、快捷、实用等功能创造出了许多自动化机器,这些机器能根据固定的工作模式以最快的速度完成人们的需要。各种设计遍布在各种领域,工业控制、农业生产、日常生活或者科学探索。而长期以来,这些高端的技术产品,它们内部的机电系统与智能系统都是以人通过键盘、按键的形式才能表现出来,而它们的运作过程也是通过显示器等方式反映运行状态。目前,人们最典型的人际交互模式就是“手动对话”,通过手动操作来运行各种机器以达到想要的结果。虽然,系统的流程是方便了很多,但是,却间接地把人与系统通过中间的介质限制在近距离面对面空间作业上,所交换的信息也是数字量或者以数字量所表现的形式。这种手动的人机交互模式大大的限制了人机系统交流的灵活性。当然,为了提高工业系统、家电系统等范围的智能化,在人际交流方面就需要寻求最好的信息交互手段。语言是人们最常用的交流手段。在日常生活中,人们通过语言传播大量的信息,而语言也是信息载体中承担信息量最大的信号,结合了高智能化和灵活性的特点,让使用智能系统能够达到看、听、说、能感觉的目标是目前人机交互的发展方向,其中语音就是最好的人机交互方式,相对其他方式来讲,语音交互有着无可比拟的优势,语音作为人机交互的手段能够使人机对话转化为人人对话,可以填补人机对话的空白。语音操控模式具有一定的便携性和一致性,让人机交互界面变得更加自然、直接。虽然这一系统还在开发阶段,没有做到普及,但是这一技术的实现必将给给类智能系统和人类生活产生巨大的编号。目前,语音系统的发展处在各种电子技术的平台上,电子技术的革新对未来几年内的进步起着不小的作用。例如在半导体技术的发展使得原来在巨型机上才能运行的语音系统得以在微机上发展,再有软件技术的不断演进,像语音技术的核心算法,例如噪音消除、声学模拟、语音模型的选取与建立、特征库的建立,还有自适应算法都得到长期的发展。随着软硬件的逐渐演化和提高,结合语音技术的融合发展,相信以后的语音技术将会走进工业、家电、医疗、通信等各个领域,最后达到无处不在的地步。1.2语音控制技术的研究现状DSP数字信号处理从十七到十八世纪开始,到今天已经在很多领域得到了长期应用,像语音通信、语音传输、声纳、雷达、地震学、数据通信、生物医学等工作领域都有显著的应用。现阶段,数字信号处理技术本身在算法、设计工具、仿真和设计思想上以及硬件结构上也都在不断发展。特别是自1980年以来,DSP芯片的飞速发展更是让人乍舌。DSP芯片又称作数字信号处理器,是一种适合于数字信号处理芯片的微处理器。能够快速实现数字信号处理算法。语音技术便是加载在数字信号处理上的一种技术。语音技术也有它的发展史。最早的语音技术就是“自动翻译电话”,而它也是语音识别技术的先驱者,自动翻译电话包含了语音识别、自然语言理解和语音合成三部分。语音识别的技术研究最早可追溯到20世纪50年代的AT&T贝尔实验室,贝尔实验室推出了可识别十个英文数字的语音识别拨号Andrey系统。而接下来60年代,在计算机技术广泛应用与语音技术中提出了动态规划和线性预测技术。70年代,语音技术的研究又有了突飞猛进的发展。经过了十几年的研究,线性预测和动态规划技术也基本成熟,而且提出了矢量量化和隐马尔可夫模型,80年代,随着神经网络的二次高潮,语音识别技术的研究对象也逐渐集中化,主要将目光放在人工神经元网络和隐马尔可夫模型方面,其中马尔可夫模型是语音识别技术中最广泛应用而且也是最成功的研究。著名的IBM公司在1984年就是首次展示了有5000个词汇的语音识别系统。90年代,语音识别系统就更加成熟,并且逐步走向了应用。商业化的大量词汇量连续语音识别系统开始推向市场,逐渐将语音识别的应用重点放在电话语音识别上,如航班查询,保险锁等。IBM的viavoice和dragondictation就是其中的代表。、以这两种使用的语音电子信息已经在iphone上有了应用。目前,语音技术的研究方向是集中在生理学与自然语音处理与语音识别技术的结合、跨语种多平台语音识别、自然语音处理等方面。语音技术经过半个多世纪的发展,目前已经在多个领域取得成就,已经面向实用阶段。在信息领域,语音技术用于给计算机发送指令、听写系统的创建、实现信息查询系统和网上语音交流等;在教育和商务领域,语音技术被用于语音教学软件,语音查询和电子商务等;在消费类电子产品领域,语音导航系统,语音家电控制系统等。现阶段,语音处理技术在我过也已经取得了长足发展。2005年10月,中文语音技术交互技术标准工作组审议通过《中文语音合成系统通用技术规范》和《中文语音识别系统通用技术规范》。这两项标准详细规定了中文语音合成系统的术语定义、系统分类及中间数据的传输格式CSSML(中文语音合成标记语言)、中文语音识别技术的术语定义、系统分类、性能测试和语音输入输出规范等。根据这两项标准的指导,目前国内语音技术已经应用于30多个行业。像科大讯飞,在银行、电信、电力、政府信息服务等多个领域形成了典型应用,例如科大讯飞在上海天津的劳动保障信息服务热线的系统建设及应用。中信科利通过三家VAR(增值服务商)将语音技术应用于中国电信、中国网通、中国移动的20个省的语音呼叫服务上。08年的“数字奥运”,语音技术被用于实现“面向奥运多语言信息服务体系”的目标,这是一套基本实现任何人在任何时间任何地点都能够安全、方便、快捷、高效的获取可支付、无语言障碍、人性化的信息服务系统,比且具有一定的学习记忆能力。虽然今天语音技术还知识初步阶段,但是随着各项语音技术的日趋成熟,未来语音技术的应用还会更加广泛。1.3单片机控制电路的设计1.3.1单片机的概述单片微型计算机(简称单片机,又称微控制器)作为微型计算机家族中的一员—发展中的一个分支。它不是完成某一个逻辑功能的芯片,而是将微处理器(计算机的中央处理单元CpU—CentralproeessingUnit)、一定容量的RAM和ROM以及I/O接口、定时等电路集成在一片芯片上。概括的讲:一块芯片就成了一台计算机。它的体积小、质量轻、价格低廉、为学习、应用和开发提供了便利条件。1.3.2单片机的特点MCS一51是Intel公司最早推出的51单片机,其代表产品就是8051系列单片机,其代表芯片包括8051、8031、8052、8032、8751和8752。以后的单片机多兼容8051,例如STC89C51,它的内部结构和8051相似。其主要有微处理器、RAM、ROM、I/O口、串行口、定时/计数器、中断系统及特殊功能寄存器组成,在设计时可以满足控制要求。单片一机属于集成芯片,它除了具有集成芯片的特点外还有许多特点。(l)高度集成,体积小、制作方便。单片机内部集成CUP、内存、1/0口,保证控制功能的实现,双列直插40引脚的单片机尺寸大约只1.srnmxsrnrn,贴片式单片机的尺寸大约有小纽扣大小,给设计制作电路带来了方便。(2)灵活性好、可靠性高。在设计电路时,单片机的最小系统就可以提供电路工作所需的时序,因此在设计电路的时候,只要根据具体要求扩展外围电路就可以达到要求。单片机的工作电压是SV,在单片机内固化不同的程序,实现的功能,它的误差就会控制在可控范围内。(3)易于扩展ROM、RAM等资源,用途广、价格低。单片机的资源一般可以满足小系统的应用,若系统较大,单片机可以扩展资源,它有便于扩展的结构及控制引脚,利用它们容易构成各种规模的单片机系统和单片机应用系统。每片STC89C52单片机的价格大致在8元左右,对于学生和大多数研究开发人员可以承担其开发经费。1.3.3单片机串行通信技术单片机与单片机,单片机与计算机之间进行信息互相传递,主要通过电线连接,而电线连接的接口就是单片机进行外部通讯的主要部件。单片机通信可以分并行通信和串行通信。并行通信按数据的位数分配导线,每位一根导线,数据同时传送出去,传输速度快,但是由于这种通信需要大量的导线,当传输距离远或者信息量大的时候,传输数据的干扰大,架设导线需要的投资也很大,所以在非必要情况下不采用这种传输方式,而采用串行通信。串行通信的载体就是串行口,这种方式采用按位传输,每次发送/接收一位,需要一对导线就可以实现通信,传输速度没有并行通信快,但是传输距离远,传输数据的准确性较高,降低成本。1.3.4硬件电路板制作电路设计自动化(ElectronieDesi,Automation,EDA)指的是计算机协助完成电路设计中的各种工作,比如电路原理图(Schematic)的绘制、印制电路板(PCB)的设计制作、电路仿真(Simulation)等工作。随着电子技术的发展,大规模、超大规模集成电路的使用,使PCB板设计越来越精密和复杂。Protel系列软件是EDA软件的突出代表,它操作简单、易学易用、功能强大。AltiulnDesigne:是Protel99sE和Protel2004的继承版,但是它自身还加入了高端的功能打破了传统Protel的绘制电路图操作的界限,而且更加智能化,加入了嵌入式集成芯片电路的设计,加入了3D的显示效果,操作起来更加方便。总结起来,它具有如下的特点:(l)通过设计档包的方式,将原理图编辑、电路仿真、PCB设计、FPGA设计及打印这些功能有机结合在一起,提供了一个集成开发环境;(2)提供了混合电路仿真功能,为设计实验原理图电路中某些功能模块的正确与否提供了方便,并提供布线前后的信号完整性分析功能;(3)提供了丰富的原理图元器件库和PCB封装,并且为设计新的器件提供了封装向导程序,简化了封装设计过程;(4)提供了层次原理图设计方法,支持“自上向下”的设计思想,使大型电路设计的工作组开发方式成为可能;(5)提供了强大的查错功能。原理图中的ERC(电气规则检查)工具和PCB的DRC(设计规则检查)工具能帮助设计这更快地查出和改正错误;(6)完全兼容Protelgs、Protel99、Protel99SE、ProtelD”,并提供对Protel99SE下创建的DDB文件导入功能,以及OrCAD格式文件的转换功能;(7)提供了全新的FPGA设计功能,这是以前的版本所没有提供的;(8)完整的板级系统设计平台。AltiumDesigner6.。是业界第一款也是唯一一款完整的板级设计解决方案。AltiumDesigner6.o拓宽了板级设计的传统界限,集成了FPGA设计功能,允许用户将系统设计中的FPGA与PCB设计集成在一起;(9)支持多种文字(中文、英文、德文、法文、日文);(10)允许用户交互式地执行并调试验证基于逻辑可编程芯片的系统设计。1.4项目主要内容和实施技术路线1.4.1、项目的主要内容和整体设计思路项目研究和设计中,有硬件部分,同时也有软件部分,但总体一共可分成三个部分:前端处理部分、语音识别部分和最后控制部分,在前端处理部分中,主要任务是对采集的混合语音信号按帧实现语音信号的净化处理,精确测定哪一帧信号才是语音信号的开始端和结束端,实现从采集的混合信号中分辨出包含语音的信号段,提供后续便于识别的语音信号,提高识别精度。语音识别部分是本控制系统的关键部分,识别的精确度将直接影响控制动作的执行情况。在语音识别部分中,首先按帧实现语音信号特征提取,在训练工作模式下得到语音识别的参考模型库,在识别模式下通过与参考模型库中信息的模板匹配,再做出识别决策。得到识别结果。识别部分做出的识别决策将直接决定控制决策。在控制部分中,根据控制决策来实现对被控制对象确定的控制操作。项目实施过程中由另外一位同学和本人共同负责完成,设计中,本人主要完成硬件部分,也就是控制部分,在对方完成语音识别系统的软件同时,需要与本人的硬件部分结合,从而完成整个设计。1.4.2、作者承担的主要设计工作项目实施中本组人主要是分工设计,对方软件主要是设计语音信号的采集、去噪处理、检测语音信息的起始点和结束点、并从多信号源的混合信号中得到个信号源的估计信号。而本人主要是负责硬件部分,硬件部分主要是针对各个功能设计电路及焊接系统板,如下:①语音信号的接收、语音信号的放大及纯化和各个部分接口电路设计及对语音信号处理芯片的选型等。②完成语音家电语音控制部分硬件电路设计,主要包括:语音控制系统硬件框架构建、控制芯片选型、语音识别电路与语音控制电路之间的接口电路设计,实现语音识别模块和控制模块之间的实时无误差通信。1.4.3、本文主要研究内容本文是对本人在大学期间理论学习和实际工作的概括总结。文中详细介绍了项目实施中涉及到的基本理论、算法和整个系统的结构设计,包括了针对实际控制对象的所有软件设计思想和硬件设计电路图。第1章,绪论。叙述了课题的选题背景,阐述了语音技术在当今科学领域中的作用和地位,给出了语音控制技术在实际应用中的价值和课题的研究意义。第2章,语音控制系统总体设计方案。阐述了语音控制在实际应用中的主要问题以及本项目中所采用的解决方法,给出了系统软件设计和硬件设计中的总体设计思路。第3章,语音控制系统的信息处理。简单概述了语音控制系统在目前应用中各个环节的解决方法,及软件部分使用的算法等。第4章,语音控制系统的硬件实现。重点且详细给出了本系统各个组成部分的硬件设计,在研究本系统功能要求的基础上,分别给出了MCU子系统、数据采集子系统、控制实现子系统、电源管理子系统和复位子系统的硬件设计思想。最后,对本文的研究成果进行了总结和展望。第2章语音控制系统的总体设计2.1语音控制应用的难点分析语音技术作为一项比较典型的高新技术研究,具有技术含量高、覆盖面积广、影响广、产业化前景好等特点,是信息技术人机接口的关键技术,并已逐步成为IT只能产品的至高点。但是,语音控制系统存在以下难点,而使得语音技术并不完善,而本文正是针对这些难点选择一些比较实用性的算法,相对的在硬件设计的过程中也会结合软件的理论应用在设计思路上。2.1.1、语音控制的可靠性问题首先,作为语音录入,最主要的问题当然就是环境噪声对语音控制系统可靠性的影响。在实验室中,相对的环境比较安静,但是,其他场合中,各种环境的噪声及说话的语音室不可避免的,噪声破坏了语音信号原有的声学特征和语音模型,模糊了不同语音之间的差异性,造成语音质量下降。人可以能动的从噪声和众多话语中获取自己所需要的特定信号。摒弃噪声和不相关信息。但是对与机械系统和计算机系统,以这种方法是不可能能动实现的,这些环境噪声和背景声音信号极大的限制了语音控制系统的控制精度和稳定性,这主要表现在两个方面:其一,有效信号不能被语音控制系统及时、准确的捕捉,从而使控制操作不被执行或错误执行;其二,语音控制系统从众多无效的语音信号中有可能捕捉到“有效”的语音信号,从而发生动作不当的情况。实验表明,用语法标准、词语普通的非专业词,语音识别的精度与信噪比的关系为:当噪声较小的时候(SNR>15dB),语音识别的的正确率也较高,则相应的控制精度也会较好;但是随着噪声在信号中所占有的比重的增加,则识别的正确率也有所下降。其次是说话人不同,说话的习惯也就不同,对语音信号的影响也就各不相同。人们日常生活和工作中的说话具有随意性,大多数人用自然音,而且每个人的发音习惯也不相同,不同情绪造成的发音也会不同,例如生气、伤心、高兴、口音、更正、咂嘴、咳嗽、不受语法限制等。针对这些不同人的说话习惯就得要求语音控制系统具有较高的自适应能力。2.1.2、实用化的解决一个语音控制系统,给出的结果必然要符合人们的说话习惯,满足人们的实际控制需求,控制操作能够被人们所理解。而识别的结果是否合理,在很大的程度上取决于系统的语言处理能力。实际上,由于同音不同字的普遍存在和协同发音带来的影响,人类语音的声学混淆现象是不可能仅仅利用声学知识完全消除的。这就要求识别系统可以利用语言学知识来修正声学混淆所引入的错误,从而改善系统的识别性能。但是,我们所利用的语言是活的语言,是发展的语言,正因为我们对语言本身的分析和解释理论还很不完善,而且还不断有新的词汇、新的用法出现,因此,对自然语言的处理是一项非常困难的技术,尚有待于人们长期而艰苦的努力。2.1.3、界面的有好程度人机交互界面,是计算机科学和认知心理学两大科学结合的产物,人机界面存在于用户和硬件之间,更主要的是体现在用户与软件之间,因为比起硬件,用户更常常与软件打交道。介于人机界面有好的要求,语音控制系统的操作要简单、易学、易掌控、控制动作反映迅速、响应合理,在有些环境和操作中还要求对当前控制动作执行做出回答这就要求用语通俗、语义明确易懂。2.2系统总体设计2.2.1、系统设计的基本要求(1)完成声音信号量的采集,最终转换成方便处理的数字量(2)对完成转换后的数字量进行必要的语音数字信号前端处理。(3)从接收到的混合信号中得到便于识别的语音数字信号。(4)能够从信号中识别出确定的控制信息。(5)实现控制信息所规定的控制操作,并反馈当前控制操作的执行情况。(6)确保整个控制系统实时性,准确性,可靠性和稳定性。(7)整个控制系统做到相对通用性,能够方便地实现在不同控制对象之间的移植。2.2.2、系统总体设计方案及硬件系统设计2.2.2.1硬件系统抗干扰设计影响系统工作稳定性的因素主要有来自系统内部和外部的各种电气干扰,同时还要受到系统本身所采用的元器件材料、制造工艺和系统结构设计的影响。在电路设计前应充分考虑电路抗干扰设计要求,系统设计中对干扰问题的解决主要可从以下几个方面着手。切断干扰电源切断干扰源的方法主要包括二极管隔离、门电路隔离、光偶隔离、电磁隔离等。高频干扰噪声和有用信号的频带不同,可以通过在导线上增加滤波器的方法切断高频干扰噪声的传播,有时也可加隔离光耦来解决。在输入输出通道上通过光耦合器件传输信息可将系统与各种传感器、开关、执行机构从电气上隔离开来,阻挡很大一部分干扰。②屏蔽抗干扰对于通过空间辐射传播到敏感器件后引起的干扰,也可以采用敏感器件上加屏蔽罩、接地等方法解决。例如对于高频电源、交流电源、强电设备、电弧产生的电火花,甚至雷电,都能产生电磁波,从而成为电磁干扰的噪声源,用金属外壳将器件包围起来,再将金属外壳接地,其对屏蔽各种通过电磁感应引起的干扰非常有效。硬件滤波采用这种硬件滤波法能够很好的抑制传输线路中的噪声和工频干扰,起到很好的抗干扰作用。RC低通滤波器可以大大消弱各类高频干扰信号(如各类“毛刺”干扰)。A/D转换用隔离放大器或采用现场转换的方法实现,既可以减少误差,又可减少模拟端和现场信号对于数字信号的影响。电路板抗干扰设计电源线加粗,合理走线、接地;对于闲置的I/O口,不要悬空,要接地或接电源。IC器件尽量直接焊在电路板上,少用或不用IC座;合理分区,如强、弱信号区,数字、模拟信号区:尽可能把干扰源与敏感元件远离。2.2.2.2硬件系统总体设计基于DSP的语音控制系统主要包括两个主要模块:语音信号处理模块和控制模块,本系统中的开发重点在语音信号处理模块中,各种相关主要信号处理算法都要在此模块中实现,本文的讨论部分也是以硬件为主,软件为辅着手说明。控制模块主要是实现对被控制对象的各种控制操作,同时还完成与语音信号处理模块之间的实时无误差通信过程。从语音控制设计的实际和软件算法实现要求出发,本系统中语音接收采用两个麦克风,对所得到的模拟语音电信号进行放大,接收的语音信号在ADC之前设置带通滤波器实现反混叠滤波,再经过TI公司的TLC320AD50C作为数据采集芯片产生数字语音信号。语音信号经过前端处理后可以被识别子系统所识别,识别出的控制信息被控制子系统获得后实现具体控制操作。对所采集语音数据和系统的软件采用FLASH存储器保存。在整体系统设计中还设置了硬件复位和电源管理子系统,硬件模块的整体结构见下图。原始混合信号原始混合信号麦克风模拟信号信号放大带外噪声消除模拟信号模拟信号控制实现电路数据采集子系统数字信号MCU识别子系统FLASH系统硬件复位子系统电源管理子系统与控制子系统的接口电路对电路设计中未用引脚都需要做相应的处理。否则,整体系统运行时可能会出现无法预知的问题,在硬件电路设计时需要对这些引脚做适当处理。(1)未用的输入引脚不能悬空不接,而应将它们上拉或下拉为固定的电平,以降低功耗,避免干扰信号引入电路或芯片中。(2)关键的控制输入引脚,例如DSP芯片的Ready、Hold等,应固定接为适当的状态,Ready引脚应固定接为有效状态,Hold引脚应固定接为无效状态;(3)无连接(NC)引脚:除非特殊说明,这些引脚可悬空不接;(4)保留(RSV)弓I脚:应根据数据手册具体决定接还是不接;(5)未用的输出引脚可以悬空不接;(6)对于未用的I/0引脚,如果缺省状态为输入引脚,则作为非关键的输入引脚处理,上拉或下拉为固定的电平;如果确省状态为输出引脚,则可以悬空不接。2.3语音处理系统总体软件设计2.3.1、软件设计的基本思想对于一个控制系统,必须要软硬件结合才能得到最终完美的结果,硬件的板子设计与软件的程序设计一个都不能少,虽然本次毕设本人的主要着重点在硬件方面,但是相对的软件的一些基本设计思路还是需要补充和说明的。因为对于硬件系统来讲,软件系统的方便与以及使用的灵活性不仅可以发挥硬件的性能,还可以解决硬件系统中的不足,提高整体系统工作的稳定性、可靠性和抗干扰能力,在不改变硬件的前提下使系统灵活多变的满足各种应用需求。尤其是现在,软件编写的界面越来越人性化,各种实际算法越来越成熟,软件编写效率越来越高,同时,现阶段在各项电子技术高速发展的推动下,各种微处理芯片的性能也大幅度提高,这都为编写实时性好、功能性强的软件系统提供了条件。而且最重要的是在不更改硬件的同时进行软件实用化的升级,更节约了成本。依据本项目应用中实际要求和借鉴其他前辈软件设计经验,在本软件的编制过程中遵循了以下基本思想。(1)优良的人机交互能力在实现语音控制操作的过程中,既包括现场操作人说出命令的过程,也包括了MCU系统获得数据、处理数据和最后作出操作动作的过程,甚至还包括了机器在动作完成后使用语音“回答具体的动作情况”,在语音识别系统中也要区分特定人和非特定人、关键词和一段话语音识别。(2)控制操作的准确性和实时性DSP系统对数据的接收、应用算法对数据进行处理、控制操作的实现以及不同微处理器系统之间的通信等过程都要求软件设计的准确性和实时性。在硬件设计确定后,可以在软件系统设计中通过算法选择、简化算法和优化代码等方法保证控制操作的准确性和实时性。(3)系统稳定、有序并可控地运行智能控制器系统必须完成许多不同功能的任务,这些任务发生有先后顺序,不同微处理器有不同的功能要求,不同芯片工作在不同频率,控制任务有优先级区别,这些都是整体系统可能不稳定工作的潜在威胁。(4)可扩展性、灵活性和可插入性设计的软件系统要允许代码修改平稳发生,例如新的功能或特性很容易加入到系统中、对一处的修改不会涉及到很多其他模块、抽出一个类或组件、插入其他的类或组件等等。可扩展性、灵活性和可插入性的软件思想。使得软件设计必须是面向对象的模块化设计,提高系统的复用性。2.3.2、软件设计总体结构本智能语音控制系统软件设计可分为控制应用模块、两微处理器之间通信控制模块、不同算法实现模块和硬件电路驱动模块。控制应用层控制应用层微处理器之间通信控制层语音识别层信号预处理层底层硬件驱动层A/D存储器系统初始化底层硬件驱动层相对而言是最直接的硬件操作层,因此与硬件所要实现的功能特征密切相关,例如现场语音模拟量采样、对存储器的读写、整个系统初始化和硬件复位、人机接口的管理和控制动作的实施等。底层硬件驱动层使得硬件与更高级的软件系统分开,其它软件层所需要的数据来源于底层硬件驱动层,同时又通过底层硬件驱动层完成具体控制动作。同时又因为底层硬件驱动层的隔离作用,是上层算法实现具有在不同应用中的可移植性。信号预处理层包括信号的分帧加窗、端点检测和混合语音信号的盲源分离等。从底层硬件驱动层采集的语音数据通过这一层后,混合信号变化为分立的“单个人声音信号”、按帧保存且适合后续算法实现的格式。语音识别层在整个控制系统中起到至关重要的作用,在这一层中实现从去噪、分离后的单个语音信号中得到有效的控制信号。语音识别层中也包括控制命令识别语音标准库的建立,这是在语音识别训练模式下、在实验室无噪声环境中建立的~个标准库。当工作在语音识别模式时。对语音信号中控制命令的准确获取就是依据这个标准库得到。微处理器之间通信控制是连接DSP和AT89C5l两块MCU应用层的功能根据不同具体将实现的控制要求确定。在应用层中,依据语音识别层得出的信息与存储系统中所保存的训练模式时确定控制信息对比,得到具体控制操作后再通过底层硬件驱动层驱动硬件动作。整体软件设计流程见下图。整个软件系统设计由两大部分组成:识别标准信息库建立过程的训练模式和正常工作中时的语音识别控制模式。这两大部分的共同之处是都包括从接收到的信号中得到语音段起始点和结束点、语音信号预处理等信号前段处理部分。由于本人的设计是硬件部分,因此在这里只是简单的介绍一下。
第3章语音控制器硬件设计根据系统的总体硬件设计方案,基于DSP芯片TMS320Vc5402设计了整个硬件系统,系统的主要功能模块包括MCU模块、数据采集模块、控制电路实现模块、滤波模块、隔离模块、电源模块、硬件复位模块。3.1MCU模块3.1.1、数字信号处理器选择数字信号处理是一门涉及许多学科而又广泛应用于许多领域的新兴学科。它是利用计算机或专用处理设备,以数字形式对信号进行采集、变换、滤波、估值、增强、压缩、识别等处理,以得到符合人们需要的信号形式。数字信号处理是围绕着数字信号处理的理论、实现和应用等几个方面发展起来的。数字信号处理在理论上的发展推动了数字信号处理应用的发展。反过来,数字信号处理的应用又促进了数字信号处理理论的提高。而数字信号处理的实现则是理论和应用之间的桥梁。MCU选用TI公司推出的数字信号处理器TMS320VC5402,这是一款定点数字信号处理器。它采用修正的哈佛结构,包括一个程序存储总线、三个数据存储总线和四个地址总线,这种结构允许同时执行程序指令和对数据操作,运行速度快,单周期定点指令执行时间10ns,远大于语音信号采集和处理的要求。其主要特性有:(1)增强的多总线:三个分立16位数据存储器总线和一个程序存储器总线;(2)40位的算术逻辑单元,包括40位桶形移位器和40位累加器;(3)17x17位并行乘法器连接到40位专用加法器,实现非流水线式单周期乘法累加运算;(4)比较、选择、存储单元,用于加法和比较选择;(5)指数编码器可以在单周期内计算40位累加器中数值的指数;(6)双地址生成器,包括8个辅助寄存器和2个寄存器算术运算单元;(7)最大外部程序存储空间寻址范围lMxl6bit;(8)4Kxl6bit片上ROM,16Kxl6bit片内双寻址RAM;(9)片上主要外围设备软件可编程等待状态发生器:一代有内部震荡器或外部时钟源的片内锁相环(PLL)时钟发生器;一两个多通道缓冲串口;8位并行主机接口(HPl8);6个直接存储器访问(DMA)控制器;两个定时器。(10)可用IDLEI、IDLE2和IDLE3指令控制功耗,以工作在省电模式;(11)CLKOUT输出信号可关断;(12)片仿真接口支持符合IEEEll49.1标准的JTAG口;(13)单周期定点指令执行时间10ns(100MIPS);(14)可用封装形式有144脚LQFP和BGA两种。3.1.2、TMS320VC5402主要功能和外围电路MCU子系统是硬件整体系统的核心,协调其他各子系统按一定时序工作,本系统主要功能如下:(1)控制数据采集模块,完成初始化数据采集子系统和语音数据采集;(2)控制语音识别子系统完成语音关键信息识别;(3)向控制模块发出语音识别子系统识别出的控制信息;(4)协调各子系统动作时序,针对事件的重要程度设置相应中断优先级;(5)完成系统上电时的BootLoader过程,完成整个系统初始化操作;(6)控制对存储系统的读、写和保护数据的操作;图形如下:管脚名称标号说明DVddDVdd给I/O管脚提供3.3v工作电压CVddCVdd给CPU提供1.8v工作电压VssGND接地NC无连接端X1、X2/CLKINY210MHz晶振接入端CLKMDl、2、3配置DSP芯片工作在PLLxl0A0~A15DSP-ADDR[0⋯15]最大寻址空间64KDO~D15DSPDATA[0⋯15]与外围芯片数据传输端口MP/MCGND接地使DSP工作在微计算机模式INTO~INT3DVdd本系统中无外界中断NMIDVdd开启所有不可屏蔽中断RSBRDRST#复位信号输入端R/WDSPR,WDSP对外部数据读写控制操作端BCLKR/X0、1DSP—SCLKl、2MCBSPI、2与AD50之间时钟同步信号输入BFSR,X0、1DSPFSl、2MCBSPI、2与ADS0之间帧同步信号输入BDR0、1DSPDOUTl、2MCBSPI、2从AD50读语音采样数据BDX0、lDSPDINl、2MCBSPI、2向ADS0写控制数据CLKOUTDSPCKLOUT给AD50提供主时钟信号HDO~HD7DSPHD[0⋯7]DSP与AT89C5lHCNTL0、1HCNTL0、lAT89C5l读写HPIC和HCSHCS产生对HPI的选通信号HR/WHR/W读写信号控制HPI的数据流向HINTHINT对AT89C5lHPIENAHPI通信模式选择始终为使能状态HDSl,2HDSl/2对AT89C5lHBILHBIL标志DSP和AT89C5lHASHAS信号下降沿提供HBIL、HCNTL0/I和HR/W的锁存HRDYHRDY=I表示HPI已经准备好给AT89C5l3.2数据采集模块3.2.1、模数转换实现的硬件基础在语音信号采集中,模拟信号向数字信号转化(ADC)的精度和实时性对后续信号处理和控制功能实现有至关重要的作用。本设计中采用TLC320AD50C完成语音信号的A/D转换。TLC320AD50C是TI公司提供的一款16位同步串口A/D和D/A转换芯片,ADC之后有一个抽取滤波器。其采样频率最高可以达到22.5kb/s,满足语音信号处理中关于采样频率的要求,并且可通过M/S脚的电平设置将TLC320ADSOC配置为主机或从机工作方式。TLC320AD50C的主要特征有:(1)采用16位过采样sigma.delta技术实现ADC和DACt(2)串型端口连接方式:(3)采样速率可通过DSP编程设置:(4)有两种数据传输模式:16位传输模式和15+I位传输模式;(5)对于ADC和DAC是典型的89dB的SNR;(6)检测模型包括数字模型和模拟模型两种;(7)可编程控制输入输出的增益;(8)一个TLC320AD50C主片最多可带三个从片;(9)具有片上锁相环;(10)采用两组模拟输入和两组模拟输出,共模抑制能力强。TMs320vC5402处理器具有两个多通道缓冲串口McBSP,可实现与工业标准的编码器、模拟界面芯片和其它串口器件通信,可直接与多种串口协议接口通信。MeBSP提供了全双工的通信机制,以及双缓存的发送寄存器和三缓存的接收寄存器,McBSP具有独立的输入、输出帧同步和时钟信号,且帧同步和时钟信号的极性可通过编程确定。双缓冲寄存器完成数据流的连续、全双工传输,可与多达128个通道进行收发,支持传输的数据格式可以是8bit,12bit,16bit,20bit,24bit或32bit,DMA可用于实现MCBSP对多帧、大量数据的传输。McBSP串口复位可通过DSP芯片硬件复位,也可使用软件独立复位。McBSP有7个管脚可用于外部数据通信,在时钟信号(CLKx和CLKR)和帧同步信号(FSX和FSR)控制下,利用DX脚完成数据发送、DR脚完成数据接收。通过控制寄存器SPCR[1,21和管脚控制寄存器PCR实现McBSP串口不同参数配置,接收和发送控制寄存器是RCR[1,2]和XCR[1,2]用于配置发送和接收过程的不同帧长和字长等。3.2.2、数据采集硬件电路设计和主要功能描述3.2.2.1模拟电信号获得本电路中采用的TLC2272A是TI公司生产的差分式运算放大器。用麦克风PHONE、采集得到语音信息模拟电信号,采集的模拟信号需要通过由TLC2272A组成的三级放大电路,TLC2272A输入端2IN.和2IN+之上分别加载采集到的模拟电信号与比较参考信号。为了消除电源信号变化对语音信号的干扰,在电源和地线之间都加了一个109F的去耦电容。去耦电容一方面消除电源噪声对电路的影响,另一方面旁路掉该器件的高频噪声,同时还有蓄能的作用。二级放大信号和三级放大信号分别作为两个差分模拟输入信号加载到AD50的INP和INM端,也即信号被输入到sigma.delta调节器。3.2.2.2模数转化电路设计模数转化子系统中AD50C外围电路见下图。在本项目中用AD50C得到16位数字语音信号,其模拟电压和数字电压输入分别采用5V和3.3V供电。因为信号的输入采用AD50C的INP和INM端,因此将AUXP和AUXM通过电阻接地。语音信号通过麦克风接到AD50C芯片,得到数字信号后再传送到DSP的MCBSP口,在这里AD50C不需要从片设计,因此将M/S脚接到高电平,即总是配置为主片模式。ADC后的语音信号数据通过DOUT脚输出到DSP,通过DIN脚实现来自DSP的初始化控制信号写入和读AD50C寄存器操作。同时还设置了与整个系统实现同时硬件复位信号BRDRST#。3.2.2.3模数转化前的高通滤波设计从麦克风进入电路的模拟语音信号包含有低频干扰,尤其是50Hz到60Hz的工频干扰。利用高通滤波器滤除这部分的低频干扰,将对与语音识别更为有用的高频信号部分的频谱进行提升,同时还可以起到消除直流漂移、抑制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年医务人员职业防护培训试题及答案
- 社区养老服务中心服务流程规范手册
- 供应商合作意向书签订生产部商洽函(9篇)
- 患者隐秘守秘责任承诺函3篇
- 投资项目回报确保承诺函(5篇)
- 工业生产过程记录模板
- 体育器材制造与销售行业品质控制指南
- 2026年保险改造仓储托管协议
- 2026年餐饮审计节能改造合同
- 沟通技巧提升训练手册
- 中通快递运输合同
- 西南大学PPT 04 实用版答辩模板
- 东北地区概况农业生产条件及农业发展
- 胃malt淋巴瘤临床与诊治进展
- 承包人实施计划及施工组织设计
- 马克思主义哲学十讲
- 血脂异常和脂蛋白异常血症病人的护理
- 《草船借箭》【市一等奖】
- 连续性血液净化设备技术要求
- 物流项目计划书
- 进展性脑卒中的诊疗策略课件
评论
0/150
提交评论