语音智能控制小车设计_第1页
语音智能控制小车设计_第2页
语音智能控制小车设计_第3页
语音智能控制小车设计_第4页
语音智能控制小车设计_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE7PAGE语音智能控制小车设计摘要随着现代技术的发展,语音并没有由于技术的发展而被取代,语音现在依旧是通信中最自然的通信媒介,同时语音也是现在比较有效、方便、简单、便捷的交互信息和控制方式。语音识别控制的根本意图就是能让机器能够理解人发出的命令并作出相应的控制,从而实现语音控制机器的目的。语音识别控制中语音识别技术是其中最为重要的技术之一,随着现代电子技术的发展和语音识别算法的发展,进一步发展了语音识别技术的实际应用。本课题中语音无线遥控采用了STM32F103C8T6单片机来控制,LD3320语音识别模块检测到用户发出语音指令后,STM32F103C8T6单片机与无线蓝牙模块共同配合发出对应动作指令给智能小车,当智能小车上MK60DN512ZQL单片机连接的无线蓝牙接收到动作指令时,单片机按照对应指令策略和PID控制系统,采用PWM波来控制智能小车的电机以及舵机,从而智能小车实现前进、后退、左转、右转、停车、加速、减速等操作,通过实际测试表明:语音智能控制小车能够较好的识别语音指令同时控制智能小车完成对应的动作。关键词:语音识别;LD3320;智能小车;PIDABSTRACTWiththedevelopmentofmoderntechnology,voicehasnotbeenreplacedbythedevelopmentoftechnology.Voiceisstillthemostnaturalcommunicationmediumincommunication.Atthesametime,voiceisalsoamoreeffective,convenient,simple,andconvenientwayofinteractiveinformationandcontrol.Thebasicintentionofvoicerecognitioncontrolistoenablethemachinetounderstandthecommandsissuedbypeopleandmakecorrespondingcontrol,soastorealizethemotherofthevoicecontrolmachine.Speechrecognitiontechnologyisoneofthemostimportanttechnologiesinspeechrecognitioncontrol.Inthistopic,thevoicewirelessremotecontroliscontrolledbytheSTM32F103C8T6single-chipmicrocomputer.AftertheLD3320voicerecognitionmoduledetectstheuser'svoicecommand,theSTM32F103C8T6single-chipmicrocomputerandthewirelessBluetoothmodulecooperatetoissuethecorrespondingactioncommandtothesmartcar.WhenthesmartcarisconnectedtothewirelessMK60DN512ZQLmicrocontrollerWhentheBluetoothreceivestheactioncommand,thesinglechipcomputerusesthePWMwavetocontrolthemotorandsteeringgearofthesmartcaraccordingtothecorrespondingcommandstrategyandPIDcontrolsystem,sothatthesmartcarcanrealizeforward,backward,left,right,parking,acceleration,deceleration,etc.Operation,theactualtestshowsthatthevoiceintelligentcontrolcarcanbetterrecognizevoicecommandsandcontrolthesmartcartocompletethecorrespondingactions.Keywords:Speechrecognition;LD3320;Smartcar;PID目录摘要 IABSTRACT II目录 III第1章绪论 11.1.1课题背景 11.1.2课题研究的意义 11.2语音识别研究现状 21.3本文完成的主要工作 4第2章语音识别工作原理 52.1语音识别的基本原理 52.2语音识别方法 5第3章系统硬件组成及其原理 93.1系统概述 93.2小车机械结构 93.3LD3320语音识别模块 103.4语音无线遥控 113.5智能小车主控 113.6电路设计 123.6.1最小系统板供电 123.6.2舵机供电 123.6.3蓝牙供电 123.6.4驱动电路模块 13第4章系统软件设计 154.1语音无线遥控 154.2PID算法 164.2.1位置式PID 174.2.2增量式PID 184.2.3PID参数的整定 184.3智能小车 18第5章系统设计主要特点及结果 205.1系统设计特点 205.2系统设计结果 20结论 21参考文献 22致谢 23附录 24第1章绪论1.1课题背景及研究的意义1.1.1课题背景人类发明和创造机器以来一直有一个迫切的愿望:能够实现人与机器的对话,实现人机交互的目的,随着计算机技术和语音识别技术的共同发展,现在人类的这一愿望得以实现。伴随着语音识别技术的不断发展和进步,语音识别技术吸收了众多科研领域的理论知识,有着一个庞大的知识体系,目前语音识别技术是一门新的交叉学科,它不仅包括了语音信号处理、声音学,还包括了模式匹配、数学、信息理论、语言学、计算机科学等领域。随着语音识别技术的不断发展,无论是实际应用和理论研究都获得了巨大的进步,已被广泛的运用各种生活和科学领域。在当代生活中,通过语音识别完成机器控制,完成一些原本较为复杂的工作,让工作不仅简单快捷同时节约时间成本、人力成本,例如:语音控制家居、语音翻译助手、语音控制驾驶等很多方面。语音识别控制的根本意图就是能让机器能够理解人发出的语音命令并作出相应的控制,从而实现语音控制机器的目的。语音识别控制的基本原理是具有语音识别功能的机器接收人发出的语音指令后,首先把语音这种模拟信号转为数字信号,并按照一定的语音识别算法进行处理后,根据得出的指令按照设定完成不同操作控制,从而实现语音控制。1.1.2课题研究的意义进入21世纪以来,语音识别技术从发明到现在一直备受关注,因为目前语音识别技术被视为实现人机交互通信关键技术与主要方向。随着越来越多产品搭载语音识别技术的出现和应用,从侧面印证了语音识别有很大的市场前景,同时能够语音识别能够应用的领域很广泛。随着时代的进步和技术的不断发展,自动化驾驶已经不再是遥不可及,未来自动驾驶将成为现实,自动驾驶则无需驾驶者亲自操作,语音控制驾驶相较于其他自动驾驶方式更便捷和可操作。由于电子技术的迅猛发展,电子芯片的性能越来越强,系统可以集成运行在电子芯片上,基于电子芯片的语音识别处理前景广阔,受到了很多关注。本课题的目的就是研究语音识别智能控制技术,语音智能控制小车集成了语音识别技术和自动控制技术,让人通过近距离语音信号实现对汽车的操控成为可能。在课题设计中体现人机互动性以及智能性,通过缩短人机距离体现出人机一体化的设计思想,同时引入自动控制技术共同形成机器智能,使其自动感知、自动决策、以及自动执行。无论是在提高生活水平方面还是计算机技术发展方面,语音识别控制的研究有着极其深远的意义。随着语音识别技术和自动控制技术的深入研究,语音识别控制将会取得巨大的突破,发展前景越发广阔。1.2语音识别研究现状语音识别技术从发明以来由于技术原因并没有现在热门,深度学习的出现和发展促进了其他很多技术的发展进步,其中就包括了语音识别技术。虽然通过它提高了语音识别的准确性,但是由于技术原因未能做到各领域的应用,但是也为我们提供了一种人机交流的方式。语音识别,又称为自动语音识别,英文是AutomaticSpeechRecognition,缩写为ASR,由于机器无法听懂人说话的内容,需要将人说话的内容转变为机器可读的语言或者符号,然后再将机器可读的内容输入到计算机中进行识别判断。我们一般认为语音识别只是语音识别技术的一种,即语音转为文本,简称语音转文本识别SpeechToText更合适。语音识别是一门覆盖了多门学科的交叉学科,覆盖了数学与统计学、声学与语言学、计算机与人工智能等基础学科和前沿学科,是人机自然交互技术中的关键环节。借助于深度学习的出现语音识别发展迅猛。使用环境是影响语音识别精度的主要因素,在较为适合的环境下语音识别的精度高达百分之九十五以上,基本可以识别大多数内容,从侧面验证了机器有了较高的语音识别能力,从而使语音识别技术变得风靡一时。随着语音识别技术的进步,噪声以及其他影响因素不再影响语音识别的精度,随着语音识别技术巨大进步和不断成熟,具有语音识别功能的智能音响开始走进了千家万户。由于语音交互提供了更自然、更便利、更高效的沟通形式,语音必定将成为未来最主要的人机互动接口之一。目前语音识别技术也不能做到十全十美,在识别距离较远、噪声干扰大、连续语音内容识别情况下还有巨大的改进空间;同时多人需要进行语音识别的情况下和没有网络实时运算识别的情况下也急需改进和解决。目前虽无法做到各领域的完全应用以及十全十美,因为语音识别技术具有巨大的前景,我们对其仍然抱有很大的期望,希望更加深入的研究能够解决现在的制约因素。目前,语音识别框架还是由3个部分组成:声学模型、语言模型和解码器,由于各种新技术的出现为声学模型提供了新的解决办法,将新技术融入到声学模型是现在的主流方向,其中就包括了神经网络、深度学习等新技术。依托各种新技术各公司争相提出自己的声学模型,在不同方面较传统的声学模型均有巨大进步。由于中文语音识别的复杂性,国内针对中文语音识别的研究较其他国家更深入,主流方向都是更深更复杂的神经网络技术融合端到端技术。其中科大讯飞提出DFCNN声学模型,DFCNN使用大量的卷积直接对整句语音信号进行建模,该方法主要借鉴了图像识别的思想,每个卷积层使用小卷积核,并在多个卷积层之后再加上池化层,通过累积非常多卷积池化层对,从而可以看到更多的历史信息;随后阿里巴巴提出LFR-DFSMN,该模型将低帧率算法和DFSMN算法进行融合,语音识别错误率相比上一代技术降低20%,解码速度提升3倍。FSMN通过在FNN的隐层添加一些可学习的记忆模块,从而可以有效的对语音的长时相关性进行建模。而DFSMN是通过跳转避免深层网络的梯度消失问题,可以训练出更深层的网络结构。后来百度的SMLTA模型横空出世,该模型是在LSTM和CTC的基础上引入了注意力机制来获取更大范围和更有层次的上下文信息。其中流式表示可以直接对语音进行一个小片段一个小片段的增量解码;多级表示堆叠多层注意力模型;截断则表示利用CTC模型的尖峰信息,把语音切割成一个一个小片段,注意力模型和解码可以在这些小片段上展开,联网情况下该模型语音识别率比之前提出的模型有百分之十五的提升。语音识别另外两个技术部分:语言模型和解码器,相较于之前没有声学模型进步巨大。语言模型主流还是基于传统的N-Gram方法,虽然目前也有神经网络的语言模型的研究,但在实用中主要还是更多用于后处理纠错。解码器的核心指标是速度,业界大部分都是按照静态解码的方式进行,即将声学模型和语言模型构造成WFST网络,该网络包含了所有可能路径,解码就是在该空间进行搜索的过程。因为该技术比较成熟,只是需要根据实际使用情况进行优化即可,所以解码器并没有受到过多关注和研究。1.3本文完成的主要工作语音识别控制小车作为自动化驾驶典型应用之一,让语音智能控制在无人驾驶方面能够得到实际应用,在课题设计中体现人机互动性以及智能性,通过缩短人机距离体现出人机一体化的设计思想,同时引入自动控制技术共同形成机器智能,使其自动感知、自动决策、以及自动执行。课题主要工作如下:要实现通过对语音样本的训练、语音数据的采集、识别,并将识别结果作为指令对小车的行驶状态进行控制,实现人通过近距离语音信号对汽车的操控。研究语音识别控制的总体设计,采用模块化思想设计各部分方案,确定语音智能控制小车拟要实现的功能:当人发出语音指令时,语音识别模块开始识别语音指令,识别指令后按照相关设定通过无线蓝牙将指令发给智能小车执行,智能小车接收到语音无线遥控发出的指令后,按照相关设定执行指令控制智能小车的电机以及舵机,让智能小车完成相应的指令操作,通过语音指令来控制智能小车的状态。让语音智能控制小车具有指令识别准确、精准控制、响应速度快、抗干扰能力强等优点。

第2章语音识别工作原理2.1语音识别的基本原理语音识别的基本原理是采集声音指令这种模拟信号,滤除无关的声音以及噪音,将模拟信号转为数字信号后,经过一系列语音算法来提取信息,然后根据信息进行查询和对比,最后做出相应的操作或反馈。无论是基于计算机还是单片机,第一步都是针对语音进行预处理,通过预加重、反混叠滤波、端点检测、噪声滤波等处理过程,用以去除声门激励、口鼻辐射、高于1/2采样频率的高频和噪声信号的影响,将声音这种模拟信号转为机器识别处理的数字信号。数字信号再通过一定的语音算法进一步提取特征参数,这些提取到的特征参数组合成为特征矢量序列。特征矢量序列主要包括了:时域参数、频域参数、声道的形状函数、随机模型的概率函数、量化矢量等,最后通过对比声音的标准模式库,进行搜索和对比相似度,相似度最高的就是识别结果。2.2语音识别方法语音识别简单来说就是人发出语音命令后识别机器能明白人的指令,根据指令做出相应的操作或者反馈,语音识别的基本原理是采集声音指令这种模拟信号,滤除无关的声音以及噪音,将模拟信号转为数字信号后,经过一系列语音算法来提取信息,然后根据信息进行查询和对比,最后做出相应的操作或反馈。语音识别系统包含预处理、声学模型和搜索比较三个主要步骤。语音识别主要分为两个步骤:第一步是“训练”或“学习”阶段,通过一定的语音识别算法和机器学习建立语音特征参数模板,将得到语音特征参数模板建立模型,通过同样的方法建立声学模型和语言模型;第二步是“识别”或“测试”阶段,模拟信号转为数字信号后,通过特定的处理算法提取相应特征,按照一定的准则与之前建立的标准模型进行匹配比较,通过比较匹配出最符合的作为识别结果。语音识别的第一步就是进行预处理,由于噪音会对声音识别造成较大的干扰,所以预处理模块首先滤除原始语音信号中的次要信息及背景噪音等,包括抗混叠滤波、模/数转换、自动增益控制等处理过程,把语音这种模拟信号转变为数字信号;数字信号再通过一定的语音算法进一步提取特征参数,这些提取到的特征参数组合成为特征矢量序列。语音识别系统常用的特征参数有短时平均幅度、短时平均能量、短时频谱等。特征提取和选择是构建系统的关键,对识别效果极为重要。由于语音信号本质上属于非平稳信号,目前对语音信号的分析是建立在短时平稳性假设之上的。在对语音信号作短时平稳假设后,使用窗函数将语音信号变成短片段后进行特征提取。这些短时片段被称为帧,以帧为单位的特征序列构成语音识别系统的输入。由于梅尔倒谱系数及感知线性预测系数能够从人耳听觉特性的角度准确刻画语音信号,已经成为目前主流的语音特征。为补偿帧间独立性假设,人们在使用梅尔倒谱系数及感知线性预测系数时,通常加上它们的一阶、二阶差分,以引入信号特征的动态特征。 声学模型处于语音识别中重中之重的地位。声学建模涉及建模单元选取、模型状态聚类、模型参数估计等很多方面。在目前的LVCSR系统中,普遍采用上下文相关的模型作为基本建模单元,以刻画连续语音的协同发音现象。在把语境等因素考虑进来,因为需要添加各因素相关的声学模型,模型数量大大增加,LVCSR系统通过一定的算法将各因素相关的声学模型进行压缩处理,通过这种方式减少模型的训练。通过训练来进行特征提取,把提取的特征参数组合形成特征矢量序列,然后由特征建模模块建立训练语音的参考模式库。常用的声学建模方法包含以下三种:基于模式匹配的动态时间规整法(DTW);隐马尔可夫模型法(HMM);基于人工神经网络识别法(ANN)等。DTW是较早的一种模式匹配的方法。动态时间扭曲是用于测量可能在时间或速度上变化的两个序列之间的相似性的算法。DTW已应用于视频、音频和图形。实际上,任何可以转换为线性表示的数据都可以使用DTW进行分析。一个众所周知的应用是自动语音识别,以应对不同的语速。通常,它是一种允许计算机在具有某些限制的两个给定序列之间找到最佳匹配的方法。也就是说,序列被非线性地“扭曲”以彼此匹配。它基于动态规划的思想,解决孤立词语音识别中的语音信号特征参数序列比较时长度不一的模板匹配问题,DTW通过计算已预处理和分帧的语音信号与参考模板之间的相似度,再按照某种距离测度计算出模板间的相似度并选择最佳路径。HMM是对语音信号的时间序列结构所建立的统计模型,是在马尔可夫链的基础上发展起来的,它是一种基于参数模型的统计识别方法,HMM可模仿人的言语过程,对语音识别系统而言,HMM的输出值通常就是各个帧的声学特征。为了降低模型的复杂度,通常HMM模型有两个假设前提,一是内部状态的转移只与上一状态有关,一是输出值只与当前状态或当前状态转移有关。HMM模型还存在着一些理论上的假设,其中之一就是,它假设语音是一个严格的马尔科夫过程。HMM受欢迎的另一个原因是因为它们可以自动训练并且使用起来简单且计算可行。在语音识别中,隐马尔可夫模型将输出一系列n维实值向量(假设n=10)10毫秒输出一个这些向量。矢量将倒谱系数组成,倒谱系数是通过对短时间语音窗口进行傅里叶变换并使用余弦变换对频谱进行去相关而获得的。然后取第一个系数。隐马尔可夫模型将倾向于在每个状态中具有对角协方差高斯的混合的统计分布,这将给出每个观察向量的可能性。每个单词,或对于更一般的语音识别系统,每个音素,将具有不同的输出分布;通过将单独训练的隐马尔可夫模型连接成单独的单词和音素,制作用于一系列单词或音素的隐马尔可夫模型。以上描述的是最常见的基于HMM的语音识别方法的核心要素。许多系统使用所谓的判别训练技术,其省去了对HMM参数估计的纯粹统计方法,而是优化了训练数据的一些与分类相关的测量。示例是最大互信息(MMI),最小分类错误(MCE)和最小电话错误(MPE);ANN以数学模型模拟神经元活动,将人工神经网络中大量神经元并行分布运算的原理、高效的学习算法以及对人的认知系统的模仿能力充分运用到语音识别领域,并结合神经网络和隐含马尔可夫模型的识别算法,解决了ANN在时间方面的问题,与HMM相比,神经网络对特征统计特性的显式假设较少,并且具有多种特性使其成为语音识别的有吸引力的识别模型。当用于估计语音特征片段的概率时,神经网络允许以自然且有效的方式进行辨别训练。虽然有些方面略有成效,但是由于时间因素的影响不能连续进行识别。目前语音识别使用声学建模方法最为广泛的即是人工神经网络识别法(ANN)和隐马尔可夫模型法(HMM)俩种。搜索时在一定范围情况下,根据设定的搜索规则,寻找在该范围内的最优结果。搜索的目的就是在指定的范围内寻找最优解,搜索的身影出现在了各种领域。它在语音识别中通过利用已掌握的声学知识、语音学知识、语言模型知识等,在从声学模型、HMM状态中找到最优的状态序列。最终的词序列是对输入的语音信号在一定准则下的一个最优描述。通过搜索之前提取的标准模式中,通过标准模式进行参考比较,最终选择相似度最高的即为识别结果。仅有搜索对比是远远不够的,还需要针对识别结果做进一步的处理才能保证识别率,包括通过Lattice重打分融合更高元的语言模型、通过置信度度量得到识别结果的可靠程度等。在人为约束的条件下,使识别的正确率大大提高。第3章系统硬件组成及其原理3.1系统概述智能小车车模选用轮式结构,底盘采用全国大学生智能汽车竞赛指定的C型车模,车模的两个前轮由连杆连接并通过舵机拉伸控制来实现转向控制,车模的后轮为两个独立的直流电机以及齿轮共同配合来提供小车的动力。语音智能小车由语音无线遥控和智能小车共同组成,其中语音无线遥控由STM32F103C8T6为主控芯片,对语音识别模块LD3320进行配置以及识别信息进行判别扫描,根据识别内容按照设定通过无线蓝牙将指令发送给智能小车;智能小车上的作为主控采用MK60DN512ZQL10单片机,通过无线蓝牙接收语音无线遥控的指令,根据蓝牙接收到的指令内容,按照设定规则策略组合控制车模电机及舵机,让其按照语音命令实现前进、左转、后退、右转、停止等指令动作。图1系统组成3.2小车机械结构小车采用舵机来控制转向,舵机的安装方式有俩种,分别是立式舵机和卧式舵机,由于智能小车的主控板安装会占用一定的空间,以及对转向性能的不同要求,对车模上的舵机采用符合实际的安装方式。通过大量查阅相关资料和实际操作对比中发现,卧式舵机相较于立式舵机比较迟钝,而且较立式舵机输出力矩较小,它的最大的优点就是占用空间小,由于智能小车要求转向灵活且快速,因此卧式舵机的安装方案不符合设计要求,所以课题中舵机安装方式选用立式。由于舵机设计之初其转动速度和功率已被固定,想要实现车模转向则需通过舵机拉伸连杆才能实现,要想语音控制时加快转向机构的响应速度,舵机的安装方式和舵机连杆的长度尤为重要。功率等于速度乘上力矩,由于功率固定,速度和力矩需要分配合理,否则会出现追求速度而损失力矩,或者出现力矩过小的情况,造成小车转向迟钝。所以安装舵机时需要到相应速度和力矩的关系,综合实际情况不断进行改进,从而小车实际转向时满足设计要求。小车采用直流电机提供动力,直流电机通过齿轮与车轮进行衔接,车轮上的齿轮和直流电机上的齿轮间隙对小车运行有着很大的关系,因为齿轮间隙直接影响了小车的运行状态,当齿轮传动的间隙过小导致齿轮咬合较紧时会大大增加电机驱动后负担,当齿轮传动的间隙过大导致齿轮咬合不紧密时产生打齿同时伴有噪音产生。在安装过程中,保证齿轮之间良好的咬合,这样保证了动力的平顺传递,同时也对齿轮进行了保护,这样保证了小车运行时不会产生较大噪音对语音识别时形成较大干扰。3.3LD3320语音识别模块本课题的语音识别模块采用了LD3320模块,LD3320模块采用了非特定人语音识别技术,该技术能让识别有很好的适用性和广泛性,因为需要将模拟信号和数字信号互为转换,故模块上的LD3320芯片集成了ADC和DAC,具有语音输入和输出接口,因为要对语音信号进行处理所以该模块上处理器内置了语音识别算法,为了储存语音识别算法还集成了Flash。由于模块上的处理器算力有限,故将语音样板提前内置在存储器中直接进行对比。该模块的原理为:首先通过模块上的麦克风将语音信号采集下来,再通过内置的ADC进行数模转换,根据内置的语音识别算法提取特征参数,再与内置的语音识别模板进行搜索比较,如果出现相似度最高的就是识别结果。主要功能如下:1.模块支持动态编辑识别内容,应对不同场景直接编辑对应的识别内容,这样可以做到灵活转换,识别内容只需编辑对应词组或者字的拼音,但是当识别内容是词组时,词组中的每个字后面需要加空格,其中词组长度不应超过10汉字。2.该模块具有睡眠模式,睡眠模式下可以减少模块耗电,提高续航能力。3.该模块有两种连接方式:串行和并行连接,由于串行连接占用管脚较少适用于管脚较少的场合,可根据不同情况灵活选择。4.该模块由于方便输入和输出,内置了高精度的DAC和ADC,同时拥有语音输入和输出接口便于麦克风和喇叭扩展。3.4语音无线遥控语音无线遥控采用主控芯片为STM32F103C8T6,该芯片最高频率可达72MHZ,芯片采用了ARMCortexM-M3的内核,芯片上有着丰富的IO端口,芯片上不仅有常用的模数转换、数模转换、SPI串行接口、UART等接口,同时还有定时器以及比较器等,可以实现较为复杂的需求。主控单片机STM32F103C8T6的端口直接与语音识别模块直接相连,LD3320的语音芯片具有并行数据传送与串行数据传送俩种传送方式,并行数据传输的速度比串行数据传输的速度更快,但是占用单片机IO口资源较多,串行数据传输采用SPI协议,只占有4个单片机IO口且STM32单片机自带硬件SPI接口,可以直接用SPI读写命令操作LD3320芯片。无线蓝牙也是直接与无线蓝牙进行连接,直接使用STM32单片机的UART接口,通过无线蓝牙将命令发给智能小车。3.5智能小车主控智能小车的主控板采用MDK60DN512ZVLQ10单片机,MDK60DN512ZVLQ10属于原飞思卡尔公司的Kinetis系列,该系列采用Cortex-M4内核作为控制器内核,该芯片运行频率可达100MHz,同时可根据需要进行超频,最多可以超到180MHz。该芯片具有较大的存储空间,其中SRAM为128KB、Flash为512KB,该芯片不仅包含了常用的DAC、ADC之外,还有不同的定时器、FTM模块、I2C模块、LPTMR模块等,IO接口也十分丰富可以应对不同场景。板子上设计了最小系统板供电电路、同时也通过FTM接口与驱动电路相连实现对小车电机进行控制,无线蓝牙通过UART端口与MCU电路相连实现接收指令。3.6电路设计3.6.1最小系统板供电本课题采用MK60DN512ZQL10芯片作为主控芯片,该芯片为3.3V供电,在设计时针对单片机进行3.3V单独供电,单独供电的原因一是K60芯片对供电电压比较敏感,当电源纹波较大时容易复位,二是由于K60芯片作为控制的核心,对小车的正常运行至关重要,将其与其余供电模块隔离开来,防止其余供电模块对其造成干扰。在设计时需要将电池电压降为3.3V,在稳压芯片的选择上,考虑到纹波大小以及稳定性等因素结合实际应用,为使单片机正常工作,最终采用LM2937作为稳压芯片。3.6.2舵机供电舵机一般可采用5V或者6V进行供电,在设计前查阅大量资料对比得出,当舵机采用5V电压时,可以延长使用寿命,但是此时响应速度较慢,当发出语音命令时,舵机响应速度跟不上;当采用6V供电时,舵机响应速度加快,舵机响应速度加快,可使小车响应速度加快同时小车转向更为灵敏。通过对比俩种方案优劣后,决定选择采用MP2307同步降压稳定器以及可调电阻组合,实现可调电压,根据不同情况选择不同电压,提高供电的灵活性。3.6.3蓝牙供电蓝牙模块采用5V供电,设计时采用LM2940稳压芯片,直接将电池电压7.2V降为5V。LM2940芯片有着防过流保护和防过压保护以及电压反接保护,同时该降压电路组成较为简单,只需要LM2940和两个电容共同构成5V稳压电路,其中两个电容分别为470uF、0.1uF,该稳压电路具有热损失小、供电稳定、滤除高频、降低电源内阻、压损较小等优点,同时由于LM2940上具有散热的铜片,所以无需考虑散热问题。3.6.4驱动电路模块目前直流电机的驱动方式有如下两种:第一种是直接选用集成电机驱动芯片来驱动直流电机,第二种是选用专用的栅极驱动芯片和N沟道的MOSFET共同组合形成驱动电路来驱动直流电机。目前集成电机驱动芯片一般采用Freescale的33886芯片,主要因为该芯片具有过流、过温、欠压保护,能够很好的保证驱动的稳定性,同时性能较强其他芯片。经查阅该芯片最大工作电流为5安,同时内部的电阻仅为120毫欧。虽然使用集成驱动芯片比较简单可靠,但是该集成驱动芯片的内阻大大高于使用的电机内阻,从而会使电枢总电阻有所增加,由于电机受电枢总电阻的影响不能完全发挥其全部性能,故不太满足本课题设计要求。而采用栅极驱动芯片和N沟道MOSFET组成的驱动电阻,电枢总电阻降低了很多,直流电机性能能够充分的发挥。同时选用的栅极驱动芯片具有良好的导通性能,能够大大提高N沟道MOSFET的开关速度,由于本课题中电机驱动控制采用了PWM,该组合可以有效地提高PWM的频率,通过提高PWM的调制频率来减少电枢中的电流脉动。同时该芯片具有良好的稳定性和可靠性,同时还具有防同臂导通、硬件死区和欠电压保护等功能,根据以上分析,本课题选择采用第二种方案进行设计。MC34063开关电源芯片使用较为广泛,同时芯片效率较高于其他同类芯片,即使输入和输出的压降相差较大时工作效率也不会有所降低,故该芯片的发热较小不需要专门的散热器,同时该芯片体积较小不会占用过多的位置,该芯片内部主要为振荡器、比较器和驱动器等等,该芯片可以用来设计升压、降压、电压方向电路,在本课题中采用MC34063作为升压芯片,将7.2V电池电压升至12V电压。本课题中驱动芯片选用IR2104,该芯片性能较为良好且稳定可靠,该芯片在驱动时可以提供较大的驱动电流,两片IR2104型半桥驱动芯片和N沟道MOSFET芯片即可构成驱动电路,该驱动电路可以防止同臂导通和硬件死区的情况出现,该驱动电路被称为H桥式电路,通过该驱动电路可以实现电机的正转和反转,完成课题的前进和后退指令要求。综上所述,由于功能完善满足课题要求,同时性能符合要求,故选择IR2104驱动芯片。由于需要两片半桥驱动芯片和N沟道MOSFET组合才能构成驱动电路,本课题中驱动电路芯片优先选择耐压值高、导通电阻低以及封装尺寸较小。其中耐压值的选择与所用电源有很大关系,因为电机有时处于再生发电状态,所以选择耐压值较高的芯片,一般耐压值只需高于需用电源的两倍即可,本课题中的电源电压为7.2伏,芯片电压只有高于16V即可。由于导通电阻对电机性能是否充分发挥有着巨大的影响,一般导通电阻越小越好。同时封装尺寸和功率以及栅极电荷成正比关系,相同电阻情况下封装越大功率和栅极电荷则越大,这两个因素会大大影响导通速度。通常的MOSFET封装有TO-220、TO-252、SO-8等,其中LR7843型N沟道MOSFET较为符合课题要求,Vdss=55V、RDS(on)=8.0毫欧、ID=110A。第4章系统软件设计4.1语音无线遥控语音无线遥控中语音识别过程主要由LD3320语音识别模块和主控单片机共同完成,由于LD3320模块的芯片只负责识别和处理语音信号,然后把识别结果放在寄存器中存储,想要完成对LD3320模块的任何操作只能通过寄存器。比如需要对LD3320模块写入设置关键词列表时,首先在程序中写入关键词的拼音然后将程序下载到主控中,主控芯片再通过串口写入到对应寄存器中。LD3320语音识别模块寄存器的读写方式共有有两种:一种是并行方式,占用较多的接口但是传输较快;另一种是串行方式,速度较慢于并行方式但是占用接口较少。图2语音无线遥控程序流程图针对语音无线遥控,由于LD3320语音识别模块以及无线蓝牙分别与STM32F103C8T6的SPI端口和UART端口相连,故在软件程序上需要对相应端口的管脚进行初始化配置,同时根据各器件要求进行中断配置,然后对LD3320语音识别模块进行初始化配置,一般对初始化ASR时需要多启动几次防止硬件故障,如果检测正常接下来需要将关键词添加到LD3320芯片中,同时检测添加状态,如果发现LD3320识别模块的状态不正常时通过主控单片机重启芯片,重新开始之前的流程。如果LD3320识别模块的状态正常的话则运行ASR运算。ASR运算结束后通过寄存器读取识别结果,根据读取到的识别结果安装设定的策略执行,将对应的指令通过无线蓝牙发送给智能小车,完成一次流程。程序上具体操作顺序为:根据数据手册,首先将RTSB管脚拉低,然后在对CS管脚先发送低电平然后再发送高电平,激活DSP处理芯片。然后进行语音识别操作顺序为:向LD3320写入关键词列表,为每一个关键词设定一个编号,编号为8位可自由编辑是否连续,编号相同或不相同并不造成影响。至多可以设置50个关键词,程序中关键词只需写其小写拼音即可。当语音识别模块听到指令开始会进入预设的中断程序,在中断程序中读取相关寄存器的值从而得到识别结果,一般识别时会根据相似度进行比较,取相似度最高的作为识别结果;如果采用查询方式进行识别,在麦克风采集到声音后,读取并查询相应的寄存器,一般识别成功后该寄存器会返回一个21H的值,接下来也是进行相似度比较然后取相似度最高的作为识别结果。由于语音识别模块是非特定语音识别,识别成功后进行相似度比较,取相似度最高的作为识别结果,由于该原因与关键词类似音调的词语会导致相似度有时会高于其他结果,从而导致出现误识别。在程序上我们还需进行添加垃圾词语来解决该问题,垃圾词即语音识别模块中的关键词音调类似的词组,当设置垃圾词后不做任何操作。例如设置的关键词是“打开风扇”,当语音识别模块识别到“打开风扇”后启动风扇等。那程序上为:“打开风”、“打开风扇啊”等与关键词类似音调的垃圾词进行设置,当识别到这些词组时不做任何操作和处理。我们称这些词组位垃圾词,因为识别后不做任何操作和处理,只是用来避免关键词被干扰,从而提高了语音识别的抗干扰和准确率。4.2PID算法PID调节主要有比例、积分、微分三部分来控制。PID控制器70年前就已提出理论并应用,PID控制器依靠结构简单、稳定性好、工作可靠、调整方便这些优点,至今依然作为重要的控制技术。当被控对象的结构和参数不能完全掌握,或得不到精确的数学建模时,控制理论的其他技术难以采用时,系统控制器的结构和参数必须依靠经验和现场调试来确定时,这时应用PID控制技术最为方便。即当我们不完全了解一个系统和被控对象,或不能通过有效的测量手段来获得系统参数时,最适合用PID控制技术。PID控制,实际不一定都是PID控制,根据使用情况也会选择PI或者PD控制。PID控制器是一种线性控制器,它根据给定值与实际输出值构成控制偏差,将偏差的比例(P)、积分(I)、微分(D)通过线性组合构成控制量,对被控对象进行控制,故称PID控制器,原理框图如下所示。图3PID原理框图PID控制器各控制环节各司其职,所以各环节有不同功能:比例环节,按照比例设定反馈实际值与目标值之间的偏差,如果实际值与目标值之间的偏差不为零,控制器马上作用来减少实际值与目标值之间的偏差;而积分环节主要用于系统消除净差,提高无差度,积分时间常数对积分作用有着很大的影响,它们之间为反比关系:积分时间常数越强而积分作用越弱,反之积分时间常数越弱而积分作用越强;微分环节,则反馈实际值与目标值之间的偏差变化速率,际值与目标值之间的偏差变太大前,让系统提前开始修正偏差,由于提前修正了偏差减少了调节时间,加快系统反应速度。数字PID控制算法主要分为位置式PID控制算法、增量式PID控制算法。4.2.1位置式PID位置式PID中,由于计算机输出的u(k)直接去控制执行机构,u(k)的值和执行机构的位置是一一对应的,所以通常称公式为位置式PID控制算法。位置式PID控制算法的缺点是:由于全量输出,所以每次输出均与过去的状态有关,计算时要对过去e(k)进行累加,计算机工作量;而且因为计算机输出的u(k)对应的是执行机构的实际位置,如果计算机出现故障,u(k)的大幅度变化,会引起执行机构位置的大幅度变化,这种情况往往是生产实践中不允许的,在某些场合,还可能造成严重的生产。因而产生了增量式PID控制的控制算法,所谓增量式PID是指数字控制器的输出只是控制量的增量u(k).4.2.2增量式PID增量式PID控制算法,一般计算机控制系统采用恒定的采用周期T,一旦确定了Kp、Ti、Td,只需要使用前后三次的测量值偏差,即可由公式求出控制增量。增量式PID具有以下优点:由于计算机输出增量,所以误动作时影响小,必要时可用逻辑判断的方法进行关掉;手动、自动切换时冲击小,便于实现无扰动切环。此外,当计算机发生故障时,由于输出通道或执行装置具有信号的锁存作用,故能保持原值;算式中不需要进行累加,控制增量的确定仅与最近k次的采样值有关,所以较容易通过加权处理而获得比较好的控制效果。但是增量式PID也有一些不足的地方:积分截断效应大,有静态误差;溢出的影响大。一般为了避免这些缺点通常选择带死区、积分分立等改进PID控制算法。综上所述,增量式更加适合智能小车,故采用增量式为小车的舵机和电机控制算法。4.2.3PID参数的整定PID控制的关键是在于选择合适的参数,通过调整合适的Ki、Kd、Kp三个参数能使PID更好的控制,即PID参数整定。在实际应用中PID参数的整定方法分为两种:一种是依据对系统建立相应的数学模型,通过对数学模型进行理论计算,从而确定PID控制参数;另一种是依赖实际经验的参数整定方法,该方法一般从控制试验中来进行参数整定,该方法一般适用于不方便数学建模的场合,由于该方法简单有效、方便获取,所以该方法实际中广泛采用。由于智能小车要建立精确的运动控制模型有一定难度并且与实际有一定误差,故采用了依靠实际经验的参数整定方法,通过不断的实验积累经验来调整合适的参数。4.3智能小车智能小车的主要工作即为接收语音无线遥控的指令,根据这些指令,控制舵机、电机等完成对应指令要求动作。MK60DN512ZQL10共有3个独立FTM端口,每个FTM端口有8个通道,舵机和俩个直流电机各使用一个端口,系统采用PWM波来实现直流电机的正反转以及舵机转向控制。程序上流程如下:首先对需要使用的各管脚进行初始化,然后针对各管脚进行功能配置,然后进行中断配置,设置串口的中断向量表优先级,当UART端口接收到无线蓝牙接受的指令时进入中断,同时判断接收指令,根据该指令通过使用PID算法,然后对舵机和电机发生成对应PWM进行控制,完成一次语音识别控制。图四智能小车流程图第5章系统设计主要特点及结果5.1系统设计特点(1).系统采用STM32F103C8T6单片机和MK60DN512ZQL10单片机,这俩款单片机可靠性高,抗干扰能力较强,单片机频率高,保证了系统的实时性。(2).系统硬件均采用了模块化设计,可以提高系统的可扩展性,同时方便对各模块进行调试。(3).将语音智能小车分为语音无线遥控与智能小车,由于小车在执行命令完成前进等操作中,小车行驶中产生的噪音会对语音识别的距离和距离造成较大影响,故将语音识别模块分离出来将识别结果通过无线蓝牙发送到小车上,大大提高了抗干扰。(4).针对语音模块的特点,由于语音识别模块使用了非特定语音识别技术,同时根据内置语音算法寻找最为相似的词作为识别结果,为了减少发音造成的干扰我们需要添加与关键词音调相似的词组,对这些音调相似的词组不进行任何处理和操作,这些音调相似的词组识别到后不会起任何作用,只是用来避免干扰关键词,从而提高了语音识别的抗干扰和准确率。(5).舵机和直流电机均采用PID算法和PWM波控制,提高了系统的精确性、稳定性、高效性等。5.2系统设计结果本课题设计的语音智能控制小车,语音无线遥控能够对人发出的语音命令进行识别,同时将命令发送给智能小车

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论