版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
无人机的语音辨认与控制系统的硬件设计案例目录TOC\o"1-3"\h\u30261无人机的语音辨认与控制系统的硬件设计案例 1125511系统总体设计 140222硬件电路设计 3301212.1飞控硬件模块选用及作用 4285422.2无线传输模块选用及作用 4107232.3语音识别模块的选用 4169472.4无人机语音指令控制终端设计 595302.4.1处理器的选择及作用 5125302.4.2供电电路的设计 613642.4.3麦克风放大电路的研究 881282.4.4LCD显示及触摸屏驱动的设计 10202762.5姿态测量及主控模块的设计 13134082.6无线传输系统的设计 1669662.6.1无线传输模块接口配置 1643112.7实现语音控制姿态 181系统总体设计无人机的语音辨认与控制系统的设计有两个方面:一是硬件和软件。它的硬件架构主要有四个部分:动力系统模块、姿态感知系统、控制系统、wifi模块、空气动态感知装置;软件设计组成部分以万维网中的语音识别语法规范1.0标准(下文缩写为srgs1.0)作为技术基础,先以abnf格式的文档完成了语音识别,识别的结果由软件自动进行信号处理,匹配后可自动生成一个相应的控制指令,利用移动手机端的wifi模块的特性将信号通过wifi发送到无人机。uav端通过ticc3200wifi模块直接接收到控制命令,驱动电机由stm32f3进行控制,完成了用户所需要的相应命令。该传感器控制系统通过无人机姿态融合算法和控制算法对各种无人机的转速和运动情况进行了调整,并根据传感器群感知无人机的实时状态数据(飞行姿态、高度、方向等)对其进行人工语音控制,从而实现对无人机的人工语音控制。对于整体系统设计流程图,如图2-1:图2-1系统设计原理流程图图2-2为飞控主控制器系统整体电路图。图2-2飞控主控制器系统电路语音识别工作流程:大致可以分为四个大部分:语音接收,特征提取,分析语言模型,解码输出。对于具体的语音识别部分的工作流程图如图2-3所示:图2-3语音识别流程图本文中的语音控制系统中包含语音录入模块,语音识别模块,标准指令库模块,所述的语音识别模块分别与功能控制模块和标准指令库模块连接。其工作逻辑是:识别转换模块识别语音的信息,并将所述语音信息与所获取的标准指令库模块内的标准指令进行比对,获取对比结果,并向所述功能控制模块发送所述比对结果,是通过WiFi模块进行发送的,识别转换模块和所述功能控制模块之间通过总线信号连接,然后功能控制模块再根据比对结果执行对应的功能操作。与比对结果对应的功能操作包括:操作无人机显示屏对应显示,通过无人机的总控系统对应控制无人机实现操作或操作无人机的电源管理模块。操作员通过手机上的Wifi模块连接无人机上的终端处理器,但是单单只有WiFi模块是不够的,还有状态同步器,位置在无人机接收系统与控制系统之间,它的作用是实时同步无人机控制系统获取到的无人机信息数据,并对所述无人机信息数据进行异常检测,且如果有异常能发出警告。本文中的硬件结构组成及作用:1动力部:为机构提供所需的动力2姿态感知部:在运动中可以进行一系列的动作姿态的改变3控制部:控制转速,高度,方向等4WiFi模块:使用WiFi模块进行接收控制指令5气动感知装置:用气压力驱动启闭或调节阀门的执行装置2硬件电路设计2.1飞控硬件模块选用及作用首先是对于飞控硬件模块的选用,我对于此部分设计选用了市场上很常用的F450四轴飞控模块作为无人机的机架,选用型号为SPRacingF.3的飞控板作为无人机控制器,选用这种型号的飞控板可以使得在无人技术研发应用中所自行研制的无人飞行机动姿态系统有着高稳定性、有确立的稳定点、进行定翻转等工作也非常方便。飞控模块硬件控制模块主要功能是专门负责对各种无人机的运动姿态与整体运动位置进行精确检测,控制各类专用无人机的运动转速与姿态运动,从而精确控制各种无人机各类专用电机的运动位置与姿态运动运行方向,负责WiFi模块(或GSM或Bluetooth模块)的通讯工作。2.2无线传输模块选用及作用UAV通讯模块可以直接选择wifi、gsm、蓝牙等模块作为通讯模块,与android终端进行通讯。gsm模块通讯效率较低;蓝牙模块则是通讯的距离较短,不太适宜于本设计的应用场景;而wifi模块的通信速率相对较高,因此选择WiFi模块。TICC3300WiFi模组的功耗极低,尺寸小,速度快且UART波特率可达3Mbps。无线传输模块的作用就是通过WiFi进行信号指令的传输工作。2.3语音识别模块的选用语音识别解决方案的种类也有很多种,如常见的le3320模块、isd等一系列的芯片模块以及pm等一系列的芯片模块,虽然都已经基本上具有了各种语音音频识别的技术和基本功能,但是实际上由于其使用较繁琐,除此之外现在pc等移动通信终端上的microsoft等应用程序所需要进行集成的各种语音音频识别处理功能虽然也被广泛地应用于本操作系统,但是在实际调试时却不难发现其使用效果并不好。相比之下可将安卓等移动手机作为语音数据识别的基础硬件,让操作员所需要执行的操作步骤大幅度减少,其中的开源语音数据资料更丰富,更全面,识别语音效果也做得更好,省去了繁琐的手机语音识别培训操作过程,更加适合本语音识别系统的硬件设计。图3-1为硬件设计框架。图3-1硬件框架2.4无人机语音指令控制终端设计2.4.1处理器的选择及作用本论文选用stm32f103作为其主芯片。作为嵌入式ARM处理器,它为实现MCU的需要提供了低成本的平台、缩减的引脚数目、降低的系统功耗,同时提供了卓越的计算性能和先进的中断响应系统。为整个语音控制系统的数据处理提供保障,提高运算速度,存储容量也相对充足。图3-2STM32F103内部及连接结构图如连接结构图3-2所示,是这款处理器的主要内部结构和在实际使用中可能遇到的外设连接情况,这款处理器理论上的定点运算执行速率大约可高达每秒9600万次的即时定点高速运算,不再需要搭载其他操作系统时,只有sram的元件使用量相对应的减小,片内64kb,无须其他外扩式的sram。在我们所有需要运行和使用的仪器芯片数量均为stm32f103zet6时,从一个flash中自动开始运行一个应用代码,主频被自动调至72mhz,除了需要再次使用运算器核心外,只要你还是需要再次打开我们所有的仪器和使用芯片得到的软件组成:fsmc、exit、定时器1、2、3,spi1、2、3、adc1等,实测得的输出和输入电流的电流量范围大约是46ma(2.3v标准输出电压),功耗也相对比较低。使用一个模拟信号采样器是at9912的麦克风配合一个模拟信号采样放大器和一个控制电路,将10mv左右的微弱数字音频的信号进行采样放大到1.5v左右,提供给每个模拟信号芯片一台使用一个自带12位数的adc主机对其进行模拟视听和数字音频的信号采样。处理器对各个数据库信号进行了多次语音识别辨认和数据处理后,将语音识别的数据结果直接显示出来在一个lcd上,与基于lcd的各个数据库信号进行了通讯,并且采用了fstm32的接口fsmcd的数据接口。利用该处理器上的spi的通信端口和主控电阻屏上的adi口转换器芯片相互连接ads7843通信端口用于直接实现一个移动式自动触摸式按键,语音指令控制终端结构图如图3-3所示。图3-3语音指令控制终端结构图2.4.2供电电路的设计供电电路是为了防止当适配器断电时,被充电电池的电流向适配器倒灌,而只能对负载供电。在仔细地比较了普通碱性aa电池、镍氢充电电池、铅酸充电电池、锂聚合物电池这几者之间的优缺点之后,选择一种能耗,密度最高,充电时间相对较短的锂聚合物电池。再根据该系统的实际应用情况和要求,对所需要的电压设备进行选择,地面控制终端分别采用12.6v、3500ma的锂电池。该系统中主要采用的三种参考电压设备,类型分别是+5v、+2.3v和+2.5v,其中+5v的参考电压可以直接提供给远程无人机遥控器或者是做参考电源等设备的使用,+2.3v的参考电压设备可以直接提供stm32f103、nrf24l01、ads7843及lcd。,+2.5v可以作为adc的一个参考电压。在此设计中,我选用了3R33DC这个型号的电源模块进行直流电压效率转换,主要原因是直流性稳压器件对于直流转换的电压效率比较低,而且需要消耗大量的能源,也会使直流电池储存能量过多。选用的该型号电源模块主要采用mp2307的稳压电源转换芯片,12v转2.3v时间其转换的电压效率平均可以达到高达98%的程度。电源模块外观如图3-4所示。图3-4电源模块在实践中的应用中我们不仅能够直接转换一下原来四个模块设计中的电源稳压二极管与电源调压器之间的电阻,通过vadj四个逆变器外接器对逆变器的电路值进行电压调整后其电阻值就可以直接被应用于实现12v一直到5v的稳压输出,转换器的效率也可以保持在95%以上。由于其中dc-dc系列器件的信号输出和输入电压普遍较低而纹波比较大,所以每个输出电压的输入和信号输出的两端都会根据需要分别添加一个较大的纹波电容,希望这样电容能尽量减少和有效消除内部纹波,在此我们主要采用的电容是16v纹波耐压1000uF用于电解液等元件的小型纹波电容。电压12v转5v的转换电路如图3-5。图3-5电压12V转5V电路2.3v为直接控制电源终端的数字电路即可实现直流供电。为了有效地保证整个系统的稳压和电压传递的稳定性我们分别选择了一种新型的线性稳压元件例如lm1117-2.3,输入和稳压电压的输出分别在其中一端加入0.1uf+10uf的稳压电容器来对其进行稳压和滤波处理。将该型号的电源模块输出的5v控制电压转化成2.3v以上的稳定电压即可提供到各种类型的数字控制芯片设备中使用,其中主要包括有数字主控器控制芯片(含处理器)、无线信号射频控制芯片、pwm控制调压部分、lcd驱动控制器背光芯片、led控制背光与主控触摸屏,转换电路如图3-6所示。图3-6基准电压源2.3V电路图2.4.3麦克风放大电路的研究1.麦克风的作用对于语音控制系统而言,麦克风的作用显而易见,是用来录入人声等语音的,所以尽可能要求麦克风录入的效果好且识别速度快。2.麦克风的选择驻极体的电阻麦克风通常属于直流电容式电阻麦克风的一种,声音的内部温度和电压波动率的可能性也会直接影响改变这种麦克风内部输入电容的大小尺寸和电容大小,但由于这种驻极体的电阻麦克风电容输入和外部输出的输入阻抗非常高,因此就常常需要在内部直接安装一个电容场效应管理器来用它作为输入阻抗电压转换器,为此这种驻极体的电容麦克风在正常声音工作中就常常需要一个直流偏置的输出电压。一般的驻极体语音麦克风根据输出的输入电压和输出频率不同波动到的范围一般是5~10mv之间,各种不同的生产厂家极体麦克风根据输出的输入电压和输出频率不同波动到的范围也不同,对于不同输出频率的信号噪声和语音信号波形产生的影响相应也就不同,最终这些可能也就会直接产生的的影响涉及到信号放大后的语音噪声和信号波形,对于一些语音指令的准确识别也就会有所应的影响。一种方法是从普通的商业电子邮件商务零售市场上直接获取并得到的新型麦克风,另一种为实验室可以直接购买的新型铁三角AT9912麦克风。两种类型麦克风的频率录音值和频率放大波形可以采用相同的频率放大值和倍数来进行视频显示。图3-7AT9912录制的“左”字时域波形图图3-8普通驻极体麦克风录制的“左”字波形图表3-1麦克风波形测试对比表麦克风类型幅值特点AT9912高灵敏度高,识别迅速,效果好普通驻极体低灵敏度较低从本文图3-7at9912与本文图3-8普通驻极体录音麦克风的本机录音"左"右按键相同处的文字我们已经可以清楚地明显看到,at9912输出的录音信号幅度均值相对比较高,普通驻极体录音麦克风的本机输出录音信号幅度均值相对比较低,说明本机at9912的输出录音信号灵敏度相对比较高。从两种采样麦克风的各种功能特点和使用性能上对我进行了一次综合的对比分析,为了能使后期采样标签上的识别采样效果更加良好,本次我在采样系统中分别选择了at9912进行采样声乐和音频视听。2.麦克风放大电路仿真的研究麦克风放大器的电路原理框图结构如下,详见图3-9。首先向驻极体麦克风中加入一个偏置的电压,以便于它内部的mosfet。然后再加入一个电压增益提升器,将其电压增益提升,经过一次集成式运放mcp601,这次放大的倍数为50倍。最终的输出电流是在0.9v~1.5v之间有变化,适合adc设定的基准输出电压为2.5v。图3-9麦克风放大电路图2.4.4LCD显示及触摸屏驱动的设计1.LCD显示界面在一个lcd的视频显示界面上,使用两个ili9320芯片加起来可以实现对一个lcd的多个画面视频信号同时输出,ili9320是一款26万彩色彩色tft屏幕的驱动显示芯片,最大亮度可以同时支持240*320分辨率的视频显示,片内数据可以同时显存到的字节数高达172800个。它目前可以同时支持四种与其他无线主控器和控制芯片相互建立联系的无线连接控制模式,分别是被称为i8i80模式、vsyncnc模式、spipc模式与rgrgbrc模式。本文先后尝试采取两种使用方式与pdili9320通信器相互进行联系以直接实现驱动显示的背光效果,第一次使用采取了lstm32的方式gpio口使用模拟16位的li80模式直接使用驱动背光显示控制芯片,使用方式pdio口高8位使用作为连接数据线低8位,peio口高8位使用作为连接数据线高8位,pd0-pd3口分别使用作为连接cs、wr、rd与一个rs引脚,pd6作为连接lcd的一个reset引脚,pa1作为连接lcd的一个背光电路控制引脚并用来对其电路进行背光控制。接口图如图3-10所示。ili9320写入与读取时序图如图3-10所示。图3-10stm32与ili9320连接图及ili9320写入时序图在程序的控制上,我采用的方法是通过直接对i/o口数据进行读写,从而达到控制时序的主要目的,需要严格地按照数据读写的顺序和时间路线来改变指令引脚的时序状态,由于pd,pe的数据接口是可以进行分开读写的高8位的,需要注意的是保护各口低8位的数据不被转换或者改写。但最后测试发现速度不尽人意,目测时间估计为每秒3~5帧左右。所以该部分设计仍有待提高。I/O口模拟数据线读写与读寄存器程序流程图如下图3-11所示。图3-11I/O口模拟数据线读写与读寄存器程序流程图由于每个I/0口的数据读写工作模式完全上都是由一个软件进行控制,并且在每个软件控制电路设定线置高、设定电路位置低后后它都会设定有一个延时以及与每台计算机工作相互配合的工作时序,所以实时刷屏的工作速度比较缓慢,不能很好地完全满足系统实时刷屏显示的主要特点。后来对其外部显示接口模式的设计方法进行了重大改善,经过多次反复查阅的一些相关资料和分析得知了具有stm32的内部fsmc传输接口,即可通过转换而成为一个完全可变外部静态的数据存储器和控制器,通过对内部fsmc传输接口和外部相应的数据寄存器接口进行了自动化的配置,即可根据不同外部静态存储器传输的类型自动直接向存储器发出与其传输速度相同或者适应的传输数据、地址、控制信号,使得stm32可以对不同的类型、外部存储器数据库传输速度进行不同的控制。尤其是可以采用i80和m68模式连接LCD进行显示和控制并采用硬件管理CS、RS等接口电平改变。2.5姿态测量及主控模块的设计姿态运动测量射频模块主要包括射频加速度姿态传感器、无线通信射频载波模块、单片式电机和无线计算机射频电源模块四个大部分共同组成,其中无线载波射频模块加速度姿态传感器主要功能是一种用于能够直接精确感受射频加速度并将其信号转换成作为频率可以应用于射频输入或者输出测量射频信号的姿态传感器,具有了姿态测量精确、性能稳定、可靠性好、使用灵活等几大特点。无线电和射频识别模块主要用途是被泛指属于自动识别射频技术的一种,通过无线电和射频的各种方式与识别物体之间数据进行不同的非自动接触双向射频数据通讯,利用无线电和射频的各种方式对识别物体数据进行信息阅读和数据写入,从而可以实现自动识别的主要目标及任务进行时的数据交换。电源模块的作用就是电压的转换,它可以将交流或直流电变换成语音控制系统所需要的交流或直流电。通过这几个模块来对无人机的姿态进行调整。无线测量模块硬件结构图如图3-12所示。图3-12无线测量模块硬件结构图机载式电压传感器系统采用4.2v、300ma的磷酸锂电池进行供电。在需要进行直接供电控制系统一部分的稳压控制电路系统设计时,使用现在智能手机上的直接供电系统控制电路系统和本电路常见的交流低压差分非线性交流稳压(ldo)稳压控制电路芯片r-sp6201,将4.2v的钛酸锂电池电源输出端的交流电压直接转换成2.3v的直流电压,压降只有0.9v,并且其直接供电端的电流精度可以达到超过300ma。电路图如图3-13所示。图3-13锂电池4.2V转2.3V图3-14为主要的控制系统模块和adxl345模块的具体实物结构示意图。传感器控制模块几乎能够和其他主控制器模块一样使用外接杜邦线缆来进行无缝连接。图3-14控制模块及ADXL345传感器模块实物图图3-15为我们通过目前使用的usb-logic等等逻辑加速分析仪进行计算分析得到的atmega88读取adxl345的加速度进制数据读取时序流程示意图,首先由加速传感器向主机控制中心芯片上的atmega88发送读取命令0xf2,读取一个加速度数据缓冲区,传感器在用户接受到这个命令后就可以会决定在下一个读取加速度数据时钟运行周期的开始到来时立刻开始向用户传输读取加速度进制数据,共3轴进制数据,按照图中x、y、z三个轴的排列顺序依次进行排列,每一个轴上的进制数据各自分别占用2个单位字节,数据时序中的最后一高位作为符号位,0代表正,1代表正和负,然后我们选择被读取后10位的一个二进制输入数据,接收后得到的这些进制数据时序可以根据实际采样的计算精度进行变化和转换算法生成实际测量值。图3-15SPI总线读取ADXL345加速度数据图3-16为一个adxl345芯片的基本配置和输入读数据处理应用程序工作流程的示框图。由于系统采用高位加速度滤波传感器可使adxl345输出的软件信号频率波动较大,在实际进行应用时我们分别加入了多种软件输出滤波共享算法,本文主要采用了高中位值软件滤波和高位平均值软件滤波数据共享算法来分析处理这些滤波数据,减少了对软件输出滤波信号的频率。图3-16ADXL345配置与读数据程序流程图2.6无线传输系统的设计2.6.1无线传输模块接口配置无线通信系统模块设计采用了公司现有的两个成品通信模块,由美国nordic公司的两个nrf24l01及其两个附属集成电路组合而成。在一个数据包的发送端,nrf24l01使用接口spifo接口将一个单片机缓慢地将其发送上传过来的所有数据进行存储处理起来,然后再将其中存放的所有数据通过接口txfifo,存放后数据会自动分别添加上一个地址位的标记器、奇偶效果和实测位。例如当所有的发送数据都已经存放了处理完毕且片选的发送信号都已经到来时,就在2.4ghz的频段以2mbp/s的载波速率高速地再次发送了数据出去,发送任务完毕后后该系统就自动设置了每次发送任务完毕的数据中断。例如,当一台驱动单片机中断检测器收到此信号中断,便使它可以及时知道该中断数据信号是否已被中断发送成功。否则自动停止进行一次重发,直到成功或者也就是最大限制重发的执行次数。这时即可将设置最高中断重发至最低中断。单片机就被自动认为终端是正在丢帧,清空所有发送帧的队列并再次启动继续向其终端发送下一个数据。在接受器的一个终端同样没有需要直接使用的rnrf24l01,芯片将自动开始一直在空中自动开始搜索所有器需要的在设定的一个频段内所有器的无地址补码信号,一旦一个没有正确的无地址的补码的读取数据被直接发出,芯片便有机会自动开始从接受器中自动收集这些数据,并将其放入存放器得到所有器需要的接受器数据队列中的rxfifo,存放器得到所有器需要的接受器数据队列后其中的两个数据将开始会自动地分别去掉接受器的所有地址的开头、crco和效验的补码,这样被信号检测器直接读取数据得到的两个数据信号便是同时发送给该信号读取数据的也就是二进制码的补码。nRF24L01无线通信系统模块基本结构如图3-17。图3-17nRF24L01无线通信系统模块基本结构Atmega88的系统软件硬件spi传输速度最高可以直接达到1mbps以上,能够完全满足整个系统的各种数据实时传输和信息发送的超高实时性。该电路接口集成电路基本机构如图3-18所示。图3-18nRF24L01接口电路图根据进入sck的原理nrf24l01spi不用时序的基本特点:sck不用时序只是一个非常低电平、当这个数据在进入sck的第一个时钟脉冲时间上升到下沿时有效,nrf24l01spi的不用时序基本结构如下下图3-19所示。最终设计可以直接实现两个通讯芯片之间的两个spi无线通讯,利用简单的编程逻辑原理分析利用计算机usb-logic进行逻辑观察和最后的设计得到的两个SPI波形的结果如图3-20所示。图3-19nRF24L01的SPI读时序图3-20SPI总线向无线射频芯片发送读取的数据2.7实现语音控制姿态从语音识别到完成姿态控制的主要步骤如下:移动端获取语音信息,通过上文所选用的AT9912型麦克风录入语音,根据所述语音信息转换生成
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 口腔护理技术操作要点解析
- 产科护理操作与风险管理
- 2026年教师资格证(面试-幼儿园)考试题及答案
- 2025四川德阳市第二人民医院考核招聘专业技术人员20人备考笔试试题及答案解析
- 2025云南康旅酒店管理有限公司社会招聘5人备考笔试试题及答案解析
- 2025大有兴华科技(河南)有限公司招聘6人备考笔试试题及答案解析
- 2026中国航天科技集团商业卫星有限公司校园招聘模拟笔试试题及答案解析
- 2026年云南省烟草专卖局毕业生招聘(65人)备考笔试题库及答案解析
- 2026贵州安顺市某单位招聘派遣制工作人员备考笔试试题及答案解析
- 2025湖北恩施州巴东县人力资源和社会保障局公益性岗位招聘2人备考笔试题库及答案解析
- 中国文化:复兴古典 同济天下学习通超星期末考试答案章节答案2024年
- 《底层逻辑》刘润
- 家电的购销合同电子版
- 社会稳定风险评估 投标方案(技术标)
- T-NMAAA.0002-2021 营运机动车停运损失鉴定评估规范
- 现代艺术馆建筑方案
- 农产品加工专业职业生涯规划书
- DL/T 5218-2012 220kV~750kV变电站设计技术规程
- 范里安-微观经济学:现代观点1
- 商业银行经营学(第六版)全书电子教案
- 初中英语-《Unit9 It's important to have good habits》writing教学课件设计
评论
0/150
提交评论