基于语音控制的智能车设计_第1页
基于语音控制的智能车设计_第2页
基于语音控制的智能车设计_第3页
基于语音控制的智能车设计_第4页
基于语音控制的智能车设计_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基于语音控制的智能车设计年 级: 学 号: 姓 名: 专 业: 指导老师: 年 月 第 II 页 共 40 页摘 要让机器能够听懂人的语音,按照人类的命令去执行,是未来发展的一个重要方向,而语音识别是实现语音控制的关键性技术。语音识别的核心思想,就是模式匹配。通过语音训练建立一个语音库,把输入的语音与语音库中的模板相匹配,并对每一个匹配的模板进行打分,把分数最高的模板,作为识别结果输出。本文着重阐述了语音识别的原理,并介绍了语音识别专用芯片-LD3320。对此芯片的识别原理、典型应用电路图、软件驱动都有所涉及。本设计利用STC12LE5A60S2 为主控芯片,结合 ICRoute 公司高性能

2、语音识别芯片 LD3320,设计了基于非特定人的语音识别与控制的智能小车。该智能车由语音识别模块、主控模块、电源模块、电机驱动模块等几大部分组成。语音识别模块由语音芯片LD3320、语音采集单元即咪头等组成。主控模块由 STC12LE5A60S2 型号的单片机组成。电源模块由 7.2V 镍氢动力电池、7805 稳压芯片、ASM1117-3.3V 稳压芯片组成。电机驱动模块由直流电机、L298N 驱动芯片组成。该智能小车实现了语音命令的“前进” 、 “后退” 、 “左转” 、 “右转” 、 “提速” 、 “降速”等功能。在环境较为安静的情况下,正确识别率较高。关键词:语音识别; LD3320;

3、STC12LE5A60S2; 7805 稳压芯片; L298N 驱动芯片 第 III 页 共 40 页AbstractLet the machine to understand human speech, perform the humans order , is an important direction for future development, and speech recognition is the key technology to realize voice control.The core idea of speech recognition, is pattern ma

4、tching. The establishment of a speech database through voice training, the input speech and speech database template matching and scoring for each matching template, the template with the highest scores, output as the recognition results.This paper focuses on the principle of speech recognition, and

5、 introduces the speech recognition chip -LD3320. This chip identification principle and typical application circuit diagram, software drivers are involved. This design uses STC12LE5A60S2 as the main chip, chip with high performance speech recognition company ICRoute LD3320, the design of intelligent

6、 car speech recognition and control based on speaker independent. Composed of several modules such as the smart car driven by a speech recognition module, main control module, power supply module, motor.The speech recognition module is composed of LD3320 voice chip, voice acquisition unit is Amy etc

7、. The main control module is composed of MCU models STC12LE5A60S2. The power supply module is composed of 7.2V Ni MH battery, 7805 voltage stabilizing chip, ASM1117-3.3V regulator chip. The motor drive module by DC motor, L298N driver chip.The smart car to achieve the voice command forward and backw

8、ard and left and right and speed and speed and other functions. The environment is quiet, higher correct recognition rate.Keywords: speech recognition; LD3320; STC12LE5A60S2; 7805 voltage regulator chip L298N driver chip 第 IV 页 共 40 页目 录摘 要.IIAbstract .III第 1 章 绪论.11.1 语音识别概述.11.2 研究目的.11.3 语音识别的发展过

9、程与现状.11.4 课题研究手段.21.5 论文主要工作.21.6 本章总结.3第 2 章 系统整体方案设计.42.1 系统方案介绍.42.2 语音识别原理.42.3 LD3320 语音芯片识别原理.52.4 小车电机驱动方式.62.4.1 脉冲宽度调制调速的原理.62.4.2 PWM 调速的单片机实现方法 .62.5 本章总结.6第 3 章 系统硬件设计.73.1 系统电源部分设计.73.2 小车电机驱动模块.73.3 LD3320 语音识别芯片 .83.3.1 LD3320 语音芯片介绍.83.3.3 LD3320 硬件电路图及本设计电路图.93.5 LD3320 语音芯片语音采集部分.1

10、03.6 本章总结.10第 4 章 系统软件部分设计.114.1 小车电机转速控制软件.114.1.1 PWM 的软件实现 .114.1.2 小车功能实现.114.2 语音芯片 LD3320 软件编程实现.124.2.1 LD3320 寄存器操作方式.12 第 V 页 共 40 页4.2.2 LD3320 的驱动部分.134.3 小车整体软件实现.154.4 本章总结.15第 5 章 系统整体调试.165.1 系统硬件调试.165.2 系统软件调试.165.3 本章总结.16第六章 总结与展望.176.1 总结.176.2 展望.17致 谢.18参考文献.19附 录 1 流程图、电路图及实物图

11、、仿真图.20附 录 2 本设计的主要程序.22 第 1 页第 1 页 共 40 页第 1 章 绪论1.1 语音识别概述语言和声音是人类相互传递信息的重要手段1。人类自从能够制造出可以代替自身劳动的机器以来,就有个梦想,就是让机器能够听懂人类的命令,并按照人类的语音去行动2,从而实现机器与人的人性化沟通与交流,而不是依赖传统的鼠标、键盘的交互方式。语音识别技术的出现让人类的这个理想得以实现。我们通常意义上的语音识别,就是计算机或处理器把语音信号“翻译”成相对应的语言序列3。所谓的“翻译” ,是指在有限的区间里选择出待识别的目标,即是:所有可能结果已经存在,是一种模式匹配的思想,目前,语音识别的

12、主要方式就是基于这种模式匹配思想的。总体而言,语音识别的过程即是一个模式匹配的过程4,首先,根据人多次语音输入,建立一个语音模型,即是语音库,当开始识别时,需要对输入语音信号进行分析,然后,进行提取出此语音信号的特征,最后,将已经提取的语音信号的特征与已经存在的语音模型进行比较,将每一个模板的比较结果得分统计,找出分数最高的最优的匹配模板,进行输出5。图 1-1 为其基本语音识别的结构。图 1-1 语音识别系统的基本结构1.2 研究目的通过对该课题的研究,一方面理解语音识别技术的原理,了解当前的发展水平,分析国内外语音识别技术水平之间的差距。另一方面,根据自己当前对语音控制系统的研究,为语音控

13、制无人驾驶汽车的应用,奠定良好的基础。1.3 语音识别的发展过程与现状语音识别的设想很早就有人提出,甚至,计算机还没有被发明出来的时候,语音识别的想法已经初现雏形,在 1920 年的时候,一种玩具狗叫做“Radio Rex”被 第 2 页 共 40 页 生产出来,当人们叫出它的名字的时候,这只小狗可以听懂,并从座上弹出来。这也许是最早的语音识别机器了7。语音识别的研究工作大约开始于 20 实际的 50 年代8,贝尔实验室开发的Audrey 语音识别系统是最早的基于计算机的识别系统,1960 年代,语音识别引入了人工神经网络。线性预测编码 Linear Predictive Coding (LP

14、C), 及动态时间弯折 Dynamic Time Warp 技术是这一时代的突破性技术。语音信号产生模型的问题被动态时间弯折技术很好的解决了,大大的推动了对语音识别的发展。70 年代,对语音识别的研究,有了一个很大的突破9-10。LP 技术在理论上得到了很大的发展,并且,动态时间归正技术(DTW)也渐渐趋于完善,矢量量化(VQ)和隐马尔可夫模型(HMM)理论也被提了出来。80 年代,进一步发展了语音识别技术,MFCC 的参数提取技术和 HMM 模型都得到了的深入的发展,在理论体系上,比较完整和准确的描述了语音识别的问题逐,同时在实践上,效率较高的解决算法又逐步被研发出来。我国语音识别研究工作起

15、步于 50 年代11-12,虽然我国起步很晚,但是,语音识别的研究工作发展迅猛。也渐渐从实验室变为实际产品。国内最初期的语音识别技术研究是从中科院声学所开始的。国外也非常重视中国未来的庞大市场,美国、新加坡等很多公司,对汉语语音的研究都投入了巨大的物力、财力。并已达到世界先进水平。因此,一方面,要不断加强对语音识别理论的研究,另一方面,还要加快从理论转化为产品的进程。1.4 课题研究手段1.4.1 研究手段首先查找和语音控制小车相关文献和资料从而全面地、客观地了解语音控制小车的发展现状,并且按照本设计功能的实现可以划分为:语音处理模块、主控模块STC12LE5A60S2、电机驱动模块和电源模块

16、等部分。然后按照各个模块分别调试,之后,各个模块综合调试,以完成本次设计。1.5 论文主要工作(1) 介绍了语音识别的原理,以及语音识别芯片 LD3320 的识别原理。(2) 对语音芯片 LD3320 的硬件电路进行了介绍,并介绍了其软件驱动。(3) 对 LD3320 进行软件编程,并对小车的控制进行了编程。(4) 整体系统进行了软硬件的调试,通过语音控制实现了智能小车的前进、后 第 3 页 共 40 页 退、左拐、右拐、提速、降速等功能。1.6 本章总结本章是绪论部分。对语音识别原理进行一个基本的概述,并介绍了本次设计的研究目的。然后介绍了语音识别的发展过程与现状,并且,提出了对本设计的研究

17、手段,最后介绍了论文所做的主要工作。 第 4 页 共 40 页 第 2 章 系统整体方案设计2.1 系统方案介绍本设计以 STC12LE 系列低电压单片机为核心,并采用 ICRoute 公司生产的LD3320 语音识别芯片和相关电路,实现了语音控制小车的设计任务。使其可根据语音提示,做出前进、后退、左拐、右拐、提速、降速等相应动作。图 2-1 语音控制小车整体框图 2.2 语音识别原理语音识别本质上属于模式识别的范畴。语音输入后,对语音进行预处理和特征提取,并产生一个训练模板,多次语音学习和训练后,就会生成一个模板库,当有命令再次输入时,就会与模板库中的参考模板进行比对,得分最高的一项,作为识

18、别结果输出。 图 2-2 语音识别原理下面详细介绍语音识别原理的几个关键部分1. 预处理 包括对语音信号进行采样、反混叠带通滤波、去除个体发音差异、 第 5 页 共 40 页 去除环境噪声引起的干扰等,基元的选取和端点检测问题也是语音识别会涉及到的。2. 特征提取 特征提取,主要是把能够反映出语音本质的一些参数,提取出来,如平均能量、平均跨零率、共振峰等。提取语音特征在语音识别中也非常重要。3. 训练 训练,就是要求是在识别之前,需要很多次的重复待识别的命令,每次都能提取出关键字,去除无效的信息,按照不同命令,写入不同的规则库中,就能够形成需要识别的模板库。4. 模式匹配 语音识别系统的核心内

19、容便是,模式匹配。它是通过某些定义好的规则,来计算出输入语音提取的特征参数与模板库中的参数之间的相似程度,来得到匹配分数的。这个规则,可能是某种语法规则或者专家经验来组成的。2.3 LD3320 语音芯片识别原理LD3320 语音芯片的识别原理: 图 2-3 LD3320 语音芯片识别原理LD3320 提供的语音识别技术,是基于“关键词语列表”的识别技术(Auto speech recognition)工作过程:语音通过麦克风接口 MIC 输入到芯片中,然后,对输入的声音执行频谱分析,并且,提取出输入语音的一些能够代表语音特征的参数,把提取出来的参数,与写入程序中的关键词语进行比对,每个模板关

20、键词都会有个匹配分数,找出得分最高的关键词作为识别输出。但是,语音输入是随时的,随时开始,随时结束,所以说,语音是否结束,识别算法并不能准确的判断出来,所以,并不能判断出此识别结果是否正确。比如,识别列表中有两个关键词语分别是“李晓”和“李晓明” ,当用户说到“晓”这个音节时,在识别芯片内部是“李晓”得分最高,但此时,芯片是无法给出识别结果。随着用户说出“明”音节后, “李晓明”则成为得分最高。此时,用户停止说话,或者是定时录音已到,使得识别芯片可以判断出用户已经停止说话了, 第 6 页 共 40 页 才能给出识别结果是“李晓明” 。2.4 小车电机驱动方式 本设计采用 DC3V-6V 直流减

21、速电机作为小车的驱动电机,减速比为 1:48,这样可以大大提高电机转矩,在路况不平时也能有较大的转速。2.4.1 脉冲宽度调制调速的原理该直流电机选用 PWM 方式进行调速。PWM 即是脉冲宽度调节(Pulse Width Modulation-简称 PWM)。PWM 的占空比即是高电平时间与整个周期的时间之比,是一种控制平均电压的调速方式。t1 是高电平时间,t2 是低电平时间,T 是一个周期的时间,所以占空比 D=t1/T,如图 2-4 所示图 2-4 PWM 信号的占空比2.4.2 PWM 调速的单片机实现方法不同的单片机实现 PWM 的方式有很大不同,一是可以利用单片机自身的资源来实现

22、,比如,某些型号的单片机,可以通过配置一些固定的管脚来输出 PWM 波,例如,STM32 类的单片机。二是通过单片机利用定时器来模拟出 PWM 波形,如常用的 51 单片机,本文所用的即是方法二。实现方式为利用单片机的定时器功能来模拟出 PWM 波形,进而通过改变计数器的计数值来改变占空比。2.5 本章总结 本章是整体方案设计,对系统的整体方案进行了介绍,详细介绍了语音识别的原理,并且,介绍了语音识别芯片 LD3320 的识别原理。接着介绍了小车电机的驱动方式,即采用 PWM 进行调速。然后介绍了 PWM 的调速原理,以及软件实现PWM 的思路。 第 7 页 共 40 页 第 3 章 系统硬件

23、设计3.1 系统电源部分设计系统供电电源采用 5000 毫安 7.2V 镍氢动力电池,给电机驱动供电,经过 7805稳压芯片输出 5V,一方面可以给电机驱动芯片 L298N 逻辑端芯片供电,另一方面,7805 输出的 5V,经过 AMS1117-3.3V 电压转换芯片,转换为 3.3V 给单片机和LD3320 语音芯片供电。图 3-1 7805 芯片电路图图 3-2 ASM1117 电路图3.2 小车电机驱动模块L298N 此芯片的时序信号利用 L298 来提供的,而不是使用单片机的输入输出端口模拟,这样做可以节省单片机输入输出接口。连接方式:L298N 的 Pin1 和 Pin15 可通过连

24、接电阻来控制负载电路。两个电机连接到输出的四个端口上,即:OUTl、OUT2 、OUT3、OUT4 ,电机的正反转通过输入 input1input4 引脚来控制。电机停转则有 Enable 使能位控制。 第 8 页 共 40 页 图 3-3 L298N 芯片电路图3.3 LD3320 语音识别芯片 3.3.1 LD3320 语音芯片介绍LD3320 语音识别芯片是由 ICRoute 公司设计并生产的。是一款专用于语音识别的芯片,该芯片集成了语音识别处理器和一些像 AD、DA 转换、麦克风、声音输出电路等外部电路,该芯片待识别命令是可以动态编辑的,并且,不需要外接数据辅助芯片,如 RAM、Fla

25、sh 等,直接用在现有的产品中,就可以实现语音识别、人机对话等功能。 第 9 页 共 40 页 3.3.3 LD3320 硬件电路图及本设计电路图图 3-4 LD3320 引脚图 第 10 页 共 40 页 图 3-5 LD3320 电路图3.5 LD3320 语音芯片语音采集部分本设计将利用 LD3320 芯片上的 MIC 连接到咪头上直接对语音信号进行采集。咪头是将声音信号转换为电信号的转换器件,通过正负管脚与 LD3320 芯片相连接,完成语音信号的输入工作。由于本设计选取的 LD3320 芯片自带特征提取算法,并且内部自带 2 个 FIFO 缓存器,可以直接保存数据而不需要外接任何辅助

26、芯片如 Flash、RAM 等。3.6 本章总结 本章是本次设计的硬件电路部分。首先介绍了该系统的电源部分的设计,接着,对电机驱动部分进行了介绍,即 L298N 的工作原理。然后介绍了 LD3320 的引脚图以及典型的应用电路,并介绍了该芯片的语音采集部分。 第 11 页 共 40 页 第 4 章 系统软件部分设计4.1 小车电机转速控制软件4.1.1 PWM 的软件实现初始化时,先把控制电机的四个信号线的电平拉低,,打开定时器 0,并且进入计数模式,定时器每隔 0.25 毫秒进入一次中断,在中断函数中开始计数,如果计数达到了一个指定的值,便开始把电平拉低,如此往复循环。产生 PWM 的部分程

27、序如下:void Timer0(void) interrupt 1 TH0=(65536-250)/256; TL0=(65536-250)%256;/定时 0.25mS Cnt+;if(Cnt = dianji)Zuo1 = 1;you1 = 1;4.1.2 小车功能实现小车要想实现前进、后退等的功能,只要完成对 PWM 波的控制即可。前进、左转、右转,只要控制电机的使能端即可,例如,前进时,左右两端的使能端 ENA、ENB 都要使能,左转时,只控制左边电机使能,即 ENA 使能,相反的,右转时,只控制右边电机使能,即 ENB 使能即可。后退时,需要着重说明,因为后退也是两个电机同时转动,单

28、独控制使能端就无法控制电机达到后退的功能,这时候,就要控制 PWM 的产生引脚,产生与前进时的 PWM 相反的两路反 PWM 波形。具体实现如下,可以设置一个标志位 flag,在初始化时,flag 为高,等到后退时,把 flag 拉低,进入反 PWM 程序段即可。加速、减速时,可以改变高电平时间即可。如,加速时,让高电平时间每次加10,减速时,让高电平时间每次减 10。便实现了加速、减速的功能。 第 12 页 共 40 页 4.2 语音芯片 LD3320 软件编程实现4.2.1 LD3320 寄存器操作方式通过操作各个寄存器才能够完成对 LD3320 的操作,例如,设置相关标志位,读取某些寄存

29、器状态,向 FIFO 中写入数据等。有两种方式可以进行对寄存器的读操作与写操作,一种为串行 SPI 形式,另一种为并行方式。本设计采用串行软件模拟 SPI 读写方式,与 LD3320 进行寄存器读写。LD3320 的第 46 脚(MD)接高电平,且第 42 脚(SPIS*)接地时按照此串行 SPI 方式工作。1. 串行 SPI 写模式 写的时候,在写状态期间,需要保持 SCS* 引脚为有效电平,即低电平状态,首先,向 SDI 引脚发送一个写的指令,然后,再向其引脚写入8 位寄存器的地址, 再给 SDI 引脚发送 8 位数据。图 4-2 SPI 方式写时序2. 串行 SPI 读模式 读的时候,S

30、CS*保持在有效电平,即低电平状态。首先,向 SDI 引脚发送一个读取的指令,然后,再向其引脚写入 8 位寄存器的地址,最后,就可以从 SDO 引脚接收到 8 位数据。图 4-2 SPI 方式写时序 第 13 页 共 40 页 4.2.2 LD3320 的驱动部分1. 芯片复位 芯片复位就是对芯片的第 47 脚(RSTB* )发送低电平。 void LD_reset() RSTB = 1; delay(1); RSTB = 0; delay(1); RSTB = 1; 芯片初始化一般在程序的开始进行,如果有时芯片的反应不太正常,也可以用这个方法恢复芯片的初始状态。2. 语音识别的驱动部分 语音

31、识别的操作顺序是:各个寄存器的通用初始化;语音识别过程初始化;写入识别列表;开始识别,同时,准备中断服务程序,并置位中断允许位。(1) 通用初始化 按照以下程序设置寄存器。void LD_Init_Common() LD_ReadReg(0 x06); LD_WriteReg(0 x17, 0 x35); delay(10); LD_ReadReg(0 x06); LD_WriteReg(0 x89, 0 x03); delay(5); LD_WriteReg(0 xCF, 0 x43); delay(5); LD_WriteReg(0 xCB, 0 x02); /*PLL setting*/

32、 LD_WriteReg(0 x11, LD_PLL_11); LD_WriteReg(0 x1E,0 x00); LD_WriteReg(0 x19, LD_PLL_ASR_19); LD_WriteReg(0 x1B, LD_PLL_ASR_1B); LD_WriteReg(0 x1D, LD_PLL_ASR_1D); delay(10);LD_WriteReg(0 xCD, 0 x04);LD_WriteReg(0 x17, 0 x4C); delay(5);LD_WriteReg(0 xB9, 0 x00);LD_WriteReg(0 xCF, 0 x4F); LD_WriteReg(

33、0 x6F, 0 xFF); 第 14 页 共 40 页 (2) 语音识别通用初始化 按照以下序列设置寄存器。 void LD_Init_ASR() nLD_Mode=LD_MODE_ASR_RUN; LD_Init_Common(); LD_WriteReg(0 xBD, 0 x00); LD_WriteReg(0 x17, 0 x48); delay( 10 ); LD_WriteReg(0 x3C, 0 x80); LD_WriteReg(0 x3E, 0 x07); LD_WriteReg(0 x38, 0 xff); LD_WriteReg(0 x3A, 0 x07); LD_Wri

34、teReg(0 x40, 0); LD_WriteReg(0 x42, 8); LD_WriteReg(0 x44, 0); LD_WriteReg(0 x46, 8); delay( 1 ); (3) 写入识别列表 识别列表的规则就是,每个特定编号,对应于一个待识别的命令,而同一个编号可以与几个不同的待识别命令相对应。该 LD3320 语音识别芯片可以最多支持 50 个待识别命令,每一个待识别命令,是一个普通话的汉语拼音,中间间隔一个空格。 (4) 开始识别 按照本节的说明,通过设置几个相关的寄存器,LD3320 语音识别芯片就能够开始语音识别。(5) 相应中断 不管正确的结果能否被识别出,

35、一旦麦克风采集到了声音,都能够产生一个中断信号。在中断程序中读取寄存器中的值并分析识别结果,BA 寄存器里的值是候选答案的数量,而 C5 寄存器中,存储的是可能性最高,得分最高的答案。例如,发音为“南京” ,并被成功识别(无其他候选项),那么,BA 寄存器里的数值就是 1,而 C5 寄存器里面的值是对应的编码是 3。4.3 小车整体软件实现语音芯片 LD3320 语音识别芯片每次语音识别之后,跳转到识别结果的函数中去,在对应的识别结果中,调用小车的运动函数,例如,当识别出“前进”的命令时,程序便跳转到“前进”的函数中去,然后,小车开始动作,即, “前进” ,而对于“后退” 、 “左拐” 、 “

36、右拐” 、 “降速” 、 “提速也依次进行。 第 15 页 共 40 页 4.4 本章总结 本章是软件部分的介绍,先介绍了小车调速的软件实现,即利用单片机模拟出PWM 波,进行调速。并介绍了语音识别芯片 LD3320 的软件编程,对该芯片进行操作的方式,即采用软件模拟 SPI 进行串行的读写操作。并且介绍了 LD3320 的驱动软件,并介绍了该芯片的识别流程。 第 16 页 共 40 页 第 5 章 系统整体调试5.1 系统硬件调试 刚接触语音芯片 LD3320 时,单片机选型上,先用 STC89C52,这种 5V 单片机,然后,通过电平转换芯片-ASM1117,转换为 3.3V,芯片无法正常

37、工作,后来选择STC12LE 系列的低电压单片机,芯片正常工作。当电池给各个部分供电时,需要注意各个部分的“共地” 。因为不同的 GND 会影响系统正常工作,需要把各个部分的 GND 连接在一起,才能达到电平统一的效果。5.2 系统软件调试在程序调试时,可以把程序一段一段的调试,可以暂时屏蔽掉那些不相关的程序,而只调试某一段程序。这样,确保每一段程序的执行正确,最后,再把各个模块一块一块地连接到一起调试,如,当调试语音模块时,可以用一个 LED 灯来代替小车,如果语音输入的命令与写入模板命令匹配,可以使单片机输出一个引脚,连接到 LED 上,使此引脚电平发生变化,LED 灯变亮,便说明语音匹配

38、成功。5.3 本章总结 本章主要介绍了在本次设计工作中对系统软硬件进行调试时所遇到的问题,如在硬件调试时,单片机的选型问题,只有使用低电压 3.3V 单片机,才能与语音芯片的信号进行操作,在软件调试时,对语音芯片的识别软件进行调试,用 LED 灯来显示调试的结果。 第 17 页 共 40 页 第六章 总结与展望6.1 总结本文着重阐述了语音识别的原理,并介绍了语音识别专用芯片 LD3320 的硬件知识以及软件驱动程序。通过调试,正确识别率达到 90%左右,达到了较好的预期效果。当然,本设计还存在很多能够改进的地方,例如,语音芯片识别时对环境有所要求,在嘈杂的环境中,识别的准确率大大降低,容易不

39、识别或者误识别。存储能力较低,最多只能识别 50 条命令,而且,对每条命令也有限制,即:每条命令所包含的内容,不允许超过 10 个汉字,等同于 79 个字节的拼音串。毕业设计工作从开始到现在已有几个月的时间,从构思,到定题、开题、购买元件、硬件电路搭建以及软件的编写,论文定稿,这期间收获很大,自己的能力也有了很大的提升。6.2 展望语音技术发展到现在,其应用已非常广泛。未来的一个很重要的发展方向就是应用在语音接口上,即是,利用语音识别技术来代替鼠标、键盘等传统的人机交流方式,通过人类的语音命令与机器进行交流,势必将给传统的交互方式带来一个革新。如果能够打破环境的限制因素,对环境的要求不是特别的

40、苛刻,即在相对噪杂的环境中,如高噪声的工业环境,语音正确识别率能够大幅度的提高,语音识别的应用将更加的广泛。还有,如果机器能够正确识别大词汇量、连续语音和不同语言,那么,语音识别技术将会进入一个全新的时代。 第 18 页 共 40 页 致 谢经过很多次的修改,设计的论文工作总算告一段落,但是,由于认识的不足,理解能力的限制,一定会有很多的不足。在此期间,如果没有指导老师的辛勤指导,还有同学们的大力支持,独自完成论文的困难是难以想象的。在这里首先要感谢我的导师杨老师,对我的谆谆教诲。 还要感谢我的好朋友陈同学,在技术上给与我很多的帮助,并且,从他身上,我学会了很多东西。还要感谢我的好搭档王同学,

41、在那些奋斗的夜晚,我两个多次合作参加比赛,不管比赛的结果是成功还是失败,但是,从每次比赛中,都能让我学到书本上学不到的东西。正是这些结晶,让我一步步走向浩瀚的电子世界。还要感谢我的舍友,张同学,对我的支持和鼓舞,没有我舍友们的支持,就没有自信的我。还有自动化三班的同学,给与我的帮助和支持,真心的感谢你们,我的导师,我的同学们。另外,我还要感谢电气院曾给我授课的每一位老师,是你们教会我专业知识,把我领进了自动化的大门,没有那些让我爱戴的老师们,就没有现在的我,在未来的日子里,我的每一个进步,都离不开带我入门的老师们,感谢你们,我人生的导师。 第 19 页 共 40 页 参考文献1 刘幺和, 宋庭

42、新. 语音识别与控制应用技术M. 科学出版社, 2008.2 赵力. 语音信号处理 (第 2 版)M. 北京:机械工业出版社, 2009.3 金鑫, 田犇, 阙大顺. 基于 LD3320 的语音控制系统设计实现J. 电脑与信息技术, 2011,06:22-25.4 王富中, 黄文浩. 基于语音识别技术的智能控制系统设计J. 自动化与仪表, 2006,04:8-10.5 语音识别 LD332XICRouteDB/OL. 2010-07-01http:/ LD332X_DebugProcess.html.6 芯片 LD3320 简明调步骤试 DB/OL. 2010-07-01http:/ LD33

43、2X_DebugProcess.html.7 马俊. 语音识别技术研究D. 哈尔滨工程大学. 2004.8 雷静. 语音识别技术的研究及基本实现 D. 武汉理工大学. 2002.9 高新涛, 陈乖丽. 语音识别技术的发展现状及应用前景J. 甘肃科技纵横, 2007, 36(4): 13-13.10 罗冬梅,黄贤立. 语音识别技术在专题学习网站中的应用研究J. 中国教育信息化:高教职教, 2009 (11): 72-74.11 张珍. 智能机器人语音识别技术J. 现代电子技术, 2011, 34(12): 57-60.12 胡宾. 嵌入式语音识别技术的研究D. 武汉理工大学. 2006.13 朱

44、淑琴. 语音识别系统关键技术研究D. 西安电子科技大学. 2004.14 顾亚强. 非特定人语音识别关键技术研究D.国防科学技术大学. 2009.15 黄文龙. 语音识别关键技术研究及系统实现D. 重庆大学. 2010.16 Schroeder M R. Linear predictive coding of speech: Review and current directionsJ. Communications Magazine, IEEE, 1985, 23(8): 54-61.17 Hung S L, Adeli H. A parallel genetic/neural networ

45、k learning algorithm for MIMD shared memory machinesJ. Neural Networks, IEEE Transactions on, 1994, 5(6): 900-909.18 Maniezzo V. Genetic evolution of the topology and weight distribution of neural 第 20 页 共 40 页 networksJ. Neural Networks, IEEE Transactions on, 1994, 5(1): 39-53.19 Savoji M H. A robu

46、st algorithm for accurate endpointing of speech signalsJ. Speech communication, 1989, 8(1): 45-60.20 Jiang H. Discriminative training of HMMs for automatic speech recognition: A surveyJ. Computer Speech & Language, 2010, 24(4): 589-608. 附 录 1 流程图、电路图及仿真图、实物图开始初始化程序起点检测预处理特征提取终点检测语音模板识别识别结果输出结束NYNY 图

47、 1 语音识别流程图 第 21 页 共 40 页 开始初始化程序语音输入产生中断识别出命令识别结果小车根据命令运行YN 图 2 小车整体程序框图 第 22 页 共 40 页 图 3 智能小车的整体电路图 第 23 页 共 40 页 图 4 智能小车的实物图附 录 2 本设计的主要程序/* 接线说明: (信号管脚需要接上拉电阻 1K 到 3.3V)sbit SDCK =P00; /SPI 时钟信号sbit SDI =P01; /SPI 数据输入sbit SCS =P02; /芯片片选信号,sbit RSTB =P03; /芯片复位信号sbit LD_MODE=P04; /芯片模式选择信号,sbi

48、t SPIS =P05; /SPI 模式设置:低有效,sbit SDO =P06; /SPI 数据输出 sbit IRQ=P32; /接单片机的中断管脚 电机控制引脚 第 24 页 共 40 页 sbit zuo1=P10;sbit zuo2=P11;sbit you1=P12;sbit you2=P13; sbit ena=P14sbit enb=P15;*/ #include STC12LE5A60S2.H /头文件兼容 STC12#include LDchip.h#include IO_DEF.H #include AsrItem.h /*/nAsrStatus 用来在 main 主程序

49、中表示程序运行的状态,不是 LD3320 芯片内部的状态寄存器/LD_ASR_NONE:表示没有在作 ASR 识别/LD_ASR_RUNING:表示 LD3320 正在作 ASR 识别中/LD_ASR_FOUNDOK:表示一次识别流程结束后,有一个识别结果/LD_ASR_FOUNDZERO:表示一次识别流程结束后,没有识别结果/LD_ASR_ERROR:表示一次识别流程中 LD3320 芯片内部出现不正确的状态/*/uint8 idata nAsrStatus=0;unsigned char Cnt=0;unsigned char CYCLE=80; /周期变量 20msint dianji=

50、45; /数值越小,速度越快int flag=0;sbit zuo1=P10;sbit zuo2=P11;sbit you1=P12;sbit you2=P13;sbit ena=P14;sbit enb=P15;void delayms(unsigned int m)/10ms int a, b; for(a=0;a3000;a+) for(b=0;bm;b+); 第 25 页 共 40 页 /LD3320 送出中断信号,ASR 中断,需要在中断处理函数中处理void ExtInt0Handler(void) interrupt 0 ProcessInt0();void MCU_init()

51、 /单片机初始化程序P1M0 |= 1;P3M0 |= 8;P4SW = 0 xFF;P0 = 0 xff;P1 = 0 xff;P2 = 0 xff;P3 = 0 xf3;P4 = 0 x3f; / 接口方式 SPILD_MODE = 1;/设置 MD 管脚为高,SPI 模式 IP=0;IPH=0;PX0=1; PT0=1;PS=1;IPH |= 1;EX0=0;EX1=0;EA=1;TMOD =0 x01;/定时器设置 1ms in 12M crystalTH0=(65536-250)/256; TL0=(65536-250)%256;/定时 1mS EA=1;/打开中断ET0=1; TR

52、0=1; ena=0;enb=0;zuo1=0;zuo2=0;you1=0;you2=0; 第 26 页 共 40 页 /* 以下是小车的控制程序,前进,后退、左拐、右拐、提速、降速/*/ void qianjin()ena=1; / 使能电机左右两个电机的使能端enb=1;flag=0; /PWM 取反时的标志位void houtui()/PWM 值 给反的就能倒退了 ena=1;enb=1;/ 使能电机左右两个电机的使能端flag=1;/PWM 取反时的标志位void zuoguai() ena=0;/ 使能电机左右两个电机的使能端enb=1;flag=0;void youguai() e

53、na=1;/ 使能电机左右两个电机的使能端enb=0;flag=0;void stop() ena=0;enb=0;flag=0;void jiasu() dianji-=10;if(dianji=70) dianji=25;void main()uint8 idata nAsrRes;MCU_init();LD_reset();nAsrStatus = LD_ASR_NONE;/初始状态:没有在作 ASR while(1)switch(nAsrStatus)case LD_ASR_RUNING:/表示 LD3320 正在作 ASR 识别中case LD_ASR_ERROR:/表示一次识别流程

54、中 LD3320 芯片内部出现不正确的状态break;case LD_ASR_NONE: / 表示没有在作 ASR 识别/FlashLED(1);nAsrStatus=LD_ASR_RUNING;if (RunASR()=0) /启动一次 ASR 识别流程:ASR 初始化,ASR 添加关键词语,启动 ASR 运算nAsrStatus = LD_ASR_ERROR;break;case LD_ASR_FOUNDOK: /表示一次识别流程结束后,有一个识别结果nAsrRes = LD_GetResult(); /一次 ASR 识别流程结束,去取 ASR 识别结果if(nAsrResITEM_COU

55、NT)switch(nAsrRes) case 0: qianjin(); / 对应AsrItem.h中的 STR_00“qian jin” , break; case 1: houtui(); /LED1 对应AsrItem.h中的 STR_01hou tui” , 第 28 页 共 40 页 break; case 2: zuoguai(); /对应AsrItem.h中的 STR_02“you guai” , break; case 3: youguai(); /对应AsrItem.h中的 STR_03“zuo guai” , break; case 4: stop(); /对应AsrIt

56、em.h中的 STR_04“ting zhi” , break; case 5: jiasu(); /对应AsrItem.h中的 STR_05“jia su” , break; case 6: jiansu(); /对应AsrItem.h中的 STR_06“jian su” , break; default: break; nAsrStatus = LD_ASR_NONE;break;case LD_ASR_FOUNDZERO: /表示一次识别流程结束后,没有识别结果default:nAsrStatus = LD_ASR_NONE;break; /*/* 定时器 0 中断服务函数 */*/vo

57、id Timer0(void) interrupt 1 TH0=(65536-250)/256; TL0=(65536-250)%256;/定时 0.25mS Cnt+; 第 29 页 共 40 页 if(Cnt=dianji)&(!flag)zuo1=1;you1=1;if(Cnt=dianji)&(flag) /反 PWM 波/zuo1=0;zuo2=1;/you1=0;you2=1; if(Cnt = CYCLE)&(!flag)/低电平时间到zuo1=0;you1=0;Cnt=0;if(Cnt = CYCLE)&(flag)/低电平时间到反 PWM 波zuo2=0;you2=0;Cnt

58、=0; 开题报告:开题报告:基于语音控制的智能车设计基于语音控制的智能车设计 第 30 页 共 40 页 1选题的目的、意义及国内外对本课题涉及问题的研究现状选题的目的、意义及国内外对本课题涉及问题的研究现状:选题的目的、意义(理论意义、现实意义):(1)选题目的 通过对该课题的研究,一方面理解语音识别技术的原理,了解当前的发展水平,分析国内外语音识别技术水平之间的差距。另一方面,根据自己当前对语音控制系统的研究,为语音控制无人驾驶汽车的应用,奠定良好的基础。(2)选题意义现实意义:目前现代生活水平不断提高,人们对智能化产品有着前所未有的巨大需求。语音识别技术,是世界上最热门和最具发展前景的新

59、型技术之一1-2。语音智能控制简便、快捷的交互方式以及稳定、精准的控制效果得到越来越多人的认可。语音控制的出现和发展也给残障人士带来了巨大福音,让其自主出行和生活自理成为可能。语音控制轮椅将很好的解决传统器械需要按键、需要旁人辅助等问题,为残障人士的出行提供方便。未来交通工具的驾驶将不再局限于手工操控,语音控制必会为其提供更方便,更准确,更安全的驾驶方案。随着语音识别技术和电子行业的发展,语音控制将取代现有的鼠标、键盘、触摸屏等,成为新一代人机交互方式3-4。 理论意义:本设计以 STC89C52 单片机为核心,并采用 ICRoute 公司高性能 LD3320 语音识别芯片和相关电路,实现了语

60、音控制小车的设计任务。使其可根据语音提示,做出前进、停止、后退、左转、右转和加速、减速等相应动作。LD3320 集成了语音识别处理器和外部电路,包括 AD 转换器、麦克风、声音输出等接口,不需要外接任何 Flash、RAM 等5-6。直接集成便可实现语音识别、声控、人机对话等功能。识别关键词语是可以任意动态编辑的,因而满足了小体积、低功耗的要求7-8。选题的研究现状(理论渊源及演化、国外相关研究综述、国内相关研究综述):(1)理论渊源及演化自从人类可以制造和使用各种机器以来,人们就有一个理想,那就是让各种机器能听懂人类 第 31 页 共 40 页 的语言并能按照人的口头命令来行动,从而实现人机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论