(无线电物理专业论文)无线遥控与语音识别机器狗的研制.pdf_第1页
(无线电物理专业论文)无线遥控与语音识别机器狗的研制.pdf_第2页
(无线电物理专业论文)无线遥控与语音识别机器狗的研制.pdf_第3页
(无线电物理专业论文)无线遥控与语音识别机器狗的研制.pdf_第4页
(无线电物理专业论文)无线遥控与语音识别机器狗的研制.pdf_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

兰州大学研究生学位论文 无线遥控与语音识别机器狗的研制 摘要 用计算机技术、控制技术、通讯技术来完善机械产品的性能并使之 向智能化方向迈进是传统机械行业发展的趋势,具有广阔的发展前景。本 文以玩具机器狗的研制为切入点,运用既具有微控制器功能又具有d s p 运算功能的凌阳s p c e 0 6 1 a 单片机为核心,对其信息处理和传感器部分进 行了整体设计。s p c e 0 6 1 a 芯片内置的在线仿真电路接口和其在线串行编 程技术,使其软件的编程与调试变的非常灵活,便于二次开发。本机器狗 具有语音识别功能,又可进行无线遥控,具有自动判断障碍物和感知触摸 的功能。 关键词:机器狗;无线遥控;语音识别;s p c e 0 6 1 a ;机电一体化 兰州大学研究生学位论文 a b s t r a e t c o n s u m m a t et h e p e r f o r m a n c e o fm e c h a n i c a l p r o d u c t s w i t h c o m p u t e r t e c h n o l o g y 、c o n t r o lt e c h n o l o g ya n dc o m m u n i c a t i o nt e c h n o l o g y ,a n dm a k e i t s t r i d ef o r w a r di n t e l l i g e n t i z e ,w h i c hi st h et r e n do f d e v e l o p m e n t o ft r a d i t i o n a l m e c h a n i c a li n d u s t r y ,a n dh a sw i d ed e v e l o pf o r e g r o u n d 。t h i sp a p e rf o c u so n d e v e l o p o f t o ym e c h a n i c a ld o g ,d e s i g nt h ei n f o r m a t i o nd e p o s a lp a r ta n d s e n s e o r g a np a r tw i t hs p c e 0 6 1 a s c mw h i c hh a st h ef u n c t i o no f m i c r o c o n t r o l l e r a n dd s p o p e r a t i o n 。s p c e 0 6 1 ac h i p h a ss i m u l a t eo n - l i n ec i r c u i ti n t e r f a c e a n do t h e rs e r i a lp r o g r a m t e c h n i q u e ,w h i c hm a k e s o f t w a r ep r o g r a m m ea n d d e b u g g i n gv e r y f l e x i b l e ,s oc a r lc o n v e n i e n tf o re x p l o i t i n ga g a i n t h e m e c h a n i c a ld o gh a st h ef u n c t i o no f s p e e c hr e c o g n i z a t i o n 、w i r e l e s sr e m o t e c o n t r o l 、j u d g i n g o b s t a c l ea u t o m a t i c a l l ya n d a p p e r c e i v i n g t o u c h k e y w o r d s :m e c h a n i c a l d o g :w i r e l e s s r e m o t e c o n t r o l ;s p e e c h r e c o g n i t i o n ;s p c e 0 6 1 a ;m e c h a t o r n i c s ( m e c h a n i c a ls y s t e m ) 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行 研究所取得的成果。学位论文中凡引用他人已经发表或未发表的成果、 数据、观点等,均已明确注明出处。除文中已经注明引用的内容外,不 包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究成 果做出重要贡献的个人和集体,均已在文中以明确方式标明。 本声明的法律责任由本人承担。 论文作者签名:玉l 鸩望 日期: p j - 纹w 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰 州大学。本人完全了解兰州大学有关保存、使用学位论文的规定,同意学 校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被 查阅和借阅;本人授权兰州大学可以将本学位论文的全部或部分内容编入 有关数据库进行检索,可以采用任何复制手段保存和汇编本学位论文。本 人离校后发表、使用学位论文或与该论文直接相关的学术论文或成果时, 第一署名单位仍然为兰州大学。 保密论文在解密后应遵守此按定。 论文作者签名:淄导师签名:车龃日 期:! 生坐 兰州大学研究生学位论文 引言 机器人研究者正把越来越多的目光投注到家用机器人上。这包括从提供家庭日 常服务的机器人到机器人玩具。随着人们生活水平和生活质量的提高,这些机器人的 需求量将会越来越大。尤其是玩具机器人,目前已成为诸多大的生产厂家的追逐热点。 玩具机器人通常只需要提供一些简单的功能,因此价格比较低廉。但是真正的智 能机器人,由于其技术含量比较高,所以价格相对较高。目前世界上有三种智能狗, 有日本的爱博狗和英国的大丹狗以及银辉公司生产的爱奏比。英国的大丹狗鲜为人 知,因它是为军事应用而模仿英国大丹狗而设计制造的,它不是玩具,曾作为非卖品 在一些特殊场合展览过。日本的爱博狗作为高科技电脑的产物而皤名于世,它是技术 概念性智能狗,不完全是普通玩具。它是玩具机器人的典型,其功能主要包括自动翻 身、平地四足行走、简单艘体动作、简单语音表达、识别和控制能力、基本触觉能力, 等等。机器狗全身总共约有十余个关节,每个关节都有相应的侍服控制回路。这些控 制回路由几个数字处理芯片管理控制。去年推出的机器狗,价格约在两千荚金左右, 可谓不菲,一般家庭难于消受。价格所以居高不下,一个关键原因则在于侍服回路部 分。可接受的较高精度的侍服回路,小批量价格常常也高达一二百美金。对于机器狗 来说,仅此一项,总共就需近千美元。爱奏比是国产智能机器狗,特别强调人性化的 情感,将高科技科普化,只要读懂说明书的人都可以玩这种高智能的玩具。即使这样, 每只价格也在3 6 0 0 元左右。因此,如何在性能和价格之间取一个折中,乃十分关键。 一种降低费用的途径,是全部自行设计控制嚣和主要部件,从最基本的控制电路开始。 鉴于智能玩具的市场需求比较大,而现有的智能机器狗的性价比又极高,不是大多数 工薪阶层所能接受,我们想研发一款性能价格比较高的真正的智能玩具狗,使之更适 合于酱通人,且其功能也是可以接受的。 1 机器狗的硬件组成及整体功能 机器狗主要由机械部分和电子部分组成,机械部分由机架部分、行走机构、头部 、 运动机构和传动部分组成:电子部分由硬件部分、软件部分组成。机器狗具有前进和 转弯的行走功能,头部具有左右转动功能。这些动作既可以用语膏遥控也可以用无线 遥控实现。它能够识别十个语音命令,和六个无线遥控指令,它具有检测障碍物和感 知触摸的能力,有障碍物时自动停止前进,并发出警告,当有触摸时能发出欢快的声 兰州大学研究生学位论文 音。 l - 1 机械部分的组成 外部结构的设计采用自行设计,使其外形与真狗相像。 行走机构的设计,主要是腿的机构设计,这里我们采用易于加工和制造的连杆机 构,来模仿狗腿的运动。但连杆机构设计比较复杂,需要进行大量的实验才能得到合 理的运动曲线。 为了使设计简化,头部的运动比较简单,只有一个自由度,即可以左右转动。为 此只需要把头固定在一个可以转动的轴承上,其传动端与电机的传动链相连,则通过 改变电机的正反转实现头部的左右转动。 传动部分的设计。传动部分的主要功能是降低速度和增加力矩。用一拔叉控制电 机与腿之阔传动链的脱离与结合。拔叉在没有外力的作用下,处于中闯位置,使电机 与两腿之间的传动链相联,当拔叉受到向右或向左的力矩时则使右腿或左腿与电机的 传动链脱离,从而实现转弯时的动作配合,在失去外力后有复位弹簧使其复位。 由于机械部分的设计制作需要专门的知识和设备,而我们暂时并不具备这样的条 件,所以我们仅仅对行走机构和转弯机构的原理进行了初步设想,以便于和电子部分 的功能相衔接。正是因为机械部分没有实际制作,所以还很不成熟,有待于进一步完 善。 1 2 电路部分的设计与实现 1 2 1 电路部分的整体原理框图 电路部分的整体原理框图如图1 1 所示。圈中的s p c e 0 6 1 a 最小系统板( 简称6 l 板) 是以1 6 位单片机s p c e 0 6 1 a 为核心的精简开发仿真实验板。它是整个控制电路的 核心。s p c e 0 6 1 a 内置有3 2 k 字的f l a s h 和2 k 字s r a m ,具有可编程音频处理功 能,2 个1 6 位可编程定时器计数器,2 个l o 位d a c 输出通道,3 2 位通用可编程输 入输出端口,1 4 个中断源可来自定时器工a b 、时基、2 个外部时钟源输入和键唤 醒,3 2 7 6 8 h z 实时时钟,7 通道l o 位电压模数转换器和单通道声音模数转换器且声 音模数转换器输入通道内置麦克风放大器,并具有自动增益控制( a g c ) 功能。另外 6 1 板还包括有电源电路、音频电路( 含m i c 输入部分和d a c 音频输出部分) 、复位电 路等。图中s p r f 2 7 1 6 是2 7 m 载频的无线通信模块,f s k 半双工收发器,数据传输速 率为5 k b p s ,具有8 个通道,功率为1 0 r o w 。 2 兰州大学研究生学位论文 图1 1 控制系统组成框图 系统的工作原理是:系统初始化后进入键控状态,可以通过按键选择以下功能: k e y l 选择语音锕练功能,k e y 2 选择语音识别功能,k e y 3 选择无线遥控功能。当选择 k e y l 时可进行语音训练,包括训练狗的名字、前进命令、左转命令、右转命令和停止 命令以及唱歌、睡觉、向右看、向左看、准备前进命令。训练好后按k e y 2 键进入语 音识别功能,此时可对遇障碍物事件与触摸事件做出反应。若要进行无线遥控需要 r e s e t ,然后按k e y 3 便进入无线遥控状态。无线遥控命令有:前进、左转、右转、停止、 向右看,向左看等。在前进过程中可对遇障碍物事件与触摸事件做出反应。指令中涉 及语音的命令,由6 l 板自身做出反应,指令中涉及运动的命令则通过相应f o 口输出 至电机控制模块,以完成对前进、转弯和头部电机的控制机器狗在行进过程中,一 直打开二个外部中断,一个用于判断有无触撰事件的发生,如果有则跳转到语音播放 程序,发出狗的叫声;一个外部中断用于判断前方有无障碍物,如果有则停止前进, 并提示前面有障碍,请求帮助。以上只是控制系统的原理框图,整体电路原理图见附 兰州大学研究生学位论文 象一o 1 2 2 主控电路的设计 控制部分6 l 板与外围电路的硬件联结如图1 3 。s p c e 0 6 1 a 的开发是通过在线 调试器p r o b e 实现的。它既是一个编程器,又是一个实时在线调试器。它可以替代 在单片机应用项目的开发过程中常用的软件工具。它利用了s p c e 0 6 1 a 芯片内置的在 线仿真电路i c e ( m - c k c m te m u l a t o r ) 接口,凌阳i d e 集成开发环境软件包下开发, 其5 芯的仿真头直接连接到目标电路板上6 l 板的相应引脚,直接在目标电路板上的 c p u 上调试、运行用户编制的程序。p r o b e 的另一头是标准2 5 针打印机接口,可直 接连接到计算机打印口与上位机进行通信,在计算机i c e 集成开发环境软件包下, 完成在线调试功能。 图中s p r 4 0 9 6 是一个高性能的4 m - b i t ( 5 1 2 k 8 - b i t ) f l a s h ,s p r 4 0 9 6 还内置了一个 4 k x 8 b i t 的s r a m 。s p r 4 0 9 6 串行接口的工作频率可达5 m h z 。s p r 4 0 9 6 有两个电源 输入端v d d i 和v d d q 。v d d i 是给内部f l a s h 和控制逻辑供电的,电压由图1 2 所 示电路获得。 v c c 理图v c c 由r l 和r 2 分压后, 使a 点电压为3 v ,经运算放大器同比例输出得到3 v 稳定电压v d d 。v d d q 是专门 为f o 供电的,它由v d d i 经二极管降压后得到。它的允许电压分别为v d d q :2 2 5 v 3 , 6 v ) d i :2 2 5 v - 二2 7 5 v 。s p r 4 0 9 6 按串行接口模式工作,要把c f 2 c f o 均接 高电平。c f 7 为低电平时选中f l a s h ,高电平时选中s r a m 。 由图1 3 可知,i o a 是作为输入端口,接收来自无线模块、按键、传感器等等 信息,由s p c e 0 6 1 a 进行综合处理,做出相应判断并由l o b 输出到执行电路,从而使 执行部件实现控制者的意图。下面我们把i o a 和1 0 b 口各引脚的功能见表i 1 、表 1 2 。 4 兰州大学研究生学位论文 i o a 口为输入端口,其各口功能分配见袭1 1 : 端口 1 0 a 01 0 a l1 0 a 21 0 a 3i o a 41 0 a 5i o a 6i o a 7 判障传触摸传 无线信语音训语音识无线遥 功能感器入感器入留用留用 号输入练键别键控键 口口 表1 ,1 兰州大学研究生学位论文 i o b 口为输出端口,其各口功能分配见表1 2 : 端口 1 0 b o1 0 8 11 0 8 21 0 8 31 0 8 41 0 8 5 i o b 61 0 8 7 转弯电转弯电头部电头部电 主电机 功能s c ks d a机主开机正反机主开机正反留用 开关 关转关转 表1 2 1 2 3 避障传感器电路的设计 为了降低制造成本,采用了分立元件自行设计了一种红外判断障碍物的电路 其原理如图1 4 所示: 图1 4 判断障碍物电路原理图 其工作原理:当有障碍物时,红外发射二极管发出的红外光被物体反射,红外 接收二极管接收后内阻变小,使a 点的电压降低,a 点电压作为输出接入一比较电路。 比较电路是由两个三极管组成,分别为n p n 型和蟊n p 型,其门限电压由可调电阻r 5 决定,调节r 5 可以使输出端u 。在机器狗距离障碍物2 0 厘米左右时发生跳变。将判障 电路的输出引入s p c e 0 6 1 a 的1 0 口,可引起中断,执行相应中断服务程序。 1 2 4 触摸传感器电路的设计 本电路由单稳触发电路与放大器构成的反相电路组成,如图1 5 : 6 兰州大学研究生学位论文 其工作原理是:i c l 采用5 5 5 时基电路,平时,由于它的2 脚通过电阻r l 接至 v v o ,使该脚呈高电位,5 5 5 置于复位状态,即输出呈低电位。当有人触摸金属片m 时, 人体感应的杂波信号经c 1 耦合至5 5 5 的触发端2 脚,使单稳态触发器翻转而呈高电 平,其暂稳时间为: 铲1 1 r 2 c 2 5 5 5 电路的输出端接运算放大器的输入端,由原理图可知: 1 0 ( u = d ) u o = v o d - u = 1 1 l ( 劬;o ) 运算放大器组成反帽器,使触摸时的u 的电平上升沿变为砺的电下降沿,接单片 机的i o 口,利用下降沿触发外部中断,引起响应。 1 2 5 继电器驱动电路的设计 由于单片机i o 口提供的电流很小,不能直接驱动继电器。在这里采用三极管 8 0 5 0 来提供一个开关电压,实现i o 口对继电器的驱动,用i n 4 0 0 7 去调继电器断开 时线圈产生的反向电流,保护8 0 5 0 。 由第一章可知,执行各动作时三个电机的状态由表1 3 7 兰州大学研究生学位论文 前进左转弯右转弯停止头左转头右转头停止 m l+ + o m 20 +o m 3 + 0 表1 3 说明:1 m 1 、m 2 和m 3 分别为行走电机、转弯电机和头部电机 2 + 、一、0 、分别表示电机正转、反转、停止、任意 根据表1 3 设计驱动电路如图1 6 所示: 儿b 一射 -i j 4 。_ j - - 一 ) 儿一引 hr 鞠 7 1 ll j 2 i 图中m 1 、m 2 、m 3 分别为主电机、转弯电机和头部电机,由图可知各开关的作 用,j 1 由i o b 2 控制,j 2 由i o b 3 控制,j 3 由i o b 4 控制,j 4 由i o b 5 控制,j 5 由i o b 6 控制。j 1 控制主电机m 1 ,j 2 和j 4 控制转弯电机m 2 和头部电机m 3 的通断,j 3 和 j 5 控制转弯电机m 2 和头部电机m 3 的正反转,它们是都具有两组常闭触点和两组常 开触点的继电器,当继电器通断电时可改变流过电机的电流方向,从而实现电机的正 反转。 2 机器狗的软件设计 2 1 系统总体软件设计 由于使用s p c e 0 6 1 a 单片机作为控制核心,所以外围电路比较简单,整个系统的 主体任务就落到了软件的设计上。系统主程序流程图见图2 1 。 软件是本系统的灵魂,在设计软件时,主要从系统实用、可靠及方便等几个方面 出发,使程序满足设计要求。程序包括四部分:语音训练子程序、语音识别子程序、 s 兰州大学研究生学位论文 无线遥控子程序和执行输出子程序。主程序用c 语言编写,c 语言具有代码清晰易读、 易维护、易形成模块等优点。打开电源后,通过按键选择功能。然后进入相应的子程 序。主程序源代码见附录二。 图2 1 主程序流程图 z 2 执行输出子程序的软件设计 如图2 2 所示是语音遥控时的主程序流程框图当选择k e y 2 进入语音识别状态 后,机器狗等待触发命令,当触发命令正确时做出应答。并等待其它语音命令,语音 命令主要有两类,一是指挥腿动作的命令, 左转弯、右转弯的命令时打开吣5 中断, 二是指挥头动作的命令。当识别出前进、 根据读回的值确定外部事件,如果有触摸 或有障碍物,机器狗会发出叫声并停止前进。如果无障碍物则执行前进、左转弯或右 转变。由于库函数和内存的限制。十个命令必须分成两组,并分别调入内存。所以停 止命令和准备前迸命令是两命令组的切换命令。头部动作命令的执行比较简单,i o b 5 和i o b 6 配合动作就可完成。 9 兰州大学研究生学位论文 图2 2 语音遥控时的主程序流程图 1 0 兰州大学研究生学位论文 2 3 对多个中断源的合理使用 由于本系统使用了多个中断源,如果不能合理安排各中断的优先级别,会造成 系统运行的紊乱。因此对中断源的合理使用是本系统的个难点和重点。 语音播放和识别用到t u n e r a ( f i q ) 中断,无线遥控 编码的接收也用的是t i m e r a 内部中断,把之设置为m q l 中断,以避免与语音播放和识别中断的冲突。另外触摸传 感器和判断障碍传感器得用4 h z 时基中断( i r q 5 中断) 。 f i q 中断服务程序和m q l 中断服务程序由后面章节单独 讨论,m q 5 中断服务程序流程图如图2 3 所示。 3 无线遥控的硬件及软件实现 3 1 无线遥控模块的设计 各种电信号特征都可以用来做遥控指令,如电压极 性、电信号相位、电信号的幅度、电信号的频率、脉冲信 号的编码,脉冲信号的宽度、相位、幅度等。其中脉冲编 码指令具有指令容量大、抗干扰能力强、保密性好和便予 用数字逻辑电路来实现的优点,因此本系统的编码方式采 用脉冲编码方式。 遥控系统对遥控指令信息传输的可靠性要求是很高 的,通常都对指令码组加以保护和监督,以便使遥控指令 尽量不出或少出错,即使出了差错也能很快的被发现或纠 正。保护码组的方法有:奇偶校验、定和校验和循环码校 验。本系统采用奇偶校验,确认遥控指令的正确性。 遥控指令的准确传送在很大程度上是依赖于正确的 同步。同步不良将给系统的传输质量带来严重的损害,甚 至不能正常工作。在数字式系统中,g - + 遥控指令都是经 过逐位编码的。所以,它的一帧除分为若干个码字外,每 ( 中断入口) 上 关中断 l 现场保护 i s t a t e i o a = p i d a d a t a l ls t a t el o a 4 = s t a t ei o a l& 0 x 0 0 2 0 上 s t a t ei o a 5 = s t a t ei o a 0 x 0 0 2 0 l 清中断标志位 0 恢复现场 上 开中断 ( 中断返回) 图2 3i r q 5 中断服务 程序流程圈 一码字又由若干码元组成,这样对数字式遥控系统来说,除传送帧同步外,还要传送 字及位同步信息。一般遥控系统的时序电赂都是使用精度很高的晶体振荡源,各种信 兰州大学研究生学位论文 号都可以由它产生出来,只要解决了起始位置对齐,其位同步问题就可以由晶体振荡 源的精度来保证。总之,在数字式遥控中,同步系统的作用就是将发端的码元、码字、 帧的起止时刻,准确地传到接收端,保证收发同步工作。同步信号一般有以下几种: 采用高电平脉冲,它的抗干扰能力太差,很少采用;采用宽脉冲,这种方式抗干扰能 力大大增强,故得到了广泛应用;采用脉冲对,即在正常信息中插入两个脉冲间隔小 于正常信号间隔的脉冲对做同步脉冲,也具有较强的抗干扰能力,也是较常用的一种 同步脉冲形式;采用脉冲码组,即利用多个脉冲组成的脉冲组来做同步脉冲组。本系 统采用脉冲码组作为同步信号,以保证指令代码的接收与发送同步。 3 1 1 系统组成 本遥控模块主要由凌阳s p c e 0 6 1 a 单片机和s p r f 2 7 1 6 无线收发模块以及遥控按 键组成,系统框图如图3 1 所示。 图3 1 遥控模块系统框图 这个系统的基本工作流程为:遥控器电源打开之后,s p c e 0 6 1 a 开始进行键扫描, 当有遥控键按下,便把其键值写入内存,并通过对键值的处理,使发射端口获得遥控 编码,并用4 k h z 的t i m c r a 中断送至s p r f 2 7 1 6 的d a t ai n 端口,由s p r f 2 7 1 6 发射 出去。 3 1 2 硬件设计 系统电路原理图如图3 2 所示。通过按键使i o a 0 i o a 6 上获得不同的键值, s p c e 0 6 1 a 运行按键扫描程序和按键去抖程序,把i o a 端口上的稳定键值读入内存。 由程序判断按键的功能,并开放4 k h z 的t u n e r a 中断,把无线控制指令以一定的数据 编码格式发送出去。 图中s p r f 2 7 1 6 由单片机控制,i o b 0 是单片机脉冲编码的输出端,与d a t ai n 相联,l o b l 按s p r f 2 7 1 6 的放大使能端,高电平使能。i o b 2 接s p r f 2 7 1 6 的发射控 制端,高电平发射,低电平接收。单片机的i o a 口作为按键输入端口,单片机通过对 i o a 口的扫描,获得健值并将相应键值转换为脉冲编码通过l o b 0 口输出到s p r f 2 7 1 6 。 1 2 兰州大学研究生学位论文 图3 2 无线发射电路原理图 3 1 3 软件设计 软件的设计主要包括两个部分:一是无线遥控的控制时序和传输协议的确定。二 是s p c e 0 6 1 a 的处理程序,主要完成按键的判断并按传输协议发射出遥控指令。 控制时序和传输协议的确定。由于无线传输易受杂波的干扰,而且各厂家生产的 无线收发模块的性能和特点也各有不同,因此必须根据具体的模块来确定控制时序和 传输协议一本遥控系统采用的收发模块是s p r f 2 7 1 6 ,控铆时序如图3 3 所示。图中 锁上延时时间依据锁相环的带宽确定。 兰州大学研究生学位论文 r a e n 竺三l厂 厂 厂 厂 一锁上延时k 图3 ,3s p r 2 7 1 6 的发射控制时序 在无线传输中,为了使接收端的输出信号进入稳定状态,常需要在起始位之前有 一段较长的导言,其格式为“0 1 0 1 0 1 0 l ”,起始位和控制信号紧跟其后,为了避 免连续的“0 ”或“1 ”,采用m a n c h e 啦rc o d i n g ,这种编码方式的特点是,不会出现 3 个连续的“0 ”或“1 ”,且无直流成份。以m a n c h e g e rc o d i n g 编码格式规划的控制 指令信息的发射格式如图3 4 所示。 长导言起始位命令代码 导言 l 厂1 厂 么一厂 l1 0 2 5 m s l0ll01 图3 4 指令信息发射格式 s p r f 2 7 1 6 模块具有可扩展功能强大、易于应用和灵敏度高的特点。由于灵敏度高, 使之在相同的有效控制距离内具有能耗较低的优点,但同时也带来在收发转换的瞬间 杂波干扰比较严重的弊端,需在编程序时予以考虑。 无线发射子程序流程图如图3 5 所示。 s p c e 0 6 1 a 控制程序主要由四部分组成:第一、初始化s p c e 0 6 1 a 。主要是对f o 口的设置。i o a i o a 7 设置成带下拉电阻的输入引脚。i o b 0 接发射模块的d a m 一 端口,设置为带数据缓存器的高电平输出;l o b l 接发射模块的p a e n 端口,即放大 使能端,高电平使能,i o b t 设置为高电平,以放大发射功率。i o b 2 与t 瓜( 发射控 制端) 相连,高电平为发射,低电平为接收,此口设置为带数据缓存器的高电平输出。 第二、键盘扫描和按键去抖程序。这部分的任务是把i o a 的可靠健值读入内存。在键 兰州大学研究生学位论文 扫描的过程中,先置i o a 0 i o a 7 为带数据缓 存器的高电平输入,此时若有键按下,读取 i o a 口上的值,再经过按键去抖处理,取得键 值并把此值保存下来。键盘扫描的中断服务程 序流程图见图3 6 。按键去抖程序的主要功能 是防止按键时由于机械反弹的原因而发生多 次触点闭合断开的情况发生,避免了误操作。 第三、判断键值并把指令代码赋予指令变量。 程序通过判断键值,跳转至控制指令赋值语 句,指令变量被赋值为相应的二进制指令代 码。 图3 5 无线发射子程序流程图 图3 6 键盘扫描中断服务程序流程图 兰州大学研究生学位论文 第四、循环体部分,主要任务是等待中断,并判断中断次数,决定何时返回主函 数,重新进入等待指令状态。在指令交最取得指令t 代码后,便设置并打开t i m e r a 中 断,然后程序执行循环体,依次串行输出指令代码,并判断指令是否输出完毕,如果 输出完毕,则跳转至按键扫描程序,等待新指令的输入。第五部分是中断服务程序, 其程序流程图见图3 7 。 图3 7 无线发射中断服务程序流程图 1 6 兰州大学研究生学位论文 说明:框图中m 、n 分别代表导言位数和起始位位数。 进入中断之后,首先发射导言部分,偶数发“0 ”,奇数发“l ”,导言计数器满之 后发射起始位,起始位计数器满之后,发射指令代码,发射完毕盾,指令代码计数器 返回循环体,作为判断中断结束的标志。 3 2 无线接收模块的设计 3 2 1 系统组成 本遥控模块主要由凌阳s p c e 0 6 1 a 和s p r f 2 7 1 6 组成,系统框图如图3 8 所示: 图3 8 无线接收模块系统组成 这个系统的基本工作流程为;程序初始化之后,打开4 k h z 的t i m e r a 中断扫描 i o a 口,对连续“0 1 ”避行实时监控,当连续“0 1 ”计数器达到一定数值时,便开始 检翔4 起始位。当检测到起始位后,开始读取i o a 0 的数据,存入指令变量并逻辑左移。 当信号全部接收完毕,各计数器归零。判断指令变量的值并转入相应执行程序,等待 下一个指令的到来。 3 2 2 软件设计 软件的设计主要包括两个部分:一是通过无线接收把控制信号从i o a 0 串行读入 内存,这主要由中断服务程序完成。二是s p c e 0 6 1 a 的处理程序,主要完成对控制指 令的识别并根据指令把控制信号从1 0 b 口输出。 无线接收的软件编程,其中断服务程序流程图见圈3 9 。当系统进入无线遥控状 态之后,便打开4 k h z 的t i m e r a 中断实时监控i o a o d 并对连续的“o l ”进行计数。 当连续“0 1 ”达到足够的数量后,贝判定导言部分已经到来。接着对起始位进行判断。 当检测到起始位之后,则要对后面的数据信息进行移位操作并计数,当控制信息完全 接收完毕并把结果存入内存时。数据接收完毕,各计数器要及时清零并返回接受命令 状态。 控制信息成功接收之后,就要对接收的数据进行处理,这主要是解码移执行语 句。对于按照m a n c h e s t e rc o d i n g 规则处理过的指令,可以编写一个子程序进行解码, 1 7 兰州大学研究生学位论文 解码后进入多分支程序结构,首先通过奇偶校验法确定指令的正确性,如果指令错误, 则不进行任何操作,返回接受命令状态。如果是正确的指令,则通过分支结构跳转到 相应的执行程序,使l o b 口的相应引脚获得控制外部驱动电路的电平信号。 图3 9 无线接收中断服务程序流程图 说明:m 1 :导言次数判断,m 1 - t m + n 兰州大学研究生学位论文 n :起始位次数判断 4 语音识别与播放 语音播放采用凌阳公司提供的音频编码算法,先在p c 机上录好语音文件( w a v 文件) ,并经凌阳公司提供的压缩工具压缩处理成二进制文件加载到用户程序,编译 链接后存储到f l a s h 中,播放时再解压缩并送d a 还原出语音。用于u n s p t m 内核的 s p c e 系列芯片,凌阳公司提供三种不同压缩率的算法,下表是各种压缩算法名称及 编码宰类型。 压缩算法名称语音压缩编码率类型i ! s a c m _ a 2 0 0 0 l6 k b i t 幽、2 0 k b i t s s 、2 4 k b i t s s s a c ms 4 8 04 8 k b i t s s 、7 2 k b i t s s l i s a c ms 2 4 0【2 4 k b i t a s 对较小,音质较好,相应的资源占用较多。s a c m _ s 2 4 0 的压缩率最大,音质相对较 差。s a c m8 4 8 0 介于这两者之间。每种算法都有完整的库函数供程序调用,软件编 写非常方便。本系统采用s a c m _ s 4 8 0 算法。 4 1 语音信号的产生及处理方法 语音信号是声道被激励发生共振而产生的输出。由于在发音过程中声道是运动 的,因此可以用一个时变线性系统来模拟。理想的模型是线性的,且时不变的;但是 语音信号是一连串的时变过程,且声门和声道相互耦合形成了语音信号的非线性特 性。做一个合理的假设,当在较短的时间间隔内表示语音信号时,则可以采用线性时 不变模型。图4 1 给出经典的语音信号的产生模型,语音信号被看成是线性时不变系 统在随机噪声或准周期脉冲序列激励下的输出。 1 9 兰州大学研究生学位论文 基音周期 i i 图4 1 语音信号产生模型 语音信号 第一种语音处理方法是时域分析法。语音信号处理系统包括语音通信、语音识 别、语音合成等几方面内容,其前提和基础是对语音信号的分析。语音分析就是从语 音信号中抽取表现其本质的特征参数的语音处理技术,只有分析出表现语音信号本质 的特征参数,才有可能利用这些参数进行高效的语音通信,才可能建立用于识别的知 识库,也才能建立用于语音合成的语音库。语音识别率的高低、语音合成音质的好坏, 都取决于对语音信号分析的准确性和精度。贯穿于语音分析全过程的是短时分析技 术。由于语音在个短时间范围内的物理特征与频谱特征近似不变,具有适时平稳特 性,因此可以把语音的分析和处理建立在短时分析技术的基础上,即将语音信号分段 来分析。其中每段称为帧。帧的长度叫帧长,前后帧之间的交叠部分称为帧移。 通常,由于语音在l o 3 0 m s 之内是保持相对平稳的,因此帧长取为l o 3 0 m s ,帧移 与帧长之比为0 1 2 。语音信号本身就是一种时域信号,因而时域分析是最早使用、 也是应用范围最广的一种方法。这种方法直接利用语音信号的时变特点即时域波形来 进行分析。时域分析具有物理意义清晰、运算简单等特点,通常用于最基本的语音参 数分析及语音的预处理、分割等方面。为了将原始的模拟语音信号变为数字信号,必 须经过采样和量化两个步骤,从而得到时间和幅度上均为离散的数字语音信号。根据 采样定理,当采样频率大于信号的2 倍带宽时,在采样过程中不会丢失信息,且从采 样信号中可以精确地重构原始信号波形。在实际语音信号处理中,采样频率通常为7 至l o k t l z ,相应采样频率最好为2 0 k h z 。在信号的带宽不明确时,采样前应接入防混 叠滤波器,使其带宽限制在某个范围内;否则,如果采样频率不满足采样定理,则产 卜瓣型h喇鬈盟趟。匿 一 翌o j 番黔 模一 晤器一 再生 丽必一 藤。一 颞艇一 一1 j g一品刈。翌圈 点 兰州大学研究生学位论文 生频谱混叠。此时,信号中的高频成分将产生失真;语音信号的量化过程一定会带来 误差,即量化噪声。研究表明:要使语音波形的动态变化信噪比达到5 5 d b ,量化分 辨率应取l o 位以上。 已经数字化的语音信号序列将被依次存入一个数据区。在语音信号处理中,一般 用循环队列的方式来存储这些数据,以便用一个有限容量的数据区来应付数量极大的 语音数据。在进行处理时,按帧从此数据区中取出数据,处理完成后再取下帧,如 此进行下去。一般来说,语音信号处理的帧长都是2 0 m s 。分帧后的语音信号可以用 一个长度有限的窗序列截取一段语音信号来进行分析;也可以用短时平均能量与 短时平均幅度来处理;还可以用短时平均过零率或短时相关分析等方法来处理。 第二种语音处理方法是频域分析法。傅立叶变换在信号处理中具有十分重要的作 用,它通常能使信号的某些特性变得根明显,而在原始信号中这些特性可能含糊不清 或至少不明显。在语音信号处理中傅立叶变换一直起主要作用。其原因在于:一方 面,稳态语音的生成模型由线性系统组成,此系统由一个随时间周期变化或随机变化 的源所激励,因而系统输出频谱反映了激励与声道频率响应特性:另一方面,语音信 号的频谱具有非常明显的语言声学意义,可以获得某些重要的语音特征。语音信号是 非平稳信号,其非平稳性是由发音器官的物理运动而产生的。这个运动过程与声波振 动的速度比起来要缓慢的多,因此可以按照上面作的合理假设,即极短时间内是平稳 的。短时分析应用于频域分析就是短时傅立时变换,楣应的频谱称为“短时谱”,即 有限长度的傅立叶变换。短时傅立叶交换最重要的应用是语音分析与合成系统,因为 由短时傅立叶交换可以精确地恢复语音波形。语音信号被认为是局部平稳的,故可以 对某一帧语音进行傅立叶交换。短时傅立叶变换的定义为; ! x 。( e 一) = x ( m ) o k 一m ) e 叫“ - - 由定义知,短时傅立叶变换是窗选语音信号的标准傅立叶变换。这里用下标1 1 区别于 标准的傅立叶变换。不阿的窗口函数序列,将得到不同的傅立叶变换的结果。由该式 知,短时傅立叶变换有两个自变量一和,所以它既是关于行的离散函数,又是关于 的连续函数。与离散傅立叶变换和连续傅立叶变抉的关系一样,令= 2j r k n ,则 离散的短时傅立叶变换为: 2 1 兰州大学研究生学位论文 石。( p 2 棚”) = z 。( 七) = x ( m ) m ( n - m ) e 一7 2 “0 s 胁7 - 1 m e m 它实际上是j 。0 ,。) 在频城内的采样。当,固定不变时,则是将窗函数的中心移至 处截取信号x ( n ) ,再进行傅立叶变换而得到的一个频谱函数。当频率固定时,则 x 。( e 巾) 可看作是信号经过一个中心频率为0 9 0 的带通滤波器后产生的输出。 第三种处理语音信号的方法是线性预测分析。1 9 4 7 年维纳首次提出线性预测,并 且这项技术在许多领域都得到应用。1 9 6 7 年板仓等人将线性预测技术应用到语音分析 和合成中。现在线性预测已经是语音信号处理中的核心技术,并被成功地皮用于语音 识别、合成、编码、说话人识别等方面。线性预测分析的基本原理是将被分析的信号 用一个模型来表示,即将信号看作是某个模型的输出,这样就可以用模型参数来描述 信号。在基于模型参数的谱估计和系统辩识研究中,经常假定模型的系统函数为有理 函数: 1 + 妻,z 一, 以加印表 其中:系数a ,、母及增益因子g 是模型的参数,而p 和q 是选定模型的阶数。当盘,- 0 时,爿j 为全极点模型,模型的输出只取决于过去的信号值,称为自回归模型a r 。 该模型的参数估计十分简便,而且往往只需很少几个极点就可以相当好地遇近一种频 谱或一种系统的频率响应。线性预测法是基于全极点模型假定,采用时域均方差最小 准则来估计模型参数的。它能与级联无损声道的语音产生模型相联系,并在频谱特性 度量方面发展了多种与人类听觉有密切联系的谱失真测度,因而在语音信号处理的各 个领域中得到广泛应用。对于全极点模型: 刖2 器2 面g 输出信号与输入信号“的关系可以表示为差分方程; j ( 刀) # 艺口,s ( n - i ) + g u ( 玎) 兰州大学研究生学位论文 定义线性预测器为:j ( n ) = q s 仰一f ) 因为它是由与j 相邻的前p 个值线性组合得到的,即由如) 过去的值来预测当前值。 式中的a i 称为线性预测系数。线性预测的基本问题是由语音信号直接决定一组预测器 系数 口j ,使预测误差在某个准则下最小。这个准则通常采用最小均方误差准则,这 个过程称为线性预测分析。 还有一种处理语音信号的方法是语谱图分析法。时域分析和频域分析都有自己的 局限性,因此,人们致力于研究语音的时间依赖于博立叶分析的方法。这种时间依赖 于傅立叶分析的显示图形称为语谱图,这种分析方法便是语谱图分析法。语谱图中显 示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优点,明显 地显示出语音频谱随时间的交化情况。实际上,这种语谱图是一种三维频谱,即同时 在时间和频率上显示出语音特性,或者说是一种动态的频谱。语谱表示语音频谱随时 间变化的图形,其纵轴为频率,横轴为时间。任意给定频率成分在给定时刻的强弱用 相应点的黑白度即色调的浓淡来表示。记录这种谱图的仪器就是语谱仪,它实际上是 通过一个带通滤波器的中心频率发生连续变化,重复再生并分析语音,来进行频率分 析的。语谱图的实际应用是确认讲话人的本性,即不同讲话者语音的语谱图是不同的, 因而可以利用其鉴别不同的讲话人。这与指纹可区别不同人是一个道理。 4 2 语音识别的基本原理 语音识别系统本质上是一种多维模式识别系统,基本结构如图5 1 所示。 it识别 i 南躲 调练l 匿l j 图4 2 语音识别系统基本结构 语音识别系统与般的模式识别系统类似,包括特征提取、语音模式库、模式匹配3 个基本单元。 兰州大学研究生学位论文 预处理包括预加重、反混叠滤波、模数转换、自动增益控制等处理过程,用以 取除声门激励、口鼻辐射、高于1 2 采样频率的高频噪声信号的影响,实现语音信号 的数字化。在语音识别中,预处理还包括在声学参数分析之前正确选择识别基元的问 题。经过预处理的语音信号,要对其进行特征提取,即特征参数分析。该过程就是从 原始语音信号中抽取出能够反映语音本质的特征参数,形成特征矢量序列。可选择的 语音特征参数有时域参数、频域参数等。语音模型库即声学参数模板。它是用聚类分 析等方法,从一个讲话者或多次重复的语音参数中,经过长时间的训练得到的。模式 识别即将输入语音的特征参数同训练得到的语音知识库进行比较分析,从而得到初步 识别结果。后处理是指在大词汇量连续语音识别系统中,为了提高识别正确率需要使 用语言模型,利用语音识别单位之间连接时的相互制约关系,采取统计方法与语法相 结合的方法建立语言模型,达到限制识别器译码时豹自由度,提高系统的性能。目前 后处理在嵌入式语音系统中还很难使用。 利用凌阳s p c e 0 6 1 a 单片机制作语音识别系统很方便,因为它把语音辨识的一些 功能作成了模块,并通过调用a p i 函数来实现这些功能。我们可以把凌阳单片机 s p c e 0 6 1 a 语音识别原理用图4 3 表示: 调用训练模块 初始化识别1 弱国丽 】 t r m n w o r d ( i n t 器控辨识处理 胃o r d i d i n t b s ri n t r e c ob s re n a b l e c一主-b s r e r r g n i z e r ( b s r p u i n d i c a t o re s u l t ( ) r e s p o n d l d ) 0m i c ) 图4 3 语音识别原理 语音识别分为特定发音人识别( s p e a k e rd e p e n d e m ) 和非特定发音人识别 ( s p e a k e r i n d e p e n d e n t ) 两种方式。 特定发音人识别是指语音样板由单个人训练,对训练人的语音命令识别准确率较 高,而其他人的语音命令识别准确率较低或不

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论