毕业设计(论文)-基于8051的声控设计.doc_第1页
毕业设计(论文)-基于8051的声控设计.doc_第2页
毕业设计(论文)-基于8051的声控设计.doc_第3页
毕业设计(论文)-基于8051的声控设计.doc_第4页
毕业设计(论文)-基于8051的声控设计.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

南京信息南京信息职业职业技技术术学院学院 毕业设计论毕业设计论文文 作者 学号 系部 电子信息工程系 专业 无线电技术(微波技术与器件) 题目 基于 8051 的声控设计 指导教师 评阅教师 完成时间: 2011 年 5 月 1 日 毕业设计毕业设计(论论文文)中文摘要中文摘要 题目:基于 8051 的声控设计 摘要:本设计是基于 8051 的声控设计,整个声控系统的组成是以声控芯片 RSC364 为核心所设计的声控模块(简称 VCMM)为中心来做应用,系统采用 模块化设计,扩充性佳,本身控制板可以适合不同的硬件工作平台。整套系 统可以做夸平台声控应用,可由串行接口来下命令道 VCMM 做声控处理。声 控模块系统构架主要有语音辨认芯片,程序 EPROM,FLASH 内存,单芯片 89C2051 组成。89C2051 是 8051 单片机的小型化设计包装,用于较简单化的 硬件设计上。语音辨认芯片采用 sensory 公司设计的芯片,主要优点为省电 及相关模拟电路简单,适合做小型多样化产品设计用。 关键字: 声控芯片;跨平台;外部联机;串行接口;声控模块 毕业设计毕业设计(论论文文)外文摘要外文摘要 Title:8051 voice-based design Abstract: The design is based on the 8051 voice design, the composition of the whole system is voice-activated voice chip RSC364 designed as the core voice module (referred to VCMM) to do applications for the center, the system is modular in design, good expandability, and its own control panel can Work for different hardware platforms. Platform for the entire system can do boast voice applications, can be ordered under the serial interface to do voice processing VCMM. Voice modules are speech recognition system, chip architecture, program EPROM, FLASH memory, composed of single- chip 89C2051. 8051 89C2051 is a small design package, for a more simplified hardware design. Speech recognition chip designed by sensory chip, the main advantage of energy saving and related analog circuit is simple, suitable for product design with a small variety. keywords: voice chip,cross-platform,external line, serial Interface, Voice Module. 目录 1 1 引言引言.1 1 2 2系统概述系统概述 .1 1 3 3 声控计算机的相应概况声控计算机的相应概况.3 3 3.3. 1 1 声控计算机的分类声控计算机的分类 .3 3 3.3. 2 2 声控计算机的基本规格声控计算机的基本规格 .4 4 3.3. 3 3 声控计算机的应用声控计算机的应用 .4 4 4 4 声控模块硬件配置声控模块硬件配置.4 4 4.14.1 声控模块声控模块 VCMMVCMM 功能功能 .4 4 4.24.2 声控模块声控模块 VCMMVCMM 配备配备 .5 5 4.34.3 声控模块声控模块 VCMMVCMM 硬件说明硬件说明 .5 5 4.44.4 声控模块声控模块 VCMMVCMM 操作说明操作说明 .6 6 5 5 基本控制电路基本控制电路.8 8 5.15.1 经过串行接口来控制经过串行接口来控制 VCMMVCMM.8 8 5.25.2 经过经过 PCPC 的的 RS-232RS-232 接口来控制接口来控制 VCMMVCMM .8 8 5.35.3 程序说明及流程图程序说明及流程图 .9 9 结论结论.1313 致谢致谢.1313 参考文献参考文献.1313 1 1 引言引言 声控技术是用来设计一台会听话的计算机,只要对着麦克风讲话,便 可以指挥计算机动作,也就是要实现“芝麻开门”声控计算机的梦想,当 然现在已不是梦想。声控技术将以软件和硬件来实现。语音识别系统应用 的范围相当广泛,现在随着许多关键技术的突破及 VLSI 技术的进步,市场 上已出现许多方便使用的声控应用产品,如中文语音输入系统,升空移动 电话(或手机)语音拨号,声控汽车音响等,而且未来会有更多有趣的声 控电子产品上市。 声控系统可以声音来控制计算机,完成某些特定的工作,如此一来可 以取代部分按键输入来执行命令,也就是说计算机也可以听懂人们的声音, 并且加以处理后可以完成特定的工作,更进一步让人和计算机交谈。声控 计算机的技术使用的是计算机语音识别技术,由人的声音来控制计算机动 作,可是计算机本身完全听不懂人的声音,因此必须先让计算机先了解人 的讲话的声音及腔调。将原先训练好的声音特点存成语音参考样本,以便 将来做识别时,当做对比参考。本论文是基于 8051 的声控设计,介绍整个 声控系统的设计流程。 人们对声控系统的进一步研究和发展,将会为我们以后的生活和工作 带来无穷的方便和乐趣。 2 2 系统概述系统概述 整个声控系统的组成是以声控芯片 RSC364 为核心所设计的声控模块(简称 VCMM)为中心来做应用,系统采用模块化设计,扩充性佳,本身控制板可以适 合不同的硬件工作平台。整套系统可以做夸平台声控应用,可由串行接口来下 命令道 VCMM 做声控处理。 声控模块系统构架如图 2-1 所示,主要有语音辨认芯片,程序 EPROM,FLASH 内存,单芯片 89C2051 组成。89C2051 是 8051 单片机的小型化设 计包装,用于较简单化的硬件设计上。语音辨认芯片采用 sensory 公司设计的 芯片,主要优点为省电及相关模拟电路简单,适合做小型多样化产品设计用。 FLASH ROM 串行接口 TIL 电 平 RS-232 串行接口 EROM +5V 电源稳压器 R S C3 64 模拟电路麦克 风输 入 LM386 声频放大 器 喇叭输 出 89C2051 单芯片按键输入 控制 图 2-1 声控系统组成构架 语音辨认程序代码存于程序 EPROM 中,先前压缩的语音提示语也可以存放 于其中。FLASH 内存则是存储语音训练时所输入的参考样本特征参数及实时输 入的语音压缩数据,所输入的语音压缩数据可以在辨认后说出来当做辨认结果 验证用。以上这些数据因为存于 FLASH 内存内,关机后数据仍保存着,以免每 次开机后,又要重新做训练造成使用上的不方便。在模拟的接口电路上以最少 的电路便可以做语音的录放音控制。 整个系统架构采主从式双处理机架构设计,由单芯片当做主控芯片,送出 串行控制信号来控制辨认芯片完成相关的辨识工作。此一架构可以简化系统的 软硬件设计,语音辨识的软硬件部分交由专用辨识芯片来处理,这些工作需要 有效的算法及高速的硬件架构才能完成。在单芯片控制语音辨认芯片方面使用 串行接口做控制,并定义一系列与与语音辨认处理相关的控制指令来完成工作。 单芯片则负责人机接口的控制,在操作上使用 4 只按键控制来做设置,分别做 语音输入训练,修改,听取语音内容,辨认等四项工作。所有工作经过动作指 示 LED 灯及语音提示语来完成。除了基本的按键操作外,并建立了单片机串行 传输接口,可以经过外部的其他种设计师熟悉的单芯片,如 PIC 或是 EM78 系列 单片机来做更复杂的系统整合用,经过堆积木的方式来构建更复杂的声控应用 系统,使整个复杂的声控系统设计,可以简化到以简易的串行接口指令来完成。 更复杂的控制可以经过 RS-232 接口连接到 PC 接口上设计串行通信程序来完成。 3 3 声控计算机的相应概况声控计算机的相应概况 声控计算机可以声音来控制计算机,完成某些特定的工作,如此一来可以取代部 分按键来执行指令,也就是说计算机可以听懂人们讲话,并且加以处理完成特定的工 作,进一步让计算机与人进行交谈。 3 31 1 声控计算机分类声控计算机分类 依系统所能辨认单字多寡可以分类为以下三种: (1) 特定词汇:几个单词,词或是词组。 (2) 少量词汇:数十个单字,词或是词组。 (3) 大量词汇:涵盖所有的单字,词或是词组发音。以中文语音辨认而 言便是所有的中文字。 依用户是否需要是先做训练分为: (1)特定语者 声控系统只能辨认某一特定用户的声音,用户在第一次使 用此系统时需将所要辨认的词汇念过一到两遍,当做语音参考样本。谁来辨认 说出语音,辨认时会很准确,当然如果训练时是男生的声音,如其他的男生来 辨认,只要腔调及音频不要差异太大,仍然可以辨认出来。 (2)语者调适 用户只要曾经对辨认系统训练过,此系统便可辨认出他 的声音,是一种比较有灵活的做法,用户不需要念完所有的音,只要念过一部 分的单音后,系统会自动将语音参考样本做调整。 依说话者的方式分类为: (1)单音辨认:系统只能辨认单音,因此用户所说的每一个字必须分开来。 (2)连续音辨认:系统可以接受语音者连续发音。 由以上几种分类说明可以看出,一套最理想的声控计算机系统应该是大量 词汇,不特定语者连续音语音辨认系统,一般人不需要经过学习,便可以让计 算机听懂他发出的语音,也就是说只要对着计算机说话便可以直接来控制计算 机动作了,但是要完成这样的一套高辨认率的系统实在不是一件容易的工作。 一般在应用上,特定语者,少量词汇的单音辨认系统便可以满足我们的特 定需求,若能先完成一套简单而又高辨认率的声控系统,在不影响辨认率的情 况下而后再逐渐加大词汇量,或是修改语者训练的方式,采用语者调适的方法, 也可以提升声控系统的整体性能,增加使用的方便性。 3.23.2 声控计算机的基本规格声控计算机的基本规格 一般的声控计算机的基本规格: (1)辨认率高 (2)特定语者 (3)少量词汇 (4)单音辨认 3.33.3 声控计算机的应用声控计算机的应用 声控的应用范围很多,一般可以分为以下几种: (1)计算机接口应用:利用声音控制屏幕显示(如简报系统,多媒体展示) ,或利用声控来下达计算机指令与键盘同时操作(如应用在 CAI,GAME 中)。 (2)自动化控制:利用声音来控制机器人在高危险度的场所工作,或各种 机械操作,或是声控仪表操作。 (3)消费性产品应用:如家电控制,电视,音响,电灯或语音自动拨号, 汽车声控设备,儿童玩具声控。 (4)文本处理器:利用语音来输入文字(如听写机或是声控文书处理器) (5)利用语音辨识技术设计门禁管理系统。 4 4 声控模块硬件配置声控模块硬件配置 声控模块 VCMM 是由单芯片 89C2051 控制语音辨识专用芯片 RSC364,单芯 片只用 4 条 I/O 线便可以控制声控芯片动作。 4.14.1 声控模块声控模块 VCMMVCMM 功能功能 (1)利用本套系统可以自行设计独立操作型特定语者声控系统,产品附 加价值高。 (2)本系统特定语者的单词,字,词语音辨识。 (3)不限定说话语言,中英文皆可。 (4)具有自动语音输入侦测的功能。 (5)特定语者辨识率可达 98%以上,反应时间小于 1 秒。 (6)系统参数及语音参考样本一但输入后数据可以长久保存。 (7)系统采用模块化设计,扩充性佳,可适合不同的硬件工作平台。 (8)在线训练输入的语音可以压缩成语音数据而又系统说出来当做辨认 结果确认。 (9)系统可以独立操作,不必依靠 PC。 (10)系统包含有英文的语音提示语做语音动作引导。 (11)系统展示 5 组语音辨认功能。 (12)最多可以扩充控制到 60 组语音辨认。 (13)需要外加+5V 的电源供电。 (14)内建 DTMF 信号产生功能,可做电话拨号的实验。 (15)内建 4 只按键开关及 RS-232 串行通信接口。 (16)提供完整 8051 控制接口及声控芯片电路图。 (17)含 8051 汇编语言串行应用范例源程序及 PC VB RS-232 元程序。 (18)可扩充软硬件功能做进一步产品设计或声控专题制作 4.24.2 声控模块声控模块 VCMMVCMM 配备配备 (1)VCM 控制板成品 (2)+5V 的直流电源线 (3)小型喇叭 (4)系统工作磁盘 (5)展示操作书名书 (6)完整电路图 4.34.3 声控模块声控模块 VCMMVCMM 硬件说明硬件说明 U1 RSC364:声控芯片。 U2 FLASH:29C20 2M,内存语音样本及语音压缩数据。 U3 EPROM:存声控芯片程序代码,RSC364 可执行文件。 U4 89C2051:存 8051 声控程序代码。 U5 LM386:声频放大器。 U6 ICL232:RS-232 电平转换芯片。 U7 7805:5V 稳压 IC。 J1:电容式麦克风。 J2:外部电容式麦克风扩充接头输入。 J3:PWM 语音输出(DTMF 信号产生,电话拨号信号输出) 。 J4:DAC 语音输出。 J5:喇叭输出接头。 J6:9V DC 输入接头。 J7:5V DC 输入接头,红色+5V,黑色 GND。 VR1:喇叭输出音量控制。 J8:89C2051 串行接口 I/O 输出接头。 J9: 89C2051I/O 输出接头。 J10:RS232 D 型 9 引脚的公接头。 J11:RSC364 声控芯片控制信号。 J12:RS232 3 引脚的接头。 4.44.4 声控模块声控模块 VCMMVCMM 操作说明操作说明 (1)准备一个+5V 电源。经过 2 引脚的电线接至+5V 接点 J7,红色+5V, 黑色 GND。 (2)或是准备接一个+9V 电源。经过 2 引脚的电线接至+9V 接点 J6,红色 +9V,黑色 GND。 (3)喇叭接线接至 J5SP,打开电源,电源指示灯 D2 亮起,工作指示灯 D3 闪烁,表示开机正常。或是按下 8051 RESET 键 S6。 (4)注意:系统已经录有测试语音(例如 1,2,3) ,先按 S3 键,聆听系统 已经在的语音内容,作为欲辨识的字词。多按几次 S3 键,听听内建已经训练的 语音。 (5)按 S4 键:说出欲辨识的字词来辨认。系统会以英文说出“WHAT NAME”当提示语,D3 LED 灯亮起,则对着麦克风说出语音,如说“1” ,系统辨 认出来后会说“1” 。 (6)因为为特定语者语音辨认,男生来辨认会准确些,谁来训练语音, 辨认会准确,辨识率可达 95%以上。 (7)语音输入操作技巧: 训练及辨认时周围环境不宜太嘈杂。 语音提示音会有提示音,LED 亮起,等提示音说完才输入语音。 语音输入时与麦克风的最佳距离为 30cm,有效距离为 100cm,距离越远则 音量要大点,若太小声系统会以英文说出“PLEASE LOUDER” ,要您说话大声点。 (8)S1S4 功能键如下: 按键 S1:做语音参考样本训练输入,一次训练一组,展示系统为 5 个辨认 的单音。已训练的语音会永久保存在 FLASH 的记忆芯片中,即使关机还是有效, 语音训练输入需要输入 23 次,一般正常情况输入 2 次语音便可按下 S1 键, 操作过程如下: 系统说出“SAY NAME” (说一单音)第 1 次录音 系统说出“REPEAT NAME”(重复一遍)(非必要)第 2 次录音 系统说出“REPEAT NAME TO RECORD” (重复一遍录音用)第 3 次录音 第 1,2 次录音作为产生语音参考样本,第 3 次录音则是做聆听已存在的语 音内容用。若训练成功后,系统会说出您刚刚输入的语音,以做确认。 按键 S2:修改原先已存在的语音参考样本。先按 S3 键聆听系统已存在的某 组语音内容。再按 S2 键该组内容会先被删除,再执行语音输入训练过程来建立 新的语音参考样本。若在语音输入训练过程中失败,可以使用 S1 键来输入新的 语音样本。 按键 S3:聆听系统已经存在的语音内容。展示程序为编号 04,重复循环。 按键 S4:进行辨认。 (9)做内建 DTMF 信号产生实验:RESET+S3 键,则工作 LED 灯会持续闪动, 进入 DTMF 信号实验模式,可做电话拨号的实验,按 S3 键则产生 DTMF 信号 “117” 拨号音,则会接通电话,进行报时的动作,需按 RESET 才能回到辨认的功能。 实际电话拨号的电路设计,由 J3 的 POM0 单点送出拨号音(DTMF 信号)至电话 耦合接口,达成拨号的动作。 (10)其他说明: 当用户第一次使用此系统时,不必输入新的语音样本,以原来的辨认单音, 例如“!” , “2” , “3”便可以进行辨认,一般男生应可以辨认正确,如果是辨 认自己的声音,则可以高达 95%以上的辨认率。 您可以依自己喜好来重新输入新的语音样本,如“JOHN” , “NANCY”等。 展示系统为 5 个辨认的单音,当辨认到相对的语音(编号 04)则原先输 入对应的语音说出来当作确认用。 5 5 基本控制电路基本控制电路 VCMM 本身便可以做语音辨认实验,但由单片机 8051 设计声控的功能也 可以由外部联机来控制 VCMM 动作。所有应用主控系统都是经过串行接口来 控制 VCMM 动作,进一步完成声控的目的,分为两种方式来作控制:经过串 行接口来控制 VCMM 和经过 PC 的 RS-232 接口来控制 VCMM。 5.15.1 经过串行接口来控制经过串行接口来控制 VCMMVCMM 由外部任何单芯片经过串行接口来控制 VCMM,其电平为 TTL 信号,皆可以 由 J8(89C2051 串行接口 I/O 输出接头)连到 VCMM。其控制连接方式如下表 2- 2-1 所示。 外部单芯片 VCMM 89C2051 J8 TXD RXD(接收) RXD TXD(发送) 接地 接地 表 5-1-1 VCMM 的控制连接方式 5.25.2 经过经过 PCPC 的的 RS-232RS-232 接口来控制接口来控制 VCMMVCMM 此一控制方式是连接到 PC 的 RS-232 D 型 9 引脚的公接头,经过 RS-232 串 行接口来控制 VCMM,由 J10(RS-232 的 D 型 9 引脚的公接头)连接到 PC 串行 接口输入端,在 PC 上写串行控制指令来做声控应用。 VCMM 可以做夸平台声控应用,可由串行接口来下命令 VCMM 做声控处理。不 是使用 8051 的系统,也可以联机来控制 VCMM。主要是以串行通信指令来控制 VCMM。 VCMM 的串行通信格式为9600 N 8 1: 传输率 9600bps,不做校验位检查,传输 8 个数据位,1 个停止位。下一节 以 8051 程序代码来写声控程序,并以 IO51 控制板来做控制实验。 5.35.3 程序说明及流程图程序说明及流程图 以 IO51 控制板的串行接口来控制 VCMM 声控模块。以 3 条连接线相连,将 IO51 J1 联机至 VCMM J8 插座。下图为其控制电路: 图 5-3-1 IO51 控制电路图 VCMM 串行接口声控指令句柄如下: (1)句柄t:语音训练,做语音参考样本训练输入,一次训练一组, 展示系统为 5 个辨认的单音。 (2)句柄m:语音修改,修改原先已存在的语音参考样本。 (3)句柄l:语音聆听,聆听系统已存在的某组语音内容,展示程序为 编号 04,重复循环。 (4)句柄r:语音辨认。 以上所有动作操作如同操作 VCMM 上的 4 个按键一样。 IO51 送出辨认句柄r后,等待约 1 秒后,VCMM 送出句柄ab用以表 示辨认结果,ab 为所辨认的语音样本编号编码,实际辨认结果编号为 no: no=10a+b,其中 no 有效值为 059。 若辨认错误则会传回X作为响应。 例如辨认出语音样本编号 1,则会传回ab,用户可以再设计程序做进 一步应用控制。 IO51 在收到辨认结果后也会以内置的 LED 指示灯组合来表示,LED 动作是 反向亮灭指示灯,一次亮,一次灭。顺序由左而右对应编号 04。 IO51 控制板上的操作: (1)按下 K1 键:IO51 送出句柄“t”,语音训练。 (2)按下 K2 键:IO51 送出句柄“m”,语音修改。 (3)按下 K3 键:IO51 送出句柄“l”,语音聆听。 (4)按下 K4 键:IO51 送出句柄“r”,语音辨认。 由于实验时是以串行接口做信号联机,不需经过 RS-232 电平转换,因此 VCMM 及 IO51 两边的 RS-232 控制芯片 ICL232 要先取下来,以避免信号干扰, 无法正确的联机。 图 2-3-2 是主控程序控制流程图。在主控程序循环中扫描是否有按键,若 有修改则做相对功能处理,若按下 K1 键则送出语音训练句柄,若按下 K2 键送 出语音修改句柄,若按下 K3 键送出语音聆听句柄,若按下 K4 键则送出语音辨 认句柄,执行辨认功能。 声控应用程序的控制程序文件名为 V51.ASM,子程序说明如下: (1)DELAY:延迟子程序。 (2)LED_BL:工作指示灯闪烁。 (3)INIT_RS232:初始化 RS-232 接口。 (4)TX_CHAR:传送一个字节数据。 (5)RECOG:启动 VCMM 开始做辨认处理。 (6)OP:执行辨认后的相对反应动作。 (7)TEST_LED:测试 LED 灯亮灭。 (8)RXA:等待 VCMM 传回辨认结果。 是否按

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论