基于凌阳61的语音识别报警器_第1页
基于凌阳61的语音识别报警器_第2页
基于凌阳61的语音识别报警器_第3页
基于凌阳61的语音识别报警器_第4页
基于凌阳61的语音识别报警器_第5页
已阅读5页,还剩39页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

河南理工大学毕业设计(论文)说明书声控遥控器找寻器摘要随着计算机软硬件技术、半导体技术、电子技术、通讯技术等的飞速发展人类已经进入后PC时代。然而人类科技的发展总是离不开以人为本这一永恒的主题,家庭日用品更是被人们设计的越来越人性化,越来越便于使用,例如语音识别技术。它得到了迅猛发展,支持语音识别的各种产品纷纷面世。在我们生活中常见的语音识别技术产品有语音命令控制空调、电视、灯光、自动窗帘等的使用,让人们的生活“随音所欲”,更加舒适,更加便捷。与传统方案相比,具有结构简单、成本低、易实现的特点,能缩短开发周期,并且可扩充性强。本设计方案可应用于家电产品及其他电子产品,还可利用此系统的语音处理的优势组成语音应答系统、语音合成系统、互动式玩具等,具有广阔的市场前景。本文的设计是以凌阳61单片机为主要元器件并结合SPLC501液晶显示模组使产品同时具有语音识别和显示功能。此产品属于寻找器,主要应用于家庭小器件的快速寻找。寻找器系统采用模块化设计法,其硬件主要包括电源区、下载区、音频区、SPCE061A与周边、键控区、复位区、端口区、显示区;软件部分有C语言编程,实现对各个模块的控制。设计时首先对61单片机进行语音训练,再利用61单片机的语音接收模块接收语音信号,接收后送入语音处理模块进行识别处理,与模板匹配后发出相应的语音报警信号,达到找寻的目的。对语音信号的识别采用DTW算法,配合音频解码达到识别特定语音的效果。经过多次训练与调试,对于特定人语音的识别这一预期的效果已经达到。整个设计结构简单,使用方便。关键字SPCE061A单片机语音识别找寻器河南理工大学毕业设计(论文)说明书VOICEACTIVATEDREMOTECONTROLFINDERABSTRACTALONGWITHTHERAPIDDEVELOPMENTOFTHECOMPUTERSOFTWARE,HARDWARETECHNOLOGY,SEMICONDUCTORTECHNOLOGY,ELECTRONICTECHNOLOGYANDTHECOMMUNICATIONTECHNOLOGY,THEPCERAAFTERTHEPEOPLEHASALREADYENTEREDINTOHOWEVER,THEDEVELOPMENTOFHUMANTECHNOLOGY,ALWAYSINSEPARABLEFROMTHEPEOPLEORIENTEDTHEETERNALTHEME,HOUSEHOLDITEMSDESIGNEDTOBEMOREHUMANE,MOREANDMOREEASYTOUSE,FOREXAMPLEVOICERECOGNITIONTECHNOLOGYITHASBEENTHERAPIDDEVELOPMENTOFAVARIETYOFPRODUCTSHAVEEMERGEDTOSUPPORTVOICERECOGNITIONINOURLIVESINCOMMONSPEECHRECOGNITIONVOICECOMMANDSTOCONTROLTHEUSEOFAIRCONDITIONING,TV,LIGHTS,AUTOMATICCURTAIN,SOTHATPEOPLESLIVES“WITHTHESOUNDWANTS“,MORECOMFORTABLE,MORECONVENIENTTHEDESIGNOFPAPERISBASEDONTHESUNPLUS61MICROCONTROLLERASTHEMAINCOMPONENTSANDTOCOMBINESPLC501LCDMODULEALSOHASVOICERECOGNITIONANDDISPLAYTHISPRODUCTBELONGSTOTHEFINDER,MAINLYUSEDINSMALLHOUSEHOLDDEVICESQUICKFINDFINDERSYSTEMMODULARDESIGNMETHOD,THEHARDWAREINCLUDETHEPOWERAREA,DOWNLOADAREA,AUDIOAREA,SPCE061AWITHNEIGHBORINGKEYINGDISTRICT,RESETDISTRICT,PORTDISTRICT,THEDISPLAYAREASOFTWAREPARTOFTHECPROGRAMMINGLANGUAGE,TOACHIEVEONEACHTHECONTROLOFTHEMODULETHEDESIGNOFTHEFIRST61SINGLECHIPVOICETRAINING,REUSETHEVOICEOF61SINGLECHIPRECEIVERMODULETORECEIVETHEVOICESIGNALINTOTHEVOICEPROCESSINGMODULERECEIVEDRECOGNITIONPROCESSING,VOICEALARMSIGNALISSUEDBYTHEAPPROPRIATETEMPLATEMATCHINGTOACHIEVETHEPURPOSEOFLOOKINGFORINADDITION,THEIDENTIFICATIONOFTHEVOICESIGNALUSINGTHEDTWALGORITHM,WITHTHEAUDIODECODERTOIDENTIFYTHEEFFECTOFAPARTICULARVOICEAFTERSEVERALROUNDSOFTRAININGANDCOMMISSIONING,THEDESIREDEFFECTFORASPECIFICVOICERECOGNITIONHASBEENACHIEVEDTHEENTIREDESIGNSTRUCTUREISSIMPLE,EASYTOUSEKEYWORDSPCE061ASPEECHRECOGNITIONALARM河南理工大学毕业设计(论文)说明书1绪论11引言近年来,语音识别技术取得了飞速发展,并逐渐应用于通信、军事、人工智能、工业自动化等多个领域。语音识别技术的出现,使人们和机器通过自然语言交流成为可能,不仅解决了人机“交流”大众化中的障碍,了人机交互的效率,而且给人体无法接触或不便接触来实现操作控制的场合带来了极大的方便。随着改革开放的深入发展,电子电器的飞速发展人民的生活水平有了很大提高,生活步伐明显提高,在高效率的生活节奏下,找寻一些常用却经常会遗忘的用品成了人人都会遇到的小难题,因此设计生产出一种体积娇小的挂件式声控报警器显得非常必要。常用的报警器为人们解决了不少问题但是市场上的报警器大部分都是用于一些大公司财政机构,价格高昂,一般人们难以接受。如果再设计和生产一种价廉、性能灵敏可靠的报警器,必将在防盗和保证财产安全方面发挥更加有效的作用。由于声控报警器体积小,灵敏度高具有很强的隐蔽性和保密性,因此在防盗、警戒等安保装置中得到了广泛的应用,此外报警器亦可以用于物品的找寻方面。如果设计出一种体积小、灵敏度高、且具有语音识别功能的报警器当做提醒器用于日常生活,将会给我们的日常生活带来很大的帮助,其价格低廉、技术性能稳定等特点也必将受到广大用户和专业人士的欢迎。12国内外语音识别系统发展情况概述121国内对语音识别的研究发展情况我国语音识别研究工作起步于五十年代,但近年来发展很快。研究水平也从实验室逐步走向实用。从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室。河南理工大学毕业设计(论文)说明书清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到948(不定长数字串)和968(定长数字串)。在有5的拒识率情况下,系统识别率可以达到969(不定长数字串)和987(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到9873,前三选识别率达9996;并且可以识别普通话与四川话两种语言,达到实用要求。中科院自动化所及其所属模式科技PATTEK公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品PATTEKASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史。122国外语音识别系统发展情况国外对语音识别的研究工作可以追溯到20世纪50年代AT是第DTIR,I帧测试矢量和第J帧模板矢量之间的距离测度。TIIDTW算法要求参考模板与测试模板采用相同类型的特征矢量、相同的帧长、相同的窗函数和相同的帧移。为了使动态路径搜索问题变得有实际意义,在规整函数上必须要加一些限制,不加限制使用式31找出的最优路径很可能使两个根本不同的模式之间的相似性很大,从而使模式比较变得毫无意义。通常规整函数必须满足如下的约束条件1边界限制当待比较的语音已经进行精确的端点检测,在这种情况下,规整发生在起点帧和端点帧之间,反映在规整函数上就是(32)1NM2单调性限制由于语音在时间上的顺序性,规整函数必须保证匹配路径不违背语音信号各部分的时间顺序。即规整函数必须满足单调性限制(33)NNI1I3连续性限制有些特殊的音素有时会对正确的识别起到很大的帮助,某个音素的差异很可能就是区分不同的发声单元的依据,为了保证信息损失河南理工大学毕业设计(论文)说明书最小,规整函数一般规定不允许跳过任何一点。即(34)NNI1IDTW算法的原理图如图32,把测试模板的各个帧号N1N在一个二维直角坐标系中的横轴上标出,把参考模板的各帧M1M在纵轴上标出,通过这些表示帧号的整数坐标画出一些纵横线即可形成一个网格,网格中的每一个交叉点TI,RJ表示测试模式中某一帧与训练模式中某一帧的交汇。DTW算法分两步进行,一是计算两个模式各帧之间的距离,即求出帧匹配距离矩阵,二是在帧匹配距离矩阵中找出一条最佳路径。搜索这条路径的过程可以描述如下搜索从1,1点出发,对于局部路径约束如图53,点IN,IM可达到的前一个格点只可能是IN1,IM、IN1,IML和IN1,IM2。那么IN,IM一定选择这三个距离中的最小者所对应的点作为其前续格点,这时此路径的累积距离为DINDTIRIND1IIN1DIN12,这样从L,1点出发令D1,10搜索,反复递推,直到N,M就可以得到最优路径,而且DN,M就是最佳匹配路径所对应的匹配距离。在进行语音识别时,将测试模板与所有参考模板进行匹配,得到的最小匹配距离DMINN,M所对应语音即为识别结果。MIMR21时间规整函数NM11123INTN图32DTW算法原理放宽端点限制普通DTW对端点检测比较敏感,端点信息是作为一组独立的参数提供给识河南理工大学毕业设计(论文)说明书别算法的。它要求两个比较模式起点对起点,终点对终点,对端点检测的精度要求比较高。当环境噪声比较大或语音由摩擦音构成时,端点检测不易进行,这就要求在动态时间规整过程中给以考虑。放松端点限制方法不严格要求端点对齐,克服由于端点算法不精确造成的测试模式和参考模式起点终点不能对齐的问题。一般情况下,起点和终点在纵横两个方向只要放宽23帧就可以,也就是起点可以在1,1,L,2,1,3,2,1,3,L,终点可类似放松。如图33。JRRJJIRCK(IK,JK)时间规整函数JIRC1(1,1)CK(I,J)WIDTHRJR2R1T1T2T3TI4TTII图33改进的DTW算法原理图在放宽端点限制的DTW算法中,累积距离矩阵中的元素1,L,L,2,L,3,2,L,3,1不是根据局部判决函数计算得到的,而是直接将帧匹配距离矩阵的元素填入,自动从其中选择最小的一个作为起点,对于终点也是从松弛终点的允许范围内选择一个最小值作为参考模式和未知模式的匹配距离。33凌阳音频概述通常所说的音频是指频率在20HZ20KHZ的声音信号,分为波形声音、语音和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础。语音也可以表示为波形声音,但波形声音表示不出语言、语音学的内涵。语音是对讲话声音的一次抽象,是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。音乐与语音相对更规范一些,是符号化了的声音。但音乐不能对所有的声音进行符号化。为了让数字计算机更加便利处理音频信河南理工大学毕业设计(论文)说明书号,需要将模拟的(连续的)声音波形数字化(离散化),该过程主要包括采样和量化两个方面。数字音频的质量取决于采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备也是影响音频质量的原因。语音处理技术是建立在语言学和数字信号处理基础之上的综合学科,其过程大致可以分为A/D采样输入、编码处理、存储、解码处理和D/A等。如今,要实现语音处理有多种渠道,可以选用专用语音芯片也可以选用单片机,二者区别参看表1,如下表1语音处理器件性能对照表所选器件音质语音播放长度和段落价格专用语音芯片好受限制较高单片机由AD、DA精度、压缩算法等决定由存储空间决定有优势SPCE061A单片机具有八路10位ADC和两路10位DAC,两个16位可编程定时器/计数器,内置MIC放大器和自动增益控制(AGC)电路,CPU时钟主频最高达49MHZ且具有DSP功能,有能力执行复杂压缩算法。所以在选择具有语音处理功能单片机时,SPCE061A单片机可谓是上上之选。SPCE061A将A/D、编码算法、解码算法、存储及D/A做成相应的模块,每个模块都有其应用程序接口API,要实现语音处理,只用了解每个模块所要实现的功能及参数的内容,然后调用该API函数即可。不同音频质量等级的编码技术标准(频响)参看表2,如下表2音频质量等级编码技术标准信号类型频率范围(HZ)采样率(KHZ)量化精度(位)电话话音200340088宽带音频(AM质量)5070001616调频广播(FM质量)2015K37816高质量音频(CD质量)2020K44116凌阳音频压缩算法处理的语音信号的范围是200HZ34KHZ的电话话音。河南理工大学毕业设计(论文)说明书音频压缩编码基础音频压缩编码中的数据量(采样频率量化位数)/(字节数)声道数目压缩编码的目的,通过对资料的压缩,达到高效率存储和转换资料的结果,即在保证一定声音质量的条件下,以最小的资料率来表达和传送声音信息。压缩编码的必要性,未经压缩编码的音频资料量很大,用来传输或存储是不容易实现的。所以要通过对信号趋势的预测和冗余信息处理,进行资料的压缩,这样就可以使我们用较少的资源建立更多的信息。常见的几种音频压缩编码(1)波形编码,将时间域信号直接变换为数字代码,尽量真实地还原波形。波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。译码是其反过程,将收到的数字序列经过译码和滤波恢复成模拟信号。(2)参数编码,参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。具体说,参数编码是通过对语音信号特征参数的提取和编码,尽量保持语音信号的可懂性,而还原后的波形可能与原波形差别很大。(3)混合编码,将波形编码和参数编码组合起来,克服了原有波形编码和参数编码的弱点,结合各自的长处,尽量保持波形编码的高质量和参数编码的低速率。压缩分类压缩分为无损压缩和有损压缩。无损压缩一般指磁盘文件,压缩比低,一般为2141;有损压缩是指音/视频文件,压缩比可高达1001。凌阳音频压缩算法根据不同的压缩比分为以下几种SACMA2000、SACMS480、SACMS240。三者区别参看表3,如下表3凌阳语音压缩算法区别凌阳音频压缩算法编码方式编码率(BPS)压缩比音质SACM_A2000波形编码16K,20K,24K81,8125,815好河南理工大学毕业设计(论文)说明书SACM_S480混合编码48K,72K803,8015中SACM_S240参数编码24K8015差凌阳语音的播放、录制、合成和辨识要完成语音的播放、录制、合成及辨识等工作,单片机需要强大的信息处理能力而凌阳16位SPCE061A单片机则是为此而开发的,其具有DSP功能,可处理大量信息,CPU最高时钟频率可达到49MHZ,具备运算速度高的优点。凌阳压缩算法中SACM_A2000、SACM_S480、SACM_S240主要是用来放音,可用于语音提示,而DVR则用来录音。常用的应用程序接口API的功能及应用语音和音乐与我们的生活有着相当密切的关系,而单片机对语音的控制如录放音、合成机辨识也广泛应用在现实生活中。语音处理大致可以分为A/D、编码处理、存储、解码处理以及D/A等。然而,通过麦克风输入所生成的WAVE文件,其占用的存储空间很大,对于单片机来说想要存储大量的信息显然很不可能实现的,而凌阳的SPCE061A所采用的解决办法即SACM_LIB,该库将A/D、编码、解码、存储及D/A做成相应的模块,对于每个模块都有其应用程序接口API,要实现某功能,用户只需了解每个模块所要实现的功能及其参数的内容,然后调用该API函数即可。语音识别API介绍BSR_INITRECOGNIZERINTAUDIOSOURCE;初始化识别器BSR_TRAININTWORDID,INTTRAINMODE;语音训练BSR_DELETESDGROUPINTSDGROUPNO;清除内存BSR_PAUSERECOGNIZER;暂停识别,但不释放中断等资源BSR_RESUMERECOGNIZER;恢复被暂停的识别BSR_GETRECOGNIZERSCORE;获得识别结果的可信度,返回值从4096到4096,数值越大表示输入语音与特征模型的匹配度越高BSR_ENABLECPUINDICATOR;开启CPU状态监测功能。开启该功能后,IOA0和IOA1将发出每16MS电平变化一次的方波BSR_DISABLECPUINDICATOR;关闭CPU状态监测功能BSR_EXPORTSDWORDINTCOMMANDID;使用函数库时,会自动创建一个100WORD的数组BSR_SDMODEL100,可以把某条训练命令的特征模型数据导出到这个数组中河南理工大学毕业设计(论文)说明书BSR_IMPORTSDWORDINTCOMMANDID;可以把BSR_SDMODEL数组中的数据导入为某条语音命令的特征模型UNSIGNEDINTBSR_SDMODEL;配合BSR_EXPORTSDWORDINTCOMMANDID与BSR_IMPORTSDWORDINTCOMMANDID函数使用,此数组的作用相当于一个暂时的存储区SACM_480采用混合编码方式,压缩比比较大,存储容量大,音质介于A2000和S240之间,适用于语音播放,如电子词典词库等,所以本文采用了该算法,以下就SACM_480算法具体介绍其API函数的格式、功能、参数、返回值、备注。其相关API函数如下所示1)API格式CINTSACM_S480_INITIALINTINIT_INDEXASMR1INIT_INDEXCALLF_SACM_S480_INITIAL功能说明SACM_480语音播放之前的初始化。参数INIT_INDEX0手动方式INIT_INDEX1自动方式。返回值0语音模块初始化失败。1语音模块初始化成功。备注该函数用于对定时器、中断和DAC等的初始化。2)API格式CVOIDSACM_S480_SERVICELOOPVOIDASMCALLF_SACM_S480_SERVICELOOP功能说明从资源中获取SACM_S480语音资料,并将其填入解码队列中。参数无返回值无备注播放语音文件中数据,当出现FFFFFFH数据时便停止播放。3)API格式CINTSACM_S480_PLAYINTSPEECH_INDEX,INTCHANNEL,INTRAMP_SETASMR1SPEECH_INDEXR2CHANNELR3RAMP_SETCALLSACM_S480_PLAY功能说明播放资源中SACM_480语音。河南理工大学毕业设计(论文)说明书参数SPEECH_INDEX语音索引号。CHANNEL1通过DAC1通道播放。2通过DAC2通道播放。3通过DAC1和DAC2双通道播放。RAMP_SET0禁止音量增/减调节。1仅允许音量增调节。2仅允许音量减调节。3允许音量增/减调节。返回值无备注SACM_S480的数据率有48KBPS72KBPS两种,可在同一模块的几种算法中自动选择一种。SPEECH_INDEX是定义在RESOURCEINC文件中资源表的偏移地址。中断服务子程序中F_FIQ_SERVICE_SACM_S480必须放在TMA_FIQ中断向量上。4)API格式ASMCALLF_FIQ_SERVICE_SACM_S480功能说明用作SACM_S480语音背景程序的中断服务子程序。通过前台子程序(自动方式的SACM_S480_SERVICELOOP及手动方式SACM_S480_DECODE)进行语音信息编码,然后将其送入DAC通道播放。参数无返回值无备注SACM_S480语音背景子程序只有汇编指令形式,且应该将此子程序安置在TMA_FIQ中断源上。河南理工大学毕业设计(论文)说明书4系统硬件设计41总体设计框图系统设计大体包括以下部分电源模块下载区音频区(语音接收和语音识别)SPCE061A单片机最小系统液晶显示模块扬声器图41设计总体结构框图电源区为整个系统提供电源,通常采用系统配套的电池盒进行供电,只要放入3节5号电池就可以满足供电需求了。下载区程序就是通过这边的接口下载到SPCE061A单片机的,当然,在进行在线调试时也能上传一些硬件信息到开发环境中。音频区这里的麦克风是用来进行语音输入的,还有语音识别模块配合进行语音信号处理。SPCE061A最小系统SPCE061A最小系统中,包括SPCE061A芯片及其外围的基本模块,其中外围的基本模块有晶振输入模块(OSC)、锁相环外围电路(PLL)、复位电路(RESET)、指示灯(LED)等。42主控器件的选择421凌阳61单片机61单片机61板除了具备单片机最小系统电路外,还包括有电源电路、音频电路(含MIC输入部分和DAC音频输出部分)、复位电路等,采用电池供电,方便随身携带。61板上有调试器接口(PROBE接口)以及下载线河南理工大学毕业设计(论文)说明书(EZ_PROBE)接口,分别可接凌阳科技的在线调试器、简易下载线,配合UNSPIDE,可方便地在板上实现程序的下载、在线仿真调试。SPCE061A单片机是台湾凌阳公司研制的一个16位结构的微控制器,将MCU、A/D、D/A、RAM、ROM集成在一块芯片上,具有很高的集成度。同时具有较高运算速度的1616位的乘法语音和内积运算指令,CPU最高可达时钟49MHZ,因此在复杂的数字信号处理方面既非常便利又比专用的DSP芯片便宜得多。系统支持10个中断向量及14中断源,具有较强的中断处理能力,适合实时语音处理。并具有双通道10位ADC方式的音频输出功能,配置带自动增益控制功能(AGC)的麦克风输入方式,为语音处理带来了极大的便利。SPCE061A既具有体积小、集成度高、可靠性好的特点,又具有较强的中断处理能力、高性能的价格比和功能强、效率高的指令系统及低功耗、低电压的特点,所以非常适合用于嵌入式语音识别系统。凌阳16位单片机所拥的一套指令系统和集成开发环境具有易学易用、效率高等特点。在集成开发环境中,支持标准C语言编程,并可以实现C语言与凌阳汇编语言的相互调用,语音的录放只需调用相应的库函数就可实现。SPCE061A片内还集成了一个ICE(在线仿真电路)接口,使得对芯片的编程和仿真变得非常方便,而且ICE接口不占用芯片上的硬件资源,结合凌阳科技提供的集成开发环境(UNSPIDE)可以对芯片进行仿真;而程序的下载(烧写)也是通过该接口进行下载。SPCE061A功能简介(1)16位微处理器(2)工作电压(CPU)VDD为3036V,(I/O)VDDH为3056V(3)CPU时钟03249152MHZ(4)内置2K字SRAM(5)内置32K字FLASH(6)可编程音频处理(7)晶体振荡器(8)系统处于备用状态下(时钟处于停止状态),耗电仅为2UA/36V(9)2个16位可编程定时器/计数器(可自动预置初始计数值)(10)2个10位DAC(数/位转换)输出通道(11)32位通用可编程输入/输出通道(12)14个中断源可来自定时器A/B、时基、2个外部时钟源输入和键唤醒(13)具备键唤醒的功能河南理工大学毕业设计(论文)说明书(14)使用凌阳音频编码SACM_S480可以播放压缩的语音资源(15)锁相环PLL振荡器提供系统时钟信号(16)32768HZ实时时钟(17)7通道10位电压摸/数转换器(ADC)和单通道声音模/数转换器(18)声音模/数转换器输入容道内置麦克风放大器,并具有自动增益控制(AGC)功能(19)具备串行设备接楼(SIO)(20)具备低电压复位(LVR)功能和低电压检测(LVD)功能(21)内置ICE(在线仿真电路)接口(22)具有WATCHDOG功能SPCE061A单片机代表了单片机发展的潮流,非常适合用于嵌入式语音识别系统。它整合了多个常用的功能模块,让我们在进行系统开发的时候不用外加过多的硬件就可方便的完成一个系统的设计,这就是人们常说的SOC(SYSTEMONCHIP)技术。耗电少,可以满足很多手提设备、掌上设备低能耗的需求,低能耗也是电子技术一直在追求的一个目标。可方便的用来实现声音录制、播放,MIDI音乐合成和语音识别,相比别的单片机比较有特色。可方便的完成一系列乘加的运数,实现一些数据处理比较容易,别的单片机一般都不具备这种功能。芯片里具备在线仿真调试电路,使调试和程序下载更加方便,也把仿真器和烧录器的成本给节省下来了。凌阳SPCE061A单片机语音处理的实现凌阳SPCE061A将语音处理相关各功能做成函数模块,通过API调用来实现。这些函数分为两类用于音频资料播放的凌阳音频编码(SACM)类和用于辨识语音的语音识别(BSR)类。对输入生成的WAVE文件按不同的压缩算法压缩成SACM_A2000或SACM_S480等相应语音资料后,就可利用SACMLIB库对这些资料进行处理。该库将A/D、编码、解码、存储及D/A做成相应的模块,每个模块都有其应用程序接口API函数,调用对应函数即可实现各自功能。如针对特定人语音辨识,SACMLIB库中提供了包括C语言和汇编语言两种格式定义的API函数,常用语音辨识API函数有河南理工大学毕业设计(论文)说明书(1)SRAM初始化函数INTBSRDELETESDGROUP(INT)(2)训练函数INTBSRTRAIN(INTCOMMANDID,INTTRAINMODE)(3)识别初始化函数INTBSRINITRECOGNIZER(INTAUDIOSOURCE)(4)获取识别结果函数INTBSRGETRESULT(VOID)(5)停止识别函数VOIDBSRSTOPRECOGNIZER(VOID)(6)识别中断程序BSRFIQROUTINE配合语音压缩及播放的相关API函数,即可构成一个完整的语音应用系统。SPCE061A的结构如图42所示16位微控制器UNSPTMICEFLASHRAMRAM双16位定时器/计数器时基中断控制锁相环振荡器CPU时钟实时时钟7通道10位ADC单通道ADCADG低电压监测/低电压复位双通道10位DAC输出串行输入输出接口32管脚通用输入输出端口ICEENICESCKICESDAVCPXI/RXOMINCNAUD1AUD2IOA150IOB150IOB0(SCK)IOB1(SDA)图42SPCE061A结构图河南理工大学毕业设计(论文)说明书图3461原理图放在附录部分422SPLC501液晶显示模组V51该模组是凌阳公司的一款12864点阵的液晶模组,驱动芯片采用的是凌阳SPLC501。模组接口简单,应用方便,功耗低,且可以完成较多液晶特效功能。可以显示字符、汉字、图形等,且灰度编程可调。图43SPLC501原理图河南理工大学毕业设计(论文)说明书5系统软件设计51开发环境所谓的开发环境,其实就是一个或几个电脑上的可执行程序,不管是哪类单片机的开发环境都至少具备如下的功能程序编写可以在开发环境里录入程序。编译程序负责把程序翻译成机器码。程序下载把机器码下载到仿真板或开发系统上。61板开发系统的开发环境叫做集成开发环境(也称IDE),它除了具上面的三个功能外还可以组织多个程序文件形成一个系统开发的项目,这样更有利于一些大型系统的开发和各功能模块的模块化,同时它还结合SPCE061A单片机的硬件提供各类在线调试窗口,使调试程序变得更加直观和简单,除此之外,它还提供一些软件模拟SPCE061A单片机仿真的功能,在没有硬件的情况下也可以完成一些简单程序的调试。52主程序的设计基于凌阳61单片机的声控遥控器找寻器需要有语音信号的采集、识别处理、语音匹配、报警的运行过程。根据这一要求,语音信号采集与处理分三个阶段61单片机音频部分的麦克风接收到语音信号以后,将其转交给语音处理部分进行语音识别,与之前训练过程中存入芯片的语音模板进行匹配,若为同一语音源发出的语音信号,则匹配成功后发出相应的报警信号,若不能匹配则不会发出报警声音。51为主程序工作流程,河南理工大学毕业设计(论文)说明书开始初始化训练找寻器已经训练过重新训练进入识别模式语音识别与执行清模型存储区保存训练结果等待复位装载语音模型YNNY图51主程序流程图完成特定人语音的训练可在主函数中调用相关函数,然后在训练成功后进行语音识别,再根据识别的命令执行相关的操作。根据FLASH中的标志位判断是否为第一次下载。使用BSR_EXPORTSDWORDUICOMMANDID函数将训练好的语音模型导出存储到FLASH中,用于操作。在语音识别中,首先读取FLASH取得语音模型,然后调用BSR_IMPORTSDWORDUICOMMANDID函数将语音资源载入内存。在识别出命令后,执行相关动作。61单片机本身具有语音识别的功能,不过要先对其进行语音识别训练,即形成所谓的模板库,让芯片记住这些被训练过的语句和语音频率,当下次同一语音信号出现时,做出相应的动作就可以了。训练是必备的一步,并且多次训练可以使语音识别的效果更好。河南理工大学毕业设计(论文)说明书训练识别的程序流程图见图52初始化定义存储器调用第一条提示音播放训练名称成功否训练第一条命令成功否训练第二条命令成功否开始识别辨识器初始化启用实时监控调用提示辨识音播放获取语音数据辨识主循环否否否是图52语音识别模块流程图下面是一个特定人辨识的范例,相关的操作方法如下在程序中我们通过三条语句的训练演示特定人连续音识别,其中第一条语句为触发命令。在程序一开始为训练名称,即触发命令,然后提示训练两条命令,训练完毕开始辨识,当识别出触发名称后,发布命令则会听到应答。具体命令如下训练提示音输入语“请输入触发名称”“符佳佳”“请输入第一条命令”“你在干什么”“请输入第二条命令”“毕业设计什么”“请再说一遍”(以上提示音每说完一遍出现此命令)“没有听到任何声音”(当没有检测到声音时出现此命令)河南理工大学毕业设计(论文)说明书“两次出现名称不相同”(当两次输入的名称不同时出现此命令)“两次输入命令不一样”(当两次输入的命令不同时出现此命令)“准备就绪,请开始识别”(以上三条命令全部训练成功时,进入识别)识别发出命令应答“符佳佳”“在”“你在干什么”“毕业答辩”“毕业设计什么”“声控报警”(相应程序见附录程序清单)经过多次训练,当下次同一个人说起相同的话时,若有相应的语音报警提示声音发出,则说明训练已经成功可以使用。针对同一模板,在同一环境条件下分别进行了10次、40次和80次训练识别,识别率结果如表一表一同一背景不同训练次数的识别率训练次数识别率10次8940次92580次952针对同一模板,在不同的噪声背景下分别进行测试,识别率结果如表二表二不同噪声背景下识别率训练次数识别率平缓噪声突然噪声10次787250次8580河南理工大学毕业设计(论文)说明书6实物的制作与调试61电路板制作过程61板PCB图图6161板PCB图在插放元件前先用电工刀将电路板的外型设计好,是否与它的外壳相匹配。要注意插入边沿的元件后,能否盖上外壳。在插放元件的时候,最好对每个元件的性能进行检测,我们所购买的都不是军用元件,存在一定的误差。不同的三极管引脚排列顺序不一样,对电阻、电容、电解电容、二极管、三极管、可控硅、稳压二极管、集成电路等的识别及检测焊接的时候应注意烙铁的温度,最好不要在电风扇下面,以免风扇影响烙铁头的温度。同时要注意焊接技术,不要出现尖角,剪除引脚的时候,引脚不要留的太长,避免不必要的干扰。62实物图焊接完成的61板外观图,液晶显示模组外观图以及最后的实物图见附录。63调试按电路图焊接组装好后,可进行调整,主要是调整电路的接收灵敏度。调河南理工大学毕业设计(论文)说明书整时,一边发出响声,一边调试电路,发出报警声。电路中的其他部分只要组装正确,一般不需调整即能正常工作。调试的时候先一个人对着麦克风说话,说出程序中编写过的语句,进行训练,待芯片识别后换了几个人对着麦克风说同样的话,发现只有这个人说话的时候报警器才会做出相应的反应。并且是不管是同一个人还是其他人,说的话和预先训练时候说的不同时,也不会有相应的报警信号。而在不同的环境条件下进行测试,发现系统的抗噪声性能还可以,即便是在噪声很大的环境下进行测试也有很高的识别率,虽然出现过一点小失误,但是都在误差可以接受的范围内。由实验结果也表明对其进行多次训练的效果比进行一次训练的结果要好很多,并且在相对平缓的噪声环境下识别率高于噪声突然和尖锐的环境。64实物制作过程中遇到的问题及解决方法由于时间和自身能力的限制,焊接的过程中出现了不必要的损坏,一些元器件焊接完成后却不能使用,排查原因发现一些在焊接的过程中被烧坏了。造成了时间和经济的双重损失。本次设计的板子没有预期的那么小,因为语音识别功能的实现需要61芯片,但是单独的61芯片不能实现相关功能,必须配以周围电路和相关的程序,自己设计外围电路需要的元器件更多,需要的板子大小也更大,所以买了61板子的元器件自己焊接,不够精巧但是基本可以实现相应的功能。没有买到合适的封装用外壳,虽然焊接的时候相对比小的板子容易,但是体积较小这一设计目的并未达到。因为时间紧迫,对61单片机的学习深度有限,没有外接事先预想的蜂鸣器和LED灯,只是借助一个扩音喇叭,在程序编写的时候利用延长暂停时间的办法使喇叭在系统接收到语音信号几秒钟后进行响应。经过一段时间的调试与检测,设计已经基本上实现了特定人的语音识别功能,由于焊接工艺的不专业,结果在进行语音识别的过程中存在失误,精确率也不是很高,不过都在误差允许的的范围之内,基本完成预定目标。河南理工大学毕业设计(论文)说明书7结论与展望71结论经过近两个月的努力,我的毕业设计声控遥控器找寻器设计已经基本完成。在设计过程中,力求系统的实现电路简单、成本低,系统的功能快捷易用并且完善。但是由于一些条件的限制,所设计系统仍然存在一些不足,有待改进。设计过程中先对61单片机进行了系统的学习,通过学习了解了61单片机强大的语音识别功能,进而找出在设计实现语音识别中应注意到的问题,并针对这些问题,对语音识别过程中的语音识别原理和算法以及音频压缩惊醒了研究,主要工作包括1研究了语音识别的两个主要步骤,训练和识别。语音信号识别最重要的一环就是特征参数提取和模式匹配。设计中严格按照特征提取需要注意的要求进行语音特征的提取和识别,达到的较好的效果,2研究了语音识别的算法,力求使语音识别的效果更明显,抗噪性更好。本设计采用动态时间归整技术DTW对于因信号进行识别,鉴于普通DTW对端点检测比较敏感,对端点检测的精度要求比较高,当环境噪声比较大或语音由摩擦音构成时,端点检测不易进行,所以本设计采用的是方块短点的DTW算法,很好的克服了上述缺点。3研究了对所接收语音进行音频压缩的方法。通常所说的音频是指频率在20HZ20KHZ的声音信号,而为了让数字计算机更加便利处理音频信号,需要将模拟的(连续的)声音波形数字化(离散化),不同音频质量等级的编码技术标准不同,本设计采用凌阳压缩算法中SACM_S480进行处理,效果不是最好的,但是已经可以实现要求。经过一段时间的努力,虽然结果不是特别理想,但是识别特定语音信号这一预定目标已经基本实现,今后我会更加努力学习专业课知识,相信以后会做的更好的。72展望本毕业设计是声控遥控器找寻器,目的是通过61的语音识别功能,达到找寻物品的实际目的。在软件编程方面采用C语言,主要考虑单片机课程中C语音是基础和核心河南理工大学毕业设计(论文)说明书的语言,相关算法和流程多采用模块法和顺序循环法,分块编写的程序能很清楚的展示各块程序实现的作用,便于调试。如果在今后实际使用时,可以进一步研究出更合理和简明的算法步骤,优化程序。在硬件开发方面,由于学生的资金紧张,在选配元件时多以价格相对便宜的民用指标为主的元件,所以在精度方面可能会受到一点影响。随着社会的进步和科技的发展,人们对生活以及居住环境提出了更高的要求,智能家居逐渐成为中国家居消费市场的新潮流。目前,国内部分地区、特别是经济比较发达的地区,已经有很多社区实现了智能家居生活。智能家居的日渐兴起已经开始影响到人们生活的方方面面,改变了人们日常的生活习惯,提高了人们的生活质量,促使家庭实现了生活现代化,给人们的家居生活带来了全新的感受。展望未来,我们所用的61语音识别单片机,其强大的语音识别功能,必将使它在以后的智能家居生活发展中占有相当重要的地位。河南理工大学毕业设计(论文)说明书致谢经过两个多月的忙碌,在高娜老师悉心指导以及其他的院领导和老师们的关心下,我的毕业设计声控遥控器找寻器终于在炎热夏天来临之际顺利完成在此要感谢我的指导老师高娜对我悉心的指导,感谢老师给我的帮助。还要感谢我的室友,她们的勤奋、认真时常感染和影响着我,她们对我学习生活中遇到的问题给予极大地帮助,我们在一起学习生活是非常快乐和美好的时光。她们对我的论文提出了非常有价值的建议,并给予了一定的解决方案,在此真诚感谢通过本次设计,我不仅把知识融会贯通,而且丰富了大脑,同时在查找资料的过程中也了解了许多课外知识开拓了视野,使自己在专业知识方面和动手能力方面有了质的飞跃。常遇到这样的情况,在某个问题上发现自己的薄弱,或者有所遗漏,于是及时查阅资料、询问老师使问题得以解决,并以此加深对相关知识的理解。此过程中,自然遇到一些问题,虽然陌生,却只需细加思考,这些问题仍在我们的能力范围之内。像这样的问题源于课本而高于课本,尽管在总体规范的要求下将问题解决,但是否与实际生产水平相适应,这就需要生产实践去检验。理论与实践二者的有机结合,说起来容易做起来难书到用时方恨少,与千变万化的实际问题相比,我的所学犹如九牛一毛其次是培养我们处理问题的全局观、系统化。这要求我们处理问题的时候,要看到事物的两面。有的问题正面处理好了,反面却没有注意到。而有的地方需要我们正确处理好事物的主要矛盾和次要矛盾,抓住要矛盾,兼顾次要矛盾。把煤矿开采学、通风安全学、热工学、流体力学等多门学科综合起来运用,本身就要求我们具备良好的统筹能力,要从整体看问题。最后是培养我们的动手能力。书上得来终觉浅,绝知此事要躬行。只知道纸上谈兵,最终将被社会抛弃。毕业设计是我作为一名学生即将完成学业的最后一次作业,他既是对学校所学知识的全面总结和综合应用,又为今后走向社会的实际操作应用铸就了一个良好的开端,毕业设计是我对所学知识的检验和总结,能够培养和提高设计者独立分析和解决问题的能力;是对我们运用所学知识解决实际问题的考核;是理论与实践有机结合的过程;是理论与实践升华的过程;更可以说是自己的思想成熟、成长的过程河南理工大学毕业设计(论文)说明书设计要求我们遵循合理、规范的原则,正如我们做人要遵循社会法律、社会公德一样。但在这个过程之中,没有人能够独立成功,我们需要别人的帮助,需要社会的帮助,就像我们作设计需要老师的指导和同学们的帮助一样。我们需要不断地学习、查找资料来完善我们的设计,就像我们在社会上需要不断地学习交流来完善自己在设计过程中,我通过查阅大量有关资料,与同学交流经验和自学,并向老师请教等方式,使自己学到了不少知识,也经历了不少艰辛,但收获同样巨大。在整个设计中我懂得了许多东西,也培养了我独立工作的能力,树立了对自己工作能力的信心,相信会对今后的学习工作生活有非常重要的影响。而且大大提高了动手的能力,使我充分体会到了在创造过程中探索的艰难和成功时的喜悦。虽然这个设计没有做到完美,但是在设计过程中所学到的东西是这次毕业设计的最大收获和财富,使我终身受益。河南理工大学毕业设计(论文)说明书河南理工大学毕业设计(论文)说明书参考文献1朱淑鑫,谢忠红浅谈语音识别技术的应用及发展J长春理工大学学报高教版,20092朱淑琴语音识别系统关键技术研究D西安西安电子科技大学,20043杨占军,杨英杰,王强基于DSP的语音识别系统的设计与实现J东北电力大学学报,20064李双勋,欧建平TLV320AIC23在音频处理中的应用J国外电子元器件,20035陈涛基于DSP的语音信号识别系统的研究与实现D成都成都理工大学,20106蒋永生,张雄伟,曾宏辉一种基于DSP的语音处理系统软硬件设计J电力系统通信,20077曾日波小词表实时语音识别系统的定点DSP实现J现代电子技术,20048贾克明,陶洪久基于DSP的嵌入式语音识别系统的研究与实现J武汉理工大学学报信息与管理工程版,20069王倩,吴国平,陈琳特定人语音识别算法DTW算法J软件导刊,200510李晶皎嵌入式语音技术凌阳16位单片机应用M北京北京航空航天大学出版社,200311薛均义张彦斌凌阳16位单片机原理及应用北京北京航空航天大学出版社,200312凌阳科技大学计划凌阳单片机在大学生电子竞赛中的应用北京北京航空航天大学出版社,200513赵定远马洪江16位单片机及语音嵌入式系统北京中国水利出版社,200614罗亚非凌阳16位单片机应用基础北京北京航空航天大学出版社,2005河南理工大学毕业设计(论文)说明书河南理工大学毕业设计(论文)说明书附录1系统整体设计原理图61板外观图SPLC501液晶显示模组封装SPLC501元件封装河南理工大学毕业设计(论文)说明书图54最终实物图河南理工大学毕业设计(论文)说明书河南理工大学毕业设计(论文)说明书附录2程序清单INCLUDE“SPCE061AH“INCLUDE“BSRSDH“INCLUDE“ROBOTH“INCLUDE“UARTH“INCL

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论