怎样设计语音控制音乐播放器.doc

上传人：灯*** IP属地：河北上传时间：2020-01-10 格式：DOC 页数：39 大小：1.32MB 积分：12 举报 版权申诉

已阅读5页，还剩34页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

语音控制音乐播放器的设计摘要电子信息技术已经深入应用到各行各业的产品中，包括工业控制设备，通讯设施以及各种消费类电子产品。在这个领域，伴随着人工智能和计算机技术的发展，人类的电子设备将会朝着智能化方向高歌猛进，其中，语音遥控将会起着不可估量的作用，语音控制也将会取代传统的键盘输入控制，不仅节约了成本，而且也减少了传输线间的串扰，提高了产品的友好操作性和智能化水平。本课题是研究语音控制的音乐播放器，以证明语音智能控制的理论和实施的可行性,为以后将语音智能控制广泛应用于人类日常生活、生产和无人危险作业提供理论和实践依据。本设计采用凌阳科技生产的SPCE061A单片机，运用其语音信号识别与处理功能达到控制播放器的功能，拥有两种控制模式：语音控制和键盘控制，语音控制模式能够识别“播放”、“暂停”、“停止”、“上一首”、“下一首”五种语音指令；键盘控制模式能够通过按键操作控制播放器的开关机和播放情况。设计通过仿真，达到了语音键盘双模控制的目标。关键词：语音识别；SPCE061A；语音控制；音乐播放器The Design of Voice Control Music PlayerABSTRACTElectronic information technology has further applied to all walks of life products, including industrial control equipment, communication facilities and a variety of consumer electronics products. In this area, along with the development of artificial intelligence and computer technology, electronic equipment, human intelligence will be moving in the direction of triumph, in which voice will be playing an invaluable role remote control, voice control will also replace the traditional keyboard input control, not only cost savings but also reduces crosstalk between transmission lines and improve product interoperability and intelligent level of friendship.This topic is to study the voice-controlled music player, to prove the theory of intelligent control and voice feasibility of implementation, for future voice is widely used in intelligent control daily life, production, and no dangerous operations to provide theoretical and practical basis. This design uses Sunplus production SPCE061A MCU, using its voice recognition and signal processing functions to control player functions, with two control modes: voice control and keyboard control, voice control mode to identify the Play, Pause , Stop, the one, next song five voice commands; keyboard control mode operation can be controlled through key players switch machine and play situations. Design through simulation, dual-mode control to achieve the goal of voice keyboard.Key words：Voice Recognition; SPCE061A；Voice Control; Music Player目录第一章绪论11.1 课题简介11.2 研究背景11.3 国内外发展状况2第二章语音识别技术理论42.1 语音识别概述42.1.1 基本概念42.1.2 语音识别的分类42.1.3 语音识别的主要方法52.1.4 语音识别的难点与对策52.2 语音信号的识别系统组成62.3 语音信号分析概述7第三章播放器系统的硬件设计93.1 系统设计93.2 主要电路设计103.2.1单片机主电路103.2.2电源电路113.2.3音频电路113.2.3开机指示灯电路和键盘控制电路12第四章 SPCE061A单片机介绍144.1 SPCE061A单片机的结构144.1.1 总述144.1.2 SPCE061A内部结构144.1.3 SPCE061A特性参数154.2 SPCE061A的主要功能模块154.2.1看门狗模块154.2.2 低电压检测/低电压复位164.2.3 单片机的并行I/O接口164.2.4 时间基准信号164.2.5定时器/计数器174.2.6中断系统174.2.7 SPCE061A的ADC184.2.7 SPCE061A的DAC184.2.8 SIO同步串行接口184.3 凌阳音频194.3.1 凌阳音频压缩算法的编码标准194.3.2 压缩分类204.3.3 凌阳常用的音频形式和压缩算法204.3.4 凌阳语音的播放、录制、合成和辨识20第五章播放器的软件设计225.1 集成开发环境IDE概述225.1.1 IDE的概念及其发展225.1.2 凌阳nSP IDE235.2 主要程序设计245.2.1 训练命令程序245.2.2 主程序255.2.3中断程序27结论30参考文献31附录33致谢34XX大学2010届本科毕业设计说明书第一章绪论1.1 课题简介随着人工智能和计算机技术的发展,语音遥控将在人们的日常生活和生产领域起着不可估量的作用, 语音控制音乐播放器是通过语音识别技术，完成一定的动作，这是语音智能控制在日常生活应用的一个实例。通过此设计可以证明语音智能控制的理论和实施的可行性,为以后将语音智能控制广泛应用于人类日常生活、生产和无人危险作业提供理论和实践依据。本课题采用凌阳SPCE061A单片机，该单片机具有强大的DSP功能，对于复杂的音频信号具有完善的语音处理能力，同时还具备语音识别模块和语音放音模块，只需要外接一个功放即可播放语音信号了。通过本设计希望能够达到以下基本要求：（1）通过语音命令对音乐播放器进行控制，可以识别5条命令（2）两种控制模式（3）音乐播放器的语音存储1.2 研究背景科学技术发展至今，实现了人可以通过机电系统和计算机智能系统从事劳动生产、工业控制、科学探索和方便日常生活。长期以来，这些机电系统和智能系统与人之间的信息交流主要依靠各种形式的键盘、按键等实现的，机电系统和智能系统通过显示器等反映运行状态。目前，人机交流基本上属于数字领域的“手动操作”方式人机对话，它把人与系统通过中间介质限制在近距离面对面的空间里，所交换的信号是数字量或者数字量的转化形式。这种“手动操作”人机对话模式限制了人与计算机系统和机电系统交流的灵活性。为了提高工业系统、计算机系统和家电系统智能化水平，在人机对话方面就是寻求最好的信息交换手段。语言是人类最主要和最基本的交流方式，在日常生活中，人们通过它互相传递信息。而且语言也是信息载体中承担信息量最大的信号，具有很高的智能水平，使智能系统能听、能看、能说、能感觉是未来人机交互的发展方向，其中语音为未来最被看好的人机交互方式，语音比起其它的交互方式有更多的优势，语音作为人机对话的手段使人机对话转化为人人对话，可以填补人机对话的空白。语音操作控制模式具有应用的便捷性和一致性，使人机界面自然化，现在还处在起步阶段，但这一技术必将给各类智能系统和人类生产生活带来巨大变化。目前的各项电子技术的革新为语音技术的发展提供了充分条件，首先是半导体技术的发展使得原来在巨型机上才能运行的语音系统现在完全可以在微机上实现，其次是软件技术的不断演进，语音技术的一些核心算法，例如噪声消除、声学模型和语言模型建立、语音特征提取、搜索算法和自适应算法都得到长足发展。软硬件的不断演化和有效结合为语音技术的发展、应用提供了良好的契机。人们预计，在未来的10年内，语音控制技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子等各个领域。传统的音乐播放器都是手动按键式的操作模式，这种形式的操作不仅容易加速硬件设施的老化，而且对于手脚不便利的用户就大为不便，因为需要直接接触操作，所以在时间和空间上都会有一些延迟。本课题基于这些因素，将播放器改进为语音控制型的，不仅减少了硬件资源，而且操作相当人性化，用户只需要张口就可以对播放器进行“播放”、“上一首”等操作，对于手脚不便甚至盲人用户都带来巨大福音。1.3 国内外发展状况语音控制是语音识别技术在控制领域的应用，因此，语音识别技术的研究与发展就决定了语音控制的研究与发展。语音识别的研究工作大约开始于50年代，标志就是AT&TBell实验室实现了第一个可识别十个英文数字的语音识别系统-Audry系统。60年代，计算机的应用推动了语音识别的发展。这一时期的重要成果是提出了用动态规划(DP)方法来解决语音识别中不等长的对正问题。70年代，语音识别领域取得了突破。线性预测编码技术(LPC)的引入，使语音识别的特征提取产生了一次飞跃。动态时间规整技术(DTW)基本成熟，提出了矢量量化(VQ)和隐马尔可夫模型(HMM)理论。实现了基于线性预测倒谱和DTW技术的特定人孤立语音识别系统。80年代，语音识别研究进一步走向深入，其显著特征是HMM模型和人工神经元网络(ANN)在语音识别中的成功应用。HMM模型的广泛应用应归功于AT&TBell实验室Rabiner等科学家的努力，他们把原本艰涩的HMM纯数学模型工程化，从而为更多研究者了解和认识。进入90年代，随着多媒体时代的来临，迫切要求语音识别系统从实验室走向实用。许多发达国家如美国、日本、韩国以及IBM、Apple、AT&T、NTT等著名公司都为语音识别系统的实用化开发研究投以巨资。IBM公司于1997年开发出汉语Via、bice语音识别系统，次年又开发出可以识别上海话、广东话和四川话等地方口音的语音识别系统Via、roiee，98。它带有一个32，000词的基本词汇表，可以扩展到65，000词，还包括办公常用词条，具有“纠错机制”，其平均识别率可以达到95%。该系统对新闻语音识别具有较高的精度，是目前具有代表性的汉语连续语音识别系统。SPeechworks公司是世界领先的电话自动语音识别系统(ASR)解决方案的提供者，代表产品为Speechworks6。利用该产品，用户可以通过电话用自然语言与系统进行交互，进行旅游预约、股票交易、银行服务、订票服务、宾馆服务和寻呼服务等，由于系统是自动的，无需服务人员的介入。目前市场上出现了语音识别电话、语音识别记事本等产品，如美国vPTC公司的VoieeO玛耐zer和法国的Parrot等。我国语音识别研究工作始于二十世纪80年代初，一直紧跟国际水平，国家也很重视，并把大词汇量语音识别的研究列入“863”计划，由中科院声学所、自动化所及北京大学等单位研究开发，取得了高水平的科研成果，如中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统，其字准确率或系统响应率可达90%以上。鉴于中国未来庞大的市场，国外也非常重视汉语语音识别的研究。美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者，研究成果已达到相当高水平。目前，语音控制技术应用的最广泛的就是在家电方面的应用。如日本Sony公司声控汽车音响，美国JVC公司KD-LXSO型声控盒(车用)，美国InVoca全方位声音遥控器，意大利Delonghi微波炉等都是能用语音命令去执行各种功能。松下电器产业于2001年12月开始上市配备具有语音识别功能的36英寸电视机-“内置AV硬盘的Bs数码高清晰度电视机”。该产品的昵称为“数码T”。该产品中配备了麦克风遥控器，可用语言指令输入指示。用户可以通过语音报出电视台名或者频道号码，便可很容易地选择BS数码广播或地面波模拟广播的具体电视台。在使用过去的遥控器时，当搜索节目信息以及预约录像等时需要通过菜单画面逐步进行操作，而在语音操作时则可以省略中间阶层的操作。语音控制不仅应用于家电，在通讯、自动控制、家居自动化等方面都有着越来越广泛的应用。第二章语音识别技术理论2.1 语音识别概述2.1.1 基本概念语音识别是机器通过识别和理解把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域，语音识别又是一门交叉学科，它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。语音识别是人机接口的一项重要内容，也是世界语音信号处理中非常重要的应用技术。语音识别的目的是机器“听懂”人类的语音，这也是机器智能化的一个重要方面。让机器识别语音的困难在某种程度上就像一个外语不好的人听外国人讲话一样，它和不同的说话人、不同的说话速度、不同的说话内容、以及不同的环境条件有关。语音信号本身的特点造成了语音识别的困难。这些特点包括多变性，动态性，瞬时性和连续性等。2.1.2 语音识别的分类语音识别按不同的角度有下面几种能够分类方法。1以识别单位分语音识别以识别单位分，有孤立词（识别的单词之间有停顿）识别、音素识别、音节识别、孤立句识别、连接词识别、连续语音识别（识别的单词之间没有停顿）和语音理解等。2以识别规模分语音识别以识别规模分，有小词汇（1050个）、中词汇（50200个）、大词汇（200个以上）等孤立词识别。3以服务对象分语音识别以服务对象分，有特定说话人、多说话人（有限的说话人）和与说话人无关（无限的说话人，无论是谁的声音都能识别）3种。特定说话人的语音识别比较简单，能得到较高的识别率。后两种为非特定说话人识别系统，这种识别系统的通用性好、应用面广，但难度也较大，不容易得到较高的识别率。而与说话人无关的识别系统的实用化将会有很高的经济价值和深远的社会意义。4以识别的方法分语音识别以识别的方法分，有模板匹配法、随机模型法和概率语义分析法。这三种方法都属于统计模式识别法。除了这三种外，其他识别方法还包括人工神经网络语音识别、应用模型数学的语音识别及句法语音识别等。目前，语音识别的研究重点已经转移到大词汇量、非特定人、连续语音上来并且取得了一些突破。典型的做法是：以HMM为统一框架，构筑识别系统模型。每个识别单位至少建立一套HMM结构和参数。大词汇量、非特定人的连续语音识别系统可以用于人机直接对话、语音打字机以及两种语言之间的直接通信等一系列重要场合。2.1.3 语音识别的主要方法语音识别是国际上的热点领域，人们尝试了很多种语音识别的方法。一般来说，语音识别的方法有三种：有模板匹配法、统计模型法和概率语义分析法。早期的语音识别系统大多采用模板匹配法，它多应用于特定人、小词汇量和孤立词的识别系统中。这种系统利用训练的语音数据产生模板库，然后直接将根据输入语音得到的特征矢量与模板库中的模板进行比较，选择出区别最小的模板作为输入语音输出。随着应用需求的增长，识别词汇量逐渐增多，识别对象也从孤立词向连续语音转变。此时，由于已经很难对自然的连续语音进行分割，语音单元间的协同发音现象也十分普遍，因此基于模板匹配结构的识别系统不再使用。同时大词汇量的词汇表存储、搜索也需要极大的存储空间和计算资源，因此语音识别的研究从模板匹配技术向基于统计模型的识别技术转变。统计模型法中应用最广泛的是隐马尔可夫模型（Hidden Markov Model）和人工神经网络模型。HMM的出现，使自然语言识别系统取得了实质性突破。HMM方法现已成为识别的主流技术，目前大多数词汇量、连续语音的非特定语音识别系统，都是基于HMM的模型。HMM是针对语音信号的时间序列结构，建立起的统计模型，可被看作是一个数学上的双重随机过程：一个是用具有有限状态数的Markov链，来模拟语音信号统计特性变化的、隐含的随机过程；另一个是与Markov链的每一状态相关联的、观测序列的随机过程。前者通过后者表现出来，但前者的具体参数（如状态数）是不可观测的。人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络本质上是一个自适应非线性动力学系统，模拟人类神经活动的原理，具有自适应性、并行性、鲁棒性、容错性和学习特性，在结构和算法上都显示出实力，为语音识别提供了一个新的途径。2.1.4 语音识别的难点与对策尽管语音识别的研究已有半个世纪了，但现有的语音识别系统仍存在许多困难，还远远达不到实用化的要求，主要表现在：鲁棒性：目前的语音识别系统对环境条件的依赖性强，要求保持测试条件和训练条件一致，否则系统性能会严重下降。噪声问题：现有的语音识别系统大多只能工作在安静的环境下，一旦在噪声环境下工作，讲话人产生情绪或心理上的变化，可能会产生发音失真、发音速度和音调改变等现象。常用的抑制噪声的方法，可以概括为四个方面：谱减法、环境规整技术、不修正语音信号而是修正识别器模型使之适合噪声、建立噪声模型。语音识别基元的选择：如何根据存储空间和搜索速度的要求，选择合适的识别单元，如词、音节、音素。一般来讲，要识别的词汇量越多，所用的基元应越小越好。端点检测：研究表明，即使在安静的环境下，语音识别系统一半以上的识别错误，来自端点检测器。提高端点检测技术的关键在于寻找稳定的语音参数。韵律信息的利用：韵律信息指的是说话之中的重音、语调等超音段信息。实验表明，人可以从说话的韵律中获取很多重要信息。但目前的语音识别系统却忽略了韵律信息。因此，如何在语音识别中结合韵律信息还有待进一步研究。2.2 语音信号的识别系统组成不同的语音识别系统，虽然具体实现细节有所不同，但所采用的基本技术相似，一个典型语音识别系统的实现过程如图2.1所示。图2.1 语音识别系统实现过程Fig. 2.1 Realization of speech recognition system预处理：包括预加重、反混叠滤波、模/数转换、自动增益控制等处理过程，用以去除声门激励、口鼻辐射、高于1/2采样频率的高频和噪声信号的影响，实现语音信号的数字化。在语音识别中，预处理还包括在声学参数分析之前，正确选择识别基元等问题。特征提取：对经过预处理的语音信号，要对其进行特征提取，即特征参数分析。该过程就是从原始语音信号中抽取出能够反映语音本质的特征参数，形成特征矢量序列。识别参数的选择有很多种，要视系统的具体要求来定。参数中所包含的信息越多，分析或提取的复杂度也越大。可供选择的识别参数包括：平均过零率、短时平均幅度、短时平均能量、基音周期、短时频谱（有1030个通道滤波器组的平均谱、DFT频谱、模仿人耳听觉频谱特性的MEL谱等）、共振峰（频率、带宽、幅度）、倒谱、线性预测系数、PARCOR参数（偏自相关系数）、声道的形状函数（用于求取说话人的个性特征）、随机模型（隐马尔可夫模型）的概率函数、矢量量化的矢量，以及音长、音调、声调等超音段信息函数。语音库：即声学参数模板，是用训练和聚类的方法，综合一人或多人多次重复的语音参数，经过长时间的训练而聚类得到。模式匹配：语音识别的核心。将输入语音的特征参数同训练得到的语音模式库进行比较分析从而得到初步的识别结果。常用的方法有：动态时间规整法、有限状态矢量量化法、HMM模型法等。判决：语音识别的最后一步，也是系统识别效果的最终表现。对属于由信号计算而得到的测度，根据若干准则及专家知识，判决选出可能结果中最好的结果，由识别系统输出。2.3 语音信号分析概述通过对于语音信号发声过程的研究以及观察记录的各种语音波形，便可知道语音信号的频谱分量主要集中在3003400Hz的范围内，如图2.2所示为“确信”语音信号的波形图。图2.2 “确信”语音波形图Fig. 2.2 Confident voice waveform语音信号的另一个重要特点是它的“短时性”。在某些短时段中它呈现出随机噪声的特征，另一些短时段则呈现出周期信号的特征，其它时段则为两者的混合。简而言之，语音信号的特征是随时间而变化的，只有在一短段时间间隔中，语音信号才保持相对稳定一致的特征。这短段时间一般可取为5-50ms，因此对于语音信号的分析和处理必须建立在“短时”的基础上。根据语音信号的特征，我们可以认为在一小段时间内语音信号近似不变。于是可以把语音信号分成一些短段（或称为分析帧）来进行处理。这些短段（或帧）具有固定的特征。短段间经常有一定的重叠，组合成一段语音。这种方法称为“短时”处理方法。这种短时处理方法可以表示为：语音信号的分析是语音通信、语音合成、语音识别、说话人识别和语音增强等语音信号处理的前提和基础。只有将语音信号分析描述成其本质的特征参数，才有可能利用这些参数进行高效的语音通信，建立语音库，构造识别模板或知识库。根据所分析的参数不同，语音信号可分为时域、频域、倒谱域等方法，其中频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络等。按照语音学的观点，可将语音分析分为模型分析法和非模型分析法两种，其中模型分析法是指依据语音产生的数学模型来分析和提取表征这些模型的特征参数，共振峰模型分析、声管模型（即线性预测模型）就属于这种分析方法。而不进行模型化分析的其它方法都是属于非模型分析法，包括时域分析法、频域分析法及同态分析法等。第三章播放器系统的硬件设计3.1 系统设计要设计语音控制音乐播放器，主要有两个模块，一是音频输入，实现语音信号的识别；二是音频输出，实现播放功能。根据这一思路，主要有两种方案可供选择：1 方案一采用普通的MCU，如89C51等较为低端的MCU控制芯片设计本系统，其框图如图3.1：音频输入放大滤波语音芯片MCU放大滤波图3.1 方案一系统框图Fig. 3.1 Program one system block diagram音频输出MIC扬声器根据上面的框图可以很清楚地看到，这个结构需要单片机是最简单的，不需要单片机具有内置ADC,DAC等功能，对于编程来说就相对简单得多了。不过本方案的缺点是电路设计过于复杂，电子元器件较多的情况下，并且器件之间的干扰会比较严重，做PCB要考虑的EMC会比较复杂。这不是一个好的设计方案。2 方案二运用凌阳SCE061A单片机，现在提出如下系统方案，如图3.2所示：音频输入SPCE061A放大电路扬声器电源模块图3.2 方案二系统框图Fig. 3.2 Program two system block diagramMIC音频输出凌阳SPCE061A单片机出色的DSP功能，同时61单片机也自带7通道10位普通ADC（IOA0-IOA6）和1个10位MIC_IN，并且MIC还自带ADC与AGC电路模块，因此，运用SPCE061A单片机设计语音录入电路时，只需要加入语音传感器麦克风电路即可。另外在语音输出这一部分，因为SPCE061A内置2路10位精度DAC，于是只需要外接功放电路即可完成语音的播放。该方案的优点是很明显的，因为SPCE061A是一款带DSP功能的MCU，并且还内置ADC.DAC通道，这使得电路结构简单了很多，节约了很多硬件资源。凌阳SPCE061A确实是实现语音功能的单片机中的最佳选择。3.2 主要电路设计3.2.1单片机主电路采用方案二的系统，则SPCE061A单片机的主电路包括其外围的基本模块，譬如晶振，锁相环，复位电路等。如下图3.3所示：图3.3 单片机主电路Fig. 3.3 MCU main circuit3.2.2电源电路图3.4是电源部分的电路，由电池盒提供的4.5V直流电压经过SPY0029后产生3.3V给整个系统供电。SPY0029是凌阳科技公司设计的电压调整IC，采用CMOS工艺，具有静态电流低，驱动能力强，线性调整出色等特点。图3.4 电源电路Fig. 3.4 power circuit图中的VDDH3为SPCE061A的I/O电平参考点，如果该点接SPCE061A（PLCC84）的51引脚，可使I/O输出高电平为3.3V；VDDP为锁相环（PLL）电源，接SPCE061A的7脚；VDD和VDDA分别为数字电源和模拟电源，分别接SPCE061A的15引脚和36引脚；AVSSI是模拟地，接SPCE061A的24引脚；VSS是数字地，接SPCE061A的38引脚；AVSS2接音频输出的AVSS2。3.2.3音频电路1音频输出电路音频电路由音频输入和音频输出两部分组成。图3.5是音频输出电路，SPCE061A内置2路10位精度的DAC，只需要外接功放电路即可完成语音的播放。图 3.5 DAC音频输出电路Fig. 3.5 DAC audio output circuit图中的SPY0030是凌阳科技公司的一款音频放大芯片，可以共工作在2.4-6V范围内，功能相当于LM386，但是比LM386音质好，它可以工作在2.46.0V范围内，最大输出功率可达700mW（LM386必须工作在4V以上，而且功率只有100mW）。 2音频输入电路图3.6是音频输入电路，SPCE061A芯片已经集成了音频输入专用ADC以及AGC放大电路，因此芯片外部电路比较简单。图 3.6 MIC音频输入电路Fig. 3.6 MIC audio input circuit如图中显示，麦克风作为传感器，将声音信号转化为电信号，再经过一系列的滤波放大等信号调理电路后输入单片机进行A/D，DSP等处理。3.2.3开机指示灯电路和键盘控制电路因为是采用双模控制，所以，除了语音控制播放器之外，还有六个按键控制播放器的开关机，播放，暂停，停止，上一首，下一首等操作，如图3.7所示：图3.7 键盘、指示灯电路Fig. 3.7 Keyboard, indicator circuit图中LED是开机指示灯，当播放器打开后，指示灯点亮，若播放器掉电关闭时则指示灯熄灭。因为绿色LED的开启电压约为2.0V，发光时电流约20mA，为保证LED正常发光和达到保护效果，所以需要串联一个330的电阻以限流。第四章 SPCE061A单片机介绍4.1 SPCE061A单片机的结构4.1.1 总述SPCE061A 是继nSP系列产品SPCE500A等之后凌阳科技推出的又一个16位结构的微控制器。与SPCE500A不同的是，在存储器资源方面考虑到用户的较少资源的需求以及便于程序调试等功能，SPCE061A里只内嵌32K字的闪存FLASH ROM。较高的处理速度使nSP能够非常容易地、快速地处理复杂的数字信号。因此，与SPCE500A相同，以nSP为核心的SPCE061A微控制器也适用在数字语音识别应用领域，SPCE061A是数字声音和语音识别产品的一种最经济的应用。4.1.2 SPCE061A内部结构凌阳SPCE061A的内部结构框图如图 4.1 所示。图4.1 SPCE061A的内部结构框图Fig. 4.1 Block diagram of the internal structure of SPCE061A内部以位微控制器为核心，集成了ICE（在线仿真）、Flash存储器（闪存）、SRAM（静态内存）、通用I/O端口、定时器/计数器、中断控制、CPU时钟、锁相环（PLL）振荡器、双16位定时器/计数器、时基控制器、中断控制器、7通道10位ADC（模拟/数字转换器）、单通道ADC+AGC（自动增益控制）、双通道10位DAC（数字/模拟转换器）、UART（通用异步收发器）通信接口、SIO（串行输入输出）端口、低电压监测/低电压复位等模块。4.1.3 SPCE061A特性参数其特性参数如下所示： 1 .工作电压：CPU工作电压 VDD为 3.0 3.6V(CPU)，I/O口工作电压 VDDH 为 VDD5.5V； 2. CPU工作频率：0.32MHz49.152MHz； 3 .数字存储器： 2K字 SRAM ； 4程序存储器： 32K字闪存 ROM；5I/O端口：2组16位可编程输入输出端口；6中断：14个中断源，故障中断请求（FIQ）和中断请求（IRQ）两个中断优先级；7定时器/计数器：两组16位可编程定时器/计数器；8模/数转换器：7通道10位精度ADC和单通道10位音频MIC输入ADC；9数/模转换器：2个10位精度DAC输出通道；10UART：1个全双工通用异步收发器串行接口；11SIO：1个同步串行设备接口；12节电功能：具备弱振和睡眠方式；13看门狗（Watch Dog）功能：具备清除时间周期0.75s的看门狗；14其他功能：低电压复位、低电压监测、保密功能等4.2 SPCE061A的主要功能模块4.2.1看门狗模块一般MCU的看门狗相当于一个定时器，如果每隔一定时间不刷新定时器，它将溢出；而且大多数情况下溢出将复位系统。SPCE061A的清狗周期为0.75S；清看门狗操作寄存器为P_Watchdog_Clear(0 x7012H);清狗操作：在每个0.75S的清狗周期里P_Watchdog_Clear写入0 x0001。当程序中存在未测试到的bug时，在运行过程中，就可能会运行到本身就存在问题的程序，如死循环、错误地址等，这样看门狗就会在其周期内对系统进行复位了，这样避免了系统的错误延续下去。在电子产品使用过程中，可能会遇到尖峰很大的脉冲电流或电压，或都其它的一些电磁干扰；这样就可能会使单片机里的数据有异常变化，从面使单片机进入死机等不可恢复状态，这时，看门狗可以使单片机减少这些状态的时间，这在实时间高、对生命财产有效重要影响的产品中是非常有用的。4.2.2 低电压检测/低电压复位通过编程设置低电压监测（LVD），具有低电压复位功能（LVR），这在一个可靠的系统中，是非常重要的，但尽量不要把维持系统的可靠性的希望寄托在LVD和LVR上，因这这两个功能只是最低限度的保障，在一个可靠的系统中只有到了迫不得已的情况下才会用到这两个功能的。从电源供给、单片机稳定运行、防止出错方面去考虑的话；更多的可靠性保障是来源到外部电源模块的可靠性，而单片机内部的LVD、LVR功能只是最低限度的保障，最后一道防线而已。但是用好LVR和LVD对于一个单片机系统的可靠性、稳定性来说，是非常重要的。4.2.3 单片机的并行I/O接口单片机内部CPU与外设间所传递信息的性质、传送方式、传送速度和电平各不相同，所以CPU与外设之间不是简单的直接相连，必须借助于I/O接口这个过渡电路才能协调起来。这个接口是CPU数据转换为电平的最基本途径，也是外设电平转换为CPU识别的数据的最基本途径。它有着独立的I/O口逻辑电平（VDDIO），可接VDDIO范围：3.35.5V。有着多种输入方式，比如悬浮、上拉、下拉输入方式，适应不同的外围器件对接口要求。可按位设置每一位的输入输出方式、状态。它包含两个16位I/O口，IOA与IOB，IOA口用作7路普通AD输入端口和触键唤醒功能，IOB口为外部中断输入、串行接口、PWM输出等复用端口。4.2.4 时间基准信号来自于RTC分频，通过选频组合，提供常用时间基准信号给定时器/计数器以及中断系统。SPCE061A的时基信号，选频逻辑TMB1为TimerA的时钟源B提供各种频率选择信号并为中断系统提供中断源(IRQ6)信号。通过分频产生2Hz、4Hz、1024Hz、2048Hz以及4096Hz的时基信号，为中断系统提供各种实时中断源(IRQ4和IRQ5)信号。4.2.5定时器/计数器他们是用来精确地确定某一时间间隔（定时器）。用来累计外部输入脉冲个数，即可计算出所定时间的长度等（计数器）。它基本工作原理是当作定时器用时，在其输入端输入一系列周期固定的脉冲，根据定时器/计数器中累计或预先设置的脉冲个数，即可计算出所定时间长度。定时器与计数器实际上都是同一个模块，其共同的特点是都有一个计数脉冲输入端，每输入一个脉冲，计数器就进行加1或减1计数。若计数器件的计数脉冲的频率固定，则可利用计数实现定时，这就是定时器。若计数器件的作用是累加输入脉冲的多少或测量外部输入脉冲的参数，则为计数器。SPCE061A的定时器/计数器采用递增计数方式，自动重载定时器/计数器初始值，输出4位可调脉宽比PWM信号，溢出频率/2的方波输出，多种时钟源输入。定时器的应用以及时基信号的应用，很大程度上要与中断系统配合，所以学习SPCE061A的中断系统，是掌握SPCE061A硬件结构的必要内容。4.2.6中断系统中断是为处理器对外界异步事件具有处理能力而设置的，中断技术的引入把计算机的发展和应用大大地推进一步。因此中断功能的强弱已成为衡量一款单片机性能的重要指标。中断存在一个优先级的概念，给众多中断源定义一个优先顺序，即所谓的优先级排队。中断优先级越高，则响应优先权就越高。当CPU正执行中断服务程序时，又有中断优先级更高的中断申请产生，如果CPU能够暂停对原来的中断处理程序，转而去处理优先级更高的中断请求，处理完毕后，再回到原低级中断处理程序。中断的相应过程为：中断请求、现场保护、中断服务、清中断请求标志位、恢复现场、返回。SPCE061A系列单片机中断系统功能较强，它拥有十四个中断源，两级中断优先级，两级嵌套，每个中断源单独设置开或关。单片机在上电复位开始工作，直到接收到睡眠信号后，才关闭系统时钟(PLL振荡器)，进入睡眠状态。用户可以通过对控制寄存器P_SystemClock单元写入CPU睡眠信号使系统从运行状态转入备用状态。系统进入睡眠状态后，程序计数器(PC)会停在程序的下一条指令计数上，当有任一唤醒事件发生后开始由此继续执行程序。单片机接收到唤醒信号后接通PLL振荡器，同时CPU会响应唤醒事件的处理并进行初始化。唤醒操作完成后，程序将会从进入睡眠后指令计数的断点处开始被继续执行。此外还有其他几种中断，定时器中断，参考定时器/计数器的设置，设置好相应中断即可。支持FIQ/IRQ1/2。时基中断，设置好相关选频寄存器，设置好中断即可使用多种频率中断。在单片机中，时钟电路、I/O口、定时器、中断是最基础的部分，要学好一颗单片机，这些基础部分是必学的；而要用好一颗单片机，其特殊部分的功能模块更是应该学的，SPCE061A中集成的ADC、DAC是非常有特色的地方。4.2.7 SPCE061A的ADC8通道10位模-数转换器。其中7个通道（Line_IN）用于将模拟量信号转换为数字量信号, 可以直接通过引线(IOA06)输入，1个通道只作为语音输入通道，通过内置有自动增益控制放大器的麦克风通道(MIC_IN)输入。由数模转换器DAC0和逐次逼近寄存器SAR组成逐次逼近式模-数转换器，硬件ADC的最高速率限定为(/32/16)Hz。4.2.7 SPCE061A的DAC两路10DAC（DAC1、DAC2），AUD1和AUD2管脚输出，电流型DAC，03mA Vdd = 3.3V，02mA Vdd = 3.3V。DAC相关寄存器，P_DAC1(读/写)(7017H)，该单元为一个带10位缓存器(DAR1)的10位D/A 转换单元(DAC1)。用于向DAR1写入或从其中读出10位数据。P_DAC2(读/写)(7016H)，P_DAC2(写)：通过此单元直接写入10位数据到10位缓存器DAR2，来锁存DAC2的输入数字量值(无符号数)，P_DAC2(读)：从DAR2内读出10位数据。DAC的控制寄存器P_DAC_Ctrl(写) (702AH)，DAC音频输出方式的控制单元。第58位用于选择DAC输出方式下的数据锁存方式；第3、4位用来控制A/D转换方式。第1位总为0 用于双DAC音频输出。还有几点需要注意的地方，首先是音频元器件布局与布线，在PCB板的布局、布线时，要注意MIC回路与音频输出回路的分开，最好能在板子的不同两侧。关于省电，当不用ADC、DAC时，可以在软件中关掉它们，但电源最好接上，防止芯片内漏电。语音功能方面SPCE061A提供了10位分辨率的ADC，以及两路10位DAC，另外在片上集成了AGC控制的运放，构成MIC输入通道。这些都为SPCE061A的语音功能提供了必备的硬件基础。4.2.8 SIO同步串行接口SIO为凌阳科技定义的一个串行接口，多用于与外部设备进行数据传输。SPCE061A也提供了一个全双工的UART接口，与标准UART接口兼容。SIO串行接口为1位串行接口，配有1个Clock（SCK）、1个Data（SDA），可设地址位数，或无地址模式。SIO数据与地址寄存器有四个读写单元。P_SIO_Data(读/写)(701AH)，该单元为接收/发送串行数据的缓冲单元。P_SIO_Addr_Low(读/写)(701BH)，此为串行设备起始地址的低字节(默认值为00H)。P_SIO_Addr_Mid(读/写)(701CH)，这是串行设备起始地址的中字节(默认值为00H)。P_SIO_Addr_High(读/写)(701DH)，这是串行设备起始地址的高字节(默认值为00H)。SPCE061A的UART模块提供了一个全双工标准串行接口，用于完成SPCE061A与外设（如PC机）之间的串行通讯。利用UART IRQ中断，可以同时完成UART接口的接收发送数据的过程。UART模块的接收管脚Rx和发送管脚Tx分别与IOB7和IOB10共用。UART控制寄存器1为P_UART_Command1(写)(7021H) UART控制端口，控制寄偶校验，UART IRQ中断，寄存器复位。UART控制寄存器2该单元写入时为UART数据发送/接收控制端口，第6、7位分别控制着数据发送和接收管脚的允通/禁通。P_UART_Command2(写)(0 x7022)单元的缺省值为0 x00。P_UART_Command2(读)(7022H)，该单元读出为UART状态信息。第7位是RxRDY标志位，当接收到数据时该标志位被置为“1”，读P_UART_Data单元将清除该标志位。第6位是TxRDY标志位，该标志位被置为“1”，表示发送器的数据缓存器为空，已准备好可以发送写入P_UART_Data单元的数据。UART常见问题有SPCE061A输出的是TTL的UART信号，而PC端的为RS232电平信号，两者间要通过232电平转换才能实现通讯。串口通讯速率匹配问题，当通讯双方速率不匹配时，通常接收到的都是些错误数据。开接收中断后一直进入接收中断，端口设置有误或出现导常。一般会由于IOB7与IOB10设置有误才导至问题的出现的；有时也会因为IOB7共用端口的器件使IO口信号发生变化造成。SPCE061A提供的SIO口一般会用来与其它带SIO口的Flash、SRAM片子相连，扩展数据的存储空间，存放更多的语音资源。UART的存在，为多MCU协同工作提供了条件，在众多多MCU系统中、串行总线应用中广泛应用。4.3 凌阳音频4.3.1 凌阳音频压缩算法的编码标准表4.1列出了不同的音频质量等级的编码技术标准（频响）。表4.1 不同音频质量等级的编码技术Table 4.1 Different audio quality levels of coding信号类型频率范围采样率量化精度信号类型频率范围采样率量化精度电话语音200-3400HZ8KHZ8位调频广播2-15000HZ37.8KHZ16位宽带音频50-7000HZ16KHZ16位高质量音频2-20000HZ37.8KHZ16位凌阳音频压缩算法处理的语音信号时范围为200HZ-3.4KHZ的电话语音。4.3.2 压缩分类压缩分为无损压缩和有损压缩。无损压缩一般指磁盘文件，压缩比低，为2:1-4:1；而有损压缩则是指音/视频文件，压缩比可以高达100:1。凌阳音频压缩算法根据不同的压缩比分为以下几种：SACM_A2000:压缩比为8:1、8:1.25、8:1.5SACM_S480:压缩比为80:3、80:4.5SACM_S240:压缩比为80:1.5按音质排序：A2000S480S2404.3.3 凌阳常用的音频形式和压缩算法1波形编码（SACM_A2000）特点：高质量、高码率，适于高保真语音/音乐。2参数编码（SACM_S240）特点：压缩比大，计算量大，廉价但音质不高3混合编码（SACM_S480）特点：综合参数编码和波形编码的优点除此之外，还有FM（调频）音乐合成方式，即SACM_MS01。4.3.4 凌阳语音的播放、录制、合成和辨识凌阳SPCE061A是16位单片机，具有数字信号处理器（DSP）功能，有很强的信息处理能力，最高时钟频率可达到49MHZ，具备运算速度高的优势等，这些都是无疑为语音的播放、录放、合成及辨识提供了条件。凌阳压缩算法中SACM_A2000、SACM_S480、SACM_S240主要用于放音（语音提示），而数字录像机（DVR）则用来录放音。对于音乐合成MS01，该算法较繁琐，而且具备音乐理论、配器法和声学知识，一般人员不便使用。语音识别电路基本结构如图4.2所示。语音滤波噪声预加重滤波器组；PARCOR系数；线性预测系数；过零次数；能量；相关系数等模式匹配词典语音分析识别结果输出图4.2 语音识别电路结构Fig. 4.2 Speech recognition circuit凌阳语音辨识主要有以下两种：1.特定发音人模式（SD）2.非特定发音人模式（SI）其中特定发音人模式只能识别一个人的语音指令，在训练时最好训练两次，两次训练结果接近就算训练成功；非特定发音人模式可以识别多个人的语音指令，与某个具体的发音人没有关系，这个模式难度比SD难度高，但是这个将会更好地提高电子产品的智能化水平。第五章播放器的软件设计5.1 集成开发环境IDE概述5.1.1 IDE的概念及其发展集成开发环境: 较早期程序设计的各个阶段都要用不同的软件来进行处理,如先用字处理软件编辑源程序，然后用链接程序进行函数、模块连接,再用编译程序进行编译,开发者必须在几种软件间来回切换操作。现在的编程开发软件将编辑、编译、调试等功能集成在一个桌面环境中,这样就大大方便了用户。集成开发环境（简称IDE Integrated Develop Environment ）是用于提供程序开发环境的应用程序，或者说是一种辅助程序开发人员开发软件的应用软件。一般包括编程代码编辑器、编译器/解释器、自动建立工具、通常还包括调试器和版本控制系统和一些可以设计图形用户界面的工具。许多支持面向对象的现代化IDE还包括了类别浏览器、物件检视器、物件结构图。虽然目前有一些IDE支持多种编程语言（例如Eclipse、NetBeans、Microsoft Visual Studio），但是一般而言，IDE主要还是针对特定的编程语言而量身打造（例如Visual Basic）。就是集成了代码编

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

怎样设计语音控制音乐播放器.doc

文档简介

温馨提示

最新文档

评论

怎样设计语音控制音乐播放器.doc

文档简介

温馨提示

最新文档

评论

相关文档