毕业设计(论文)-DSP语音处理系统设计.doc_第1页
毕业设计(论文)-DSP语音处理系统设计.doc_第2页
毕业设计(论文)-DSP语音处理系统设计.doc_第3页
毕业设计(论文)-DSP语音处理系统设计.doc_第4页
毕业设计(论文)-DSP语音处理系统设计.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科生毕业设计题目dsp语音处理系统设计姓名 学号 院系信息技术与传播学院专业电子信息科学与技术指导教师 职称 副教授 年 月 日曲阜师范大学教务处制目录摘要1关键词1abstract1key words1引言11.芯片简介11.1 tlv320aic23芯片11.2 tms320vc541芯片22、系统硬件设计与实现22.1工作原理22.2系统硬件结构22.2.1数字信号处理芯片22.2.2音频codec模块32.2.3电源模块32.2.4 滤波电路32.2.5 jtag 仿真接口32.3 硬件接口设计32.4 bootloader 设计43、系统软件设计与实现53.1语音识别的基本原理53.2 接口软件设计53.2.1 tms320vc5416 初始化53.2.2 lv320aic23 初始化53.2.3小波变换64、设计总结致谢参考文献dsp语音处理系统设计专业:电子信息科学与技术 学生姓名: 指导教师: 摘要:基于dsp芯片为控制核心,设计了语音处理系统,有效地解决了高性能与低成本间的矛盾。系统的硬件部分包括数字信号处理芯片、音频codec模块、电源模块、滤波电路、jtag 仿真接口等几大模块,系统的软件部分介绍了语音识别的基本原理,阐述了dsp实现技术,探讨并验证小波变换算法比傅里叶变换算法在提高语音识别系统性能应用中的有效性。该系统资源丰富,电路兼有模拟和数字信号接口,可以作为一个独立的模块应用于其他电路,方便地扩展其应用。关键词:dsp 语音处理 小波变换design of speech process system based on dspmajoring in :electronic information science and technology name:liqian tutor name:zhengchunhouabstract: the design of speech process system is based on the dsp chip, which solve the contradiction between high performance and low cost effectively. the part of sampling circuit is composed of digital signal processing chip, voice-frequency circuit, filtering circuit, simulation of jtag interface. the part of software introduces the fundamental theory of speech recognition, explaining the dsp realization technology of speech recognition. the system is rich in resources and the circuit provides interfaces with analog and digital signal, and could be taken as an independent module to be used for other electronic circuits, making it convenient to expand its application.key words:dsp;speech process;wavelet transform引言 声学是一门具有广泛应用性的学科,涉及到人类生产、生活及社会活动的各个方面;声学又是一门具有很强交叉渗透性的学科,与各种新学科、新技术相互作用,相互促进,不断地吸收、应用和发展新的思想,增强了声学的生命力、竞争力和学术与艺术魅力。同时,声学也是一门技术,包括声呐技术、噪声控制技术、电声技术、超声技术与语音处理技术。语音处理技术解决的是人机对话的问题,研究语音的识别、合成、编码、翻译、传送等。dsp的应用已经涵盖了工业、通信、娱乐、教育、安全、个人医疗、环境控制等领域,将来的人们对具有dsp核心的数字信息产品会更加的情有独钟,如今高速发展的语音信号处理技术已在音频信息的处理、传输和存储等方面得到广泛应用; 同时, 随着高性能dsp 的日益普及, 利用dsp 对语音信号处理进行算法研究和实时实现正成为新的热点,而含有dsp芯片的语音处理系统会使人们的生活更加绚烂多姿。因此,本文设计并实现了一种语音采集与处理系统,目的是为语音信号处理的算法研究和实时实现提供一个应用平台。1、芯片简介1.1 tlv320aic23芯片tlv320aic23(以下简称aic23) 是ti公司的一款高性能codec芯片。主要特性有:内置耳机输出放大器,支持mic和linein (二选一) 两种输入方式,且对输入和输出都具有可编程增益调节;芯片中的a/d转换器和d/a 转换器采用多位sigma- delta技术, 数据传输字长为16、20、24、32bit, 采样率为8khz96khz;在采样率为96khz 的情况下a/d转换器信噪比达到90db, d/a转换器达到100db;回放模式下功率为23mw省电模式下更是小于15uw。基于上述优点, aic23是可移动的数字音频播放和录音使用中的模拟输入输出等应用系统的理想选择。1.2 tms320vc5416芯片tms320vc5416(以下简称vc5416) 是ti公司的一款 16bit定点高性能dsp, 是tms320vc54x系列中的第3代芯片。主要特性有: 速率最高达160mi/s; 3条16bit数据存储器总线和1条程序存储器总线;1 个40bit桶形移位器和2个40bit累加器; 1个1717乘法器和1个40bit专用加法器; 最大8m16bit的扩展寻址空间, 内置128k16bit 的ram和6k16bit的rom; 3个多通道缓冲串口(mcbsp) ;配有pcm3002 可对语音进行a/d和d/a 转换,由于vc5416功耗低, 性能高, 其分开的数据和指令空间使该芯片具有高度的并行操作能力, 在单周期内允许指令和数据同时存取, 再加上高度优化的指令集, 使得该芯片具有很高的运算速度并且该芯片本身具有丰富的片内存储器资源和多种片上外设,因此在工程界得到广泛应用,尤其是在语音编码和通信应用方面。12、系统硬件结构2.1工作原理由话筒输出的语音信号首先经过放大电路和前置滤波电路,将处理后的语音信号(模拟量)由音频模块进行a /d转换和语音数据的编码,再将编码数据送到dsp中进行处理,最后进行训练与识别。识别结果通过液晶显示器读出,或将识别结果通过音频解码器进行d /a转换后经过后置滤波电路,通过扬声器放音。2.2系统硬件结构图1 系统硬件结构图话筒扬声器音频编解码前置滤波后置滤波tms320vc5416jtaglcd显示sdrame2prom复位晶振电源3.2系统硬件设计与实现语音采集与处理系统主要包括三个部分: 以vc5416为核心的数据处理模块;以aic23为核心的语音采集与编解码(codec) 模块和用户根据需要扩展的存储器模块。系统硬件结构如上图。22.2.1数字信号处理芯片 为满足语音信号处理的实时性要求, 语音信号采集与处理系统应具有高速数据处理能力。本系统采用tms320vc5416芯片作为信号处理芯片。2.2.2音频codec模块 本系统的codec模块以tlv320aic23芯片为核心。2.2.3电源模块 vc5416属于低功耗定点芯片,采用双电源供电。电源由内核电源和i/o电源两部分构成, 其中内核电源为1.8v, i/o电源为3.3v。内核电源采用1.8v供电可以降低功耗;i/o电源采用3.3v供电使得芯片可以直接与外部低压器件接口, 而不需要额外的电平转换电路。本系统采用ti公司的tps73hd318( 简称hd318) 作为电源输入芯片, hd318提供的两路输出电压一路为1.8v,一路为3.3v。另外该芯片提供的宽度为200ms的低电平复位脉冲还可以用来作为vc5416的上电复位信号。aic23芯片具有单电源和双电源两种供电模式,本系统选择双电源供电模式。这样aic23和vc5416之间就可以直接联接而不需要其它电平转换芯片。2.2.4 滤波电路 前置滤波采用带通滤波电路,上截频 为3400 hz,下截频 为60 hz。后置滤波采用精度较高的巴特沃斯滤波电路,滤掉系统中数字信号的干扰。二阶有源低通巴特沃斯滤波器的传递函数为 n=1, 2 , 3 (1)可写成: (2)式中 通带内的电压放大倍数 截止角频率n滤波器的阶数由式(3)可知, 当 = 0 时, 式( 3)有最大值1; =时, 式( 3 ) 等于0.707, 即衰减了3 db。n越大,随着的增加,滤波器的输出电压衰减越快,滤波器的幅频特性越接近于理想特性。2.2.5 jtag 仿真接口系统由硬件仿真器xds510/pp 通过jtag 仿真接口和计算机相连, 用户可以通过此接口向vc5416 芯片加载程序并观察芯片内部存储器的数据, 完成系统仿真及程序调试的任务。如果系统需要以脱机方式工作, 可以用jtag 仿真接口将用户程序烧录到flash rom 中, 再通过设置启动方式引脚确定系统从片外rom启动。2.3 硬件接口设计vc5416 有3 个mcbsp, 可以方便地利用其中2 个mcbsp完成对aic23 的控制和通信, 其中vc5416 的mcbsp0 与aic23的数据口相连, mcbsp1 与aic23 的控制口相连3。aic23 芯片是一个可编程芯片, 内部有11个16 位寄存器,控制接口具有spi 和i2c 工作方式, 这两种工作方式由mode引脚来选择, 即:mode=0 为i2c 模式;mode=1 为spi 模式。如下图所示。aic23 与vc5416 的接口电路bfsx1bdx1bclkx1bclkx0bclkr0bdx0bdr0bfsx0bfsr0/csdinsclkbclkdindoutlrcinlrcout 图2 aic23 与vc5416 的接口电路vc5416 的2个多通道缓冲串口mcbsp 分别配置为i2c 模式和spi 模式。mcbsp0 作为数据的发送和接收端口,bsp1对codec 写控制字, 作为控制端口,aic23 作为从设备, 因此设置为slave 模式, 而vc5416 则设置为master 模式, codec 采样率设置为8khz。42.4 bootloader 设计fpgaflashdspd0-d7d0-d2/is图3 bootloader 原理vc5416 片内rom 中有固化的自加载程序(bootloader),但它对被加载程序的大小有限制。在使用8bit flash 的情况下, 只能加载小于16k的内容。而三个速率的selp 算法程序区和数据区的总数据量远远超过16k, 显然只使用片内的bootloader 是不能满足需要的。因此,首先由vc5416 片内的bootloader 把自己写的加载程序加载到片内ram, 然后执行这段加载程序, 加载其它部分。这里需要解决的一个主要问题就是flash 数据和片内地址空间的映射关系。由于selp 算法的程序数据总量很大, 所以必须用到片内扩展的程序区, 也就是说mp/mc 标志位需要设为0。从此时的memory map 中可以看出, vc5416 可以访问的每块连续片外地址空间只有32k, 所以flash 数据只能按照每页32k 的方式分页映射到片内地址空间。使用fpga 可以很方便地控制哪页flash 数据映射到片内中, 这部分的原理框图如图3 所示。3、系统软件设计与实现3.1语音识别的基本原理语音识别本质上是一种模式识别的过程5 ,其基本结构框图如图4 所示。预处理特征提取相似性度量后处理参考模式库图4 语音识别基本原理图语音识别过程主要包括语音信号的预处理、特征提取、建立参考模板库、相似性度量和后处理等几个功能模块 ,对小词表语音识别系统, 往往不需要语音后处理部分。预处理包括预滤波、采样和量化、加窗、端点检测、预加重等过程。提取的特征参数必须满足以下的要求 6 :(1) 能有效代表语音特征;(2) 各参数之间有良好的独立性;(3) 特征参数要计算方便, 以保证语音识别的实时实现。在训练阶段,将特征参数进行一定的处理后, 为每个词条建立1 个模型,保存为参考模板库。在识别阶段,将输入的语音的特征矢量参数和参考模板库中的模式进行相似性度量比较, 将匹配分数最高的参考模板作为识别结果。3.2 接口软件设计本系统的软件采用c 语言和汇编语言混合编写。由于是利用vc5416 的mcbsp 口来控制aic23 芯片, 且2个mcbsp 口设置成不同的工作方式, 所以必须把mcbsp 初始化为符合aic23芯片的控制命令时序和要求的工作模式。对vc5416 及aic23 芯片初始化设置时的部分代码如下。3.2.1 tms320vc5416 初始化swwsr=0x7fff; /程序、数据、i/o 空间swcr=0x0001; /等待周期为72=14bscr=0x8006; /按32kw分区, hd7:0, d15:0holdclkmd=pll_div_init;waitloop(0x0400);clkmd=pll_lock_init_x(5);waitloop(0x0400);pmst=0x0168; /中断向量表定位在0x100, mp/mc=1ovly=1,drom=1;3.2.2lv320aic23 初始化为使aic23 正常工作并产生预期的音频效果, 必须对其相应的寄存器进行配置。首先对vc5416 的i2c 模块初始化, 将aic23 总线上的地址写入从机地址寄存器icsar; 再把相应的aic23 内部映射寄存器的地址和待写数据合并为16bit 控制字,逐次写入icdxr, 并通过i2c 总线发送给aic23, 即可完成对aic23 的初始化配置。aic23 初始化的源代码:unsigned int codec_buf =ox1e00, oxoc00, oxo81a,oxoao4, oxoe01, 0x1020, 0x1021, 0x0117, oxo5f9;port_sub_address=(unsigned int*)mcbsp_spsa_addr(1);port_sub_index_reg=(unsigned int*)mcbsp_spad_addr(1);*port_sub_address=mcbsp_spcr2_subaddr;for(i=o;i9;i+)while(! (*port_sub_index_reg&(mask_bit(xrdy);set_codec_cs_low();mcbsp1_dxr1=codec_bufi;while(! (*port_sub_index_reg&(mask_bit(xrdy);set_codec_cs_high();3.2.3小波变换小波变换已经在科技信息产业领域取得了令人瞩目的成就。信号处理已经成为当代科学技术工作的重要部分,信号处理的目的就是:准确的分析、诊断、编码压缩和量化、快速传递或存储、精确地重构(或恢复)。现在,对于其性质随时间是稳定不变的信号,处理的理想工具仍然是傅立叶变换。但是在实际应用中的绝大多数信号是非稳定的,而特别适用于非稳定信号的工具就是小波分析。事实上小波变换的应用领域已十分广泛,它包括:数学领域的许多学科;信号分析、图像处理;量子力学、理论物理;军事电子对抗与武器的智能化;计算机分类与识别;音乐与语言的人工合成;医学成像与诊断;地震勘探数据处理;大型机械的故障诊断等方面;例如,在数学方面,它已用于数值分析、构造快速数值方法、曲线曲面构造、微分方程求解、控制论等。在信号分析方面的滤波、去噪声、压缩、传递等。在图像处理方面的图像压缩、分类、识别与诊断,去污等。在医学成像方面的减少b超、ct、核磁共振成像的时间,提高分辨率等。在实际应用中,语音识别要解决的首要问题是客观存在的环境噪声。如何滤掉系统中存在的噪声,在当今语音识别的研究领域中占有很重要的地位。该语音识别系统加入了小波变换,可以有效地去除系统中的噪声,提高系统的识别率。由于语音信号的特殊性,人们希望找到一种有效的降噪方法,以改善语音识别的效果。常用的滤波方法是采用带通滤波器,滤掉语音信号中的高频噪声,但这种方法只是对特定的噪声效果明显。利用小波变换进行降噪处理,以滤掉在背景下的各种高频噪声,提高语音识别系统的整体性能6。小波变换(wavelet transform)克服了傅立叶变换和窗口傅立叶变换的缺点,具有窗口自适应性,能对信号作不同尺度的分析。小波变换是一个时间和频率的局域变换,能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,解决了傅立叶变换不能解决的许多问题,因而小波变换被誉为“数学显微镜”,在信号分析领域中占有非常重要的地位。下面介绍小波降噪的原理。一个含噪声的一维信号模型可表示为 s(k) = f(k) +e (k) k = 0, 1, , n - 1 (1)式中s(k) 含噪声信号f(k) 有用信号e(k) 噪声信号噪声信号的比例系数通常,噪声信号包含在具有较高频率的细节中。对信号进行小波分解时,可利用门限阈值等形式对所分解的小波形式进行处理, 然后对信号进行小波重构即可达到对信号降噪的目的。可将噪声e ( k)看作普通信号,分析它的相关性、频谱、频率3个主要特征。语音信号经过小波变换后, 信息主要集中在低频部分,噪声主要集中在高频部分。通常,在低频部分,语音信号的小波系数值大于白噪声的小波系数值;在高频部分,语音信号的小波系数值小于白噪声的小波系数值。小波降噪的具体步骤如下:(1) 选择适当的小波函数,并确定变换次数,对含噪声语音信号进行小波变换。(2) 确定小波变换后各层子波的门限阈值,对各层小波系数进行修正。(3) 对修正后的小波系数进行小波反变换,恢复出降噪后的语音信号。首先进行3层小波分解,分解模型如图5所示, s = ,噪声部分包含在高频、中。然后对各个子波设定一个阈值, 再对每一个子波进行加权处理,加权后, s =。其中, 0.9 1,且0 0.1,且n = 1, 2, 3。这样就可以有效降噪, 并保留语音信号。s图5三级小波的分解模型隐马尔可夫模型( hidden markov model,hmm)作为语音信号的一种统计模型,正在语音处理各个领域中获得广泛的应用7。隐马尔可夫过程是一个双重随机过程:一重用于描述非平稳段的统计特性(信号的瞬态特性,可直接观测到) ;另一重随机过程描述了每个短时平稳段如何转变到下一个短时平稳段,即短时统计特征的动态特性(隐含在观察序列中) 。建立的隐马尔可夫模型可解决以下3个问题:(1) 已知观察序列o 和模型,如何计算由模型 产生观察序列o 的概率 。(2) 已知观察序列o 和模型, 如何确定一个合理的状态序列,使之能最佳地产生o,即如何选择最佳的状态序列。(3) 如何根据观察序列不断修正模型参数(a, b ,) ,使p (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论