语音信号处理课设哈理工_第1页
语音信号处理课设哈理工_第2页
语音信号处理课设哈理工_第3页
语音信号处理课设哈理工_第4页
语音信号处理课设哈理工_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、语音信号处理课程设计任务书一、课程设计的目的和意义1掌握如何使用DSP仿真平台、DSP内部结构和工作原理;2熟悉用DSP实现各种基本算法。3了解ICETEK-VC5509-A 板上语音codec 芯片TLV320AIC23 的设计和程序控制原理。4了解数字回声产生原理、编程及其参数选择、控制。5熟悉VC5509DSP 扩展存储器的编程使用方法6.了解语音编码G.711 的特点、工作原理及其编程。7了解PCM 编码过程及应用,学习ALaw 压缩解压缩方法的运算过程和程序编制实现。8通过实验体会语音编解码过程及应用。9熟悉FIR 滤波器工作原理及其编程。二、课程设计的题目1. 基于DSP的语音采集

2、和放送系统设计;2. 基于DSP5000系列的语音信号编码解码(G.711);3. 基于DSP5000系列的语音信号的FIR 滤波。三、课程设计报告的撰写要求1. 设计目的;2. 设计原理;3. 设计流程图;4. 实验步骤;5. 主要程序代码;6. 设计结果分析,提出改进措施,心得体会。四、课程设计时间安排1月4号 布置课程设计任务1月5号 查找相关资料,完成程序总体规划1月6号 上机进行程序操作和调试1月7号 上机进行程序操作和调试1月8号 撰写并提交课程设计报告摘要 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门新兴学科。语音信号处理的应用极为广泛,其中的主要技术包括语音编码

3、、语音合成、取语音识别识别作为重点讨论课题。语音识别就是让计算机听懂人说的话,并作出正确的反应。目前主流的语音识别技术是基于统计模式识别的基本理论。本文首先对语音信号处理进行了概述,其中包括各种处理技术、发展及应用。接下来主要介绍了语音处理方面的手段,介绍了语音信号的采集和放送(回声)、语音信号的编码解码(G.711)以及语音信号的FIR滤波,并在CCS环境下和ICETEK-VC5509-EDU实验箱上进行软件仿真和硬件仿真。 关键词:语音信号处理;采集和放送;编码解码;滤波目录第1章 绪论1第2章 设计目的2第3章 设计基本原理3第4章 设计内容6 4.1 语音的采集与放送6 4.2 语音信

4、号编码解码(G.711)11 4.3 语音信号的FIR滤波13第5章 课程设计心得体会19参考文献20第1章 绪论语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新型学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。20世纪60年代中期形成的一系列数字信号处理的理论和算法

5、,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC)。并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术-矢量语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HM化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述M已构成了现代语音识别研究的重要基石。近年来人工神经网络(ANN

6、)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一。同时,它的许多成果也体现在有关语音信号处理的各项技术之中。语音信号处理技术的应用极其广泛,涉及工业、军事、交通、医学、民用等各个领域,其中最重要的包括语音编码、语音合成、语音识别以及语音增强等。第2章 设计目的1掌握如何使用DSP仿真平台、DSP内部结构和工作原理;2熟悉用DSP实现各种基本算法。3了解ICETEK-VC5509-A 板上语音codec 芯片TLV320AIC23 的设计和程序控制原理。4了解数字回声产生原理、编程及其参数选择、控制。5熟悉VC5509DSP 扩展存储器的编程使用方法6.了解语音编码G.7

7、11 的特点、工作原理及其编程。7了解PCM 编码过程及应用,学习ALaw 压缩解压缩方法的运算过程和程序编制实现。8通过实验体会语音编解码过程及应用。9熟悉FIR 滤波器工作原理及其编程。第3章 设计基本原理1TLV320AIC23 芯片性能指标及控制方法位置及其插座:初始化配置:DSP 通过I2 C总线将配置命令发送到AIC23,配置完成后AIC23 开始工作。语音信号的输入:AIC23 通过其中的AD 转换采集输入的语音信号,每采集完一个信号后,将数据发送到DSP 的McBSP 接口上,DSP 可以读取到语音数据,每个数据为16 位无符号整数,左右通道各有一个数值。语音信号的输出:DSP

8、 可以将语音数据通过McBSP 接口发送给AIC23,AIC23 的DA 器件将他们变成模拟信号输出。2数字回声原理:在实际生活中,当声源遇到物体时,会发生反射,反射的声波和声源声波一起传输,听者会发现反射声波部分比声源声波慢一些,类似人们面对山体高声呼喊后可以在过一会儿听到回声的现象。声音遇到较远的物体产生的反射会比遇到较近的物体的反射波晚些到达声源位置,所以回声和原声的延迟随反射物体的距离大小改变。同时,反射声音的物体对声波的反射能力,决定了听到的回声的强弱和质量。另外,生活中的回声的成分比较复杂,有反射、漫反射、折射,还有回声的多次反射、折射效果。当已知一个数字音源后,可以利用计算机的处

9、理能力,用数字的方式通过计算模拟回声效应。简单地讲,可以在原声音流中叠加延迟一段时间后的声流,实现回声效果。当然通过复杂运算,可以计算各种效应的混响效果。如此产生的回声,我们称之为数字回声。3G.711 语音编码标准:G.711 是国际电报电话咨询委员会(CCITT)和国际标准化组织(ISO)提出的一系列有关音频编码算法和国际标准中的一种。应用于电话语音传输。G.711 是一种工作在8kHz 采样率模式下的脉冲编码调制(Pulse Code Modulation,PCM)方案,采样值是8 位的。按照恩奎斯特法则规定,采样频率必须高于被采信号最大频率成分的2倍,G.711 可以编码的频率范围是从

10、0 到4kHz。G.711 可以由两种编码方案:A 律和律。G.711 采用8kHz、8 位编码值,占用带宽为64kbps。4PCM 编码:在电话网络中规定,传输语音部分采用0.3 到3.3kHz 的语音信号。这一频率范围可覆盖大部分语音信号,它可以保留语音频率的前3 个共振峰信息,而通过分析这3 个共振峰的频率特性和幅度特性可以识别不同人,而0-0.3Hz 和3.3kHz-4kHz 未用,也被当成保护波段。总之,电话网络具有4kHz 的带宽。由于需要通过这一带宽传送小幅变化的语音信号,需要借助于脉冲编码调制 (PCM),使模拟的语音信号在数字化时使用固定的精度,以最小的代价得到高质量的语音信

11、号。PCM 编码需要经过连续的三步:抽样、量化和编码。抽样取决于信号的振幅随时间的变化频率,由于电话网络的带宽是4kHz 的,为了精确地表现语音信号,必须用至少8kHz的抽样率来取样。量化的任务是由模拟转换成数字的过程,但会引入量化误差,应尽量采用较小的量化间隔来减小这一误差。最后,编码完成数字化的最后工作,在编码的过程中,应保存信息的有效位,而且算法应利于快速计算,无论是编码还是解码。其中,压扩运算可以采用两种标准:A 律(A-law)和律(-law)。律是美洲和日本的公认标准,而A 律是欧洲采用的标准。我国采用的是欧洲标准。5A 律压扩标准:A 律(A-Law)编码的数据对象是12 位精度

12、的,它保证了压缩后的数据有5 位的精度并存储到一个字节(8 位)中。其方程如下:F(x) = sgn(x) A |x| / (1 + lnA) 0 < |x| < 1/A= sgn(x) (1+ln A|x|) /(1 + lnA) 1/A < |x| < 1其中,A 为压缩参数取值87.6,x 为规格化的12 位(二进制)整数。下面是用折线逼近的压缩方程曲线示意图:图3-1 压缩方程曲线我们将A 律压缩编码图示如下:图3-2 压缩编码A 律解码方程为:A 律解码示意图:图3-3 A律解码一般地,用程序进行A 律编码解码有两种方法:一种是直接计算法,这种方法程序代码较多

13、,时间较慢,但可节省宝贵的内存空间;另一种是查表法,这种方法程序量小、运算速度快,但占用较多的内存以存储查找表。6FIR 滤波器原理参数选取:实验程序采用64阶滤波参数,低通滤波,汉明窗(Hamming Window)函数,截止频率为2400Hz,采样频率为48000Hz,增益40dB。7TI 的算法库dsplib 使用:在这里, 我们需要调用dsplib 中的函数fir2 。调用规则可以参看文档c:tidocspdfspru422.pdf。这是一个可以利用DSP 中有双MAC 硬件的滤波程序,而TMS320VC5509DSP 片内具有双MAC,可以用此程序完成运算。第4章 设计内容4.1 语

14、音的采集与放送本设计目的是实现语音的采集与放送,即在硬件设备上实现实验者声音的采集和实时放送,说出即可听到自己的声音。当已知一个数字音源后, 可以利用计算机的处理能力, 用数字的方式通过计算模拟回声效应。简单地讲,可以在原声音流中叠加延迟一段时间后的声流,实现回声效果。当然通过复杂运算,可以计算各种效应的混响效果。如此产生的回声,我们称之为数字回声。通过计算机和ICETE-VC5509-EDU实验箱的软硬件协作实现语音采集与放送。程序流程图:图4-1 硬件运行流程图4-2 软件流程图实验步骤:1实验准备:连接实验设备。准备音频输入、输出设备。将耳机上麦克风插头插到 ICETEK-VC5509-

15、A 板的 J5 插座,即上图中“麦克风输入” 。将耳机上音频输入插头插到 ICETEK-VC5509-A 板的 J7 插座,即上图中“耳机输出” 。调节耳机上音量旋钮到适中位置。2设置 Code Composer Studio 2.21 在硬件仿真(Emulator)方式下运行。3启动 Code Composer Studio 2.21。选择菜单 DebugReset CPU。4打开工程文件:工程目录为:C:ICETEK-VC5509-EDULabLab0701-Echoaudio.pjt。5编译、下载程序,选择菜单 Debug->Go Main,使程序运行到 main 函数入口位置。6

16、设置观察窗口:打开源程序 aic23.c,将变量 bEcho、uDelay 和 uEffect 加入观察窗口。图4-3 主函数位置图4-4 反汇编7运行程序观察结果:-按“F5”键运行,注意观察窗口中的 bEcho=0,表示数字回声功能没有激活。-这时从耳机中能听到麦克风中的输入语音放送。-将观察窗口中 bEcho 的取值改成非 0 值。-这时可从耳机中听到带数字回声道语音放送。-试着分别调整 uDelay 和 uEffect 的取值,使他们保持在 0-1023 范围内,同时听听耳机中的输出有何变化。图4-5 修改bEcho值激活回声8退出 CCS:实验结果分析:修改bEcho的值为非零参数,

17、运行并下载至实验箱中,将双线带麦克风耳机分别插入准确的孔,然后对麦克风说话可以在耳机里听见自己的回声。声音放送可以加入数字回声,数字回声的强弱与原声的延迟均可以在程序中设定和调整。图4-6 将程序下载至实验箱中4.2 语音信号编码解码(G.711)本实验目的在于了解语音编码G.711的特点、工作原理以及编程,了解PCM编码过程及其应用,学习Alaw压缩解压缩方法的运算过程和程序编制实现。图4-7 TLV320AIC23芯片实验步骤:1实验准备:连接实验设备。准备音频输入、输出设备。测试计算机语音输出:用“我的电脑”帮助启动播放语音文件C:ICETEK-VC5509-EDULabLab0702-

18、AudioG711AudioLineIn.mp3, 并选择播放器参数为循环播放;将耳机上音频输入插头插入计算机上耳机插座;仔细听耳机中是否有输出、左右声道应该输出不同。拔下耳机音频输入插头,用实验箱附带的音频连接线(两端均为 双声道音频插头)连接计算机耳机输出插座和 ICETEK-VC5509-A 板上 J5 插座,上图中“麦克风输入” 。将耳机上音频输入插头插到 ICETEK-VC5509-A 板的 J7 插座,即上图中“耳机输出” 。调节耳机上音量旋钮到适中位置。2设置 Code Composer Studio 2.21 在硬件仿真(Emulator)方式下运行。3启动 Code Comp

19、oser Studio 2.21。选择菜单 DebugReset CPU。4打开工程文件:工程目录为:C:ICETEK-VC5509-EDULabLab0702-AudioG711audio.pjt。5编译、下载、运行程序到 main 函数。6设置观察窗口:打开 aic23.c,将变量 bCodec 加入观察窗口。7运行程序,听效果:-按“F5”键,可以听到立体声线路输入的语音信号。这时的语音信号并未经过压扩处理。-修改观察窗口中 bCodec 的值为非 0 值,启动 A-law 压扩算法,听效果。-反复修改 bCodec 的值成 0 或非 0,比较原声和编码并还原的声音。8退出 CCS图4-

20、8 修改bCodec的值实验结果分析:从实验上分析,因为底噪和线传输损耗以及接触不良等因素会导致有干扰,无法很好的用耳朵去分辨质量。 从理论上分析,压扩后的声音与原声质量相近,且左右声道使用一个缓冲区存储,至少节省了一半存储空间。实验程序采用了直接计算方法进行压缩和解压缩。4.3 语音信号的FIR滤波本实验采用64阶数滤波参数、低通滤波器,汉明窗函数,截止频率为2400Hz,采样频率为48000Hz,增益为40dB。实验流程图:图4-9 硬件流程图图4-10 软件流程图实验步骤:1实验准备:连接实验设备。准备音频输入、输出设备。将耳机上麦克风插头插到 ICETEK-VC5509-A 板的 J5

21、 插座,即上图中“麦克风输入” 。将耳机上音频输入插头插到 ICETEK-VC5509-A 板的 J7 插座,即上图中“耳机输出” 。调节耳机上音量旋钮到适中位置。2设置 Code Composer Studio 2.21 在硬件仿真(Emulator)方式下运行。3启动 Code Composer Studio 2.21。选择菜单 DebugReset CPU。4打开工程文件:工程目录为:C:ICETEK-VC5509-EDULabLab0703-AudioFIRaudio.pjt。5编译、下载、运行程序。用麦克风输入一些语音信号,可以从耳机中听到:左声道存在一些高频噪声,而右声道则较为干净

22、。下面我们根据输入输出波形分析这个现象。6设置断点:在麦克风上吹气,造成“呼呼”声音输入,同时在程序 aic23.c 的有“break point”注释的语句上加注软件断点(双击此行前的灰色控制条),程序会停止在此行上。7打开观察窗口,观察滤波效果显示:图4-11 调整左声道输入图4-12 调整右声道输入图4-13 滤波器-观察窗口中各波形的时域波形。-将各观察窗口参数中“Display Type”项分别改成“FFT Magnitude” 。-观察窗口中各波形的频域波形。8使用计算机提供的声源: 测 试 计 算 机 语 音 输 出 : 用 “ 我 的 电 脑 ” 帮 助 启 动 播 放 语 音 文 件C:ICETEK-VC5509-EDULabLab0703-AudioFIRAudioLineIn.mp3,并选择播放器参数为循环播放;将耳机上音频输入插头插入计算机上耳机插座;仔细听耳机中是否有输出。拔下耳机音频输入插头,用实验箱附带的音频连接线(两端均为 双声道音频插

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论