




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实验报告之语音采集与回放作者:吴瑶魏翠袁文涛赛前及文稿整理辅导老师:黄根春摘要本系统基本实现了语音信号的采集与回放。其主要结构由语音处理前向通道,A/D转换模块,单片机控制兼数据处理模块,D/A转换模块,键盘显示模块及后向处理通道组成,实现了语音的采集与回放功能。设计制作时使用了32K存储器和较高速 A/D (AD574 ),并分别尝试了 4K , 8K的采样频率,效果不错,在 PCM , DPCM , IV三种编码模式下,基本 上都能较好的进行语音回放。整个制作过程,单片机控制处理程序简练,前后向处理通道效果良好,系统已具备较高的性能指标。一:方案设计与论证顾名思义,语音采集与回放系统具有两
2、个最基本的功能:完整的采集原音数据和回放 语音。采集数据主要由前向通道和A/D实现,前向通道将语音放大,滤波,然后送给 AD采样,继而CPU读入数据并压缩存储;而语音回放主要是将前向采集的数据解压缩,然后 送至DA及后向通道还原出语音信号。下面就对这些重要环节的设计方案做论证和比较。1:语音采集(1) :语音信号放大:因为话筒采集的声音信号极为弱小,一般小于5mv,所以在AD采集之前要对小信号进行隔离放大。测量放大器具有高输入阻抗,高放大倍数,抗噪性能好,可以对小信号进行很好的隔离与放大,所以选择该种放大器来做语音信号前置放大的核心放大电路。(2) :前向滤波:滤波要求通频带内平外陡。一般情况
3、,巴特沃斯滤波器通频带较为平坦,而采用多阶滤波可提高陡度。所以采用5阶巴特沃斯低通和 5阶巴特沃斯高通级联,效果挺好。(3) :数据采入:选择较高速 AD采样芯片AD574作信号采样和转换处理,据奈奎斯特采样定理,系统分别采用了 4K , 8K的采样速率对语音信号进行采样。下面则对读取和压缩数据的设计方案作比较。方案(一):使用CPLD或FPGA高速读入数据,继而在其内部进行压缩编码,不经 过CPU直接送至存储器,而 CPU只作一些控制功能。(用FPGA实现DMA功能)方案(二):使用单片机作控制兼数据处理功能。也即CPU控制读入采样数据,继而自行进行数据压缩,放至存储器。两种方案都可以较好的
4、进行语音压缩编码。方案1速度快,处理方便,可以作更多的算法处理,但价格昂贵,成本太高;方案 2速度虽慢,但若使程序简练,算法精辟,速度可 以达到要求,而且成本相对较低,故采用第二种方案。(4) :数据压缩编码方式:采用常用的三种语音编码方式:即采即放PCM,插值IV,差分脉冲编码DPCM 。2语音回放(1) :输出已压缩语音:选择DAC0832作D/A转换处理,比0800控制方便。而CPU 的数据解压缩,也有两种方案,同上,设计时选择单片机自行进行数据解码处理。(2) :后向滤波:与前向滤波方案一致。(3) :音频功放:人耳听到的语音功率不大,故选择常用的集成功放芯片LM386来 驱动0.5W
5、的扬声器,达到了不错的效果。二:系统各模块的具体设计与实现系统组成及原理框图如图 1 -1- 1所示。以下就各模块进行具体分析。(系统框图1-1-1)1:前向通道(1) :小信号隔离放大的电路设计和实现 :拾音器采集的信号极为弱小,且拾音器输出阻抗不可忽略,故放大前必须进行隔离,并尽量减小信号输出阻抗。本电路采用运放隔离电路 放大部分则分前置同向放大,测量放大及自增益控制放大电路。前置同向放大电路具有很高的输入阻抗,可以先将小信号进行适当放大,再用高抗噪的测量放大器进行大幅度放大,自增益控制放大电路则是考虑到放大信号过大,以防A/D采样失真,并可以使声音变得圆润。又考虑到放大电路会引入直流分量
6、,还会有偏零现象,故在整个放大电路的设计中必须加入耦合和调零电路。具体电路图分别如下:R/10 kOhm/50这是隔离电路, 同向放大器的运放在 见图(1 1 3)(前置隔离放大电路图1-1-2)4.7uf的电容和3M的电阻组成阻容耦合电路,1, 5调零端接入调零电路。我们取该放大器并增大隔离器输入阻抗。Av = 2;继而进入测量放大,uFL hmV/60 Hz/O Deg 10 kOhmWVVR/2 kOhm 巧5 k Ohm -VvV10 kOhmVW-7411 M Ohm1 M Ohm27 k Ohm-VW27 k Ohm27 kOhm -WV+27 kOhm-Vv27 k Ohm-Vv
7、V-74127 kOhm-VW(测量放大电路1-1-3)该测量放大器同样采用了阻容耦合电路,前级的两个运放则是将输入信号进行双极性转换。进入测量放大器的信号线 采用屏蔽导线。而两个1M的电阻则是使测放电路上下充分 对称,降低零点漂移,并提高共模抑制比。其中Av=1+2R/Rf,(该电路中,R = 27K取标称值, Rf为2K滑变),故Av>=28。此时已将一般语音信号放大至1V左右。然后进入 AGC控制放大电路,将信号峰峰值范围稳住,见图(1-1-4 )。3 m Ohm47 UF74ivfchrn4(AGC控制放大电路1-1-4)图中场效应管选用 3DJ6F, N沟道,Vgs必须是负值。
8、当 Vgs由0向负向增大时,管 子沟道变窄,导通电阻增大,放大倍数减小,否则反之;故在运放输出进行负向检波,得到 负直流控制电压,两个3M的电阻则是使管子栅极电流小,并有高频扼流功能,47uf的电容也是去纹波。(2) :前向滤波电路:选择巴特沃斯滤波器,5阶低通级联5阶高通,具体电路见图1-1-5。1.3fi nF二二 12 nF用MF(图 1-1-5)滤波器参数选择:由5阶巴特沃斯函数极点可以算出其归一化滤波器的各元件参数:低通:R=47k;C1=1.75nf;C2=1.35 nf;C3=0.42 nf;C1 '=3.2 nf;C2 '=0.31 nf;高通:C=0.01UF
9、;R1=30.3K;R2=39.2K;R3=126;R1 '=16.4K;R2 '=171.8K;2:中央处理模块中央处理模块由 AD,DA及单片机控制兼处理模块组成。(1): A/D芯片选择较高速12位AD芯片AD574 ,但由于单片机内部处理限制,只启动 8位转换。其与单片机的接口采用标准接法,见图(1-1-6 )。<WR<RDVCC1心DB11REFOUTDBIOEEFINDB9Em OFFDB7AGDE6AD574DE5DE4燮/CSDB2A19DEIR/CDBOCElavnbrSTSmgrAD574DID(AD574采样电路1-1-6)(2): D/A选用
10、0832,方便控制,速度适中,性能良好。接口图见(1-1-7):(DAC0832数模转换电路 1-1-7)(3):单片机控制兼处理模块:采用89S52处理器构成单片机最小系统,扩展一片容量为32Kbyte的62256芯片作为语音存储介质,通过键盘选择如下几种编码解码方式。下面分别对各种方式进行阐述:1:压缩编码:有三种编码方式:即存即放PCM,差分脉冲DPCM,插值IV;PCM :录音时,单片机采入 AD转换的数据,随即存入 RAM ;放音时,单片机又将 这些数据依次送入 DA转换,可以很好的还原语音。DPCM :差分脉冲编码调制。采用预测编码技术,从输入中减去预测值,然后对预测误差进行量化,
11、最终的编码就是预测值与实际值的差值。解码器用以前的数据对当前样值进行预测,然后用误差编码重构原始样值。性能决定于预测编 码的方法。DPCM系统是一个负反馈系统,采用这种结构可以避免量化误差的积累。在实际应用中,我们用四个Bit对差值进行量化编码,最高位作为符号位,0表示当前样本值大于预测值,1表示当前样本值小于预测值,剩下三位保存插值的量化绝对值。这种编码方式可以很好的还原原始语音信号,并且将录音时间延长到了 8s,但是引入了少量噪音。DM :增量调制,也称 调制。DM是对实际的采样信号与预测的采样信号之差的 极性进行编码,将极性变成 0和1这两种可能的取值之一。这样每个byte可以用一个bi
12、t来表示,压缩率达到 8: 1,录音时间延长到了 32s。在增量调制 编码中,量化阶的选择至关重要。过大,会引入严重的粒状失真;过小,会产生斜率过载,造成超越失真。根据AD采集的语音信号幅度的大小和实际的调试经验,取 = 10可以得到最佳的语音还原。由于超越失真和粒状失真 的存在,恢复的语音信号幅度明显没有其他几种编码方式大,并且当输入信号较平坦时,重构信号被一个周期性的方波信号污染,经分析认为是由粒状失真造成。在软件中采取适当措施,很好的抑制了污染。IV:线性插值法。即使用 4k/s对语音信号进行半采样,并且直接编码存储,重构 时在两个实际值之间插入它们的平均值,用8k/s的速率播放。在实际
13、调试中我们发现,取3个实际值的平均值作为插入值效果更加理想。由于是半采样, 所以对语音信号中的高频分量损失很大,在放音时有明显表现。2:解压缩:由于压缩算法都是线性算法,故只需对压缩算法进行逆运算就可以对压缩编码进行解压缩。3:后向通道(1):后向滤波:复制前向滤波器。(2) :音频功放:选择一般集成功放芯片LM386。设计时在其传统接法上作了些改进, 使男低音得到适当提升,并稍微抑制女高音,感觉效果较好。具体电路图如下:GND(功放电路1-1-8)三:系统调试根据方案设计的要求,调试过程分为三大部分:硬件调试、软件调试和软硬件联调。电路按模块调试,各个模块调试通过后再联调。1:硬件调试前级测
14、量放大电路和 AGC电路的调试是本系统硬件调试的重点和难点, 测量放大器 具有很高的共模抑制比,调整其参数,使背景噪声得到有效的抑制;AGOt路根据输入信号的幅度自动调整增益的大小,使语音信号幅度平坦,限制在AD的最佳采集范围之内(-2V 2V),使微弱信号和大信号都能得到有效的采集。 使用AGC电路之后,系统的 动态范围得到了很大的扩展,使得系统的语音采集范围达到了4米!2:软件调试程序全部由c语言编写,可实现编码模式选择、录放起止、暂停、停止、音量加 减、快进、快退、反复播放等功能。人机交互采用16X 1液晶显示器和4X 4键盘,界面友好。本系统使用单片机内部定时器中断产生采样频率。即使定
15、时器T0工作在可以自动赋初值的模式2状态,定时125us,产生8K的采样频率。本软件设计的瓶颈在于,两 次中断的时间间隔太短(125us),在这125us内,单片机要完成启动 AD转换、等待转 换结束、读取转换结果并对数据进行压缩存储。单片机的执行速度限制了压缩与解压算法的复杂程度,使我们只能选择最简单的算法,这直接影响到了恢复的语音信号的质量。本软件设计的另一个难点在于显示部分。由于LCD是慢速器件,执行一条指令需要多达100多个机器周期,在系统不断产生中断的情况下,实时显示录放信息(录放时间)成为很大困难。为了解决这个问题,我们尝试了在中断服务程序中添加显示指令, 即当录放时间达一秒时,
16、执行一次显示指令, 在指定的显示位上显示当前秒数。为了节省时间,我们抛弃了传统的刷屏显示套路,而是对光标进行精确定位,只对要显示的位进行操作,这样就大大的节省了CPU的等待时间。当然,在每一秒钟到来的时刻,执行显示指令会对采样频率造成影响,但是实际证明,这种影响几乎可以忽略不记。程序开始时设计了 RAM检测程序,以保证 RAM工作的可靠性。软件主体流程图如下:桐蛤化|EAM检测驮认模式|等将按罐(图 1-1-9)T0中断服务程序流程图如下:读取F州数据,RAF地址+ +I解码I瞄出3:软硬联调本系统的软件和硬件联系非常紧密。在软件调试成功之后加入AD, DA电路,用信号源和示波器模拟前向通道和
17、后向通道, 直至DA输出波形与AD采集波形一致。最后加 入前向放大系统、滤波系统、功放系统实现整机联调。四:系统性能测试1、测试仪器:PC机(P4 1.8G,256M内存)、WAVE600吩真机、SG1733SB3At流稳压稳流电源、TDS1002数字示波器、33120A信号源及FLUKE17醒字万用表各一台。2、测试过程:一名组员在离麦克风不同的距离上以同样的声音大小说话,分别换用不同的编码方式,对各种编码方式的最终放音效果进行了记录,如表1 1 1所示:编码方式采样速率(k/s)放音速率(k/s)M时间(s)放音效果PCM884好DPCM888好ADM8832能听清楚插值法488能听清楚(表 1 11)由表可见,在有限
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 计算机网络架构设计的原则与方法试题及答案
- 战略沟通的重要性试题及答案
- 如何进行项目风险评估试题及答案
- 委婉拒绝合同条款回复函
- 重新定义品牌核心价值的方法计划
- 2025【设备租赁合同】设备租赁合同
- 程序调试与优化方法试题及答案
- 班级心理健康知识普及活动计划
- 精炼试题2024年高考数学及答案
- 计算机网络技术基础试题及答案
- 《高效面试技巧课件版》教案
- 实验室精密仪器全面维护保养服务协议
- (三模)2025年沈阳市高中三年级教学质量监测 (三)生物试卷(含答案)
- 拓扑优化与异形结构打印-洞察阐释
- 【绥化】2025年黑龙江绥化市“市委书记进校园”事业单位引进人才287人笔试历年典型考题及考点剖析附带答案详解
- 粉笔协议班电子合同
- 2025年电缆购销合同范本9篇
- 2025+CSCO非小细胞肺癌诊疗指南解读课件
- 中学生学宪法班会课件
- 医院后勤考试试题及答案
- 县人民医院老住院楼装修改造项目可行性研究报告申请报告编写
评论
0/150
提交评论