【毕业学位论文】(Word原稿)语音信号数据传输-控制理论与控制工程_第1页
【毕业学位论文】(Word原稿)语音信号数据传输-控制理论与控制工程_第2页
【毕业学位论文】(Word原稿)语音信号数据传输-控制理论与控制工程_第3页
【毕业学位论文】(Word原稿)语音信号数据传输-控制理论与控制工程_第4页
【毕业学位论文】(Word原稿)语音信号数据传输-控制理论与控制工程_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

22 数 据 传 输 摘 要 本系统对语音信号采用时域处理方法:数据采集直存直取、欠抽样采样、自相似增量调制法等三种方法,分别完成了对语音信号 、 、 的存储与回放;前置自动增益控制( 语音信号控制在 A/D 转换器可处理的范围内以保证话音采样不失真;带通滤波器合理的通带范围有效地滤除了带外噪声,减小了混叠失真;通过后级补偿电路对输出的语音信号进行了)/s 校正,回放语音清晰;并具有自动录音、手动录音、录 /放音时间显示以及掉电后保护语音信号 等功能。 23 一、 方案设计与论证 本题目是设计制作一个数字化语音存储与回放系统。要求前置放大器的增益为 46益可调;带通滤波器,带宽为 300样频率 长 =8位;语音存储时间 10秒;换频率 长 =8 位;且要求回放语音质量好(话音清晰、失真小、杂音少)。方案考虑如下。 (一) 语音编码方案论证 语音是一维时间信号,由于是表示语言声音的信号,所以不是恒定的,信号的性质随时间变化很大。为了充分利用有限的存储空间,并不失真地传送语音信号必须对采集 后的语音信号进行进一步压缩,即语音压缩。所谓语音压缩,是为了声音信号更大信息量的传送与记忆而压缩数据,并有效地回放声音的过程。语音压缩可由将语音信号采集,并利用适当的量子化形式的压缩符号化或预测符号化等进行。 现代常用的语音信号表示方法如用生成模的参数表示声音时,参数的数据率为 5K 比特 /秒左右,与波形符号化相比,参数表现的数据率显著变低,若使用声音生成模,则以利用声音信号分析而得的模的参数为基础,可进行声音的再合成。在听觉上得到的与原声音没有多少不同的合成声音。参数的数据率为信号波形数据率的101 24 以下, 所以可进行高效的声音数据压缩。 单从声音的存储与压缩率来考虑,生成模参数表示法明显优于信号波形表示法。但要将之应用于单片机,显然信号波形表示法相对简单易实现,具有很强的可行性。故方案的设计均从声音信号以波形存储来考虑。基于这种思路的算法,除了传统的一些脉冲编码调制外,目前已使用的有 术及一些变换编码和神经网络技术,但是算法复杂,目前的单片机速度低,难以实现。结合实际情况,提出了以下几种可实现的方案。 1、 短时平均跨零计数法 该方案通过确定信号跨零数,语音信号编码为数字信 号。该方案主要应用于语音识别中,具有较小的回放失真,音质较好。但对于现用单片机,处理数据能力低,故该方法不易实现。 2、 实时幅值采样法 采样过程如下图所示: 抽样 量化 存储(2) (3)( 1) 直存直取法 该方案将话音信号的抽样值直接存取,以保证在回放时能真实的重现抽样值。由于这种方法重现的是采样的真实值,所以只存在 25 一般量化噪声,与 A/D 转换精度有关。故此方法回放质量最好,但占用存储空间也最大,编码速率为 s,每采集 1 秒钟的话音信号需占用 于我们扩展了 256K 字节的 采用这种方法作为不压缩的存储,音质好,录音可达 。该方法示意图如图 1: 0 0 0 注:该方法中的量化台阶为 10H,图中 70H、 80H、 70H、 60H、 50H、 40H、 50H、 70H、 90H、 所要存储的值,解码后所输出的值为: 70H、 80H、70H、 60H、 50H、 40H、 50H、 70H 90H、 2) 欠抽样采样法 虽然语音信号频谱在高频处迅速下降,但语音信号并非固有的 26 频带受限。对于浊音来说,超过 4低 40一方面,对于清音,即使超过 8谱也没有显著下降。因此为了精确的表示所有语声,常常需要大于 20而,在大多数应用中不需要这样高的抽样率。下的频谱足以清晰地传输话音信号,即 8常的“电话语音”就是用 4奈奎斯特频率实现的。因此可以 8K 的采样速率对话音信号采样,而存储时采用奇存法,即只存奇数点而抛弃偶数点,回放时在两相邻奇数点之间的偶数点只需用两数的平均值代替即可。这样既保留语音信号的主要部分,使回放的音质较为理想 ,又提高了存储器的利用率,理论计算录音时间可达 ,数据压缩率为 1:2。但是,由于这种方法的采样速率实际上只有 4在回放时会产生一定的失真。该方法示意图如图 2所示 27 0 0 0 注:图中 70H、 70H、 50H、 50H、 90H、 所要存储的值,解码后所输出的值为: 70H、 70H、 70H、 60H、 50H、 50H、 50H、 70H 90H、 3) 自相似增量调制法 从典型的语音信号可以看到,语音信号的特征是随时间而变化的,在大多数语音处理方案中,基本的假定为语音信号特性随时 间的变化是缓慢的。这个假定导出各种“短时”处理方法,在这里语音信号被分隔为一些短段再加以处理。这些短段就好像是来自一个具有固定特性的持续音片断一样。这些短段一般都按要求重复(常 28 是周期性的)。这些有时称为分析帧的短段彼此经常有一些叠接,对每一帧的处理结果或是一个数或是一组数。所以,经过处理以后产生一个新的依赖于时间的序列而用于描述语音信号。 这种短时处理技术,可以表示成数学形式 mn ()( 对语音信号(或者是经线性滤波后滤出所要求的频段)做变换T,该变换可以是线性的,也 可以是非线性的,它可以依赖于某个可调参数或一组参数。然后把所得到的序列乘以窗序列,这个窗序列位于与抽样标志 n 相一致的时间上,最后对乘积的所有非零值求和。通常窗序列宽度是有限的,当然不总是这样。所以 就是序列 Tx(m)的部分加权平均值的序列。短时分析原理的一般表示如图3 所示。 图 3 利用语音信号的短时平稳性及波形自相似的特点,本系统提出自相似增量调制法,该方法是以 8K 的采样速率,在采样过程中,以每九个相邻采样点为一组,每组中对第一个采样值保存其真实值,而其 余的采样值采用增量调制的方法生成一个字节保存,这样,线性滤波器 T 低通滤波器语 音 信 号 x(n ) 29 每一组共占用 2个字节。数据压缩率为 1:方法既有 M 调制的优点,又同时兼有 码误差较小的优点,编码误差不向后扩散。编码示意图如图 4: 0 0 0 注:图中所示增量为 =10H,所存数据为 70H, 87H( 10000111B), .707H 组成上述的一组, 70H 为一组中的第一点,是真实的采样值,87的每一位都表示了曲线的变化趋势,增量调制用一位码表示相邻抽样值的相对大小,而相邻抽样值的相对变化同样能反 映模拟信号的变化规律。只要时间间隔 t 和台阶都很小,则 m( t)和 m(t)将会相应的接近。解码后所输出的值为: 70H、 80H、 70H、 60H、 50H、 40H、 50H、60H、 70H、 . 30 由于使用 了 载量化噪声(有时简称过载噪声)发生在模拟信号斜率陡变时,由于台阶是固定的,而且每秒内台阶数也是确定的,因此,阶梯电压波形就跟不上信号的变化,形成了很大失真的阶梯电压波形,这样的失真称为过载现象,也称为过载噪声。 (二) A/D、 D/A 及存储器芯片的选择 1 A/D 转换芯片的选择 根据题目要求采样频率 长 =8 位,可选择转换时间不超过 125 S 的 8 位 A/D 转换芯片。当前常用的 A/D 转换的实现方法有多种:积分式、逐次逼近式、并行比较式和二进制斜坡式(又称计数式)、量化反馈式等。鉴于转换速度的要求,最适合本题使用的是逐次逼近式转换器,它具有转换速度较快、转换精度较高的特点,一次转换时间在数微秒至百微秒范围内。其中 目前使用较为广泛的通用 8 位 A/D 转换芯片。它的转换时间小于 120 S,模拟输入为 0 5 V,基本上可以满足题目的要求 ,但由于要实现自动录音,需要数微秒级的转换时间才能达到良好的效果。因而我们采用了 12 位逐次逼近式 A/D 转换芯片 的转换时间小于10 S,可编程为 8 位 A/D 转换工作方式,而且其可输入 5V 的模拟信号,故无需在前级增加电平抬高电路,可减少因通过一级电路 31 后引起的信号失真以及系统噪声。 2 D/A 转换芯片的选择 D/A 转换器的作用是将存储的数字语音信号转换为模拟语音信号,由于一般的 D/A 转换器都能达到 1S 的转换速率,足够满足题目的要求,故我们在此选用了通用 D/A 转换器 单片机的连接如图 5 所示 F - I b D B 016D B 117A N - G N 218D B 319D B 420B P L R o 521D B 622D B 7231 0 V s p 824D B 9252 0 V s p 1 026m s b - 1 127R E F o u A T U V /S /82A D 1 6 7 4E A /V S E T 012I N T 113 01P 1 12P 1 23P 1 34P 1 45P 1 56P 1 67P 1 78P 0 039P 0 138P 0 237P 0 336P 0 435P 0 534P 0 633P 0 732P 2 021P 2 122P 2 223P 2 324P 2 425P 2 526P 2 627P 2 728P S E E / C 5 1- 1 2+ 1 2o u b D I 07I o u 16D I 25R f 34D I 416V r e 515D I 614m s b D I 713I L 218 12X f e C 0 8 3 2V C - 0 71 1 2- 1 2V C L 3基准电压 L S 1 3 8V C 3 数据存储器的选择 当采样频率 8长为 8 位时,按照 1:1 的存储率,一秒钟就能采样 8000 个点,为了能够存储多于 10 秒钟的语音,则存储 32 器至少需要有 8 的容量。在此我们选用了两片 56K 8,这样就能以 1:1 的存储率存储 路图如图 6 所示 04P A 13P A 22P A 31P A 440P A 539P A 638P A 737P B 018P B 119P B 220P B 321P B 422P B 523P B 624P B 725P C 014P C 115P C 216P C 317P C 413P C 512P C 611P C 710 S E C 5 5 023A 1 125A 1 24A 1 328A 1 43A 1 531A 1 62 013D Q 114D Q 215D Q 418D Q 519D Q 620D Q 721D Q 822 6 1 C 1 0 2 4 023A 1 125A 1 24A 1 328A 1 43A 1 531A 1 62 013D Q 114D Q 215D Q 418D Q 519D Q 620D Q 721D Q 822 6 1 C 1 0 2 4V C S E (三) 放大器的设计 作为语音放大器的前端放大器,有以下几点要求 : 增益。 前端放大器: 系统要求放大器增益为 64于驻极体生成的语音信号 33 较大,在此我们选用动圈型拾音器。为了保证录音质量,语音信号应保证满量程模数转换,所要录制的声音大小可能相差很大,因此路至关重要, 所以我们将放大器做成低噪声、自动增益控制( 手调增益型放大器。 在此选用低噪声高压摆率的运放 为放大器,对信号进行多级放大:缓冲放大、放大、调整放大,其中放大环节包括 两种方式可自由切换。 后端放大器: 为了保证耳机和外放都能正常工作,语音信号的输出应有 一定的输出功率,在此选用两级放大,第一级为信号放大,第二级为功率放大,由于功率放大器有较大的噪声,在使用耳机工作时需输出的功率较小,可只对语音信号进行信号放大,因此我们选用两种工作方式:信号放大、功率放大,这样既保证了使用外放的使用,又不增加耳机工作的系统噪声。 在该系统中,有两处用到放大器,增益分别为 46 40增益均可调,既可用专用放大器实现,也可用分离元件实现,综合考虑实际应用与性价比,我们采用分立元件实现。注意到发挥部分要求减少系统噪声电平,增加自动音量控制,所以我们将放大器做成低噪声、自 动增益控制( 手调增益型放大器。 34 (四)滤波器的设计 为了滤除音频信号中不必要的杂波,必须在数据采集前端放置滤波器,以尽可能滤除噪声干扰与混叠失真。这里将通频带设为3003400用分立元件构成的有源滤带通 波器,其性能优于集成滤波器。 整个系统框图如图 7 所示。 图 7 二、 理论分析与计算 ( 1) 放大器设计 这里由 成的增益放大器,增益可达 64 可手动调节与自动调节,手动调节时 端点 2 连接,通过调节电位器变 2极电压来调整 增益,增益的达 64连续可调,8 9 C 5 1单片机键 盘 设 定 数 据 显 示A / D 转 换 电 路电源电路看 门 狗 电 路存储器D / A 转 换 电 路 带 通 滤 波 器 放大器 耳机带 通 滤 波 器放大器 拾音器 35 当 端点 1 连接时,增益可自动调节,输入信号小可到几毫伏,线性动态范围为 40出 直稳定在 10路如图 8所示: 2+122742 该增益放大电路由三级运放组成: 36 第一级为缓冲放大,对语音信号进行缓冲,增益为:14 第二级包括 手动增益调节电路,增益为: 1415145 2 2三极管 9012构成的检波电路对第二级放大器构成了负反馈,使输出电压稳定。 第三级为调节放大,调节输出信号 0V,即保证 A/D 满量程转换,增益为:1011 采样输出放大器 : 经带通滤波器输出的声音回放信号,其幅度 为 0,足以用耳机来收听,故不用接任何放大器。而考虑到实际中经常会用到喇叭外放,故在本系统中增加外放功能,前端放大器采用通用型音频功率放大器来完成。电路如图 9 0 4 7 u 1 22 k+ 1 2+ 1 23 3 8 632674O P - 0 7S P E A K E 37 该电路为增益 50 200 连续可调,最大不失真输出功率为 325 出端接 联电路,以校正喇叭的频率特性,防止高频自激。脚接 220消除低频自激。为便于该功放在高增益情况下工作,这里将不使用的输入端脚对地短路。 ( 2)有源带通滤波器设计 声音信号经动圈拾音器转化成电压信号,通过前级放大,在对其进行数据采集之前,有必要经过带通滤波器滤除带外杂波。选定该滤波器的通带范围从 300 作用: ( 1)保证 3003400语音信号不失真的通过滤波器; ( 2)滤除带外的低频信号,以减少带外工频等分量的干扰,大大 减小噪声影响 ,该下限频率可下沿到 270右; ( 3)便于滤除带外的高次谐波,以减小因 8K 采样率而引起的混 叠失真,根据实际情况,该上限频率可在 2700右;带 通滤波器按品质因数 Q 的大小分为窄带滤波器( Q10)和 宽带滤波器 (T 区域有较多的高频泄漏,表现在时域图上如图 14 的( b)所示,波形有阶梯不够平滑。因此需要在 D/A 变换后,加模拟低通滤波器,滤除不必要的高频分量,对 波形起平滑作用,该模拟滤波器也称平滑滤波器。 经过上述处理的话音信号,具体实现后与原声对比可知 :处理后的信号失真较小。从另一个方面考虑上述处理过程,零阶保持器在将采样信号恢复成模拟信号的同时,由于低通的作用,对信号加了一个小的相移, 由于人耳对相位的失真是不敏感的,故不考虑相位的滞后;除此以外,还对高频少部分信号进行了不应有的衰减,增大了信号的失真,若能将这部分衰减进行补偿,则可使话音信号的失真进一步减小。鉴于此,我们对零阶保持器传输函数 H(中因 43 )/s 校正,具体方法如下: 首先对频域中的)/s 函数进行分析, )/s / 在频域 304030围内的曲线如图 16 所示: 图 16 由图可见,它近似于阻带内增益变化极为缓慢的阻带内近恒定增益的高通滤波器;进一步分析可知,该曲线在频率很高处有大幅度的下降,故可用带通滤波起来拟和该曲线,由于受单片机数据运算处理能力( 限制,数字滤波不易实现,故这里采用硬 件滤波,滤波 电路如图 17 所示: 44 图 17 该滤波网络采用简单的无源滤波网络即可实现,图中 成初始放大倍数近乎恒定的网络,观察到)/s 在频率 较高处有大幅度的衰减,故该网络还应满足在频率较高处的衰减 特性,考虑到对于声音信号,过多的高频分量只能增加噪声,所以后接 成低通滤波器,截止频率合理的设在 100真结果如图 18、 19 所示: 图 18 45 图 19 由仿真结果可知,该网络在频域由 30,增益缓慢增大,从 幅频响应大幅度降底,曲线拟和较好,补偿了 数。 三、 软件设计流程 系统软件总体流图见图 20、 21所示。 开机发 送 看 门 狗 信 号等 待 中 断 发 生系 统 初 始 化置 预 置 值自 动 录 音状 态 位 为 1 ?否是进 入 自 动 录 音 状 态快 速 转 换 模 拟 信 号 并积分积 分 溢 出 ?否是复 位 自 动 录 音 状 态 位图 20 46 键 盘 中 断 服 务 程 序 流 程 图键 盘 中 断 入 口读键值0 8 H 0 9 H 0 A H 1 3 H 1 2 时 器 1 中 断设置方式1录音标志设置方式2录音标志返 回 等 待定 时 器 1 中 断 服 务 程 序定 时 器 1 中 断 入 口读 取 定 时 器 服 务 标 志 位0 0 H 0 0 H 0 0 H 0 0 回 等 待其它置位自动录音标志位图 21 四、 其它功能的实现: 1、 良好的人机界面: 系统工作状态由数码管显示,系统状态的转换有键盘控制包括三种处理方式的切换:直存直取法、欠抽样采样法、自相似增量调制法;录音开始时间的选择:即时式、自检测式。 47 2、 录放音时间可由数码管显示。 3、 存储 的语音信号掉电不丢失,掉电后 电池供电,掉电保护电路如图 22: 2 +572 4、 系统录音的自检测功能: 录音的开始时间有两种方式:即时录音方式即可在按键后开始录音,自检测方式是在按键后并不开始录音,而是在当有声音发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论