




已阅读5页,还剩60页未读, 继续免费阅读
(物理电子学专业论文)基于ide硬盘的大容量语音记录仪的研制.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 随着我国经济建设的迅猛发展,公安、铁路、民航、金融等系统对电话语音 记录的需求越来越多。并且经常需要记录长达几个月。甚至年以上的语音信息。 目前,使用的大容量语音记录仪是基于p c 机的,其设备体积大,成本高。i d e 硬盘是具有存储数据容量大、接口智能化程度高、控制方便等优点,能够作为大 容量语音记录仪的存储介质。 本文研制了基于i d e 硬盘的大容量语音记录仪;分祈并研究了 t r u e s p e e c h 语音压缩算法( 即g 7 2 3 1 协议) ,并采用该语音压缩算法实现了 刘语音信号的压缩;在确定总体设计方案的基础上,设计了语音记录仪的硬件, 采用c 5 1 语言编写了其软件;并从软、硬件两方面采取了抗干扰措施,提高了 该仪器的可靠性;进行了调试和实验研究。 该语音记录仪能够实现对电话语音信号进行高阻并联录音及录音回放,并可 同时进行;预留了远程调度电话接口;显示系统的时间和状态信息等功能。并可 通过键盘对其进行控制。它具有的存储容量大、语音记录时间长、性能可靠、体 积小和成本低等优点,能够满足用户需要,具有较好的市场应用前景。 关键词:语音记录仪;单片机;i d e ;d 6 5 7 1 e ;t r u e s p e e c h 算法 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to ft h ee c o n o m yo fo u rc o u n t r y ,m a n yv o c a t i o n s , s u c ha st h ep o l i c ed e p a r t m e n t ,t h er a i l w a ys y s t e m ,t h ec i v i la v i a t i o n ,t h ef i n a n c e s y s t e ma n ds oo n ,n e e dm o r ea n dm o r et e l e p h o n ep h o n e t i cr e c o r d i n ge q u i p m e n t u r g e n t l y m o r e o v e rv o i c ei n f o r m a t i o nn e e d st or e s t o r ef o rs e v e r a lm o n t h s ,e v e nm o r e t h a no n ey e a r a tp r e s e n t ,t h el a r g ec a p a c i t yp h o n e t i cr e c o r d i n gi n s t r u m e n ti sb a s e do n p c ,w h o s ec u b a g ei sl a r g ea n dc o s ti sm u c h ,i d eh a r dd i s kh a v et h ea d v a n t a g e so f l a r g ec a p a c i t y ,h i g hi n t e l l i g e n t i z e di n t e r f a c ea n dc o n v e n i e n tc o n t r 0 1 i t c a nb et h e m e m o r ym e d i u mo ft h el a r g ec a p a c i t yp h o n e t i cr e c o r d i n gi n s t r u m e n t t h ep h o n e t i cr e c o r d i n gi n s t r u m e n to fl a r g ec a p a c i t yb a s e do ni d eh a r dd i s kh a s b e e ni m p l e m e n t e di nt h i sp a p e r ;t h et r u e s p e e c hc o m p r e s s i o na l g o r i t h m ( n a m e l y g 7 2 3 1p r o t o c 0 1 ) h a sb e e na n a l y z e da n ds t u d i e d ,w h i c hh a sb e e nu s e dt oc o m p r e s s t h es p e e c h ;o nt h eb a s i so fw h o l ed e s i g n ,t h ep h o n e t i cr e c o r d i n gi n s t r u m e n th a sb e e n d e s i g n e di n c l u d i n g t h eh a r d w a r ed e s i g na n ds o f t w a r ep r o g r a m m i n gb yc 5 1 ;t h e a n t i - j a m m i n gm e a s u r e si su s e dt oi m p r o v et h ed e p e n d e n c eo ft h ei n s t r u m e n tf r o m s o f t w a r ea n dh a r d w a r e ;f i n a l l y , t h ei n s t r u m e n ti s a c c o m p l i s h e da f t e rd e b u ga n d e x p e r i m e n t t h ec o n n e c t e d l yr e c o r da n dv o i c ep l a y b a c kc a nb er e a l i z e di nt h i sr e c o r d i n g p h o n e t i ci n s t r u m e n tr e s p e c t i v e l yo rs i m u l t a n e i t y ;t h el o n g d i s t a n c ec o n t r o lt e l e p h o n e i n t e r f a c ei s r e a s s i g n e d ;a n ds e v e r a lf u n c t i o n sa r ea c h i e v e d ,s u c ha ss y s t e mt i m e d i s p l a y ,s t a t u si n f o r m a t i o ne t c t h ek e y b o a r dc a nc o n t r o lt h ei n s t r u m e n t a st h e f e a t u r e so hl a r g ec a p a b i l i t y ,l o n gt i m er e c o r d ,r e l i a b i l i t y , s m a l lv o l u m ea n dc o s tl e s s e t cc a ns a t i s f i e db s e r sd e m a n d ,t h i sr e c o r d i n gp h o n e t i ci n s t r u m e n tw i l lh a v eaw i d e l y a t u r e k e y w o r d :t h ep h o n e t i cr e c o r d i n gi n s t r u m e n t ,s i n g l ec h i p ,i d e ,d 6 5 7 1 e , t r e u e s p e e c h 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得云洼王些太堂或其他教育机构的学位或 证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示了谢意。 学位论文作者签名签字日期:年月同 学位论文版权使用授权书 本学位论文作者完全了解云星王些太堂有关保留、使用学位论文的规定。 特授权丞洼王些太堂可以将学位论文的全部或部分内容编入有关数据库进行 检索并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学 校向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名:导师签名: 签字日期:年月同 签字日期莎岫件;月矿日 学位论文的主要创新点 一、研制了基十i d e 硬盘的语音记录仪,设计了仪器的硬件,编写了其软件, 该语音记录仪具有存储容量大、语音记录时间长、性能可靠、体积小和成本 低等优点。 二、在对t r u e s p e e c h 语音压缩算法进行了理论分析的基础上,将该算法 用于仪器中的语音信号的压缩。 三、采取了抗干扰措施,提高了语音记录仪的可靠性和稳定性,并进行了实 验研究和调试实验。 第一章引言 1 1 语音记录设备的现状 第一章 引言 语音记录设备就是把有保存价值的来往电话记录下来,以便查询、研究或作 为档案保存,它是以计算机技术、电子技术和通信技术作为理论基础和技术保证 的。最初的电话录音系统使用磁带式录音设备,占据市场多年。利用大规模多轨 道的磁带录音设备,对模拟声频信号进行记录,结果存放在一卷一卷的磁带之上, 有音质差、查询检索难和保存难度大等缺点。但由于其价格低廉仍有一定的生存 空间。随着数字处理技术的发展,数字处理效率和精确度的提高,同时存储设备 费用的下降,数字电话录音设备迎来了巨大的增长,国内数字录音市场启动于十 年前,高潮出现在三四年前。目前,各行业使用的电话语音记录设备主要有以下 几种。 1 磁带式语音记录设备 由模拟磁带机或数字磁带机构成,将电话语音信号通过录音磁头记录在磁带 上,电路较简单,但功能单一,易腐蚀,不宜长期保存,记录时间较短。目前在 我国的铁路系统中还存在有少量的这种设备。 2 基于p c 机的语音记录设备 主要由p c 机和电话语音卡构成,电话语音卡通过对并联电话的语音信号进 行实时压缩,再通过i s a 或p c i 总线将压缩完的语音数据记录在p c 机硬盘上。 这种电话语音记录设备功能较多,记录时间也较长,但购置费用较高,设备体积 也较大,无论用户需要记录的电话路数是单路还是多路,都必须购置一台p c 机, 对某些用户来说不太实际。 3 ,基于f l a s h 芯片的语音记录设备 一种由d s p 或单片机控制记录电话语音的设备,将电话语音信号记录在 f l a s h 芯片上。这种电话语音记录设备体积较小,使用方便,但由于受f l a s h 芯片容量的限制导致记录时间也较短。 虽然上述电话语音记录设备已在各行各业中得到了应用,但由于体积过大、 记录时间较短或成本过高等缺点满足不了某些用户的特殊需要。 当前,语音低比特率压缩处理技术发展飞速,这为大容量的语音应用提供了 更加灵活的技术手段,例如码激励线性预测语音编码( c e l p ) 、多带激励线性预 测语音编码( m b e l p ) ,在码率为4 8 0 0 比特秒( 每秒6 0 0 个字节) 和2 4 0 0 比特 第一章引言 秒( 每秒3 0 0 个字节) 的情况下,可以获得和普通市内电话和长途电话大致相同 的话音质量。因此连续记录2 4 小时的语声只需2 5 9 2 m b y t e ( 字节) 的存储量。 再有,近年来作为数据存储介质的硬盘,单碟硬盘容量越来越大、接口智能化程 度越来越高、控制方便,所以更加受到人们的重视。这也为开发超大存储容量、 可脱离主机系统、性能可靠的大容量语音记录仪提供了技术保证。 因此,本文研究设计的超大存储容量、性能可靠、体积小巧和成本低廉的语 音记录仪将能满足很多用户需要,具有较好的市场应用前景。 1 2 研究的目的和意义 本课题的研究目的是采用计算机技术、电子技术和通信技术研制出基于i d e 硬盘的大容量语音记录仪。该记录仪能充分发挥硬盘优势,脱离系统主机,具有 存储容量大、性能可靠、体积小及成本低等特点。可对电话进行高阻并联录音、 记录回放、远程调度、数字音量控制、自动增益控制、变速回放、双音频信号的 产生以及来电显示等功能。当硬盘容量为2 0 g 字节时,语音记录时间可长达6 0 0 0 多小时,并能达到较高的性能指标。 语音记录设备能够用于航空、电力、铁路、石油、港口、交通等指挥调度中 心,因为每一句话都关乎到重大的安全责任,一旦有失,将造成严重的后果;能 够用于银行、期货、证券业等交易系统,由于每一个指令都会产生巨额的资金流 动,因此对每一个指令做出详细的记录成为成功的保障;能够用于公安、安全、 消防、急救、监狱等系统,因为在安全部门和快速反应部门,对呼叫做出及时、 快速的响应是非常重要的;能够用于政府公共事业、军事机构、呼叫中心等更多 部门,对提高工作效率和工作水平有着重大的意义。 1 3 研究的内容 为了提高语音记录仪存储容量,提高其性能的可靠性,基于i d e 硬盘的大容 量语音记录仪。其具体设计内容有以下几点。 1 对t r u e s p e e c h 语音压缩算法( 即g 7 2 3 1 协议) 的编码原理、解码原 理以无声压缩原理进行分析和研究; 2 对基于i d e 硬盘的大容量语音记录仪的总体方案进行了设计: 3 大容量语音记录仪的硬件设计,包括语音编解码电路、i d e 硬盘的接口电 路、时钟电路、语音回放电路、电源电路、l c d 接口电路、键盘接口电路、远程 调度电路和振铃电路等设计; 4 大容量语音记录仪的软件编程,包括主程序、线监测子程序、记录子程序、 第一章引言 回放子程序、i d e 硬盘的读写子程序、时钟子程序、l c d 显示子程序和键盘扫描 子程序等; 5 从硬件和软件两方面采取抗干扰措施; 6 样机调试及运行实验。 第二章语音压缩编码的算法与原理 第二章语音压缩编码的算法与原理 数字语音编码技术是整个数字化通信网中重要的组成部分之一,同时也是近 年来多媒体技术发展的一个热点。语音编码的各种国际标准集中反应了其技术发 展的水平。七十年代国际电报电话咨询委员会c c i t t ( 现并入国际电联i t u ) 公 布6 4 k b p s 脉冲编码调制p c m 国际标准,此后又先后公布了3 2 k b p s 自适应差分 编码a d p c m 及1 6 k b p s 延时码本激励线性预测编码l d c e l p 等国际标准。自8 0 年代以来,国际上的通信机构大力开展了高质量、低码率技术的研究,一些算法 迅速走向了成熟并得到了广泛应用。如1 9 8 9 年通过的编码速率为1 3 6 k b p s ,采 用规则脉冲激励长时预测算法的语音编码标准,在误码率为1 0 。3 的g s m 信 道中传输,话音质量不降低;而编码速率为5 6 k b p s 的v s e l p 编码则足以使现在 的g s m 扩容一倍:目前人们已能在8 k b p s 的速率上获得短延时高质量的重建语 音,在5 k b p s 一6k b p s 的速率上获得高质量的重建语音。总之,语音压缩编码发展 的趋势是向着具有更低速率、更高质量和更低延时的压缩编码方案方向发展。但 就目前来说,g 7 2 3 1 标准是i t u t 于1 9 9 6 年3 月推出的用于对媒体通信的 5 3 6 3 k b p s 双数率语音编码标准,其主要应用目标是基于公共电话网( p s t n ) 的h 3 2 4 低比特率可视电话。同时,g 7 2 3 1 标准也被i t u 接受为因特网和局域 网等分组交换网上提供语音业务的国际标准,并且还被v o i p ( 国际多媒体电信会 协议会的一部分) 作为通过调制解调器连接的因特网电话的首选语音编码器。因 此在许多方面得到了应用。本论文中使用g 7 2 3 1 标准作为语音压缩算法。 2 it r u e s p e e c h6 3 5 3 协议简介 t r u e s p e e c h6 3 5 3 被国际电信委员会推举为标准的语音压缩算法,以下 简称g 7 2 3 1 。g 7 2 3 1 是国际电联( i t u ) 于1 9 9 6 年推出的采用多脉冲最大似然量 化( m p m l q ) 年 i 代数码激励线性预钡i j ( a c e l p ) 技术的具有5 3 k b p s 和6 3 k b p s 两种 编码速率的语音编码算法标准。与i t u 图像压缩编码标准h 2 6 3 一同成为i t u 低 码率多媒体通信标准h 3 2 4 的重要组成部分。g 7 2 3 1 最初提出是为了应用在会议 电视中,但是随着v o l p 技术的发展,低速率、高质量的g 7 2 3 1 已经成为当前i p 电话中的编码标准之一。 g 7 2 3 i 算法是以语音编码方案中的码激励线性预澳t j ( c e l p ) 技术为基础提出 来的,c p e l p 技术虽然能在中低速率上提出较好的合成语音质量,成为目前语音 编码算法中最重要的方案,但计算复杂和数据存储量大却是它的固有缺陷。因此 第二章语音压缩编码的算法与原理 g 7 2 3 1 算法中采用了分列式矢量量化、特殊结构的代数码本、高效的脉冲及码 本搜索算法以及增益的矢量量化等关键技术以降低算法的复杂度和存储量。在无 声时进行舒适噪声填充的功能来降低运算量。 g 7 2 3 1 对每帧语音及其它音频信号采用线性预测分析综合编码。6 3 k b p s 时的非周期激励信号算法采用的是多脉冲最大似然量化法( m p m l q ) ,5 3 k b p s 时 采用代数码本激励线性预测法( a c e l p ) 。帧长为3 0 m s ,2 4 0 个样值。由于加窗, 导致了3 7 5 m s 的算法延时。通过对原始语音进行分析提取c e l p 参数( l s p 参数、 码本索引和增益等) ,将这些参数编码传送。在解码端用这些参数构造激励信号 和合成滤波器,将激励信号经过合成滤波器获得重建语音信号。 2 2 编码原理 编码器采用线性预测合成分析编码方法,使感知加权误差信号最小。一次处 理一帧,共2 4 0 个采样点,其处理流程框图如图2 1 所示。输入的语音要经过三 个处理。 1 预处理 每帧( 2 4 0 个采样点) 先经过高通滤波器去掉直流分量,然后分成4 个子帧, 每个子帧6 0 个采样点。 2 提取声道参数 采用线性预测分析法,对语音信号进行短时预测分析。对于每个子帧,采用 加窗后的语音信号计算l p c 的1 0 阶滤波器系数,这4 个子帧的l p c 系数将用来 建立感知加权滤波器,这个滤波器作用于整个帧并且得到感知加权信号。最后一 个子帧得l p c 滤波器系数还将被转换成l s p 系数,然后使用预测分裂矢量量化器 ( p s v qp r e d i c t i v es p l i tv e c t o r0 w a n t i z e l ) 量化。 3 提取激励信号参数 ( 1 ) 信号中基音成分预测 包括开环预测和闭环预测。 开环预测,对每两个子帧( 1 2 0 个采样点) 使用加权语音信号计算开环基因 周期k 。这个基音预测是在1 2 0 个采样点的基础上计算的,此基音周期如的搜 索范围是从1 8 到1 4 2 样值。以下的各步将基于一个予帧( 6 0 个采样点) 进行。 闭环预测,是计算加权合成滤波器的冲激响应,利用前面计算出的估测基音 周期k ,建立一个谐波噪声整形滤波器,然后将l p c 合成滤波器、感知加权滤 波器和谐波噪声整形滤波级联到一起得到加权合成滤波器的冲激响应。闭环预测 时进行自适应码本的搜索,且自适应码本不断更新。 使用开环基音周期预测值k 和上面得到的合成滤波器响应,建立一个五阶线 第二章语音压缩编码的算法与原理 性闭环基音预测器,对输入信号进行长时预测分析,其目标矢量是合成滤波器的 零输入响应和原始语音之间的一次残差经共振峰感知加权、谐波噪声整形后的 值。闭环基音周期在开环基音周期的修正范围之内搜索。从最初的目标矢量中减 去经过基音周期预测器的输出语音信号得到残差信号,作为下面随机码本搜索的 目标矢量。 f 2 ) 信号中非周期性成分预测 对经过长时预测后的二次残差信号进行估测,高速率采用多脉冲最大似然量 化激励( m p m l q ) 进行预测,低速率采用代数码本激励线性预测( a c e l p ) 。 此时码本搜索是对固定的随机码本的搜索。 图2 1g 7 2 3 1 编码器 被编码器处理后的一帧信号需传输的参数:声道参数l s p 参数:激励参 数基音周期与长时预测增益,随机码本中脉冲的位置和增益。 第二章语音压缩编码的算法与原理 2 3 声道参数提取 1 6 b i t s 线性p c m 数字码流进入编码器后,被分成2 4 0 点的帧长。6 0 点为一 子帧。编码器按帧处理数据。每帧数据先通过一个高通滤波器以去掉直流分量。 滤波器的传递函数为 1 1 日0 ) = 二斋一 ( 2 1 ) l 一竺z 1 1 2 8 去掉直流成分后,语音需要加窗,此处采用汉明窗,窗长为1 8 0 点,加在每 个子帧的中心。然后计算加窗后的信号的字相关值,共1 1 个。考虑到白噪声 修正因子( 1 0 2 5 1 0 2 4 ) ,使r o 】= r 0 ( 1 + 1 1 0 2 4 ) 。通过查二项式窗口系数表得到其 它字相关值的修正系数。l p c 系数a ,通过迭代算法计算。在这里,由于加窗引起 了一子帧长的延时,即7 5 m s 。 每一子帧的l p c 系数由来建立短时感知加权滤波器。因为l s p 系数的量化 特性和内插特性均优于反射系数,第四子帧的l p c 系数将转换成l s p 系数,并 进行量化,作为声道参数传输。 首先,对l p c 参数进行一个小的带宽扩展( 7 5 h z ) ,由于p b i ”= r 所以可 以通过给l p c 合成滤波器的极点乘以o 9 9 4 得到。然后利用修正后的l p c 系数计 算p ( z ) 和q ( z ) 的系数。坞( z ) 的l s p 系数通过一个一阶预测、三维分裂矢量量化 器进行量化。 2 3 1l s p 量化 1 通过沿单位圆搜索,并且在零点位置处内插,l p c 系数扛 。,。被转化成 l s p 系数扫1 ,l1 0 0 2 从l s p 参数中减去直流成分p 。、得到区直流的l s p 参数p 。 3 p 。表示当前第n 帧需要量化的l s p 参数,瓦一。表示上一次解码后的l s p 矢量:瓦表示去直流的预测l s p 参数;e 。表示第n 帧的l s p 残差矢量。 p 。7 1 = 阮p :,。卸1 0 。】( 2 - 2 ) p 一。7 = 阮瓦忙l o 。 ( 2 - 3 ) 芦。乘以一阶固定的预测因子6 = ( 1 2 3 2 ) ,得到a 。 两= 6 瞄。一p 。) ( 2 - 4 ) 第二章语音压缩编码的算法与原理 e 。= p 。一芦。 ( 2 - 5 ) 芦。的初始状态为p r o :。 4 未量化的l s p 矢量p 。,量化的l s p 矢量死,残差矢量e 。,分别被分成 3 个子矢量,他们的维数分别为3 ,3 ,4 。对残差的每个予矢量使用8 b i t s 、含2 5 6 个码字的码本进行量化。所以l s p 的量化值将是2 4 比特。第m 个子矢量码本的 最佳索引l 是使误差均值e t 。最小的索引值。这里使用的失真测度是欧式距离一 一加权均方误差。 f 3 ,m = 0 p t 。7 :br l + 3 mp 。a p u ,。k ,= 3 ,珑= 1 ( 2 - 6 ) 1 3 ,m = 2 芦,。7 = 瞄1 f 。芦2 ,。 。 。1 0 州2 ,1s ,_ c 。u ) ,那么选后 _ 一次的c 。f ( ,) 为为最大值。在两个索引之差大于或等于1 8 的条件下,当且仅当 c o 。u ) 比c k u ) 多出1 2 5 d b 时最大值选用c 。d ) ,否则最大值为q 。( ,) 。 2 4 1 3汉明噪声整形信号 经过感知加权后的语音信号将进行谐波噪声整形,降低共振峰区的信号幅 第二章语音压缩编码的算法与原理 度,这也是为了提高合成语音的质量。滤波器的传输函数为 p f = t 一肛- f 2 2 3 1 在这个函数中,需要确定两个参数。 ( 1 ) 确定最佳整形周期三 取使相关值c ,( ,) 最大的伪,的搜寻范围是l o l 前后三个样值内。只考虑 平方前分子式的正相关值( ,关系式如式( 2 2 4 ) 拳j 式( 2 2 5 ) 。 5 9 ( ,) = f i n 厂 一门 ( 2 r 2 4 ) :矿鱼立l ,厶蔓厶( 2 - 2 5 ) f i n f n 一门 这里有上l = m 一3 和三2 = l 。l + 3 。 ( 2 ) 确定口 c e 表示最大值,g o p t 代表最佳滤波器增益,表达式 g 5 9 ,吣f n 一纠 型l一,三。jl59 2 一一 f n - l f n 一纠 月t m ( 2 2 6 ) 其中g 印f 的值被限定在【o ,1 x e f b 3 9 ,对于加权的语音序列扩【盱】) 。:o5 9 ,其能 量的表达式为 e = ,2 【川 ( 2 2 7 ) 那么对于汉明噪声整形滤波器( 用p ( z ) 表示) ,它的芦系数定义如 卢:0 3 1 2 5 g o ,, , - 1 0 小昝z p :。, 10 0 其它 党纪算完汉明系数8 后,即将共振峰加权语音序列f 1 3 经过汉明窗p ( z ) 的滤 波后,得到最终的目标矢量w n 】。 研h = f i n 卜i n 一三】,0 h 5 9 ( 2 - 2 9 ) 第二章语音压缩编码的算法与原理 2 4 2 非周期性激励参数的预测 2 4 2 1 多脉冲最大相似量化编码( m p m l q ) m p m l q 多脉冲最大相似量化编码技术实现了低速率( 4 8 6 4 k b p s ) ,高质 量的语音信号编码。传输信道编码采用t d m 编码技术,确保信号传输优质可靠。 根据a t & t 实验室测试,在6 4 k b p s 速率下,其m o s 值为3 9 ,而6 4 k b p s p c m 信道的m o s 值为4 1 ,1 3 k b p s 信道m o s 值为3 5 7 。 2 4 2 ,2代数码激励线性预测编码( a c e l p ) 代数码激励线性预测编码( a c e l p ) 是在5 3 k b p s 以下速率中广泛应用的语音 编码。其目的是将多脉冲l p c 中使用的分析一综合方法扩展到低比特率范围。指 导思想是用有限数量的存储序列替代多脉冲激励。这个序列为码本。a c e l p 中的 码本编码方法基于下面两个事实。 ( 1 ) 用长时或短时预测清除话音信号的冗余之后,剩余信号序列相互独立可 用,具有相同概率分布的随机序列所精确模拟,这个序列称为更新序列或激励序 列。 ( 2 ) 为了编码,可以找出有限数量的序列近似在语音片段中出现的重要激励 序列。这个激励序列称为码本。 由于这两个因素,先要找出给定块的语音编码最好的长时和短时预测器,用 各种可能的激励作用于它们,然后找出码本中的序列,生成与输入语音源相似的 合成语音信号。长时和短时预测器的信息和从码本中选出的激励序列的二进制数 全都送入接收端进行合成。 通常,在考虑频谱的精细结构时,语音过程可由长时预测器建模。在考虑频 谱范围和共振时可由短时预测器来给出基音。在随机编码的研究中,级联预测器 的激励是一个高斯分布( g a u s s i a n ) 的白噪声序y j j ( a t a l 和s c h r o e d e r l 9 8 4 ) 。为了用 这个结构对语音编码,每5 - 2 5 m s 就要用l p c 中的技术对长时和短时预测器编码。 随机编码或a c e l p 的目标是提高l p c 品质,提供一种对基音提取不敏感并且不 依赖于清浊音分类的方法,这和l p c 有所不同。 2 4 2 3参数的比特匹配 第二章语音压缩编码的算法与原理 表2 - 1 6 3 k b p s 的比特分配 编码的参数第一子帧第二子帧第三子帧 第四子帧总和 l p c 索引 2 4 自适应码本延迟 727 2 1 8 所有增益的组合编码 1 21 21 21 24 8 脉冲位置 1 21 21 21 24 8 脉冲符号 44 4 41 6 奇偶位标志 11114 总计 1 5 8 编码的参数第一子帧第二子帧第三子帧第四子帧总和 l p c 索引2 4 自适应码本延迟 72721 8 所有增益的组合编码 1 21 2 1 21 24 8 脉冲位置 2 01 82 01 87 3 脉冲符号 65 65 2 2 奇偶位标志 l1 1l4 总计 1 8 9 利用固定码本中码字的数目jk 是2 的指数,通过组合每个脉 注 冲位置索引的4 个m s b 可书省3 个比特。组成13 b i t 字 2 5 解码原理 解码以帧为单位进行的。首先解码量化的l p c 索引,建立l p c 合成滤波器 a ( z ) 。对每一子帧,解码接收到的自适应码本激励和固定码本激威,其和e 【n 】输 入合成滤波器。 自适应后置滤波器包括基音后置处理器和共振峰后置滤波器。前者为长时相 关滤波,置于合成滤波器之前,按子帧执行,用于改善合成话音质量。后者为短 时相关滤波,置于合成滤波器之后。 定标单元恢复原信号能量。其定标值 ( 2 - 3 0 ) 然后根据此值及上一子帧的比例因子,组合生成本子帧的比例因子 d 叫= ( 1 - a ) g ”一1 】+ 昭, r 2 3 1 ) 取a = l 1 6 。最后输出话音信号为 第二章语音压缩编码的算法与原理 g n 3 p f n 。g 【n 】。( 1 + 口) r 2 3 2 ) 2 6g 7 2 3 1 的关键技术 2 6 1 矢量量化 图2 2g 7 2 3 。l 解码器 g 7 2 3 1 算法中的预测分裂矢量量化、随机码本搜索和固定码本搜索等算法 中,都使用了矢量量化( v e c t o r q u a n t i z a t i o n ,v q ) 编码技术。矢量量化并不是对 单个抽样样点进行量化,而是将若干个抽样样点构成一个矢量,然后在矢量空间 中进行量化,为了压缩速率,在矢量被量化后,不去传送量化矢量的本身而去传 送量化矢量的一个序号。因此,应需预先将若干个典型的数据矢量( 码矢量) 储 存起来并给每个码矢量分配一个序号,这种表示码矢量与序号之间关系的表格称 为码本( c o d e b o o k ) ,每当编码时,输入的数据矢量根据预定的算法与每个码矢量 都进行比较,并将与此数据矢量最相似的码矢量所对应的序号,作为输入数据的 编码来发送。在接收端则利用与发送端相同的码本找到与传送序号所对应的码矢 量连同源信息一起来重建语音信号。矢量量化的原理图如2 3 所示。 第一章语音压缩编码的算法与原理 编码器 2 6 2 无声压缩技术 图2 - 3 矢量量化原理图 译码器 无声压缩技术用来减少没有语音传送的比特率。它的基本算法是语音有声无 声检测( v a d ,v o i c e da c t i v i t yd e t e c t i o n ) 和舒适噪声产生( c n g ,c o m f o r t n o i s e g e n e r a t o r ) 算法。这种技术减少了没有语音发送时的比特率。 编码段同时具备v a d 和c n g ,进行v a d 的目的是监测语音的有与无,并把 检测结果传送给c n g 。 具体算法是基于几个连续帧的信息,判断语音的有、无,这样做是为了防止 由于突发性因素的产生而影响判定;从而使判决结果更可靠。v a d 被认为是针对 于3 0 m s 的语音帧,这个语音帧将不是有编码器编码就是有舒适噪声发生器产生 的舒适噪声所填充。v a d 的输出结果将被传递给c n g ,监测语音有无的困难在 于当存在着广泛的背景噪声时,很难出别出语音和噪声。v a d 技术必须能在非常 低的信噪比情况下,判断出有声无声。所以不能使用简单的门限技术,尤其是当 部分语音发声被噪声淹没时。通过考虑它们的频谱可以将语音和噪声区别出来。 因此,v a d 和一个反滤波器共同作用,此滤波器的系数来自只有噪声时的c n g 。 编码段进行c n g 的目的是产生一个与实际背景噪声相匹配的噪音,并且尽可能 地减少编码的比特,得到在解码器输入端所需产生噪声的参数。这些编码后的参 数构成静态插入描述帧( s i d ) ,s i d 帧笔迹或的语音帧所需的比特数目少,在静 念时传送。其算法为传送s i d 帧是非周期的,对于每帧均要判断是否发s i d 帧。 这个判断基于当前的静态帧和前一个s i d 帧,s i d 帧被限制在噪声功率谱变化时 发送。 解码端只具有舒适噪声合成c n g 。通过让一白噪声激励作用短时合成滤波器 ( l p c ) 得到舒适噪声。用来描述舒适噪声的参数是l p c 合成滤波器系数和激励信 第一章语音压缩编码的算法与碾理 号的能量。在解码端,此算法为每个s i d 帧计算l p c 参数和激励信号能量。c n g 算法的显著特点是为每个s i d 帧估算周围噪声频谱,这种方法考虑了本地的静态 和非静态的输入信号。算法采用的激励信号是m p m l q 。因为固定激励的频谱特 性不好。长时激励信号同样被用在获得更好的白噪声激励。算法随机选取长时激 励参数( 延时和增益) 和固定码本参数( g r i d 脉冲位置和符号) 。对每两个子帧, 计算固定激励的增益以便达到来自被发送s i d 帧能量的个全局能量。 在接收端,为了简化算法,当舒适噪声产生时,谐波后滤波器被关掉。 第三章记录仪的设计方案及_ i 二作原理 第三章记录仪的设计方案及工作过程 3 1 语音记录仪的组成及性能指标 基于i d e 硬盘的大容量语音记录仪主要由单片机系统、语音编解码电路、 i d e 笔记本硬盘及接口电路、l c d 显示模块及接口电路、键盘及接口电路、时 钟电路、电源电路、电话线接口电路、远程调度电路和运放电路等部分组成,仪 器原理框图如图3 1 所示。 图3 一l基于i d e 硬盘的大容量语音记录仪原理框图 语音记录仪的性能指标如下 ( 1 ) 可记录电话路数:1 路: ( 2 ) 记录时长:6 0 0 0 小时( 2 0 g b 硬盘) ; ( 3 ) 压缩速率:8 k 采样频率下语音压缩速率可为6 。3 k b p s 或5 3 k b p s f 4 ) m o s 指标:可达到3 9 8 ; ( 5 1 直流电源电压:1 2 v 二i :1 0 第三章记录仪的设计方案及工作原理 交流电源电压:2 2 0 v 士1 5 ( 6 ) 工作温度:- 2 0 4 0 。c ; ( 7 ) 相对湿度:4 5 7 5 。 3 2 语音记录仪的工作过程 仪器上电后,对i d e 硬盘、编解码器、时钟芯片、l c d 液晶显示器等进行 初始化。然后,单片机开始定时扫描键盘,并启动d 6 5 7 1 e 监测电话线状态。如 果扫描到有键按下,就判断有无新任务。若有,则将其与现执行任务进行优先级 比较,且执行优先级高的任务。 本仪器的编码电路对电话线进行监测并随时准备压缩( 录音) ,解码电路完 成对压缩数据的解压( 回放或远程调度) 。 当编码电路监测到并联线路上有音频信号时,表明有去话;当振铃检测电路 检测到并联线路上有振铃信号时,表明有来话,此时,编码电路将语音信号压缩 并实时传送给单片机。单片机负责将压缩后的语音数据存储在硬盘上,并附加上 相关的日期时间、来去话标志、主被叫电话号码和通话时长等索引内容,供日后 查询使用。 另外,当本机需要回放语音记录或远程调度时,单片机将硬盘上的语音压缩 数据通过解码电路转变成语音信号。 硬盘中预留1 m b 的存储空间作为记录索引表,表里存贮的是每一个记录的 日期时间、来去话标志、主被叫电话号码、通话时长、起始扇区和终止扇区等索 引内容,以便以后查询时用。日期时间为年,月,日,时,分5 个字节。来话时 标志是l ,去话标志是0 。通话时长是分钟数。 如果要查询以前的通话记录,首先在菜单项里查找该功能菜单项。按确定键 后,仪器便提示输入查找语音记录的索引标志( 主要是时间) ,按确定键,则可 根据标志类型自动地在i d e 硬盘的记录索引表里查找,并且把符合要求的记录 显示在l c d 上。查询人员通过上下翻滚键找到相应的记录( 反色显示) 后,按 确定键,语音记录仪便可通过喇叭开始放音。在播放的同时l c d 显示当前语音 记录时间,来去话标志、主被叫电话号码和通话时长等索引内容。 回放时可对语音进行变速回放和调节音量,只要在菜单项中进行设置即可。 还可以通过键盘对语音压缩率的高低进行设置。语音压缩率共有两个压缩级别: 高压缩率、低压缩率。它们都属于不同的任务进程,并且有着不同的优先级。 单片机系统的外部r a m ( 地址为0 0 0 0 h - - 7 f f f h ) 可用作对硬盘读写以及 录音回放时的数字进行缓冲存储。单片机对外部r a m 进行了分区管理,共有 第三章记录仪的设计方案及工作原理 6 4 个区,每一区有5 1 2 个字节,这是与硬盘扇区的字节数相匹配的,除第一、 二区用作记录l 晦时索引等内容外,其它都作为记录回放时的数据缓冲用,并设 有“区空”、“区满”等标志。当用户要求录音时,便与用于录音的d 6 5 7 1 e 芯片 进行通信。首先使录音的d 6 5 7 1 e 置于接收状态,然后d 6 5 7 1 e 将接收数据压缩 并将已压缩的数据通过中断方式传送给外部r a m ,c p u 根据分区管理协议分别 设置相应的标志位,当有“区满”标志时就启动硬盘写扇区进程,写完后清“区 满”标志,置“区空”标志:同理,如果用户要求放音时,则与用于放音的d 6 5 7 1 e 芯片通信。首先将要回放的内容按扇区从硬盘读出并写入r a m 空区内,同时通 知d 6 5 7 1 e 接收数据,当要从d 6 5 7 1 e 接收数据时,d 6 5 7 1 e 先给单片机发出一 个请求中断信号,这时单片机将r a m 中的数据放到数据总线上,d 6 5 7 1 e 将数 据解压缩后通过t p 3 0 5 7 及扬声器进行回放。同理c p u 根据分区管理协议分另0 设 置相应的标志位。 当与时钟芯片d s l 3 0 2 通信时,通过与d s l 3 0 2 的s c l k 相连,p 1 2 口不断 改换高低电平,把所读写的数据在t i m e i o 端串行输出输入。 本仪器通过8 2 5 5 对单片机进行i o 扩展,驱动i d e 硬盘。单片机与8 2 5 5 通 信时,p a 口地址为8 0 4 0 ,p b 口为8 0 4 1 ,p c 口为8 0 4 2 ,控制口为8 0 4 3 。p c 口 用作对i d e 命令口的控制,p a 、p b 口作数据口。 远程调度电话线接口可实现远程监听和查询等功能。仪器在检测到远程调度 电话线上的振铃信号后,将模拟摘机,同时向主叫播放语音提示。主叫可按照语 音提示操作,即可监听到硬盘上的任意一段语音记录,甚至可以监听到仪器正在 记录的语音。 第四章记录仪的硬件设计 4 1 单片机系统 4 1 1 单片机选型 第四章记录仪的硬件设计 本仪器采用了台湾华邦公司( w i n b o n d ) 的w 7 8 e 5 2 单片机。w 7 8 e 5 2 是一 种能够在低电源消耗下容纳更宽的频率范围的8 位微控制器( 8 位c m o s 为控制 器全静态设计) 。它的指令集完全符合8 0 5 l 标准。它包括一个8 k 字节的f l a s h e p r o m ;一个2 5 6 字节的r a m ( 随机内存) ;4 个8 位双向寻址i o 口,可提供 6 4 k b 外部程序内存地址空间及6 4 k b 外部数据存储器地址空间;一个附加的4 位i o 口p 4 ,并附加i n t 2 i n t 3 ( 在4 4 引脚的p l c c q f p 封装上有效) ;3 个 1 6 位定时计数器,一个硬件监视时钟和一个全双工串行口( u a r t ) 和开l 、 狗 电路( w a t c h d o g t i m e r ) ,是目前最高可运行在4 0 m h z 晶振的少数单片机之一。 w 7 8 e 5 2 可提供e m i 简化模式以及内部电源管理,其供电电压:4 5 v 5 5 v 。这 些外围设备都是由2 个优先级的8 中断源进行设置。为方便编程和校验,w 7 8 e 5 2 中的f l a s he p r o m 允许对程序内存进行编程。代码一经确立,用户可保护代码 的安全性。 由于w 7 8 e 5 2 对处理器内核进行了重新设计,因而其性能比标准的8 0 5 2 有 了很大提高。w 7 8 e 5 2 改进了传统处理器的时序。机器周期与时钟之比可以由软 件来控制,最快时一个机器周期仅需4 个时钟,最慢时一个机器周期需1 0 2 4 个 时钟。在同样的时钟频率下,当时钟机器周期等于4 时,w 7 8 e 5 2 的指令速度比 传统的5 1 单片机提高了i 5 3 倍( 平均2 5 倍) 。w 7 8 e 5 2 为全静态c m o s 设 计,其工作时钟最高为4 0 m h z ,最低可以是0 ,因此w 7 8 e 5 2 微控制器有两种 电源简化模式:空闲模式和断电模式。两种都是基于软件可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 垃圾收运合同范本
- 餐饮行业营销推广活动策划
- 国贸专业相关的毕业论文
- 教育机构如何适应在线教学趋势
- 家庭教育发言稿模板
- 园林本科毕业论文
- 大班区域活动主题教案
- 2024年黑龙江省黑河市国家职业技能鉴定考评员技能鉴定考评员服务考核试卷及答案
- 安全突发事件管理工作预警和干预机制
- 四下4.5.3 三角形三边的关系【教案】
- GB/T 9775-2025纸面石膏板
- 2025年陕西西安工业投资集团有限公司招聘笔试参考题库含答案解析
- 骨质疏松症课件
- REFLEXW使用指南规范.doc
- 赛摩6001B皮带校验说明书
- 气动机械手系统设计(含全套CAD图纸)
- 常用处方药名医嘱拉丁文缩写
- 只征不转 - 增城市国土资源和房屋管理局
- 会计查账实务
- 电鱼机的原理与制作及电路图
- 分布式光伏发电介绍ppt课件
评论
0/150
提交评论