




已阅读5页,还剩62页未读, 继续免费阅读
(计算机应用技术专业论文)基于e2c编码算法的voip系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 摘要 当今的v o i p 系统所使用的编码方法虽然获得了较好压缩效果 但过于繁琐 且压缩过程会对音质造成不同程度的损害 本课题以e 2 c 编解码器为核心 设计了一个别致的嵌入式v o i p 系统 论文 首先讲述了v o i p 的原理和体系结构 然后介绍了v o i p 中的关键部件一编解 码器 其中列举了当今一些主流的音频编码算法 并对这些算法做了简单的介绍 和评价 接着详细阐述了e 2 c 压缩算法 随后我们对该算法的性能进行了测试 使其工作于不同的通话环境下 使该算法的有效性得到了证明 最后介绍了基于 e 2 c 编解码器的v o i p 系统 e v o i p 的架构及功能实现 其中该v o i p 系统的亮点在于设计出了一种压缩思想别具一格的编码算法一 一e a s yt oc o m p r e s sa l g o r i t h m 简称e 2 c 它的独特之处在于从更高的 层次对语音数据进行压缩 传统的编解码器将每个8 b i t 的音频数据压缩为更少 的几个b i t 而e 2 c 则是将一串n 个b y t e 的音频数据流压缩为少量的几个 b y t e 除此之外 通常的压缩算法在提高压缩效果的同时 音质将受到不同程 度的损害 压缩率越高损害越大 而e 2 c 所作的压缩是在保证源音频数据可以 被完好无损的还原的基础上的 同时 在无语音输入时 e 2 c 的压缩效果将成倍 的增大 有效的降低了静音时对带宽的浪费 e 2 c 由同值压缩 s v a 和小振幅压缩 璐a 两种压缩算法组成 可以方 便的对a l a w 和m l a w 的p c m 编码进行压缩 在整个工作过程中 该压缩 算法压缩率是在不断变化的 在发言频率最高的时候 压缩率为5 8 4 随着被 测试端发言频率的降低 压缩效果在不断提高 最后压缩率达到了1 1 5 在正 常的交谈中压缩率为4 7 1 比i t u 的g 7 2 6 压缩效果略好 而音质效果却和 g 7 1 1 一样 优异的语音质量 快捷的执行效率 较低的带宽占用是对e 2 c 的最简明概括 关键字 v o i p 语音编解码器 语音压缩算法 脉冲编码 p c m 自适应差分 脉冲编码 a d p c m g 7 1 1 1 7 2 3 1 g 7 2 6 c 7 2 9 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 a b s t r a c t a st h ep o p u l a re n c o d ea l g o r i t h m sa r ec o m p l i c a t e da n dt a k eu dal o to f s y s t e mr e s o u r c e ss u c ha sb a n d w i d t ha n dc p ut i m e t h ee a s yt oc o m p r e s s a l g o r i t h m e 2 c i sa ne l e g a n ta l g o r i t h mc o n s i s t e do f2e n c o d e r s n a m e l yt h e s a m ev a l u ee n c o d e ra n dt h el i t t l es c o p ee n c o d e nt h i sa l g o r i t h mc a ne n c o d e b o t ht h ea l o wa n dt h e j l o wp c mv a l u ea ta v e r a g ec o m p r e s sr a t eo f4 5 w i t h o u tl o s i n ga n yi n f o r m a t i o n t t l i sp a p e ri n t r o d u c e sh ot h ea l g o r i t h mw o r k s a sw e l la sr e s u l ta n a l y s i sa n dp e r f o r me v a l u a t i o n t h i s p a p e r i n t r o d u c e dav o i p s y s t e m i n c l u d i n g i t s d e s i g n a n d a r c h i t e c t u r e f i r s t w ei n t r o d u c e dw h a ti sv o ip h o wi tw o r k sa n dt h eg e n e r a l a r c h i t e c t u r e s e c o n d l y w ed i s c u s s e dc o d e m t h ek e yc o m p o n e n t o ft h ev o i p s y s t e m i nt h i sc h a p t er w ee n u m e r a t e ds o m ep o p u l a re n c o d i n ga l g o r i t h m s t h e nw ed e s c n b e dt h ee 2 c o m p r e s sa l g o r r t h mi nd e t a i l s a tl a s t w eg a v ea n v o i ps y s t e mb a s e do nt h ee 2 ca l g o r i t h m t h ee 2 c o m p r e s sa l g o r i t h mi se a s yt ou s e t h i sc o d e ri sc o m p o s e do f2 e n c o d e r s t h e ya r et h es a m ev a l u ee n c o d e ra n dt h el i t t l es c o p ee n c o d e r t h i sa l g o r i t h mc a nc o m f o r t a b l ye n c o d eb o t ht h ea l o wa n dt h eu l o wp c m v a l u e a n dt h ee n c o d e dv a l u ec a nb ee a s i i yd e c o d e dt ot h es o u r c ep c mv a l u e w i t h o u ta n yd a m a g e i nt h et e r mo fe n c o d i n g t h ec o m p r e s sr a t ei sv a r i a b l e a n dt h ea v e r a g ev a l u ei s4 5 t h i sp a p e rc o v e r e dh o wt h ea l g o r i t h mw o r k e d t h et e s tr e s u l ta n dt h ee v a l u a t i o n k e y w o r d s v o l ec o d e c e n c o d e ed e c o d er p c m a d p c m g 7 1 1 g 7 2 3 1 g 7 2 6 7 2 9 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 1 绪论 1 1 研究背景 1 1 1v o i p 技术 v o i p v o i c eo v e ri n t e m e tp r o t o c 0 1 是一种以l p 电话为主 并推出相应的增 值业务的技术 它是建立在i p 技术上的分组化 数字化传输技术 其基本原理是 通过语音 压缩算法对话音进行压缩编码处理 然后把这些语音数据按i p 等相关协议进行 打包 经过l p 网络把数据包传输到目的地 再把这些语音数据包串起来 经过 解码解压处理后 恢复成原来的语音信号 从而达到由l p 网络传送话音的目的 v o i p 最大的优势是能广泛地采用i n t e m e t 和全球l p 互连的环境 提供比传 统业务更多 更好的服务 v o i p 可以在l p 网络上便宜的传送语音 传真 视频 和数据等业务 如统 一消息 虚拟电话 虚拟语音 传真邮箱 查号业务 i n t e r n e t 呼叫中心 i n t e r n e t 呼叫管理 电视会议 电子商务 传真存储转发和各种信息的存储转发等 1 1 2v o i p 电话的原理 传统的电话网是以电路交换方式传输语音 所要求的传输宽带为6 4 k b i t s 而v o i p 是以i p 分组交换网络为传输平台 对模拟的语音信号进行压缩 打包 等一系列的特殊处理 使之可以采用无连接的u d p 协议进行传输 通过观察图1 1 可以发现v o l p 设备是如何把语音信号转换为l p 数据流 并把这些数据流转发到l p 目的地 i p 目的地又把它们转换回到语音信号 两者 之间的网络必须支持l p 传输 且可以是i p 路由器和网络链路的任意组合 我们可以简单地将v o i p 的传输过程分为下列几个阶段 1 语音 数据转换 语音信号是模拟波形 通过i p 方式来传输语音 不管是实时应用业务还是非 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 实时应用业务 首先要对语音信号进行模拟数据转换 数字化可以使用各种语音 编码方案来实现 目前采用的语音编码标准主要有i t u tg 7 1 1 2 原数据到i p 转换 i p 网络不像电路交换网络 它不形成连接 它要求把数据放在可变长的数据 包或分组中 然蜃给每个数据包附带寻址和控制信息 并通过网络发送 一站一 站地转发到目的地 3 传送 在这个通道中 全部网络被看成一个从输入端接收语音包 然后在一定时间 t 内将其传送到网络输出端 网络中的同间节点检查每个l p 数据附带的寻址信 息 并使用这个信息把该数据报转发到目的地路径上的下一站 网络链路可以 是支持i p 数据流的任何拓扑结构或访问方法 4 i p 包 数据的转抉 目的地v o l p 设备接收这个l p 数据并开始处理 在数据报的处理过程中 去 掉寻址和控制信息 保留原始的原数据 然后把这个原数据提供给解码器 5 数字语音转换为模拟语音 语音信号在i p 网络上盼传送要经过从模拟信号到数字信号的转换 数字语音 封装成i p 分组 i p 分组通过网络的传送 i p 分组的解包和数字语音还原到模拟 信号等过程 2 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 图1 1v o i p 工作原理图 1 1 3v o i p 中语音缡解码器的作用 人类的语言都是以模拟信号形式表示的 早期的电话模拟信号可以描述为平 滑的 正弦波 虽然模拟通信技术已相当发达 但是传输的效率不高 当传输衰 减导致模拟信号变弱时 要将复杂的模拟语音信息和传输噪声区分开来是很困难 的 数字信号只有 1 和 0 两种状态 易于同噪声区分开 而且不易发生畸变 因 此 全球的通信系统已转换为数字传输格式 称为脉冲编码调制 p c m p c m 将模拟语音转换为数字格式 标准电话p c m 使用8 位代码和8 0 0 0 秒采样频 率 所以每一路电话占用6 4 k b s 信道带宽 为了提高传输效率 节省带宽 产生了各种各样的编解码器 语音编码器的主要功能就是把用户语音的p c m 脉冲编码调制 样值编码成 少量的比特 帧 这种方法使得语音在连路产生误码 网络抖动和突发传输时 3 浙江大学硕士学位论文基于e 2 c 编码算法的v o i p 系统 具有健壮性 r o b u s t n e s s 在接收端 语音帧先被误码为p c m 语音样值 然 后再转换成语音波形旧 1 2 论文结构 第一章 引出一些前导性知识 介绍了v o i p 的基础知识以及语音编码器在 v o i p 系统中的作用 第二章 介绍编解码器方面的知识 主要包括编解码器概念 分类以及现在 的主流编码器及其压缩原理 最后对这些编解码器作了评定和比较 第三章 阐述非固定压缩率样本无损的v o i p 音频编解码器 详细讲解了它 的设计思想 算法及具体实现 第四章 详细记录了测试项目 测试方法 测试过程及测试结果 并在此基 础上对改编码算法作出详细的评估 第五章 提出了基于该编解码算法的一个嵌入式v o i p 系统的实现 第六章 分析了该算法的用途及发展方向 4 浙江大学硕二t 学位论文基于e 2 c 编码算法的v o i p 系统 2 编解码器概述 2 1 编解码器的用途 语音编码器的主要功能就是把用户语音的p c m 脉冲编码调制 样值编码成 少量的比特 帧 这种方法使得语音在连路产生误码 网络抖动和突发传输时 具有健壮性 r o b u s t n e s s 在接收端 语音帧先被误码为p c m 语音样值 然 后再转换成语音波形 嘲 2 2 编解码器的分类 语音编码器分为三种类形 a 波形编器 b 声码器 c 混合编码器 波形编码器会尽可能构出包括背景噪单在内的模拟波形 4 2 2 1 波形编码器 波形编码器作用于所有输入信号 因此会产生高质量的样值 然而 波形编 码器工作在高比特率 例如 i t u g 7 1 1 规范 p c m 用的比特率为6 4 k b p s 嘲 2 2 2 声码器 声码器 v o c o d e r 不会再生原始波形 这组编码器会提取一组参数 这组参 数被送到接收端 用来导出语音产生模形 线性预测编码 l p c 用来获取一时 变数字滤波器的参数 这个滤波器用来模拟说话人的声道输出 e s t 9 6 在电 话系统中使用声码器 语音质量不够好 2 2 3 混合编码器 在v o i p 中常用的语音编码器是混合编码器 它融入了波形编码器和声器的 长处 它的另一特点是它工作在非常低的比特率 4 6 k b p s 混合编码器采用 5 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 合成分析 a b s 为了说明问题 考虑人的声道产生的一个语音模式 当人说话产生语音信号 时就会发出浊音 如音素p a d a 等 和清音 如音素s h t h 激励信号就是 由输入的语音信号导出的 其方法是使合成语音与输入语音的差别非常小 l p c 的用法 激励的产生以及对合成分析 a b s 系统的误差检查均如图4 1 所示 长话质量编码器在比特率高于8 k b p s 时容易实现 如图4 2 所示 长话质量的 语音平均意见得分 m o s 必须在分或许分以上 传统的p c n 语音在比特率小 于3 2k b p s 语音质量会严重恶化 在这里就不讨论p c n 了 混合编码和声码 器在比特率相当低的m o s 上的得分是可接受的 在现阶段 大多数基于v o i p 的编码器的工作范围在5 2 8 k b p s 研究表明 标准的编码器在比特率为4k b p s 时能提供可接受的n o s 得分 一些分用系统在4 8k b p s 的m o s 上的得分为 3 8 矢量量化和码激励线性预测一种较好的方法就是用预测存储的最优参数 码 元矢量 的码本对输入语音信号的表示矢量进行编码 这种技术称为矢量量化 v q v e c t o rq u a n t i z a t i o n 将v q 和a b s 技术结合在一起会进一步提高编 码性能 a b sv q 是技术构成c e l p 的基础 v q 和a b sv q 的主要区别在于进 行矢量量化码簿搜索时采用的量化失真测量定义的不同 2 2 4e 2 c 本文所描述的编解码器不属于以上三种 传统的语音编码器的主要功能就是 把用户语音的p c m 脉冲编码调制 样值编码成少量的比特 帧 而本文中的 编解码器是将一大段语音帧压缩为一小段 简而言之 通常的压缩算法以帧为单 位 把一个8 b j t 的语音帧压缩为2 到6 个b i t 而本压缩算法以段为单位 把 大段语音帧用 j 段语音帧表示 压缩时所处的高度不同 2 3 典型的编解码器 常见的编解码器如表2 1 所示 6 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 表2 1 1 5 1 骥麟璐臻i 曩誊 ii 勰l 自粼i i i i i i i i i i i i i i i i i i l 糊醐繁 蘩 i 蠢i 编獭鬻壤 q 7 1 186 4 m u l a wp c m g 7 1 186 4a l a w p c m q 7 2 1 8 3 2a d p c m g 7 2 27 4 8 5 6 6 4 a s p c m q 7 2 2 11 62 4 3 2m l t q 7 2 2 21 6 9 6 6 2 3 8 5 a c e l p q 7 2 38 2 4 4 0 a d p c m q 7 2 3 i86 3m p m o q g 7 2 3 185 3a c e l p q 7 2 68 16 2 4 3 2 4 0a d p c m q 7 2 7816 2 4 3 2 4 0a d p c m q 7 2 881 6l d c e l p e 1 7 2 9 88c s a c e l p 2 3 1 波形编码器 p o l i o 声音是一种模拟信号 为了把声音表示成计算机可以理解的形式 我们a d 转换 进行p c m p u l s ec o d em o d u l a t i o n 编码 即脉码调制 调制过程如图 2 1 所示 脉冲调制就是把一个时间连续 取值连续的模拟信号变换成时间离散 取值离 散的数字信号后在信道中传输 脉冲编码调制就是对模拟信号先抽样 再对样值幅 度量化 编码的过程 嘲 7 浙江大学硕士学位论文基于e 2 c 编码算法的v 0 1 p 系统 l i 一 图2 1p c m 编码过程 r e t 所谓抽样 就是对模拟信号进行周期性扫描 把时间上连续的信号变成时间上 离散的信号 该模拟信号经过抽样后还应当包含原信号中所有信息 也就是说能无 失真的恢复原模拟信号 它的抽样速率的下限是由抽样定理确定的 在该实验中 抽样速率采用8 k b i t s 所谓量化 就是把经过抽样得到的瞬时值将其幅度离散 即用一组规定的电平 把瞬时抽样值用最接近的电平值来表示 一个模拟信号经过抽样量化后 得到已量化的脉冲幅度调制信号 它仅为有限 个数值 所谓编码 就是用一组二进制码组来表示每一个有固定电平的量化值 然而 实 际上量化是在编码过程中同时完成的 故编码过程也称为模 数变换 可记作 d p c m 量化原理如图2 2 所示 l l ll i i l ilf hl l l 1 lll il ii li i iii l1 0 髑l t 0 01 1 11 1 蕾 0 0 0 0 01 1 i 0 l jo r l l 伽l l li 0 o l k t e 01 0 1 图2 2p c m 采样及量化原理 8 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 话音信号先经防混叠低通滤波器 进行脉冲抽样 变成8 k h z 重复频率的抽样 信号 即离散的脉冲调幅p a m 信号 然后将幅度连续的p a m 信号用 四舍五入 办法量化为有限个幅度取值的信号 再经编码后转换成二进制码 对于电 话 c c i t t 规定抽样率为8 k h z 每抽样值编8 位码 即共有2 8 2 5 6 个量化值 因而 每话路p c m 编码后的标准数码率是6 0 4 k b s 为解决均匀量化时小信号量化误差 大 音质差的问题 在实际中采用不均匀选取量化间隔的非线性量化方法 即量化 特性在小信号时分层密 量化间隔小 而在大信号时分层疏 量化间隔大 在实际中广泛使用的是两种对数形式的压缩特性 a 律和律 a 律p c m 用于欧 洲和我国 律用于北美和日本 g 7 1 1 是现在用的最普遍的编码技术 它是目前全世界电路交换电话网中使 用的编码技术 它以8 0 0 0 h z 为采样频率 如果使用编一量化的方式 话音中通常的 信号层次的每一个样本需要用1 2 比特来表示 这样就有9 6 k b p s 的比特率 如果用 不统一量化模式 就可以达到6 4 k b p s 的码率 这样就可以进行流畅的语音传输交 互了 g 7 1 1 的m o s 等级在4 3 左右 所以质量就相当不错了 但是问题在于它需要 6 4 k b p s 的带宽 如果能再小的话 那就更理想了 在g 7 1 1 中p c m 编解码器把各个样本传输到远程终端 由于语音变化的速度 比较慢所以从先前的样本中预测出当前的样本的可能性是很大的 这样我们就可 以通过样本预测值与实际样本之差进行编码 这样的技术被称为差分 p c m d p c m 在有了d p c m 的模型之后 我们还有一个更为先进一些的模型 自适音频脉 冲编码 a d p c m a d p c m 是由以前的样本信息通过语音的变化科研部中提取出 公共信息作为预测值 在a d p c m 上最主要的标准就是g 7 2 6 p c m 与a d p c m 都 没有算法上的时延 所以可以进行实时的编解码 2 2 2 自适应差分脉冲编码a d p c m g 7 1 1 使用a 律或p 律p c m 方法对采样率为8k h z 的声音数据进行压缩 压缩后的数据率为6 4k b s 为了提高充分利用线路资源 而又不希望明显降低 传送话音信号的质量 就要对它作进一步压缩 方法之一就是采用a d p c m 采 9 浙江大学硕士学位论文基于e 2 c 编码算法的v o i f 系统 用a d p c m 算法的编解码器有 g 7 2 1 g 7 2 3 g 7 2 6 及g 7 2 7 2 3 2 1 自适应脉冲编码调制 a p c a 自适应脉冲编码调锖r j a d a p t i v ep u l s ec o d em o d u l a t i o n a p c m 4 是根据输入 信号幅度大小来改变量化阶大小的一种波形编码技术 这种自适应可以是瞬时自 适应 即量化阶的大小每隔几个样本就改变 也可以是音节自适应 即量化阶的 大小在较长时间周期里发生变化 改变量化阶大小的方法有两种 一种称为前向自适应 f o r w a r da d a p t a t i o n 另 种称为后向自适应 b a c k w a r da d a p t a t i o n 前者是根据末量化的样本值的均 方根值来估算输入信号的电平 以此来确定量化阶的大小 并对其电平进行编码 作为边信息 s i d ei n f o r m a t i o n 传送到接收端 后者是从量化器刚输出的过去样本 中来提取量化阶信息 由于后向自适应能在发收两端自动生成量化阶 所以它不 需要传送边信息 前向自适应和后向自适应a p c m 的基本概念 如图2 3 所示 图中的 七 是发送端编码器的输入信号 耳 七 是接收端译码器输出的信号 浙江大学硕士学位论文基于e 2 c 编码算法的v o i p 系统 b 后向自适应 图2 3 a p c m 方块图 2 3 2 2 t 分脉冲编码调制 呻删 差分脉冲编码调制d p c m d i f f e r e n t i a lp u l s ec o d em o d u l a t i o n 1 4 1 是利用样本 与样本之间存在的信息冗余度来进行编码的一种数据压缩技术 差分脉冲编码调 制的思想是 根据过去的样本去估算 e s t i m a t e 下一个样本信号的幅度大小 这 个值称为预测值 然后对实际信号值与预测值之差进行量化编码 从而就减少了 表示每个样本信号的位数 它与脉冲编码调伟i j p c m 不同的是 p c m 是直接对 采样信号进行量化编码 而d p c m 是对实际信号值与预测值之差进行量化编码 存储或者传送的是差值而不是幅度绝对值 这就降低了传送或存储的数据量 此 外 它还能适应大范围变化的输入信号 差分脉冲编码调制的概念示于图2 4 差分信号d 七 是离散输入信号8 七 和 预测器输出的估算值 七一1 之差 注意 七一1 是对 七 的预测值 而不是 过去样本的实际值 d p c m 系统实际上就是对这个差值d q 进行量化编码 用 来补偿过去编码中产生的量化误差 d p c m 系统是一个负反馈系统 采用这种 结构可以避免量化误差的积累 重构信号昂 是由逆量化器产生的量化差分信 号d f 七 与对过去样本信号的估算值 七一1 求和得到 它们的和 即耳 七 作 为预测器确定下一个信号估算值的输入信号 由于在发送端和接收端都使用相同 的逆量化器和预测器 所以接收端的重构信号母 七 可从传送信号 的获得 1 1 浙江大学硕士学位论文基于e 2 c 编码算法的v o i p 系统 图2 4 d p c m 方块图 2 3 2 3 自适应差分脉冲编码调制 加p 渊 a d p c m a d a p t i v ed i f f e r e n c ep u l s ec o d em o d u l a t i o n 1 4 1 综合了a p c m 的自适 应特性和d p c m 系统的差分特性 是一种性能比较好的波形编码 它的核心想 法是 利用自适应的思想改变量化阶的大小 即使用小的量化阶 s t e p s i z e 去 编码小的差值 使用大的量化阶去编码大的差值 使用过去的样本值估算下一 个输入样本的预测值 使实际样本值和预测值之间的差值总是最小 它的编码简 化框图如图2 5 所示 接收端的译码器使用与发送端相同的算法 利用传送来的信号来确定量化器 和逆量化器中的量化阶大小 并且用它来预测下一个接收信号的预测值 一 一甲 娅c m 样本 恩翼厂磊赢 图2 5 a d p c m 方块图 a d p c m 差值 a d p c m 是利用样本与样本之间的高度相关性和量化阶自适应来压缩数据的 浙江大学硕士学位论文基于e 2 c 编码算法的v o i p 系统 一种波形编码技术 c c i t t 为此制定了g 7 2 1 推荐标准f 7 i 这个标准叫做3 2k b s 自适应差分脉冲编码调制 8 2k b sa d a p t i v ed i f f e r e n t i a lp u l s ec o d e m o d u l a t i o n 7 1 在此基础上还制定了g l 7 2 1 的扩充推荐标准 即g 7 2 3 a e x t e n s i o no fr e c o m m e n d a t i o ng 7 2 1a d a p t i v ed i f f e r e n t i a lp u l s ec o d e m o d u l a t i o nt o2 4a n d4 0k b sf o rd i g i t a lc i r c u i tm u l t i p l i c a t i o ne q u i p m e n t a p p l i c a t i o n 使用该标准的编码器的数据率可降低到4 0k b s 和2 4k b s c c i t t 推荐的g 7 2 1a d p c m 标准是一个代码转换系统 它使用a d p c m 转 换技术 实现6 4k b sa 律或 j 律p c m 速率和3 2k b s 速率之间的相互转换 g 7 2 1a d p c m 的简化框图如图2 6 所示 a a d p c m 编码器 b a d p c m 译码器 图2 6g 7 2 1a d p c m 简化框图 浙江大学硕j 学位论文基于e 2 c 编码算法的v o i p 系统 在图2 6 a 所示的编码器中 a 律或 j 律p c m 输入信号转换成均匀的p c m 差分信号等于均匀的p c m 输入信号与预测信号之差 4 自适应量化器 用4 位二 进制数表示差分信号 但只用其中的1 5 个数 即1 5 个量级 来表示差分信号 这 是为防止出现全 0 信号 逆自适应量化器 从这4 位相同的代码中产生量化差分 信号 预测信号和这个量化差分信号相加产生重构信号 自适应预测器 根据重 构信号和量化差分信号产生输入信号的预测信号 这样就构成了一个负反馈回 路 g 7 2 1a d p c m 编译码器的输入信号是g 7 1 1p c m 代码 采样率是8k h z 每个代码用8 位表示 因此它的数据率为6 4k b s 而g 7 2 1a d p c m 的输出代 码是 自适应量化器 的输出 该输出是用4 位表示的差分信号 它的采样率仍然 是8k h z 它的数据率为3 2k b s 这样就获得了2 1 的数据压缩 嘲 在图2 6 b 所示的译码器中 译码器的部分结构与编码器负反馈回路部分相 同 此外 还包含有均匀p c m 到a 律或 j 律p c m 的转换部分 以及同步编码 调整 s y n c h r o n o u sc o d i n ga d j u s t m e n t 部分 设置同步 串行 编码调整的目的是 为防止在同步串行编码期间出现的累积信号失真 2 3 3 线性预测合成分析编码器 线性预测合成分析编码器最常用的 e 特率在4 8 k b p s 1 6k b p s 之间的语音 编码器是基于模型编码器的 这些编码器都是线性预测合成分析 l r a s 方法 为了随着时间的变化模拟语音信号 线性预溯语音产生模型必须用适当的信号来 激励 每隔一段固定时间 如每隔2 0 m s 语音模型参数和激励参数都必须做 一次估计和更新 并用来控制语音模型 下面将介绍两种l p a s 编码器 前向至 应l p a s 编码器和后向自适应l p a s 编码器 前向自适应l p a s 编码器 8 k b p s g 7 2 9 编码器和6 3 k b p s 与5 3 k b p sg 7 2 3 1 编码器在前向自适应的a b s 编码 器中 预测滤波器的系数和增益是显示传送的 为了提供长话质量的语音性能 这两种编码器都依赖于信源模型 激励信号 以语音基调周期的信息形式表示 也要传送 这种编码器所提供的模型对语音信号来说是比较好的 但对于一些噪 音或者多数器来说并不合适 因此 在背景噪音和音乐环境下 l p a s 编码器的 质量比7 7 2 6 和7 7 2 7 的编码器的质量要差一些 1 4 浙江大学硕士学位论文基于f 2 c 编码算法的v o i p 系统 g 7 2 3 1i t u tg 7 2 3 1 编码器在6 4 k b p s 提供长话质量语音 同时g 7 2 3 1 还包括一个工作在5 3 k b p s 的低质量语音编码器 g 7 2 3 1 是为低比特率可视电 话而设计的 在这种适应中 由于视频编码时延通常大于语音编码时延 因此对 时延的要求不是很严格 g 7 2 3 1 编码器的帧长为3 0 m s 还有7 5 m s 的前视 再加上编码器的处理时延 编码器的单向总时延为6 7 5 m s 其它时延是由系统 缓冲区和网络造成的 g 7 2 3 1 编码器首先对语音信号进行传统电话带宽的波滤 基于g 7 1 2 再 对语音信号用传统的8 0 0 0 h z 速率进行抽样 基于g 7 1 1 并变换成位的线性 p c m 码作作为该编码器的输入 在编码器中对输出进行逆操作来熏构语音信号 7 2 3 1 系统用l p a s 编码方法将语音信号编码成帧 编码器能够产生两种速率 的语音流量 a 用于高速率的6 3 k b p s b 用于低速率的5 3 k b p s 主速率编 码器使用多脉冲最大自然量化 m p m l q 低速率编码器使用代数码激励线性 预测 a c e l p a l g e b r a i c c o d e e x c i t e dl i n e a r p r e d i c t i o n 方法 编码器和解 码器都必须支持两种速率 并通能够在帧问对两种速度进行转换 此系统同样能 够对音乐和其它音频信号进行压缩和解压缩 但它对语音信号来说是最优的 编码器对帧进行操作 每帧包括2 4 0 个样点 采用速率为8 0 0 0 h z 在进一 步的处理 商通滤波器去直流分量 后把每帧分成4 个子帧 每个子帧包括6 0 个样点 其它的各种操作包括l p c 滤波器以及l s p 滤波器非量化系数的计算等 将会导致3 0 m s 的分组时延 对每个子帧 用未经处理的输入信号计算l p c 滤 波器 最后一个子帧的滤波器系数用来预测分裂矢量量化器 p s v q p r e d i c t i v e s p l i tv e c t o rq u a n t i z e r 进行量化 正如前面所介绍的 前视占有7 5 m s 所以 整个编码时延为3 7 5 m s 这个时延在评介编码器 尤其是通过数据网络传输语 音时是个很重要的因素 因为如果编码及解码时延比较小的话 就意味着处理互 联网中的时延及其抖动时具有更大的自由度 解码器的处理也是基于帧的 解码 过程如下 g 7 2 3 1 算法摘要 对l p c 的量化索引号进行解码 对构造l p c 合成滤波器 对每个子帧 先对自适应码本激励和固定码本激励解码 然后再输入合成滤 波器 浙江大学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 激励信号经基音后置滤波器处理后 再送入合成滤波器 合成信号被输入到共振峰后置滤波器 该滤波器采用增益标度单元以使其输 出能量维持在糨的输入水平 静音压缩已运用多年 它运用了在总会话时间中静音时间占大约5 0 这一事 实 其基本思路是在静音期间减少传送的比特数 从而节省了所需传输的总比特 数 在电话网中 多年来对模拟语音信号都是用时间分配语音插值 t a s i 1 3 m e a s s i g n e ds p e e c hi n t e r p o l a t i o n 主法进行处理 这一技术也就是将其它语 音信号或者数据信号放置在谈话的静音期间内 从而为多信道链路提供附加容 量 现今 6 i 已运用数字信号中并被赋予新名称一其中的一个例子就是时分多 址 t d m a 1 1 m ed i v i s i o nm u l t i p l ea c c e s s 简要地讲 d t m a 是将通常的信 号划分成很小的 数字化片段 s l o t s 即时隙 这些时隙和其它时隙一起在一个 信道中进行时分复用 g 7 2 3 1 采用了执行不连续传输的静音压缩 这就意味着在静音期间的比特 流中加入了人为的噪声 除了预留带宽之外 这种技术使发信机的调制解调器保 持边续工作 并且避免了载波信号的时通时断 g 7 2 9 编码器是为低时延应用设计的 它的帧长只有1 0 m s 处理时延也是 1 0 m s 再加上5 m s 的前视 这就使得g 7 2 9 产生的点到点的时延为2 5 m s 比 特率为8k b p s 这些时延性能在互联网中很重要 因为我们知道任何能减少时 延的因素都是非常重要的 g 7 2 9 有两个版本 g 7 2 9 和g 7 2 9 a g 7 2 9 比g 7 2 3 1 简单 这两个版本 互相兼容但它们的性能有些不同 复杂性低的版本 g 7 2 9 a 性能较差 两种 编码器都提供了对帧丢失和分组丢失的隐藏处理机制 因此在因特网上传输语音 时 这两种编码器都是很好的选择 c o x 等 c o x 9 8 认为g 7 2 9 在处理随机比特 错误方面性能不好 建议在有随机比特错误的信道上不使用此编码器 除非利用 信道编码 前向纠错码和卷积码 将在无线部份讨论 保护最敏感的比特 2 3 4 后向自适应l p a s 编码 16k b p sg 7 2 8 低时延码激励线性预测g 7 2 8 是低比特线性预测合成分析编 码器 g 7 2 9 和g 7 2 3 1 和后向a d p c m 编码器的混合体 g 7 2 8 是l d c e l p 1 6 浙江大学硕士学位论文基于e 2 c 编码算法的v o 口系统 编码器 它一次只处理5 个样点 c e l p 是上种语音编码技术 它的激励信号是从一个可能的激励信号集合中 通过仝搜索方法选出的 低速率语音编码吕器对样值预测滤波器采用前向自适应 方案 而l d c e l p 采用后向自适应滤波器并每隔2 5 m s 做一次更新 c e l p 中 共有1 0 2 4 个可能的激励矢量 这些矢量可进一步分析为4 种可能的增益 两种 符号 和一 与1 2 8 种形状矢量 对于低速率 5 6 1 2 8k b p s 的综合业务数字网 i s d n 可视电话 g 7 2 8 是一种建议采用的语音编码器 由于其后向自适应特性 因此g l 7 2 8 是一种低 时延编码器 但它比其它的编码器都复杂 这是因为在编码器中必须重复做5 0 阶l p c 分析 g 7 2 8 还采用了自适应后置滤波器来提高其性能 2 4 编解码器的评价标准h 2 评估编码器的性能时要考虑几个重要因素 这些因素如下提示 帧大小 帧的大小表示语音流量的时间长度 也称为帧时延 帧是语音 信号的分立部件 且每帧是根据语音样点更新的 本介绍的编码器都是 一次处理一帧 每帧信息各放在各语音分组中 并传送给接收端 处理时延 它表示在编码器中对一帧语音做编码算法处理所需时间 它 通常简单计入帧时延 处理时延好称为算法时延 前视时延 编码器为了对当前帧的编码提供帮助而检查下一帧的一定长 度 此长度就称为前视时延 前视的想法是为了利用相邻语音帧之间的 密切相关性 帧长度 这个值表示经编码处理后的字节数 不包括帧头 语音比特率 当编解码器的输入是标准脉冲编码调制的语音码流 比特 率为6 4k b s 时 编解码器的输出速率 d s p m i p s 此值是指支持特定编码器的d s p 处理器的最低速度 值提 注意的是d s pm i s p 与其它处理器的m i s p 速率无关 与用在工作站和 个人计算机上通用处理器不同 这些d s p 是为特定任务而专门设计的 因此 为实现上述的编解码器处理所需求m i s p 通用处理器要比专用 d s p 处理器大 r a m 需求 它描述了支持特定的编码过程所需要r a m 的大小 1 7 浙江人学硕士学位论文 基于e 2 c 编码算法的v o i p 系统 评价编码器性能的关键因素是编码器工作所需时间 这个时间是指编码器的 缓存及处理时间 称为单向系统时延 其值等于 帧大小 处理时延 前视时延 显然 解码时延也非常重要 实际上 解码时延大约是编码时延的一半 语音编码器的比较为了标准编码器的讨论作个总结 在表2 2 中对几种编码 器的比特率 m o s 复杂性 以g 7 1 1 为基准 和时延 帧大小及前视时问 作为比较 表2 2 编解码器编码类型0 i比特事m o s复杂性时延 m s q 7 1 1p c m6 44 5 1 o 1 2 5 q 7 拍a d p c m3 24 4 1 0 o 1 2 5 q 7 2 8l d c e l p1 64 35 0 0 6 2 5 g s mr a e l p 下1 33 752 0 q 7 2 9c s a c e l p84 03 01 5 q 7 2 3 1a c e l p6 33 82 53 7 5 u s d o dl p c 1 0 2 4 合成语音1 02 2 5 峰值5 6 同值压缩 e 2 c 谷值8 4 510 2 5 小振幅压缩 平均2 8 8 1 8 浙江大学硕士学位论文 基于e 2 c 编码算法的v o 坤系统 3e 2 c 音频压缩算法 e a s yt oc o m p r e s sa l g o r i t h m 简称e 2 c 该算法由两个子算法组成 第一个 算法称为同值压缩 t h es a m ev a l u ec o m p r e s sa l g o r i t h m 简称s v a 针对一 段值连续不变的p c m 编码样本进行压缩 第二个算法成为小振幅压缩 t h el i t t l e s c o p ec o m p r e s sa l g o r i t h m 简称l s a 针对一段p c m 编码值小范围波动的 样本进行压缩 3 1 第一步压缩 同值压缩 s a 3 1 1 压缩思想 在通话阶段 平均有4 0 的时间在说话1 13 l 在无声的时候 p c m 采集到的 是静音 或是单调的背景音 这时得到的p c m 编码样本中会呈现大段大段的一 样的值 即使在说话的时候 句与句 字与字之问存在停顿 甚至出现延时较长的发 音时 p c m 都会编码出大段的一样的值 针对在p c m 编码样本中存在大量的值连续不变的样本串 我们将它们表示 为该值及其连续出现的次数 如下面的一段p c m 编码数据 2 5 4 2 0 62 0 22 0 22 0 22 0 2 2 0 22 0 22 0 22 0 2 2 0 22 0 22 0 32 0 3 2 0 3 2 0 3 2 0 32 0 3 2 0 3 2 0 2 经过同值压缩后将变为 2 5 4 2 0 6 5 0 2 0 21 05 0 2 0 37 2 0 2 其中 2 0 2 这个值连续出现了1 0 次 所以被表示为 2 0 21 0 2 0 3 连续出现了 7 次 所以被表示为 2 0 37 浙江大学硕士学位论文 基于e 2 c 编码算法的v o l 9 系统 3 1 2 压缩算法 u n s i g n e di n t 同值压缩 源语音块指针 目标指针 函数的返回值为压缩后的字节数 建立第一个匹配队列 m a r c h p 该队列的特征值初始化为未处理的第一个值 w h i l e 源语音块未扫描完 i f p 当前的值不等于m a r c h i f 连续4 个p c m 值等于m a r c h 的值 将这l e n g t h 个值编为 m a r c hl e n g t h 写入队列n 将s i z e 的值减去节省的字节数 e l s e l e n i g t h 的值小于4 将l e n g t h 个m a r c h 的值写入队列n 将m a r c h 赋值为当前 p 的值 将l e n g t h 的值赋为o i f p 当前的值不等于m a r c h i f e 续4 个p c m 值等于m a r c h 的值1 将这l e n g t h 个值编为 m a r c hl
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论