(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf_第1页
(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf_第2页
(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf_第3页
(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf_第4页
(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf_第5页
已阅读5页,还剩122页未读 继续免费阅读

(信号与信息处理专业论文)感知信源编码中的若干核心技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 近年来,互联网、移动通信和多媒体等产业发展非常迅速,宽带移动通信、 数字广播和数字电视技术逐渐成熟并进入应用领域i 移动互联网和移动多媒体等 概念已经深入人心。然而,无线频带资源是有限的,继续扩大信道容量已经越来 越困难;类似的问题同样也出现在网络多媒体、高清晰度数字电视、数字广播和 数字激光视盘等领域。在许多场合,信源的压缩编码几乎成了唯一的出路,因此, 近年来,信源编码问题进一步为人们所重视,并推出了一系列优秀的编码技术和 标准,同时,一些新标准正在制定之中。 本文的主要内容是在作者参加中国音视频标准化工作和相关国家重大科研 项目的过程中完成的。论文主要讨论了感知信源编码中的一些核心技术,包括滤 波和变换技术、量化和熵编码技术及人类听觉感知特性和模型。在此基础上,本 文设计了一个低复杂度的音频编码器( e a c ) 。本文的主要研究成果主要包括三个 方面: 1 变换和滤波技术 基于传统小波变换在变换块间基函数的不连续问题,提出块重叠小波变 换技术,以有效消除小波编码中块边界的不连续性( 即块效应问题) 。 由于研究和分析问题的角度不同,调制滤波器组的时域分析和频域分析 存在着不同的形式和方法。本文通过证明t d a c 余弦调制滤波器技术时频 分析的等价性,探索了两种分析方法本质上的联系,也为进一步分析和 应用t d a c 余弦调制滤波器组提供了更大方便。 本文将一种正交非等带宽余弦调制滤波器组构造技术拓展到双正交场 合,由于双正交滤波系统的分析和综合滤波器组可以不同,因此在编码 和解码多选择不同特性的非等带宽滤波器组:本文提出并验证了上述非 等带宽滤波器组的多分辨率分析性能。 本文拓展了传统多分辨率分析的思想,提出频域多分辨率分析技术,通 过对f f t 和m d c t 变换系数进行多分辨率分析处理和音频编码实例,介绍 了该技术的具体实现思路和特点,以及与已有技术的联系。 本文通过对基于余弦调制滤波器组的多分辨分析技术理论分析和应用研 究,对余弦调制滤波器组技术和多分辨率分析技术的结合进行了有益的 尝试。 2 感知比特分配 本文围绕感知编码中的一个具体的比特分配问题,设计了基于“最大最 小”( 全局最大失真最小) 失真准则的熵约束量化器组的比特分配策略, 并证明该策略可以获得在“最大最小”失真准则下的最优比特分配方案。 3 感知音频编码器设计 作为理论工作的具体实践例,本文设计和实现了一个低复杂度、高效率 的音频编解码器( e a c ) 。经过和两种先进水平的编码器的对比实验,验 证了该技术是切实可行的。 关键词:感知信源编码音频编码滤波器组小波变换t d a c 滤波器组余弦调 制滤波器组m d c t 多分辨率分析量化比特分配心理声学模型 a b s t r a c t i nt h el a t ed e c a d e s ,i n t e m e t ,m o b i l ec o m m u n i c a t i o na n dm u l t i m e d i ai n d u s t r yh a d b e e ni m p r o v e dq u i c k l y ,a n dt h et e c h n o l o g i e so fw i d eb a n dm o b i l ec o m m u n i c a t i o n , d i g i t a lb r o a d c a s ta n dd i g i t a lt v a r ec o m i n gi n t of o r c e w h i l et h ei d e a so fm o b i l e i n t e r n e ta n dm o b i l em u l t i m e d i aw i l ls o o nb e c o m et h er e a l i t y s i n c et h eb a n d w i d t ho f t h es p e c t r u mi sl i m i t e d ,t h ee f f o r tt oe x p a n dt h ec a p a b i l i t yo ft h ec h a n n e l si sb e c o m i n g m o r ea n dm o r ed i f f i c u l t 西et r o u b l ee x i s t sa l m o s te v e r y w h e r e e s p e c i a l l yi nw i r e l e s s c o m m u n i c a t i o n ,i n t e m e tm u l t i m e d i a ,h i g hd e f i n i t i o nt v ,d i 舀t a lb r o a d c a s ta n dd i g i t a l l a s e rv i d e od i s k e t t e o nt h eo t h e rh a n d ,t h es o u r c ec o d i n gh a db e e nt h ee f f e c t i v e a l t e r n a t i v es o l u t i o nt ot h ep r o b l e m ,s ot h a tt h ei n t e r e s ti nt h i sa r e ah a db e e nf u r t h e r s t i m u l a t e d ,a n dal o to fs t a n d a r d sh a db e e no ra r eb e i n gp r o d u c e d t h ew o r kd e s c r i b e di nt h i sd i s s e r t a t i o nh a sb e e nd e v e l o p e di np a r a l l e lw i t ha n d s o m e t i m e sc o n t r i b u t i n gt ot h ec h i n e s ea u d i oa n dv i d e os t a n d a r d i z a t i o n ( a v s ) a c t i v i t ya n d t h en a t i o n a lp r o j e c t s s o m ec r i t i c a lt o p i c so ft h ep e r c e p t u a ls o u r c ec o d i n g h a db e e ns t u d i e di nt h ed i s s e r t a t i o n ,i n c l u d i n gt h et e c h n i q u e so ff i l t e rb a n ka n d t r a n s f o r m ,q u a n t i z a t i o n a n d e n t r o p yc o d i n g ,a u d i t o r yp e r c e p t u a lp r o p e r t i e s a n d m o d e l s b a s e do nt h ew o r k ,an e wl o wc o m p l e x i t ya u d i oc o d e r ( n a m e de a c ) i s d e s i g n e da n dt e s t e d t h em o s ti m p o r t a n tc o n t r i b u t i o n sa n dr e s u l t sp r e s e n t e di nt h i s d i s s e r t a t i o ni sc o n c l u d e da sf o l l o w e d : 1 t r a n s f o r i l la n df i l t e rb a n k n e l a p p e db l o c kw a v e l e tt r a n s f o mi s i n t r o d u c e dt or e m o v et h eb l o c k i n g e f f e c t se s s e n t i a l l ya tt h ee d g eo ft h ef r a m e b yp r o v i n g t h e e q u i v a l e n c e o ft h e p e r f e c t r e c o n s t r u c t i o nc o n d i t i o n so f t i m e - a n a l y s i s a n df r e q u e n c y - a n a l y s i s ,w ef o u n dt h ei n h e r e n t r e l a t i o n s h i p b e t w e e nt i m ed o m a i n a l i a s i n gc a n c e l l a t i o n ( t d a c ) a n d c o s i n em o d u l a t e d f i l t e rb a n k ( c m r ) b yi n t r o d u c i n gb i o r t h o g o n a l i t yi n t ot h ed e s i g nm e t h o do fn o n u n i f o r mf i l t e r b a n kw i t ho r t h o g o n a lc m f , w ec a nd e s i g nt h en o n u n i f o r ma n a l y s i sa n d s y n t h e s i sf i l t e r sw i t hd i f f e r e n tp r o p e r t i e sa c c o r d i n gt oi t sa p p l i c a t i o n ,a n di t p r o v i d eab r o a d e rs p a c e f o rt h ec h o i c eo ft h ep r o t o t y p ef i l t e r s t h e nt h e m u l t i r e s o l u t i o na n a l y s i st e c h n o l o g yb a s e do nt h eb i o r t h o g o n a ln o n u n i f o r m c m fi ss t u d i e d t h em u l t i r e s o l u t i o n a n a l y s i st e c h n o l o g y i nt h e f r e q u e n c y d o m a i ni s i n t r o d u c e d ,a n dt h ea n a l y s i sm e t h o da n di t sr e l a t i o n s h i pw i t ho t h e rr e s u l t sa r e i n v e s t i g a t e db yt w oe x a m p l e sb a s e do nf f t a n dm o d i f i e dd i s c r e t ec o s i n e t r a n s f o r m ( m d c t ) i ti sw o r m vt o e m p h a s i z e t h a tt h ec o m b i n i n gi d e ab e t w e e nc m fa n d m u t l i r e s o l u t i o na n a l y s i si so n eo ft h em a j o re f f o r t si nt h ed i s s e r t a t i o n 2 稚l eb 娃a l l o c a t i o nb a s e do n p e r c e p t u a lp r o p e r t y o fh u m a n b e i n g t h em a x m i nb i ta l l o c a t i o no fab a n ko f e n t r o p y c o n s t r a i n e ds c a l a r q u a r t z e r s ( e c s o ) 诲d e s c r i b e d 。a n d i ti sp r o v e dt h a tt h i sm e t h o dc a no b t a i n t h eb e s ts o l u t i o no nc o n d i t i o no fm i n i m i z i n gt h em a x i m t i mo ft h el o c a l d i s t o r t i o 矗。 3 矗n e wl o w c o m p l e x i t y a u d i oc o d e ri sd e s i g n e d a so n ec o n c r e t ee x a m p l eo ft h et e c l m i q u e sd e s c r i b e di nt h ed i s s e r t a t i o n ,a n e wl o wc o m p l e x i t ya u d i oc o d e r ( n a m e de a c ) i sd e s i g n e da n dt e s t e d c o m p a r e d w i t ht w os t a t e - o f - t h e - a r tc o d e c s , k e y w o r d :p e r c e p t u a ls o u r c ec o d i n g , a u d i oc o d i n g , f i l t e rb a n k ,w a v e l e tt r a n s f o r m , t d a c , c m f , m d c t , m u l t i r e s o l u t i o na n a l y s i s , q u a n t i z a t i o n ,b i t a l l o c a t i o n , p s y c h o a c o u s t i c sm o d e l 北京邮电大学博士学位论文 1 。 引言 第一章绪论 将模拟信号躐嵩速率离散僚学转换为低速率、易予传输和存储的数据流的过 稷一毅技拣必傣滚缡羁。蠢蕊遽绫薅一样,壤滚编羁魄楚信惠辩学豹一令藿要分 支。信源编礤童簧解决有效饿闯题,郎通溅辩信源的聪缩、扰乱、加密等处理, 力浓用最少的数码传递最大的信息量。而倍道编码主爰解决可靠性问题,以尽量 使处理过的信号在传输过稷中不出错或少出错,弗可自动检错和尽量纠错 “ 【黜l 朝【7 i o 舀从香农程1 9 4 8 年第一次掇出率失爽壤论戳来“o “,由于茯速蹭长懿逶信 产般的驱动,人们已经在信源编码方面微了大量的工作。 溷l 一1 是一个逶露的信息鬈统模型铷,瀣: 本文童豢讨论信源编碣技零,不 失一般经,我稍霹班穰设僖遂为毽想静秃嗓傣遒。萁审,信源输出敬霹戳是模撅 信号,如语音、音频、图像或视频信号等;也可以是离散信号( 这里,离散信号 包撼辩阍离散、揠僮连续的馁譬秘数字僚譬) ,翔文字麓。这里,信源编码豹作 弼在予寻求一黪信源输窭翡蠢效表示方法,使箕缀少簸不产生冗余,将信滚输窭 的模拟或离散倍号有效地变换成二进制数字序列。 豳1 - 1 遥用信息系统模型 从信息论的角度看,信源缡码的主要弱的就是要群决数据压缩编碣闽题。形 象瓣滋,数据羼缭编璐戆嚣豹怒力争戳最少戆数羁表零臻滚囊发熬壤譬,减少容 纳给定信息集会或数据采样集合的信号室阕n 】c 7 j 。 数据压缩编码包括无失真编码和限失真编码。因为违续信源其信源输瞄的信 息嫩为无限大,因此只有离散倍源才能实现无失真编粥。根据香农熵编码定理, 离教信源熬元必囊绫羁实震主建一耱统诗藏聚缡璃,羚缀据售漯熬不阏壤搴分蠢 逸瘸楣匹配鹄缡磷策略,使鹂举最小。隈失囊编码是程定失真准掰( 始r ( 玲) 下,使码率最小。对限失真编磷信源,根据髅宿的要求可分为限波形必真信源和 第一章绪论 限特短参萋失爽售源,并分别对应波形编妈窝参数编弼“”。 感知续码怒传统售源缀码技本驰掇震,即在售源编码中充分考虑镲宿特经瓣 编码鼓术。在感知绽璐中,鸯耀穆冗余;统计冗余秘感知无关冗余。其中,感酝 无关冗余息指缡码信号中人类感知器寅无法感妇到的时间、频率或空瓣分蹩,在 实际的感知编码中,感知无关冗余的利用效率往往对编码爨的性& 起着决定性躲 作用。例如,般c d 采样的立体声音乐的无损压缩率为3 左右,丙基于感知编 码的m p 3 编码器的压缩率可以达到1 2 ,而a a c 编码器可以达到1 6 。 这厘,给出一个感知编码的简单定义:感知编码即基于感知的信源编码,是 指用尽可能低的码率获得信源输出的感知无失真表示,或在码率确定的情况下, 使解码信号的主观失真最小的信源信号的表示过程。3 。这里,失真准则是使人的 主观感知失真最小,对于语音( 窄带声音) 和音频( 宽带声音) 编码,是使听拦 失真最小;对于图像和视频编码( 运动图像) 是使人的视觉失真最小。 需要指出的是,基于感知的信源编码的核心概念是嗓声或失真掩蔽,即在编 码过程中,如采产生的失翼分布合理,就可以获得信号本身的掩蔽,使人感觉不 到失真现象。遮就是感知透明编码的含义。 1 2 课题背景 近年来,登联网、穆动逶攘弱多媒体等产炫发展l # 常邋速,数字广播耪数字 电视技术逐渐成熟磐进入艨用领域,宽繁移动遥售、移动耍联阚露移致多媒体等 概念也已深入人心,人类已经遴入售感社会。然蘧,无线频豢溃源是鸯眼的,继 续扩大信道容爨已经越来越困难;类似的阀题网梯也出现在网终多媒体、离瀵濒 度数字电视和数字激光视擞等领域。在许多场食,信源的压缩编码几乎成了唯一 的出路,因此,近年来信源编码问题进一步为人们所重视,并推出了一系列优秀 的编码技术和标准。 回顾已有的优秀编码技术,如j p e g 、j p e g 2 0 0 0 、m p e g l 、m p e g 2 、m p e g 4 、h 2 6 1 , h 2 6 3 、d o l b ya c 一3 等等,已经为我们的生活和工作带来了极大的方便和乐趣。 但是,由于在这些已有的标准中,我国基本上没有核心的知识产权,因此,在相 应的产业竞争中处于非常不利的地位。例如,从1 9 9 9 年开始的d v d 知识产权收 费问题纠纷,以及d o l b y 关于a c 一3 编解码技术知识产权的收费政策变化等,都 对我国褶关产鼗的发展造成极大的负面影响。 为了摆脱这种被动、不利的局衙,中国的榴关产韭界、学术界和政府已经汗 始行动起来,通过联合立项和成立专题工作组的形式,以推动阑内相关核心技术 研究、标疆纯释产妇发展。1 9 9 9 年,辔信息产监部和外经贸部牵头,成立了以 d v d 穗关会韭为成员萃位豹“中国数字技术联骚”,英看来攉蹬了“裔密度激先 l l 索鼯电丈学薄士学像论文 援盘行业标猴( e v d ) ”;2 0 0 2 霉,多豢研究魂褥、大学秘金、翌获褥国家8 6 3 计 划项目( 课题2 0 0 2 a a l l 9 0 1 0 ,“数字视音频编码、传输、测试与应用示范”) 支 持;2 0 0 2 冬第1 8 7 次香由零率学会议螽,信惑产翌部成立了“数字齑税额标准工 作组( a v s ) ”来推动中国数字音视频编码技术标准化工作。这些工作,使中国新 一代的数字街视频褶关技术标准化工作可以和整界同步,为我国制定先逑的、舆 有自主知识产权的赣视频编码技术标准奠定了基础,并将对相关匿际标摸的制定 产生深远的影响。 从2 0 0 0 冬接嚣始,传考裁深入参与了e g d 技术疆究莘鞋标准耽工作,以及嚣 来的a v s 标准化和8 6 3 项圈研究工作。在此期间,作者参加了一系列音频、视频 绫码技零磅究窥标雄证工作,势霾点磁究了惑j 霭音鬏编羁技术。 本论文的主要内容就是在作者在参加上述标准化工作和相关国家重大科研 顼嚣遥程中完成的,其中部分研究成果巍经成为上述标准的霪要缎成部分或技术 提案。 1 。3 感知债源编码 蔻覆已经筵萃翳分绥了感鲡馈滚编褥懿裰念,这篷,我察透过对感翔售滚缡 码做更进一步的介绍,以便于说明本文的主要研究内容和工作重点。 懿嚣已经捷蜀,信源输出静蜀戮是模越信号,氇碍戳是离教信号。 对于信源输出魑模拟信号戆傣息系统,信源输出的波形雄) 是随极过程x ( t ) 的一个样本瞒数,是幅度芹玎时间连续的,需要通过模数( a d ) 转换才能获得该 信号豹离散表示。焱进行a 庙转换的过程串,采祥( 躐时闯离散化) 后酌信号豹 幅值依然是连续的,因此憨要进行幅度蠡化。理论上,幅值露化过程也可以先予 采样过程,但在通常的应掰中,采样过程一般先于幅值量化过程。幅值量化带来 了数攫医缨,但同时弓l 入了波形失真或信号傺真度的损失。 例如,对于语音或音频信号,x q ) w 以认为是带限平稳随机过程。此时,根 据采样定理,可以嗣一个以奈奎斯特速率抽取的、均匀的抽样序列来表示。然蔚 对样傻幅度遴行量他移绽避。一耪蕊单蛇缡码方法是耀一事二进囊l 数字廖列来代 液一个离散幅值电平,这样,如果有l 个电平,当l 是2 的幂次时每个样值需用 r l o g :l 磁特表示,当l 不是2 的幂次是,每个祥值需霞t 1 0 9 :三1 + 1 眈特表示。 露虽,若竣战毫平不等壤搴显各瞧平橇率已絮,可以惩滚绽码寒掇舞绽戳效率。 一般地,根据符号间统计相关性不同,离散信源可以分为无记忆信源和有记 忆售澈。有 嚣忆信漾输鑫豢号静符号阕存在统诗冗余,胃骧遥过预溺、滤波帮交 换等技术减小或消除。信源编码就是通过消除信号的统计冗余和感知无关冗余, 第一章绪论 这翻数据压凌瓣瑟戆。 在信源编码中,由于幅僚、滤波或变换系数的量化过程决定了信息系统的失 真和所需信道带宽( 同时,也受熵编码影响) ,因此,爨化是一个a # 常关键的处 理遗疆。 当信源棒馕、滤波或交换系数被量健晦,就产生了失粪。一般缝,所谓静“失 真”包括客观失真和主观失真,客观失真描用某种客观尺度衡量的实际信源矢量 z 与璧化后的矢爨是的距离测发,可用矗仅翦表示。一般地,客观失真可以为便 于计算、稻子分耩和满足感赧一致性的任意度量。然丽,完全满足这魑要求的失 真定义是很难得到的。下面嫩最常用的平方误差失真: 蠢编癸一卜麓2 ;固协蛰* 私一毫| 2 生观失真又叫感知失真,是刻画量化威编码信号在人的主观感觉上的失真程 度的度量。由于蹰前对人的感知认识上的扁限性,还很难给出一个精确的主观失 奏诗冀方法,一缎瓣,霉潋采麓专家主理努分戆溺试实验懋鬟圭褒失囊谬羧绝栗。 感知编码的梭心思想是利用人类感知掩蔽效应,使编码过程中引入的量化噪 声w 以被信号本身掩蔽( 或部分掩蔽) 的编码方法0 1 。通过感知编码,在同样的 码率下,可以获褥感知无失囊( 即感知透嬲) 或感知质爨优于其谴编码方法的信 号。入的感知掩蔽效应是捂奄予感稚生理霸心理特性,搜得我靛不憩分辨两释有 不同的频率、时间或空间谱结构的信号的现象。在感知编码中,可以根据人的感 知特性,使量化噪声按照感知失真最小的原则分布,以巍分利用人的感知掩蔽效 应,辫诋羁率。强撵意义下,麴莱谴褥量纯噪声分毒豹镣个频率、辩瓣或空溺感 知区间均满足掩蔽效应,则可获得透明编粥质量。因此,和基于客蕊失真编码不 同,在感知编砜中,较低的储噪比并不意味着较低的主观质量。 感知编码普遍适用于语音、音频、图像和视频信号编妈。我们知邋,语音信 号瓣信源可戳丽颓涮模鍪寒袭零,逶合予参数编码,其缡璐效率穰离;然嚣,音 频、图像和视频信号的信源却很难用一个简单、通用的模型来描述,因此其编码 性能的提高,彼往需要有效利用信宿模型特性即人的感知特性。 虫子夭豹感麴系统 h l ( z ) = e ( z ”、 ( 2 - 6 ) 同理,若定义合成滤波器缎的多相矩阵r ( z ) * 【r f f ( 瑚,则有类型多楣形式: 暇曩( z ) 。,( z ) 】;k 州枷z - ( ”) 啦( z ”) ( 2 7 ) 稻粥滤波器缝鲍多档形式图孙2 的醚等带宽邋遘旗赛采榉率滤波器缀w 表示成露 2 - 3 ( a ) 。利用滤波器组理论的显著恒等斌,可进一步袭示为图2 - 3 ( b ) 。 还蛐 垣两丑 b - ,辩:, 瓶州爵 _ _ _ b 缸,r 儡, ( b ) 阕2 - 3m 等带宽邋道临界采样率滤波器组的多相形式 ;| 入滤波器缀翡多穗形式,蔻滤波器缀瓣设诗裒疫麓挺供了较大豹方褒。蒙 因猩于,它不但脊效提高了滤波器组的执舒效率,还大大简化了滤波器组的设计 工作“。 ,彳i : l 京邮电大学博学位论文 2 1 4 m 等带宽通道临界采样率滤波器组完全莛构的充分 必要条馋 当带宽通道临界采样率滤波器组的多相矩阵e ( z ) 和r ( z ) 满怒如下条件 最( z z :( 刁一c z 一“。j ( 2 8 ) 则该系统是完全重构的( p e r f e c tr e c o n s t r u c t i o n ) 。其中c 为一不等于零的常 数,m 。为一艇数“,i 为m x m 单位矩阵。 上瑶的结论对i i r 滤波器组两样 魏是成立静。 更进一步地,我们有如下结论”1 : 满足式( 2 8 ) 完全黧构条件的f i r 分析和合成滤波器组一定满足如下条件: 陬z l 一:“释事z x 一。“ m n e z ( 2 9 ) 2 1 5 仿酉滤波器组和双正交滤波器组 仿酉滤波器组有时又被称为正交滤波器组。因为正交滤波器缀往往可以更好 的分离各予带信号,因此在许多应用场合,人们希黧获得仿酉滤波器组。 定义2 - 1 “3 如果一个滤波器组的多掇矩阵满足如下条终: r ( z ) 一z - k e + ( z 。1 ) ( 2 一l o ) 那么,该滤波器组是仿酉滤波器组。其中k 是e 0 ) 的阶数;e p ”1 ) 表示e 0 ”1 ) 的 共囊转受。 对于实系数仿酉滤波器组,有: r ( z ) 一z - k e 7 ( z - 1 ) ( 2 一1 1 ) 其中,0 。) 表f f x ( z ) 十五( 2 ) 盖( 一z ) ( 2 - 1 3 ) 其中转移函数( :) 和五( z ) : 辅) _ 三溉妒出m ( z 胤纠 ( 2 _ 互( 力一三瓴( z ) 。( 一z ) + e ( z 科,( 一z ) ) 圈2 4 双通道理解采样滤波器鳃 可见,转移函数r o ( z ) s n r , ( z ) 实际上分别是系统的失真和混叠函数。因此 北京邮电大学博士学位论文 在设计一个双通道完全重构滤波器组中,目标是设计合理的h 。( z ) 和e ( z ) ( k = 0 或1 ) ,使输出为输入的时延。即满足下式: r ( z ) 日。( z ) + ( z ) 日( z ) = z ( 2 - 1 5 、 f 0 ( z ) 日。( - z ) + 曩( z ) 日,( 一z ) 一0 上面的第二个等式( 混叠抵消) 意味着f 0 ( z ) = h 。( - z ) 和f l ( z ) 一- h 。( 一z ) 。可以 证明m “,n 。必为一个奇数,而且多项式p ( z ) = f o ( z ) 爿。( z ) 是一个长度为 。+ n 。一1 的半带宽滤波器“”“。假设p ( z ) 是一个线性相位的半带宽滤波器,则 有o + n 1 4 1 ,f 是正整数。 上面的双通道滤波器组完全重构条件也可以用冲击响应函数h 。( ,1 ) 和 ( n ) ( k = 0 或1 ) 以及多相转移矩阵表示如下“3 : 魄( ,1 ) ,f ( 加一九) 一8 ( m ) 8 ( k z ) ( 2 1 6 ) 脚以加z 1 耘“雕 ( 2 - 1 7 ) 将p ( z ) ,以及f o ( z ) 一h 1 ( 一z ) 和e ( z ) = - h o ( - z ) 带入式( 2 1 4 ) 的第一个等 式,有: j p ( z ) 一e ( - z ) 一z 一 ( 2 1 8 ) 一般来说,设计一个二通道完全重构滤波器组,是一个多目标优化问题,求解起 来难度颇大。“,也可用谱分解技术来实现。谱分解技术可按如下步骤完成“”“1 : ( 1 ) 设计一个满足式( 2 1 8 ) 的低通滤波器p ( z ) ; ( 2 ) 因式分解p ( z ) ,获得日。( z ) 和f o ( z ) ,然后选择满足完全重构条件的 日。( z ) 和e ( z ) 。 具体的实现方法可参考文献 1 4 。 需要指出的是,在双通道完全重构滤波器组场合,除了特殊情况( 如h a a r 小波) ,正交性和线性相位是一对矛盾,即两者不能共存 1 4 6 。因此在应用中, 需权衡利弊,以选择最合适的滤波器组。 第二章滤波器组技术基础 2 2 2 离散二进小波变换 一般来说,研究小波变换可以从框架理论和多分辨率分析的角度进行 t 4 h 6 1 6 1 ;t k ;8 z s 2 0 ,这里,为了深入考察小波变换与滤波器组的内在的联系,我们 主要从多分辨率滤波器组( m u l t i r a t ef i l t e rb a n k s ) 技术角度来研究小波技术。 离散小波变换可通过m 子带多分辨率滤波器组在低频子带层层嵌套来实现, 当m = 2 时,如图2 - 5 所示。 a 正卫卫 日毒窖 ( b ) 图2 - 5 二通道滤波器组迭代实现的小波变换 ( a ) 正向小波变换( b ) 频带划分,( c ) 反向小波变换 上图为一个典型的小波变换,而对于小波包变换,高频子带可以继续分解。 每一个有限次的时间小波分解都对应一个离散时间多分辨率分析,其等效低通滤 波器的频率响应为n 日。f 罟1 。如果低通滤波器满足标准正交条件,且存在 k - i 、 一阶消失矩,即摹【七】* 万1 。那么低通滤波器的频率响应的极限 ! 鳃珥nh 。( 号) 收敛于连续时间函数方( 国) ,其逆傅立叶变换妒( r ) 称为尺度函数 北京邮电大学博士学位论文 潞。尺度函数窥,l 、波涵鼗矿0 ) 之润懿关系霹瓣二足度方程寒联系 n 日n c : 妒。; o 抟弦( 复一的 妒妒;趣刚2 t - k ) ( 2 - 1 9 ) 如果小波滤波器是f i r 系统,那么妒( 印和y ( f ) 是紧支撑的。小波函数的 平移帮律缩移( 2 t 一露k ,。稳成可一i l 2 ( r ) ( 平方可欷) 的紧框架。褥尺度函数 毋( 甜) 的平移张成一个“低遗”空间k ,即受限尺度信母集合“。k 空间的任意 一个连续雾重闫缀数,( ) 懿毒袋示凳露下形式: ,( f ) - v :o 一抖) ( 2 2 0 ) 荬孛上蠡( o ) 袭示在0 足发整阕熬扩震。蠡乏嚣,弼整痔裂椒 究全表示。 给定一个序列桃 ,其在下一维低频予空间k 中的i 匝似可由小波滤波器组的 低通滤波器来窭现: v :m h o ) l2 ) i n 】 ( 2 2 1 ) 其中:“木”表示卷积算子,“i2 ”表示2 间隔下采样。 题理,序列键 在下一维鬻频子空趣磁( 根据多分辨率分辑,有毪。粥o k ) 中的细节可用对应的高通滤波器来实现。 小波滤波器组是双通道兜全重构滤波器组,因此,它满足一般双通道完全重 构滤波器组的梭质。铡如,除了h a a r ,j 、波,没有其稳小波滤波器缎阕靖满足芷 交链耧线性福骰的性质。霞魏,在应焉串,需辗据实酥情况权衡选铎。戮蟊前为 炽,正交小波农应用中并没材什么特别的优势”1 。双正交小波由于在计算和边界 恢复方面的优势,在图像编粥中获得了广泛的应用。”。 羹手璐上戆分辑霉燹,麸羰域戆囊疫番,夸波交换臻当手一组l 等带宽夔滤 波器组,如图2 - 5 ( b ) 所示。 一般来说,小波滤波器的构造需要高深的数学理论熬础和很高的技巧。因此, 在编码器设计中,设计人员只戆是稳用有敝的可以德到的小波滤波嚣,优化设计 小波基来提离缡褥器匏效率。当然,经过学者稻静不断努力,在小波鹣工程应藤 方筒,已经获得了许多有意的成果。例如,王国秋教授程其关于“超小波”的研 究报告。”中提出利用小波滤波器系数循环矩阵、消失矩和正交( 或双正交) 性来 第二章滤波器组技术基础 构造小波滤波器的方法,大大简化了小波滤波器的设计问题,并在正交性程度的 意义上优化选择小波滤波器。虽然“超小波理论”的完备性还有待证明,同时, 基于正交性的优化选择并不一定能得到最优的滤波器设计,但“超小波”方法不 失为小波理论及其应用一个有意义的探索。 正如王国秋教授在其关于“超小波”的论文”中所说的,“没有人认为小波 理论已经发展到了成熟的地步,也没有人认为小波理论很容易研究”,小波的研 究和应用依然有许多需要解决的问题。 其实问题还不止于此,小波作为一种特殊的滤波器,在信源编码中,是否有 其局限性,还不得而知。即使在小波应用最成熟的静止图象压缩领域,t d t r a n 等人已经证明了有性能更好的滤波器组的事实”1 。 2 2 3 多通道滤波器组 从滤波器组的角度,离散傅立叶变换( t h ed i s c r e t ef o u r i e rt r a n s f o r m , d f t ) 、离散余弦变换( t h ed i s c r e t ec o s i n et r a n s f o r m ,d c t ) ,重叠正交变换 ( t h el a p p e do r t h o g o n a lt r a n s f o r m ,l o t ) 1 ,以及广义重叠正交变换( t h e g e n e r a l i z e dv e r s i o nl a p p e do r t h o g o n a lt r a n s f o r m ,g e n l o t ) ”“”其实都可 看作等带宽的滤波器组。而且,多小波滤波器组也是一种特殊的多通道滤波器组。 这里,我们需要介绍m 通道滤波器组理论( m 2 ) 。 相对于双通道滤波器组而言,在相同的延时下,多通道滤波器组可以提供更 高的频域分辨率和频带区分性能。而且,由于引进了更多的自由度,多通道滤波 器组为在处理不同信号的情况下选择更有效的滤波器提供了更多的手段。在 2 - 2 - i 小节我们曾经指出,在双通道滤波器组中,除了h a a r 滤波器外,正交性 和线性相位是不可能同时得到的。但是,在多通道滤波器组中,这一矛盾将不再 存在。例如,d c t 和l o t 同时满足了正交性和线性相位的性质“”1 。 2 2 3 。1 完全重构的多通道滤波器组 我们曾在2 - i 节中从多相形式的角度分析了多通道滤波器组的完全重构条 件,并在2 - 2 1 小节中解释了双通道滤波器组的完全重构问题和解决办法。然而, 在实际的构造多通道滤波器组时,却不象设计双通道滤波器组那样简单。 给定一组m 通道滤波器组,定义w 。e - i 2 “”,可的重构信号雪( z ) “: j ( z ) 。吉荟z ( z w t ) 蔷风( z 。) e ( z ) ( 2 - 2 2 ) 北京邮电大学博士学位论文 和式( 2 1 3 ) 一样,我们用失真函数r o ( z ) 和混叠函数正( z ) 1 szs m 一1 来 重写上式如下: j ( z ) = 吉x ( z ) m 磊- 1 h 如皿( z ) + 吉蓦z ( z 勺m 荟- 1 e 。,) e ( 引。一:。, = t o ( z ) z ( z ) + 五( z ) x ( z w 其中 喇2 吉荟风( z ) 喇( 2 - 2 4 ) 荆。吉荟峨( z w 。) 喇,l l m - i ( 2 - 2 5 ) 可见,谱分解已经变的很困难。而且,很难确定如何选择h ,( z ) 和只( z ) ,以完全 消除混叠失真( 使混叠函数l ( z ) 一0 ,1 fs m 一1 ) 和使失真函数瓦( z ) 为一纯 延时z 。由于引进了更多的自由度,多通道滤波器组的设计将比双通道滤波器 组的设计更为复杂。现在已经发现了几种设计方法,如格型结构参数法、时域优 化和余弦调制等技术,由于篇幅所限,不做太多介绍。 2 2 3 2 离散余弦变换( d c t ) 从统计学的观点看,k - l 变换是能量聚集性能最好的酉变换“2 “,然而k l 变换是依赖于信号的,所以计算量非常大。a h m e d 、n a t a r a j a n 和r a o 等人在1 9 7 4 年提出的离散余弦变换是对一阶正态分布马尔可夫过程在相关系数接近1 时的 k - l 变换的近似伽。 目前,由于我国学者王中德的工作啪,离散余弦变换已经拓展到8 种之多。 这里,我们只列出经常使用的四种基向量。这里j 和k 都是从0 到n - 1 ,则第k 个基向量的第j 个元素为: d c t - 1 :c o s 七土( 当j 或k 为0 或n - 1 时,要除以2 ) 。n 一1 。 d c t 一2 :c 。s ( ,+ 1 七万z ( 当k 为。时,要除以j ) d c t _ 3 c 。s i ( k + 言) 吾 ( 当j 为。时,要除以压) d c t _ 4 c 。s ( ,+ 争( 七+ 互1 百z 第二章滤波器组技术基础 从滤波器的观点看,d c t 变换是一种最基本的m 通道的线性相位正交滤波器 组。例如,第二种d c t 变换( d c t 一2 ) 的频率响应和冲击响应如图2 - 6 所示。从 图中可以看到,低频部分被强调,这是比较符合人的视觉感知特性的。 赫l 图2 - 6 离散余弦变换( d c - q - 2 ) 的频率响应和冲击响应 2 2 3 3 块重叠正交变换和广义块重叠正交变换 由于余弦变换的基函数是不重叠的,因此每个变换块( 如j p e g ) 的变换是彼 此独立的,从信源编码的角度看,这将影响块间相关性的消除:而且,由于在编 码中引进了量化噪声,将导致块问在边界处的不连续性,即产生“块效应”问题 。”“1 。正是由于这一问题,才推动了块重叠变换的产生和发展。l o t 和g e n l o t 就 是利用重叠技术对d c t 的改进,当滤波器长度l 等于通道数的两倍时,为l o t 变 换,大于两倍时,即为g e n l o t 变换。其频率响应和冲击响应分别如图2 - 7 和2 - 8 所示。从频率响应看,两者性能均较d c t 有了很大的改善,而且,随着重叠的增 加,改善越明显。 图2 7l o t 的频率响应和冲击响应图2 - 8 8 通道冲击响应长度为4 0 的 g e n l o t 的频率响应和冲击响应 理论上,重叠变换的性能优于d c t 的原因在于: j 京邮电大学博士学位论文 ( 1 ) 从分析的角度来说,通过究分利用块间符号相关性,提高了能量的聚集 性能。 ( 2 ) 歇合成的焦度来说,重叠变换翦基函数凌途奏灏进蟪熬予零,钛恧蠢效 的消除了“块效应”。 下一章我们将根据炔重叠变换的思想,拓展传统的小波变换,讨论块重黢小 波变换技术,以克服在浆用小波变换技术对信源数据进行分块编码时产生的块效 应运逶。 2 2 3 4 余弦调制滤波器组 在实繇编码器设计巾,余弦调制滤波器组获褥广泛使用。并且,由予成糟场 合、研究方法和理解角度不同,某些余弦调制滤波器组被称为t d a c ( t i m ed o m a i n a 1 i a s i n gc a n c e l l a t i o n ) 、修正离散余弦变换( m o d i f i e dd i s c r e t e c o s i n e t r a n s f o r m ,浚下楚穆涵殴) 窝m l t ( m o d u l a t e dl a p p e dt r a n s f o r m ) 等技术。 余弦调制滤波器组的优点在于计算和设计简单“: ( 1 ) 计算上,分析滤波器组的执行效率等于一个滤波器滤波加上滤波调制的效 率,最分辑和综会滤波器缓懿技孬效率穗阁。 ( 2 ) 设计上,因为炎须优化原型滤波器,因就调制滤波器缀鹣设计优化参数个 数很少。 一般的,余弦调制滤波器缎包括伪q m f 滤波器缝和p r ( p e r f e c t r e e o n s t r u c t i o n ) 余弦满翱滤波器筑。 伪q m p 滤波器组是j 绽似p r ( 或a p p r o x i m a t er e c o n s t r u c t i o n ) 系统。对于伪 q m f 滤波器组,分析和综合滤波器。( = ) 和e ( z ) 的混叠抵消只是相对于两个相 貉子带嚣蠢戆,嚣诧,系统转递丞数哭是一个逶纭豹辩延。 p r 余弦调制滤波嚣缀不仅保持了伪q m f 滤波器缀计算和设计简单的优点,还 有完全重构( p e r f e c tr e c o n s t r u c t i o n ,简称p r ) 的性能。 关予伪溯f 滤波器缀翻p r 余弦诞篱l 滤波器维技零,我霞】将农第霆章孛避行详 细的讨论。 2 。2 3 。s 多通道小波滤波器 利用多源道滤波器技术,可以推广传统的双通道小波到多瀛道小波。和本节 开始的论述一样,多通邋的引入,同样调和了正交性和线性相位之间的矛盾,同 时蠢效鲍减弱了由于双逶遴夺波憨

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论