(检测技术与自动化装置专业论文)高性能cabac解码器vlsi设计与实现.pdf_第1页
(检测技术与自动化装置专业论文)高性能cabac解码器vlsi设计与实现.pdf_第2页
(检测技术与自动化装置专业论文)高性能cabac解码器vlsi设计与实现.pdf_第3页
(检测技术与自动化装置专业论文)高性能cabac解码器vlsi设计与实现.pdf_第4页
(检测技术与自动化装置专业论文)高性能cabac解码器vlsi设计与实现.pdf_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高性能c a b a c 解码器v l s i 设计与实现 摘要 基于上下文自适应二进制算术编码( c o n t e x t b a s e da d a p t i v eb i n a r v a r i t h m e t i cc o d i n g ,c a b a c ) 是h 2 6 4 a v c 两种可选的熵编码方案之一。相对于 另一种熵编码上下文自适应变长编码( c o n t e x t b a s e da d a p t i v ev a r i a b l e l e n g t hc o d i n g ,c a v l c ) ,c a b a c 具有更高的编码效率:在相同画面质量下, c a b a c 比c a v l c 压缩效率提高1 0 1 5 。另一方面,c a b a c 压缩效率的提 高是以高复杂性为代价,若用软件进行实时解码,需要c p u 具备较高的运行频 率,动辄上g 。因此,c a b a c 多以硬件加速来实现。但是,由于c a b a c 算法 复杂,依存度较高,实现高效的c a b a c 硬件解码器需要克服许多挑战。 本文研究了c a b a c 解码器原型芯片的设计与实现方法,主要贡献如下: ( 1 ) 优化c a b a c 解码器电路面积。根据分析c a b a c 解码流程,提出一种新型 上下文索引生成电路,将非残差部分的上下文增量单独设置成一个表,而 上下文索引偏移量大部分是由逻辑电路生成,上下文索引查找表缩小到 7 6 8 b i t s ,大大减小了查找表面积。 ( 2 ) 优化c a b a c 解码速率。利用电路冗余结构和电路并行性特点,将上下文 索引生成模块和上下文模型存储器分别拆分成两个部分,并将概率存储器 复制一份,使部分语法元素的解码能够实现流水操作,减少了流水暂停概 率,提高了解码速率。利用旁路解码的特点进行旁路加速解码,在必要的 时候能够每个周期解码2 个旁路位或者一个规则位和一个旁路位,从而进 一步提高解码器的解码速率。采用简洁的首一检测逻辑电路达到一个周期 完成归一化目的。采用单一桶式移位寄存器达到连续读取变长码流功能。 用标准测试码流对其进行软件仿真,仿真结果显示c a b a c 解码速度达到 1 7 5 c y c l e b i t 。用一个常规c a b a c 解码器( 采用单一的上下文指针生成电 路,无流水) 与优化后的解码器在性能和面积上做比较。结果显示所提构 架在面积增加9 3 的情况下得到2 倍的解码速度。 ( 3 ) 设计实现c a b a c 解码器原型芯片。在f p g a 上设计实现了c a b a c 解码器 原型芯片,采用v e r i l o g 语言对所提构架进行硬件实现,用e d a 软件对其 进行仿真,在f p g a 上验证其功能,用e d a 综合工具对其进行逻辑综合。 本解码器被并整合到一个完整的h 2 6 4 解码器中,并在f p g a 原型上进行 设计实现。实验结果表明,解码器最大频率达1 0 0 m h z ,平均解码速率达 1 7 5c y c l e b i n ,能够满足h d l 0 8 0 i 格式的视频的实时解码要求。在o 2 5 微米工艺下设计实现了v l s i 芯片。本解码器综合后面积为16 16 6 6 7 5 u m z , 最高运行频率达到1 6 6 7 m h z ,当时钟为1 0 0 m 时动态功耗为2 3 8 9 8 7 m w , 静态功耗为7 3 8 5 4 9 7 m w 。 关键词:h 2 6 4 a v c ;c a b a c :解码器;v l s i ;冗余结构 v l s id e s i g na n di m p l e m e n t a t i o no f c a b a cd e c o d e r a b s t r a c t h i g hp e r f o r m a n c e c o n t e x t - b a s e da d a p t i v eb i n a r ya r i t h m e t i cc o d i n g ( c a b a c ) i s o n eo ft h eh 2 6 4 a v c e n t r o p yc o d i n gs t y l e s c o m p a r e dt oo t h e re n t r o p yc o d i n gs t y l e ss u c ha st h eo n t e x t b a s e d a d a p t i v ev a r i a b l el e n g t hc o d i n g ( c a v l c ) ,c a b a ch a sh i g h e rc o d i n ge f f i c i e n c y i th a s m o r et h a n10 t o15 c o m p r e s s i o ne f f i c i e n c yi m p r o v e m e n tu n d e rt h es a m ep i c t u r eq u a l i t y b u tt h ec a b a ch a sm o r ec o m p l e xh a r d w a r ea r c h i t e c h e rb e c a u s eo fi t s a l g o r i t h m c o m p l e x i t y i fw eu s es o f t w a r et om a k er e a l - t i m ed e c o d i n g ,t h ec p u o p e r a t i n gf r e q u e n c y m u s tb en e e dt oa r c h i e v et h eg sd e g r e e ,s oh a r d w a r ed e s i g ni su s e dt o s p e e du pt l l e d e c o d i n g h o w e v e r , c o n g s i d e r i n gt h eh i g hc a b a ca l g o r i t h mc o m p l e x i t ya n dt h eh i g h d e g r e eo fd e p e n d e n c e ,t oi m p l e m e n ta ne f f i c i e n tc a b a cd e c o d e ri nh a r d w a r es h o u l eb e n e e dt oo v e r c o m em a n y c h a l l e n g e s t h i sp a p e rf o c u s e do nc a b a cd e c o d e rp r o t o t y p ec h i pd e s i g na n di m p l e m e n t a t i o n t h em a j o rt a s k so ft h i sp a p e ra r ea sf o l l o w s : ( 1 ) c a b a cd e c o d e rc i r c u i ta r e ah a sb e e no p t i m i z e d an e wc o n t e x ti n d e xg e n e r a t o r c i r c u i t sh a v eb e e np r o p o s e d ,n o n - r e s i d u a lp a r to ft h ec o n t e x ti n c r e m e n t a lw a ss e tt oa s i n g l et a b l e ,w h i l et h em a j o r i t yo ft h ec o n t e x to f f s e ti n d e x e sw e r eg e n e r a t e db yt h e l o g i cc i r c u i t t h ea r e ao ft h ec o n t e x ti n d e xl o o k u pt a b l ea r er e d u c e dt o7 6 8 b i t s g r e a t l yr e d u c e dt h el o o k u pt a b l ea r e a ( 2 ) c a b a cd e c o d i n gr a t eh a sb e e no p t i m i z e d b yu s i n gt h er e d u n d a n tc i r c u i t sa n d p a r a l l e lc i r c u i t s ,c o n t e x ti n d e xg e n e r a t o rm o d u l ea n dt h ec o n t e x tm o d e lm e m o 巧w e r e s p l i t e di n t ot w op a r t s a st h es a m et i m e ,t h ep r o b a b i l i t ym e m o r yh a sb e e nd u p l i c a t e d s op a r to ft h ed e c o d i n gp r o c e s sf o rs y n t a xe l e m e n t sc a na c h i e v ep i p e l i n eo p e r a t i o n s , w h i c hc a nr e d u c et h ep r o b a b i l i t yo fp i p e l i n es u s p e n s i o nt oi m p r o v et h ed e c o d i n g s p e e d b y p a s sd e c o d i n gh a sb e e nu s e dt oa c c e l e r a t et h ed e c o d i n g t h ed e c o d e rc a n d e c o d e2b y p a s sb i t so ro n er e g u l a rb i ta n do n eb y p a s sb i tp e rc y c l ew h e nn e c e s s a r y a s i m p l ef i r s to n ed e t e c t i o nl o g i cc i r c u i th a sb e e nu s e dt oe n a b l et h ep r o c e s sc a nb e c o m p l e t e di no n ec y c l e as i n g l eb a r r e ls h i f tr e g i s t e rh a sb e e nu s e dt oa c h i e v et h e f u n c t i o nt h a tv a r i a b l e l e n g t hc o d es t r e a mc a nb er e a dc o n t i n u o u s l y s i m u l a t i o nr e s u l t s s h o wt h a tc a b a cd e c o d i n gs p e e da c h i e v e s 1 7 5 c y c l e b i t t h i sd e c o d e rw a s c o m p a r e dw i t han o r m a lc a b a cd e c o d e r ( as i n g l eg e n e r a t i o nc i r c u i to fc o n t e x t i n d e xi su s e d ,n op i p e l i n e ) i nd e c o d i n gp e r f o r m a n c ea n da r e a t h er e s u l ts h o w e dt h a t t h em e n t i o n e df r a m e w o r kh a s2t i m e sd e c o d i n gs p e e di m p r o v i n gu n d e rt h e9 3 a r e a i n c r e m e n tc o m p a r et ot h en o r m a ld e c o d e r i i - ( 3 )c a b a cd e c o d e rh a sb e e nd e s i g n e da n di m p l e m e n t e d t h ep r o p o s e dh a r d w a r e f r a m e w o r kw a si m p l e m e n t e dw i 廿lv e r i l o gl a n g u a g e ,s i m u l a t e dw i me d as o f t w a r e , v a r i c a t e di nt h ef p g a s y n t h e s i z e dw i t he d as y n t h e s i st 0 0 1 t h ed e c o d e rh a sb e e n i n t e g r a t e di n t o t h eh 2 6 4 d e c o d e r , a n di m p l e m e n t e do nf p g ap r o t o t y p e 1 1 1 e m a x i m u mf r e q u e n c yo ft h ed e c o d e ri sio o m h z n ea v e r a g ed e c o d i n gr a t ei s1 7 5 c y c l e | b i n ,w h i c hh a sm e th d 10 8 0 if o r m a tv i d e or e a l t i m ed e c o d i n gr e q u i r e m e n t 1 1 1 ed e c o d e ri m p l e m e n t e di na0 2 5 一u r ns i l i c o nt e c h n o l o g y , t h ea r e ai s1 , 616 ,6 6 7 5 u m 2 ,a n dt h em a x i m u mf r e q u e n c yi s16 6 7 m h z 1 1 1 e :d y n a m i cp o w e rc o n s u m p t i o ni s 2 3 8 9 8 7m w ,a n dt h es t a t i cp o w e rc o n s u m p t i o ni s7 3 8 5 4 9 7n w ,w h e nt h ec l o c k f r e q u e n c yi s10 0 m h z k e yw o r d s :h 2 6 4 a v c :c a b a c ;d e c o d e r ;v l s i ;r e d u n d a n c ys t r u c t u r e i i i - - 插图清单 图l - 1 视频编码标准发展历程图。l 图1 2h 2 6 4 编码结构1 图1 - 3 h 2 6 4 解码器结构2 图2 1 算术编码示意图7 图2 2 哈夫曼编码示意图8 图2 3c a b a c 概率估计与刷新模型【4 】1 0 图2 4c a b a c 编码模型1 1 图2 5 常规编码过程流程图1 2 图2 - 6c a b a c 编码归一化流程图1 2 图2 7c a b a c 常规解码模式解码单个语法元素流程图13 图2 。8 语法元素上下文模型分配示意图1 4 图2 - 9 常规解码过程流程图1 6 图2 1 0 旁路解码过程流程图1 7 图2 1 l结束解码过程流程图1 7 图2 1 2 解码归一化流程图1 8 图3 1c a b a c 解码器总体结构框架2 2 图3 2c a b a c 解码流程2 3 图3 3冗余结果c a b a c 解码流程2 4 图3 4c a b a c 语法元素结构框图2 4 图3 5c a b a c 语法元素的解码顺序图2 6 图3 6 主控状态机状态转移图2 7 图3 7 宏块预测状态转移图2 9 图3 8 子宏块预测状态转移图3 1 图3 - 9 宏块残差解码状态机状态转移图3 2 图3 10 宏块中小块扫描顺序3 3 图3 h小块残差解码状态机状态转换图3 4 图3 1 2 小块残差z i g扫描顺序图35_zag 图3 1 3 码流读取模块电路结构图3 6 图3 1 4 上下文索引查找表3 8 图3 1 5 上下文索引生成模块电路结构3 9 图3 1 6常规的运动矢量残差上下文信息推导过程3 9 图3 1 7改进的运动矢量残差上下文信息推导过程4 0 图3 18 相邻宏块存储器4 0 图3 。1 9 概率模型及状态转移存储器组织4 1 图3 2 0 解码器# o 4 2 图3 2 1解码器# 1 4 2 图3 2 2 上下文模型更新电路示意图4 2 图3 2 3首1 检测电路示意图4 3 图3 2 4 反二进制化模块电路结构示意图4 3 图4 1a s i c 设计流程4 4 图4 2h 2 6 4 视频处理要求4 5 图4 3c a b a c 解码器仿真验证流程图4 8 图4 4 h 2 6 4f p g a 验证平台4 9 图4 5 码流读取模块仿真波形图5 0 图4 - 6 上下文模型产生模块仿真波形图5 0 图4 7 二进制解码模块仿真波形图51 图4 8 反二进制化模块仿真波形图5 1 图4 - 9c a b a c 解码器总体仿真波形图5 2 图4 1 0h 2 6 4 解码器f p g a 原型验证结果5 2 图4 1 lf p g a 综合结果5 3 图4 1 2d c 综合面积报告5 5 图4 1 3d c 综合时序报告。5 5 图4 1 4d c 综合功耗分析报告。5 5 图4 1 5 解码速率对比5 6 图4 16 无冗余结构c a b a c 解码器d c 综合面积报告5 7 表格清单 表2 1 字符概率表7 表2 2 上下文模型初始化伪码1 4 表2 3部分语法元素偏移地址索引表15 表2 4部分语法元素上下文索引增量查找表1 5 表2 5 r a n g e t a b l p s 15 表2 - 6 状态转移表17 表2 7 一元( u ) 二值化1 8 表2 8 舍位一元( t u ) 二值化19 表3 1子宏块预测层解码语法元素2 5 表3 2 宏块预测层解码语法元素2 5 表3 3 残差层解码语法元素2 5 表4 1d c 工作环境设置脚本5 4 表4 _ 2d c 读入工程文件脚本5 4 表4 3 环境类约束设置脚本5 4 表4 4 时钟类约束设置脚本5 4 表4 5设计规则类约束设置脚本5 4 表4 - 6 采用本结构解码器的性能提高5 6 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。 据我所知,除了文中特别加以标志和致谢的地方外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得金胆王些太堂或其他教育机构的学位或证书而使 用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意。 学位论文作者签字:古a 牙献签字日期:2 ,p 年丫月心e l 学位论文版权使用授权书 本学位论文作者完全了解 金魍王些太堂 有关保留、使用学位论文的规定,有权 保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅或借阅。本人 授权金胆王些太堂可以将学位论文的全部或部分论文内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文者签名:相a 亏掇 签字日期:b p 年l 卜月1 2 - 日 学位论文作者毕业后去向: 工作单位: 通讯地址: 导师签名: 签字日期:2 爿口年丫月1 2 - 日 电话: 邮编: 致谢 首先感谢我的导师高明伦教授。在二年多的时间里,高老师在学习和生活 上都给了我们无微不至的关怀。高老师不仅学识渊博,治学严谨,而且待人诚 恳,平易近人,对学生的谆谆教诲深深地记在我的心中。能成为高老师的学生 是我一生的骄傲,高老师是我永远学习的榜样。 感谢张多利老师,杜高明老师,宋宇鲲老师,耿罗锋博士在我日常学习、 项目实践和论文写作中给予的巨大帮助。感谢杜高明老师对我论文的耐心修改、 指导和帮助。感谢尹勇生老师,邓红辉老师,王晓蕾老师,胡永华老师,王锐 老师,刘聪老师,倪伟老师以及电气学院的所有老师在课程上的指导,使我受 益匪浅。感谢林微老师,贾靖华老师对我的关心和热情帮助。 感谢马亮、杜福慧、王白露、翟元杰、张云、付强、候宁、沈健等师兄师 姐在学习和工作上给予我的帮助。 感谢程贤文、吴腊狗、于亚轩、覃春平、黄俊俏、陈迎春、肖福明、刘艳、 温海华与我的长期合作和对我的帮助。感谢崔磊、杨俊、邓亮、张郭敏、何莹 莹、邓惠娟、果鹏、苏琴、关皓伟、颜哲、朱永强等同学在学习和生活中对我 的帮助,有了你们,才使得研究生生活更精彩。 感谢王传杰、张静、郑勇、李宝川、李桦林、朱玉龙、戚斌、夏云同学在 论文校正工作中提出的宝贵意见和修改建议。 感谢范阿姨、胡剑、木子一在实验室日常事务中的辛勤劳动。 最后,感谢我的家人所给予我学业和生活上的关心、帮助和支持。 作者:胡学权 2 0 10 年4 月 第一章:绪论 1 1 视频编码标准的发展 从电视信号的数字化开始,图像数字编码已经有很长的的历史。如今,图 像编码技术在理论研究和实际应用中都取得了长足的进步,尤其是最近1 0 年, 图像编码技术得到了迅猛发展和应用,并越来越成熟。国际组织多项关于图像 编码技术标准的制定是图像编码技术发展的里程碑。国际标准化组织( i s o ) 和国际电工委员会( i e c ) 分别对静止图像和活动图像制定了标准。制定的静 止图像的标准为j p e g j p e g 2 0 0 0 ,目前大量应用于静止图像的存储。制定的活 动图像的编码标准有m p e g 1 、m p e g 2 、m p e g 4 ( 2 ) 、m p e g 一4 ( 1 0 ) 【i 】等。 另外国际电信联盟( i t u ) 制定了关于图像的视频编码标准h 2 6 x 系列。这些标 准融合了各种图形编码技术,代表了图像编码技术的发展水平。图1 1 为视频 标准的发展情况。l 2 j i t u v 【l e u h 2 6 l ( f 1 ) | i ,| 1 i h i2 6 3 ) 1 9 l 5 9 6 ( 1 9 9 7 9 8 ) l ( 2 弼0 0 0 ;l ( 1 9 9 0 ) f腰e g 2 上 _ 呻s 嬲h 2 6 4 , h 2 6 2 ) _ - (9 9 4 9 5 ) 量p e 0 - 4v l m p e o 1 ( 1 i s 01 e c( 1 9 9 3 ) _ 3 一刁 m te g 芳 1 9 9 0l1 总体结构 图视频编码标准发展历程图 图 编码结构【3 l 图1 2 为h 编码结构【3 1 。编码工作流程如下: 一:如果是帧内帧,原始图像首先进行帧内预测模式判别。选出最佳预测 模式后将原始值减去预测值进行变换,量化,重排序,熵编码并最终经 打包输出。其中熵编码包括c a b a c ( c o n t e x t b a s e da d a p t i v eb i n a r ya r i t h m e t i c c o d i n g ) 和c a v l c ( c o n t e x t b a s e da d a p t i v ev a r i a b l el e n g t hc o d i n g ) 。 为了使解码与编码一致,编码的参考帧需要用到解码后重建的参考帧。所 以量化后的残差需要进行反量化,反变换,并与预测值相加后滤波重建图像, 得到新的参考帧,以便在编码帧间图像时使用。 二:如果是帧间帧,原始图像在做帧内预测的同时要对当前宏块进行运动 估计和残差计算。帧内预测和帧间预测都做好后比较两个残差结果,取残差数 据小的预测方式作为最终预测方式。进而对残差进行变换,量化,重排序和熵 编码,后面的步骤和帧内预测相同。 可以发现,h 2 6 4 编码器中包含解码器的功能。 h 2 6 4 解码器结构如图1 3 t 列 图1 - 3h 2 6 4 解码器结构【3 l 解码的过程几乎是编码的逆过程,数据首先进行n a l 单元解包,熵解码, 反扫描排序,反量化,反变换。如果是帧内宏块,则进行帧内预测和数据恢复, 如果是帧间宏块,则进行运动补偿和数据恢复,最终数据进行滤波,重建图像 并输出显示。 h 2 6 4 与以往技术不同之处主要体现在以下几方面。 1 帧内预测 h 2 6 4 在变换前进行了一次数值预测,即根据上边宏块和左边宏块的数据预 测当前宏块数据。预测后的数据和真实值相减得到残差,然后再进一步进行变 换和量化。 2 帧间预测 帧间预测主要采用运动估计的方式,找到相邻帧与本宏块数据差值最小的宏 块的位置,然后对这个差值作进一步处理。h 2 6 4 将亮度的运动矢量精确到1 4 像素,色度的运动矢量精确到1 8 像素,进一步减小运动估计后的残差。 3 整数变换 h 2 6 4 把帧内预测和帧间预测的残差结果再进行一次时频变换,使用了与 4 x 4 离散余弦变换类似的整数变换,而不像m p e g 2 4 那样使用的的浮点数变 换1 2 1 。整数变换的好处是只有加法和位移,从而大大增加了变换的速度,同时 反变换能完全复原原始数据。同时整数变换结合量化,保证了整个计算值都在 1 6 位精度之内。另外,变化块大小从8 x 8 变为4 x 4 ,能够减小块效应和震铃效 应【2 1 。 4 量化 以往的标准也采用量化的原理来进行压缩编码,但h 2 6 4 采用了无扩展的 分级量化进行量化,其基本公式为:z = r o u n d ( 毒一) ,其中z 为量化值,y 为输 q s i e p 入系数,q s t e p 为量化步长f 2 1 。 5 熵编码 h 2 6 4 采用了两种熵编码方式。即基于上下文的自适应变长编码方式 c a v l c 和基于上下文的自适应算术编码c a b a c ,其中c a v l c 对每个小块的 游程和幅值单独进行编码。同时,h 2 6 4 将上下文引入变长编码,提高了编码 效率。 另外,h 2 6 4 引入算术编码并对其改进,作为熵编码两种可选方式之一。 h 2 6 4 将上下文自适应概念与算术编码相结合,大量引入上下文内容,使得码 字的概率更容易接近真实概率,因而取得了比c a v l c 更好的编码效率【2 】。同时, 由于c a b a c 实现较为复杂,所以h 。2 6 4 的熵编码采用c a v l c 和c a b a c 两中 熵编码可选的方式。 6 新的图像片类型 h 2 6 4 除了支持i ,p ,b 片外还支持s i ( s w i t c h i n gi ) 和s p ( s w i t c h i n gp ) 片,用于在码流之前快速切换。 7 分层的算法结构 h 2 6 4 在总体上分为2 个层:网络适配层n a l ( n e t w o r ka b s t r a c t i o n l a y e r ) 和视频编码层v l c ( v i d e oc o d i n gl a y e r ) 2 1 。其中视频编码层负责视频数据的 压缩,其设计目标是提高编码效率【2 1 。而网络适配层负责视频编码数据在不同 网络上打包传输,其目标是提高视频服务质量和网络传输的适配1 2 1 。 1 3c a b a c 国内外研究动态及本文工作点 自适应二进制算术编码( c a b a c ) 是h 2 6 4 标准规定的两种熵编码之一, 采用二进制算术编码和基于上下文的概率模型两种技术,比c a v l c 减少1 5 的 编码数据m c a b a c 由于其运算复杂及频繁访问存储设备,导致其解码器的解码效率很 低。目前市场上的h 2 6 4 a v c 解码器的实现主要用串行的d s p 实现,而在d s p 解 出一个单独的c a b a c 解码的符号位平均需要3 0 4 0 个时钟周期【5 j 。显然,对于较 高档次的数字视频通讯,如高清数字电视传输,这种方案满足不了视频实时解 码要求。而采用a s i c 或f p g a 来实现,可以灵活地安排库单元或逻辑单元形成 并行结构。如果能设计出一种高效的硬件结构,则可以大大减少c a b a c 解码所 需时钟,因而可被应用于实时通讯的c a b a c 解码器设计上。同样由于c a b a c 算法复杂,导致在硬件实现时很难提高运行频率;且每解一个单独的位( b i t ) 要超过4 个时钟周期,如果不进行优化,很难满足实时通讯的要求。因此,设计 一个高效的c a b a c 解码电路面临很多挑战。 国内外关于c a b a c 硬件解码部分的文章很多。文献【6 】提出了一个h 2 6 4 c a b a c 硬件体系结构,但未能与h 2 6 4c a b a c 标准相兼容。文献 7 】将残差系 数解码与其他部分解码分开,前者用一个优化的硬件加速器解码,而后者用软 件解码,这种结构同样体现在文献【8 】中,它使用指针链检索随后位的上下文模 型,并且存储上下文评选的中间结果。文献 9 】采用基于大概率值的预测的方法, 提前预取上下文模型,缩短了解码周期,但它将整个解码周期压缩成2 个周期, 大大增加了关键路径的延时,如果不使用很高的工艺,将使整个c a b a c 解码器 关键路径延时大大增加。文献【1 0 】、 1 1 】提出在同一周期能解多个位的方案。其 中文献 10 】在一个周期能同时解2 个规则位和一个旁路位,文献 11 】最多同时能 解16 位。但这以牺牲硬件为代价,同时将产生一个长关键路径。文献【1 2 】提出 一个高效有限状态机来控制解码,解码速率为2 3c y c l e b i t 。文献【1 3 】对上下 文模型存储器进行了优化。文献 1 4 】提出一个拥有二个状态有暂停的流水结构, 解码速率得到3 9 3 c y c l e b i t 。 本文提出一种新型硬件构架,采用部分电路冗余结构并利用电路的并行运 算以减少流水被打断的概率。具体做法是将上下文索引生成模块和上下文模型 存储器拆分成2 个部分,同时将概率模型查找表复制一份,利用先前的解码位选 择当前的概率模型,以减少解码等待时间。此外本文还对上下文索引( e t x i d x ) 生成电路进行了优化,地址生成采用逻辑生成与查找表结合的方法,大大减小 了上下文索引生成电路的查找表面积。对上下文查找步骤做出改进,减小上下 文索引生成电路延时。另外利用旁路解码的特点进行旁路加速解码,在必要的 时候能够每个周期解码2 位旁路位或者一个规则位和一个旁路位,从而提高解码 器的解码速率。 对于控制状态机,采用分级的方法达到减小跳转延时的目的。对于变长码 流读取,采用单一桶式移位寄存器达到连续读取变长码流功能。对于相邻宏块 存储器,采用活动窗的组织方式减小存储面积。对于上下文模型存储器更新, 采用有选择的更新来减小更新频率,以达到减小电路功耗的目的。对于解码区 间归一化,采用简洁的首一检测逻辑电路达到一个周期完成归一化目的。 1 4 本文章节安排 本文总共分为5 章,其内容和结构如下 第一章首先介绍视频编码标准的发展历史。对两大国际组织发行的视频 标准做简要的介绍,之后对最新的视频标准h 2 6 4 做系统的介绍和技术分析。介 绍和分析国内外关于c a b a c 研究的最新动态以及本文工作创新点。 第二章首选从介绍算术编码和变长编码原理开始,比较两种编码方法的 优缺点,阐明了h 2 6 4 为什么采用算术编码。然后再介绍自适应上下文二进制算 术编码原理以及h 2 6 4 对其进行应用优化的方法,最后详细介绍c a b a c 的解码 流程。 第三章在对c a b a c 原理和流程分析,以及对c a b a c 解码细节分析的基 础上提出c a b a c 总体设计构想,提出c a b a c 的总体框架。之后简要介绍总体 框架中各模块的功能以及电路总体工作流程,进而详细介绍c a b a c 解码器状态 机流程图,并对c a b a c 中码流读取模块、上下文模型产生模块、概率模型产生 及状态转移模块、二进制解码模块、反二进制化模块做详细介绍。 第四章讨论c a b a c 解码器的v l s i 设计实现过程。并分别讨论c a b a c 解 码器的仿真,验证和综合。最后对采用冗余结构的c a b a c 解码器和未采用冗余 结构的解码器进行性能上比较。 第五章对本文工作进行总结,并对以后的工作进行展望。 第二章c a b a c 原理及其在h 2 6 4 标准中的应用 h 2 6 4 采用了两种编码方法:一种是基于算术编码原理的c a b a c ;另一种 是基于哈夫曼编码原理的c a v l c 。本章首先分别介绍算术编码和哈夫曼编码的 基本原理,比较这两种编码方法的优缺点。然后介绍算术编码在h 2 6 4 中的应 用,从介绍c a b a c 的编码方法,到详细介绍c a b a c 的解码步骤。 2 1算术编码原理以及与变长编码优缺点的比较 2 1 1 算术编码原理 算术编码的基本思想是用0 到1 区间上的一个数来表示一个字符流,它的 本质就是为整个输入流分配一个码字,而不是给输入流中的每个字符分别指定 码字【3 1 。算术编码是通过区间逐次递进的方法来为输入流编码【3 1 。设区间长度 为l ,编码一个字符,新的区间区间范围和长度映射关系如下: l n e w = l 幸z ;厶。= l 宰只; n = i - i r n e w l o , , = r t o w + ( p i ) 牛三; ( 2 一1 ) n = l r n e w h i 劝= r 门p w + l n e w ; 假设码流中总共有4 种字符a b c d ,出现的概率分别为o 2 ,0 4 ,o 2 ,0 2 。 设整个区间长度为l ( 初始为1 ) ,区间范围为r ( 初始为0 1 ) 。编码时将a 映 射到区间范围o 幸l 2 0 * l ,将b 映射到2 0 * l 6 0 * l ,将c 映射到 6 0 * l 8 0 * l ,将d 映射到8 0 * l 一1 0 0 * l 。对一个码流a b b c d 的编码的步 骤如图2 1 : 1 输入码流a ,区间范围r 从( 0 ,1 ) 映射n ( o 0 ,o 2 ) ,同时l 由1 变为o 2 : 2 输入码流b ,区间范围r 从( 0 0 ,0 2 ) 映射n ( o 0 4 ,0 1 2 ) ,同时l 由o 2 变为0 0 8 ; 3 输入码流b ,区间范围r 从( 0 0 4 ,0 1 2 ) 映射n ( o 0 5 6 ,o 0 8 8 ) ,同时l 由0 0 8 变为0 0 3 2 : 4 输入码流c ,区间范围r 从( 0 0 5 6 ,0 0 8 8 ) 映射n ( 0 0 7 5 2 ,0 0 8 1 6 ) ,同 时l 由0 0 3 2 变为0 0 0 6 4 ; 5 输入码流d ,区间范围r 从( o 0 7 5 2 ,0 0 8 1 6 ) 映射到( o 0 8 0 3 2 ,0 0 0 8 1 6 ) , 同时l 由0 0 0 6 4 变为0 0 0 1 2 8 ; 区间映射完成后只要在0 0 8 0 3 2 0 0 816 之间选取一个值就完成了,通常为 减小码字长度选择其中二进制表示最短的一个值。 假设我们取值为o 0 8 1 ,解码过程如下: 1 0 0 8 1 属于a 的区间范围( o ,0 2 ) ,解码输出a ,重新计算解码中间值 d n e w = ( d r l o w ) l n e w = ( 00 8 i 一00 ) 02 = 04 0 5 : 2o4 0 5 属于b 的区间范围( o2 ,06 ) ,解码输出b ,重新解算解码中间值 d n e w = ( d r l o w ) l n e w = ( 04 0 5 - 02 ) 04 = o5 1 2 5 : 3o5 1 2 5 属于b 的区间范围( 02 ,06 ) ,解码输出b ,重新解算解码中问值 d n e w2 ( d r l o w ) l n e w = ( 05 1 2 5 - 02 ) 04 = o 7 8 1 2 5 ; 4 o7 8 1 2 5 属于c 的区间范围( o6 ,o8 ) ,解码输出c ,重新解算解码中问 值 d n e w = ( d r l o w ) l n e w = ( o7 8 1 2 5 - 02 ) 1 02 = 09 0 6 2 5 : 5 o9 0 6 2 5 属于d 的区间范围( o8 ,1o ) ,解码输出d : a bli ) 】c ( h;) 2 凹2 1 算术编码示意图 2 12 哈夫曼编码原理 1 9 5 2 年哈夫曼提出的一种变长编码方法,现在已经成为基本的数据压缩方 法i ”i 。其基本思想是将码流中出现概率大的字符分配较短的码字,将出现概率 小的字符分配较长的码字,从而达到缩短总体输出码流的目的】。图2 - 2 为哈 犬曼编码的一个实例。假设信源中有7 种符号,出现概率如表2 1 所示。 表2 - 1 字符概率表 l 塑圣! - ! ! l11 11 1 1 【! :! ! l ! :! ! l ! :! ! i ! :! ! i 哈夫曼编码步骤如下 1 s l : 1 将输入符号按出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论