已阅读5页,还剩54页未读, 继续免费阅读
(检测技术与自动化装置专业论文)基于dsp的h264帧间预测算法的优化.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北塞窑亟太坐瑟主堂位i 金塞。虫塞揸墨 中文摘要 摘要:随着多媒体技术的迅速发展,视频会议系统,h d t v 等多媒体服务逐渐成 为人们关注的热点由其带来的信息爆炸,使信道带宽和信道传输速率成为多媒 体技术发展的瓶颈问题。删t 和m p e g 联合组成的j y i ( j o i n tv i d e oe x p e r t t e a m ) 于2 0 0 3 年3 月正式发布了视频压缩编码标准h 2 6 4 。h 2 6 4 可以实现高品 质、低比特率的编码效果,达到很高的编码效率。但是h 2 6 4 的高压缩率是以计 算复杂度的提高为代价的,所以在实际应用中必须对其进行优化。 本文对h 2 6 4 的各个关键技术包括预测编码、变换与量化、熵编码、去块 效应滤波器进行了分析,尤其对标准中最为耗时的帧间预测算法进行了详细的探 讨。在充分研究了h 2 6 4 测试软件t 2 6 4 的基础上,详细分析了其中的帧间预测算 法的实现过程。开发了一款视频压缩系统的硬件平台,对此平台上存在的信号完 整性问题给出了解决方案。最后在开发的硬件平台上对h 2 6 4 的测试软件t 2 6 4 进 行了优化,包括代码级的优化和存储器级的优化,最终的优化结果可以满足q c i f 大小图像的实时编码要求。 关键词:视频压缩编码;h 2 6 4 视频压缩标准;帧间预测算法;d s p ;优化 分类号:n 姻1 9 8 1 a b s t r a c t :w i t ht h ef a s td e v e l o p m e n to fm u l t i m e d i at e c h n o l o g y , m u l t i m e d i a s e r v i c e ss u c ha sv i d e oc o n f e r e n c es y s t e ma n dh d t vg r a d u a l l yb e c o m et h ef o c u so f a t t e n t i o n t h ei n f o r m a t i o ne x p l o s i o nh a sm a d et h et r a n s m i s s i o nr a t ea n dc h a n n e l b a n d w i d t hb e c o m eb o t t l e n e c k si nt h ed e v e l o p m e n to fm u l t i m e d i at e c h n o l o g y h 2 6 4i s t h el a t e s tv i d e oc o d i n gs t a n d a r dd e v e l o p e db yt h ej o i n tv i d e ot e a mo v t ) w h i c hi s f o r m e dw i t hr n j tv i d e oc o d i n ge x p e r t sg r o u p ( v c e o ) a n di s o i e cm o t i o np i c t u r e e x p e r t sg r o u p ( m p e g ) i n2 0 0 3 h 2 6 4c a na c h i e v eh i g h - q u a l i t y , l o wb i tr a t ec o d i n g e f f e c ta n dr e a c hah i g hc o d i n ge f f i c i e n c y h o w e v e r , t h eh 2 6 4h i g hc o m p r e s s i o nr a t i oi s i m p r o v e da tt h ec o s to fc o m p l e x i 够i nt h ep r a c t i c a la p p l i c a t i o ni tm u s tb eo p t i m i z e d i nt h i sp a p e ri ta n a l y z e dt h ek e yp a r t so fh 2 6 4s u c ha sp r e d i c t i o na l g o r i t h m , i n t e g r a lt r a n s f o r m ,q u a n t i z a t i o n , e n t r o p yc o d i n ga n dl o o pf i l t e re s p e c i a l l yt oi n t e r - f r a m e p r e d i c t i o nw h i c hc o s tt h em o s tt i m ei nh 2 6 4 a f t e rd e t a i l e dr e s e a r c hi nt 2 6 4w h i c hi s t h et e s ts o f t w a r eo fh 2 6 4t h i sp a p e ra n a l y s e st h er e a l i z a t i o np r o c e s so fi n t e r - f r a m e p r e d i c t i o na l g o r i t h m av i d e oc o m p r e s ss y s t e mi sd e v e l o p e da n dt h es o l u t i o no fs i g n a l i n t e g r i t yp r o b l e mw h i c hm a yb eh a p p e ni nt h es y s t e mi sg i v e n a tl a s tt 2 6 4i s o p t i m i z e do nt h eh a r d w a r ep l a t f o r mi n c l u d i n go p t i m i z a t i o no fc o d el e v e la n dm e m o r y o p t i m i z a t i o n t h er e s u l to fo p t i m i z a t i o nc a na c h i e v er e a l - t i m ec o d i n gf o rq c i fi m a g e k e y w o r d s :h 2 6 4 v i d e oc o m p r e s s i o n a l g o r i t h m ;i n t e r - f r a m ep r e d i c t i o n a l g o r i t h m ; d s p ;o p t i m i z a t i o n 学位论文版权使用授权书 本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特 授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索, 并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国 家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名二 i 鳓i j 导师签名:;参砍 签字日期:h 5 其中,r o u n d ( x ) = i2 5 5 ;x 2 5 5 x l 剩下的1 “像素点( 如c 、g 、p 、r ) 的值由它所邻近的一对1 2 像素点的值 进行线性插值得到。 例如:e = r o u n d ( b + h + 1 ) 1 色度分量的预测值通常是通过双向线性内插得到的,因为色度信号的采样分辨 1 7 j e 立窑盈太堂亟堂焦i 金塞 蜮回亟型簋迭敛盆趁 率比亮度分量低,色度信号位移矢量的精度是1 8 像素。 3 3 运动矢量预测 传输m v 还是需要大量的比特,尤其是当使用小尺寸的块分割时,由于临近块 分割具有很强的相关性,m v 可以通过先前已经编码宏块的m v 预测得到。实际 传送的是m v 与m v p ( 运动矢量预测值) 的差m v d 。m v p 取决于运动补偿的尺 寸和邻近m v 的有无。 假设e 为当前宏块或子宏块分割。a ,b ,c 分别为e 的左,上,右上的三个 相对应块。如果e 的左边不止一个分割,取其中最上的一个为a ;上方不止一个 分割时,取最左边一个为b 。图3 6 所示为所有块分割为相同尺寸的邻近分割选择。 图3 7 所示为不同尺寸时邻近分割的选择。 其中: ( 1 ) 传输块分割不包括1 6 8 和8 1 6 时,m v p 为a ,b ,c 块分割的m v 的中值; ( 2 ) 对于1 6 x 8 分割,上面部分m v p 由b 预测,下面部分m v p 由a 预测; ( 3 ) 对于8 1 6 分割,左面部分m v p 由a 预测,右面部分m v p 由c 预测; ( 4 ) 跳跃宏块( s k i p p e dm b ) 同( 1 ) 图3 6 当前块和邻近块分割相同尺寸 f i g 3 6t h es a m es i z eo ft h ec u r r e n tb l o c k a n dt h ea d j a c e n tb l o c kp a r t i t i o n bc 4 x 81 8 x b e 图3 7 当前块和邻近块分割不同尺寸 f i g 3 7t h ed i f f e r e n ts i z eo ft h ec u r r e n tb l o c ka n dt h ea d j a c e n tb l o c kp a r t i t i o n 1 8 如果如图3 7 所示的已传送宏块不存在( 如在当前片外) ,m v p 的选择需要重 新调整;在解码端,m v p 以相同的方式形成并加到m v d 上。对于跳跃宏块而言, 由于不存在m v d ,其运动补偿宏块由m v 直接生成。 3 4 多参考帧 在h 2 6 4 中最多允许采用1 5 个参考帧进行运动补偿,这对于在很多自然场景 周期变换及镜头在两个场景中交替转换等情况下可以提高编码效率。在这种模式 下,对某一块进行运动估计时,编码器会对过去或将来( 从编码顺序上说) 的一 个或几个刚刚编码的参考帧进行运动补偿,从而找到具有最佳匹配效果的参考帧。 但是由之带来的缺点也要注意,例如:需要更多的存储空间来存储参考帧, 这对于存储资源十分宝贵的嵌入式系统来说是个需要十分重视的问题,另外,在 进行运动估计时,需要遍历当前所有的参考帧,运算量也提高了很多,经实验, 考虑到缓冲区的能力和编码器的效率,目前一般都选取3 5 个参考帧【2 j 。 3 5h 2 6 4 测试软件t 2 6 4 中的帧间预测代码分析 目前,世界上存在三大h 2 6 4 的开源编码器,分别为德国h h i 研究所开发的j m , 网上自由组织联合开发的x 2 6 4 ,中国视频编码自由组织联合开发的t 2 6 4 ,这三大 编码器各有自己的特点,例如,j m 作为h 2 6 4 的官方测试源码,它实现了2 6 4 所 有的特性,适合算法的学术研究,但其程序结构冗长,只考虑编码性能,却忽视 了编码复杂度,所以不宜使用。而t 2 6 4 摒弃了h 2 6 4 中一些对编码性能贡献很小 但计算复杂度极高的新特性,如减少了参考帧的数目,去掉了模式选择中不必要 的模式等。而且t 2 6 4 包括已经移植到d s p 平台上的版本,所以可以省掉代码移 植这一步骤,加快系统开发的速度。本文的优化工作就是基于t 2 6 4 进行的。 由于h 2 “采用了树状结构运动补偿,在进行帧间预测时,需要找到最佳的块 分割模式,图3 7 为t 2 6 4 中块模式选择的流程图 1 9 北塞窑亟厶堂亟堂焦途奎岖间瑟捌簋洼的盆蚯 动可用的帧问预测 鬯! 塑! 到输嬲;6 ) 及 l 一 l 根据上一步返回的相应的可月j 分块 f 模式,对不同的块分割模式选择相 i 应的函数进行帧目j 预测 例i n t e 蛊f8 x 。1 6 p 曲“” f 对1 6 x 8 - 8 x1 6 宏块进 一j 行整象紊搜索找到最佳 睦型矢量和最小的s d 砸童! 吵 适 t 恒堕基童四匪壅垂至圈 唾釜多 i 进行亚象素运动矢量搜索 t 对眶宏块进行楚象素 搜索找到艇佳运动向 量及拉格朗日优化结 果 函习 图3 7t 2 6 4 块分割模式选择流程 f i g 3 7m o d ed e c i s i o np r o c e s so fb l o c kp a r t i t i o ni nt 2 6 4 下面对块分割模式选择过程中用到的关键函数进行说明: 首先是t 2 6 4i n t e rd 1 6 x 1 6m o d e ,此函数返回宏块级(包括16availableo 1 6 ,1 6 8 ,8 1 6 ) 可用的帧间预测模式。在此函数中,如果使用的是强制模式, 则根据配置文件中的设置选择可用的块分割模式,否则,根据实际编码过程中的 情况进行选择:首先,判断当前宏块左边及上边的宏块是否存在,如果存在,则 1 6 1 6 块分割模式为可用的;判断左边的宏块是否为1 6 8 ,如果是,则1 6 8 模 式为可用的;判断上边的宏块是否为8 1 6 ,如果是,则8 1 6 模式可用,当左边 和上边的宏块都不存在时,三种模式都为可用的。 然后分析各个块分割模式进行帧间预测的函数,t 2 6 4 _ m o d e _ d e c i s i o n _ i n t e r _ 1 6 x 1 6 p o 为例进行说明。 在此函数中首先得到最佳的运动矢量的预测值,然后进行整像素搜索和亚像素 搜索,相关函数及调用过程见图3 8 l g e tv m v 0h及相关向量 ,、l 返回当前宏块运动向量的预测值 整象素点擅霍卜 _ 1 五百( j 毫i 五i f 亚象素搜索卜钉石i i 磊;i 磊:i i i f j 磊:;三;i 订 , 面高谣 图3 8t 2 6 4m o d e _ d e c i s i o ni n t e r1 6 x 1 6 函数流程图 f i g 3 8t 2 6 4 _ m o d e _ d e c i s i o ni n t e r1 6 x 1 6f u n c t i o nf l o w c h a r t 下面对1 r 2 “m o d ed e c i s i o ni n t e r1 6 x 1 6 p 0 主要的调用函数进行分析: g e tp m v o i 函数通过左边,上边,右上( 左上) 的块来预测当前宏块的运动矢 量,并返回左边,上边,右上,左上的四个块的运动向量,零向量。这六个向量作 为运动搜索时的候补向量,存放在数组v e c 6 中。 在1 2 6 4 s e a r c h 0 中,首先尝试预测向量的中间值v e c 0 ,然后计算其他候补向 量的s a d 值,找到最小的一个作为最佳运动向量,当此运动向量计算出的s a d 值 小于预定的门限值时,返回此s a d ,如果最小的s a d 都没有小于门限值,则需要 调用菱形搜索( s m a l ld i a m o n ds e a r c h ) ,计算当前点周围上下左右四个点的s a d 值, 找到这几个点中最小的s a d 。 t 2 6 4q u a r t e r _ p i x e l _ s e a r c h 0 用来进行亚像素搜索,首先是1 2 像素搜索,生成1 2 插值数据后,计算当前整像素周围8 个方向( 上,下,左,右,左上,左下,右上, 右下) 的亚像素点的s a d 值,找到最小的s a d 。然后生成1 4 插值数据,搜索过程 与1 2 像素类似。 由上面对t 2 6 4 帧间预测代码的分析可以看出,运动估计的过程要多次计算 s a d 值,s a d 值的计算在帧间预测算法甚至在整个的t 2 6 4 编码器中都占有很大 的计算量,所以在后面的程序优化中,对此段程序做了特别优化,大大提高了程 序的运行速度。 e 立窆亟丕茔亟璺位监毫 幢回亟捌簋洼的盆圭匠 3 6 本章小结 1 本文对帧问预测算法中的树状结构运动补偿中的七种块分割模式进行了分析。 2 对帧间预测算法中亚像素级运动估计算法的插值过程进行了分析。 3 分析了帧间预测算法中运动矢量的预测和多参考帧的原理。 4 对h 2 6 4 的测试软件砭6 4 中的帧自j 预测算法部分的代码进行了剖析,给出了 块分割模式选择的流程图,并以1 6 x1 6 块分割模式为例,分析了一个宏块迸行帧 阃预测的过程和其中调用的主要函数,分析结果显示,s a d 的计算量很大,在进 行优化过程中必须进行重点考虑。 4h 2 6 4 视频压缩系统硬件平台的开发 4 1 芯片的选型设计 数字信号处理任务通常需要完成大量的实时计算,如在d s p 中常用的f i r 滤波 和f f f 算法。数字信号处理中的数据操作具有高度重复的特点,特别是乘加操作 y = a xb + c 在滤波,卷积和f f t 等常见d s p 算法中用得最多。d s p 在很多程度 上就是针对上述运算特点设计的。与通用微处理器相比,d s p 在寻址和计算能力 等方面作了扩充与增强。在相同的时钟频率和芯片集成度下,d s p 完成f f f 算法 的速度比通用微处理器要快到2 到3 个数量级,例如1 0 2 4 点的f f t 算法,时钟相 同,集成度相仿的i b mp c a t - 3 8 6 和t m s 3 2 0 c 3 0 ,运算时间分别为0 3 s 和1 5 m s , 速度相差2 0 0 倍【1 9 1 。 d s p 的结构特点在很大程度上体现了d s p 算法的需求。d s p 在结构上的主要 特点包括以下几点【刎: ( 一) 算术单元 由于d s p 的功能特点,乘法操作是d s p 的一个主要任务。而在通用微处理器 内通过微程序实现的乘法操作往往需要1 0 0 多个时钟周期,非常费时,因此在d s p 内部都设有硬件乘法器来完成乘法操作,以提高乘法速度。硬件乘法器是d s p 区 别于通用微处理器的一个重要标志。 为进一步提高速度,可以在c p u 内设置多个并行操作的功能单元( a l u ,乘 法器和地址产生器) ,如c 6 0 0 0 的c p u 内部有8 个功能单元,包括2 个乘法器和6 个a l u 。 ( 二) 总线结构 通用微处理器是为计算机设计的。基于成本上的考虑,传统的微处理器通常 采用冯诺依曼总线结构:统一的程序和数据空间,共享的程序和数据总线。由于 总线的限制,微处理器执行指令时,取指和存取操作数共享内部总线,因而程序 指令只能串行执行。 、 对于面向数据密集型算法的d s p 而言,冯诺依曼总线结构使系统性能受到很 大限制,因此d s p 采用了程序总线和数据总线分离的哈佛总线结构,这样d s p 就 能够同时取指令和取操作数了。而且很多d s p 甚至有2 套或2 套以上的内部数据 总线,这种总线结构成为修正的哈佛结构。对于乘法或加法等运算,1 条指令要从 存储器中取2 个操作数,如果采用多套数据总线就可以同时取得2 个操作数,因 韭塞变亟厶堂亟堂僮监塞 丛:2 笪趣题匿缩丕统鲤性壬台的珏蕴 此提高了程序效率。 ( 三) 专用寻址单元 d s p 面向的数据密集型应用,随着频繁的数据访问,数据地址的计算时间也线 性增长。如果不在地址计算上作特殊考虑,有时计算地址的时问比实际的算术操 作时间还长。因此,d s p 通常都有支持地址计算的算术单元一地址产生器。地址 产生器与a l u 并行工作,因此地址的计算不再额外占用c p u 时间。由于有些算 法通常需要一次从存储器中取2 个操作数,所以d s p 内的地址产生器一般也有2 个。 d s p 的地址产生器一般都支持间接寻址,而且有些d s p 还能够支持位反转寻 址( 用于f f r 算法) 和循环寻址,如c 6 0 0 0 就支持循环寻址。 ( 四) 片内存储器 由于d s p 面向的数据密集型应用,因此存储器访问速度对处理器的性能影响很 大。现代微处理器内部一般都集成有高速缓存器( c a c h e ) ,但是片内一般不设存 储程序器的r o m 和存储数据的r a m 。这是因为通用微处理器的程序一般都很大, 片内存储器不会给处理器性能带来明显改善。而d s p 算法的特点是需要大量的简 单计算,相应的其程序就比较短小,存放在d s p 片内就可以减少指令的传输时间, 并有效缓解芯片外部总线接口的压力。除了片内程序存储器外,d s p 内一般还集 成有数据r a m ,用于存放参数和数据。片内数据存储器不存在外部存储器的总线 竞争问题和访问速度不匹配问题,因此访问速度快,可以缓解d s p 的数据瓶颈, 充分利用d s p 强大的处理能力。 ( 五) 流水处理 除多功能单元外,流水技术是提高d s p 程序执行效率的另一个主要手段。流水 技术可以使2 个或更多不同的操作重叠执行。在处理器内,每条指令的执行分为 取指,解码和执行等若干个阶段,每个阶段成为一级流水。流水处理使得若干条 指令的不同执行阶段可以并行执行,因而能够提高程序执行速度。 为了保证视频流输出的连续性,本系统必须具有很高的处理速度,另外,所选 择的d s p 芯片应该具有视频信号的接口,网络接口等外设以利于视频信号的接收 与发送。基于以上考虑,本文最终选择1 r i 公司的一款高性能的媒体处理器d m 6 4 2 作为视频信号的压缩处理单元。 d m 6 4 2 1 2 1 1 1 笠l 内核是基于t m s 3 2 0 c 6 0 0 0 家族中最高性能的定点d s pc 6 4 x 设计 的。t m s 3 2 0 c 6 4 xc p u 在6 0 0 m h z 的时钟频率下,数字处理能力最高可以达到4 8 0 0 m i p s ( 每秒百万条指令) 。它具有极强的处理能力和高度的灵活性和可编程性,同时 d m 6 4 2 又集成了音视频和网络通信等外设,特别适于多媒体通信应用。 d m 6 4 2 内部有八个并行处理单元,分别处理算术、逻辑、乘法和存取运算。采 韭塞銮道太堂亟堂焦i 金峦丛:2 垒掘麴压缩丕蕴缝住圣台的珏蕴 用两级c a c h e 结构,能够以很小的存储代价取得相当于无限s r a m 的运行速度。 t m s 3 2 0 d m 6 4 2 结构如图4 1 所示。 lb r _ l 一b - f b - t 5 o 蛆 li b i w a m 卜 i 叠t i + m h e r h t o b l l l f i f oh 3r m 4 r oh l l a lr o _ 敷 * + + j 嚣飘卜 io 自o i ,c m im ii l o n h 4 - t ”i 一d p 。,“b i d 丹o e t 叫 椭n - p b p h t b m 0 o “l b j 誓搿。 b i m i q i i m o b i l t i _ a 1 “口 li s 1 l - 8 0 i 0 _ tllllll i lm c , 勰a i l l l ,l 辩i 群li 船1 毗il o i u ih t k i i 署1 蝻o z t n ” k 讪k b o一 p 罚叼 罢i i 竺! l i 竺竺l 一e ,_ 叫o mh h1 2 c o 图4 1t m s 3 2 0 d m o t 2 结构图 f i g 4 1t m s 3 2 0 d m 6 4 2 s t r u c t u r e t m s 3 2 0 d m 6 4 2 的主要外围设备包括: 三个可配置的视频接口,可以和视频输入,输出或传输流输入无缝连接 v c x o 内插控制端口( v i c ) 1 0 l o o m b p s 以太网口( e m a c ) 数据管理输入输出模块( m d i o ) 多通道音频串行端e i ( m c a s p ) 1 2 c 总线模块 i 瘟銮煎厶堂亟堂焦j 佥塞丛:2 丝援麴压缉丕蕴礁仕垩台的珏蕴 两个多通道有缓存的串口( m c b s p s ) 三个3 2 - b i t 通用定时器 用户可配置的1 6 b i t 或3 2 - b i t 的主机端e l ( h p l l 6 h p l 3 2 ) 6 6 m h z ,3 2 b i t 的p c i 接口 通用加端口( g p i 6 4 b i t 的外部存储单元接口,支持与同步或异步存储单元的连接 d m 6 4 2 的视频端口可以无缝地与n t s c p a l 编解码器接口。它的m c a s p 或 m c b s p 外设可以接不同的a d 或d ,a 变换器,用作麦克风和扬声器的接口。外 部存储器接i i ( e m i f ) 可以接高密度的s d r a m ,用很少的系统代价换来很大的视频 数据的存储空间。同时,还可以接非易失性存储器f l a s h ,用于系统程序的存储 和系统自启动。e m a c 使d m 6 4 2 可以通过一个以太网物理器件与网络接口,发送 打包的数据( 话音和视频) 到远端,还可以通过一个r j 4 5 插头,连接到p c 或局域 网。 d m 6 4 2 计算能力强,片上外设丰富,指令集功能很强大。其v i d e op o r t 接口是 专门为视频输入和输出设计的接口,可自动接收发送各种格式的视频图像流。无 缝以太网接口、多通道音频接口也是高性能视频会议终端所必须的。通过上述分 析可知,此芯片符合本系统的设计要求 4 2 系统的电路设计 本文设计的h 2 6 4 视频压缩编码系统。其设计目标是使其可以在不改变硬件的 基础上实现对多种视频编码标准的支持,并且提供了p c i ,以太网口用作视频信号 的发送接收,功能强大,结构复杂,在此基础上还可以开发网络视频会议系统和 网络视频监控系统1 4 4 1 1 4 s l 。 系统以1 r i 公司的d m 6 4 2 媒体处理器为核心,主要外围电路包括扩展存储器电 路,视频采集电路,视频编码电路,串口通信接口电路等。 系统上还保留有p c i 接口,h p i 接口等,可以留做以后系统的扩展,到时候只 需要提供相应的驱动程序就可以工作,而不用对硬件进行修改。 视频信号输入电路 采用了两块芯片实现了对v g a ,c o m p o n e n t ,c o m p o s i t e ,s v i d e o 这几种目前 应用最为广泛的视频信号格式的支持,这两块芯片分别为a d 公司的a d 9 8 8 8 和 m i c r o n a s 公司的v p c 3 2 3 0 。 a n a l o gd e v i c e s 的a d 9 8 8 8 1 冽是一块数字图形转换器,这款芯片能够支持带宽 达5 0 0 m h z 的图像输入,可以支持离达2 0 4 8 x 7 6 8 或2 5 6 0 x 1 0 2 4 的分辨率,在本系 j e 塞交煎厶堂亟堂僮论毫丛:2 笪扭题压堑丕红夔仕圣台啦珏蕴 统中,它的作用就是将输入的v g a 模拟信号转换为数字v g a 信号。 v p c 3 2 3 0 2 4 】是一个由1 2 c 总线控制的彩色解码芯片,可以对p a l ,n t s c , s e c a m 制式的彩色信号进行解码,而且可以从t v ,s v i d e o ,d v d 格式信号中分 离出同步信号,在本系统中用于对s - v i d e o ,c o m p o s i t ,c o m p o n e n t 接口中输入的 信号进行解码。 a d 9 8 8 8 与v p c 3 2 3 0 输出的视频信号传输给输入端的f p g a ( f p g a _ i n ) ,然 后f p g a 玳将输入的数字信号进行视频格式的转换和分辨率的调整,将处理结果 交给d m 6 4 2 的v p o 口。 连接示意图如下: e 8 叫f 蓉秒 卜 v md m 6 2 蚓卜 y = 剖。m ” y u v 信号、 图4 2 视频输入电路示意图 f i g 4 2v i d e oi n p u tc i r c u i tm a p 外围存储器电路 d m 6 4 2 1 勾部有1 6 k b y t e 的p r a m 和1 6 k b y t e 的d r a m ,没有r o m ,需要外加程序 存储器,本文选择的f l a s h 型号为a m 2 9 l v 0 3 3c 【2 5 1 ,4 m x 8 b i t ,把它映射到d m 6 4 2 的c e l 地址空间,分成8 页。通过设置d m 6 4 2 的引脚b o o t m o d e 0 和b o o t m o d e l 的电平把系统设置成从f l a s h 启动的模式,当系统复位后,复位指针即指n a s r i 的第o 页,开始执行程序。 f l a s h 内部分为三个部分,各部分所存程序如图4 3 所示: 区:! ! 兰! :翮! j ! ! :! :l l oo t l o d t fi fr oa d i i ,o o 二二二夏夏二二 r - t 西匠夏亘玉玉二 r - : :! i :! i ! :j i ! :j ! i :i i :! ! r 一t , 西互至夏】卫口r 一 亘夏至亘理 口m s 西 至亘玉】 ,s 亘匠夏夏至】j r - , 亘正夏亘蔓】l ,一 图4 3f l a s h 内部程序分布示意图 f i g 4 3p r o c e d u r ed i s t r i b u t ei nf l a s h 韭鏖銮亟占堂亟堂僮淦塞丛:堑扭题压缉丞统蝗仕垩台的珏蕴 f l a s h 第0 页的前半页,大小为2 5 6 k b y t e s ,用于存放用户的自启动程序 ( b o o tl o a d e r ) ,后半页( 2 5 6 kb y t e s ) 用于存放f p g ao u t 的程序,第一页( 5 1 2 k b y t e s ) 预留为用户数据空间。第二页至第七页存放t 2 6 4 的程序,最大可存放3 m b y t e s 。b o o tl o a d e r 用于把从第2 页开始的t 2 6 4 程序调入内存,开始执行。由于 h a s h 的速度较慢,所以在d m 6 4 2 与f l a s h 加了b u f f e r 进行地址和数据的缓冲。 另外系统上还外接了四块1 m x 4 b a n k x1 6 b i t 的s d r a m ,型号为 m t 4 8 l c 4 m 1 6 a 2 2 6 1 ,它采用3 3 v 电压供电,频率为1 3 3 m 。s d r a m 地址,数据 线以及控制信号可以直接连接到d m 6 4 2 上,由它进行数据的读写操作,s d r a m 的时钟由d m 6 4 2 的内部时钟进行分频得到。 外围存储器部分的原理图如下: 图4 4 d m 6 4 2 端的电路原理图 f i g 4 4d m 6 4 2 e i u e u i ts c h e m a t i c 图4 5 b u f f e r 原理图 f i g 4 5b u f f e rs c h e m a t i c 图4 6f l a s h 部分电路原理图 f i g 4 6f l a s hs c h e m a t i c 韭夏窑煎太堂亟堂僮监塞丛:2 丝扭题匡蟹丞统缝往圣台数珏蕴 图4 7s d r a m 部分原理图 f i g 4 7s d r a ms c h e m a t i c 串口电路 系统提供了串口用于实现d s p 与p c 间的r s 2 3 2 通信,串口信号f l j t l l 6 c 7 5 2 b i z r l 芯片产生。t l l 6 c 5 2 b 是一块双路,带有6 4 b y t e f i f o s 的u a r t 数据收发芯片,3 3 v 电压供电,最高波特率可以达到2 2 5 m 。d s p 将并行数据写入其发送f i f o ,然后根 据设置,将它转换为r s 2 3 2 形式的数据流,并串行地送出;接收的串行数据先进入 接收h f o ,然后d s p 从中并行地读出数据。 系统上两个串口都映射在c e l 地址空间,映射地址见下表: 表4 1 串口映射地址 映射地址 u a r ta o x 9 0 0 80 0 0 0 0 x 9 0 0 80 0 0 7 u a r tb0 x 9 0 0 80 0 0 8 o x 9 0 0 80 0 0 f d s p 可以直接对它进行读写操作,非常方便,本部分的原理图如下: j e 塞銮塑厶堂亟堂僮垃塞丛:2 鲢扭题压缉丕统塑性圣台的珏蕴 圈4 8 串口部分原理图 f i g 4 8u a r ts c h e m a t i c 电源电路 本视频压缩系统由外部5 v 电源输入,在系统内部,5 v 电源首先通过两个型号 为t p s 5 4 3 1 0 的电压调节器( r e g u l a t o r ) ,转换成1 4 v 、3 3 v 两种电压,其他外围设备 例如f p g a ,a d 9 8 8 8 ,v p c 3 2 3 0 所需要的1 8 v ,2 5 v 电压由此处产生的3 3 v 电压通 过各自的电压调节器转换出来。 本系统在电源设计时,需要考虑d m 6 4 2 的上电,掉电时序问题:上电的时候, d m 6 4 2 的核电压应该提前于i o 电压上电,或者两者同时上电;掉电的时候d m 6 4 2 的核电压不得早于l o 掉电时间【捌。基于此考虑,本文采用了给d s p 核,i o 分别供 电的方式,并通过肖特基二极管减少二者上电的延迟,原理图如下: 圈4 9 电源部分原理图 f i g 4 9p o w e rs c h e m a t i c 视频信号输出电路 d m 6 4 2 的视频11 2 用来驱动视频编码器,视频信号经过输出端的f p g a 芯片 ( f p g ao u t ) ,连到视频编码芯片p p i l i p ss a a 7 1 0 5 1 4 2 1 。f p g ao u t 用于扩展屏幕 显示功能和板子上的粘合逻辑。视频输出信号支持r g b 、高清晰度视频、p a l n t s c 复合视频和s 端子视频信号。通过d m 6 4 2 的1 2 c 总线对s a a 7 1 0 5 的内部寄存器编程 实现不同格式的视频信号输出。连接示意图如下: 3 1 丝毫銮遭厶堂亟堂焦论塞丛:2 丝扭麴压缉丕红堙往垩台的珏蕴 图4 1 0 视频信号输出电路示意图 f i g 4 1 0v i d e os i g n a lo u t p u tc i r c u i tm a p 整个视频压缩系统的整体结构如下图所示: 图4 1 1 视频压缩系统结构示意图 f i g , 4 , 1 1v i d e oc o m p r e s s i o ns y s t e l mm a p 4 3 硬件平台的p c b 设计 4 3 1 布局设计 在p c b 设计中,布局是一个重要的环节。布局结果的好坏将直接影响布线的效 果,合理的布局就是p c b 设计成功的第一步。 p c b 板的布局的整体思想:在符合产品电气以及机械结构要求的基础上考虑整 体美观,在一个p c b 板上,元件的布局要均衡,疏密有序。不同的硬件平台器件布 局的要求不同,对于本文设计的系统来说,放置的原则有以下几点: 1 元件在二维、三维空间上要避免冲突 韭塞銮道厶堂亟堂缱监塞h :2 丝援麴压缉丞蕴缝仕垩鱼艘赶蕴 2 元件布局要疏密有序,排列整齐,并且不遗漏器件 3 插件板插入设备放置在板子边缘便于连接 4 尽量使信号流程顺畅且互相的连线最短 5 速度较快的器件如s d r a m 要尽量的离c p u 近 6 由相同电源供电的器件尽量放在一起,便于电源层的分割 7 本系统中间部分为数字电路,两侧因为有视频编解码芯片所以涉及到模拟电 路,因此,布局的时候要保证模拟部分的电路与数字部分的分开,以减少二者间 的相互干扰。 4 3 2 高频信号的信号完整性设计 由于系统时钟频率的升高和i c 器件上升沿越来越陡,信号完整性设计变得越 来越重要。信号完整性对设计的影响包括特征阻抗控制、终端匹配、电源和地平 面、信号布线和串扰等问题。电路设计的早期,就应该注意到潜在可能的信号完 整性问题,然后尽量避免信号完整性对设计性能的影响【丝】【捌【加l 【3 l 】【3 2 l 。 本文对系统中可能遇到的信号完整性问题进行分析并提出解决方案: - 阻抗匹配: 阻抗匹配是高频信号布线中经常遇到的问题,为了使信号源输出最大功率, 则要求信号源的内阻抗与传输线的输入阻抗互为共轭复数,为了使终端负载吸收 全部入射功率,而不产生反射,则要求终端负载与传输线的特性阻抗相等,另外 为了使信号源工作稳定,则要求没有或者很少有返回信号源的波。如果源端和传 输线及负载没有进行阻抗匹配,则从源端发出的信号传输到负载后会从负载反射 回源端,反射波到达源端后还会再次反射到负载,这样来回反射,就会形成振荡。 在本系统中,s d r a m 的频率达到了1 3 3 m l l z ,在这样高的频率下,如果不能够使 s d r a m 的布线达到阻抗匹配的话,就可能导致逻辑错误。 阻抗匹配的关键是确定传输线的特征阻抗,它不仅仅是印制线的电阻。当印 制线上传输的信号频率很高时,必须将印制线看成是带有寄生电容和电感的传输 线,而且在高频下会有趋肤效应和电介质损耗。在印刷电路板上的传输线可以分 为两种:微带线和带状线。其中微带线是指在p c a # b 层的走线和只有一个参考平面 的连线;带状线则表示在绝缘层中间,有两个参考平面的连线。这两种传输线的 传输速度和特性阻抗是不同的。本设计中尽量使高频信号在板子的内部走线,而 且只有一个参考平面,所以都属于微带线,特性阻抗的计算公式如下: z o - - - ;! ! i n ! :! 坠q( 4 1 ) r + 1 4 1 0 8 w + 4 上式中6 1 是p c b 板介质的介电常数,w 是走线宽度,a 则代表走线的铜线厚度。 由于系统中d s p 采用b g a 封装等各方面的限制,改变走线距离和走线宽度是不可 能的,所以只能添加合适的匹配电阻来实现阻抗匹配。 阻抗匹配的方案常用的有两种源端串联匹配和终端并联匹配,考虑到空间的 限制,采用前一种方案,s d i 认m 进行阻抗匹配的示意图如下: 图4 1 2s d r a m 阻抗匹配示意图 f i b 4 1 2s d r a mi m p e d a n c em a t c h i n g 在仿真软件h y p e r l y n x 中建立s d r a m 的i b i s 模型,设置传输线的各项参数 后进行b o a r d s i m 仿真,通过观察进行阻抗匹配前和匹配后的波形( 见图4 1 3 , 图4 1 4 ) ,可以看出匹配后的波形已经消除了振荡。 图中绿线为传输的信号波形,红线为作为参考的输入波形。 图41 3 阻抗匹配前的仿真结果 f i g 4 1 3s i m u l a t i o nr e s u l tb e f o r em p e d a n m a t c h m g 图4 f 1 4 阻抗匹配后的仿真结果 f i g 4 1 4s i m u l a t i o n r e s u l ta f a ri m p e d a n c em m h i n g 一串扰 在p c b 设计中,串扰问题是另一个值得关注的问题。图4 1 5 中显示出在一个 p c b 中相邻的三对并排信号线间的串扰区域及关联的电磁区。当信号线间的间隔太 小时,信号线问的电磁区将相互影响,从而导致信号的恶化,造成串扰,如图4 1 6 所示。 串扰可以通过增加信号线间距解决。然而,布线空间的限制,往往不能如自 己所愿。目前,业界认可的规则是3 w 规则,即相邻信号线间距至少应为信号线宽 度的3 倍,所以,设计中,尽量遵守这项规则,把串扰降到最小的限度,另外可以 通过在信号线问加地线将信号线隔开,减少信号线间的分布电容,尽可能通过地 给双方提供互不干扰的返回路径。 图4 1 5 传输线问距大无串扰 f i g 4 1 5n oc r o s s t a l k 图41 6 传输线间距小存在串扰 f i g 4 1 61 1 l c r o s s t a l k 电源退耦 电源退耦是现在数字电路设计中标准惯例,有助于减少电源线上的噪声问题。 一个干净的电源对设计一个高性能电路至关重要。迭加在电源上的高频噪声将会 对相邻的每个数字设备都会带来问题。典型的噪声来源于地弹、信号辐射或者数 字器件自身。 最简单的解决电源噪声方式是利用电容对地上的高频噪声退耦,本系统在每 个i c 的电源引脚上都加上了0 1 u f 的滤波电容去除高频噪声,然后在每两个s d r a m 间放置一个4 7 u f 的钽电容,在d m 6 4 2 四周放置四个1 0 u f 的钽电容用来滤除低频噪 声。 4 4 本章小结 本文硬件平台设计的工作重点在于整个电路板的原理图和p c b 设计,以及最小 系统的调试工作,即实现视频文件通过j t a g 接口传输到d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 亚健康状态筛查管理手册
- 厂界噪声污染控制管理标准
- 减肥代餐配送服务流程
- 深松整地机械作业质量验收标准
- 药膳食材搭配规范管理手册
- 空气消毒操作管理流程
- 身体症状自评量表应用操作指引
- 水稻田二化螟无人机飞防方案
- 风电场主轴维护方案
- 慢病营养膳食搭配干预方案
- 装配式建筑装饰装修技术 课件 模块八 集成门窗
- MOOC 电路基础-西北工业大学 中国大学慕课答案
- 医院骨科专病数据库建设需求
- 妊娠剧吐护理查房
- 圣乔治呼吸问卷SGRQ
- 空防安全威胁应对措施与异常行为识别基础
- 煤矿机电运输安全管理培训课件
- GB/T 2820.6-2009往复式内燃机驱动的交流发电机组第6部分:试验方法
- GB/T 1184-1996形状和位置公差未注公差值
- 2022年南靖县荆江国有资产投资有限公司招聘笔试题库及答案解析
- 东河流域水电梯级开发规划报告修订本定
评论
0/150
提交评论