版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
运动估计综述第一页,共三十三页,2022年,8月28日图像的冗余
视频序列图像在时间上存在很强的相关性,采用运动估计和运动补偿技术可以消除时间冗余以提高编码效率,这种技术广泛用于视频压缩的一些国际标准中,如H.261/263/264、MPEG-1/2/4。第二页,共三十三页,2022年,8月28日运动估计的分类全局运动估计基于块的运动估计基于象素点的运动估计基于区域的运动估计基于网格的运动估计时域运动估计频域运动估计(DFT、DCT、DWT)第三页,共三十三页,2022年,8月28日运动估计的分类a全局运动估计c基于块的运动估计b基于象素点的运动估计d基于区域的运动估计第四页,共三十三页,2022年,8月28日运动估计的分类a基于块的运动估计b基于网格的运动估计块匹配运动估计因算法简单、便于硬件实现得到广泛应用,本文将对其进行重点讨论,下面简称其为“运动估计”。第五页,共三十三页,2022年,8月28日运动估计的定义基本思想是将图像序列的每一帧分成许多互不重叠的宏块,并认为宏块内所有象素的位移量都相同,然后对每个宏块到参考帧某一给定特定搜索范围内根据一定的匹配准则找出与当前块最相似的块,即匹配块,匹配块与当前块的相对位移即为运动矢量。视频压缩的时候,只需保存运动矢量和残差数据就可以完全恢复出当前块。第六页,共三十三页,2022年,8月28日匹配准则
常见的运动估计匹配准则有三种:MAD、MSE和NCCF,由于MAD没有乘除操作,不需做乘法运算,实现简单方便,所以使用较多。通常使用求和绝对误差(SAD)代替MAD。第七页,共三十三页,2022年,8月28日全搜索法对搜索区域的所有位置进行穷尽搜索。精度最高计算复杂,难以实时处理必须研究相应的运动估计快速算法第八页,共三十三页,2022年,8月28日运动估计快速算法分类分层的和多分辨率的快速块匹配方法固定搜索模式的快速块匹配方法基于时空相关性和视觉特性的快速块匹配方法基于连续消除的快速块匹配方法基于象素子抽样的快速块匹配方法第九页,共三十三页,2022年,8月28日分层的或多分辨率法
在较粗糙的分辨率下预测一个接近的大尺寸的运动矢量,然后在较高的分辨率下进一步修正。称为分层的或多分辨率的运动估计快速算法。缺点:计算过程复杂,内存需求较大。第十页,共三十三页,2022年,8月28日连续消除法第十一页,共三十三页,2022年,8月28日象素子抽样法通常的匹配准则是把块里所有的象素点进行计算和比较,事实上一个块里相邻象素的差别很小,使得它们之间也存在冗余。子采样运动估计算法就利用了这一事实,只取其中的一部分象素进行计算,可大大减少计算量,但同时降低了准确性。第十二页,共三十三页,2022年,8月28日固定模式法
该方法假设匹配误差随着离全局误差最小点的距离增加而单调增加。一般从原点开始,采用固定的搜索模板和搜索策略得到最佳匹配块。著名的算法有:三步法、梯度下降法、四步法、菱形法、六边形法等,下边将分别予以介绍。第十三页,共三十三页,2022年,8月28日三步法搜索模板半径依次减半对小运动检测效果不好搜索范围大于7时,搜索步骤不止三步第十四页,共三十三页,2022年,8月28日梯度下降法反复使用3×3模板进行搜索。模板中心处SAD值最小时结束。对大运动检测效果不好第十五页,共三十三页,2022年,8月28日四步法反复使用5×5方形模板进行搜索。模板中心处SAD值最小时再用3×3模板搜索一次确定最佳匹配位置。第十六页,共三十三页,2022年,8月28日菱形法搜索方式与四步法类似,只是搜索模板换为两个菱形模板。第十七页,共三十三页,2022年,8月28日六边形法搜索方式与菱形法类似,只是大搜索模板换为一个六边形模板。第十八页,共三十三页,2022年,8月28日固定模式搜索法的缺点
没有利用图像本身的相关信息,不能根据物体运动的剧烈程度自适应的改变搜索起点和搜索半径。以菱形法为例,对背景图像,也要经历从大模板到小模板的转换过程,至少需要13个搜索点,搜索速度还有待改进。对于运动剧烈的图像,从原点开始搜索时,要经过多次搜索才能找到匹配点,搜索点过多,且容易陷入局部最优点。第十九页,共三十三页,2022年,8月28日序列相关性和视觉特性
针对固定模式法的不足,近几年来,人们针对序列图像的时空相关性和人眼视觉特性,提出了许多改进算法,主要可分类下面几类:预测搜索起点扁平搜索模板背景图像快速检测多预测点搜索第二十页,共三十三页,2022年,8月28日预测搜索起点利用相邻块之间的运动相关性选择一个反映当前块运动趋势的预测点作为初始搜索点,这个预测点一般比原点更靠近全局最小点。从预测点开始搜索可以在一定程度上提高搜索速度和搜索精度。可参考预测搜索法(PSA)、自适应运动跟踪法(AMTS)。
第二十一页,共三十三页,2022年,8月28日扁平搜索模板在序列图像中,大多数的运动矢量都位于水平或垂直方向,因此有些论文设计了扁平搜索模板(非对称搜索模板)来加快搜索速度。可参考十字菱形搜索法(CDS)。第二十二页,共三十三页,2022年,8月28日背景图像的快速检测由于一般序列中背景图像占有相当的比例,对背景图像的快速检测对搜索算法的性能提高很大。一般有两种方法:中止判别条件(门限一般设置512左右)从中心点开始用小模板检测,可参考CDHS算法第二十三页,共三十三页,2022年,8月28日多预测点搜索这种方法是根据邻块运动矢量预测多个搜索点,在搜索过程中选择预测性能最好的预测点,通常于小模板搜索方法想结合。可参考自适应十字模式搜索(ARPS)及其改进算法。预测方法至关重要。第二十四页,共三十三页,2022年,8月28日H.264标准中运功估计的新特点多帧参考¼象素预测精度多块尺寸第二十五页,共三十三页,2022年,8月28日多帧参考第二十六页,共三十三页,2022年,8月28日帧间运动矢量复用第二十七页,共三十三页,2022年,8月28日¼预测精度第二十八页,共三十三页,2022年,8月28日亚象素全搜索法第二十九页,共三十三页,2022年,8月28日亚象素快速搜索(一)第三十页,共三十三页,2022年,8月28日亚象素快速搜索(二)第三十一页,共三十三页,2022年,8月28日多块尺寸第三十二页,共三十三页,2022年,8月28日H.264的性能优势和计算复杂度
在相同的图像质量下,H.264所需码率约为MPEG-2的36%、H.263的51%、MPEG-4的61%,在很大程度上应归功于运动估计的这三个新特性。但是,H.264的高性能是以计算复杂度为代价的。以运动估计为例,1/4象
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026云南大理州大理市综合行政执法局招聘城市管理辅助性服务人员18人考试备考试题及答案解析
- 招3人!乌兰县紧密型县域医共体面向社会公开招聘工作人员考试备考题库及答案解析
- 新人教版二下数学第一单元同步课时练习(二)
- 性格不合离婚协议书
- 高压水射流清洗工达标水平考核试卷含答案
- 2026陕西西安文理学院高层次人才和紧缺特殊专业人才引进50人考试参考题库及答案解析
- 2026年及未来5年市场数据中国塔吊租赁行业市场全景评估及发展战略规划报告
- 2026新华保险管理干部招聘笔试模拟试题及答案解析
- 成都市金牛区人民医院2026年二季度招聘工作人员(24人)考试模拟试题及答案解析
- 橡胶硫化工安全实践水平考核试卷含答案
- 2025年拥抱Z世代珠宝行业数字化转型与文化变革报告
- 浙江省温州市直遴选笔试真题及解析(2025年7月27日)
- 安全知识竞赛填空试题及答案
- GM/T 0028-2024密码模块安全要求
- 药品生物检定技术课件
- 水池维修维护方案(3篇)
- 3.1 《中国科学技术史》序言(节选)(课件)中职高二语文(高教版2023拓展上册)
- 2025年华为数通中级H12-821(V1.0)认证考试复习题库
- GB/T 45568-2025继电保护信息规范
- T/CHES 42-2020水质涕灭威、克百威和甲萘威的测定液相色谱法
- 网络基础知识专题课件
评论
0/150
提交评论