CN120220035A 一种基于时序预测的快速视频审核方法及系统

上传人：x*** IP属地：重庆上传时间：2025-09-03 格式：DOCX 页数：24 大小：417.99KB 积分：10.8 举报 版权申诉

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

(19)国家知识产权局王光永限公司37105GO6V20/40(2022.0一种基于时序预测的快速视频审核方法及系统本发明公开了一种基于时序预测的快速视信息，形成初始状态向量xo,并初始化时序状态集中于预测的感兴趣区域(RegionofInterest,21.一种基于时序预测的快速视频审核方法，其特征在于，包括以下步骤：步骤S1:构建时序状态预测模型，并对视频流的初始帧进行全局扫描，调用目标检测算法识别并定位目标；步骤S2:提取目标在初始帧中的状态信息，形成初始状态向量Xo,并初始化时序状态预测模型；步骤S3:使用初始化后的时序状态预测模型对初始帧后的每一帧进行迭代循环处理，完成视频审核。2.根据权利要求1所述的一种基于时序预测的快速视频审核方法，其特征在于，所述步骤S2中，目标在初始帧中的状态信息包括但不限于：感兴趣目标的位置信息(Px,Py)、尺寸信息(w,h),以及通过多帧数据估算运动参数，所述运动参数包括但不限于速度信息(vx,vy)、加速度信息(ax,ay)。3.根据权利要求1所述的一种基于时序预测的快速视频审核方法，其特征在于，所述步骤S3,包括以下步骤：S31:定义初始帧后的每一帧为当前帧k,基于前一帧的修正状态Xk-1,通过时序状态预测模型预测当前帧k的状态Xk|k-1;S32:根据预测状态Xk|k-1的位置信息和尺寸信息，在当前帧生成感兴趣区域，所述感兴S33:在感兴趣区域内执行目标分析，所述目标分析包括但不限于：精准定位、特征提S34:若目标在感兴趣区域内被检测到，则获取目标的测量状态，利用Zk修正时序状态预测模型，输入后验状态Xk,作为下一帧预测的输入。4.根据权利要求2所述的一种基于时序预测的快速视频审核方法，其特征在于，感兴趣区域的生成满足以下条件：5.根据权利要求3所述的一种基于时序预测的快速视频审核方法，其特征在于，目标分析包括但不限于：基于深度学习的检测器对感兴趣区域内的目标进行精确定位；提取目标的纹理、颜色或形状特征用于增强跟踪鲁棒性；通过分类模型识别目标的类别属性。6.根据权利要求1所述的一种基于时序预测的快速视频审核方法，其特征在于，模型修正采用卡尔曼增益计算预测状态与测量状态的加权融合，或通过反向传播算法更新深度学习模型的权重参数。7.根据权利要求3所述的一种基于时序预测的快速视频审核方法，其特征在于，所述步骤S3,还包括：若连续n帧未检测到目标或预测偏差超出阈值，暂停感兴趣区域分析并触发全局扫描，通过全局扫描重新捕获目标或发现新目标，并根据扫描结果重新初始化或终止跟踪。38.根据权利要求7所述的一种基于时序预测的快速视频审核方法，其特征在于，触发全局扫描的条件包括但不限于：固定时间间隔触发；目标丢失事件触发；场景突变事件触发。9.一种基于如权利要求1所述的基于时序预测的快速视频审核方法的审核系统，其特初始化模块，用于执行全局扫描、目标检测及初始状态提取；时序预测模块，用于根据历史状态预测当前帧的目标状态；ROI生成模块，用于动态划定感兴趣区域；局部分析模块，用于在ROI内执行目标分析任务；状态修正模块，用于融合预测与测量数据以更新模型；容错控制模块，用于处理目标丢失事件并触发全局扫描。10.根据权利要求9所述的一种审核系统，其特征在于，所述时序预测模块支持多模型切换，包括但不限于：卡尔曼滤波、粒子滤波及LSTM网络，且根据场景复杂度动态选择最优模型。4一种基于时序预测的快速视频审核方法及系统技术领域[0001]本发明涉及计算机视觉技术领域，具体是一种基于时序预测的快速视频审核方法及系统。背景技术[0002]随着视频监控、内容审核、行为分析等应用的普及，对海量视频数据进行高效、准确地处理分析已成为一项重要需求。传统的视频审核或分析方法通常涉及对视频的每一帧进行全局扫描和目标检测。虽然这种方法能够获取全面的信息，但在处理高分辨率、高帧率的视频流时，需要消耗大量的计算资源(如CPU、GPU处理时间)和带宽资源，导致处理速度[0003]为了提高效率，研究人员提出了一些基于目标跟踪的方法。然而，现有的方法可能未能充分利用目标的运动状态信息来主动预测其未来位置，或者局限于特定的跟踪算法。[0004]因此，当前迫切需要一种能够显著降低计算复杂度、提高视频审核处理速度的技术方案。发明内容[0005]本发明的目的在于提供一种基于时序预测的快速视频审核方法及系统，它通过预(RegionofInterest,ROI)进行扫描和识别，而非进行全局扫描，从而大幅节省计算资源，提升审核效率。[0006]本发明为实现上述目的，通过以下技术方案实现：一方面，本发明提供一种基于时序预测的快速视频审核方法，包括以下步骤：步骤S1:构建时序状态预测模型，并对视频流的初始帧进行全局扫描，调用目标检测算法识别并定位目标；步骤S2:提取目标在初始帧中的状态信息，形成初始状态向量xo,并初始化时序状态预测模型；步骤S3:使用初始化后的时序状态预测模型对初始帧后的每一帧进行迭代循环处[0007]优选的，所述步骤S2中，目标在初始帧中的状态信息包括但不限于：感兴趣目标的位置信息(Px,Py)、尺寸信息(w,h),以及通过多帧数据估算运动参数，所述运动参数包括但不限于速度信息(vx,vy)、加速度信息(ax,ay)。[0008]优选的，所述步骤S3,包括以下步骤：S31:定义初始帧后的每一帧为当前帧k,基于前一帧的修正状态Xk-1,通过时序状态预测模型预测当前帧k的状态Xk|k-1;S32:根据预测状态Xk|k-1的位置信息和尺寸信息，在当前帧生成感兴趣区域，所5S33:在感兴趣区域内执行目标分析，所述目标分析包括但不限于：精准定位、特征S34:若目标在感兴趣区域内被检测到，则获取目标的测量状Zk态，利用Zk修正时序状态预测模型，输入后验状态Xk,作为下一帧预测的输入。基于深度学习的检测器对感兴趣区域内的目标进行精确定位；提取目标的纹理、颜色或形状特征用于增强跟踪鲁棒性；通过分类模型识别目标的类别属性。[0011]优选的，模型修正采用卡尔曼增益计算预测状态与测量状态的加权融合，或通过反向传播算法更新深度学习模型的权重参数。若连续n帧未检测到目标或预测偏差超出阈值，暂停感兴趣区域分析并触发全局扫描，通过全局扫描重新捕获目标或发现新目标，并根据扫描结果重新初始化或终止跟踪。[0014]另一方面，提供一种基于如上述的基于时序预测的快速视频审核方法的审核系时序预测模块，用于根据历史状态预测当前帧的目标状态；局部分析模块，用于在ROI内执行目标分析任状态修正模块，用于融合预测与测量数据以更新模型；容错控制模块，用于处理目标丢失事件并触发全局扫描。[0015]优选的，所述时序预测模块支持多模型切换，包括但不限于：卡尔曼滤波、粒子滤[0016]对比现有技术，本发明的有益效果在于：1、大幅提升审核效率：通过将分析计算集中在预测的感兴趣区域(ROI),而非全帧处理，显著减少了每一帧所需的计算量，从而加快了视频审核的整体速度；2、显著降低计算资源消耗：由于仅对ROI进行目标检测、识别等复杂分析，避免了对视频帧中大量背景或非相关区域的冗余计算，有效节省了处理器、内存等硬件资源；3、对高分辨率视频适应性更强且优势更明显：随着视频分辨率的提升，像素总量呈乘法级增长，导致传统全帧分析的计算负担急剧增加。本方法通过聚焦ROI,其计算量基本与目标大小相关而与整体分辨率的增长关系不大，因此分辨率越高，本方法在效率提升和资源节省方面的优势越突出；4、持续优化预测精度：通过在ROI内成功找到目标后，利用其最新的测量状态来更6新时序状态预测模型，实现了对目标状态的持续跟踪和预测模型的迭代优化，有助于在后续帧中更准确地预测目标位置和定义ROI。附图说明[0017]图1是本发明的方法流程图；图2,其中A为本发明的初始检测框围绕检测到的人脸例图；B为本发明的基于图2中A使用Alpha-Beta预测生成的ROI例图；C为本发明的基于图2中B截取的扩展后的ROI例图；D为本发明的基于图2中C内部人脸识别得到结果并框出人脸位置的示例图；图3是本发明的基于Alpha-Beta模型预测-识别-预测的完整过程可视化例图，图4,其中A为本发明的初始化粒子滤波器的示例图；B为本发明的基于图4中A扩展之后的感兴趣区域ROI;C为本发明的基于图4中B的感兴趣区域ROI截取示例图；D为本发明的基于图4中C内部人脸识别得到结果并框出人脸位置的示例图；图5是本发明的基于粒子滤波器模型预测-识别-预测的完整过程可视化例图，其图6是本发明的基于粒子滤波器模型丢失目标并重新捕获的完整过程可视化例图7是本发明的系统结构示意图。具体实施方式[0018]下面结合具体实施例，进一步阐述本发明。应理解，这些实施例仅用于说明而不用于限制本发明的范围。此外应理解，在阅读了本发明讲授的内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所限定的范围。[0019]在本发明中，术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系，只是为了便于叙述本发明各部件或元件结构关系而确定的关系词，并非特指本发明中任一部件或元件，不能理解为对本发明的限制。[0020]实施例1:如图1所示，本实施例提供基于Alpha-Beta滤波器作为时序状态预测模型的一种基于时序预测的快速视频审核方法，包括以下步骤：步骤S1:构建时序状态预测模型，并对视频流的初始帧进行全局扫描，调用目标检测算法识别并定位目标；步骤S2:提取目标在初始帧中的状态信息，形成初始状态向量Xo,并初始化时序状态预测模型；步骤S3:使用初始化后的时序状态预测模型对初始帧后的每一帧进行迭代循环处[0021]其中，步骤S1-S2在本实施例中可以视为“初始化”阶段(冷启动过程),步骤S1可以7首先通过全局图像扫描方式(如常规的目标检测算法)检测感兴趣的目标。一旦目标被检测到，如图2中A所示的初始检测框围绕检测到的人脸，在视频的第一帧，其初始测量状态包括中心位置(px,mo,Py,mo)和尺寸(Wmo,hmo),被用来初始化Alpha-Beta滤xk=[px,Py,w,h,px,py,w,包含目标的位置、尺寸及其各自的变化率(速度)。初始时，位置和尺寸分量设为测量值，而所有变化率分量(速度Px、Py,和尺寸变化率w、h)通常设为零。S31:定义初始帧后的每一帧为当前帧k,基于前一帧的修正状态Xk-1,通过时序状态预测模型预测当前帧k的状态Xk|k-1;(“时序状态预测”阶段)S32:根据预测状态Xk|k-1的位置信息和尺寸信息，在当前帧生成感兴趣区域，所述感兴趣区域的尺寸为预测尺寸与放大系数αROI的乘积，其中αROI≥1;(“感兴趣区域S33:在感兴趣区域内执行目标分析，所述目标分析包括但不限于：精准定位、特征S34:若目标在感兴趣区域内被检测到，则获取目标的测量状态Zk,利用Zk修正时对于后续的每一帧k,利用k-1时刻经过修正的状态Xk-1|k-1,Alpha-Beta滤波器预测当前帧k的目标状态xk|k-1。预测过程基于简化的动态模型，例如匀速运动和匀速尺寸变化模型：预测位置：新位置预测值=旧位置+旧速度×△t;速度和尺寸变化率通常被预测为保持不变：新速度预测值=旧速度；其中△t是帧间的时间间隔。根据预测得到的目标状态klk-1中的预测位置(Px,klk-1,Py,k|k-1)和预测尺寸(Wk|k-1,hklk-1),结合一个预设的或自适应的放大系数αROI(例如1.8),生成一个预测的感兴趣区域(ROI)。该ROI预计将包含目标在当前帧的实际位置。(如图2中B所示，紫色虚线框为基于Alpha-Beta预测生成的ROI,黄色虚线为使用扩展系数扩展之后的ROI)如图2中C所示，人脸识别会在此区域内部扫描人脸即：仅在“感兴趣区域(ROI)生若在ROI内成功检测到目标(如图2中D所示，绿色框为在ROI内检测到的目标),则8获取当前的测量状态zk=[px,m,k,Py,m,k残差=测量值一预测值(针对各分量分别计算);本实施例提供基于粒子滤波器作为时序状态预测模型的一种基于时序预测的快初始测量状态zo=[px,m₀,Py,m₀,Wmo,hmo]后，系统初始化Np个粒子(本示例这些粒子通常通过在Z₀周围依据某个初始不确定性分布(例如高斯分布)采样生成(如附图4中A所示，图中众多粒子围绕初始目标散布，紫框为预测框位置)。所有粒子的初始权重对于后续帧k,每个粒子xk-{9k-1(来自上一帧更新和重采样后的粒子集合)根据一个预设的动态模型进行传播(演化),以得到

人人文库> 全部分类> 行业资料 > 各类标准

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

CN120220035A 一种基于时序预测的快速视频审核方法及系统

文档简介

温馨提示

最新文档

评论

CN120220035A 一种基于时序预测的快速视频审核方法及系统

文档简介

温馨提示

最新文档

评论

相关文档