论文【17000字】.doc

【JL102】视觉跟踪技术研究

收藏

压缩包内文档预览:(预览前20页/共39页)
预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图 预览图
编号:687222    类型:共享资源    大小:1.16MB    格式:RAR    上传时间:2016-07-03 上传人:棒*** IP属地:湖北
25
积分
关 键 词:
jl102 视觉 跟踪 技术研究
资源描述:
【JL102】视觉跟踪技术研究,jl102,视觉,跟踪,技术研究
内容简介:
本科毕业设计论文 题 目 视觉跟踪技术研究 专业名称 自动化 学生姓名 刘 晨 指导教师 邢 超 毕业时间 2014 年 6 月 提供 北工业大学明德学院 本科毕业设计 导 师:邢 超 姓 名:刘 晨 班 级: 191003 学 号: 103639 2 目:视觉跟踪技术研究 视觉跟踪技术的研究意义 视觉跟踪算法的分析 视觉跟踪算法的实现 3 . 视觉跟踪技术的研究意义 近十年中,视觉跟踪技术已经在诸如智能监控系统、机器人视觉、医学辅助诊断、地图绘制等方面得到广泛的发展和应用。例如,在视频监控系统中对人的行为的识别研究,其主要解决的问题是基于计算机视觉的人的手势和表情的识别;对于人脸的检测、识别与跟踪还能在远程会议中大大降低图像传输的比特率,并使画面锁定在讲话人的身上;此外,视觉跟踪技术也是虚拟实现中的核心技术之一。因此,开展视觉技术研究是非常有意义的 4 . 视觉跟踪算法分析 本次毕业设计对视觉跟踪的方法做了简要的分类,并指出了目标跟踪中的几个难点所在,再具体的以实例对视觉跟踪算法中目标检测方法(即基于知识的方法,特征不变的方法,模板匹配的方法,基于外观的方法)和目标跟踪方法 (即基于模型的跟踪,基于运动的跟踪 )进行了优缺点的分析。 5 . 视觉跟踪算法的实现 本次设计是通过 + 人的脸部为目标进行检测识别的跟踪。总体实现系统框图如下: 获得视频图像,得到 而获得待检测图像 图像 到图像 到图像 初始化跟踪,构建目标区域模板直方图 运动估计 确定最大搜索边界 找出最佳区域 6 以人脸为目标的目标检测的详尽框图如下: 图 人脸检测框架图 7 以人脸为目标的目标跟踪的详尽流程图如下: 图 基于检测的人脸跟踪流程图 8 实验结果展示 9 业设计是学生学习总结的过程,可以体现以及提高一个学生的综合素质。在此期间,对邢超老师、高超老师、以及各位同学们给予的帮助、指导和提出的很多宝贵意见在此表示最诚挚的感谢! 10 谢 西北工业大学明德学院本科毕业设计论文 1 摘 要 视觉跟踪是通过对图像序列中的运动目标进行检测、 提取、表达和识别,首先获得关于运动目标的位置、速度、加速度及其运动轨迹等运动参数,再通过进一步处理与分析,实现对运动目标的行为理解,以最终完成更高一级的任务如对目标实施跟踪等。可见, 视觉跟踪技术是一项融合图像处理、模式识别、人工智能、自动控制等多个领域的高技术课题 。 本文主要研究了视频图像序列中的跟踪技术及其实现。首先给出了 视觉跟踪算法 的相关知识及其分类,然后详细介绍了本文中采用的跟踪算法 以及在实例中的应用 ,最后给出了设计和实验结果。本文的重点 在于算法的设计,整个 视觉跟踪 算法 是通过建立目标检测和目标跟踪两个不同的模块来进行 实现 的 。 跟踪 模块主要研究了 图像 分割算法,并采用 颜色检测算法进行 被跟踪目标 的定位;在 跟踪目标 检测成功的基础上, 目标 跟踪模块通过一阶差分运动估计,确定最大的搜索区域,在此区域使用直方图穷举算法来 实现目标的 跟踪。实验结果表明该系统能够对通过 计算机 图像序列中的 目标 进行准确的检测与跟踪,具有良好的性能和一定实际应用价值,可以被应用在视频监控系统中。 关键词 :目标 检测 ,目标 跟踪 ,计算机视觉 西北工业大学明德学院本科毕业设计论文 2 is on in on as in of to a as In of in of in in of in is is is to is of in in a it be in 北工业大学明德学院本科毕业设计论文 3 目 录 第一章 绪论 3 言 5 觉跟踪技术的研究意义 5 及的学 科和理论 6 文工作及内容安排 7 文的主要工作 7 文各章内容安排 7 第二章 视觉 跟踪算法分析 8 标跟踪算法基础 8 标跟踪中的难点 9 标检测的基本概念和主要技术方法 10 标检测的基本概念 10 标检测的主要技术 10 于知识的方法 11 征不变的方法 11 板匹配的方法 12 于外观的方法 12 标跟踪的基本概念及主要技术 13 标跟踪的基本概念 13 标跟踪主要方法 13 绍 14 特点 14 函数体系 15 一些重要配置 15 第三章 视觉跟踪系统实现 19 西北工业大学明德学院本科毕业设计论文 4 标检测和跟踪系统的设计目标 19 统的基本软件、硬件 19 标检测和跟踪系统的整体框架 19 键技术方案和模块设计 20 频图像捕获模块 21 脸 检测模块 22 脸跟踪模块 29 第四章 总结和展望 34 文工作总结 34 来工作展望 34 参考文献 35 致谢 36 毕业设计小结 39 西北工业大学明德学院本科毕业设计论文 5 第一章 绪论 言 近年来 ,随着信息技术的发展,计算机应用的普及性不断得到提高,以 及计算机的软硬件性能的飞速提升 ,更加高效并且也更加友好的人机交互技术 ,即 不断的提出并应用于我们周围,并且这些技术的应用不再依赖于传统的键盘、鼠标、显示器等设备,开始向着多模态人机交互的方向发展。多模态人机交互模拟人类自然交流的方法,包括视觉、听觉、触觉和嗅觉,试图综合图像 ,声音 ,文字等手段 ,达到与计算机进行交流的目的,其中以视觉交流最为方便和易于接受。同时,图像处理设备的性价比也不断的提高,从而使得基于图像处理的人机交互技术成为当前研究领域的热 点。 计算机视觉是在数字图像处理的基础上发展起来的新兴学科,它从信息处理的层次研究视觉信息的认知过程,研究视觉信息处理的计算理论和表达与计算方法,包括图像特征提取,摄像机定标,立体视觉,运动视觉(或序列图像分析),由图像灰度恢复三维物 体形状的方法,物体建模与识别方法以及距离图像分析方法等方面。作为一门综合性的交叉学科,计算机视觉处理的领域计算机科学与工程、信号处理、应用数学、以及神经生理学与认知科学等方面,并在军事等领域的各种智能自主系统中有着广泛应用。 觉 跟踪 技术 的研究意义 视觉 跟踪技术引起广泛关注是因为它能够广泛应用于民事和军事的许多领域,近十年中,已经在诸如智能监控系统、机器人视觉、医学辅助诊断、地图绘制等方面得到广泛的发展和应用。总结起来,其应用主要包括三方面,即视频监控、图像压缩和三维重构。除了此三个方面,其相关应用技术还可以应用到很多方面。例如,在视频监控系统中对人的行为的识别研究可以应用于人机感知接口中 ,其主要解决的问题是基于计算机视觉的人的手势和表情的识别 ; 对于人脸的检测、识别与跟踪还能在远程会议中大大降低图像传输的比特率,并使画面锁定在讲话人的身上; 在视觉跟踪技术中 ,还可以利用图像序列中感兴趣目标的相似性实现对目标的识别与跟踪,这一技术能被用于进行图像检索和图像查询;此外,视觉跟踪技术也是虚拟实现中的核心技术之一。 西北工业大学明德学院本科毕业设计论文 6 综上所述,开展视觉技术研究是非常有意义的,其研究成果也具有广阔的应用前景。 及的学科和理论 跟踪问题涉及包括数字 信号 处理 24、计算机视觉 11、模式识别 12、人工智能在内的众多领域。 1) 数字图像处理 这是一门用计算机对图像数据进行加工处理的学科,它主要有以下几方面的内容 :图像的数字化、图像分割、图像描 述、图像增强、图像复原、图像的压缩编码以及运动图像的处理等。数字图像处理的各项内容渗透在 目标 检测和跟踪的诸多环节中。 2) 计算机视觉 视觉是人类获取信息的主要来源,也是适应复杂、变化环境的感知基础。使计算机具有与人类相似的视觉处理能力,从而能更好地协助以至代替人的工作,这是人类长期追求的梦想。人类的视觉系统利用投影到视网膜上的二维的像对物体进行三维的理解。为此,计算机需要具有处理、分析和理解图像的能力。计算机视觉是一门用计算机来实现人的视觉功能,实现客观三维世界的识别的学科。 3) 模式识别 模式,是指事物及其信息。模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。模式包括的范围很广,往往表现为具有时间或空间的信息,图像就是模式的一种。识别是指从客观事实中自动建立符号描述或进行逻辑推理的数学和技术,因而人们定义模式识别是对客观世界中物体和过程进行分类、描述的学科。目前,对图像模式的识别主要集中在对图像中感兴趣的内容 (目标 )的分类、分析和描述。 模式识别在 目标 检测算法中有着很重要的作用,有很多算法是基于模式分类的技术来检测 目标 的。 4) 人工智能 人类智能主要指人类理解世界、判断事物、学习环境、规划行为、推理思维、解决问题等的能力。人工智能则指由人类用计算机模拟、执行或再生某些与人类智能有关功能的能力和技术。视觉功能是人类智能的一种体现,所以图像理解和计算机视觉与人工智能密相关。 西北工业大学明德学院本科毕业设计论文 7 文工作及内容安排 文的主要工作 本文通过阅读一定文献,对常用 视觉跟踪 方法进行研究的基础上,利用 台,首先通过摄像头捕获实时视频数据,然后利用 建立 模型检测到 跟踪目标 的位置,接着利用该位置初始化 目标 跟踪算法的跟踪窗口,最后 利用有效的 目标 跟踪算法实现对 目标 的跟踪。 目标 跟踪的算法是采用在预测区域进行彩色直方图穷举,得到最匹配的 目标 ,即跟踪成功。 文各章内容安排 全文共分为 4 章,各章内容安排如下 : 第 1 章 绪论,介绍了 视觉跟踪 问题的提出以及研究背景。说明了 视觉 跟踪研究的内容, 涉及的学科以及 应用领域。最后给出了本文的主要工作及论文各章的内容安排。 第 2 章 说明了基本跟踪方法以及跟踪难点,并 详细介绍了当前 目标 检测和跟踪的主要方法和研究方向,分析了各种方法的优缺点及其适用性。 第 3 章 就 目标 检测和跟踪系统的设计目标将该系统分为三部分:视频图像捕获模块、 目标 检测模块、 目标 跟踪模块,并对各模块进行了详细的介绍和分析。 第 4 章 对本文的工作进行了总结,介绍了文章中存在可改进的地方,并对下一步的工作做了展望。 西北工业大学明德学院本科毕业设计论文 8 第二章 视觉跟踪算法分析 标跟踪算法基础 目标跟踪方法有很多,迄今为止,没有权威的分类的方法,目标跟踪方法大体上可分为基于模型匹配的跟踪、基于区域匹配的跟踪、基于特征匹配的跟踪和基于运动特性的跟踪。另外也可以从基于前提假设条件来分类。 1)基于模型匹配的跟踪( 该方法利用点、线、区域把被跟踪的目的拟合成一个几何模型,如果可以得到描述特定目标的模型(也称模板),那么目标跟踪就变成了模板与在分析下的图像序列之间的特征匹配过程,运动目标的跟踪变成了目标识别的问题。这种方法充分利用了目标的特殊性质,与别的方法比较起来,更能适应复杂环境中的目标的跟踪。模板匹配可分为固定模板和可变模板。固定模板在目标形状不随摄像机视角改变而变化的情况下是可用的,而可变模板对于目标由于刚性和非刚性变形而变化的 情况是非常适合的。由于目标物体在运动过程中可能会出现旋转,大小,形状的变化,所以固定模板不能满足准确匹配的要求,在实际跟踪任务中常用的是可变模板。 2)基于区域匹配的跟踪( 区域匹配算法就是在当前帧中搜索上一帧中目标区域的相关度最大的区域,也可以叫做基于相关型( ,具体做法就是将目标图像在当前帧图像上以不同的偏移值位移,然后根据一定的相似性度量准则对每一个偏移值下重叠的两个图像,即目标图像和与目标 图像同样大小的当前帧图像进行相关处理,根据判别准则和相关处理结果,判断目标在实时图像中的位置,相似度最大对应的位置就是目标当前位置。这种方法在很多系统中应用,一方面因为他算法简单,另一方面,在图像中目标特征不明显,其他算法效果不是很明显的时候,区域匹配算法还能够有足够的精度。区域匹配算法计算量大,难以达到实时性的需求,而且能否准确分割也直接影响到算法的效果。由于区域匹配算法依据颜色信息,所以当场景遇到光照强度的变化,目标姿态的变化或者其他噪音的时候,算法可能失效。 3)基于特征匹配的跟踪( 西北工业大学明德学院本科毕业设计论文 9 实现跟踪,没有必要跟踪每一个点,在基于特征的目标跟踪中,选取目标的一部分特征点进行跟踪。思路是:选取目标中具有高度稳定性的显著特征序列(如角点、边界线条、线段、局部能量或者小面),这些特征应该不受外界因素影响,提取特征后,对特征属性矢量进行相关度匹配,相关系数峰值即为匹配位置。其优点是,即使场景中出现部分遮挡,只要有一些特征点可见,仍可以保持对运动目标的跟踪。特征点的选取是这种算法的关键所在,它应具有对目标的大小、位置、方位和照度变化不敏感,图像的特征可以是幅度 分布、频谱和几何特征。这些特征的提取容易,算法可靠,运算量小。但这类特征不是很稳健。另外还有一些图像的高级特征,比如小波特征,三维特征等。小波特征在时域、空域都具有很好的分辨率,一些小波同时也具有很好的人类视觉特性。这类特征量比较稳健,抗干扰性好,但是这类特征的提取比较复杂。 4)基于运动特性的跟踪( 如果已知目标的一些运动特性,可以采用基于运动特性的跟踪算法。此算法一般可分为两种:一种是依据目标运动的连续性进行关联的算法,被用 在多种算法相融合的场合,只需要较少的计算就可以大大的提高跟踪的准确性;另外一种是运动预测跟踪算法,可以根据目标的物理运动特性来估计目标在下一时刻可能的位置。如果目标运动轨迹是光滑的,或者加速度是恒定的,即运动轨迹是线性的,且图像噪音是高斯噪音,可以采用卡尔曼滤波来预测目标在下一帧中的位置;如果运动轨迹不是线性的,可以使用扩展卡尔曼滤波;如果噪音不是高斯分布,可以使用粒子滤波来实现预测。复杂环境中目标跟踪常用的方法是粒子滤波。 其他方法如主动轮廓线,频率域匹配,光流分析,帧差分跟踪算法,记忆外推跟踪算 法等都是基于以上四种算法发展或改进来的。 标跟踪中的难点 目标检测的基础就是对动态序列图像的运动分析,关键是目标检测跟踪的准确性和智能化的程度。但是众多因素会导致图像灰度和内容产生变化,例如物体本身随着运动变大变小、摄像机与物体产生的相对运动、场景环境的变化等,从而使跟踪的过程变得比较复杂。 由于各种跟踪算法都有自己的偏重点,所以没有通用的跟踪算法。在不同的环境下要选择适当的跟踪算法。但是影响目标跟踪有一些共同的因素,主要有: 1)复杂的背景:在基于颜色的跟踪算法中,与目标 颜色相似的背景容易导致跟踪失败; 西北工业大学明德学院本科毕业设计论文 10 2)光照的变化:光照的变化引起目标颜色的变化,从而导致目标模板不可靠,而且也容易使得背景颜色发生变化,对某些算法中目标检测产生影响; 3)阴影问题:阴影属于非运动目标区域,但是与背景颜色存在差别,给运动目标检测带来很大困难; 4)目标的形变:在基于模板或特征的跟踪中,形变使得原始模板或特征目标无效; 5)遮挡问题:目标被非目标物体遮挡,或者多个目标之间互相遮挡; 6)摄像机架的抖动:抖动会导致目标与背景之间的相对平移和变形,会导致很多 相关问题出现; 7)目标的初始化:目标初始化的精度直接影响到跟踪结果的精度; 8)实时性要求:由于实时性系统的要求,目标跟踪过程必然要降低精度来提高速度,如何在提高速度同时也提高精度,这是一难点。 标 检测的基本概念和主要技术方法 标 检测的基本概念 所谓 目标 检测,一般指在图像中定位目标 。 如果图像中含有目标,则获取 当前 目标的位置、大小、姿态等信息,进一步可以提取目标的特征。目标检测问题的探索开始于八十年代末、九十年代初,吸引了越来越多的研究者的兴趣,取得了一批有意义的研究 成果。本课题的研究目标是要在复杂的背景下,尽量快速准确地判断出输入图像或者视频流中目标的存在与否,如果有目标,则给出该目标的相关信息。 标检测的主要技术 由于目标多式多样 , 检测起来 受到多种因素的影响, 因此 要从一幅图像中检测 目标的方法一般可以分为以下四种: 1)基于知识的方法( 它将典型的目标形成规则库对目标进行编码。通常,通过 典型 特征之间的关系进行目标定位。 2)特征不变方法( 该算法的目的是在姿态、视角或光照条件改变的情况下找到存在的结构特征,然后使用这些特征确定目标。 3)模板匹配方法( 存储几种标准的目标模式,用来分别描述整个目标特征;计算输入图像和存储的模式间的相互关系并用于检测。 4)基于外观的方法( 与模板匹配方法相反,从训练图像集中进行学习从而获得模型(或模板),并将这些模型用于检测。 这种分类被认为是比较合理的分类方法,并为很 多文章所引用。以下对这四种 检测西北工业大学明德学院本科毕业设计论文 11 方法分别 以对人脸检测作为实例 进行介绍 48。 于知识的方法 基于知识的方法是基于规则的人脸检测方法,规则来源于研究者关于人脸的先验知识。一般说来,很容易提出一些简单的规则来描述人脸特征和它们的相互关系,比如在一幅图像中出现的人脸,通常具有互相对称的两只眼睛、一个鼻子和一张嘴,灰度图像中眼睛要比脸上其他地方暗等等。这些特征之间的相互关系可以通过它们的相对距离,位置或像素值之间的一定关系来描述。检测时首先在输入图像中提取面部特征,确定基于编码规则的人脸候 选区域。 这种方法存在的问题是难以将人 脸 知识转换为明确定义的规则。由于实际可能出现的人脸是千变万化的,如果规则制订的过于详细 , 则会出现真正的人脸不能通过所有的规则,检测可能失败 , 如果规则太通用,可能会有较高的误检率。此外,很难将这种方法扩展到在不同的位置和姿态下人脸的检测,因为列举所有的情况将是一项很困难的工作。 基于知识的方法中代表性的方法主要有: 使用分层的基于知识的人脸检测方法,他们的系统由三级规则组成。在最高级,通过扫描输入图像的窗口和应用每个位置的规则集找到 所有可能的人脸候选区。较高级的规则通常描述人脸看起来像什么,而较低级的规则依赖于面部特征的细节。另外, 提出了的基于规则的定位方法也较为典型。将输入图像的灰度值在水平和垂直方向进行投影,通过检测投影的变化来脸部特征。认为检测到两个局部的最小点对应于头部的左右两边,获得输入图像的水平轮廓。类似地可以获得垂直的轮廓,局部最小点的确定用于定位嘴唇、鼻尖和眼睛。这些检测到的特征组成了面部候选区。 征不变的方法 与基于知识的自顶向下的方法相反,特征不变的方法 是自下而上地寻找人脸的不变特征用于人脸检测。这种方法的一个前提就是,既然人们能够从不同的姿态,光照环境等等不同情况下很容易的发现人脸,那么在这些变化的情况背后一定存在一些不变的人脸固有的特征。特征不变的方法的目的就是找出这些特征的存在从而进一步推之人脸的存在。 人们已经提出了许多先检测人脸面部特征,后推断人脸是否存在的方法。面部特征,如眉毛、眼睛、鼻子、嘴和发际,一般利用边缘检测器提取;也有很多方法是基于肤色在不同颜色空间的分布来提取特征,将这些特征建立统计模型描述它们之间的关系并确西北工业大学明德学院本科毕业设计论文 12 定存在的人脸。这 些算法存在的问题是,由于光照、噪声和遮挡等的存在使图像中的人脸特征 可能被严重地破坏,人脸的特征边界被弱化,阴影可能引起很强的边缘,光照变化使得肤色不能被正确的识别,而这些影响可能使得算法难以使用。 板匹配的方法 模板匹配的方法中,首先需要人工预定义或给出参数化的函数来描述一个标准的人脸模式 , 通常是正面人脸。给定一幅输入图像,分别计算其与标准模板的人脸轮廓,眼睛,鼻子和嘴之间的相关值,人脸的存在与否由这些相关值来确定。这一方法的好处在于容易实现,但是,对于人脸的尺度,位置,形状的变化的适 应性不佳使得其应用性上不足。为了达到人脸检测的目的,又提出了多重分辨率,子模板,可变形模板等方法来改进算法的性能。 于外观的方法 基于外观方法中的“模板”是从图像中的样本学习得到的。通常,基于外观的方法依靠统计分析和机器学习技术找到相应的人脸和非人脸图像的特征。学习的特征通常由分布模型或判别函数形成,用于人脸检测。同时,对于计算效率和检测结果的有效性的考虑,通常需要对特征进行降维处理。许多基于外观的方法可以被理解为概率结构。从图像中提取的特征向量可以看作是一个任意的变量 x,此随机变量通 过类条件概率密度函数 p(x/ p(x/述人脸和非人脸。可以用 类器将一个候选图像位置分类为人脸或非人脸。但是 x 的高维度使简单实现 类器是不可行的,因为 p(x/ p(x/多峰的, p(x/ p(x/否存在自然参数化的形式还不清楚。因此,在基于外观的方法中,大多数工作涉及的是由经验确定的参数或用非参数方法近似 p(x/ p(x/这方面人们主要研究了特征脸方法和基于分布的方 法用于人脸检测。另一种方法是在人脸和非人脸之间找到判别函数。通常将图像模式投影到较低的维数空间,然后形成判别函数进行分类,或者利用多层神经元网络形成非线性的决策面。 在这一方面的研究中,特征脸方法尤其值得一提。特征脸方法最初由 995 提出,首先应用于人脸识别的研究中。其中应用的 换, 思想是人脸检测和识别中的经典思路,随后陆续出现了许多优秀的基于特征脸思想的人脸检测和识别方法,典型的 有 决特征法等。 上述的各种方法都存在着自身的优缺点和适 用领域,研究者们在各自所面临的问题的 范围内不断探索,提出了许多卓有成效的检测算法。但是,无论什么样的检测算法,西北工业大学明德学院本科毕业设计论文 13 都存在着效率与性能上的矛盾。检测率更高、鲁棒性能更好的算法通常会花费更多的时间及系统消耗。因此,在设计人脸检测系统时,需要把效率与性能综合考虑,从系统应用的角度出发,选用合适的算法,从而找到效率和性能的最佳结合点,使检测系统从整体上达到最优。 标 跟踪的基本概念及主要技术 标跟踪的基本概念 目标跟踪是指在输入图像序列中确定某个目标的运动轨迹及大小变化的过程。目标跟踪技术 具有重要的潜在应用价值,它作为自动目标识别、基于模型的编码、视频检索、视觉监测等领域中的一项关键技术,受到研究者的普遍重视。 标跟踪主要方法 目标跟踪方法主要有:基于肤色信息的方法、基于运动信息的方法、基于运动模型的方法、基于局部器官特征的方法等 7。这些方法的共同出发点是利用相关的启发性知识(如根据肤色和运动信息限定搜索空间)达到快速跟踪的目的,通常只使用了人脸的一小部分或局部器官的分布信息,在一些典型的约束环境下(如背景简单静止的视频、工作台前的人脸或头肩部人脸视频等)可以取得很 好的人脸跟踪效果。需要说明的是这些方法一般建立在人脸初始位置大致已知的基础上,需要使用其它方法解决起始帧中人脸的检测问题。当考虑较大范围的复杂动态变化背景下的人脸跟踪问题(如视觉监视问题)时,由于存在类似肤色的区域或其它运动的目标,单靠启发性知识是很不可靠的。针对这一问题,以人脸检测技术为基础,利用图像序列前后帧中人脸在位置和大小上存在的关联性限定搜索空间,实现快速可靠的人脸跟踪。 跟踪算法是根据已有的人脸定位结果,预测新一帧中各个人脸对应的监视区域并在其约束的范围内检测人脸。由于人体运动具有随意性 (如突然改变运动方向),因而在对人物行为缺乏理解的前提下,利用已有的人脸运动轨迹预测新的监视区域具有一定的难度。 人脸跟踪可以缩小检测范围,从而有望达到实时性。国内外对人脸跟踪及姿态估计的研究者提出了各种各样的方法。目前常见的跟踪技术大致可分为两种:基于运动的方法及基于模型的方法。 基于运动方法是采用运动分割、光流、立体视觉等方法,利用时空梯度、卡尔曼滤波器等跟踪人脸运动。具体算法有: 1)光流场方法 : 通过分割二维平面上的不同的光流得出光流场进行跟踪。为了避免西北工业大学明德学院本科毕业设计论文 14 二维模型的弊端,利用这种 技术和一个三维模型结合。这样的可以跟踪到大角度的旋转和远距离平移 , 但是结果非常的不准确。 2)块匹配 : 标定一些人脸的特征点,利用卡尔曼滤波器预测一个搜索窗口,在这个搜索窗口内搜索与特征点灰度分布相似的点,这样的点有可能会找到很多,用一定的规则选定最接近的点 , 通过这些点确定被人脸的运动状况。 基于模型的方法首先获取目标的先验知识,构造目标模型,对输入的每一帧图像通过滑动窗口进行模型匹配。具体算法有: 1) 椭圆模板 : 2001 年, 出了基于一个三维人脸网格的跟踪方法,其利用 纹理信息和特征点之间的形状约束加大跟踪的准确性。这些算法虽然有很高的准确度,但速度非常的慢,离实时要求还有很大的距离。 2) 肤色模型 : 出了基于统计颜色模型和可变形模扳的实时人脸跟踪系统。这个算法可以跟踪多个人脸,并能处理一些遮挡问题。肤色模型方法的特点是非常快,但是跟踪的不准确。 一个功能强大的 C/C+接口的 计算机视觉 库,能够实现绝大多数的图像处理功能,库自身有完善的数据结构和类型, 并 根据 理器进行了优化 。由于本文的人脸 视频捕获中用到了 ,在这里做一点简单的介绍。 开放源代码的计算机视觉类库 英特尔公司位于俄罗斯的研究实验室所开发,它是一套可免费获得的由一些 C 函数和C+ 类所组成的库,用来实现一些常用的图像处理及计算机视觉算法。 英特尔公司所开发的另一图像处理库 容, 于实现对数字图像的一些低级处理,而 主 要用于对图像进行一些高级处理,比如说特征检测与跟踪、运动分析、目标分割与识别以及 3D 重建等。由于 源代码是完全开放的,而且源代码的编写简洁而又高效,特别是其中大部分的函数都已经过汇编最优化,以使之能高效而充分地利用 列处理芯片的设计体系。由于 代码执行效率是非常高的,所以近年来在国外的图像处理相关领域中被广泛地使用,成为一种流行的图像处理软件。 特点 相对于其它常用的图像处理软件来说, 其显著的不可比拟的优点,主要体现在如 下几个方面: 西北工业大学明德学院本科毕业设计论文 15 1) 一个包含了超过 300 个 C 函数的应用编程接口,它不依赖于外部库,既可以独立运行,也可在运行时使用其它外部库。 2)高性能: 所有的算法都是基于封装于 具有很高灵活性的动态数据结构,而且其中有一半以上的函数在设计及汇编时被 司针对其所生产的处理器进行了优化。 3)开放性:不管对于商业的还是非商业的用途, 是完全免费的,其源代码完全开放,开发者可以对源代码进行修改,将自己设计的新类添加到库中,只要设计符合规范,自己的代 码也可以被别人广泛使用。 4)可移植性:由于 大部分库函数基本上采用 C 或 C+语言编写,因此可以方便地移植到其它如 嵌入式微处理器中。 函数体系 每个函数的命名都以“ 始,然后是该函数的行为及目标。例如用来创建图像的函数“ 载入图像的函数“ 为图像处理及计算机视觉在实际工程中的应用而设计的一个类库,其中所有的函数都由于其在实际应用中所实现的不同的功能 而分属不同的类型,主要的函数类型有: 1)基本的图像处理与分析函数:这个类型的函数主要用于实现一些基本的图像处理与分析功能,例如图像平滑函数 子 缘分割函数。 2)结构分析函数:包括有轮廓处理函数,几何学函数以及平面细分函数。 3)运动分析与目标跟踪函数:包括有用于运动分析与目标跟踪的函数,例如背景重建函数 光流法或动态轮廓模型来实现目标跟踪的函数 及卡尔曼滤波函数 。 4)摄像机标定和 3D 重建函数:包括有用于摄像机标定,姿态估计以及从两个摄像机进行 3D 相似重构的函数。 5) 视频处理函数:包括有高级图形用户接口 以实现对图像的载入、显示及保存等基本操作以及用以实现视频输入输出及处理的函数。 根据上述的函数体系,程序开发者可以根据自己所开发应用程序所要实现的功能来方便地选择所需的库函数,从而大大减少开发时间和精力,缩短程序开发的周期。 C+要配置 在安装完 后,在 中使用 置如下: 西北工业大学明德学院本科毕业设计论文 16 1) 创建一个新的工程 选择 2) 新建一个文件,选择 C+ 入到刚才新建的工程 。 3)选择“工程( 中的“设置( 选择“ ( 如下图 4) 选择菜单 工程( 设置( C/ C+,在下拉列表中选择 预处理器( ,在 附加包含路径( 框中加 入:d:cvd:d:d:图 图 北工业大学明德学院本科毕业设计论文 17 图 ) 选择菜单 工程( -设置( - 连接( ,在下 拉列表中选择输入( ,在 d:如图 图 ) 选择菜单 下拉列表中选择 入三个库文件: 图 西北工业大学明德学院本科毕业设计论文 18 图 成了上面的几步后就可以在 平台上使用 库了。 西北工业大学明德学院本科毕业设计论文 19 第三章 视觉跟踪系统实现 标检 测和跟踪系统的设计目标 1)实时性 : 本系统处理的图像输入是视频,可以实时检测、跟踪目标。因此本系统应当采用计算量相对较小的算法,在系统结构设计上也应当考虑到这一点。 2)自动化 : 系统将自动对进入摄像头视野范围内的感兴趣区域 (目标 )进行检测、跟踪,当发现有可供检测的目标出现时,自动
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
提示  人人文库网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文
本文标题:【JL102】视觉跟踪技术研究
链接地址:https://www.renrendoc.com/p-687222.html

官方联系方式

2:不支持迅雷下载,请使用浏览器下载   
3:不支持QQ浏览器下载,请用其他浏览器   
4:下载后的文档和图纸-无水印   
5:文档经过压缩,下载后原文更清晰   
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

网站客服QQ:2881952447     

copyright@ 2020-2025  renrendoc.com 人人文库版权所有   联系电话:400-852-1180

备案号:蜀ICP备2022000484号-2       经营许可证: 川B2-20220663       公网安备川公网安备: 51019002004831号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知人人文库网,我们立即给予删除!