客流统计项目技术报告.pptx_第1页
客流统计项目技术报告.pptx_第2页
客流统计项目技术报告.pptx_第3页
客流统计项目技术报告.pptx_第4页
客流统计项目技术报告.pptx_第5页
免费预览已结束,剩余36页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于双目视觉的客流统计系统 报告人 过嗣聪报告时间 2016年9月xx日 概述 双目立体视觉介绍立体匹配算法目标检测与跟踪总结 双目立体视觉介绍 什么是立体视觉 立体视觉是利用两个及以上的相机来测量物体深度的技术属于计算机视觉的一种实时性和硬件平台实现是其研究重点之一 普通相机 单目 左图是相机成像的简化模型P Q是视场中不同的两点 但他们在图像上的投影确相同 图像平面O 光心 透镜中心 f 焦距 双目相机 如果能找到两幅图像上的对应点 对应空间中同一点 那么根据三角几何关系 就能计算出该点的深度 如何找出对应点 二维搜索计算量十分巨大 而且很难找到全局最优解 事实上 对应点必定出现在对应的极线 极线约束条件 绿色实线表示右目图像的一条极线 即红色虚线上的点在右图上的投影 极线约束指出 红色虚线在左图上的投影必定出现在右图对应的极线上 标准形式的双目相机 为了方便计算 我们会把两幅图像矫正成标准形式 图像的扫描行就是极线 并且焦距保持一致 也就是说 我们只需在图像的扫描行上搜索对应点即可 矫正前 矫正后 视差 视差和深度计算 左图 参考图 右图 目标图 视差图 容易看出 物体越近 视差越大 对应视差图中越亮的部分 代表距离的平面分布并不均匀 随着距离的增加 精度会急剧下降 但在公交客流统计中 检测深度一般不会超过3米 可以达到精度要求 空间被分解成一个个离散的平面 代表不同距离 对应不同的视差 双目视觉系统一般流程 目的是计算出摄像头的内部参数和外部参数内部参数 焦距 图像主点位置 镜头失真参数外部参数 平移矩阵T 旋转矩阵R 相机标定 离线 图像矫正 目的是有二 去除镜头的桶形失真使得图像对变成标准形式 即行对准 立体匹配的目的就是找到图像对之间的匹配点 进而得到视差 立体匹配 到此 我们获得了视差图 基线b 焦距f 深度计算公式 在结合三角几何公式 就能计算所有图像点在三维空间中的位置 X Y Z 深度图计算 立体匹配算法 立体匹配算法 局部匹配 速度较快 精度不高全局匹配 速度较慢 精度较高 立体匹配算法 ScharsteinandSzeliski指出立体匹配算法通常包含以下4个步骤 或其中的几个 匹配代价计算代价积累视差计算 优化视差提精 局部匹配算法 1 2 3 直接用WTA求解 全局匹配算法 1 3 全局或半全局优化后再用WTA求解 匹配代价计算 匹配代价是指基准图像 左图 上一点p与目标图像 右图 上可能的匹配点q的相似性度量 ost 这里介绍2种像素级的相似性度量 基于灰度差分的匹配代价 BirchfieldandTomasi 基于Census变换的匹配代价 BT匹配代价 BirchfieldandTomasi把p和q的灰度差的绝对值定义为匹配代价 1 改进形式 基于Census变换的匹配代价 首先 对图像进行统计变换 CensusTransform 该变换定义为 以3x3窗口为例 比较此窗口中每个像素值与中心像素值的大小 如果比中心像素值小 则比较结果为1 否则为0 然后把这些结果组成一个二进制的数 并代替当前像素值 11010100 212 汉明距离 对于两个等长字符串s1与s2 他们之间的汉明距离就是相应位置上存在不同字符的数量 例如字符串 1111 与 1001 之间的汉明距离为2 计算方法 Cost POPCNT s1XORs2 注 POPCNT计算一个二进制数中 1 的位数 视差空间 DisparitySpace 根据前面的代价计算 对于基准图像上一点p及视差d 总有 如图 x y平面表示图像平面 d轴表示视差从0 max变化 那么对于一个三维坐标 x y d 就有C x y d Cost 所以视差空间是一个三维数组 里面存放的是匹配代价 ost 视差计算 那么 计算图像视差的过程就变成 遍历每个像素点 计算使得当前代价C x y d 最小的d 即winner take all WTA 匹配代价是定义在像素等级上的 像素与像素之间缺少联系 那么 相应的视差图会存在大量的视差不连续的点 视差优化 Hirschmuller提出了Semi GlobalMatching 用于平滑视差图 在x y平面上按照某一方向r 遍历每一个p x y 第一项表示点p视差为d时的匹配代价 第二项表示视差平滑约束 p r表示r方向上前一个像素点 1表示当前像素与前一个像素相比视差改变较小时给予的惩罚 用于平滑物体表面的纹理 而 2表示视差改变较大时的惩罚 用于平滑物体边缘的视差不连续 并且必须保证 2 1 第三项用于限制匹配代价的增长 所以匹配代价的上限是 2 如图是沿着从右到左方向代价积累后得到视差图 可以看出视差图连续性上已经有了明显的提高 但存在明显的拖尾效应 这是因为图像在水平方向上约束太强 而竖直方向上约束太弱造成的 因此 我们可以在多个方向上分别进行代价积累 再把多个方向的视差空间进行叠加 由此计算视差图可大大减少拖尾效应 视差优化 一致性检查 类似地 我们可以计算出右图对应的视差图 并按照下式一致性检查 其中p q表示一组对应点 视差精化 异常值滤波 一致性检查并不能去除所有异常值 视差图仍会残留一些小面积的异常值 我们使用基于连通域标记的异常值滤波器删除了这些异常块 视差精化 无效区域插值 视差图经过一致性检测后留下的视差无效区域 应该分为遮挡区域和误匹配区域 这是因为对于遮挡区域和误匹配区域的插值策略是截然不同 必须区别对待 图中遮挡点p1的极线穿过 中视差不连续处 而误匹配点p2与 相交 与代价积累中从8个方向搜索类似 对于每一个无效点 周围的8个视差值都会保存下来 然后按照下面的式子插值 第一项取第二小的视差值 保证了遮挡点的视差来自较低一级的背景 而第二项取中值 强调利用所有周围的信息 视差精化 无效区域插值 目标检测与跟踪 三维重建 三维重建是指依靠一些技术手段从视差图恢复出目标的三维信息 使目标检测更加准确 右侧是经过颜色编码的视差图 颜色越暖表示离摄像头越近 反之则越远 容易看出图中两个偏暖的区域分别对应左侧图像中的两个人 目标检测 乘客被建模成一个椭圆型的金字塔 其特征向量表示为 椭圆参数包括 长短轴 离心率 面积 中心坐标 高度等等 目标跟踪 假设前一帧图像中有m个目标 对应m个特征向量 而当前图像帧中有n个目标 对应n个特征向量 相似函数S i j 表示前一帧第i个目标和当前帧第j目标的相似度 第k 1帧 第k帧 总结 算法框架设计 原始图像对 图像矫正 立体匹配 背景差分 目标跟踪 存在的问题 视差图中的目标形状 高度各异 特别是在拥挤时 多个目标会连接在一起 基于特征的启发式目标检测方法并不能100 地检测出目标 在视差图中 特征向量会随目标运动而变化 因此目标的坐标在相似性测度当中占了较高的权重 现有的跟踪逻辑比较单一 当目标的特征向量极为相似时 会出现误跟踪的情况 参考文献 http vision middlebury edu stereo data DepthdiscontinuitiesbypixeltopixelstereoACensus BasedStereoVisionAlgorithmUsingModi edSemi GlobalMatchingandPlaneFittingtoImproveMatchingQualityStereoProcessingbySemi globalMatchingandMutualInformationUsingreal timestereovisionformobilerobotnavigationhttp www vision c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论