已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
FastRCNN 继2014年的RCNN之后 RossGirshick在15年推出FastRCNN 构思精巧 流程更为紧凑 大幅提升了目标检测的速度 在Github上提供了源码 同样使用最大规模的网络 FastRCNN和RCNN相比 训练时间从84小时减少为9 5小时 快了9倍 测试时间从47秒减少为0 32秒 快了213倍 在PASCALVOC2007上的准确率相差无几 约在66 67 之间 为什么有了RCNN还要提出FastRCNN 因为前者有3个缺点 1 训练是多阶段的 先提proposal 然后CNN提取特征 之后用SVM分类器 最后再做bounding boxregression 2 训练非常耗费时间和空间 存储 在训练SVM和bboxregression的时候 需要先将之前提取出来的特征写入磁盘中 这些特征需要花费的空间很大 这个过程也非常耗费时间 3 物体检测非常慢 测试的时候 特征需要从每个图片中的每个proposal提取 使用VGG16网络大概每张图片耗费47s 在一个GPU上 1 FastRCNN方法解决了RCNN方法的三个问题 问题一 测试时速度慢RCNN一张图像内候选框之间大量重叠 提取特征操作冗余 FRCNN将整张图像归一化后直接送入深度网络 在邻接时 才加入候选框信息 在末尾的少数几层处理每个候选框 问题二 训练时速度慢原因同上 在训练时 FRCNN先将一张图像送入网络 紧接着送入从这幅图像上提取出的候选区域 这些候选区域的前几层特征不需要再重复计算 问题三 训练所需空间大RCNN中独立的分类器和回归器需要大量特征作为训练样本 FRCNN把类别判断和位置精调统一用深度网络实现 不再需要额外存储 FastRCNN的优点 相比于RCNN 1 比R CNN更高的检测质量 mAP 2 把多个任务的损失函数写到一起 实现单级的训练过程 3 在训练时可更新所有的层 4 不需要在磁盘中存储特征 2 FastRCNN的整体框架 整体框架如Figure1 如果以AlexNet 5个卷积和3个全连接 为例 大致的训练过程可以理解为 第一步 将这个完整的图片经过若干卷积层与maxpooling层 得到一个featuremap 第二步 用selectivesearch算法从这完整的图片中提取出objectproposals 即RoI 第三步 根据映射关系 可以得到每个objectproposal对应的featuremap 第四步 将第三步得到的featuremap经过RoIpoolinglayer得到固定大小的featuremap 变小了 第五步 经过2层全连接层 fc 得到固定大小的RoI特征向量 第六步 特征向量经由各自的FC层 得到两个输出向量 第一个是分类 使用softmax 第二个是每一类的boundingbox回归 3 简要流程图如下 说明 在训练的时候 分类与回归是一起训练的 总的loss是分类的loss加上回归的loss 计算公式如下 再用几句话总结 1 用selectivesearch在一张图片中生成约2000个objectproposal 即RoI 2 把它们整体输入到全卷积的网络中 在最后一个卷积层上对每个ROI求映射关系 并用一个RoIpoolinglayer来统一到相同的大小 fc featurevector即 提取一个固定维度的特征表示 3 继续经过两个全连接层 FC 得到特征向量 特征向量经由各自的FC层 得到两个输出向量 第一个是分类 使用softmax 第二个是每一类的boundingbox回归 4 RolpoolinglayerRolpoolinglayer的作用主要有两个 一个是将image中的rol定位到featuremap中对应patch 另一个是用一个单层的SPPlayer将这个featuremappatch下采样为大小固定的feature再传入全连接层 Multi tasklossFRCN有两个loss 以下分别介绍 对于分类loss 是一个N 1路的softmax输出 其中的N是类别个数 1是背景 对于回归loss 是一个4xN路输出的regressor 也就是说对于每个类别都会训练一个单独的regressor的意思 比较有意思的是 这里regressor的loss不是L2的 而是一个平滑的L1 形式如下
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2020-2025年土地登记代理人之土地登记代理实务全真模拟考试试卷A卷含答案
- 射血分数保留的心力衰竭诊断与治疗中国专家共识 2025解读
- 胆囊黏液囊肿的护理
- 雨课堂学堂在线学堂云《财税法学(辽宁大学 )》单元测试考核答案
- 高考化学“3+2”模拟练试卷含答案(十)
- 2026年房地产经纪协理之房地产经纪操作实务考试题库附参考答案【b卷】
- 2026年网络预约出租汽车驾驶员从业资格考试题库含答案【a卷】
- 2026年投资项目管理师之投资建设项目组织考试题库200道及参考答案(新)
- 中国移动总部2026校园招聘备考题库附答案
- 2026年网络预约出租汽车驾驶员从业资格考试题库及1套参考答案
- DB13-T 5810-2023 农田地膜残留监测技术规程
- 课内文言文知识点梳理(原文+注释+翻译) 统编版语文九年级下册
- 邮政社招笔试题
- DL∕T 1802-2018 水电厂自动发电控制及自动电压控制技术规范
- 配方管理制度(2篇)
- 基于NB-IOT智能宿舍安防系统设计
- 2024急性脑梗死溶栓规范诊治指南(附缺血性脑卒中急诊急救专家共识总结归纳表格)
- 碳汇经济与美丽中国智慧树知到期末考试答案章节答案2024年东北林业大学
- 《抽水蓄能电站施工监理规范》
- XF-T 3004-2020 汽车加油加气站消防安全管理
- 物联网应用技术职业生涯规划
评论
0/150
提交评论