目标检测PPT完整版_第1页
目标检测PPT完整版_第2页
目标检测PPT完整版_第3页
目标检测PPT完整版_第4页
目标检测PPT完整版_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章目标检测与识别Lecture12ObjectDetectionandRecognition4/24/20231目标检测和识别怎样检测和识别图像中物体,如汽车、牛等?4/24/20232目标识别的应用4/24/20233难点之一:如何鲁棒识别?4/24/20234类内差异(intra-classvariability)4/24/20235类间相似性(inter-classsimilarity)4/24/20236难点之二:计算量大一幅图像中像素个数多,目前每秒约产生300G像素的图像/视频数据。 -Google图片搜索中已有几十亿幅图像 -全球数字照相机一年产生180亿张以上的图片(2004年) -全球一年销售约3亿部照相手机(2005)人的物体识别能力是强大的 -灵长类动物约使用大脑皮层的一半来处理视觉信息[FellemanandvanEssen1991] -可以识别3,000-30,000种物体 -物体姿态可允许30度以上的自由度。4/24/20237难点之三:如何在小样本条件下学习4/24/20238物体识别方法检测(detection)vs.不检测表示(representation) -颜色、纹理、边缘、梯度、局部特征、深度、运动等等。分类(classificationorcategorization) -K近邻(KNN) -神经网络(NN) -支持向量机(SVM) -Boosting(Adaboost等) -隐马尔科夫模型(HMM) -其他生成学习(Generativelearning)vs.判别学习(discriminativelearning)4/24/20239生成学习vs.判别学习两种分类器学习模式生成学习

---目标是学习到符合训练数据的类别模型 ---如EM算法(MaximumLikelihood)判别学习在训练阶段即考虑类别之间的判别信息包括SupportVectorMachines(SVMs),Boosting,MinimumClassificationError(MCE),MaximumMutualInformation(MMI),LagerMargin(LM),andetc.判别学习算法比生成学习算法表现出更好的分类性能。4/24/202310判别学习方法4/24/202311第二节人脸检测与识别4/24/202312131.物体检测Car/non-carClassifierYes,car.No,notacar.基于二分类器4/24/202314物体检测Car/non-carClassifier在复杂背景下,通过滑动窗口(slidingwindows)搜索感兴趣的物体。4/24/2023物体检测Step1.获取训练数据Step2.提取特征Step3.训练分类器Step4.利用分类器进行检测4/24/202315人脸检测(Facedetection)Viola-Jones人脸检测算法(基于AdaBoost)4/24/202316Viola-Jones人脸检测算法(2004)4/24/202317滤波器设计4/24/202318AdaboostAdaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特徵,并将关键放在关键的训练数据上面。

4/24/202319BoostingExample4/24/202320BoostingExample4/24/202321BoostingExample4/24/202322BoostingExample4/24/202323BoostingExample4/24/202324BoostingExample4/24/202325Adaboost学习目标:选择能够最有效地区分人脸与非人脸的矩形特征及其阈值4/24/202326Adaboost组合弱分类器(weaklearners),得到更为精确的集成分类器(ensembleclassifier)。弱分类器:性能仅比随机分类稍好根据矩形特征定义弱分类器:4/24/202327Adaboost算法步骤初始给每个训练样本以同等权重循环执行以下步骤:根据当前加权训练集,选择最佳弱分类器提升被当前弱分类器错分的训练样本的权重按照各弱分类器分类精度对其加权,然后将各个弱分类器形成线性组合,得到最终分类器。4/24/202328Viola-Jones算法中的AdaBoost每一次boosting迭代如下:评价每一个样本上的每一种矩形特征为每一种矩形特征选择最佳分类阈值选择最优的矩形特征及其阈值组合改变样本权重计算复杂度:O(MNT)

M:特征数,N:样本数,T:阈值数4/24/2023294/24/202330级联分类器(CascadingClassifiers)4/24/202331训练级联分类器4/24/202332Viola-Jones检测算法-总体流程用5K正样本,350M反样本学习得到38层(共使用6060个特征)级联分类获得实时性4/24/202333Viola-Jones人脸检测结果4/24/202334Viola-Jones人脸检测结果4/24/202335Viola-Jones人脸检测结果4/24/2023362.人脸识别(facerecogntion)Zhaoetal.,FaceRecogniton:aliteraturesurvey.ACMComputingsurvey,20034/24/202337FaceRecognition:2-Dand3-D4/24/202338图像=像素的集合将由n个像素构成的图像视为n维空间中的点4/24/202339最近邻分类器4/24/202340Eigenfaces使用主成分分析技术(PrincipleComponentAnalysis,PCA)减少维数4/24/202341主成分分析(PCA,K-L变换)降低特征向量的维数获得最主要特征分量,减少相关性;避免维数灾难4/24/202342主成分分析(PCA,K-L变换)4/24/202343主成分分析(PCA,K-L变换)4/24/202344Eigenfaces学习1.计算训练图像的均值和协方差矩阵.2.计算协方差矩阵的特征值,取前k个最大特征值对应的特征矢量.3.将图像投影到k-维特征空间(Eigenspace)。识别1.将测试图像投影到Eigenspace.2.在特征图像上执行分类.4/24/202345Eigenfaces:训练图像4/24/202346Eigenfaces4/24/202347PCA方法的不足可能损失重要的细节信息方差最小的方向也可能是重要的没有考虑判别任务希望得到最具判别能力的特征但判别能力最佳并不等同于方差最大4/24/202348Fisherfaces:类特定的线性投影4/24/202349PCA&Fisher的线性判别函数4/24/202350PCA&Fisher的线性判别函数4/24/202351Fisherfaces示例(ORLDatabase)4/24/202352基于eigenfaces/fisherfaces的识别训练:-根据训练图像,利用PCA或Fisher方法确定投影矩阵-将每个训练图像投影到子空间(eigenspace或fisherspace)。识别:-将测试图像投影到eigenspace或fisherspace。-子空间中距离测试图像最近的训练图像对应的类别为识别结果。4/24/202353Project5:人脸合成平均人脸平均就是美4/24/202354Project5:人脸合成4/24/202355Project5:人脸合成4/24/2023562023/4/2457Project5:人脸合成4/24/202358Project5:人脸合成4/24/202359Project5:人脸合成FantaMorph,人脸合成软件4/24/202360Project5:人脸合成FantaMorph,人脸合成软件手动标定人脸4/24/202361Project5:人脸合成FantaMorph,人脸合成软件手动标定人脸4/24/202362Project5:人脸合成FantaMorph,人脸合成软件产生多张合成图像,随机或者平均输出4/24/202363Project5:人脸合成Task:利用人脸检测算法,将上述过程改为自动完成,实现自动人类合成。4/24/202364第三节深度学习导引4/24/202365第三节深度学习导引4/24/202366第三节深度学习导引4/24/202367第三节深度学习导引4/24/202368第三节深度学习导引4/24/202369第三节深度学习导引4/24/202370第三节深度学习导引4/24/202371第三节深度学习导引4/24/202372神经网络的基本结构4/24/202373神经网络的大量参数4/24/202374神经网络的表现能力4/24/202375神经网络的表现能力4/24/202376神经网络的表现能力4/24/202377神经网络的表现能力4/24/202378卷积神经网络4/24/202379卷积神经网络4/24/202380卷积神经网络4/24/202381卷积神经网络4/24/202382卷积神经网络4/24/202383卷积神经网络卷积层的作用4/24/202384卷积神经网络4/24/202385卷积神经网络4/24/202386卷积神经网络池化层的作用4/24/202387卷积神经网络4/24/202388卷积神经网络激活函数4/24/202389卷积神经网络4/24/202390卷积神经网络4/24/202391卷积神经网络4/24/202392卷积神经网络Softmax层的作用4/24/202393卷积神经网络4/24/202394卷积神经网络网络的预处理4/24/202395卷积神经网络的实例Alexnet4/24/202396卷积神经网络的实例Alexnet4/24/202397卷积神经网络的实例FCN网络4/24/202398卷积神经网络的实例FCN网络4/24/202399卷积神经网络的实例FCN网络4/24/2023100卷积神经网络的训练方法4/24/2023101卷积神经网络的训练方法4/24/2023

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论