下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
模式识别简介1大媒体计算中心沈复民上节内容回顾模式识别、样本、特征、类的概念模式识别的应用:举出至少三种。可以处理哪几种信号或数据?模式识别系统的组成预处理操作、特征提取与选择相似度和距离:常用的距离有哪几种?KNN分类算法的步骤线性分类模型的形式几种常见的线性模型学习方法(分类器)2
人脸图像处理基础人脸图像的线性表示--线性回归人脸图像的稀疏表示基于线性表示的人脸识别系统3人脸图像处理基础4灰度图像图像在计算机中被表示为数字的组合,最小灰度值0(黑),最大灰度值255(白)5彩色图像彩色图像:每个像素的信息由RGB三原色构成,R、G、B由不同的灰度值来描述。6图像的向量化7。。。2550向量化为简化计算,一般将一副人脸图像表示为向量,多幅图像的组合表示为矩阵,每一列表示一个图像。8图像的信息量每个灰度值(0~255)用1个字节表示灰度图像256x25664KB彩色图像512x512768KB电视图像:每秒60帧,分辨率1920x1080,请问一小
时的电视节目(未压缩)占用的存储量是多少?9典型图像处理操作图像增强10典型图像处理操作图像复原11典型图像处理操作图像压缩12人脸图像的线性表示13线性回归描述因变量y
的平均值或期望值如何依赖于自变量x1,x2
,…,xp的方程——(多元)线性回归方程多元线性回归方程的形式为
y=0+1x1
+2x2
+…+p
xp1,2,…,
p称为回归系数,y,xi为n维列向量。i
表示当其他变量保持不变,xi每变动一个单位时y的变动值。14二元线性回归方程的直观解释15回归参数估计
16
最小二乘的矩阵形式
17
回归估计的正则化
18
正则化项
L1范数正则化(稀疏表示)
19L1范数正则化人脸图像的线性表示一幅人脸图像可以近似表示为一组人脸图像的线性组合20=0.5*+0.4*+0.1*
估计出的图像原图像
人脸图像的稀疏表示21=0.2*+0*+0*+…+0.8*+0*+0*+0*
稀疏表示效果22原图像表示系数图像库误差图像人脸识别系统设计
--基于线性表示的人脸识别23概要我们的任务是啥?我们有啥?如何提取人脸特征?用啥分类算法?如何评价我们的系统?24人脸识别的任务
25?训练数据库
26特征提取任何模式识别的特征提取算法。常用的人脸特征提取算法:LBP,Gabor。。。最简单、最常用的的特征——灰度值27特征变换1:重采样28300x200=6000030x20=600重采样图像相邻像素之间有很大的相似性。方法1:去近邻像素的灰度值方法2:插值特征变换2:线性变换
29
30PCA的解释把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。31最直观的分类思想32回顾:K最近邻分类器(KNN)计算待分类点到所有训练样本的距离,选出距离最短的k个训练样本;统计k个样本所在的类;将待分类点分配给包含k个训练样本中数目最多的类。33最近邻分类(NN)——KNN的简化计算待分类点到所有训练样本的距离;将待分类点分配给距离最小的那个训练样本所在的类。34分类的关键:计算待识别样本到各类的距离。或者计算待识别样本和各类之间的相似度。NN的分类依据:用距离待识别样本最近的样本代表本类,该距离作为本类到待识别样本的距离。35基于线性表示(线性回归)的分类器36
37
基于线性回归的分类准则测试图像到第i类的距离:测试图像在第i类的表示误差。38
基于线性表示的人脸识别算法流程将训练图像和测试图像表示为列向量:,将图像进行特征变换,e.g.,PCA:,利用最小二乘法求得表示系数计算测试图像到各类的距离:39基于稀疏表示的人脸识别出发点:不同类别的人脸图像之间存在相似性,例如人脸结构(分为额头、眼睛、鼻子、嘴等不同部分)、光照、姿势等。方法:用所有类别的人脸图像来表示测试图像。40
41基于稀疏表示人脸识别的分类准则分类准则1:表示误差42
基于稀疏表示人脸识别的分类准则分类准则2:表示稀疏本类样本对应的表示系数更大。43分类准则2:表示稀疏44
人脸识别系统评估
45人脸识别的应用46计算机视觉的三个不同阶段low-levelimages(图像)images(图像)mid-level images(图像)features(特征)high-level features(特征)analysis(分析)几个例子Low-Levelblurring(模糊)sharpening(增强)几个例子cannyORTMid-LeveloriginalimageedgeimageedgeimagecirculararcsandlinesegmentsdatastructureLow-LevelMid-levelK-meansclusteringoriginalcolorimageregionsofhomogeneouscolordatastructure几个例子edgeimageconsistentlineclusterslow-levelmid-levelhigh-levelLowtohigh-LevelBuilding
Recognition几个例子
其他计算机视觉应用行人检测(PedestrianDetection)行人检测(PedestrianDetection)应用范围:智能辅助驾驶智能监控行人分析智能机器人主要问题:性能和速度方面不能达到一个权衡
深度学习(DeepLearning)深度学习(Deeplearning)深度学习通过多角度、多层次的对训练数据学习,学出最具代表性的特征信息。深度学习已经取代传统人工设计的特征算法(如:SIFT,HOG,LBP),成为一种流行的特征学习方法。深度学习(DeepLearning)在计算机视觉领域,目前最流行的神经网络是卷积神经网络目前的CNN有多种不同的网络结构,但所有网络结构都是主要由卷积层、池化层、全连接层、输出层组成。直观理解:可视化卷积层直观理解:可视化卷积层
最左边的图像是原图像,作者盖住不同的区域,来分析对于一张图片,经过五次卷积之后,到底是如何判断的,我们看到卷积到最后(左三),比较凸显出来的是狗的头部,左二和右二的意思是,当我们遮住不同的区域,判断是狗的几率,红色区域代表概率很高,蓝色区域代表概率很低,我们发现,当我们遮挡住狗的头的地方的时候,我们得到这个物体时狗的概率最低。
VisualizingandUnderstandingConvolutionalNetworks --MatthewD.ZeilerandRobFergus
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 自助直播活动策划方案(3篇)
- 长沙滑梯施工方案(3篇)
- 新年房车活动策划方案(3篇)
- 施工方案采购标准(3篇)
- 临时花坛施工方案(3篇)
- 电话电缆施工方案(3篇)
- 2025年图书资料馆管理与服务指南
- 指标体系评价培训
- 2025年大学学前教育(学前教育心理学)试题及答案
- 2025年高职第一学年(药学)药理学试题及答案
- 医院检查、检验结果互认制度
- 学堂在线 雨课堂 学堂云 科研伦理与学术规范 期末考试答案
- 福建省厦门市七年级语文上学期期末测试题(含答案)
- 无人机驾驶员培训计划及大纲
- 五轴加工管理制度
- 4M变化点管理记录表
- Tickets-please《请买票》 赏析完整
- 《马克的怪病》课件
- 部编版八年级道德与法治上册《树立维护国家利益意识捍卫国家利益》教案及教学反思
- 基于单片机的智能家居控制系统设计
- 锅炉大件吊装方案
评论
0/150
提交评论