机器视觉概述_第1页
机器视觉概述_第2页
机器视觉概述_第3页
机器视觉概述_第4页
机器视觉概述_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器(jīqì)视觉MachineVision2/4/20231精品资料参考书目:1、《图像处理、分析与机器视觉》(第二版)M.Sonka,V.Hlavac,R.Boyle著,艾海舟等译,人民邮电出版社,20032、《机器视觉教程》W.E.Snyder,H.Qi著林学訚等译,机械工业(gōngyè)出版社,20053、《计算机视觉》马颂德著,科学出版社,19992/4/20232精品资料第一章引论Chap1引论(yǐnlùn)讲解内容1.机器视觉的研究内容、特点及其应用。2.基础理论(Marr视觉计算、成像几何基础);3.课程学习内容。目的1.了解(liǎojiě)机器视觉的主要内容及相关知识,熟悉机器视觉与其他学科的关系;2.重点掌握Marr视觉计算理论及成像几何基础理论。2/4/20233精品资料1.1机器(jīqì)视觉

机器视觉:用计算机来模拟生物视觉功能的科学和技术。机器视觉系统的首要目标(mùbiāo)是利用图像创建或恢复现实世界模型,然后认知现实世界。•从二维图象恢复三维信息;•从原始图像数值描述产生语义描述。1.1.1基本概念机器视觉是信息科学领域的一个重大挑战性问题:•JimGray列出的12大信息科学问题之一:

Seeaswellasaperson.•BillGates:Thefutureofcomputingistomakecomputers

see,hear,speakandlearn.2/4/20234精品资料一、输入设备(inputdevice)-包括成像设备和数字化设备.成象设备是指通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行(jìnxíng)探测成象,得到关于场景或物体的二维或三维数字化图像。二、低层视觉(lowlevel)-主要是对输入的原始图像进行处理.这一过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩(sècǎi)等关于场景的基本特征;这一过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等。1.1机器视觉1.1.2研究内容2/4/20235精品资料三、中层视觉(middlelevel)-主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,实现(shíxiàn)的途径有立体视觉(stereovision)、测距成像(rangefinder)运动估计(motionestimation)、明暗特征、纹理特征等.系统标定、系统成像模型等研究内容一般也是在这个层次上进行的.四、高层(ɡāocénɡ)视觉(highlevel)-主要任务是在以物体为中心的坐标系中,在原始输入图像、图像基本特征、2.5维图的基础上,恢复物体的完整三维图,建立物体三维描述,识别三维物体并确定物体的位置和方向.五、体系结构(systemarchitecture)1.1机器视觉2/4/20236精品资料20世纪50年代归入模式识别----主要集中在二维图像分析和识别上,如光学字符识别,工件表面、显微图片和航空图片的分析和解释等。60年代,Roberts积木世界理论----开创了以理解三维场景为目的的三维计算机视觉的研究。70年代,Marr计算视觉理论----第一个较为完善的视觉系统(xìtǒng)框架,分三个层次进行处理。80年代以后,蓬勃发展----新概念、新方法、新理论不断涌现,如基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等。1.1机器(jīqì)视觉1.1.3发展概况2/4/20237精品资料(1)图像多义性(2)环境因素影响(yǐngxiǎng)(3)知识导引(4)大量数据1.1机器(jīqì)视觉1.1.4研究面临的困难2/4/20238精品资料主要(zhǔyào)期刊和会议1.1机器(jīqì)视觉•IEEET-PAMI,IJCV,IEEET-ImageProcessing,PatternRecognition,ComputerVisionandImageUnderstanding,ImageandVisionComputing,PRLetters,……•ICCV,CVPR,ICPR,ICIP,ECCV,ACCV,BMVC,MVA,……•自动化学报、计算机学报、软件学报、电子学报、中国图像图形学报、模式识别与人工智能、……2/4/20239精品资料1.2Marr视觉(shìjué)计算理论•MIT的DavidMarr在70年代末提出了第一个较为完善的视觉系统框架;•该框架立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果;•该框架尽管存在很多缺陷(quēxiàn),但过去20多年一直处于主导地位。D.Marr,Vision,1982.中译本:视觉计算理论,姚国正、刘磊、汪云九译,科学出版社,1988。2/4/202310精品资料1.2.1三个层次(céngcì)视觉信息处理系统分为(fēnwéi)三个层次:2/4/202311精品资料1.2.2视觉(shìjué)表示框架第一阶段(也称为早期阶段):将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图(primitivesketch);第二阶段(中期阶段):指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分(bùfen)的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(2.5dimensionalsketch);第三阶段(后期阶段):在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。2/4/202312精品资料表1-2由图像恢复形状信息(xìnxī)的表示框架名称目的基元图像光强表示图像中每一点的强度值基元图表示二维图像中的重要信息,主要是图像中的强度变化位置及其几何分布和组织结构零交叉,斑点,端点和不连续点,边缘片断,有效线段,组合群,曲线组织,边界2.5维图在以观测者为中心的坐标系中,表示可见表面的方向、深度值和不连续的轮廓局部表面朝向(“针”基元)离观测者的距离深度上的不连续点表面朝向的不连续点3维模型表示在以物体为中心的坐标系中,用由体积基元和面积基元构成的模块化多层次表示,描述形状及其空间组织形式.分层次组成若干三维模型,每个三维模型都是在几个轴线空间的基础上构成的,所有体积基元或面积形状基元都附着在轴线上.1.2.2视觉表示(biǎoshì)框架2/4/202313精品资料视觉处理框架基本上是自下而上,没有反馈;没有足够地重视知识的应用。基于感知特征群的物体(wùtǐ)识别理论框架,主动视觉理论框架,视觉集成理论框架等等。1.2Marr视觉(shìjué)计算理论Marr理论的不足2/4/202314精品资料1.3机器视觉(shìjué)的应用零件识别与定位(dìngwèi)产品检验移动机器人导航遥感图像分析医学图像分析安全、监控与跟踪国防系统其它(动画、体育、考古)应用领域2/4/202315精品资料Sojourner火星车前部图,中部的两个小突出(tūchū)是两个黑白CCD摄像机1.3机器(jīqì)视觉的应用2/4/202316精品资料Sojourner视觉(shìjué)系统获取的立体图象对障碍物探测示意图Sojourner视觉系统对场景的深度(shēndù)恢复1.3机器视觉的应用2/4/202317精品资料人脸跟踪(gēnzōng)演示1.3机器视觉(shìjué)的应用2/4/202318精品资料MITMediaLab,与虚拟生物(shēngwù)交互演示1.3机器(jīqì)视觉的应用2/4/202319精品资料(基于图象(túxiànɡ)序列的)五角大楼三维重建1.3机器视觉(shìjué)的应用2/4/202320精品资料三维人脸重建(zhònɡjiàn)1.3机器(jīqì)视觉的应用2/4/202321精品资料1.基于视觉(shìjué)感知与认知机理的图像分析与识别系统研究目标:突破基于人类视觉(shìjué)感知与认知机理的图像处理模型、关键技术和算法,建立个性化、高准确度的图像分析与识别系统。研究内容:分层交互的统计视觉(shìjué)计算模型与推理,基于感知整合机制的视觉(shìjué)模式识别技术,具有选择性注意机制的视觉(shìjué)信息搜索与多目标跟踪模型。863计划信息技术领域(lǐnɡyù)2006年度专题课题申请指南目标导向类课题:2/4/202322精品资料2.复杂应用(yìngyòng)环境下的生物特征识别系统研究目标:突破安全便捷的、高可靠性的多生物特征获取及识别算法,建立面向典型应用(yìngyòng)的生物特征识别与认证原型系统。研究内容:脸相、虹膜、掌纹等多生物特征获取技术,大规模生物特征库的分类和检索,具有鲁棒性的生物特征识别关键技术,面向实际应用(yìngyòng)需求的多种生物特征的融合技术等。863计划信息技术领域2006年度(niándù)专题课题申请指南目标导向类课题:2/4/202323精品资料1.4机器视觉(shìjué)与其它学科关系机器(jīqì)视觉VS图像处理•图像处理(ImageProcessing):实现从输入图像到另一种图像的转换•图像处理:人是最终的解释者•机器视觉:计算机是图像的解释者•机器视觉系统需要图像处理模块2/4/202324精品资料1.4机器(jīqì)视觉与其它学科关系机器(jīqì)视觉VS计算机图形学•计算机图形学:从三维描述到二维图像显示•机器视觉:从二维图像数据到三维描述•在一定意义上讲,计算机视觉是计算机图形学的逆问题•两者从最初相互独立的平行发展到最近的融合是一大趋势2/4/202325精品资料1.4机器(jīqì)视觉与其它学科关系机器(jīqì)视觉VS模式识别•模式识别:研究各类模式的分类,其中模式可以有不同的物理意义和表现形式•图像模式的分类是计算机视觉中的一个重要问题•模式识别中的许多方法可以应用于计算机视觉中2/4/202326精品资料1.4机器视觉与其它学科(xuékē)关系机器视觉(shìjué)VS人工智能•人工智能:主要研究智能系统的设计和有关智能的计算理论与方法•AImaybeconsideredashavingthreestages:perception,cognitionandaction•计算机视觉经常被视为AI的一个分支2/4/202327精品资料图1.6透视投影倒立(dàolì)成像几何示意图1.5成像几何(jǐhé)基础1.5.1透视投影2/4/202328精品资料图1.7透视(tòushì)投影几何示意图

1.5.1透视(t

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论