计算机视觉绪论_第1页
计算机视觉绪论_第2页
计算机视觉绪论_第3页
计算机视觉绪论_第4页
计算机视觉绪论_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉概论ComputerVision,东北大学秦皇岛校自动化系,(谢姐3150博士实验室412 ),计算机视觉发展简史,计算机视觉研究内容,计算机视觉应用情况,计算机视觉发展讨论,计算机视觉相关学科,计算机视觉计算机视觉困难,计算机视觉发展简史,计算机视觉研究内容,计算机视觉应用状况计算机视觉发展讨论,计算机视觉相关学科,计算机视觉研究进展,计算机视觉面临困难,人通过视觉感知外界信息。 俗话说“百闻不如一见”,就是从视觉上感知环境信息的效率很高。 人类感知外界的信息,80%以上是通过视觉获得的,使电脑和机器人有视觉,是人类多年来的梦想。 目前,我们不能使计算机具有生物般高效灵活的视觉,但这一希望正在实现。 人类通过眼睛和大脑获取、处理和理解视觉信息。 周围环境的物体通过可见光的照射在人眼的视网膜上形成图像,从感光细胞转换为神经脉冲信号,通过神经纤维传递给大脑皮质进行处理和理解。 视觉不仅仅是感觉到光信号,还包括视觉信息的取得、传输、处理、存储和理解的全过程。 人们用相机取得环境影像,将其转换成数字信号,试图在计算机上实现视觉信息处理的全过程,形成了新兴的学科计算机视觉。 计算机视觉的研究目标是使计算机具有通过二维图像感知三维环境信息的能力。 该能力不仅能够感知到三维环境中的物体的几何信息,而且能够描述、存储、识别和理解机器的形状、位置、姿势、运动等。 计算机视觉的发展是对神经生理学、心理学和认知科学的动物视觉系统的研究,而计算机视觉已经发展出了独立的计算理论和算法,它没有刻意“模拟”生物视觉系统。 另外,视觉信息处理的概略,从计算机视觉研究,1950年代末开始,计算机开始作为实现人的智能和人的感觉的工具使用,为了通过计算机第一次通过机器实现体力的增长,能够实现头脑和感知能力的增长。 对人的视觉感知能力的计算机模拟会产生计算机视觉。 具体而言,计算机视觉应实现的基本目的是:根据一张或多张二维图像计算观测点与对象物体的距离,根据一个或多个二维图像计算从观测点到对象物体的运动参数,计算从一张或多张二维图像到观测点到对象物体的表面物理特性计算机视觉要实现的最终目的是简要地描述:通过使用二维投影图像来重构三维对象的可见部分,其实现了对三维场景的世界的理解,即实现了人的视觉系统的一些功能。 计算机视觉发展的简史,20世纪50年代:以统计模式识别,集中于二维图像的分析和识别:如光学文字识别、工件表面、显微照片和航空照片的分析和解释等。 1960年代: Roberts(1965 )从数字图像中用计算机程序提取立方体、稗状体、棱柱体等多面体的三维结构,记述了物体的形状和物体的空间关系。 Roberts的研究开始了以理解三维场景为目的的计算机视觉的研究。 Roberts对积木世界的创造性研究有很大的启示。 许多人相信,一旦理解了由白色积木玩具构成的三维世界,就能够理解更复杂的三维场景。 对积木世界的研究范围从边缘、角点等特征中提取出来,建立了从线、平面、曲面等几何因素分析到图像明暗、纹理、运动、图像几何学等多种数据结构和推理规律。 1970年代,出现了一些视觉应用系统。计算机视觉发展简史,70年代中期,麻省理工学院(MIT )人工智能(AI )实验室正式开设了“机器视觉”课程。 与此同时,MITAI实验室在国际上有很多知名学者参与了机器视觉理论、算法、系统设计开放、简单的研究。 DavidMarr教授于1973年在MITAI实验室领导了以博士生为主体的研究小组,1977年提出了与“积木世界”分析方法不同的计算机视觉理论。 该理论在80年代成为机械视觉研究领域的重要理论框架(Marr1982)。 从出版物的名称变化可以看出计算机视觉的学科进展: 1972,CGIP (计算机图形学和图像处理)创刊; 1983年,更名为CVGIP (计算机视觉、图形和图像处理)的1991年,分为CVGIP-GMIP (图形模型和图像处理)和CVGIP-IU (图像理解)两个版本的1995年,GMIP (图形模型和图像处理) 电脑视觉发展的简单历史,对电脑视觉的全球研究热潮从1980年代开始,到了80年代中期,电脑视觉蓬勃发展,新概念、新方法、新理论不断涌现。 迄今为止,计算机视觉仍是一个活跃的研究领域。 许多会议论文集和许多学术期刊反映了这方面的最新进展。 例如internationalconferencomputerviceandpatternrecognition、CVPR; internationalconferencomputervision,ICPR; internationalconfferenceoneonroboticsandautomation,ICRA; WorkshoponComputerVision,WCV; 还有很多其他会议,如IEEE和SPIE。 ieetranstractiononpatteernanalyssisandchineintelligence (pami )计算机视频,图形,andimageprocessing (cvg IP ) ieetransactionon IEEETransactiononSystem,Man,and cybernetics (SMC ) machinevisionandapplication; internationaljournloncomputervision (ijcv ) imageandvisioncomputing; PatternRecognition; computervisionandimageunderstanding .计算机视觉发展简史、计算机视觉研究内容、计算机视觉应用状况、计算机视觉发展讨论、计算机视觉相关学科、计算机视觉研究进展、计算机视觉研究进展、60年代初至今,计算机视觉已经历近50年的研究,并有一系列其主要研究分为三个阶段:阶段1 :以模型世界为主要对象的视觉基本方法研究阶段2 :以计算理论为核心的视觉模型研究阶段3 :以应用为目标的计算机视觉方法。 以模型世界为主要对象的视觉方法,这一阶段象征着Roberts的独创性工作三维重建1965年,Roberts (machiniepereeptionofthree-dimensional solids,1965 )从数字图像到立方体、稗状体、角在Roberts工作中引入了三维物体与二维图像的关系,采用了一些简单的边缘特征提取方法,引入了线段组合方法。 随后,人们对积木世界进行了深入的研究,研究范围从边缘、角点等特征中提取出来,分析到线、平面、曲面等几何要素,建立了图像明暗、纹理、运动及图像几何等多种数据结构和推理规则。 guzman (computerreconfigingofthredemensionalobjectsinavisualscene,1968 )首先是导入处理和启发式的哈夫曼(importbleobjectsasnonsensensense ) 1971 )、cloves(onseehinging,1971 )、waltz (generingsemancdscrepationfordrawingsceneswithadows,1972 )等研究堆积木的世界,用线段解释场景,处理阴影等问题积木世界的研究反映了视觉初期研究的特点,从简化的世界开始研究。 这些工作对视觉的发展起到了促进作用,但是在有些复杂的情况下并不起到作用。主要原因是,这个时期的工作是基于三维空间关系的分析,但三维关系的分析只是依赖于单纯的边缘线段等单纯的约束关系,还没有充分考虑人和其他动物的视觉系统感知三维空间关系的方式。 从20世纪70年代开始,以模型世界为主要对象的视觉方法、以计算理论为中心的视觉模型,进入计算机视觉研究更合理阶段的主要出发点是从生理学、光学和投影几何的方法来研究成像及其逆问题。 主要着眼于各种固有特性的恢复,包括三维形状、运动、光源等的恢复。 在这个阶段,以Marr为代表的研究者中,提出了以表现为核心、以算法为中间变换过程的通常的视觉处理模型。 在其理论中,要强调显示的重要性,从不同层面研究信息处理问题,在计算理论和算法的实现上,尤其要强调计算机理论的重要性。 在三维信息的感知中,根据人的感知深度提出了一系列的感知提示从x恢复形状(其中x指示不同的提示)。 以计算理论为中心的视觉模型,在这个阶段,代表性的工作是视觉现象的中侧抑制现象的模拟。 主要通过使用不同尺度的LoG算子,实现对不同尺度的边缘信息的感觉。 分析双眼深度的线索关系到立体视觉的研究。 单目深度提示的分析导致了技术的出现,其从x恢复形状(其中x包括阴影、纹理、遮挡、焦点、线性透视等)。 关于运动物体摄像过程的研究出现了光流计算和从运动中恢复结构等技术。 以应用为目标的计算机视觉方法,从1990年代开始,随着对人工智能研究的反思,在计算机视觉研究中也开始考虑过去的方法是否正确,理论是否具有实际意义,这个方向的研究是否有明确的目标等一系列问题。 从单纯的理论框架研究转向躯干运动相结合、各种应用相结合的研究。 传统研究未充分重视生物视觉的一些重要特性,如活动性、视觉系统中高分辨率中心凹陷与周边视觉的耦合等。 为此,提出了80年代末、90年代初主动视觉、定性视觉等新方法、新思路,表明视觉已经发展到一个新的阶段。 运用积极的视觉方法,简化复杂的计算机,将病态问题转化为健全的问题,取得圆满的解决方案。 视觉信息处理系统(如基于内容的图像和视频检索(CBIVR ) )的研究是其在计算机视觉中的应用继承,也影响计算机视觉的研究和应用。计算机视觉发展简史、计算机视觉研究内容、计算机视觉应用状况、计算机视觉发展讨论、计算机视觉相关学科、计算机视觉研究进展、计算机视觉困难、计算机视觉应用状况、 工业视觉:通过外形照片进行外形检查和位置检查,通过x射线和超声波检查取得物体内部的图像,通过实现表面缺陷检查、内部非破坏探伤等的相机相关的视觉信息处理系统,根据不同的物体选择不同颜色和性质的传送带,将物体从传送带分离,进行识别和定位,由机器人把持例如工业检查、自动生产线、邮政自动化、计算机辅助外科手术、显微医学操作、在危险场所工作的机器人等。 在生产线上有简单视觉系统的工业机器人系统、计算机的视觉应用状况、人的手势动作(手语)、嘴唇动作(唇读)、身体运动(步态)、表情测量等,能够理解人的愿望并执行指令,符合人的交互习惯,是交互的便利脸部识别、代理等。人头部跟踪、视觉导航:利用两台以上摄像机同步获取的一组图像恢复三维场景信息,利用三维场景信息识别目标,辨别道路,识别障碍物等,实现道路规划、自主导航、与周围环境的自主交互,计算机视觉应用状况、 由移动机器人的立体视觉系统获取的立体图像对可以用于重构场景的三维信息,并且通过组合视觉导航:立体图像对和运动信息,可以配置满足特定任务的分辨率要求的场景深度图。 巡航导弹引导、无人飞机飞行、自动行驶车辆、移动机器人、精密引导等,可以避免人的干预及其引起的危险,提高精度和速度。 计算机的视觉应用情况,勇气号吧台,Rocky7吧台,例如飞机驾驶员的训练仿真、医学手术仿真、场景建模、战场环境显示等,计算机的视觉应用情况,MITMediaLab,与虚拟生物交互的虚拟系统计算机视觉应用情况、图像自动解释:包括射线图像、微图像、遥感多频带图像、合成孔径雷达图像、航天测量图像等自动识别理解。 随着近年来技术的发展,图像的种类和数量迅速增加,自动理解图像已经成为解决信息膨胀问题的重要手段。 安全鉴别、监视与追踪:实现停车场监视、车辆识别、车牌识别,从追踪“可疑”目标的面部、眼底、指纹等图像特征识别特定人的现在,人们研究面部运动参数的提取与描述,分析人的表情与心理活动。 计算机视觉的应用情况,医学影像分析:计算机视觉在医学影像诊断中有两种应用:一是增强影像、标记、染色等处理,帮助医生诊断疾病,帮助医生定量测量和比较感兴趣的领域,二是利用专家知识系统对影像(或一段时间内) 遥感影像分析:采用不同方法分析航摄影像(普通摄像机机制)、气象卫星影像(红外影像感测系统、合成孔径雷达)、资源卫星影像(多光谱探测器),用于气象预报、自然灾害预报、农作物与植物调查、资源生态环境测量等。 人的视觉系统和机制、脑的心理和生理研究等。计算机视觉发展简史、计算机视觉研究内容、计算机视觉应用状况、计算机视觉发展讨论、计算机视觉相关学科、计算机视觉研究进展、计算机视觉困难、计算机视觉研究内容,1 )输入设备(inputdevice )包括图像设备和数字设备。 所谓摄像装置,是指利用光学相机、红外线、激光、超声波、x射线检测周围场景

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论