




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、机器视觉Machine Vision9/17/20221参考书目:1、图像处理、分析与机器视觉(第二版) M.Sonka,V.Hlavac,R.Boyle著,艾海舟等译, 人民邮电出版社,20032、机器视觉教程W.E.Snyder,H.Qi著 林学訚等译,机械工业出版社,20053、计算机视觉马颂德著,科学出版社,19999/17/20222第一章 引 论Chap1 引论讲解内容 1.机器视觉的研究内容、特点及其应用。 2.基础理论( Marr视觉计算、成像几何基础); 3.课程学习内容。目的 1. 了解机器视觉的主要内容及相关知识,熟悉机器视觉与其他学科的关系; 2. 重点掌握Marr视觉
2、计算理论及成像几何基础理论。9/17/202231. 1机器视觉 机器视觉:用计算机来模拟生物视觉功能的科学和技术。机器视觉系统的首要目标是利用图像创建或恢复现实世界模型,然后认知现实世界。 从二维图象恢复三维信息; 从原始图像数值描述产生语义描述。1.1.1 基本概念机器视觉是信息科学领域的一个重大挑战性问题: Jim Gray列出的12大信息科学问题之一: See as well as a person. Bill Gates:The future of computing is to make computers see, hear, speak and learn.9/17/20224
3、一、输入设备(input device)包括成像设备和数字化设备成象设备是指通过光学摄像机或红外、激光、超声、X射线对周围场景或物体进行探测成象,得到关于场景或物体的二维或三维数字化图像。二、低层视觉(low level)主要是对输入的原始图像进行处理这一过程借用了大量的图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条、边界以及色彩等关于场景的基本特征;这一过程还包含了各种图像变换(如校正)、图像纹理检测、图像运动检测等。1. 1机器视觉1.1.2 研究内容9/17/20225 20世纪50年代归入模式识别-主要集中在二维图像分析和识别上,如光学字符识
4、别,工件表面、显微图片和航空图片的分析和解释等。 60年代,Roberts积木世界理论-开创了以理解三维场景为目的的三维计算机视觉的研究。70年代,Marr计算视觉理论-第一个较为完善的视觉系统框架,分三个层次进行处理。 80年代以后,蓬勃发展-新概念、新方法、新理论不断涌现,如基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等。1. 1机器视觉1.1.3 发展概况9/17/20227(1)图像多义性(2)环境因素影响(3)知识导引(4)大量数据1. 1机器视觉1.1.4 研究面临的困难9/17/202281.2 Marr视觉计算理论 MIT的David Marr在70年代
5、末提出了第一个较为完善的视觉系统框架; 该框架立足于计算机科学,系统地概括了心理生理学、神经生理学等方面取得的所有重要成果; 该框架尽管存在很多缺陷,但过去20多年一直处于主导地位。D.Marr, Vision, 1982.中译本:视觉计算理论,姚国正、刘磊、汪云九译,科学出版社,1988。9/17/202210 1.2.1 三个层次视觉信息处理系统分为三个层次:9/17/2022111.2.2 视觉表示框架 第一阶段(也称为早期阶段):将输入的原始图像进行处理,抽取图像中诸如角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图(primitive sketch); 第二阶段(中期
6、阶段):指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信息,但不是真正的物体三维表示,因此,称为二维半图(25 dimensional sketch); 第三阶段(后期阶段):在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。9/17/202212 视觉处理框架基本上是自下而上,没有反馈; 没有足够地重视知识的应用。基于感知特征群的物体识别理论框架,主动视觉理论框架,视觉集成理论框架等等。1.2 Marr视觉计算理论Marr理论的不足9/17/2022141.3 机器视觉的应用 零件识别与定位 产品
7、检验 移动机器人导航 遥感图像分析 医学图像分析 安全、监控与跟踪 国防系统 其它(动画、体育、考古)应用领域9/17/202215Sojourner视觉系统获取的立体图象对障碍物探测示意图Sojourner视觉系统对场景的深度恢复 1.3 机器视觉的应用9/17/202217人脸跟踪演示1.3 机器视觉的应用9/17/202218MIT Media Lab ,与虚拟生物交互演示1.3 机器视觉的应用9/17/202219(基于图象序列的)五角大楼三维重建1.3 机器视觉的应用9/17/202220三维人脸重建1.3 机器视觉的应用9/17/2022211基于视觉感知与认知机理的图像分析与识别
8、系统研究目标:突破基于人类视觉感知与认知机理的图像处理模型、 关键技术和算法,建立个性化、高准确度的图像分析 与识别系统。研究内容:分层交互的统计视觉计算模型与推理,基于感知整 合机制的视觉模式识别技术,具有选择性注意机制的 视觉信息搜索与多目标跟踪模型 。863计划信息技术领域2006年度专题课题申请指南目标导向类课题 :9/17/2022221.4 机器视觉与其它学科关系机器视觉VS图像处理 图像处理(Image Processing):实现从输入 图像到另一种图像的转换 图像处理:人是最终的解释者 机器视觉:计算机是图像的解释者 机器视觉系统需要图像处理模块9/17/2022241.4
9、机器视觉与其它学科关系机器视觉VS计算机图形学 计算机图形学:从三维描述到二维图像显示 机器视觉:从二维图像数据到三维描述 在一定意义上讲,计算机视觉是计算机图形 学的逆问题 两者从最初相互独立的平行发展到最近的融 合是一大趋势9/17/2022251.4 机器视觉与其它学科关系机器视觉VS人工智能 人工智能:主要研究智能系统的设计和有关 智能的计算理论与方法 AI may be considered as having three stages: perception, cognition and action 计算机视觉经常被视为AI的一个分支9/17/202227图1.6 透视投影倒立成像几何示意图 1.5 成像几何基础1.5.1 透视投影9/17/202228图1.7 透视投影几何示意图 1.5.1 透视投影9/17/202229图 1.8 正交投影几何示意图1.5.2 正交投影1.5.2 正交投影9/17/2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东育婴师试题及答案
- 企业管理规定试题及答案
- 2024年纺织设计师行业调查试题及答案
- 广告设计师考试色彩心理研究试题及答案
- 广告设计与内容营销试题及答案
- 2024年与设计相关的行业动态国际商业美术设计师考试试题及答案
- 买豆浆的孩子试题及答案
- 2024年广告设计师的复习新方法试题及答案
- 广告设计中的转化率提升策略试题及答案
- 科学编制考试试题及答案
- 高标准基本农田建设项目监理月报1期
- 温泉度假设施造价预算
- 水质自动在线监测系统技术协议1010审计
- DBJ04∕T 258-2016 建筑地基基础勘察设计规范
- 七年级地理下双向细目表
- 企业风险评估报告模板
- 网吧员工劳动合同书
- Revit基础入门课件
- 小升初英语奥数题
- 项目部管理人员安全培训考试题及答案
- 国内各航空公司差异化服务
评论
0/150
提交评论