计算机视觉.doc_第1页
计算机视觉.doc_第2页
计算机视觉.doc_第3页
计算机视觉.doc_第4页
计算机视觉.doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计算机视觉的现在和发展前景 摘要:计算机视觉学生自20世纪60年代中期迅速发展起来的一面新学科。它是个边缘学科,集众家之所长,是个工程性很强大技术,主要需要有空间几何、矩阵分析、光电技术、图像处理、应用数学、离散数学及计算机技术等等各个方面的知识,才能正确的指导视觉系统的建模、解模及实际工程问题的解决方法。计算机视觉上使用计算机及相关设备对生物的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。由于计算机视觉在工农业生产、地质学、天文学、气象学、医学及军事并学等领域有着极大的潜在应用价值,所以它在国际上越来越受人重视。本文简要地介绍了计算机视觉学的现状、发展、研究方向。关键字:计算机视觉;发展;研究计算机的现状计算机视觉领域的突出特点是其多样性与不完善性。这一领域的先驱可追溯到更早的时候,但是直到20世纪70年代后期,当计算机的性能提高到足以处理诸如图像这样的大规模数据时,计算机视觉才得到了正式的关注和发展。然而这些发展往往起源于其他不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的公式。 尽管如此,人们已开始掌握部分解决具体计算机视觉任务的方法,可惜这些方法通常都仅适用于一群狭隘的目标(如:脸孔、指纹、文字等),因而无法被广泛地应用于不同场合。 对这些方法的应用通常作为某些解决复杂问题的大规模系统的一个组成部分(例如医学图像的处理,工业制造中的质量控制与测量)。在计算机视觉的大多数实际应用当中,计算机被预设为解决特定的任务,然而基于机器学习的方法正日渐普及,一旦机器学习的研究进一步发展,未来“泛用型”的电脑视觉应用或许可以成真。 物理是与计算机视觉有着重要联系的另一领域。计算机视觉关注的目标在于充分理解电磁波主要是可见光与红外线部分遇到物体表面被反射所形成的图像,而这一过程便是基于光学物理和固态物理,一些尖端的图像感知系统甚至会应用到量子力学理论,来解析影像所表示的真实世界。同时,物理学中的很多测量难题也可以通过计算机视觉得到解决,例如流体运动。也由此,计算机视觉同样可以被看作是物理学的拓展。 另一个具有重要意义的领域是神经生物学,尤其是其中生物视觉系统的部分。在整个20世纪中,人类对各种动物的眼睛、神经元、以及与视觉刺激相关的脑部组织都进行了广泛研究,这些研究得出了一些有关“天然的”视觉系统如何运作的描述(尽管仍略嫌粗略),这也形成了计算机视觉中的一个子领域人们试图建立人工系统,使之在不同的复杂程度上模拟生物的视觉运作。同时计算机视觉领域中,一些基于机器学习的方法也有参考部分生物机制。 计算机视觉的另一个相关领域是信号处理。很多有关单元变量信号的处理方法,尤其对是时变信号的处理,都可以很自然的被扩展为计算机视觉中对二元变量信号或者多元变量信号的处理方法。但由于图像数据的特有属性,很多计算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个主要特征,便是他们的非线性以及图像信息的多维性,以上二点作为计算机视觉的一部分,在信号处理学中形成了一个特殊的研究方向。 除了上面提到的领域,很多研究课题同样可被当作纯粹的数学问题。例如,计算机视觉中的很多问题,其理论基础便是统计学,最优化理论以及几何学。 如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得合理的执行速度而又不损失足够精度,是现今电脑视觉领域的主要课题。 计算机视觉技术的出现和发展 计算机视觉在20世纪50年代从统计模式识别开始的,当时的工作主要集中在二维图像分析和识别上,如光学字符识别,工作表面、显微图片和航空图片的分析和解释等。60年代,Roberts通过计算机程序从数学图像中提取出如立方体、楔形体等多方面的三维结构,并对物体形状及物体的空间关系进行描述。到了70年代,已经出现了一些视觉应用系统。70年代中期,麻省理工学院人工智能实验室正式开设“机器视觉”课程,由国际著名学者B.A.P.Hom教授讲授。80年代以来,计算机视觉的研究已经历了从实验室走向实际应用的发展阶段。而计算机工业水平的飞速提高以及人工智能、并行处理和神经网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究。目前,计算机视觉技术正在广泛地应用于计算机图形学、图像处理、机器人学等多个领域。视觉技术的研究人类很多研究都是以延伸人类能力为目的,早期的工作室在体力上的延伸,计算机发明以来,就拓展到对人类脑力和感知能力的延伸上。对人类视觉感知能力的计算机模拟导致了计算机视觉的产生。计算机视觉也经常被称为图像理解,是指研究完成一项任务所需的视觉信息及如何从图像中获取这些信息的研究领域。其基本目的有三个:(1) 根据一副或多幅二维投影图像计算出现观察点到目标物体的距离。(2) 根据一副或多幅二维投影图像计算出现观察点到目标物体的运动参数。(3) 根据一副或多幅二维投影图像计算出现观察点到目标物体的表面物理特性。计算机视觉研究的对象和方法1.以模型世界为主要对象的视觉基本方法研究 这个阶段以Roberts的开创性工作为标志。在Roberts的工作中引入了三维物体与二维成像的关系,采用了一些简单的边缘特征提取方法并引入了组合线断的方法。这些早期的工作对视觉的发展起了促进作用,但对于复杂的景物便难于奏效。2.以计算机理论为核心的视觉模型研究 20世纪70年代开始,对计算机视觉的研究进入更为理性化的阶段,主要集中于各种本征特性的恢复,包括三维形状、运动、光源等等恢复。主要出发点是从生理学、光学和射影几何的方法出发,研究成像及其问题。在这一阶段中,以Marr为代表的一些研究者提出了以表示为核心、以算法为中间转换过程的一般性视觉处理模型。在其理论中强调表示的重要性以及从不同层次上去研究信息处理问题,在计算理论和算法实现上又特别强调计算理论的重要性。在三维信息的感知方面,根据人类感知深度的不同提出了一系列的方法。计算机视觉研究的认识计算机世界研究经历了近40年的过程,仍面临许多问题。主要由于这一方向是多学科的交叉与结合,同时视觉上一个涉及生理、心理的复杂过程,不仅与眼睛有关,还和大脑的推理、学校有关。研究计算机视觉的目的要实现对人类视觉模拟和延伸。对于人类而言,视觉上一个轻而易举的功能,对机器却不同。视觉过程很难用类似于问题求解的方法符号化。随着计算机科学领域中对定量研究的重视,这种状况会得到改善。在计算机视觉的研究过程中,应考虑将功能模拟与认知模拟相结合。人类延伸其他能力的过程中,功能模拟起到了主要作用,但视觉上涉及心理和生理两方面的过程,因此必须在功能模拟的同时重视认知模拟。计算理论的进步与感知手段的改进有助于计算机视觉的研究。在计算机视觉中计算理论占有十分重要的地位,计算理论的进步,新的计算模型的提出可以解决以往一些困难的问题;另一方面,感知手段的进步也可以起到同样的作用。采用主动视觉可从另一个侧面去处理对的视觉问题。要实现完整的视觉系统,视觉知识的获取、管理和利用是必不可少的。一个相对完备的视觉系统同时也是一个知识管理系统,在视觉过程中对一副图像的理解需要大量的关于任务领域的知识,这些知识不同于问题求解中的知识可以明确的显性表示,而且人类获取的80%是通过视觉得到的,因而这些知识涉及面之广难以预测,因此视觉系统中的知识管理是一个重要问题。从以往的研究看,过去的几十年虽然提出、解决了一些问题,但是由于视觉问题的特殊性和复杂性,还有大量的问题需要研究。研究的重点包括对新方法、新手段的探索。当然,在原有问题上采用新的描述方法、求解手段

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论