《机器视觉理论与实战》 课件 第一章 绪论_第1页
《机器视觉理论与实战》 课件 第一章 绪论_第2页
《机器视觉理论与实战》 课件 第一章 绪论_第3页
《机器视觉理论与实战》 课件 第一章 绪论_第4页
《机器视觉理论与实战》 课件 第一章 绪论_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论

本章知识点:人工智能的概念人工智能技术优势人工智能发展阶段人工智能研究领域机器视觉主要分类1.1人工智能技术简介

人类不仅可以通过眼、耳、口、鼻等感觉器官感知世界,更重要的是可以对信息进行再加工,并通过双手改造世界。

人类对世界的认知是可以通过学习积累和传承的,即所谓的“经验”。正是在不断的“学习-积累-改造”迭代过程中,人类社会才会不断进步。由此,把人类所具有的感知信息、学习过程、经验积累、改造世界的能力,称为“人类智能”。“智”指的是思维方式,“能”指的是能力。思考题:举例说明人类所具有的“智”、“能”?1、人工智能定义:1956年的达特茅斯会议上,人工智能定义首次提出为:人工智能是用计算机模拟人在思维活动中所需智能的工作过程。1987年Michael和Nils将人工智能定义为:人工智能是研究智能行为的科学。它的最终目的是建立关于自然智能实体行为的理论和指导创造具有智能行为的人工制品。人工智能有两个分支,一个为科学人工智能,一个为工程人工智能。

百度百科将人工智能定义为:它是研究、开发用于模拟、延申和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。思考题:人有哪些“智能”可以用计算机模拟?2、研究、应用人工智能的原因:(1)缩短经验积累周期,扩展个体认知水平(2)将人从繁琐的重复性劳动中解脱出来,提高工作效率(3)推动社会进步,带动相关产业发展(4)构建新的知识体系模式,推动技术发展进程思考题:你还能想出其他研究、应用人工智能的原因吗?1.2人工智能技术发展进程1.孕育期(1956年之前)

这一时期,主要是人类对自身思维方式的总结,并探索用“机器”来实现某些人类思维。2.形成期(1956-1969)1969年,成立的国际人工智能联合会议,标志着人工智能学科已经取得了世界的认可。3.发展期(1970年-2010年)

学术界也相继成立了多个人工智能学会、创办了如ArtificialIntelligence、MachineIntelligence、IJCAI等多种期刊和论文集刊载人工智能的研究成果。Google、苹果等公司从应用角度,也在持续进行着人工智能产品的研发。4.融合期(2011年至今)

这一时期开始形成人工智能产业基础,人工智能企业数量大幅增长、国家出台政策推动人工智能发展、人工智能与其他技术融合更加深入、人工智能技术获得了更广泛的应用。1.3人工智能技术研究的各种学派1.符号主义

认为人类认知和思维的基本单元是符号,认知过程就是符号操作过程。代表人物纽厄尔、西蒙。

2.连接主义

认为人工智能源于仿生学,通过对人脑模型的研究,实现人工智能。代表人物霍普菲尔德。3.行为主义

认为学习是刺激与反应之间的联结,学习的过程,就是一个不断试错、强化训练、渐进优化的过程。1.4人工智能研究领域1.机器学习

机器学习(MachineLearning)就是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

它是人工智能的核心技术,是使计算机具有人类智能的根本途径。思考题:你能举出生活中“机器学习”的例子吗?2.语音识别

语言是人类区别于其他动物的基本特征之一。人类在对话时,是通过声带振动发出不同声音,从而形成对话内容,这个功能在人工智能技术中称为语音识别(SpeechRecognition)。语音识别是指一种通过计算机将语音生成文本的技术。思考题:你能举出生活中“语音识别”的例子吗?3.自然语言处理

人类语言是及其丰富的,在不同环境、不同场景下,相同的话语表达的意思可能大不相同,所以除了将语音译成文字,还要根据语境分析、理解其中的含义,这个功能在人工智能技术中称为自然语言处理(NaturalLanguageProcessing,NLP)。自然语言处理是研究对自然语言含义进行正确、合理、有效分析的理论、方法和实现技术。思考题:你能举出生活中“自然语言处理”的例子吗?4.机器视觉(计算机视觉)

机器视觉(ComputerVision,CV)是研究以计算机、摄像机构为核心的系统来模仿人类视觉系统的技术,让计算机拥有类似人眼定位、提取、处理、分析、理解图像的能力。由于视觉信息处理是人类智能的主要特征之一,所以机器视觉成为人工智能领域研究的重点和热点;同时,因为视觉效果受物体特性、环境因素等影响,所以机器视觉也是人工智能研究的难点。思考题:你能举出生活中“机器视觉”的例子吗?5.机器人学

当机器的感官和思维方式具有人类特征之后,希望它在形体和行为特征方面也像人类一样,由此产生了机器人学,即创造外观像人一样的机器,能够模仿人的动作,并且具有人类感知、识别、分析、处理、学习和反馈信息的能力。思考题:你了解的机器人发展到了什么程度?1.5机器视觉概述

1.5.1机器视觉主要分类1.图像分类

在一张(静态)图片中识别出其中的内容,通常图片内容比较单一,主要目的是识别出内容所属的种类,例如图1-1所示图片。图1-1图像分类的例子2.目标检测(与定位)

目标检测不仅要辨别出图片上内容的类别,还要用边框将辨别的东西标记出来,确定所识别物体的位置。例如图1-2中包含很多种水果,通过机器视觉,希望给出水果的名称和出现的位置。图1-2目标检测的例子目标检测至今仍然是计算机视觉领域较为活跃的一个研究方向,虽然已经取得了大量成果,但离一些真实复杂场景的应用还存在一定差距,目标检测这一基本任务仍然是非常具有挑战性的课题,存在很大的提升潜力和空间。图1-3展示了一个工业工艺流程复杂应用场景,此时目标检测存在识别错误率较高的情况。图1-3复杂工业场景目标检测的例子3.语义分割

有些时候,不仅需要知道图像中是什么内容,还想知道更详细的信息。例如对于图1-2而言,我们需要知道其中包含的每种水果的数量,这比图像分类和目标检测结果要求更进了一步,实现这种功能的机器视觉技术称为语义分割。即语义分割是指将图像中的每个像素链接到其所属的类(标签)的过程,可以将语义分割视为像素级别的图像分类。语义分割在公共场所中人流计数、自动驾驶中运行环境理解、医学影像中诊断分析等领域都有广阔的应用前景和价值。4.目标跟踪

目标跟踪是指对图像序列(在时间上连续的图片,例如视频)中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,通过处理和分析,实现对运动目标的行为理解,以完成更高一级的检测任务。如图1-4所示的一段连续视频截图,通过目标跟踪技术,定位、跟踪红框中的车辆,以获得需要的信息。图1-4目标跟踪的例子5.光学字符识别(OCR)

图片中包含的内容不仅仅是物体,还有诸如文字、数字、字符等信息,有时需要将这些信息识别出来,在机器视觉中称为光学字符识别(opticalcharacterrecognition,OCR)。它是指通过电子设备(例如扫描仪或相机)拍摄介质上的字符,然后利用字符识别方法将其翻译成文字的过程。交通中的车牌识别、机场的身份证识别、银行的银行卡识别等都属于OCR应用场景。图1-5利用OCR对工业数显屏数据进行识别思考题:你能举出生活中应用OCR技术的例子吗?1.5.2机器视觉研究难点1.光照条件

自然环境(晴天、阴天、白天、黑夜)、光照强度、光线色泽等因素对拍摄图片的清晰度都会有影响,所以在机器视觉技术应用中,一定要非常重视光照条件,并采取有效措施,尽量避免或减弱光照因素的影响。2.拍摄角度

拍摄角度不同,会使图片中的内容产生变形、扭曲,对于机器视觉技术应用影响较大。所以在安装摄像装置时,尽量保证装置与待拍场景垂直,以获得最佳的拍摄角度;当待拍场景动态移动时,需要定制开发摄像跟踪装置,确保合适的拍摄角度,以得到清晰的图片。3.物体特征

被拍摄物体的一些特征对图片清晰度也有较大影响,这些特征主要包括物体形状、物体颜色、物体反光性、是否运动、运动是否规则等,所以在安装摄像装置前,要充分了解物体特征,做出相应的解决方案,确保拍摄到期望特征图片。4.技术因素

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论