人工智能通识课件第3章机器看世界

上传人：y*** IP属地：山东上传时间：2026-04-08 格式：PPTX 页数：40 大小：68.99MB 积分：20 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

机器看世界素养目标技能目标知识目标能够利用计算机视觉技术完成人脸识别；能够结合计算机视觉和专业背景提出创新性应用思路。理解计算机视觉的基本概念；了解计算机视觉的基本结构；熟悉计算机视觉的应用领域。培养其社会责任感和技术伦理意识；激发科技报国的热情；培养其辩证思维和社会责任感。学习目标

对于人类，看见是天生具有的，人接受信息中70%-80%来自视觉信息。但对机器而言，这样的任务，却是很艰巨的，如何让机器像人一样能“看见”眼前的事物？情景引入1.2.3.计算机视觉概述图像成像原理计算机视觉的结构4.5.计算机视觉的主要模型计算机视觉的应用场景目录6.计算机视觉的主要技术01计算机视觉概述图像的压缩数字图像和视频数据中存在着大量的信息冗余和主观视觉冗余，因此图像的压缩是必要的，也是可能的。PART02讨论机器（比如人脸识别设备）如何认得你是你？计算机视觉是模拟人类视觉系统的科学，通过相机、图像处理和算法，让机器像人一样“看懂”图像，是人工智能的重要分支。人类获取信息中70%-80%来自视觉，而机器视觉系统能够帮助计算机理解图像内容，从而在众多领域发挥重要作用。计算机视觉的定义计算机视觉的重要性随着技术发展，计算机视觉已广泛应用于安防、医疗、交通等领域，未来将在更多领域展现巨大潜力，推动社会变革。计算机视觉的应用前景什么是计算机视觉02图像成像原理成像原理人眼成像人眼的成像原理是外界物体的反射光线经过角膜、晶状体等折射，在视网膜上形成倒立的物像，再由大脑处理形成正常视觉。这是视觉感知的生物学基础。数字成像数字图像的成像原理模拟人眼机制：数码相机的镜头相当于晶状体，感光传感器相当于视网膜，将模拟图像信号转换为数字图像信号，最终存储为数字文件。图像的存储与呈现1.黑白图像：仅用0和1表示黑白两色，数据量最小。2.灰度图像：用0到255的数值表示不同亮度的灰色，呈现黑白过渡。3.彩色图像：通过RGB三通道组合呈现色彩。存储原理彩色图像通过红、绿、蓝（RGB）三个颜色通道的组合呈现色彩。每个像素点的颜色由三个通道的数值共同决定，并以三维矩阵的形式存储在计算机中。分类图像的压缩图像数据量通常很大，为了节省存储空间和提高传输效率，图像压缩技术应运而生。它主要分为两大类：无损压缩与有损压缩，分别适用于不同的应用场景。分类与特点无损压缩：无信息损失，可完全恢复，适用于医学影像等高质量要求场景。有损压缩：牺牲非关键细节换取高压缩比，广泛应用于网络图片与数字照片。简介概述不同的图像格式对应着不同的压缩方式和应用场景，了解它们的特点有助于我们选择合适的格式，平衡图像质量与存储传输效率。格式对比表名称性质典型应用开发公司/组织BMP无损Windows应用程序、高质量图像保存MicrosoftTIF有损/无损印刷出版、医学影像、专业摄影AldusGIF无损因特网、简单动画、图标CompuServeJPEG有损因特网、数码相机、日常照片ISO/IEC常见图像格式位图与矢量图根据图像的生成方式和存储原理，我们可以将数字图像分为两大类：1.位图(Bitmap)：由像素点组成，放大易失真，色彩丰富。2.矢量图(Vector)：由数学公式组成，无限放大无失真，体积小。位图特点与效果原理：由无数个像素点组成，类似马赛克。缺点：放大后会出现明显的锯齿和像素块，导致失真。应用：数码照片、复杂纹理的图像。矢量图特点与效果原理：由数学公式和几何图形（点、线、面）组成。优点：无论放大多少倍，边缘始终光滑，不会失真。应用：Logo设计、图标、工程图纸。💡核心区别：位图关注“像素点的色彩”，矢量图关注“图形的几何关系”。颜色深度与图像分辨率颜色深度：又称位深度，指每个像素点用多少位二进制数来表示颜色信息。位数越高颜色越丰富，如1位为黑白，24位为真彩色。图像分辨率：指图像的像素数量（宽×高）。分辨率越高，图像包含的细节越丰富，画面越清晰。图像的大小:图像的大小（数据量）是指在磁盘上存储整幅图像所占用的字节数。图像文件的字节数=图像分辨率*量化位数/8核心概念效果对比03计算机视觉的结构图像传感器如摄像设备等将外界景物转换为计算机内的数字化图像，可获取动态、静态等多种景物信息，是视觉系统的基础。图像传感器的作用除摄像设备外，还有热成像相机、高光谱成像仪等，它们具备超越人类视觉的能力，可观察到人类无法察觉的信息。多种图像传感器精确获取高质量的数字化图像是计算机视觉系统后续处理与分析的基础，直接影响系统性能与应用效果。图像获取的重要性数字化图像获取外界景物的数字化就是将外界景物转换成计算机内的用数字表示的图像，称为数字化图像。图像增强与复原通过图像增强和复原技术改善图像视觉效果，提高图像品质，使其更易于后续分析与理解，如去除噪声、增强对比度等。采用各种图像变换方法将空间域处理转换为变换域处理，同时运用编码压缩技术减少图像数据量，便于存储与传输。图像数据变换与压缩图像分割可提取图像中有意义的特征部分，如边缘、区域等，为图像识别、分析和理解提供基础；图像分割数字化图像处理图像管理图像管理也属于图像处理，包括图像的有组织存储，称为图像库，同时也包括对图像库的操作管理，如图像的调用、图像的增/删/改操作以及图像库的安全性保护和故障恢复等功能。图像分解指的是将图像中的一部分从整体中抽取出來。图像拼接指的是将若干幅图像组合成一幅图像。图像分解与拼接通过从物体外部测量的数据，经过数字处理后将2D平面物体转换成3D立体物体的技术。图像重建数字化图像处理03.01.02.图像描述图像描述是对图像中感兴趣目标进行检测和测量，获取其客观信息，为图像分析提供基础，可采用几何特性等方法进行描述。图像分类与识别图像分类与识别属于机器学习范畴，通过浅层或深层机器学习方法对图像进行分类判别，以识别图像中的目标。图像理解图像理解是更高级的图像分析，包括动作分析、行为分析、场景语义分析等，目标是使计算机具有通过二维图像认知三维环境信息的能力。图像分析与理解图像的分析和理解是指从现实世界中的景物提取高维数据以便产生数字或符号信息，它们可以转换为与其他思维过程交互且可引出适当行动的描述。04.图像特征提取图像特征提取指的是提取图像中包含的某些特征或特殊信息，为分析图像提供便利。04计算机视觉的主要模型主要模型卷积神经网络(CNN)计算机视觉的基石，通过卷积层自动提取图像特征，代表模型有LeNet-5、AlexNet、VGGNet、GoogLeNet和ResNet等。深度可分离卷积一种高效的卷积方式，将标准卷积分解为深度卷积和逐点卷积，显著减少计算量，被MobileNet等轻量级模型广泛采用。全卷积网络(FCN)用于语义分割任务，能够对图像中的每个像素进行分类，实现像素级的场景解析。目标检测模型如R-CNN、YOLO、SSD等，能够在图像中定位并识别多个目标物体。主要模型语义分割模型如SegNet、DeepLab，专注于将图像分割成具有不同语义类别的区域。生成对抗网络(GAN)由生成器和判别器组成，能够生成逼真的图像，广泛应用于图像生成、风格迁移、超分辨率等任务。人体姿态估计模型专注于检测图像中人体的关键点（如关节），构建人体骨骼结构，应用于动作捕捉、体育分析等领域。05计算机视觉的主要技术03.01.02.图像采集和处理使用摄像头及其他类型的传感器采集真实世界中的三维场景，将其转化为视频。目标识别物体进行识别，并在此基础上掌握更多的细节特征目标检测和图像分割把图像划分为若干个不同区域和物体。计算机视觉的主要技术04.目标追踪在视频中定位和跟踪物体05动作识别对动作和手势进行识别生成式对抗网络（GAN）负责尝试生成一些看起来很真实的东西，另一个网络名为判别式网络，它会把生成式网络所合成的东西与真实的东西进行比较，确定生成式网络的输出是真是假。计算机视觉的主要技术07.06场景理解对一个完整的场景进行分析并理解，掌握其中复杂而微妙的关系计算机视觉的应用场景0

我们在看电影时都看见过这样的场景，在一个人流量巨大的场所（比如机场），警察为了追踪一个罪犯，在监控室中将罪犯的头像与监控器中的人脸进行比对。在经短暂的比对后，罪犯的人脸在监控画面上被标记出来。更令人惊叹的是，监控摄像头一旦锁定了目标，就一直自动跟随着目标移动，直至罪犯被警察抓住。情景引入01人脸识别技术特点人脸识别具有非强制性、非接触性、并发性等特点，符合人类“以貌识人”的视觉特性，操作简单且隐蔽性好。0203人脸识别技术流程人脸识别系统包括人脸图像采集及检测、预处理、特征提取以及匹配与识别四个部分，通过这些步骤实现精确的身份识别。人脸识别的应用人脸识别广泛应用于安防、金融、手机解锁等领域，为身份认证提供了高效、便捷的解决方案，提升了安全性和用户体验。人脸识别人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。

某一天，你和家人乘坐无人驾驶汽车去郊外旅游，家里之前负责开车的人不再需要花时间专注于开车，一切交给自动驾驶来完成，一家人可以一起聊天、欣赏风景，这样的旅途是多么放松和惬意。情景引入无人驾驶技术特点无人驾驶通过多种传感器对环境感知和识别，利用人工智能技术进行决策和规划，实现车辆的自动驾驶，具有提高道路安全、减少拥堵等优势。01无人驾驶的等级无人驾驶分为从无自动化到完全自动化的六个等级（level0---level5），随着技术发展，车辆的自动化程度不断提高，推动了交通领域的变革。02无人驾驶的技术框架无人驾驶技术框架包括环境感知定位、决策规划和执行控制三个核心部分，各部分协同工作实现车辆的自动驾驶功能。03无人驾驶无人驾驶是指利用人工智能、机器学习、传感器、地图等技术，使汽车等交通工具能够在没有人类驾驶的情况下自主完成行驶、避障、停车等操作。

科幻电影里经常有这样的情节：在一场太空大战中，一个人类战士使用激光武器和敌人激烈交战中不幸受伤，他忍着疼痛，爬进一个神奇的医疗舱内，关上舱门，医疗舱就开始伸出机械手臂或是放出微型机器人开始治疗，而有些更高级的则是放出某种神秘的光线，在很短的时间里就能将重伤的患者治愈。情景引入计算机视觉在智慧医疗的技术流程包括数据采集、预处理、特征提取、模型训练、诊断分析、结果验证、临床决策支持、持续学习和改进、临床部署和监管合规等。计算机视觉在智慧医疗中的技术流程02智慧医疗面临数据隐私保护、算法透明度等挑战，但随着技术发展和优化，计算机视觉有望在智慧医疗领域发挥更大作用，推动医疗行业的进步。智慧医疗的挑战与展望03计算机视觉在医学影像分析、高准确率医学判断、特征工程与模式识别、多模态医学影像融合、实时监测与反馈、自动化和智能化流程、临床部署的挑战应对、持续学习和适应等。计算机视觉在智慧医疗中的应用01智慧医疗智慧医疗是一个利用现代信息技术，特别是互联网、大数据、人工智能等技术，来提升医疗服务质量和效率的概念。计算机视觉在智慧农业中的应用作物病虫害监测与识别、生长状态监测、智能灌溉管理、农作物收获自动化、农业机器人导航与自主驾驶、农业生态系统监测、农产品质量检测等。智慧农业的发展智慧农业结合计算机视觉等技术，实现农业生产智能化、精准化，提高农业生产效率和质量，促进农业可持续发展。智慧农业的挑战与展望智慧农业的推广需考虑农民技术接受度和培训，以及如何将这些技术与现有的农业生产实践相结合，以实现更广泛的应用。010302智慧农业计算机视觉在城市管理的各个领域发挥着重要作用。“高清化、网络化、智能化”已经成为城市建设的一种必然趋势。计算机视觉在智慧安防中的应用计算机视觉在智能交通中的应用智慧城市计算机视觉在环境监测中的应用提高公共安全优化交通管理犯罪预防及辅助侦查异常事件检测优化资源分配身份验证提升应急响应速度数据收集与分析计算机视觉在智慧安防中的应用智慧城市智能交通监控交通管理和规划带来便利交通安全教育和行为分析智慧城市计算机视觉在智能交通中的应用大气污染监测水质监测与管理垃圾分类与回收自然生态监测灾害监测与预警城市环境评价气象预测与分析基础设施结构健康监测智慧城市计算机视觉在环境监测中的应用实验案例：任务说明实验目标本次实验包含两个核心任务，旨在将理论知识应用于实战，深入掌握计算机视觉应用。任务详

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能通识课件第3章机器看世界

文档简介

温馨提示

最新文档

评论

人工智能通识 课件 第3章 机器看世界

文档简介

温馨提示

最新文档

评论

相关文档

人工智能通识课件第3章机器看世界