人工智能通识教程 课件 第7章 从图像识别到视觉理解_第1页
人工智能通识教程 课件 第7章 从图像识别到视觉理解_第2页
人工智能通识教程 课件 第7章 从图像识别到视觉理解_第3页
人工智能通识教程 课件 第7章 从图像识别到视觉理解_第4页
人工智能通识教程 课件 第7章 从图像识别到视觉理解_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能导论主讲人:XXXAI同学们好!数字化实验项目实践综合实训人工智能导论目

第一篇计算机基础与系统1AI与计算机科学导论2计算机系统3计算机程序与算法面向的问题:离开计算机科学AI能否发展?支撑AI发展的主要计算机科学与技术是什么?

第二篇AI基础与应用4人工智能学科框架5机器学习6神经网络与深度学习面向的问题:AI的科学体系?机器为什么能战胜人类?机器是如何思考问题的?

第三篇AI应用技术7图像识别到视觉理解8文本处理到语言理解面向的问题:人脸怎样被识别?手机怎样具有智能的?人类语言是怎样被机器理解的?

第四篇实验、实践与实训面向的问题:云计算是怎样支持虚拟服务的?图像编码方法?汽车外观设计垂类模型怎样训练?9验证性虚拟实验10汽车营销项目实践11垂类模型综合实训数字化实验项目实践综合实训人工智能导论第三篇---引子GPT-3的震撼——当机器学会"理解"人类本篇探索AI理解世界的两大核心能力:计算机视觉:机器如何像人类一样,从像素中构建有意义的视觉表征?自然语言处理:AI如何突破语言与视觉的界限,实现真正的"理解"?当机器同时具备“看”和“理解”的能力时,我们将迎来人机交互的全新时代。

第三篇AI应用技术7图像识别到视觉理解8文本处理到语言理解数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解本章目的:本章以安检系统为例,揭开AI“视觉魔法”的三重秘密:图像如何变成数字密码

机器如何学会“认东西”→

系统怎样做出智能判断。7.1

计算机视觉的数字化7.2

计算机视觉:虚拟现实的“眼睛”与“大脑”7.3

应用实例:人脸识别闸机一体安检门门禁Y20

数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解7.1

计算机视觉的数字化

7.1.1

图像如何变成数字?1、图形与图像图形图像数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解2、像素【案例7-1】照片分辨率。有两张尺寸相同但分辨率取不相同的照片,一张低分辨率为:640x480,另一张高分辨率为3840x2160,在放大时高分辨率照片肉眼可见仍然会很清晰,展现出更丰富的细节,而低分辨率的一张则会模糊。‌请思考:图像的分辨率与显示器的分辨率相关吗?与打印机呢?讨论数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解3、像素压缩【案例7-3】微信传送照片的信息丢失。我们已经深有感受的是:通过手机微信传照片时,如果不点“原图”,传输的照片放大时就会失真,为什么?就是为了提高传输速度,默认的方式是对照片进行了大大的压缩,而且是有损压缩。除非你特别说明“我要原图传送”,这时你就会发现传输的速度慢了很多。越逼真的图像存储量也越大,这不仅是存储的问题,更是传输问题,所以图像通常会被压缩。数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解4.图像文件类型数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解7.1.2手机拍照背后的秘密真实世界完全的视觉表达过程:采样、量化和编码,称为“图像转换三重奏”。RGB色彩空间图7-6RGB模型原理图自然界中各色光都可以由红(Red)、绿(Green)、蓝(Blue)三种基本颜色来表达,以不同比例将这三种原色混合,可以产生出其他各种颜色,称为RGB三原色模型。数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解2.颜色深度颜色深度(又称色深、色位深度)就是三原色混搭的方法以及色彩的度量指标,这是计算机图形学中表示‌单个像素颜色信息所占用的二进制位数‌,单位为bit(位)。其数值决定了像素可用的颜色数量。图7-6颜色深度示意图一个具有复杂色彩的图片,如果从位图的角度看,他的每一个像素(十字绣上的小方格)都有固定的色彩编码,比如:某个像素的色彩编码是(255,0,0),就表示红色,三个数字分别表示红、绿、蓝三个颜色分量的取值。如果这个编码是(192,18,89),那一定不是红、绿、蓝三个顺色,而是16777216种不同的颜色中的一种。可见,计算机视觉这个万花筒实际上是被三组0到255的数字控制的,这也就是色彩数字化的基本原理。数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解【纵横学习】若以PAL制式播放分辨率为640×480的图像,每个像素用256色表示,在不压缩的情况下,60分钟视频所需的数据存储量是多少?3、手机里的CMOS传感器CMOS传感器是一种利用CMOS技术制造的图像传感器,广泛应用于数字相机、智能手机、监控摄像头等设备中。其主要功能是通过光电效应将进入传感器的光信号转换为电信号,从而生成数字图像。数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解4.‌量化量化是将每个采样点的像素值从连续变化的范围转换为有限个离散的数值的过程。其目的是减少数据的存储量和处理复杂度,同时尽可能保持图像的视觉质量。请思考什么是量化级?什么是量化误差?用实例说明计算机视觉的数字化过程数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解7.2计算机视觉:虚拟现实的“眼睛”与“大脑”7.2.1计算机视觉与虚拟现实的关系‌如今的计算机视觉已从以往的各种探索实践升级为动态环境理解系统,能像人类一样实时感知、推理并响应三维世界,呈现出全新的计算机视觉新概念。这里我们仅介绍与虚拟现实紧密相关的部分新进展。1、计算机视觉新概念数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解2、虚拟现实图7-9虚实交互的技术链条【案例7-5】OculusRift到QuestPro:CV赋能的进化之路。请自学从Meta公司的VR设备发展史,了解CV如何重塑VR?为什么虚拟现实系统必须将延迟控制在20ms以内?如果延迟超过这个阈值,用户在移动中观察虚拟指引时会产生怎样的感知异常?

数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解7.2.2当CV成为VR的"视觉中枢":工业维修的虚实融合实践VR维修是近年来VR技术应用的一个重要研究方向,被广泛应用于维修检查、维修的工种培训等方面。数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解列举工业维修和安全培训中的虚实融合实例,说明:

1、计算机视觉与虚拟现实技术的融合;2、人工智能的助力作用。请查阅资料数字化实验项目实践综合实训人工智能导论第四章

人工智能学科框架

7.3应用实例:人脸识别闸机一体安检门门禁Y20‌7.3.1门禁Y20系统简介

数字化实验项目实践综合实训人工智能导论第四章

人工智能学科框架

7.3.2‌门禁Y20人脸检测技术图7-10人脸检测技术原理图图7-11CNN级联检测流程数字化实验项目实践综合实训人工智能导论第四章

人工智能学科框架

图7-12图像分类与人脸关键点检测示意图人脸检测技术新进展‌动态纹检测技术‌:美图宜肤通过AI实时捕捉表情纹变化,预测衰老趋势,展示了其在动态纹检测领域的前沿技术突破。该技术能够精准捕捉皮肤纹理在动态表情下的细微变化,计算出皱纹的分数、面积、长度、宽度、深度等关键指标,并实时跟踪皱纹在不同表情状态下的特征变化,为精准诊断和个性化治疗方案提供支持。‌侧边超声波技术‌:华为Mate80系列或采用屏下3D结构光+侧边超声波指纹的双解锁方案。侧边超声波技术凭借其高精度和强抗干扰性,在屏下指纹领域广泛应用,能够实现在不牺牲机身厚度的情况下提升功能,且适用于湿手解锁和3D活体检测,提升安全性。数字化实验项目实践综合实训人工智能导论第四章

人工智能学科框架

人脸检测技术难点‌光照问题表情姿态问题遮挡问题年龄变化人脸相似性图像质量样本缺乏海量数据大规模人脸识别人脸识别的技术难点数字化实验项目实践综合实训人工智能导论第

7章

从图像识别到视觉理解[拓展学习]声音是怎么合成的?请使用任意一款音频处理软件完成声音合成,创作一个自己的配乐诗朗诵。制作步骤及要求如下:(1)录制一段自己朗诵的诗词,时长至少1分钟,保存成一个语音音频文件。(2)找到一段与诗词相配合的背景音乐,使用音频软件剪辑其中一段,与上一步录制的语音长度相同,调整音量不超过语音文件的音量,保存成一段音乐音频文件。(3)将语音文件和音乐文件合成,完成混音,合并为一个音频文件,形成最终的配乐诗朗诵作品。(4)要求将3个音频文件分别保存成Mp4格式,打包成一个压缩文件,作为作业提交。数字化实验项目实践综合实训人工智能导论【图灵奖】

卷积神经网络之父---杨立昆

杨立昆(YannLeCun)是法国人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论