版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息技术与人工智能基础项目7
图像识别01项目背景02思维导图03思政聚焦04项目相关知识05项目任务目录CONTENTS06项目小结与展望01项目背景图像识别背景介绍伴随着图片成为互联网中的主要信息载体,难题随之出现。当信息由文字记载时,我们可以通过关键词搜索轻易找到所需内容并进行任意编辑,而当信息由图片记载时,我们却无法对图片中的内容进行检索,从而影响了我们从图片中找到关键内容的效率。图片给我们带来了快捷的信息记录和分享方式,却降低了我们的信息检索效率。在这个环境下,借助计算机实现图像主体的识别技术就显得尤为重要。计算机视觉应用----图像识别图像识别,指利用计算机对图像进行处理、分析和理解,以识别图像中各种不同模式的目标和对象的技术。通俗地讲,图像识别是让计算机像人一样读懂图片的内容,识别出图像中有什么物体,并报告出这个物体在图像中的位置和方向。02思维导图思维导图03课程思政图像识别技术应用在互联网的海量图片、视频资料中,不少涉政敏感信息、暴力、低俗等内容的图片充斥其中,这些图片严重影响着国家安全和网络文明。在图像识别还未发展成熟以前,需要人工随机抽取图片对图片内容进行审核。借助人工智能、深度学习和大数据样本等技术,这一问题得到了很好地解决。当然,智能图片鉴别模型并不能完全取代人工鉴别,相比人工审核,机器还很难理解内容背后的深意。最佳的审核方式是智能为主,人工为辅。先由智能图片鉴别模型将可疑的图片筛选出来,再由人工审核一遍,这样既能保证效率又能保证准确率。图像识别技术应用网络上的内容并不都是文明和健康的,我们应该要懂得文明上网,取其精华,去其糟粕。对于个人而言,不得在网上发布和传播虚假信息、低俗或暴力信息;不得在网上通过发帖、评论等方式攻击、谩骂他人;不得在网上从事其他违背公序良俗、损害他人合法权益的活动;不去浏览一些负面新闻,更不应该去浏览一些低俗、暴力的网站,让自己自觉抵制不良内容;不参与网络敏感话题,对于一些敏感的或者反动的话题,要及时制止,不参与,不散播。04项目相关知识图像识别人类和计算机是如何识别这张图片的呢?图像识别的任务划分
a)分类
b)分类+定位
c)多目标检测图像识别任务划分分类的相关技术图像分类的流程包括训练阶段和测试阶段名词解释:训练集、测试集、独热编码、置信率4种类别的训练图片图像的原始特征表示形式莱娜灰度图图像的原始特征表示形式(a)彩色莱娜图
(b)红色分量
(c)绿色分量
(d)蓝色分量彩色莱娜图及其红色、绿色、蓝色分量图像的预处理平移:把我们感兴趣的、图中的对象移到图像的中间位置,便于尽可能准确地、定量地分析图像的特征缩放:一个数组越大,计算机处理该数组时消耗的内存越大、花费的时间越长,因而可以根据需要对图像大小进行调整填充:为了使待处理图片符合分类模型对图像像素尺寸的要求,用特定的像素值对图片的长或宽的像素数量进行补充传统分类算法特征提取:(1)颜色直方图、局部二值模式、方向梯度直方图特征、尺度不变特征变换、Gabor特征、区域协方差描述符
(2)主成分分析(PrincipalComponentAnalysis,PCA)、线性判别分析(lineardiscriminantanalysis,LDA)、流形学习(manifoldlearning)和稀疏编码(SparseCoding,SC)分类器:K近邻(K-NearestNeighbor,KNN)、支持向量机(SupportVectorMachine,SVM)、决策树、朴素贝叶斯、逻辑回归等传统分类算法KNN分类器原理示意图深度学习算法深度学习算法的特点优势:在训练集数量充足的情况下准确率高局限性:(1)大数据集花费昂贵且耗时,并不容易获得
(2)训练阶段对硬件要求高目标检测相关技术滑动窗口检测示意图目标检测相关技术预测框的交并比说明非极大值抑制(Non-MaximumSuppression,NMS):当边框预测环节生成了大量建议边框后,接着要为每个矩形框做类别分类概率,最后需要判别哪些矩形框是没用的。所谓的非极大值抑制就是根据分类器类别分类概率做排序,从小到大排序,先拿最大概率候选框与其他框计算重叠度IOU,丢弃高于阈值的建议框。然后从没有被丢弃的建议框中再找最大概率建议框,重复上述操作,直到找到所有被保留下来的建议框。滑窗法改进YOLO算法示意图1.两步检测算法:R-CNN2.一步检测算法:YOLO图像识别的局限性1.多视角和尺度:同一个物体的图像,它的角度和尺度是多变的,获取到的这个物体的图片也是多样的;2.遮挡:目标物体可能被挡住,图片中只有目标物体的一小部分;3.光照条件:在像素层面上,光照对图片的影响非常大;4.类内差异:同一类别的个体之间有许多不同的对象,每个个体都有自己的外形。图像识别的优势1.在大数据时代,人类获取的图片资料越来越多,人们需要借助计算机去承担这些复杂沉重的工作,否则这些工作将由人类负担。2.在一些极端环境下,比如水下、严寒或酷暑的环境下的图像识别,如果工作由人工智能来完成,人类面临的危险、伤害和压力将有所减轻。3.人类判断物体类别的准确率总体上会比机器的识别率高,但在一些要求精密度的识别,比如缺陷识别、医学图片等识别,人类的优势可能会相应降低。在这类场合,通过机器替代人来实现图像识别,能够减少错误和缺陷。图像识别的应用1.光学字符识别2.图片识别分析3.工业瑕疵检测4.视频监控分析5.医疗影像诊断04项目任务任务1:数字识别1、任务描述手写数字识别是常见的图像识别任务。不同人的手写体风格迥异,大小不一,造成了计算机对手写数字识别任务的一些困难。任务1实践的主要目的是了解数字识别的基本原理与过程。首先通过查看数字图像的像素表达,了解图像到数字的转化过程,再通过手写数字的识别了解手写体识别的功能。2、任务实现2、任务实现2、任务实现任务2:目标检测1、任务描述目标检测是一个典型的计算机视觉任务,主要是完成图像中的物体的识别。与图像分类不同的是,图像分类是预测图像属于哪一种类别,而目标检测则是对图像中的一个或多个对象进行定位和分类。如果是视频,则通过不断的读取视频中的每一帧作为一幅幅图像来进行检测。任务2实践的主要目的是了解目标检测的基本原理与过程,通过上传图片来验证和实践目标检测中的图像预处理、目标定位与分类的各个步骤。2、任务实现2、任务实现2、任务实现04项目小结与展望项目小结
人类感觉信息中的80%都是视觉信息,图像是人类获取和交换信息的主要来源。机器视觉之于人工智能的意义就是视觉之于人类的意义,而决定着机器视觉技术之一就是图像识别技术。随着计算机技术的不断发展,图像识别技术也在不断地优化,其算法也在不断地改进。在某些应用场景,机器视觉比人类的生理视觉更具优势,它更加准确、客观和稳定。利用计算机代替人类实现图像识别,能够尽量缩短时间并减少资源。项目展望
人们一直致力于开发各种智能工具辅助人们的生产生活,比如机器人的研制,但是要想使得机器人可以像人一样运动,辅助人们的工作生活,那么前提是机器人必须具备类似于人的视觉系统,能够识别物体以及场景,真正的智能工具应该要具备“视觉”。目前的图像识别技术是作为一个工具来帮助我们与外部世界进行交互,为我们自身的视觉提供强有力的辅
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年首都医科大学附属北京世纪坛医院医护人员招聘笔试参考试题及答案详解
- 2026年台州市中心医院医护人员招聘笔试参考试题及答案详解
- 2026年上饶市人民医院医护人员招聘考试参考试题及答案详解
- (2026年)学校食堂食品安全各种管理制度
- 2026年舟山市妇幼保健院医护人员招聘笔试备考试题及答案详解
- (2026年)防治校园欺凌工作规章制度
- 2026年南方医科大学第三附属医院医护人员招聘笔试参考试题及答案详解
- 2026年昆明市中医医院医护人员招聘考试参考试题及答案详解
- 2026年青岛市肿瘤医院医护人员招聘考试参考题库及答案详解
- 2026年昆明市第一人民医院医护人员招聘考试备考试题及答案详解
- 2026年餐饮从业人员食品安全知识培训测试题及答案
- 2026年高考上海卷语文试卷题库及答案(新课标卷)
- 幼儿园膳食营养总结
- 2024中煤航测遥感集团限公司招聘58人易考易错模拟试题(共500题)试卷后附参考答案
- 2024年郑州高新投资控股集团有限公司招聘笔试冲刺题(带答案解析)
- 可吸收缝合线医疗器械项目可行性分析报告
- 做改革创新的生力军
- 有机物同分异构体
- 正摇双脚并脚跳绳教学设计
- 假体周围感染诊疗策略
- 现代纺纱技术课件ppt 第二章1-2新型纺织纤维及其加工技术
评论
0/150
提交评论