人工智能-19. 计算机视觉发展史2

上传人：1*** IP属地：广东上传时间：2026-04-23 格式：DOCX 页数：3 大小：17.08KB 积分：15 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

19：计算机视觉发展史（2）教师姓名授课名称人工智能及机器学习基础知识授课形式授课班级授课地点授课日期章节名称计算机视觉发展史（2）教学目的了解计算机视觉发展史。了解人工智能技术的应用。重点难点重点：人类视觉和计算机视觉的特点。难点：人工智能技术的应用。主要内容一、课程引入了解计算机视觉的发展史，能进一步加深我们对计算机视觉的认识。课程内容1990-2000年代，机器学习方法2000年左右，机器学习方法开始流行。以机器学习为手段的计算机视觉研究框架成为主流。之前，完成计算机视觉的任务，需要专家构建特征库、统计模型，进而使用特征进行图像匹配。专家需要选择特征知识，还要制定图像匹配的规则。使用了机器学习技术之后，模型在优化过程中，可以自动从大量数据中寻找最优的识别方法，提高了识别的效率。机器学习技术是从大量的数据中来构造模型。因此，机器学习离不开大规模的数据集。这一时期也是互联网迅猛发展的时期，计算机视觉领域的大规模数据集也应运而生。下面我们看几个有代表性的数据集。（1）FDDB 数据集该数据集用于人脸检测采用人工标注的方式，对数据集包含的每一张人脸，使用框给框起来。FDDB数据集包含了2845张图像，一共标注了5171张人脸的位置。计算机可以从这些标注好的数据中，使用机器学习技术来学习如何检测人脸。（2）PASCALVOC数据集PASCAL Visual Object Challenge数据集该数据集中包含了20种类别的图片，每种图片的数量在一千至一万张不等。（3）ImageNet数据集包含总计两万两千种类别，图片数量超过一千四百万张。ImageNet数据集已经成为计算机视觉的标准测试数据。该数据集是斯坦福大学教授李飞飞等人所建立的。机器学习方法在很多情况下能获得较好的效果，但在2010年之后也逐渐遇到了瓶颈。对具体任务进行特征的设计，需要丰富的经验，并且需要根据任务的场景进行大量的调试工作；随着任务越来越复杂，机器学习模型的选择和调试也变得更复杂；如何选择适合的特征、并搭配合适的机器学习算法，以获得最优的效果，变得日益困难。2012年—至今，深度学习2012年，深度学习带来了计算机视觉的突破。在基于ImageNet数据集的ILSVRC竞赛中，Hinton教授研究组使用深度卷积神经网络将ImageNet数据集上图像分类的错误率由26%降低到了15%。此后短短几年内，各种深度神经网络技术迅猛发展。2015年ILSVRC的错误率已经降到了3.6%，已经低于人类的错误率了。可以说，计算机视觉技术基本上解决了物体分类问题。深度学习的优点：不需要专家提供知识，由深度神经网络自动进行特征学习和表征；深度神经网络具有复杂的参数结构，可以使用同一个模型来解决问题；基于深度学习的计算机视觉技术，从原理上更加符合人类视觉的工作机制，容易吸收脑科学和神经科学的研究成果。深度学习的缺点：模型过于复杂，需要海量的训练数据和大量的计算资源。而人类视觉只需要很少量的样

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能-19. 计算机视觉发展史2

文档简介

温馨提示

最新文档

评论

人工智能-19. 计算机视觉发展史2

文档简介

温馨提示

最新文档

评论

相关文档