机器人感知与智能 课件 第十一章 深度学习技术_第1页
机器人感知与智能 课件 第十一章 深度学习技术_第2页
机器人感知与智能 课件 第十一章 深度学习技术_第3页
机器人感知与智能 课件 第十一章 深度学习技术_第4页
机器人感知与智能 课件 第十一章 深度学习技术_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器人感知与智能第十一章深度学习技术概述

OUTLINE深度学习技术深度学习作为机器学习的分支,通过模拟人类神经系统构建多层神经网络,利用海量标记数据自动提取特征,实现对未标记数据的精准预测与分类;相较于传统机器学习,它具备多层次表示、端到端学习、大规模并行计算加速以及强大泛化能力等显著优势,并在计算机视觉、自然语言处理等领域广泛应用,成为解决复杂实际问题的人工智能核心力量。本章将从深度学习技术种类(监督学习、半监督学习和无监督学习)出发,详细介绍深度学习的基本原理,包括神经元与激活函数、常见网络结构、神经网络的训练以及过拟合现象。最后,本章设计了一个基于MNIST手写数据集的分类实验,更深入理解深度学习技术的实际应用。01深度学习技术种类目录

CATALOGUE02深度学习原理03应用举例:机械臂抓取04实验01深度学习技术种类监督学习

回归任务示意图分类任务示意图无监督学习无监督学习旨在从未标记的数据中发现内在结构和模式,无需外部标签。相比监督学习,它更侧重探索数据的潜在特征与关系。在此过程中,模型仅依靠输入数据(无输出标签),通过学习数据的统计特性、相似性或潜在分布进行建模与推断。这能帮助我们发现未知模式、完成数据聚类及降维等任务。常见的任务包括聚类和关联规则挖掘,其中聚类最为典型。聚类是指将彼此相似的数据自动分为不同的组或簇。如图所示,原始数据为相对分离的随机点,聚类任务即在没有预先标注类别的情况下仅依照数据点间的距离关系将数据点分为右图中的3类。无监督学习广泛应用于数据分析、图像和自然语言处理等领域。它能提供对数据的全面认知,揭示隐藏的结构与规律,从而为后续的分析与决策提供高价值的信息。聚类任务示意图半监督学习半监督学习介于监督与无监督学习之间,它同时利用标记和未标记的数据来进行模型训练,如图所示。与依赖大量标记数据的传统监督学习不同,半监督学习结合少量标记数据,并充分利用大量未标记数据的特征分布,从而有效改善模型的泛化能力。其核心思想是假设相似样本具有相似标签。通过对比未标记数据的预测结果与真实标签,模型能自适应地调整参数,进一步提升性能。由于现实中获取标记数据往往昂贵且耗时,半监督学习通过利用未标记数据,能在标记数据有限的情况下显著提升模型的实际表现。常见的相关算法包括图半监督学习、生成模型和半监督支持向量机等。这些方法结合了两类数据,扩展了传统框架,为模型训练提供了更丰富的信息。半监督学习任务示意图02深度学习原理神经元与激活函数神经网络的设计灵感源于生物神经系统。右图显示了一个基本的生物神经元结构示意图。就像人类大脑中的神经元通过树突接收信号、再通过轴突传递给下一个神经元一样,深度学习中的人工神经元也会接收来自原始数据或上一层的输入。每个输入都会被赋予一个代表重要性的权重,神经元会将这些输入进行加权求和,最后通过激活函数来计算并生成最终的输出。激活函数在深度学习中起着决定性的作用,因为它为模型引入了关键的非线性。由于神经网络层与层之间的基础传递仅仅是线性的求和过程,如果没有激活函数,无论你把网络搭建得多么复杂、嵌套多少层,最后的输出依然只是一堆枯燥的线性组合,完全无法处理复杂的现实问题。常用的激活函数包括Sigmoid、Tanh以及ReLU等。人工神经元示意图神经元与激活函数

Sigmoid函数图像Tanh函数图像ReLU函数图像网络结构神经网络以模拟人脑的神经元为基本单位,通过接收输入、加权处理并产生输出。网络通常由多层相连的结构组成,最核心的结构分为输入层、隐藏层和输出层。(1)输入层:负责接收原始数据(如图像的像素值)供网络处理,其神经元数量通常与输入数据的特征数量一致。(2)隐藏层:位于输入与输出之间,是学习数据特征与模式的核心模块。它通过加权、加偏置并引入激活函数来实现非线性转换。深度学习的“深度”即指隐藏层的层数;网络越深,能学习的模式越复杂,但也更难训练。(3)输出层:作为网络的最后一层,其架构由具体的任务决定(例如在分类任务中输出各个类别的概率值),负责汇总并生成网络最终的预测结果。两层神经网络示意图网络结构随着深度学习的飞速发展,神经网络结构不断进化,以下是三种最常见的模型:(1)卷积神经网络(CNN):专长于处理图像等网格数据。它通过卷积层和池化层(结合局部感受野与权重共享)高效提取特征并大幅减少参数量,在视觉任务中表现卓越(代表作如VGG、ResNet)。(2)循环神经网络(RNN):专精于自然语言等时间序列数据。它通过循环隐藏层保留历史信息的内部状态;为解决长序列训练时的梯度消失或爆炸问题,衍生出了LSTM和GRU等现代变体。(3)Transformer:正逐步取代RNN的新型架构。它完全依靠自注意力(Self-Attention)机制高效捕获长距离相关性,且支持高度并行计算,大幅降低了训练时间,是BERT、GPT等大语言模型的核心基石。神经网络的训练

前向传播与反向传播神经网络的训练

过拟合深度学习模型不仅需拟合训练数据,更需具备在未知数据上表现优异的泛化能力。当模型过度学习了训练集中的“噪声”而非真实规律时,就会发生“过拟合”——即在训练集上表现近乎完美,但在测试集上误差显著增大。其常见原因包括模型过复杂、数据量不足或数据不平衡等。解决过拟合的常用方法如下:(1)正则化(Regularization):通过向损失函数添加额外的惩罚项来抑制模型权重的大小,从而降低模型复杂度。常见方法有L1和L2正则化。(2)早停(EarlyStopping):在训练过程中,一旦监测到模型在验证集上的性能开始下降,便提前终止训练,这是一种简单有效的防过拟合策略。(3)增加数据或数据增强:在训练数据不足时,可直接扩充数据或采用数据增强技术。后者通过对原始数据进行处理(如图像的旋转、翻转、裁剪,或文本的同义词替换等),低成本地生成多样化的新样本,从而提升模型的泛化能力。03应用举例:机械臂抓取应用举例:机械臂抓取抓取点预测目标物体的检测和定位概述抓取点预测决定了机械臂的抓取成功率。深度学习模型通过处理RGB-D或点云数据提取物体的三维特征,并在运动约束下计算出最稳定的抓取位置,大幅提升了操作的精度与智能化水平。基于CNN的深度学习模型(如R-CNN和YOLO)能高效提取图像特征,在复

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论