人工智能通识导论(理论篇)课件 第3章-智能的觉醒:深度学习改变世界_第1页
人工智能通识导论(理论篇)课件 第3章-智能的觉醒:深度学习改变世界_第2页
人工智能通识导论(理论篇)课件 第3章-智能的觉醒:深度学习改变世界_第3页
人工智能通识导论(理论篇)课件 第3章-智能的觉醒:深度学习改变世界_第4页
人工智能通识导论(理论篇)课件 第3章-智能的觉醒:深度学习改变世界_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

共赢深度学习改变世界1第3章智能的觉醒2Transformer算法模型目录Introduction0101深度学习概览0303卷积神经网络(CNN)0202人工神经网络(ANN)0404循环神经网络(RNN)06060505图卷积神经网络(GCN)Transformer算法模型深度觉醒:当机器开始“看见”与“创造”识别万物→精准辨识猫、人脸、场景生成艺术

→绘制独一无二的风格画作这一切的引擎:深度学习为机器注入“觉醒的种子”,让它们真正开始

感知、理解、创造

—我们复杂而美丽的世界无缝翻译→跨越语言边界书写未来

→自动生成文章、故事、代码策略巅峰

→围棋、象棋击败人类冠军科学伙伴

→加速新药发现,探索分子宇宙视觉语言智能看见创造人工神经网络(ANN)生物神经元原理生物神经元是神经系统的基本单位细胞体(控制中心)树突(接收信号)轴突(传递信号)生物神经元人工神经网络(ANN)ANN结构前向计算逐层计算每一层的输出,直至输出层。输出=激活函数(Σ(输入×权重)+偏置)人工神经网络(ANN)ANN结构反向传播从输出层开始,逐层往回计算(传播)对应的误差。每一层的误差都是根据下一层的误差和当前层的激活函数的导数来计算的。通过梯度下降法更新参数人工神经网络(ANN)BP神经网络与反向传播

BP神经网络:一种多层前馈神经网络,核心特点是利用误差反向传播算法进行训

练。前馈:数据从输入层→隐藏层→输出层单向流动.

反向传播:当输出结果与真实值存在误差时,误差会从输出层开始,反向传播

回网络,用于调整各层神经元的权重和偏置,从而最小化误差。人工神经网络(ANN)BP神经网络与反向传播前向传播和反向传播交替进行,直至满足停止条件:通常是达到了预设的训练次数或者误差降至某个可接受的水平。

广泛应用于模式识别、数据分类、函数逼近、预测等领域在图像识别中,可以将图像的像素值作为BP的输入数据。(手写体识别)人工神经网络(ANN)应用案例:MNIST手写体识别问题:

基于BP网络实现手写体数字识别,识别手写的数字0到9。输入是一个28×28像素的灰度图像,输出是10个类别(0到9)中的一个。网络:

输入层,28×28像素

隐藏层,100个神经元

输出层,10个神经元(0-9)训练:

数据准备

前向传播

计算损失值

反向传播及权重更新评估:准确率

召回率F1分数人工神经网络(ANN)MNIST手写体识别结果卷积神经网络(CNN)CNN工作原理核心思想是利用卷积层的卷积核,在数据上滑动提取特征,大幅减少参数数量

5✖️5的图经过3✖️3的卷积核卷积操作后,得到3✖️3的卷积特征图(5-3+1)✖️(5-3+1)卷积神经网络(CNN)CNN工作原理-卷积核心思想是利用卷积层的卷积核,在数据上滑动提取特征,大幅减少参数数量

卷积神经网络(CNN)CNN特征提取原理无论如何变形、移动,都能准确识别X和O用-1表示黑色,用1表示白色这三个小矩阵可以看作识别“X”很重要的特征。作为卷积核能在对应位置匹配到这三个特征,就意味着识别出了“X”卷积神经网络(CNN)CNN特征提取原理特征矩阵元素值越接近1,说明对应位置和核代表的特征越相似卷积神经网络(CNN)CNN工作原理-池化卷积操作后可以通过池化操作(pooling)减少特征图的空间尺寸,同时提取其中更具有代表性的特征,以起到减小过拟合和降低维度的作用,同时达到平移不变性的目的。

池化操作包括最大池化和平均池化。卷积神经网络(CNN)CNN结构可以有多个卷积层,用来提取不同层次的局部特征将局部特征进行空间组合,实现分类卷积神经网络(CNN)CNN结构CNN提取了“猫”不同局部的特征将局部特征进行空间组合,实现“猫”的正确分类CNN应用案例卷积神经网络(CNN)第一层卷积特征图(前25个)CNN应用案例卷积神经网络(CNN)第二层卷积特征图(前25个)CNN应用案例卷积神经网络(CNN)第三层卷积特征图(前25个)CNN应用案例卷积神经网络(CNN)第四层卷积特征图(前25个)CNN应用案例卷积神经网络(CNN)第五层卷积特征图(前25个)CNN应用案例卷积神经网络(CNN)浅层卷积获得的特征数据与原始的图像数据比较接近,层数越深,学习到的特征就越具体。CNN总结卷积神经网络(CNN)CNN主要用于:1.特征提取(FeatureExtraction)每个卷积核都可以被看作是一个特征检测器。通过训练,不同的卷积核会学会检测不同的特定模式。2.生成特征图(FeatureMaps)一个卷积核在输入上滑动一遍后,会生成-张激活图或特征图。这张图上的高数值区域,表示原始输入中存在该卷积核所检测的特征。通常一层会使用多个卷积核(如32个、64个),因此会生成个特征图的堆叠,每个特征图负责检测一种特征。RNN神经网络循环神经网络RNN循环神经网络(RecurrentNeuralNetwork,RNN)是一类针对时序数据或序列数据(如文本、语音、视频、股票)而设计的深度学习模型。与CNN不同,RNN具有自反馈机制,拥有“内部记忆”,记住先前的信息,从而能够处理具有时间依赖性的数据,即序列中的每个元素不仅依赖于当前输入,还依赖于过去的输入。RNN神经网络循环神经网络RNNRNN神经网络循环神经网络RNNRNN神经网络循环神经网络RNNRNN神经网络循环神经网络RNN哥哥,手机坏了,好想要256g的苹果呀Xt=256gSt-1=“手机”St

=256GByteSt+1

=苹果手机Xt+1=苹果GCN神经网络图可以用来表示社交媒体网络、交通网络、论文引用网络,或者分子结构等非结构化数据。图卷积神经网络GCNGCN神经网络图可以用来表示社交媒体网络、交通网络、论文引用网络,或者分子结构等非结构化数据。图的不规则非结构化特点与传统图像有所不同,无法使用固定大小卷积核的CNN进行处理使用GCNN提取图的特征图卷积神经网络GCNGCN神经网络图卷积神经网络GCN随着层数的增加,模型能够逐渐捕获到节点的更广泛上下文信息,从而学习到更深层次的图结构特征。聚合操作:每个节点收集其邻居节点的特征,将其自身特征与邻居节点的特征进行平均或拼接等,得到聚合后的特征。TransformerTransformer‌Transformer‌是一种基于自注意力机制的深度学习模型架构,由Google团队在2017年论文《AttentionIsAllYouNeed》中提出,主要用于自然语言处理(NLP)任务,其核心优势在于并行计算能力和对长序列依赖的高效处理。多用于自然语言处理,Vision

Transformer将图像分块处理(代替CNN),多模态任务。TransformerTransformer输入序列是𝑋=(𝑋1,𝑋2,𝑋3,𝑋4),通过Encoder得到特征向量𝑍=(𝑍1,𝑍2,𝑍3,𝑍4),输入到Decoder:Decoder根据特征向量𝑍和起始标记生成𝑌1,根据𝑌1和Z生成𝑌2,再根据(𝑌1,𝑌2)和𝑍生成𝑌3,如此反复,直至最终当前输出和前面输出都相关TransformerTransformer自注意力机制(Self-Attention)通过计算序列中所有元素间的关联权重,动态捕捉上下文依赖关系,解决了传统RNN无法并行处理长序列的问题。‌‌TransformerTransformer多头注意力机制(Self-Attention)并行运行所有(多头)输入的自注意力机制,捕捉不同的关系,大幅提升训练效率。

‌‌深度学习模型与应用知识拓展假设你需要设计一个神经网络模型,用于识别短视频中的人物动作(例如“跑步”“跳跃”“挥手”)。视频由一系列连续的图像帧组成,每秒包含30帧。请结合以下三种网络的特点,回答以下问题:1.单独使用BP网络是否适合此任务?为什么?2.单独使用CNN或单独使用RNN各自的局限性是什么?3.能否结合CNN和RNN设计一个更合理的模型?简述你的思路。获校重点建设教材立项1项本章小结38本章介绍深度学习的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论