《人工智能通识基础》课件 第3章 神经网络与深度学习_第1页
《人工智能通识基础》课件 第3章 神经网络与深度学习_第2页
《人工智能通识基础》课件 第3章 神经网络与深度学习_第3页
《人工智能通识基础》课件 第3章 神经网络与深度学习_第4页
《人工智能通识基础》课件 第3章 神经网络与深度学习_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第3章

神经网络与深度学习人工智能通识基础1.神经网络基础2.深度学习的诞生3.深度学习的技术分支目录Contents神经网络基础01大脑中的神经网络我们的大脑是由超过1千亿个神经元组成的,这些神经元都是同质的,而且功能很简单,但当大量神经元连接在一起时,就可以完成很复杂的功能。特别重要的是,神经元之间的连接是可学习的,我们就是通过这种能力,慢慢学会了各种技能。小开关大脑中的神经网络大脑里的神经网络可以理解为一个庞大的“信息高速公路系统”,神经元通过这些道路相互连接,传递信息。就像一座城市里各种道路把不同地方连接起来,让信息(信号)可以在各个地方之间快速流动。神经网络如何让我们思考和做决定?当我们在思考或做某件事时,成千上万的神经元在这个神经网络中互相发送信号。比如,你看到一只猫,大脑的视觉神经元先接收到图像信息,然后通过一连串的神经网络传递到负责“识别”的部分,最终得出“这是只猫”的结论。这个过程就像是信息在一个大网络中被传递、处理和最终输出答案的过程。神经网络研究历史脉络科学家受到人脑工作的启发,设计出了人工神经网络。在人工神经网络里,计算机模拟了神经元和神经网络的工作原理。每个人工“神经元”可以接收信息、做简单计算,然后将结果传递给下一个“神经元”。这些人工神经网络通过大量的数据训练,逐步学会如何识别图像、声音或其他复杂任务,类似于我们大脑如何通过经验逐渐学会某些事情。什么是人工神经网络模拟生物神经元连接结构包含“输入层—隐藏层—输出层”结构每个节点就是一个“类神经元”输入层输出层隐藏层水果识别器怎么学会“认水果”?情境:输入特征:颜色、形状、大小输出结果:苹果or香蕉输入(特征)→神经网络处理→输出(分类结果)神经网络的基本原理手写数字识别机器是如何通过多层神经网络识别手写数字的呢?以识别数字“8”为例,我们可以将整个过程分为以下几个步骤:1.输入层:接收图像像素信息手写数字的图片通常被划分成一个个小格子,每个格子对应一个像素点。每个像素的灰度值(例如黑、灰或白)被转换为一个数字输入给神经网络,作为网络处理的起点。2.第一层隐藏层:提取基础特征这一层负责从原始像素中识别出简单的视觉元素,比如边缘、直线、弧形等。这些特征就像是数字构成的“零件”。以数字“8”为例,网络可能会在这一层识别出两个相对独立的圆形轮廓。3.第二层隐藏层:组合局部结构这层会进一步整合前一层提取到的基本图形,将多个线条、弧形组合成更复杂的区域结构。例如,网络可能将两个圆形特征组合,识别为数字“8”特有的上下圆形结构。4.第三层隐藏层:形成抽象表示并匹配类别在这一层,网络会根据前面提取到的复杂特征形成更高层的模式表示,并将其映射到对应的数字类别。比如,它通过训练学习到:“两个垂直排列的圆形,很可能表示数字8”。5.输出层:给出最终判断最后,输出层会根据第三层生成的表示,输出对每个数字的预测概率(如

0到9)。系统会选择概率最高的结果作为最终识别结果,例如判断“这是数字8”。深度学习的诞生02从“层层神经”到“智能觉醒”人工设计特征费时费力,效果不稳定图像、语音、文本等高维数据难以处理一般来说,在参数量相同的前提下,层数更多的神经网络具有更强的学习能力。通常称包含两个隐藏层以上的神经网络为深度神经网络。基于多层结构的机器学习方法一般称为深度学习。虽然任何一种多层结构都可以用于深度学习,到目前为止,深度神经网络依然是应用最广泛的深度学习模型。深度学习VS传统机器学习深度神经网络之所以如此强大,一个很重要的原因在于它可以通过层次性处理逐渐提取抽象特征。维度传统机器学习深度学习特征处理依赖人工经验提取自动从原始数据中学习模型结构浅层(1-2层)多层(10层以上)能力范围适合结构化小数据擅长处理图像/语音等高维大数据示例算法决策树、SVM、KNNCNN、RNN、Transformer深度学习的强大,源于其强大的特征抽象能力与参数表达力深度学习成功的三大推手大数据:海量数据提供足够训练样本计算能力:GPU等硬件突破推动模型训练算法进步:如Dropout、BatchNorm、Adam等技术提升模型泛化案例:智能垃圾分类系统1.项目目标:设计深度学习的模型,能够实现智能垃圾分类系统,该系统通过识别垃圾的种类,自动将垃圾分配到正确的回收区域。2.项目步骤:1)输入层:垃圾图像数据输入的是垃圾的照片,这些图像经过预处理,调整大小(如128×128像素)并归一化处理,转化为深度学习模型可以处理的数字格式。2)隐藏层:逐层提取垃圾特征(1)第一层隐藏层:提取基本形状和纹理特征,例如,识别图像中圆形轮廓(可能是罐子)或矩形轮廓(可能是纸箱)。(2)第二层隐藏层:捕捉材质特征,分析垃圾的材质特性,如塑料表面的光滑纹理、金属的反光、纸张的纹路等。(3)第三层隐藏层:组合多维信息,将形状、材质等特征组合起来,区分不同类型的垃圾。例如,金属饮料罐和塑料瓶可能有相似的形状,但材质特性不同。3)输出层:分类结果输出层根据隐藏层提取的特征,给出垃圾的分类结果,例如“这是一个塑料瓶”“这是一个金属罐”等。深度学习的技术分支03你知道“看图写文案”的AI是怎么实现的吗?电商平台上传一张产品图,AI自动生成广告语:

“清新百搭白T恤,夏日出行好伴侣!”视频平台的AI能自动加字幕,甚至预测你爱看的内容。这些背后的核心:不同分支的深度学习模型深度学习技术分支全景图方法适合任务应用领域CNN空间数据(图像)图像识别、医学影像、安防监控RNN序列建模(时间、文本)语音识别、文本生成、金融预测GAN生成任务虚拟人脸、图像修复、AI绘画Autoencoder特征压缩、重建降噪、异常检测、编码学习Transformer自然语言处理、序列建模机器翻译、对话系统、搜索排序GNN图结构数据社交网络分析、知识图谱、推荐系统DRL决策与控制任务游戏智能、机器人控制、智能调度卷积神经网络CNN让机器“看图识物”的核心工具原理简介:使用“卷积核”自动提取图片特征类比解释:像放大镜扫描图片,抓住边缘、颜色、形状等信息网络结构:输入层→卷积层→池化层→全连接层→输出层人脸识别(如支付宝刷脸支付)医学影像辅助诊断(如肺部CT筛查)自动驾驶中的路标识别应用案例你手机相册里的‘人物识别’是靠CNN吗?你怎么看它的准确性?卷积神经网络CNN案例:分析卫星图像1.项目目标:分析和设计使用CNN进行卫星图像分析的过程。2.项目步骤:1)输入图像:图像包含建筑物、道路、植被和水体等地貌信息,作为CNN的输入数据。2)卷积操作:滤波器识别出建筑物的方形轮廓、道路的连续直线特征,以及植被区域的松散纹理特征。3)池化层:将建筑物边缘的直线特征压缩为更小的表示,忽略水体和阴影等无关信息,如:图像尺寸从512×512缩小到128×1284)多层卷积与池化:(1)第一层识别简单边缘,初步区分建筑物和道路。(2)第二层识别建筑物的矩形结构和屋顶形状。(3)第三层分辨建筑物与周围植被或其他地貌的差异。5)全连接层:综合建筑物特征,分类像素区域为“建筑物”、“道路”、“植被”或“水体”。6)输出结果:标注后的图像,建筑物区域标红色,道路标黄色,植被标绿色,水体标蓝色。序列的编织者:循环神经网络(RNN)AI如何“理解”时间与顺序?原理简介:节点之间具有“记忆连接”,前一个状态会影响下一个决策比喻说明:像人读一句话,后面词的理解依赖前面的内容局限:普通RNN难以长时记忆,发展出LSTM与GRU结构应用案例智能语音助手(如Siri听你讲整句话)股价预测(依赖历史走势)文字生成(自动写诗、写评论)试想你写一封信,哪种AI能帮你续写得像人写的?序列的编织者:循环神经网络(RNN)案例:预测每日用电量1.项目目标:分析和设计使用RNN预测每日用电量的过程。2.项目步骤:1)输入数据:模型接收过去一周的每日用电量数据作为输入,例如:[30,35,40,38,42,45,43](单位:千瓦时),每个数值代表一天的总用电量。这些数据构成了一个时间序列,输入到RNN中进行逐步处理。2)隐藏状态更新:在模型处理到第5天的数据(42千瓦时)时,会根据当前输入(第5天的用电量)与第4天计算得到的隐藏状态共同生成新的隐藏状态,从而在内部表示中保留了从第1天到第5天的时间依赖特征。这个隐藏状态承载了序列历史信息,用于后续的预测任务。3)输出预测:以第5天的隐藏状态为基础,模型预测第6天的用电量,并输出45千瓦时作为结果。在此示例中,预测值与实际值(45千瓦时)一致,说明模型能够较好地捕捉近期用电趋势。请注意,该预测过程为示例,实际训练初期可能存在较大误差。4)权重更新:如果模型在第7天预测的用电量为41千瓦时,而实际值为43千瓦时,则会通过误差计算,使用**反向传播通过时间(BPTT)**算法将误差信息反向传播回模型,调整网络的权重参数,从而提升未来预测的准确性。5)完成任务:在经过训练和调整后,模型可用于预测接下来的几天用电量。例如,预测第8~10天的结果为:[44,46,45](单位:千瓦时)。这些预测结果可为电网运营提供依据,优化电力调度计划,避免供电不足或资源浪费。攻防博弈的艺术:对抗神经网络(GAN)AI也能“以假乱真”?应用案例原理结构:两个网络对抗学习生成器(Generator):努力制造“假图像”判别器(Discriminator):努力识破“假货”对抗结果:最终生成器越来越强,能生成逼真内容AI人像生成(如AI换脸)老照片修复、黑白上色动漫风格转换GAN能生成‘假新闻’视频,你怎么看这种技术风险?攻防博弈的艺术:对抗神经网络(GAN)案例:转换图片风格1.项目目标:分析和设计使用对抗神经网络(GAN)将普通照片转换为手绘风格的人物肖像的过程。2.项目步骤:1)模型构建:搭建一个图像转换模型,包含生成器和判别器两部分。生成器接受普通照片作为输入,输出具有手绘风格的图像;判别器接收真实的手绘图像与生成器生成的图像,并判断输入图像是否为真实作品。该模型可基于条件GAN构建。2)生成初始图像:训练初期,生成器输出的图像通常较为模糊,可能仅具有大致轮廓,缺乏五官细节、笔触特征或阴影结构。此时,判别器能够轻松识别其为非真实图像。3)判别器学习:判别器不断学习识别生成图像中的不自然之处,如五官比例异常、阴影错位、笔触不连贯等,从而更准确地区分真实手绘图像与生成图像。4)生成器优化:在判别器反馈的引导下,生成器逐步优化其输出图像的细节表现,学习手绘风格中的关键元素,如柔和的线条、富有表现力的阴影和艺术化的背景处理,使生成图像更接近真实手绘效果。5)对抗训练:通过持续的对抗训练,生成器不断提升图像的真实性,判别器则持续强化其判别能力。二者在博弈中共同进步,使得生成图像愈加逼真,判别器也越来越难以判断图像真伪。6)训练完成:当生成器生成的图像在风格、细节和构图等方面已接近真实手绘图像,并能“欺骗”判别器时,可认为模型训练达到预期目标。此时,系统能够将输入的普通照片转换为风格独特、细节丰富的手绘风格肖像图像。数据维度的压缩大师:自编码器(Autoencoder)AI如何“自动压缩信息”?应用案例核心机制:编码-解码结构模拟人类提炼摘要的过程,先压缩重要特征,再重构原始数据。与传统压缩方法不同:能自动学习最优特征表示,适用于复杂数据。结构组成:编码器(Encoder):压缩数据解码器(Decoder):重建数据潜在空间表示(latentspace)图像降噪(还原模糊图片)数据可视化(高维→低维)异常检测(重建误差大=异常)数据维度的压缩大师:自编码器(Autoencoder)案例:修复照片1.项目目标:分析和设计使用Autoencoder修复图片的过程。2.项目步骤:1)输入图片:输入为一张128×128像素的家庭合影图像,拍摄于生日场景,存在轻微模糊与局部亮度不均问题,作为模型修复对象。2)编码过程:编码器通过神经网络将图像压缩为一个256维的潜在特征向量,从中提取颜色分布、轮廓结构与背景纹理等关键视觉信息,去除冗余数据。3)潜在表示:该256维特征向量是图像的低维表达,保留了最具代表性的结构信息,如人物姿态、物体轮廓与场景构图,作为后续解码的基础。4)解码过程:解码器利用潜在向量重建出128×128像素图像,通过神经网络逐步恢复图像细节,修复模糊区域与光照偏差,使输出图像更自然清晰。5)损失函数:训练过程中通过计算原始图像与重建图像之间的重建误差(如均方误差MSE)来评估模型性能。模型不断优化参数,降低损失值,提高图像修复质量。语言的解码者:TransformerAI如何“聚焦重点内容”?应用案例核心机制:注意力机制(Attention)模拟人类在阅读时“聚焦关键词”的方式与CNN/RNN不同:可并行处理长序列,速度快、效果好结构组成:Encoder-Decoder(编码器-解码器)、多头注意力、多层堆叠ChatGPT背后的大脑机器翻译图像描述生成语言的解码者:Transformer案例:修复照片1.项目目标:分析和设计使用Autoencoder修复图片的过程。2.项目步骤:1)输入图片:输入为一张128×128像素的家庭合影图像,拍摄于生日场景,存在轻微模糊与局部亮度不均问题,作为模型修复对象。2)编码过程:编码器通过神经网络将图像压缩为一个256维的潜在特征向量,从中提取颜色分布、轮廓结构与背景纹理等关键视觉信息,去除冗余数据。3)潜在表示:该256维特征向量是图像的低维表达,保留了最具代表性的结构信息,如人物姿态、物体轮廓与场景构图,作为后续解码的基础。4)解码过程:解码器利用潜在向量重建出128×128像素图像,通过神经网络逐步恢复图像细节,修复模糊区域与光照偏差,使输出图像更自然清晰。5)损失函数:训练过程中通过计算原始图像与重建图像之间的重建误差(如均方误差MSE)来评估模型性能。模型不断优化参数,降低损失值,提高图像修复质量。结构的解析者:图神经网络(GNN)AI如何“聚焦重点内容”?应用案例核心机制:图结构传播与聚合模拟人类“关系脑图”的构建方式,在复杂关系图中建模信息传播。区别于普通神经网络:支持非欧式数据结构(如社交关系图)结构组成:邻接节点信息聚合多层消息传播节点嵌入更新社交推荐(找“潜在好友”)知识图谱推理(如人物-事件关联)分子结构分析(药物研发)结构的解析者:图神经网络(GNN)案例:识别关键用户1.项目目标:分析和设计使用GNN识别高影响力的关键用户的过程。2.项目步骤:1)图的表示:节点表示用户,边表示用户之间的好友关系,例如A用户与B用户互相关注构成一条边。2)节点特征初始化:每个节点初始特征向量表示用户属性,如活跃度或发帖频率。A用户初始特征向量为:[发帖频率:5次/天,点赞数:100,评论数:50]。3)信息传播:A用户从好友B和C用户学习到高互动性,更新自身特征。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论