版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Python数据挖掘与机器学习第9章神经网络与深度学习第8章聚类本章内容神经网络基础BP神经网络深度学习10十一月20242第
9章神经网络与深度学习3神经网络基础神经网络(NeuralNetwork)最早由心理学家和神经学家开创,旨在寻求开发和检验神经的计算模拟。它是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能模拟生物神经系统对真实世界物体所作出的交互反应。今天的“神经网络”已是一个相当大的、多学科交叉的学科领域。神经网络可以用于分类(预测给定元组的类标号)和数值预测(预测连续值输出)等。人工神经元(简称神经元)是神经网络的基本组成单元,它是对生物神经元的模拟、抽象和简化。现代神经生物学的研究表明,生物神经元是由细胞体、树突和轴突组成的。通常一个神经元包含一个细胞体和一条轴突,但有一个至多个树突。
7.1.1神经元4生物神经元第9章神经网络与深度学习5
1神经元模型神经网络中最基本的成分是神经元(Neuron)模型。生物神经网络中的每个神经元彼此互连,当它“兴奋”时,就会向相连的神经元发送化学物质,从而改变这些神经元内的电位。如果某神经元的电位超过一个阈值,它就会被激活,即“兴奋”起来,向其他神经元发送化学物质。1943年,美国心理学家麦卡洛克(McCulloch)和数学家皮特斯(Pitts)按照生物神经元的结构和工作原理建立了M-P模型。第9章神经网络与深度学习61神经元模型在M-P模型中,为了使得建模更加简单,以便于进行形式化表达,忽略时间整合作用、不应期等复杂因素,并把神经元的突触时延和强度当成常数。
第9章神经网络与深度学习7第9章神经网络与深度学习8由于累加性,对全部输入信号进行累加整合,相当于生物神经元中的膜电位,其值为:第9章神经网络与深度学习9第9章神经网络与深度学习2感知机与多层网络感知器(Perceptron)由两层神经元组成,如图9-3所示。这个结构非常简单,它其实就是输入输出两层神经元之间的简单连接。10十一月202410第9章神经网络与深度学习10十一月202411感知机(Perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础;输入为特征向量,输出为实例的类别,取+1和-1;感知机对应于输入空间中将实例划分为正负两类的超平面,属于判别模型;导入基于误分类的损失函数;利用梯度下降法对损失函数进行极小化;感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式。
7.1.1神经元12第9章神经网络与深度学习
7.1.1神经元13步数操作123重复第2步,直到没有误分类点第9章神经网络与深度学习用神经网络来模拟逻辑代数中的异或运算7.1.2神经网络14第9章神经网络与深度学习用神经网络来模拟逻辑代数中的异或运算代表异或运算的点是线性不可分的,因此无法用感知机模拟,此时可以将三个分布模拟与非、或和与运算的感知机连接在一起,共同完成异或运算。7.1.2神经网络15第9章神经网络与深度学习神经元模型在神经网络中的画法单个神经元只能划分线性可分的二分类点。如果将神经元连接成神经网络,则处理能力会大为增强,这也是神经网络得到广泛应用的原因。7.1.2神经网络16第9章神经网络与深度学习第9章神经网络与深度学习要解决非线性可分问题需要使用多层感知器(多层网络)来解决。多层感知机(MultilayerPerceptron,MLP)除了输入输出层,中间可以有多个隐层。最简单的MLP只含一个隐层,即三层的结构。更一般的,常见的神经网络是形如图9.4所示的机构这样的网络结构通常称为多层前馈神经网络(Multi-layerFeedforwardNeuralNetworks)。10十一月202417第9章神经网络与深度学习2BP神经网络多层网络的学习能力比单层感知机强很多,要训练多层网络,简单的感知机学习规则显然不够,需要更强大的学习算法。误差逆传播(ErrorBackPropagation)算法就是学习算法中的杰出代表。现实任务中使用神经网络时,大多是使用BP算法进行训练。需要注意的是,BP算法不仅可以用于多层前馈神经网络,还可以用于其他类型的神经网络。通常说BP网络时,常指利用BP算法训练的多层前馈神经网络。神经网络可以用于分类(预测给定元组的类标号)和数值预测(预测连续值输出)等。10十一月202418第9章神经网络与深度学习多层前馈神经网络由一个输入层、一个或多个隐层和一个输出层组成,如图9-5所示。它利用后向传播算法迭代地学习用于元组类标号预测的一组权重。10十一月202419第9章神经网络与深度学习后向传播算法后向传播通过迭代地处理训练元组数据集,把每个元组的网络预测与实际已知的目标值相比较进行学习。对于每个训练样本,修改权重使得网络预测和实际目标值之间的均方误差最小。这种修改“后向”进行,即由输出层,经由每个隐层到第一个隐藏层。BP算法的主要思想是把训练过程分为两个阶段:1.第一阶段(正向传播过程)10十一月202420第9章神经网络与深度学习2.第二阶段(反向传播过程)若在输出层不能得到期望的输出值,那么逐层递归地计算实际输出与期望输出的差值,以便根据差值调节权值。BP算法基于梯度下降(GradientDescent)策略,以目标的负梯度方向对参数进行调整。10十一月202421第9章神经网络与深度学习10十一月202422第9章神经网络与深度学习10十一月202423第9章神经网络与深度学习10十一月202424第9章神经网络与深度学习10十一月202425第9章神经网络与深度学习【例9-1】利用后向传播算法学习的样本计算。图9.6给出了一个多层前馈神经网络,令学习率为0.9,第一个训练元组为X={1,0,1},类标号Y=1。计算每个单元的净输入和输出。10十一月202426第9章神经网络与深度学习(1)随机初始化参数值如表9.1中的数值。(2)根据BP算法中的前馈过程,计算净输入和输出的值,结果如表9.2所示。(3)计算每个结点的误差,结果见表9.3。(4)更新权重和偏倚,结果见表9.4。10十一月202427第9章神经网络与深度学习10十一月202428BP神经网络具有简单易行、计算量小和并行性强的有点,但也存在学习效率低、收敛速度慢等问题。BP神经网络具体有点和缺点如表9-2所示。表9-2BP神经网络的优缺点优点缺点(1)BP算法根据预设参数的更新规则不断调整网络中的参数,能够自适应自主学习;(2)BP神经网络具有很强的非线性映射能力;(3)误差的反向传播所采用的链式法则具有严谨的推导过程;(4)BP算法具有很强的泛化能力。(1)BP神经网络参数众多,每次迭代要更新众多数量的参数,故收敛速度较慢;(2)网络中隐层节点数目设定没有明确的准则,只能通过实验根据网络误差确定最终隐含层节点个数;(3)BP算法是一种快速的梯度下降算法,但对初始参数敏感且容易陷入局部极小值。3深度学习理论上来说,参数越多的模型复杂度越高、容量越大,这意味着它能完成更复杂的学习任务。但一般情形下,复杂模型的训练效率低,易陷入过拟合。随着云计算、大数据时代的到来,计算能力的大幅提高可以缓解训练的低效性,训练数据的大幅增加可以降低过拟合风险。因此,以深度学习(DeepLearning,DL)为代表的复杂模型受到了关注。10十一月2024293深度学习深度学习是机器学习领域中一个新的研究方向。它使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。深度学习是一类模式分析方法的统称,就具体研究内容而言,主要涉及三类方法:(1)基于卷积运算的神经网络系统,即卷积神经网络(ConvolutionalNeuralNetwork,CNN)。(2)基于多层神经元的自编码神经网络,包括自编码(AutoEncoder)以及近年来受到广泛关注的稀疏编码两类(SparseCoding)。(3)以多层自编码神经网络的方式进行预训练,进而结合鉴别信息进一步优化神经网络权值的深度置信网络(DBN)。10十一月2024303深度学习常用的深度学习算法常见的深度学习算法主要包括卷积神经网络、循环神经网络和生成对抗神经网络(GenerativeAdversarialNetwork,GAN)等。这些算法是深度学习的基础算法,在各种深度学习相关系统中均有不同程度的应用。10十一月2024313深度学习1.卷积神经网络卷积神经网络(ConvolutionalNeuralNetwork,CNN)是第一个被成功训练的多层神经网络结构,具有较强的容错、自学习及并行处理能力。CNN最初是为识别二维图像形状而设计的多层感知器,局部联结和权值共享网络结构类似于生物神经网络,降低神经网络模型的复杂度,减少权值数量,使网络对于输入具备一定的不变性。经典的LeNet-5卷积神经网络结构图如图9-7所示。10十一月2024323深度学习经典的LeNet-5卷积神经网络包括了输入层、卷积层、池化层、全连接层和输出层。(1)输入层(2)卷积层(3)池化层(4)全连接层(5)输出层10十一月2024333深度学习循环神经网络循环神经网络(RecurrentNeuralNetwork,RNN)是一类以序列数据为输入,在序列的演进方向进行递归且所有结点(循环单元)按链式连接的递归神经网络(RecursiveNeuralNetwork)。之所以是“循环”,是因为其中隐含层结点的输出不仅取决于当前输入值,还与上一次的输入相关,即结点的输出可以指向自身,进行循环递归运算,在处理时间序列相关的场景时效果明显,在分析语音、视频、天气预报、股票走势预测等方面具有突出优势。10十一月2024343深度学习生成对抗网络生成式对抗网络(GenerativeAdversarialNetworks,GAN)是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。它解决的问题是从现有样本中学习并创建出新的样本,按照人类对事物的学习过程,逐渐总结规律,而并非使用大量数据训练,所以在新的任务处理中,只需要少量的标记样本就可以训练出高效的分类器。GAN网络模型通过生成模型(GenerativeModel)和判别模型(DiscriminativeModel)的互相博弈学习产生相当好的输出。10十一月202435本章小结神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能模拟生物神经系统会真实世界物体所作出的交互反应
。在机器学习中谈论神经网络时一般指的是“神经网络学习”。感知机感知器的概念类似于大脑基本处理单元神经元的工作原理。感知器具有许多输入(通常称为特征),这些输入被馈送到产生一个二元输出的线性单元中。因此,感知器可用于解决二元分类问题,其中样本将被识别为属于预定义的两个类之一。BP算法基于梯度下降策略,以目标的负梯度方向对网络参数进行调整。现实任务中使用神经网络时,大多是使用BP算法进行训练。BP算法不仅可以用于多层前馈神经网络,还可以用于其他类型的神经网络。通常所说的BP网络指利用BP算法训练的多层前馈神经网络。10十一月202436深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等。卷积神经网络是针对二维数据设计的一种模拟“局部感受野”的局部连接的神经网络结构。它引入卷积运算实现局部连接和权值共享的特征提取,引入池化操作实现低功耗计算和高级特征提取。网络构造通过多次卷积和池化过程形成深度网络,网络的训练含有“权共享”和“稀疏”的特点,学习过程类似于BP算法。10十一月202437本章小结Python数据挖掘与机器学习第10章离群点检测第10章离群点检测本章内容离群点概述离群点检测sklearn中的异常值检测方法10十一月2024391离群点概述40数据库中的数据由于各种原因常常会包含一些异常记录,对这些异常记录的检测和解释有很重要的意义。异常检测目前在入侵检测、工业损毁检测、金融欺诈、股票分析、医疗处理等领域都有着比较好的实际应用效果。异常检测的实质是寻找观测值和参照值之间有意义的偏差。离群点检测是异常检测中最常用的方法之一,是为了检测出那些与正常数据行为或特征属性差别较大的异常数据或行为。1离群点概述41离群点的概念离群点(Outlier)是指显著偏离一般水平的观测对象。离群点检测(或称异常检测)是找出不同于预期对象行为的过程。离群点的本质仍然是数据对象,但它与其他对象又显著差异,又被称为异常值。1离群点概述42离群点不同于噪声数据。噪声是指被观测数据的随机误差或方差,观测值是真实数据与噪声的混合。而离群点属于观测值,既可能是真实数据产生,也有可能由噪声带来。离群点的产生主要有以下原因:1.第一类离群值是总体固有变异性的极端表现,这类离群值与样本中其余观测值属于同一总体。2.第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果,或产生于观测、记录、计算中的失误,这类离群值与样本中其余观测值不属于同一总体。1离群点概述43离群点的类型:全局离群点、条件离群点和集体离群点。1.全局离群点当一个数据对象明显地偏离了数据集中绝大多数对象时,该数据对象就是全局离群点(GlobalOutlier)。全局离群点有时也称为点异常,是最简单的一类离群点。如图10-1中区域R中的点,它们显著偏离数据集的绝大多数的数据对象,因此属于全局离群点。1离群点概述44离群点的类型:全局离群点、条件离群点和集体离群点。2.条件离群点与全局离群点不同,当且仅当在某种特定情境下,一个数据对象显著地偏离数据集中的其他对象时,该数据对象被称为条件离群点(ContextualOutlier)。一般地,在情境离群点检测中所考虑对象的属性划分为条件属性和行为属性。条件属性是指数据对象的定义中定义情境的属性。行为属性指数据对象中定义对象特征的属性。1离群点概述45离群点的类型:全局离群点、条件离群点和集体离群点。3.集体离群点当数据集中的一些数据对象显著地偏离整个数据集时,该集合形成集体离群点(CollectionOutlier)。不同于全局或条件离群点,在集体离群点检测中,除了考虑个体对象的行为,还要考虑集体的行为。1离群点概述46离群点检测的挑战:1.正常对象和离群点的有效建模2.针对应用的离群点检测3.在离群点检测中处理噪声4.可理解性2离群点的检测离群点的检测方法很多,每种方法在检测时都会对正常数据对象或离群点作出假设,从所做假设的角度,离群点检测方法可以分为基于统计学的离群点检测、基于近邻的离群点检测、基于聚类以及基于分类的离群点检测。10十一月2024472离群点的检测基于统计学的离群点检测在基于统计学的离群点检测方法中,假设数据集中的正常数据对象由一个统计模型产生,如果某数据不符合该统计模型,则该数据对象是离群点。在基于统计的离群点检测过程中,一般先设定数据集的分布模型,如正态分布、泊松分布和二项式分布等,然后根据模型进行不和谐检验以发现离群点。不和谐检验中需要样本空间数据集的参数知识、分布的参数知识以及期望的离群点数目。10十一月2024482离群点的检测基于统计学的离群点检测【例10-1】假设某类数据总体服从正态分布,现有部分数据{6,7,6,8,9,10,8,11,7,9,12,7,11,8,13,7,8,14,9,12},基于统计方法检测离群点。10十一月2024492离群点的检测2基于邻近性的离群点检测给定特征空间中的数据对象集,可以使用距离度量对象之间的相似性。直观地,远离其他大多数对象的数据对象被视为离群点。基于邻近性的方法假定离群点对象与它最近邻的邻近性显著偏离数据集中其他对象与其近邻之间的邻近性。基于邻近型的离群点检测方法有基于距离的和基于密度的方法。10十一月2024502离群点的检测
基于邻近性的离群点检测(1)
基于距离的离群点检测方法在基于距离的离群点检测方法中,离群点就是远离大部分对象的点,即与数据集中的大多数对象的距离都大于某个给定阈值的点。基于距离的检测方法考虑的是对象给定半径的邻域。如果在某个对象的邻域内没有足够的其他的点,则称此对象为离群点。基于距离的离群点方法有嵌套-循环算法、基于索引的算法和基于单元的算法。10十一月2024512离群点的检测
基于邻近性的离群点检测(1)
基于距离的离群点检测方法基于距离的离群点方法有嵌套-循环算法、基于索引的算法和基于单元的算法。下面简要介绍嵌套-循环算法。10十一月2024522离群点的检测
基于邻近性的离群点检测(2)
基于密度的离群点检测方法基于密度的离群点检测方法考虑的是对象与它近邻的密度。如果一个对象的密度相对于它的近邻低得多,则被视为离群点。最有代表性的基于密度的离群点检测方法是基于局部离群点离群因子的离群点检测方法。局部离群因子(LocalOutlierFactor,LOF)会给数据集中的每个点计算一个离群因子LOF,通过判断LOF是否接近于1来判定是否是离群因子。10十一月2024532离群点的检测
基于邻近性的离群点检测(2)
基于密度的离群点检测方法局部离群因子(LocalOutlierFactor,LOF)会给数据集中的每个点计算一个离群因子LOF,通过判断LOF是否接近于1来判定是否是离群因子。若LOF远大于1,则认为是离群因子,接近于1,则是正常点。对于任何给定的数据点,局部离群因子算法计算的离群度等于数据点p的k近邻集合的平均局部数据密度与数据点自身局部数据密度的比值。10十一月2024542离群点的检测3基于聚类的离群点检测离群点与簇的概念高度相关,因此,可以通过考察对象与簇之间的关系检测离群点。直观地,离群点是一个属于小的偏远簇或者不属于任何簇的数据对象。基于聚类的离群点检测方法分为两个阶段,首先对数据进行聚类,然后计算对象或簇的离群因子,将离群因子大的对象或稀疏簇中的对象判定为离群点。对于基于原型的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年山东畜牧兽医职业学院单招职业技能测试模拟测试卷附答案解析
- 2024年信阳学院单招职业适应性考试模拟测试卷附答案解析
- 2026年上海杉达学院单招(计算机)考试备考题库附答案
- 2024年湖南高尔夫旅游职业学院单招职业技能考试题库附答案解析
- 2025年内蒙古乌兰察布盟单招职业适应性考试题库附答案解析
- 重楼种植课件
- 犯罪成立的条件
- 商场超市消防安全管理
- 资深员工创新能力提升
- 物流寄递培训课件
- 学堂在线 雨课堂 学堂云 文物精与文化中国 期末考试答案
- 关于印发《2026年度安全生产工作计划》的通知
- 跨境电子商务渠道管理
- (21)普通高中西班牙语课程标准日常修订版(2017年版2025年修订)
- 洗洁精产品介绍
- 财务给销售培训销售知识课件
- 太空探索基础设施建设施工方案
- 2025年中国复合材料电池外壳行业市场全景分析及前景机遇研判报告
- 陕西亚联电信网络股份有限公司商业计划书
- 2025年数字化营销顾问职业素养测评试卷及答案解析
- 2025年保密试题问答题及答案
评论
0/150
提交评论