神经网络与深度学习.ppt

上传人：闯*** IP属地：广东上传时间：2020-03-30 格式：PPT 页数：32 大小：1.52MB 积分：25 举报 版权申诉

已阅读5页，还剩27页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

神经网络深度学习基础知识图像的特征计算机图像是由一定数量的点阵像素构成的如上所示我们看到的是一辆车但实际上计算机理解的是一个由各像素点的灰度值组成的矩阵它并不能直接理解这是一辆车我们需要将这是一辆车这个事实用完全逻辑化的语言描述出来让计算机建立一个函数这个矩阵自变量x所对应的结果因变量y就是车难度可想而知我们先看一个简单的例子一个数字9 我们如何描述它的形状现在有这么一种描述方法这个数字的上半部分是一个圆下半部分是靠右的一撇用数学语言表达就是上半部分能够以方程x12 y12 r12 r1 0 拟合下半部分能以x22 y22 r22 x20 拟合那么就能说明这个图形极有可能是数字9 特征用来描述一个对象具体表现形式的逻辑语言如前页所述上半部分是圆下半部分是靠右的一撇就是数字9的形状特征特征是构成一个对象的必要但不充分条件因为一个对象是由无数个特征组成的在有限数量的特征里我们永远只能预估该对象而不能100 确定该对象究竟是什么经典的图像特征之 Haar特征思考我们一眼就能看出来这幅图像上有一栋房子但任何一幅图像都是由一定数量的像素点组成的我们是怎么从这些单纯的像素点里发现了房子的呢这个问题还可以换一种问法我们怎么知道一幅图像中是有前景对象的对于一张纯色画布我们为什么无法发现任何对象这涉及到一个现象颜色突变上图所圈出的区域中都是颜色变化较大的区域而我们就会自然地认为这是物体的边缘而由封闭边缘构成的区域就是物体不仅是房子这个整体房子里的门窗户等元素我们都能发现而原因自然也是颜色突变思考人能看见绝对透明 100 透明的玻璃吗我们定义一个形状的时候本质上就是在定义其产生颜色突变的像素点的大致相对位置比如圆在一个直角坐标系的图象上上存在所有满足 x a 2 y b 2 r2条件的坐标点的某个小邻域内有较大的颜色突变那么这幅图像上就有一个圆的形状左上方是一幅色盲测试图不色盲的朋友都能看到左下角有一个蓝色的圆而且是一个空心圆思考我们该如何用颜色突变的方式定义一辆车先不考虑前身后身等复杂情况假设所有的车都是像左下图这样固定角度 Haar特征对大量同类的图像样本进行学习找出这些图像所有的产生了颜色突变的相对坐标位置将这些同类图片作为正样本同时给出不属于该类的远多于同类图片的负样本让机器对这些样本进行学习并最终生成一个对象识别模型用来正确寻找一幅图像中你所需要寻找的元素因此 Haar特征广义上来说就是图像的形状特征 Haar特征对于邻域的规定有三种边缘特征中心特征对角线特征其中边缘特征又分横向和纵向通过计算白色区域像素亮度和与黑色区域像素亮度和之差来反映图像的颜色突变区域即边缘区域特别地对于C模型需要将黑色区域乘以2作为其像素亮度和 Haar特征实例人脸检测我们用OpenCV中的一个训练得较好的人脸检测Haar模型对一张照片进行人脸检测结果如上 Haar特征的不足之处 Haar特征本质上是检测图像中的颜色突变的所以对图像的形状较为敏感同时对其他的特征如颜色等敏感度较低而且Haar只适用于刚性运动物体的检测而不适用于物体精细化的识别人脸检测和人脸识别难度上完全不是一个数量级的事实上任何一种单一图像特征都是不全面的是不能适应所有场景的其实图像本身只是由像素点组成的图像的特征那是我们人为整理出来的严格地说它并不属于图像的一部分那我们能不能从图像的像素点本身来寻找一些算法呢最基本的决策模型感知器生活中我们经常要对一些事情做出决策但不论我们最终选择了什么都一定是有原因的而且原因往往不止一个现在我们来玩一个情景游戏假如周末公司组织员工外出旅游你是去还是不去呢这是一个最简单的感知器最终结果只有两种 Yes和No 只是结果虽然简单但是你会考虑诸多因素最终决定结果假设你考虑以下三个因素 A 天气如何 B 可否带伙伴一起去 C 费用伙食旅馆等条件是否符合个人预期假设你是这样想的和同事一块出去玩是很难得的一件事能带伙伴一起去那是锦上添花不能也没关系但天气是挺重要的阴雨绵绵玩得不开心旅馆嘛这么多人一起不会太好但也不会太差最重要的是享受那么这时候你的决策就和当地天气唯一相关其他两个因素没有任何影响感知器的本质就是对各个输入量的加权和进行分析做出YesorNo的决策的模型上述你考虑的三个因素可以作为感知器的三个输入量x1 x2 x3 并设积极的结果为1 消极的结果为0 三者都有对应的权重量w1 w2 w3 现计算它们的加权和w1x1 w2x2 w3x3 同时加上一个偏差值b 若其为正大于0 则最终的回答是Yes 否则小于或等于0 回答No 如果你的想法如前所述那么你的感知器模型可以是这样的 w1 6 w2 2 w3 2 b 5 即判断6x1 2x2 3x2 5的正负在所有的输入量均只能取0和1的前提下我们可以很明显地看到唯独当x1 1时结果才为正即决策为Yes 只要x1 0 决策就必然为No 思考若将b改为 3 其他权重量不变那么决策会变成什么样较为复杂的感知器多层感知器非诚勿扰一个非常流行的电视节目男嘉宾上台后在场的女嘉宾首先给男嘉宾打印象分然后通过前后播放的多个不同的AVR以及各种提问对自己是否愿意跟男嘉宾走这个问题给出回答点评很多事情的决策并不是评估多个彼此独立的条件往往某个条件是和之前的一些条件相关的比如上面这个案例第一印象好坏算作感知器的输入量x1 只有当它等于1时后面的输入量才有意义但也不是它等于1就一定表示最终的结果是Yes 还需要分析其他的输入量才能得出最终结果那么这种经过多层判断得出最终结果的感知器就叫多层感知器如下图所示是一个双层感知器第二层的神经元的决策是跟第一层的决策相关的其实本质上来讲多层感知器也同样可以展开成单层感知器任何一个决策都是可以用标准与或式来表达的而感知器的本质恰恰就是逻辑电路那么感知器和逻辑电路两者的区别是什么呢两个字学习感知器可以通过给定的数据通过一定的算法来学习各个输入量的权重以及全局偏差值而这是已经固定成型的逻辑电路所做不到的多层感知器的存在也是为了建立一个符合常规思考方式的学习模型而存在的展开成单层感知器后学习目的不明显学习效果会下降学习是靠要大量样本的积累的每一个样本都有一定数量的输入量考察条件和一个理想输出值理应如此不必给出各输入量的权重以及最终偏差值机器通过不断自我调整寻找这些量使得尽可能多的样本匹配上其理想输出值注有时候样本之间可能会因为各种原因出现矛盾的理想输出值所以不能保证所有的样本都匹配但是这里有一个问题我们目前的决策是非此即彼的非常机械化的决策比如一个数字9 如果下方的那一撇写得不弯变成了一条直线那是不是这个数字就不是9了呢我们是不是应该有一个过渡的过程呢不再非此即彼 Sigmoid神经元回想一下我们以前的数学考试一道解答题12分老师批改时重点看的是过程就算结果错了只要过程是对的也绝不会把12分全扣完但是现在的感知器因为结果是非此即彼的所以它做的就是把12分全扣完的事俗话叫一棍子打死这样的话即使我们知道做错了我们也并不知道错在哪里也很难修正错误 Sigmoid神经元解决了这样的问题每一个输入量不再像感知器那样只能是0或1 而可以是0 1之间的实数最终输出结果也一样不再是斩钉截铁的Yes 1 或No 0 同样也可以是Notsure between0 1 我们的最终输出结果其实是一种概率结果为积极的概率通常被叫做Sigmoid函数它的表达式和图像如上图所示 Sigmoid神经元其实是由如左上所示的感知器函数图像平滑而来的函数图像平滑当任何一个输入量x只变化了一点点 x时最终输出量y也只会变化一点点 y 任何时候当 x 0时一定有 y 0 而这是感知器做不到的这使得决策不会产生突变更有利于学习如右上图所示多层Sigmoid神经元神经网络神经网络的本质就是多层感知器多层Sigmoid神经元它同样由输入样本输入量对应权重全局偏差值以及最终决策构成只是最左端的输入量成为了输入层最右侧的最终决策成为了输出层中间的运算量构成了隐藏层它并不是那么神秘的事物建立神经网络自学习模型现在假设我们已经有一个手写体数字图像数据集并且都已正确归类为0 9中的一种那么我们要让机器对这些模型进行学习并能对一个未知的手写体数字尽可能正确分类这些样本都是28x28大小的黑白图像也就是说一个样本有28x28 784个输入量它们非0 黑即1 白输出量一共有10个分别代表对应输入量的数字是0 9各自的可能性各输出量之和必为1 如左图所示这就是我们建立的手写体数字识别神经网络它有若干个输入样本每一个输入样本都有784个输入量隐藏层有15个隐藏神经元输出量共10个表示结果为各自对应数字的概率值最终我们要找的就是输出值最大的那个输出量所对应的数字这也就是我们的神经网络所识别出的数字值成本函数我们知道评价一个网络最重要的是其识别精度但这里我们引入一个中间量叫成本函数如果我们将每个输入量x的理想决策值即已经规定好的决策值设为A 将实际决策值即通过加权计算出的决策值设为y 这里y可以表示为x的函数即y y x 那么我们可以定义下面这样一种成本函数这实际上就是均方差很明显实际输出值A越接近理想输出值y x 成本均方差就越低网络的识别性能就越好我们学习的过程其实是通过不断微调各权重量和全局偏差值以至于这样的权重和偏差值可以使得成本函数尽可能小精度尽可能高当然了成本函数不只是均方差这一种还有很多函数能担当起成本函数的责任寻找成本函数的极小值梯度下降算法回归简单我们将成本函数C简化为和两个自变量相关的形式 C f v1 v2 实际上这里v1就是权重向量 v2就是全局偏差值只是做了简化而已那么当我们对v1及v2做了微小的变化时成本函数的全微分 C可以这样表示现在定义一个新的概念梯度它是一个函数针对所有自变量的偏导数所组成的矩阵的转置它和自变量的变化程度息息相关我们知道当C减少时 C及C的梯度必然为负我们也正是要寻找这样一组权重量和全局偏差值使得 C及C的梯度为负我们之前所说的颜色突变本意就是那个区域内的像素亮度梯度过大那么怎么才能让梯度不断下降呢我们不妨设 v C C 2 在这里是一个很小的正数通常称为学习率然后因为 C 2恒为正 C就会不断下降依此类推对于我们的成本函数则相应的梯度下降规则就应当是下面这样梯度下降的改良随机梯度下降在深度学习的过程中往往伴随着大量训练样本的出现梯度下降是针对每一个样本都要做一次相应的运算会浪费掉相当多的宝贵时间现在我们每次只随机取部分样本然后对这一部分样本统一进行梯度下降然后再去抓取其他的样本等所有样本都抓取完后再重头开始这种方法叫做随机梯度下降很明显因为每次都不是所有样本均参与训练所以最终的梯度下降幅度肯定是没有完整梯度下降算法要强的但我们只要求网络达到一定的精度就行了不完全要做到理论上的最好总结深度神经网络的学习过

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

神经网络与深度学习.ppt

文档简介

温馨提示

最新文档

评论

神经网络与深度学习.ppt

文档简介

温馨提示

最新文档

评论

相关文档