![人工神经网络-SVM-深度学习简介[资料参考]_第1页](http://file1.renrendoc.com/fileroot_temp2/2020-12/17/812a71fe-2613-4291-b1c5-4d15048d98ab/812a71fe-2613-4291-b1c5-4d15048d98ab1.gif)
![人工神经网络-SVM-深度学习简介[资料参考]_第2页](http://file1.renrendoc.com/fileroot_temp2/2020-12/17/812a71fe-2613-4291-b1c5-4d15048d98ab/812a71fe-2613-4291-b1c5-4d15048d98ab2.gif)
![人工神经网络-SVM-深度学习简介[资料参考]_第3页](http://file1.renrendoc.com/fileroot_temp2/2020-12/17/812a71fe-2613-4291-b1c5-4d15048d98ab/812a71fe-2613-4291-b1c5-4d15048d98ab3.gif)
![人工神经网络-SVM-深度学习简介[资料参考]_第4页](http://file1.renrendoc.com/fileroot_temp2/2020-12/17/812a71fe-2613-4291-b1c5-4d15048d98ab/812a71fe-2613-4291-b1c5-4d15048d98ab4.gif)
![人工神经网络-SVM-深度学习简介[资料参考]_第5页](http://file1.renrendoc.com/fileroot_temp2/2020-12/17/812a71fe-2613-4291-b1c5-4d15048d98ab/812a71fe-2613-4291-b1c5-4d15048d98ab5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、神经网络及SVM简介,1,医学档案,以冯诺依曼型计算机为中心的信息处理技术的高速发展,使得计算机在当今的信息化社会中起着十分重要的作用。但是,当用它来解决某些人工智能问题时却遇到了很大的困难。 例如,一个人可以很容易地识别他人的脸孔,但计算机则很难做到这一点。 大脑是由生物神经元构成的巨型网络,它在本质上不同于计算机,是一种大规模的并行处理系统,它具有学习、联想记忆、综合等能力,并有巧妙的信息处理方法。 人工神经网络来源于对人脑实际神经网络的模拟,一、 神经网络发展历史,背景知识,2,医学档案,人脑和CPU,3,医学档案,神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细
2、胞的轴突末梢(也就是终端)和本神经细胞的树突相遇形成突触(synapse),信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程,但就我们而言,重要的是把它看成和现代的计算机一样,利用一系列的0和1来进行操作。就是说,大脑的神经细胞也只有两种状态:兴奋(fire)和不兴奋(即抑制)。发射信号的强度不变,变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突上突触进来的信号进行相加,如果全部信号的总和超过某个阀值,就会激发神经细胞进入兴奋(fire)状态,这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值,神经细胞就不会兴奋起来。,4
3、,医学档案,人脑和CPU,5,医学档案,人脑和CPU,CPU 只具备一个功能 就是二进制加法运算,6,医学档案,人脑的特点,对损伤有冗余性(tolerance),能实现无监督的学习,处理信息的效率极高,善于归纳推广,CPU i7 3.0 Ghz,4个核,人脑 100hz,10G个核,7,医学档案,人工神经网络,一个人工神经网络(Artificial neural network,简称ANN)就是要在当代数字计算机现有规模的约束下,来模拟这种大量的并行性,并在实现这一工作时,使它能显示许多和生物学大脑相类似的特性。,8,医学档案,人工神经网络(Artificial Neural Netwroks
4、,简称ANN)是对人类大脑系统的一种仿真,简单地讲,它是一个数学模型,可以用电子线路来实现,也可以用计算机程序来模拟,是人工智能研究的一种方法。 实际上它是由大量的、功能比较简单的形式神经元互相连接而构成的复杂网络系统,用它可以模拟大脑的许多基本功能和简单的思维方式。尽管它还不是大脑的完美元缺的模型,但它可以通过学习来获取外部的知识并存贮在网络内,可以解决计算机不易处理的难题,特别是语音和图像的识别、理解、知识的处理、组合优化计算和智能控制等一系列本质上是非计算的问题。,2什么是人工神经网络,9,医学档案,1943年,美国心理学家W.McCulloch和数学家W.Pitts在提出了一个简单的神
5、经元模型,即MP模型。1958年,F.Rosenblatt等研制出了感知机(Perceptron)。,3几个发展阶段,第一次热潮(40-60年代未),1982年,美国物理学家J.J.Hopfield提出Hopfield模型,它是一个互联的非线性动力学网络他解决问题的方法是一种反复运算的动态过程,这是符号逻辑处理方法所不具备的性质. 1987年首届国际ANN大会在圣地亚哥召开,国际ANN联合会成立,创办了多种ANN国际刊物。1990年12月,北京召开首届学术会议。,低潮(70-80年代初),第二次热潮,第三次热潮 GPU 大数据 新方法 深度学习理论,10,医学档案,学习的类型,11,医学档案,
6、人工神经网络,人工神经元模型 x1xn表示与该神经元相连接的所有神经元的输入(出) w1wn表示与相连接神经元的突触强度(连接权) 表示神经元的(电压)阈值。 f ( )表示激励函数,单调上升函数,且取有限值 神经元电位值: 神经元的输出值:y =f(s),12,医学档案,人工神经网络,激励函数的基本作用 控制输入对输出的激活; 对输入、输出进行函数转换; 将可能无限域的输入变换成指定的有限范围内的输出。 激励函数类型 阈值函数 线性函数 非线性函数 Sigmoid函数,13,医学档案,人工神经网络,Sigmoid函数,就是把神经细胞原有的阶跃式输出曲线钝化为一光滑曲线,S型函数具有非线性放大
7、系数功能,可以把输入从负无穷大到正无穷大的信号,变换成-1到l之间输出 对较大的输入信号,放大系数较小;而对较小的输入信号,放大系数则较大 采用S型激活函数可以处理和逼近非线性输入/输出关系,14,医学档案,BP神经网络,15,医学档案,BP神经网络计算,16,医学档案,BP神经网络,Rumelhart,McClelland于1985年提出了BP网络的误差反向后传BP(Back Propagation)学习算法 BP神经网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
8、,J. McClelland,David Rumelhart,17,医学档案,学习规则,BP算法属于算法,是一种监督式的学习算法 主要思想 对于q个输入学习样本:P1,P2,Pq,已知与其对应的输出样本为:T1,T2,Tq 使网络输出层的误差平方和达到最小 用网络的实际输出A1,A2,Aq, 与目标矢量T1,T2,Tq之间的误差修改其权值,使Am与期望的Tm,(ml,q)尽可能接近,18,医学档案,学习规则,BP算法是由两部分组成,信息的正向传递与误差的反向传播 正向传播过程中,输入信息从输入层经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态 如果在输出层未得到期望的输出
9、,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的连接通路反传回来修改各层神经元的权值直至达到期望目标,19,医学档案,20,医学档案,一般认为,增加隐层数可以降低网络误差(也有文献认为不一定能有效降低),提高精度,但也使网络复杂化,从而增加了网络的训练时间和出现“过拟合”现象。 Hornik等早已证明:若输入层和输出层采用线性转换函数,隐层采用Sigmoid转换函数,则含一个隐层的MLP网络能够以任意精度逼近任何有理函数。显然,这是一个存在性结论。在设计BP网络时可参考这一点,应优先考虑3层BP网络(即有1个隐层)。 一般地,靠增加隐层节点数来获得较低的误差,其训练效果
10、要比增加隐层数更容易实现。,隐层数,多少隐层数才合适?,21,医学档案,隐层节点数,在BP 网络中,隐层节点数的选择非常重要,它不仅对建立的神经网络模型的性能影响很大,而且是训练时出现“过拟合”的直接原因,但是目前理论上还没有一种科学的和普遍的确定方法。 目前多数文献中提出的确定隐层节点数的计算公式都是针对训练样本任意多的情况。 事实上,各种计算公式得到的隐层节点数有时相差几倍甚至上百倍。确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐层节点数。 研究表明,隐层节点数不仅与输入/输出层的节点数有关,更与需解决的问题的复杂程度和转换函数的型式以及样本数据的
11、特性等因素有关。,22,医学档案,应用实例,23,医学档案,net = newff ( A, B, C, trainfun ),Matlab命令,A是一个 n 2的矩阵,第 i 行元素为输入信号 x i 的最 小值和最大值;,参数说明,B为一 k 维行向量,其元素为各隐层节点数;,trainfun为学习规则采用的训练函数(常见训练函数如下 表)。,C为一k 维字符串行向量,每一分量为对应层神经元的激 励函数;,24,医学档案,2. 常见训练函数,25,医学档案,MATLAB中激励函数为,其字符串分别为:logsig,tansig,purelin,3. 激励函数,26,医学档案,除了需要输入A,
12、B,C,trainfun外,还有些默认的参数可 修改,如下表,4. 可修改参数,注:不同版本Matlab的可修改参数列表可能不同。,27,医学档案, net, tr, Y1, E = train ( net, X, Y ),5. BP网络的训练与泛化,网络训练,训练跟踪信息,训练后网络,网络实际输出,误差矩阵,网络训练函数,未经训练网络,网络实际输入,网络应有输出,X为nM矩阵,为输入数据矩阵,M为样本的组数。Y为 mM矩阵,为输出数据矩阵。,28,医学档案,训练结束后,对新的输入点数据X2,调用sim函数进行泛 化,得出这些输入点处的输出矩阵Y2.,数据泛化,Y2=sim(net,X2),用
13、经过训练的网络对于不是样本集的输入,计算出相应 的输出。,什么是数据泛化?,29,医学档案,例1 由下面的语句生成一组数据 x 和 y,用神经网络进 行数据拟合 x=0:.1:10; y=0.12*exp(-0.213*x)+0.54*exp(-0.17*x).*sin(1.23*x); 可知(x, y)是曲线 上的点。,x=0:.1:10; y=0.12*exp(-0.213*x)+0.54*exp(-0.17*x).*sin(1.23*x); net=newff(0,10,5,1,tansig,tansig); net.trainParam.epochs=1000; net=train(n
14、et,x,y); x0=0.05:.1:10; figure(1) y1=sim(net,x0); plot(x,y,o, x0,y1,r),30,医学档案,实例. 蠓虫分类问题的神经网络方法(1989年MCM竞赛题目 ),生物学家试图对两种蠓虫(Af与Apf)进行鉴别,依据的资料 是触角和翅膀的长度,已经测得9只Af和6只Apf的数据如下:,9只Af 触角长:1.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56 翅膀长:1.72 1.74 1.64 1.82 1.90 1.70 1.82 1.82 2.08,6只Apf 触角长:1.14 1.18 1.20
15、 1.26 1.28 1.30 翅膀长:1.78 1.96 1.86 2.00 2.00 1.96,问题:(1)如何凭借原始资料(15 对数据,被称之为学习样本)制 定一种方法,正确区分两类蠓虫; (2)依据确立的方法,对以下三个样本: (1.24,1.80),(1.28,1.84),(1.40,2.04)加以识别,31,医学档案,解法一:建立两层前向神经网络如下:,隐层节点可适量选取(没有具体标准)。X= 为输入矩阵, x1对应于触角长, x2对应于翅膀长。Y= 为输出矩阵 规定Af对应的应有输出为 , Apf对应的应有输出为,32,医学档案,以上神经网络模型的MATLAB程序如下:,x=1
16、.24 1.36 1.38 1.38 1.38 1.40 1.48 1.54 1.56 1.14 1.18 1.20 1.26 1.28 1.30 1.72 1.74 1.64 1.82 1.90 1.70 1.82 1.82 2.08 1.78 1.96 1.86 2.00 2.00 1.96; %原始数据 x=x-1.1; %数据标准化 y=0 0 0 0 0 0 0 0 0 1 1 1 1 1 1; 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0; %应有的输出 net=newff(0,1;0 1,5,2,tansig,tansig); %建立两层前向神经网络 %net.tr
17、ainParam.goal=0.0000001; %设定训练误差 net.trainParam.epochs=2000; %设定最大训练步数 net=train(net,x,y); %训练网络 y1=sim(net,x) %输出数据 yy=sim(net,1.24 1.28 1.40;1.80 1.84 2.04) %数据泛化,33,医学档案,underfitting,overfitting,good fit,神经网络的问题,1 需要大样本 2 隐层的个数无公式 3 整个计算过程过于模糊,很容易陷入局部最优导致欠拟合或者过拟合,34,医学档案,SVM的理论基础,传统的统计模式识别方法只有在样本
18、趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。 传统的统计模式识别方法在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。 推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。,35,医学档案,SVM,根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化置信范围值,因此其推广能力较差。 Vapnik 提出的支持向量机(Suppor
19、t Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。 形成时期在19921995年。,36,医学档案,线性判别函数和判别面,一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 两类情况:对于两类问题的决策规则为 如果g(x)0,则判定x属于C1, 如果g(x)0,则判定x属于C2, 如果g(x)=0,则可以将x任意 分到某一类或者拒绝判定。,37,医学档案,最优分类面,SVM 是从线性可分情况下的最优分
20、类面发展而来的, 基本思想可用图2的两维情况说明.,图中, 方形点和圆形点代表两类样本, H 为分类线,H1, H2分别为过各类中离分类线最近的样本且平行于分类线的直线, 它们之间的距离叫做分类间隔(margin)。 所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大. 推广到高维空间,最优分类线就变为最优分类面。,38,医学档案,分类超平面示意图,最优分类超平面图,两类样本中离分类面最近的点且平行于最优分类超平面的样本点叫做支持向量。,39,医学档案,非线性变换,基本思想: 选择非线性映射(X)将x映射到高维特征空间Z,在Z中构造最优超平面,40,医学档案
21、,SVM方法的特点,非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射; 对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心; 支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。 SVM 是一种有坚实理论基础的新颖的小样本学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”(transductive inference) ,大大简化了通常的分类和回归等问题。,41,医学档案,SVM方法的特点,SVM 的最终
22、决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。 少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单,而且具有较好的“鲁棒”性。这种“鲁棒”性主要体现在: 增、删非支持向量样本对模型没有影响; 支持向量样本集具有一定的鲁棒性; 有些成功的应用中,SVM 方法对核的选取不敏感。,42,医学档案,深度学习,43,医学档案,浅层学习是机器学习的第一次浪潮 人工神经网络(BP算法) 虽被称作多层感知机,但实际是种只含有一层隐层节点的浅层模型 SVM、Boosting、
23、最大熵方法(如LR,Logistic Regression) 带有一层隐层节点(如SVM、Boosting),或没有隐层节点(如LR)的浅层模型 局限性:有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受限。,基本概念,浅层学习与深度学习,44,医学档案,2006年,加拿大多伦多大学教授、机器学习领域的泰斗Geoffrey Hinton在科学上发表论文提出深度学习主要观点: 1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类; 2)深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wise pre-training)来有效克服,逐层初始化可通过无监督学习实现的。,基本概念,45,医学档案,深度学习:深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示 深度神经网络:含有多个隐层的神经网络,基本概念,46,医学档案,1981年的诺贝尔医学奖获得者 David Hubel和Torsten Wiesel发现了一种被称为“方向选择性细胞的神经元细胞,当瞳孔发现了眼前的物体的边缘,而且这个边缘
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度绿色建材环保设备交易合同范本
- 2025年度高品质草种研发种植基地投资合作协议
- 2025年度公务车辆借用与全面保险保障合同
- 2025年再婚家庭财产分割子女抚养权解除合同样本集
- 2025年度商业地产租赁期限管理合同
- 2025年遗体火化专业代理服务合同规范范本
- 2025年茶叶品牌形象重塑与高端产品包装设计合同
- 2025年创建知识试题及答案
- 2025年生态农业项目规划与有机肥料供应合同
- 2025年弹道碎石试题及答案
- (2025秋新版)部编版八年级上册道德与法治全册教案
- 八年级心理健康体验式教学计划
- 消防监控考试题初级及答案
- 2025年太阳能海水淡化项目经济效益评估报告
- 2025年湖南湘西自治州州直事业单位招聘考试笔试试卷附答案
- 《小学开学第一课》课件
- 2025-2031年中国有源相控阵雷达行业市场发展形势及投资潜力研判报告
- 大货车货运安全知识培训课件
- 消防车辆事故课件
- 2026届四川省宜宾市普通高中高一化学第一学期期末统考试题含解析
- 景区导览智能导览设备市场前景报告
评论
0/150
提交评论