




已阅读5页,还剩33页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
神经网络算法简介,主讲:何仁斌,实际应用问题,1、蠓虫的分类问题2、DNA序列分类问题3、癌症诊断问题,神经网络算法简介,感知器感知器(perceptron)是由美国科学家F.Rosenblatt于1957年提出的,其目的是为了模拟人脑的感知和学习能力。感知器是最早提出的一种神经网络模型。它特别适合于简单的模式分类问题,如线性可分的形式。,神经网络算法简介,以两个输入的单层感知器神经元为例,w权重;b阈值如果设w(1,1)=-1,w(1,2)=2,b=1,单层感知器,多层感知器,性能指标:均方误差达到最小,涉及算法,注意:单层感知器的局限性是:仅对线性可分问题具有分类能力。,分类问题的MATLAB软件实现,以蠓虫分类问题为例,%输入向量P=1.241.361.381.381.381.41.481.541.561.141.181.21.261.281.3;1.721.741.641.821.91.71.821.822.081.781.961.862.02.01.96;%目标向量T=111111111000000;%绘制输入向量plotpv(P,T);,1)单层感知器,%建立一个感知器net=newp(03;03,1);%绘制输入向量plotpv(P,T);%初始化感知器net=init(net);%画出分类线net.iw1,1net.b1linehandle=plotpc(net.iw1,1,net.b1);%作wx+b=0的分类线,分类问题的MATLAB软件实现,分类问题的MATLAB软件实现,E=1;%修正感知器网络while(sse(E)%sse返回误差的平方net,Y,E=adapt(net,P,T);%返回学习后的网络,Y是输出,E是误差linehandle=plotpc(net.IW1,net.b1,linehandle);%分界线绘制函数drawnow;%更新分界线end;,%利用训练好的感知器对未知类别样本进行分类p=1.24,1.28,1.4;1.8,1.84,2.04;a=sim(net,p);plotpv(p,a);ThePoint=findobj(gca,type,line);set(ThePoint,Color,red);holdon;plotpv(P,T);plotpc(net.IW1,net.b1);holdoff;disp(Endofpercept),分类问题的MATLAB软件实现,分类结果:,Af,Apf,以上结果是图形化的结果,如下给出数值化的结果:mcfl1.m,P=1.241.361.381.381.381.41.481.541.561.141.181.21.261.281.3;1.721.741.641.821.91.71.821.822.081.781.961.862.02.01.96;%目标向量T=111111111000000;%建立一个感知器net=newp(03;03,1);%网络训练次数net.adaptParam.passes=100net=adapt(net,P,T);%返回自适应的神经网络%输出仿真结果Y=sim(net,P)%利用训练好的感知器进行分类p=1.24,1.28,1.4;1.8,1.84,2.04;a=sim(net,p),仿真结果:,Y=Columns1through1111111111100Columns12through150000a=111准确率达到100%。,BP网络(Back-PropagationNetwork),目前,在人工神经网络的实际应用中,决大部分的神经网络模型是采用BP网络和它的变化形式。BP网络主要用于:函数逼近模式识别分类数据压缩,学习过程由信号的正向传播与反向传播两个过程组成。正向传播时,输入样本从输入层传入,经各隐层逐层处理后,传向输出层。若输出层的实际输出与期望输出(教师信号)不符合时,则转入误差的反向传播阶段。误差反传是将输出误差以某种形式通过隐层向输入层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,此信号作为修正各单元权值的依据。,BP算法的基本思想:,隐层到输出层之间的权值矩阵:W=W1,W2,Wl,1、网络结构,2、各层信号之间的数学关系,输出层ok=f(netk),netk=j=0:mwjkyj,k=1,2,l,对隐层yk=f(netj),netj=i=0:nvijxi,j=1,2,m,传递函数一般用:f(x)=1/(1+exp(-x)(s型函数)误差函数:Eh=0.5*(j=0:l(thj-ohj)2),thj,ohj分别为期望输出和网络的实际输出。,MATLAB中有关BP网络的重要函数,newff创建前向BP网络格式:net=newff(PR,S1S2.SNl,TF1TF2.TFNl,BTF,BLF,PF),其中:PRR维输入元素的R2阶最大最小值矩阵;Si第i层神经元的个数,共N1层;TFi第i层的转移函数,默认tansig;BTFBP网络的训练函数,默认trainlm;BLFBP权值/偏差学习函数,默认learngdmPF性能函数,默认mse;(误差),MATLAB中有关BP网络的重要函数,例如:net=newff(020;016;012;012;013,51,logsigpurelin,traingdx);,三层神经网络结构:中间层为5输出层为1,输入层5维向量的取值范围,训练函数,转移函数,(1)purelin线性传递函数;(2)tansig双曲正切S型(sigmoid)传递函数;(3)logsig对数S型(sigmoid)传递函数;,1、转移函数:,(1),(2),(3),2、训练函数:,trainlmLevenberg-Marquardt的BP算法训练函数;trainbfgBFGS拟牛顿BP算法训练函数;trainrp具有弹性的BP算法训练;traingd梯度下降是BP算法训练;traingda梯度下降自适应lr的BP算法训练;traingdm梯度下降动量的BP算法训练;traingdx梯度下降动量和自适应lr的BP算法训练;,如果对神经网络的输入、输出数据进行一定的预处理,可以加快网络的训练速度。有三种方法:1)归一化将每组数据都变为-1至1之间的数,matlab中有函数:premnmx,postmnmx,tramnmx算法:pn=2*(p-minp)/(maxp-minp)-1;2)标准化将每组数据变换为均值为0,方差为1的数,所涉及的函数有:prestd,posttd,trastd3)正交化主成分分析也可以将数据进行正交处理,减少输入数据的处理,函数有:prepca,trapca.,注意:数据预处理,P=012345678910;%输入向量T=01234321234;%期望输出,例:,%创建两层的BP网络:net=newff(010,51,tansig,purelin);Y=sim(net,P);%输出仿真结果plot(P,T,P,Y,o)%作图,未经过训练的结果或net.trainParam.epochs=50;net=train(net,P,T);Y=sim(net,P);plot(P,T,P,Y,o)%作图训练后的结果,Y=-2.3431-2.7532-2.4510-1.2784-0.8590-0.29810.24950.48111.03751.22681.4232T=01234321234;%期望输出,第一种情况的输出结果:,误差很大!未训练,非线性映射能力差。,Y=-0.00191.00451.98963.01573.96373.10211.81751.20561.83223.11623.9551T=01234321234;%期望输出,第二种情况的输出结果:,思考:究竟误差有多大?,修改程序:,P=012345678910;T=01234321234;net=newff(010,51,tansigpurelin);net.trainparam.show=50;%每次循环50次net.trainParam.epochs=500;%最大循环500次net.trainparam.goal=0.01;%期望目标误差最小值net=train(net,P,T);%对网络进行反复训练Y=sim(net,P)figure%打开另外一个图形窗口plot(P,T,P,Y,o),Y=0.00051.00261.99473.01343.94293.12111.84821.17551.85683.11503.9595,第二种情况的输出结果:,范例:DNA序列模式分类问题,一、问题,假定已知两组人工已分类的DNA序列(20个已知类别的人工制造的序列),其中序列标号110为A类,11-20为B类。要求我们从中提取已经分类了的DNA序列片段的特征和构造分类方法,并且还要衡量所用分类方法的好坏,从而构造或选择一种较好的分类方法。测试对象是20个未标明类别的人工序列(标号2140)和182个自然DNA序列。例如A类:,a1=aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg;b1=gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaattaaatatttatt;,二、特征提取,序列中含有四个碱基a、g、t、c,反映该序列特征的方面主要有两个:1、碱基的含量,反映了该序列的内容;统计a、g、t、c序列中分别出现的频率;,2、碱基的排列情况,反映了该序列的形式;从字符出现的周期性来反映。统计三个字符出现的频率;在遗传学中每三个碱基的组合被称为一个密码子,如agg,att,ggc,cgg等,共有43=64个,还可以由密码子组成20个氨基酸。,三、神经网络对DNA序列分类问题的应用,假定提取已知序列类别的三字符串,如agg,att,ggc,cgg,共有43=64个,将它简化成只有5个:ttt,tta,ggc,cgg,gga。统计出任意一个DNA序列片段的5维向量,即每个特征字符串在序列中出现的频数作为分量。,a1=aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggaggacgaggtaaaggaggcttgtctacggccggaagtgaagggggatatgaccgcttgg;编程统计出该片段的字符串(ttt,tta,ggc,cgg,gga)的频数分别为:(0,1,5,7,10),经过统计计算,得到已知类别的输入向量:p=01051322211918231743122171923;12041114011315131199214127;5580109571190010003100;71016211965860001003200;10111521112129562111011011;,待判类别的输入向量:P=9231331531032659222216218;744859612331247324410210;00415021702204213121;02801150701303311102;23912181502115413112;,由前20个已知类别的DNA序列片段可以构造出目标向量:t=11111111110000000000;,1、应用感知器对DNA序列进行分类:(DNAper1.m)net=newp(01;01;01;01;01,1);net.adaptParam.passes=110net=adapt(net,p,t);Y=sim(net,p)%回代检验a=sim(net,P)%对待判类别的序列进行分类,A类,B类,a=01100010100001101000,回代检验结果是100%的准确。待判序列的分类结果:A类:22,23,27,29,34,35,37;B类:21,24,25,26,28,30,31,32,33,36,38,39,40;,输出结果:,a=01100010100001101000并附图形:,获得数值分类结果:(DNAper.m)net=newp(01;01;01;01;01,1);net.adaptParam.passes=110net=adapt(net,p,t);Y=sim(net,p)%回代检验a=sim(net,P)%对待判类别的序列进行分类,输出结果:,误差曲线图,2、应用BP网络对DNA序列进行分类:(DNAbp.m)net=newff(020;016;012;012;013,31,logsigpurelin,traingdx);net.trainparam.show=100;%两次显示之间的训练步数net.trainparam.lr=0.5;net.trainparam.mc=0.8;net.trainparam.epochos=20000;net.trainparam.goal=0.01;%训练目标net,tr=train(net,p,t);Y=sim(net,p)a=sim(net,P),Y=1.04361.02230.98790.65931.03481.02251.03641.01110.88350.982
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届湖南省邵阳县第一中学化学高二第一学期期末联考模拟试题含答案
- (2025年标准)果场投资协议书
- (2025年标准)广州合同协议书
- (2025年标准)管材合同协议书
- (2025年标准)关于分手调解协议书
- 2026届河北省保定市高一化学第一学期期中联考模拟试题含解析
- 西安长庆化工集团有限公司咸阳化学剂分公司油田助剂生产及暂存改扩建项目环境影响报告表
- 影视制作领域影视后期特效技术提升研究项目名称
- 2026届吉林省长春市吉林实验中学化学高二上期末达标测试试题含答案
- 三农村生态循环农业发展规划
- 构建专家委员会的初步方案
- DB37-T 5317-2025《旋挖成孔灌注桩施工技术规程》
- 个性化医疗决策模型-深度研究
- Oracle财务系统应付账款模块操作手册
- 体检营销话术与技巧培训
- 广东省佛山市顺德区2023-2024学年七年级(上)期末数学试卷(含答案)
- 变配电运维职业技能(中级)等级培训题库
- 矿山隐蔽致灾普查治理报告
- 实心球课件教学课件
- 玻璃体切割手术治疗2型糖尿病视网膜病变专家共识
- 大型养路机械司机(打磨车)高级工技能鉴定考试题库(含答案)
评论
0/150
提交评论