人工神经网络ANN方法简介-PPT文档.ppt

上传人：油*** IP属地：浙江上传时间：2020-03-25 格式：PPT 页数：86 大小：970.51KB 积分：30 举报 版权申诉

免费预览已结束，剩余81页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

10 1从生物神经元到人工神经网络大脑与神经细胞神经细胞与神经细胞构成了庞大天文数字量级的高度复杂的网络系统也正是有了这样的复杂巨系统大脑才能担负起人类认识世界和改造世界的任务世界上最大的未开发疆域是我们两耳之间的空间美国汉诺威保险公司总裁比尔奥伯莱恩 1 生物神经系统和大脑的复杂性生物系统是世界上最为复杂的系统生物神经系统活动和脑的功能其复杂性是难以想象的人大脑平均只有3磅左右只占身体重量比例的1 30 使眼睛可以辨别1000万种细微的颜色使肌肉如果全部向同一个方向运动产生25吨的拉力是由100亿个脑细胞和10兆个神经交汇丛组成整个大脑的神经网络足足有10英里长大脑的有关数据你的大脑就像一个沉睡的巨人英国的心理学家教育家托尼布赞如果我们迫使头脑开足1 4的马力我们就会毫不费力地学会40种语言把整个百科全书从头到尾背下来还可以完成十几个大学的博士学位前苏联学者伊凡一个正常的大脑记忆容量有大约6亿本书的知识总量相当于一部大型电脑储存量的120万倍大脑使你从出生开始每一秒钟可存储1000条信息直到老死为止全世界的电话线路的运作只相当于大约一粒绿豆体积的脑细胞即使世界上记忆力最好的人其大脑的使用也没有达到其功能的1 人类的知识与智慧仍是低度开发人的大脑是个无尽宝藏可惜的是每个人终其一生都忽略了如何有效地发挥它的潜能潜意识中激发出来的能量大脑复杂性的无限性 2 人工智能及其三个学派人类的梦想重新构造人脑并让其代替人类完成相应的工作无数科幻故事探索智能的奥秘智能 intelligence 观察学习理解和认识的能力牛津大辞典理解和各种适应性行为的能力韦氏大辞典智能是个体有目的的行为合理的思维以及有效的适应环境的综合能力也可以说是个体认识客观事物和运用知识解决问题的能力人类智能的具体含义感知与认识客观事物客观世界和自我的能力通过学习获得经验积累知识的能力理解知识运用知识和经验分析解决问题的能力联想推理判断决策的能力运用语言进行抽象概括的能力以上5点是人类智能的基本能力发现发明创造创新的能力实时迅速合理地应付复杂环境的能力预测洞察事物发展变化的能力以上3点是前5种能力新的综合表现形式人工智能人工智能 ArtificialIntelligence 1956年初次引入人工智能研究怎样用计算机模仿人脑从事推理设计思考学习等思维活动以解决和处理较复杂的问题目的之一增加人类探索世界推动社会前进的能力通过制造和使用工具来加强和延伸人类的生存发展目的之二进一步认识自己用物化的智能来考察和研究人脑智能的物质过程和规律人工智能的3个主要流派 1991年人工智能学家D Krish在 Int J ArtificialIntelligence 上提出人工智能的5个基本问题知识和概念化是否人工智能的核心认知能力能否与载体分开来研究认知的轨迹是否可以用类自然语言来描述学习能力能否与认知分开来研究所有的认识是否有一种统一的结构对以上5个基本问题的不同回答已经形成3个主要的学术流派符号主义 Symbolicisim 联结主义 connetionism 行为主义 actionism 人工智能的符号主义流派即传统的人工智能认为人工智能源于数理逻辑主张以知识为基础通过推理来进行问题求解在研究方法上采用计算机模拟人类认知系统功能的功能模拟方法Simon Minsky和Newell等认为人和计算机都是一个物理符号系统因此可用计算机的符号演算来模拟人的认知过程作为智能基础的知识是可用符号表示的一种信息形式因此人工智能的核心问题是知识表示知识推理和知识运用的信息处理过程符号主义对符号系统的描述人工智能的联结主义流派又称仿生学派认为人工智能源于仿生学人思维的基本单元是神经元而非符号处理过程主张用大脑工作模式取代符号操作的电脑工作模式智能的本质是联结机制神经网络是一个由大量简单的处理单元组成的高度复杂的大规模非线性自适应系统结构功能的研究方法认为功能结构和智能行为是密切相关的 1943年 McCulloch和Pitts从神经元入手研究神经网络模型 MP模型此为人工神经网络研究之始人工神经网络 ArtificialNeuralNetwork ANN 从四个方面刻画人脑的基本特征 1 物理结构模仿生物神经元的功能构造人工神经元的联结网络 2 计算模拟人脑神经元既有局部的计算和存储功能又通过联结构成统一的系统人脑的计算建立在该系统的大规模并行模拟处理基础之上 ANN以具有局部计算能力的神经元为基础同样实现信息的大规模并行处理 3 存储与操作大脑对信息的记忆是通过改变突触的联结强度来实现并分布存储 ANN模拟信息的大规模分布存储 4 训练后天的训练使得人脑具有很强的自组织和自适应性 ANN根据人工神经元网络的结构特性使用不同的训练过程自动从实践即训练样本中获取相关知识并存储在系统中人工智能的行为主义流派进化主义学派控制论学派认为人工智能来源于控制论智能取决于感知和行动提出智能行为的感知动作模式采用行为模拟方法对符号主义联结主义采取批判的态度智能不需要知识表示和推理只需要与环境交互作用 80年代诞生智能控制和智能机器人系统学科 R A Brooks 为机器人研究开创了新的方法 ANN是基于联结主义流派的人工智能联结主义学派与高速发展的计算机技术相结合发展为计算智能学派是人工智能在1980年代后的深化和发展计算智能借助现代计算机技术模拟人的智能控制生命演化过程和人的智能行为从而进行信息获取处理应用的理论和方法计算智能是以数学模型计算模型为基础以分布并行仿生计算为特征包含数据算法和实现的信息系统计算智能强调模型的建立和构成强调系统的自组织自学习和自适应计算智能的3个主要分支人工神经网络模拟智能产生与作用赖以存在的结构遗传算法模拟生命生成过程与智能进化过程模糊逻辑模拟智能的表现行为 3 人工神经网络概述生物神经元系统人工神经网络是受生物神经网络的启发构造而成 James 心理学 1890年大脑皮层每一点的活力产生于其它点势能释放的综合效能即其它点的兴奋次数强度和所接受的能量大脑含 1011个神经元它们通过 1015个联结构成一个网络每个神经元具有独立的接受处理和传递电化学信号的能力这种传递由神经通道来完成神经元的结构树突从细胞体伸向其它神经元神经元之间接受信号的联结点为突触通过突触输入的信号起着兴奋抑制作用当细胞体接受的累加兴奋作用超过某阈值时细胞进入兴奋状态产生冲动并由轴突输出神经元系统的基本特征神经元及其联结神经元之间的联结强度决定信号传递的强弱神经元之间的联结强度可以随训练而改变信号分为兴奋型和抑制型一个神经元接受的信号的累计效果决定该神经元的状态每个神经元有一个阈值 ANN理论及其发展阶段轴突突触树突内核轴突第一阶段1943年心理学家McCulloch和数学家Pitts对神经元进行形式化研究提出了神经元的数学模型 MP模型 1944年 D O Hebb提出改变神经元联结强度的Hebb学习规则至今仍然是人工神经网络学习算法的一个基本原则 1957年 Rosenblatt首次引进感知器 Perceptron 概念来模拟生物的感知学习能力 1962年 Widros提出用于自适应系统的连续取值的线性网络第二阶段1969年 M L Minsky和S Papert从理论上证明了当时单隐含层感知器网络模型无法解决的许多简单问题包括最基本的异或 XOR 问题使ANN理论的发展进入一个低谷 1974年 Webos提出BP学习理论 S Grossberg提出自适应共振理论 ART 第三阶段突破性进展 1982年 CalTech的物理学家J Hopfield提出Hopfield神经网络系统 HNNS 模型提出能量函数的概念用非线性动力学方法来研究ANN 开拓了ANN用于联想记忆和优化计算的新途径 1988年 McClelland和Rumelhart利用多层反馈学习算法解决了异或 XOR 问题人工神经网络的几种形式无反馈前向网多输入多输出的多层无环图同一层间无联结神经元分层排列组成输入层中间层隐层输出层有反馈前向网从输出层到输入层存在反馈的前向网层内有联结的前向网在无反馈前向网中同一层内存在神经元间的联结回路有向网任意两个神经元间都可能存在有向联结网络处在动态中直至达到某一平衡态周期态或者混沌状态 10 2感知器 Perceptron 人工神经网络的基本构件感知器 Perceptron 最早被设计并实现的人工神经网络 W McCulloch和W Pitts总结生物神经元的基本生理特征提出一种简单的数学模型与构造方法建立了阈值加权和模型简称M P模型 ALogicalCalculusImmanentinNervousActivity BulletinofMathematicalBiophysics 1943 5 115 133 人工神经元模型是M P模型的基础 1 感知器的数学模型 MP模型 WarrenMcCulloch 1898 1969 WalterPitts 1923 1969 生物神经元的基本特征神经元及其联结神经元之间的联结强度决定信号传递的强弱神经元之间的联结强度可以随训练而改变信号分为兴奋型和抑制型一个神经元接受的信号的累计效果决定该神经元的状态每个神经元有一个阈值轴突突触树突内核轴突模拟神经元的首要目标输入信号的加权和生物神经元的一阶特征人工神经元可以接受一组来自系统中其它神经元的输入信号每个输入对应一个权重所有输入的加权和决定该神经元的激活状态每个权就相当于突触的联结强度数学模型多输入单输出的加权和结构设X x1 x2 xn 表示n个输入 W w1 w2 wn 表示它们对应的联结权重故神经元所获得的输入信号累计效果为称u X 为整合函数 w1 wixi w2 wn x1 x2 xn 感知器的激活函数神经元获得网络输入信号后信号累计效果整合函数u X 大于某阈值时神经元处于激发状态反之神经元处于抑制状态构造激活函数用于表示这一转换过程要求是 1 1 之间的单调递增函数激活函数通常为3种类型由此决定了神经元的输出特征激活函数为符号函数激活函数为分段线性函数激活函数为Sigmoid函数其特点是单调递增光滑且具有渐近值具有解析上的优点和神经生理学特征 M P模型将人工神经元的基本模型与激活函数结合即McCulloch Pitts模型 2 感知器的学习算法什么是学习 Theconceptualschemefor learning inthiscontextisamachinewithaninputchannelforfigures apairofYESandNOoutputindicators andareinforcementor reward buttonthatthemachine soperatorcanusetoindicatehisapprovalordisapprovalofthemachine sbehavior M L MinskyandS A Papert Perceptron 1988 ANN学习定理 ANN可以学会它表达的任何东西 Rosenblatt 1962年 ANN的表达能力有限其学习能力也受到限制 ANN的学习过程就是训练过程在将训练样本集输入到网络的过程中按照一定的方式来调整神经元之间的联结权重值使得网络能够将训练样本集的内涵以联结权重矩阵的方式存储起来从而使得网络在接受输入时能够给出适当的输出有监督的学习 Supervisedlearning 无监督的学习 Unsupervisedlearning 基本思想感知器的学习是有监督的学习学习的问题归结为求权重系数W w1 w2 wn 和阈值的问题基本思想逐步将训练集中的样本输入到网络中根据当前输出结果和理想输出结果之间的差别来调整网络中的权重值设X x1 x2 xn 表示n个输入 W w1 w2 wn 表示它们对应的联结权重假设取符号函数为激活函数此为经典的M P模型训练集的样本输入向量输出值为 t为样本数目其中 STEP2重复下列过程直至训练完成 STEP2 1对训练集中的每一个样本 xk yk 重复如下过程 STEP2 1 1输入xkSTEP2 1 2计算STEP2 1 3若输出不正确则 STEP1初始化权重向量W w1 w2 wn 不妨取w1 w2 wn 1 3 关于感知器的基本理论问题线性不可分问题的困境及其解决 MarvinMinskyMITMediaLabandMITAILabToshibaProfessorofMediaArtsandSciencesProfessorofE E andC S M I Tminsky media mit edu 1969年 Minsky和Papert在 Perceptron 一书中从理论上证明单层感知器无法解决许多简单的问题包括异或 XOR 问题使得ANN理论的发展在1970 80年代处于低潮导致政府和企业资助减少研究人员撤退异或 Exclusive OR 运算是一个双输入单输出问题对应的单层感知器为无论如何选择参数a b 都无法满足划分这种由单层感知器不能表达的问题称为线性不可分问题考虑n个自变量的二值函数当n 4时线性不可分的函数个数远远超过线性可分函数的个数 R O Windner 1960 表明单层感知器不能表达的问题的数量远远超过它可以表达的问题的数量解决途径多层网络一个单层网络可以将空间划分成两部分用多个单层网络组合在一起并用其中的一个去综合其它单层网络的结果构成一个二层网络即可用来在空间划分出一个封闭或开放的凸域子空间 10 3单层前向网多层前向网与BP学习算法简介 1 单层前向网络单层前向网模型设有c 1个感知器其中第k个感知器的输出为yk 对于输入信号x x1 x2 xn 每个感知器有d个输入uj x j 1 2 d 输入层输出层一个单层前向网可表示为激活函数 wk wk1 wk2 wkd 第k个感知器的权重系数 k 第k个感知器的阈值 u u1 u2 ud 基函数x Rn u x Rd若记wk0 k u0 1 则上式变换为记yk wk x 为第k个感知器当权重系数为wk Rd 输入为x Rn时的输出设训练集为A x t 1 2 N 其中表示训练集数据编号 x Rn为输入 t Rc为输出 tk 为第k个感知器的期望输出基于训练集A的误差函数定义为单层前向网的学习目标函数学习的目标就是求wk k 1 2 c 使得误差函数E w 取最小值这就是目标函数单层前向网的学习原理本质上仍是感知器的学习原理线性单层前向网的解关于基函数u x 对学习集的每一个数据记其中 1 2 N 由此定义学习集A的扩展集B 不妨假设激活函数为恒等函数此时网络为线性单层前向网由此写出误差函数优化的目标函数为根据最小二乘法求解目标函数由多元函数取极值的必要条件有写成矩阵形式 W c d 1 U N d 1 T N c 解的形式为解存在的条件略 2 多层前向网络 BP学习算法双层前向网多层前向网的结构特点 1 允许网络具有数层相连的处理单元 2 联结是从前一层的每一个节点到下一层所有节点不存在其它联结 3 同一层内的节点之间不存在联结 4 不含任何反馈故输出可以用输入和权重来表示 L层神经网络具有L层可调节权重参数双层前向网模型具有两层可调节参数且同层无联结的不含反馈的人工神经网络 X层输入层Y层输出层Z层隐层两层可调节权重参数 W 1 W 2 设输入层的输入为 x1 x2 xn Rn 首先考察隐层设隐层神经元的激活函数为第j个隐层神经元的整合函数为aj 输出值为zj 第1层隐层权重矩阵中第i个输入联结到第j个隐神经元的权重第j个隐神经元的阈值同样考察输出层设输出层神经元的激活函数为第k个输出神经元以z z1 z2 zM RM为输入其整合函数为bk 输出值为yk 第2层输出层权重矩阵中第j个隐神经元联结到第k个输出神经元的权重第k个输出神经元的阈值联合得到双层前向网的输出表达式记为学习的目标函数为简化计考虑两类的分类问题设A B是分类空间Rd中两个不相交的集合考虑离散型双层前向网T W 1 W 2 1 2 x 取其激活函数为符号函数sgn u 该双层前向网的学习目标是对 A B 求 W 1 W 2 1 2 使得求解上述方程误差的后向传播多层前向网的学习原理基于适当定义的误差函数在网络中调整权重矩阵和阈值等参数使得误差函数极小化与单层前向网和感知器相比较多层前向网由于隐层的存在无法判别隐层神经元对输入误差的直接影响无法知道隐层神经元的理想输出值因此对参数权重矩阵和阈值的调整遇到困难解决方案计算两个传播方向前向传播 Forwardpropagation 输入 xi 进入网络按照信息在网络中前进移动的方向逐次计算aj zj直至输出 yk 的过程输入向输出方向的前向传播后向传播 Backpropagation 利用输出层的误差来估计输出层的直接前导层的误差再依次估计更前一层的误差获得所有各层的误差估计输出误差向输入方向的后向传播 Rumelhart Hinton Williams 1986 设学习集有T个样本记为 x t 1 2 T 其中输入理想输出计算实际输出记为实际输出显然有因此只需讨论某一个样本点的误差传播以下略去上标故误差函数为已知下列记号又定义第k个输出神经元和第j个隐层神经元的误差率为输出层误差率隐层误差率由微分链式法则计算可得输出层误差率隐层误差率因此得到梯度法求解wij l 取步长因子为固定步长得到学习规则其中 k 2 k 1 均与有关 k 1 2 c j 0 1 M i 0 1 N 补充梯度法求解优化问题已知D Rn是一个凸集求解无约束优化问题就是寻求x D使得若f x 为连续可微凸函数问题归结为求解可运用Newton迭代法数值求解但f x 的凸性难以保证求解也非常困难构造逐次使目标函数值下降的搜索算法满足 k 0 步长因子 BP学习算法的实现设学习集有T个样本记为 x t 1 2 T 其中输入理想输出又设k 1 2 c j 0 1 M i 0 1 N 对于给定的 1 2 T 指标仍然不标出 STEP1初始化权重矩阵和阈值wji 1 0 wkj 2 0 已包含阈值选择学习效率 STEP2设第t次迭代值wji 1 t wkj 2 t 已知 1 前向过程对 1 2 T 依次计算 2 后向过程利用公式对 1 2 N 依次计算 STEP2设第t次迭代值wji 1 t wkj 2 t 已知 3 迭代过程计算第t 1次权重矩阵 STEP3由此得到序列满足直至满足停机准则满足某种优化准则或者迭代次数 BP学习算法的例子考虑某双层前向网设激活函数为误差函数为注意到于是有其中利用得到迭代公式 10 4ANN方法在计算生物学的应用在生物序列分析中的应用生物调控信号的研究感知器算法具有优势例子原核基因RBS 核糖体结合位点 E coli翻译起始位点的序列特征的分析参考文献 G D Stormo T D Schneider L M Gold andA Ehrenfeucht Useofthe perceptron algorithmtodistinguishtranslationalinitiationsitesinE coli NucleicAcidResearch 1982 10 2997 3011G D Stormo T D Schneider andL M Gold CharacterizationoftranslationalinitiationsitesinE coli NucleicAcidResearch 1982 10 2971 2996 在结构识别中的应用蛋白质二级结构的预测 BP算法得到广泛的应用参考文献 N QianandT J Sejnowski Predictingthesecondarystructureofglobularproteinsusingneuralnetworkmodels JournalofMolecularBiology 1988 202 865 884H Bohr J Bohr S Brunaket al Proteinsecondarystructuresandhomologybyneuralnetworks The helicesinrhodopsin FEBSLetters 1988 241 223 228L H HolleyandM Karplus Proteinsecondarystructurepredictionwithaneuralnetwork Proc Nat Acad Sci USA 1989 86 152 156 基于氨基酸序列的蛋白质构象预测DNA序列功能位点的预测基因翻译起始位点转录因子结合位点真核基因剪接位点等详细内容请参考译本生物信息学机器学习方法张东晖等译中信出版社 200

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工神经网络ANN方法简介-PPT文档.ppt

文档简介

温馨提示

最新文档

评论

人工神经网络ANN方法简介-PPT文档.ppt

文档简介

温馨提示

最新文档

评论

相关文档