




已阅读5页,还剩40页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章神经网络理论基础 以冯 诺依曼型计算机为中心的信息处理技术的高速发展 计算机在信息化社会中起着十分重要的作用 但是 当用它来解决某些人工智能问题时却遇到了很大的困难 模糊控制从人的经验出发 解决了智能控制中人类语言描述和推理问题 但在处理数值数据 自学习能力等方面远未达到人脑境界 从人脑生理 心理学着手 模拟人脑工作机理大脑是由生物神经元构成的巨型网络 它在本质上不同于计算机 是一种大规模的并行处理系统 它具有学习 联想记忆 综合等能力 并有巧妙的信息处理方法 人工神经网络是模拟人脑思维方式的数学模型 从微观结构和功能上对人脑进行抽象和简化 模拟人类智能 人工神经网络 简称神经网络 也是由大量的 功能比较简单的形式神经元互相连接而构成的复杂网络系统 用它可以模拟大脑的许多基本功能和简单的思维方式 6 1神经网络发展史 1 启蒙期 1890 1969 对大脑神经元研究表明 当其处于兴奋状态时 输出侧的轴突就会发出脉冲信号 每个神经元的树状突起与来自其它神经元轴突的互相结合部 此结合部称为Synapse 即突触 接收由轴突传来的信号 如果 神经元所接收到的信号的总和超过了它本身的 阈值 则该神经元就会处于兴奋状态 并向它后续连接的神经元发出脉冲信号 1890年 W James发表 心理学 讨论脑结构和功能1943年 W S McCulloch和W Pitts提出了描述脑神经细胞动作的数学模型 即MP模型 1949年 D O Hebb提出了神经元的学习法则 即Hebb法则 50年代末 E Rosenblatt提出了描述信息在人脑中存储和记忆的数学模型 即感知机 Perceptron 模型 感知机是现代神经计算的出发点 Block于1962年用解析法证明了感知机的学习收敛定理 正是由于这一定理的存在 才使得感知机的理论具有实际的意义 并引发了60年代以感知机为代表的第一次神经网络研究发展的高潮 1961年 E R Caianiello提出了能实现记忆和识别的神经网络模型 它由学习方程式和记忆方程式两部分组成 1962年 M Minsky和S Papert进一步发展了感知机的理论 他们把感知机定义为一种逻辑函数的学习机 B Widraw在稍后于感知机一些时候提出了Adline分类学习机 它在结构上与感知机相似 但在学习法则上采用了最小二乘平均误差法 2 低潮期 1969 1982年 神经网络理论研究水平的限制计算机发展的冲击1969年 Grossberg提出迄今为止最复杂的ART神经网络1972年 Kohonen提出自组织映射的SOM模型 3 复兴期1982年 美国物理学家Hopfield对神经网络的动态特性进行了研究 提出了Hopfield神经网络模型 引入能量函数 实现问题优化求解1986年 以Rumelhart为首的PDP ParallelDistributedProcessing 并行分布处理研究集团对联结机制 connectionist 进行了研究 提出了著名的多层神经网络模型 即BP网络 至今为止应用最普遍 T J Sejnowski等人还研究了神经网络语音信息处理装置 这些成功的研究对第二次神经网络研究高潮的形成起了决定性的作用 Hopfield模型的动作原理是 只要由神经元兴奋的算法和神经元之间的结合强度所决定的神经网络的状态在适当给定的兴奋模式下尚未达到稳定 那么该状态就会一直变化下去 直到预先定义的一个必定减小的能量函数达到极小值时 状态才达到稳定而不再变化 1985年 Hopfield和D W Tank用上述模型求解了古典的旅行推销商问题 TravelingSalesmanProblem 简称TSP问题 1983年 S E Farmann和Hiton提出了波尔兹曼机BM BoltzmannMachine 该神经网络模型中使用了概率动作的神经元 把神经元的输出函数与统计力学中的波尔兹曼分布联系起来 1985年 W O Hillis发表了称为联结机 connection 的超级并行计算机 他把65536个lbit的微处理机排列成起立方体的互连形式 每个微处理机还带有4kbit的存贮器 误差反向传播神经网络BP ErrorBackPropagationNeuralNetwork 是1986年由Rumelhart和Hinton提出的 4 新连接机制时期 1986年 神经网络从理论 应用 神经网络芯片 神经计算机 模式识别与图象处理 控制与优化 预测与管理 通信领域 并行分布处理理论 1986年 Rumelhart和McClelland发表了 并行分布处理 认知微结构探索 一书 ParallelDistributedProcessing 系统地总结了PDP的概念 理论 数学方法 产生的背景和发展前景 著名的BP神经网络学习法则就是在本书中由Rumelhart提出的 神经网络的研究概况 神经网络的研究主要可分为以下三个方面 1 大脑和神经系统的信息处理原理 2 构造能实现信息处理的神经网络模型 3 能实现信息处理基本原理的技术研究一 神经计算机 美国军方 认为神经网络技术是比原子弹工程更重要的技术 美国国防部 DARPA 曾宣布执行一项总投资为4亿美元的八年计划 其主要研究目标为 连续语音信号识别 声纳信号识别 目标识别及跟踪等 日本通产省早在1988年也提出了所谓人类尖端科学计划 HumanFrontierScienceProgram 即所谓的第六代计算机计划 研制能模拟人类智能行为的计算机系统 到目前为止 已经发表了多达几十种的神经网络模型 它们具备不同的信息处理能力 典型的神经网络模型如表1 2所示 1987年6月21至24日在美国加州圣地亚哥 SanDiego 召开的第一届神经网络国际会议 1988年 我国在北京召开了神经网络的国际研究工作会议 并出版了论文集 关于神经网络的主要国际性杂志有 1 NeuralNetworks 国际神经网络协会会刊 2 IEEETransactionsonNeuralNetworks 3 IEEETransactionsonParallelDistributedSystem 4 ConnectionsScience 5 Neurocomputing 6 NeuralComputation 7 InternationalJournalofNeuralSystems 6 2神经网络原理 生物神经元人脑大约由1012个神经元组成 神经元互相连接成神经网络神经元是大脑处理信息的基本单元 以细胞体为主体 由许多向周围延伸的不规则树枝状纤维构成的神经细胞 其形状很像一棵枯树的枝干 它主要由细胞体 树突 轴突和突触 Synapse 又称神经键 组成 图6 1单个生物神经元解剖图 细胞体 包括细胞质 细胞膜和细胞核树突 用于为细胞体传入信息轴突 为细胞体传出信息 其末端为神经末梢 含传递信息的化学物质突触 神经元之间的接口 可塑性 从神经元各组成部分的功能来看 信息的处理与传递主要发生在突触附近 当神经元细胞体通过轴突传到突触前膜的脉冲幅度达到一定强度 即超过其阈值电位后 突触前膜将向突触间隙释放神经传递的化学物质 突触有两种 兴奋性突触和抑制性突触 前者产生正突触后电位 后者产生负突触后电位 突触传递信息的功能和特点归纳为 信息传递有时延 一般为0 3 lms 信息的综合有时间累加和空间累加 时空整合 突触有兴奋性和抑制性两种类型 具有脉冲 电位信号转换功能 神经纤维传导的速度 即脉冲沿神经纤维传递的速度 在1 150m s之间存在不应期 不可逆性 脉冲只从突触前传到突触后 不逆向传递 动态极化性 可塑性 突触传递信息的强度是可变的 即具有学习功能 存在遗忘或疲劳效应 人脑神经网络信息处理的特点1 分布存储与冗余性2 并行处理3 信息处理与存储合一4 可塑性与自组织性5 鲁棒性 人工神经网络 人工神经网络以数学手段来模拟人脑神经网络结构和特性神经网络是一个并行和分布式的信息处理网络结构 它一般由许多个神经元组成 每个神经元只有一个输出 它可以连接到很多其他的神经元 每个神经元输入有多个连接通道 每个连接通道对应于一个连接权系数 目前已有40多种模型 人工神经元模型归纳一下生物神经元传递信息的过程 生物神经元是一个多输入 单输出单元 常用的人工神经元模型可用下图模拟 图人工神经元模型 响应函数 激活函数 的基本作用 1 控制输入对输出的激活作用 2 对输入 输出进行函数转换 3 将可能无限域的输入变换成指定的有限范围内的输出 根据响应函数的不同 人工神经元有以下几种类型 图人工神经元的响应函数 1 阈值单元 2 线性单元 3 非线性单元 Sigmoid函数 上述模型能反映生物神经元的基本特性 但还有如下不同之点 1 生物神经元传递的信息是脉冲 而上述模型传递的信息是模拟电压 2 由于在上述模型中用一个等效的模拟电压来模拟生物神经元的脉冲密度 所以在模型中只有空间累加而没有时间累加 可以认为时间累加已隐含在等效的模拟电压之中 3 上述模型未考虑时延 不应期和疲劳等 6 3人工神经网络的分类神经元的模型确定之后 一个神经网络的特性及能力主要取决于网络的拓扑结构及学习方法 人工神经网络连接的几种基本形式 1 前向网络网络中的神经元是分层排列的 每个神经元只与前一层的神经元相连接 2 反馈网络从输出到输入有反馈 反馈动力学系统 需要工作一段时间才稳定 具有联想记忆功能3 自组织网络神经网络接受外界输入时 网络会分成不同区域 不同区域具有不同的响应特性 即不同的神经元以最佳方式响应不同性质的信号激励 形成一种非线性映射 通过无监督的自适应过程完成 聚类 图神经网络的典型结构 6 4人工神经网络的学习算法神经网络最有用的特征之一是它具有自学习功能 通常一个ANN模型要实现某种功能 就需要对其加以训练 所谓 训练 就是让它学会要做的事情 通过学习 把这些知识记忆在网络的权值中 学习方法是人工神经网络研究中的核心问题 通过学习算法 实现自适应 自组织和自学习能力 神经网络的权值并非固定不变 相反这些权值可以根据经验或学习来改变 神经网络的学习过程就是不断调整网络的连接数值 以获得期望输出 人工神经网络连接权的确定通常有 有导师学习 无导师学习和再励学习 常用的神经网络学习方式 1 有导师学习监督学习SupervisedLearning 例如BP 有明确的 教师 信号 2 无导师学习无监督学习UnsupervisedLearning 没有任何 教师 信号 只是通过输入数据的内部信息相当自组织 类方法 3 再励学习ReinforcementLearning源于心理学 神经网络的工作方式 学习阶段 修改权值工作阶段 计算单元变化 1 Hebb学习规则是DonallHebb根据生理学中条件反射机理 于1949年提出的神经元连接强度变化的规则 如果两个神经元同时兴奋 即同时被激活 则它们之间的突触连接加强 Hebb学习规则是一种无导师学习的方法 称为相关学习或并联学习 是人工神经网络学习的基本规则 几乎所有神经网络的学习规则都可以看作Hebb学习规则的变形 是用已知样本作为教师对网络进行学习 主要利用误差 ek dk yk 学习目的是通过调整权值 使某一基于ek的目标函数达到最小 如 常用的目标函数是均方误差判据 2 Delta学习规则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 潍坊滨海疫情管理办法
- 网络药物安全管理办法
- 网络信息生态管理办法
- 环保咨询提成管理办法
- 出行安全培训演讲课件
- 2025年中医学的试题及答案
- 2025年发展对象培训班题库(附含答案)
- 出租屋培训课件
- 山西省太原市2024-2025学年八年级下学期期末历史试题(含答案)
- 2025年关于二手房屋买卖合同范本
- 中国园林史全
- 社会调查研究方法-课件
- 雕塑基础教学课件
- 沥青混合料低温弯曲试验2002363
- 《普通逻辑》全册课后练习题参考答案(含原题)
- 新版(七步法案例)PFMEA
- 01血涂片、红细胞形态PPT课件
- 高二年级开学学生大会年级主任的讲话[001]
- 校企合作讲座精品PPT课件
- 煤矿电缆与电缆敷设标准
- 以内加减法口算100题可直接打印
评论
0/150
提交评论