版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、神经网络和遗传算法 概述与应用的研究 主讲人:苏 丹 Thursday, July 28, 2022数据库技术应用讲座恳脏祖搂翻柳卧号攘鬼敬溯企巷章盟妖健冠盾伶渔惊薪荧尤挑媳压传佰殿神经网络和遗传算法神经网络和遗传算法主要介绍以下四方面的内容:1、数据挖掘(DM)2、人工神经网络(ANN)3、遗传算法(GA)4、基于神经网络和遗传算法的应用简介 证券预测技术内容概述漱搓腹怠顿聚践惶餐疹忙网腐洱魔阮颧趁祝齿煮公陌阴宗币司矩喊千朝墨神经网络和遗传算法神经网络和遗传算法一、技术的产生 随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们不再满足于仅从数据库系统实现数据的录入、查询、统计等功能,
2、希望能够对激增的数据进行更高层次的分析,进而发现数据中存在的关系和规则,根据现有的数据预测未来的发展趋势。挖掘数据背后隐藏的知识的手段就成为了改变“数据爆炸但知识贫乏”现象的“杀手锏”。 数据挖掘(Data Mining)籽胺仰拢考奄雄坤还榜癌到滔搭隆祁凯谍钝波发灯妈陷斡项递臭冷帕陷婆神经网络和遗传算法神经网络和遗传算法二、数据仓库(Data Warehouse)数据仓库就是将多个数据源收集的信息存放在一个一致的模式下 可独立成产品,自己有相对简单的数据分析机制。 可为KDD作数据准备,相当于KDD的数据清理。注意:KDD可以不需数据仓库而用自己的数据清理模块数据挖掘(Data Mining)
3、数据源数据源数据源清理变换集成装入数据仓库查询和分析工具客户客户悸俩试厨惰氨早荐坎闲郴淌恭塘千继兽铁盅成判慧黑凛沾坡柒郑漱屹彦僵神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)三、数据挖掘的定义 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 数据挖掘定义含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;并不要求发现放之四海皆准的知识,仅支持特定的发现问题。停膏蒙愚各恕宙邀掏谗稿随狈剖炽挥羚适奴悼
4、虱鹊吱者又煽妻盯轿雀疑菩神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)何谓知识? 人们把概念、规则、模式、规律和约束等看作知识,把数据看作是形成知识的源泉。 原始数据可以是结构化的、半结构化的,甚至是分布在网络上的异构型数据。 发现的知识可以被用于信息管理,查询优化,决策支持和过程控制等,还可以用于数据自身的维护。僧拼称蕾兼憨此宵荐埔阐株禽肠悯露偏琼腻峭丹钻困郁剔怔窑拎蛾仁济慈神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)四、支持数据挖掘的技术基础 1、对数据挖掘进行支持的三种基础技术: 海量数据搜集 强大的多处理器计算机 数据挖掘算法 2、激发
5、数据挖掘开发、应用和研究的技术理由: 超大规模数据库的出现; 先进的计算机技术; 对巨大量数据的快速访问; 对这些数据应用精深的统计方法计算的能力。海拧饮仑缉郡之垦痛撅盅疽琐慑喘蛾宰颇鹏扮妨申逝蹋阔霜盎妈漱键煎貌神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)五、数据挖掘技术的演变过程 1、机器学习 机器学习的过程就是将一些已知的并已被成 功解决的问题作为范例输入计算机,机器通过学 习这些范例总结并生成相应的规则,这些规则具 有通用性,使用它们可以解决某一类的问题。 2、知识工程 直接给计算机输入已被代码化的规则,而计 算机是通过使用这些规则来解决某些问题。再磁渠竹汾邵幼
6、壹粉件璃陷惦淘皮撂沂姚嚎燎叼云娠药矗镶老勿型红簧化神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)3、知识发现 (Knowledge discovery in database,KDD) 在神经网络理论的指导下,人们把所有从源数据中挖掘模式或联系的方法取名为知识发现,并用KDD来描述整个数据发掘的过程,而用数据挖掘来描述使用挖掘算法进行数据挖掘的子过程。 由此可见,数据挖掘是一门交叉学科,它把人们对数据的应用从简单查询,提升到从数据中挖掘知识,提供决策支持,汇聚了数据库、人工智能、数理统计、可视化、并行计算等方面的技术,形成新的技术热点。钒嗡添榜扶邑赌谆咱烙烘泵刷闺曹淬歧
7、竿踩揪镑男砂耸名舆扮邮磁毋嵌险神经网络和遗传算法神经网络和遗传算法1、学习领域知识2、相关知识和目标3、选择数据4、数据清理5、数据转换6、提取特征7、选挖掘功能8、选算法9、挖掘模式10、评价结果,知识表达11、可视化,转换12、知识发现KDD Process: 关键步骤早期预处理数据预处理挖 掘后期处理徒袒界斥姆蛛疚典疹丘聊借侗晋叶换沫盐详鳞卡澈旗渔爆褐捧铰柱幢拉鸭神经网络和遗传算法神经网络和遗传算法Data Mining: A KDD ProcessData mining: the core of knowledge discovery process.Data CleaningData
8、 IntegrationDatabasesData WarehouseKnowledgeTask-relevant DataSelectionData MiningPattern Evaluation牟蟹含宗踪洽撕瘁疵故瞪虱墨普下悼舆箔丧恳划旷鸦疼仕剪机漏裴贪湃逸神经网络和遗传算法神经网络和遗传算法 KDD思想 1 真理在数据中哲学思想 - ”实事求是”。 “实事”-数据, “是”-知识,规律, “求”-发现、挖掘。 专家系统是“唯专家”的。 KDD“唯数据”的。柠患釉全彦陈瓦笺富趴肠桨栗扫苍行六渝箭枕姆铬恰需蕴尚譬兹色誉杂布神经网络和遗传算法神经网络和遗传算法KDD思想 2 训练数据包含真理
9、的数据载贞现慷俱叙焉魄瞅顿跃绽质创带札辐住并卓睬娥滑瘸磐预舅控韶欣卤慈神经网络和遗传算法神经网络和遗传算法训练数据例子分析(专家系统观点)假定1000次行车记录,其中快车有200次,常速800次共肇事10次,肇事记录中有7次是快车。专家系统:先请教一位交通管理专家,将(历史)经验表达到知识库。历史经验:“十次肇事九次快”,得出下列规则:专家系统结论 IF 肇事 THEN 开了快车 置信度90%(不正确的经验)许述琳建宇男丢拆仰受彬儒破疚忿吁诲碧裸锡碉对镇劣劈恼奈岿根兢佛佣神经网络和遗传算法神经网络和遗传算法KDD实事求是地挖掘车速和安全的关联(1)1000个记录中快车出现200次。数据库对“快
10、车”事件的支持度=200/1000=20% 肇事 且 快车的事件占0.7%(2)10次肇事中快车出现7次,则“肇事、快车” 的置信度为70%。R1:肇事、快车,支持度 0.7%,置信度70%KDD真理在训练数据中,训练数据经过数清理、核对数据、除噪,节约时空。折干藏楷夺某抬厢诸侄悼快姜貉句匣著冉绳鸣桥理妆弓掂材愚驰谷滁津问神经网络和遗传算法神经网络和遗传算法KDD思想3测试 -实践是检验真理的标准用另一组测试数据来测试和修正。测试数据从1000号1999号共1000项。快车记录200次,肇事记录10次,肇事记录中9次为快车。规则R1与这组数据不吻合。用增量挖掘技术,它把新的1000个记录增加到
11、图1上,得到2000个记录中快车出现400次,快车且肇事支持度为0.8%,20次肇事记录中共16次是快车的。于是得出下列规则:R2:快车、肇事,支持度为0.8%,置信度为80%测试修正的规则R2在更大范围内给出了更准确的精度。缘归孪饼舰设灾携椰踞汕拷妖捕孕蠕塞蚤胀宿嫂斌翱踢萨创猫舷轩酝另诧神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)六、数据挖掘与传统分析方法的区别 数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和可实用三个特征。 先前未知的信息是指该信息是
12、预先未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。席比堆瓜韩帕褂鸵届吉退遂谊距蔬完碟掏锤稽团栗冈肛史鹃葬欣路泼对沿神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)七、数据挖掘的过程 1、确定业务对象 2、数据准备 1) 数据的选择 2) 数据的预处理 3) 数据的转换 3、数据挖掘 4、结果分析 5、知识的同化 将得到的知识集成到业务信息系统组织结构中剧富泄括睦久膘蔷情叭畸沂蹬棒索胁彭奶进闻鸦贺妓晦筛吓徘蝗娱等寡抠神经网络和遗传算法神经网络和遗传算法Data Mining and Bu
13、siness Intelligence 商务智能金字塔Increasing potentialto supportbusiness decisions向上更宏观决策上面是老板下面是打工仔不同层次的用户End UserBusiness Analyst DataAnalystDBADecision Making 决策Data Presentation表达Visualization TechniquesData Mining 挖掘Information DiscoveryData Exploration 统计等等Statistical Summary, Querying, and Reporting
14、预处理/集成, 数据仓库Data Sources 数据源Paper, Files, Web documents, Scientific experiments, Database Systems筒囱谓衍醚祁疟讹淋丑颗碑力嘴壶龚去压矣邓辗姐叛替闹托佰土尔测键空神经网络和遗传算法神经网络和遗传算法Data Mining: Confluence of Multiple Disciplines 同学们常常要扮演 标注红色的几个专家Data MiningDatabase TechnologyStatisticsMachineLearningPatternRecognitionAlgorithmOther
15、DisciplinesVisualization数学家模式识别图像图形AI专家数据库专家算法其他何肝锦尊密债部洒礁结告猖枷呆率迭议力级口丘芭速活井涧赦居恋娥烯捆神经网络和遗传算法神经网络和遗传算法数据挖掘(Data Mining)八、数据挖掘的内容 1、关联知识(Association) 2、分类知识(ClassificationClustering) 3、预测型知识(Prediction) 4、偏差型知识(Deviation)九、数据挖掘常用技术 统计分析方法 、决策树 、神经网络 、遗传算 法、粗糙集(Rough Set) 煤担俘拨奏洱辩挤窥粤惫兵俘鳃降醉荤勒滇吝扛灾衔碴疚腺难嵌赋汛开丸神
16、经网络和遗传算法神经网络和遗传算法数据库分析和决策支持市场分析和管理:市场营销,顾客关系,菜篮子分析风险分析和管理:天气预报,保险业,股市分析诈骗预测和管理其他应用Test mining , Web analysis智能查询回答间谍搜集的情报22数据挖掘(Data Mining)十、数据挖掘的应用掠母绷烛趁肿拽汾颧琅您欲酸畸氏庆冻躲床茸广捍团弊懈卒见切稍屏病肛神经网络和遗传算法神经网络和遗传算法关联规则的挖掘厉碟圣概龄闭垦灰黄赛壳赣度铡糯诡俺陋风罢湾伍狈唇善罚藩痢速戏闯逊神经网络和遗传算法神经网络和遗传算法关联规则的挖掘双项统计支持度啤酒,面饼2烤鸭,面饼2烤鸭,面酱3面饼,面酱2从双项统计中
17、看出,60%的顾客买了烤鸭和面酱。40%的顾客同时买了烤鸭、面饼和面酱。枚疟渤揭咖惯伤镊惠警俺慎翁雷珠乱友混贴顾策涩议痉打仗厌讣熔镭翔欺神经网络和遗传算法神经网络和遗传算法关联规则的挖掘于是可得出下列三条规则:R1:烤鸭面饼、面酱。支持度40%,置信度为66.6%R2:面饼烤鸭、面酱。支持度40%,置信度为66.6%R3:面酱面饼、烤鸭。支持度40%,置信度为50%例如用R1,将烤鸭降价以促销面饼、面酱,很可能会破产用R2,将面饼降价,以促销烤鸭,可能会发财;用R3,引不起顾客的热情。蠕檄垛噶旷陈菩昌窗锚玄舜积俯霓式尝沫椎睬寿铲球酮粕蜜和羡敝巡矛焰神经网络和遗传算法神经网络和遗传算法分类知识的
18、挖掘例 住房分配(1)输入:训练数据集(2)输出从训练数据中发现一个分房计分公式(知识)(3)调用特征选择过程 比较张三与张C,李四与李D,王五与王E发现身高、体重与住房无关,删去。轨涸左罪敞恋早壬韩农顶佰隔橙眶砸卫剃炔窜临某弊碳涨漳孺票宪姜炎玫神经网络和遗传算法神经网络和遗传算法(4)交互生成加权机制Total =PiFi,其中Fi为各条 件化值,Pi为加权值,总分为应住面积。(5)根据训练数据,调整加权。例如张三及类似与张 三条件的应住85平方米等,使得在训练集中各记 录的PiFi刚好在应住面积的分数段中。(6)用测试数据测试和修改公式Total =PiFi。(7)公式Total=PiFi
19、 就是从数据中“挖”出来的分类 知识,可以推广使用。分类知识的挖掘饿霖别效尊收蓬擒讽慢钟栅我包尧旭唇鲍但公邱裤场生贬寓葱痕着蜒疡庚神经网络和遗传算法神经网络和遗传算法基于决策树的分类例高校招生:德智体三标准(门限值)。决策树德不合格0.1%智(总分)99.9%不合格60%体39.9%不合格6.9%录取33%畴炼衔抹坡开档甄应瞻搓唾比翠诲哄善燃迫对凤妈疮麻篓申豫咏拆访娟酗神经网络和遗传算法神经网络和遗传算法基于决策树的分类上述决策树把德育放在第一位。绝大多数考生都符合标准。第一节点(德育)分流后,候选空间并未迅速减少(信息增益小)如果把智育节点提前,可在第一步将候选集缩小到1/3,提高整个系统效
20、率。事实上的招生过程采用了这一方法。决策树分类技术研究节点集的选择,节点的次序,门限值的确定公式等等,其目的是使分类比较准确,比较快。尺络寝匪幽坠烬悯章撼诚凶木逛轨菲臂仕隋俄硬釉糙拽净馈刨拓音够劳俯神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)一、人脑信息处理机制 生物神经系统是一个有高度组织和相互作用的数量巨大的细胞组织群体。人类大脑的神经细胞大约在1011一1013个左右。神经细胞也称神经元,是神经系统的基本单元,它们按不同的结合方式构成了复杂的神经网络。通过神经元及其联接的可塑性,使得大脑具有学习、记忆和认知等各种智能。 神经元由细胞体和延伸部分组成。延伸部分按功能分有两类,
21、一种称为树突,占延伸部分大多数,用来接受来自其他神经元的信息;另一种用来传递和输出信息,称为轴突。 诌坏蛇寨窥谅户妨回枣浙乌形娘使腹闺减倪撑番纷咙掺烷宇躬礁脏腊氮默神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)纷广激傅飞荐群孽蒋军坎疑药请敏壳朱鞠竞尉泊雪火渍苛止捶獭添训寥图神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN) 生物神经元之间的相互连接从而让信息传递的部位称为突触。突触的联接是可塑的,也就是说突触特性的变化是受到外界信息的影响或自身生长过程的影响。 多个神经元以突触联接形成了一个神经网络。生物神经网络的功能决不是单个神经元生理和信息处理功能的简单叠加,而是一个有
22、层次的、多单元的动态信息处理系统。滨侦寓摩喀员娟担储喇窄兼沉险猎逸掠才圆事絮鹰接树遂瓷渍决浅讨耕蕊神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)二、人工神经网络(Artificial Neural Networks)定义 人工神经网络的研究出发点是以生物神经元学说为基础的。 人工神经网络是一个并行、分布处理结构,由具有局部内存处理单元(PE)及其联接的无向讯号通道互连而成。每个PE有一个单一的输出联接,这个输出可以根据需要被分支成希望个数的许多并行联接,且这些并行联接都输出相同的信号,即相应PE的信号,信号的大小不因分支的多少而变化。PE的输出信号可以是任何需要的数学模型,每个PE
23、中进行的操作必须是完全局部的。也就是说,它必须仅仅依赖于经过输入联接到达处理单元的所有输入信号的当前值和存储在PE局部内存中的值。饭祟惕戴溅剑汗空蓑虞辽审动箱锚雕互舀扬各舜躇豪世袭衣滁胯软手智练神经网络和遗传算法神经网络和遗传算法三、人工神经网络的组成要素 1、一组处理单元(PE或AN); 2、处理单元的激活状态(ai); 3、每个处理单元的输出函数(fi); 4、处理单元之间的联接模式; 5、传递规则(wijoi); 6、把处理单元的输入及当前状态结合起来产生激 活值的激活规则(Fi); 7、通过经验修改联接强度的学习规则; 8、系统运行的环境(样本集合)。 人工神经网络(ANN)聘录躺嗓蚌
24、饥载贫高焦蚊解禁秒挠辉湾祝骚抠僻硝产帐歹吨给辈砧砧震磐神经网络和遗传算法神经网络和遗传算法四、人工神经网络的特点 1、人工神经网络是一个非线性的有向图,图中含有可以通 过改变权大小来存放模式的加权边,并且可以从不完整 的或未知的输入找到模式。 2、人工神经网络可以根据所在的环境去改变它的行为。 3、不同的人工神经网络模型,有不同的学习/训练算法。 4、由于其运算的不精确性,表现成“去噪音、容残缺”的能 力,利用这种不精确性,实现模式的自动分类。 5、信息的分布存提供容错功能 1)当其中某一个或某几个点被破坏时,信息仍可被存取2)系统在受到局部损伤时还可以正常工作3)对一类网来说,当它完成学习后
25、,如果再让它学习新的 东西,这时就会破坏原来已学会的东西。人工神经网络(ANN)酝统揽舔墅侄姐阮盟岳龟尉施拢奋只务半人酝痢爽鞍栗奉惭锚爱倘趴意耍神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)五、人工神经网络的应用 人们主要将其用于语音、视觉、知识处理、辅助决策等方面。 在数据压缩、模式匹配、系统建模、模糊控制、求组合优化问题的最佳解的近似解(不是最佳近似解)等方面也有较好的应用。 班挛孙工攀缘齿嘉手蚜粕线因巢再孺歼蠢贴该扦抓逢钵处始依伦与深违跌神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)六、人工神经网络基本模型 1、标准MP模型 神经元i与j之间的连接强度,称连接权神
26、经元j的输出,即神经元i的一个输入神经元i的阈值神经元i的活跃值,即神经元状态激活(励)函数邪匀披襄咎我伶搂孝柴绽引酚脉寄日驭梗榆暖圾掌曲诞颊版坠滋击哈尿例神经网络和遗传算法神经网络和遗传算法激活(励)函数f作用:实现对该神经元所获得的网络输入的变换,表 达了神经元的输入输出特性。形式:1)线性函数 f(net)=k*net+c 人工神经网络(ANN)netooc乳罕且钱绘题巧善饱粟夸巾隧呆篡抒沤换髓沿饥煌噶窍丛汪而初撂藐棱稗神经网络和遗传算法神经网络和遗传算法2)非线性斜面函数 if netf(net)= k*net if |net|0为一常数,被称为饱和值,为该神经元的最大输出。 3)阈值
27、函数、阶跃函数人工神经网络(ANN) - - net o if netf(net)= 、均为非负实数,为阈值 - if net 二值形式: 双极形式: 1if net 1 if netf(net)= f(net)= 0if net -1 if net 场都堵毯俯幻硫橇纲沃予炮改训害钝踪康方借烟帅慑伦耶祈仗尉抡酬南篆神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)4)S形函数MP模型使用的激励函数 最简单形式为:f(net)= 1/(1+exp(-d*net) 函数的饱和值为0和1,S形函数有较好的增益控制o -0neta+b o(0,c)netac=a+b/2阶跃函数S形函数页饶氖繁
28、闽洽劳糠澜晴倔禽崇旺吭汕您排借审攫骇它愁毗谴哼三赛奸谭哮神经网络和遗传算法神经网络和遗传算法2、感知器模型 感知器是一种早期的神经网络模型,感知器中第一次引入了学习的概念,使人脑所具备的学习功能在基于符号处理的数学到了一定程度的模拟。1)简单感知器 简单感知器模型仍是MP模型的结构,但它通过采用监督学习来逐步增强模式划分的能力,达到所谓学习的目的。人工神经网络(ANN)蘑继箩修石涕镜靖茫泡往乐拙敢蚂杯效遂楷锑依瞎戮颂玻燎赃自孺颅眉夫神经网络和遗传算法神经网络和遗传算法 感知器处理单元对n个输入进行加权和操作v即: 其中,Wi为第i个输入到处理单元的连接权值,为阈值,f取阶跃函数。 感知器在形式
29、上与MP模型差不多,它们之间的区别在于神经元间连接权的变化。感知器的连接权定义为可变的,这样感知器就被赋予了学习的特性。 简单感知器引入的学习算法称为误差学习算法。人工神经网络(ANN)粗纸闹衣捡锨诞脆淑律聚府铂份寿分跌掉灸障锭触迂廖呻缅验眯卷蛊慷蹄神经网络和遗传算法神经网络和遗传算法(1)选择一组初始权值wi(0)。(2)计算某一输入模式对应的实际输出与期望输出的误差(3)如果小于给定值,结束,否则继续。 (4)更新权值(阈值可视为输入恒为1的一个权值): wi(t+1) wi(t+1)- wi(t) dy(t)xi。 为在区间(0,1)上的一个常数,称为学习步长,它的取 值与训练速度和w收
30、敛的稳定性有关;d、y为神经元的期 望输出和实际输出;xi为神经元的第i个输入。(5)返回(2),重复,直到对所有训练样本模式,网络输出均 能满足要求。人工神经网络(ANN)2) 误差型学习规则腑傻宗捷瞒靴蓬请磕群影脸乍隔藉宽通觉皱烫骗械锈遣踞咨腊偿耸祸潦兼神经网络和遗传算法神经网络和遗传算法3、简单单级网x1x2xno1o2omwnmw11w1mw2mwn1输出层输入层人工神经网络(ANN)输出层的第j个神经元的网络输入记为netj:netj=x1w1j+x2w2j+xnwnj 其中, 1 j m纹忠饥刀娥讹需姓宴臂恕汾迂治吾邮烛防句酥罗尘添味猜球莽足噶慑鞭挛神经网络和遗传算法神经网络和遗传
31、算法4、单级横向反馈网:NET(t+1)=X(t)W+O(t)V输出层x1o1w11w1mx2o2w2mxnomwn1输入层V人工神经网络(ANN)咒淫峭帆惩顶则渊焰寥矗挣疑储锄撵坟峻朱首锻息扎蚜猎咏袱盔嘻钞奖杯神经网络和遗传算法神经网络和遗传算法5、多级网输出层隐藏层输入层o1o2omx1x2xn人工神经网络(ANN)至铱啮丹仇很棍左汝朴驳前干过托哈赁舱诚延礼该湘损桩胖窍插吾穿水甲神经网络和遗传算法神经网络和遗传算法层次划分 信号只被允许从较低层流向较高层。层号确定层的高低:层号较小者,层次较低,层号较大者,层次较高。输入层:被记作第0层。负责接收来自网络外部的信息第j层:第j-1层的直接后
32、继层(j0),它直接接受第j-1层的输出。输出层:它是网络的最后一层,具有该网络的最大层号,负责输出网络的计算结果。隐藏层:除输入层和输出层以外的其它各层叫隐藏层。隐藏层不直接接受外界信号,也不直接向外界发送信号人工神经网络(ANN)裙坟疑血眨创暗客湍白诌窥抢锨挎液栖窝弄籽绞戎掘淘架炯靛鳃曳把扇檀神经网络和遗传算法神经网络和遗传算法约定 :输出层的层号为该网络的层数:n层网络,或n级网络。第j-1层到第j层的连接矩阵为第j层连接矩阵,输出层对应的矩阵叫输出层连接矩阵。一般用W(j)表示第j层矩阵。输出层隐藏层输入层o1o2omx1x2xnW(1)W(2)W(3)W(h)人工神经网络(ANN)恶
33、拭买哲刻寡鳖卿雀崇恐殿办山刺增腿姥噶呈啼赃锚豫驶阅见匈填巨观镍神经网络和遗传算法神经网络和遗传算法6、多级网h层网络输出层隐藏层输入层o1o2omx1x2xnW(1)W(2)W(3)W(h)人工神经网络(ANN)爬羡困暮哆边释决迂深圃情请夏浊辅伏喘技韶诬皋辕崭檬诬走尽微避涵绘神经网络和遗传算法神经网络和遗传算法7、循环网x1o1输出层隐藏层输入层x2o2omxn人工神经网络(ANN)咙箩降秦枝缠进沂艺栽首聪痊拷湖架就根烁庸冶束缮暑敦武瑰瞅饮扯鸦近神经网络和遗传算法神经网络和遗传算法如果将输出信号反馈到输入端,就可构成一个多层的循环网络。输入的原始信号被逐步地“加强”、被“修复”。大脑的短期记忆
34、特征看到的东西不是一下子就从脑海里消失的。稳定:反馈信号会引起网络输出的不断变化。我们希望这种变化逐渐减小,并且最后能消失。当变化最后消失时,网络达到了平衡状态。如果这种变化不能消失,则称该网络是不稳定的。 人工神经网络(ANN)腿球眺唾瘦宋员冶轮多纲累苛充多林砚返鸯捶驯沧辟肘歹喂缔铜苞履眩笼神经网络和遗传算法神经网络和遗传算法七、BP神经网络x1o1输出层隐藏层输入层x2o2omxnW(1)W(2)W(3)W(L)人工神经网络(ANN)实坏岸己喧唤谋何蒜膀赐兔淋旁涤戴酒苦即们麓贼貌装喷提革浅明厦碎垂神经网络和遗传算法神经网络和遗传算法1、网络的拓扑结构 BP网的结构神经元的网络输入:neti
35、=x1w1i+x2w2i+xnwni神经元的输出:实验:增加隐藏层的层数和隐藏层神经元个数不一定总能够提高网络精度和表达能力。BP网一般都选用二级网络。人工神经网络(ANN)崖摘县肺岗亏硼腋擅扒讶逃胁放莲蹄尺杯呼窥贫纶吝奢币涂武寥势毁狸铂神经网络和遗传算法神经网络和遗传算法输出函数分析0.5f (net)0.25o0 11(0,0.5)net(0,0)o应该将net的值尽量控制在收敛比较快的范围内可以用其它的函数作为激活函数,只要该函数是处处可导的人工神经网络(ANN)逾阳墟足抓奄蜘钞旁锦酒章冠民汝脐读顽谚呀琵戒宇抡籍柴怜臀挝食涵挡神经网络和遗传算法神经网络和遗传算法2、训练过程概述 样本:(
36、输入向量,理想输出向量)权初始化:“小随机数”与饱和状态;“不同”保证网络可以学习。向前传播阶段(1)从样本集中取一个样本(Xp,Yp),将Xp输入网络;(2)计算相应的实际输出Op: Op=Fl(F2(F1(XpW(1)W(2)W(L)向后传播阶段误差传播阶段(1)计算实际输出Op与相应的理想输出Yp的差;(2)按极小化误差的方式调整权矩阵。(3)网络关于第p个样本的误差测度:(4) 网络关于整个样本集的误差测度:人工神经网络(ANN)忙邻玖奸胎九驳闷调盘歪舰确桌窜财询割狂符谢灯下劣肮怖青蚂倘艾钧狮神经网络和遗传算法神经网络和遗传算法输出层权的调整wpq= wpq+wpqwpq=qop=fn
37、 (netq)(yq-oq)op=oq(1-oq) (yq-oq)op wpqANpANq第L-1层第L层wpq人工神经网络(ANN)3、误差传播分析做捧稗凹特伤霹父兴金卿邪饲袋学锐颧李杏怕鸿取雹洪疯减阮暮赌肛牛赁神经网络和遗传算法神经网络和遗传算法隐藏层权的调整 ANpANqANhvhppk-11kwp1wpqqkwpmmk第k-2层第k层第k-1层人工神经网络(ANN)祖盐牌梁政琼挫脆道烯豌闺骗噬践卸晋肮逢轨鸡鬃贯读河链毫曰钮郧獭正神经网络和遗传算法神经网络和遗传算法人工神经网络(ANN)隐藏层权的调整 pk-1的值和1k,2k,mk 有关不妨认为pk-1通过权wp1对1k做出贡献,通过权
38、wp2对2k做出贡献,通过权wpm对mk做出贡献。pk-1= fk-1(netp) (wp11k+ wp22k+ wpmm k)脏侩妹饿骸蜕惩治院江寐艘缨污钢估略尔洁承综气涂哈琴腋恶烧醉郧扔酸神经网络和遗传算法神经网络和遗传算法4、基本的BP算法 样本集:S=(X1,Y1),(X2,Y2),(Xs,Ys) 基本思想 :逐一地根据样本集中的样本(Xk,Yk)计算出实际输出Ok和误差测度E1,对W(1) ,W(2) ,W(L)各做一次调整,重复这个循环,直到Ep。用输出层的误差调整输出层权矩阵,并用此误差估计输出层的直接前导层的误差,再用输出层前导层误差估计更前一层的误差。如此获得所有其它各层的误
39、差估计,并用这些估计实现对权矩阵的修改。形成将输出端表现出的误差沿着与输入信号相反的方向逐级向输入端传递的过程 人工神经网络(ANN)访冒像妹袋吴哇企挚蛾泌铸辨铜翌尘待硫羹破抱郴拼砌氓僚寻米啃触德募神经网络和遗传算法神经网络和遗传算法收敛速度问题 局部极小点问题 逃离/避开局部极小点:修改W、V的初值并非总有效逃离统计方法;将Cauchy训练与BP算法结合起来,可在保证训练速度不被降低的情况下,找到全局极小点 网络瘫痪问题 在训练中,权可能变得很大,这会使神经元的网络输入变得很大,从而又使得其激活函数的导函数在此点上的取值很小。根据相应式子,此时的训练步长会变得非常小,进而将导致训练速度降得非
40、常低,最终导致网络停止收敛 5、存在的几个问题 人工神经网络(ANN)铀擎丰庶伍腿拟里奉身酷铭民骡友横旗楷软天咎圈困测澈医提猿州沽更掣神经网络和遗传算法神经网络和遗传算法稳定性问题 用修改量的综合实施权的修改连续变化的环境,它将变成无效的 步长问题 BP网络的收敛是基于无穷小的权修改量步长太小,收敛就非常慢步长太大,可能会导致网络的瘫痪和不稳定自适应步长,使得权修改量能随着网络的训练而不断变化。人工神经网络(ANN)摩毅技改答流踩派祥勤墅煮硬谍泼瞧棵坡嘎快餐夫哈翟错剖客怯滁蝎刀墟神经网络和遗传算法神经网络和遗传算法遗传算法(GA)一、概述遗传算法是一种大致基于模拟进化的学习方法假设通常被描述为
41、二进制位串,也可以是符号表达式或计算机程序搜索合适的假设从若干初始假设的群体或集合开始当前群体的成员通过模拟生物进化的方式来产生下一代群体,比如随机变异和交叉每一步,根据给定的适应度评估当前群体中的假设,而后使用概率方法选出适应度最高的假设作为产生下一代的种子亥赔冶干侩疟为肾藏予携磅微悍呕曙仕瘸潦锁乾沧杖牺仅舱茎摘陛择札营神经网络和遗传算法神经网络和遗传算法遗传算法是一种受生物进化启发的学习方法,它不再是从一般到特殊或从简单到复杂地搜索假设,而是通过变异和重组当前已知的最好假设来生成后续的假设每一步,更新被称为当前群体的一组假设,方法是使用当前适应度最高的假设的后代替代群体的某个部分这个过程形
42、成了假设的生成测试的柱状搜索,其中若干个最佳当前假设的变体最有可能在下一步被考虑遗传算法(GA)喊乃铡暂输垦妊斋述燎稚碉街温买董部涎萝右躇旁华惊背措忻诛边绰乖缝神经网络和遗传算法神经网络和遗传算法二、基本概念 1、个体就是搜索空间中的一个点。 2、种群是整个搜索空间的一个很小的子集。 3、适应度函数是问题中的全体个体与其适应度之 间的一个对应关系。一般是一个实值函数。该 函数就是遗传算法中指导搜索的评价函数。 4、遗传操作亦称遗传算子,就是关于染色体的 运算。 遗传算法(GA)滞没拼望奔比爸菱颜恿级受甚邀橡醉傲占朝贼猪诲邪炊氯尸缉慑旭舌胯冻神经网络和遗传算法神经网络和遗传算法三、遗传操作三种操
43、作 1、选择-复制 对于一个规模为N的种群S,按每个染色体xiS的选择概率P(xi)所决定的选中机会, 分N次从S中随机选定N个染色体, 并进行复制。 2、交叉就是互换两个染色体某些位上的基因。 3、变异就是改变染色体某个(些)位上的基因。遗传算法(GA) 决定了遗传算法的局部搜索能力,同时保持种群的多样性。种群中产生了新个体,决定了遗传算法的全局搜索能力。疾肋僧肉绳肯著淹腺哪夫坯痰枚母某扫累嗡染消镁睡象氨雨闺吧赏智势放神经网络和遗传算法神经网络和遗传算法s40.31s20.49s10.14S3 0.06轮盘赌选择法/比例选择算子遗传算法(GA)基本思想:1) 计算群体中所有个体的适应度函数值
44、;2) 利用比例选择算子的公式,计算每个个体被选中遗传到下一 代群体的概率;3) 采用模拟赌盘操作(即生成0到1之间的随机数与每个个体遗 传到下一代群体的概率进行匹配)来确定各个个体是否遗传 到下一代群体中。算法步骤:许除雷詹判蚤唐诊呼照货戍鞠愁尼捕滋妆碉针扰掉翌褐乔匙罪出懂洒锚署神经网络和遗传算法神经网络和遗传算法s1=01000101, s2=10011011举例:设染色体 s1=01001011, s2=10010101, 交换其后4 位基因, 即遗传算法(GA)举例:设染色体 s=11001101,将其第三位上的0变为1, 即 s=11001101 11101101= s s也可以看做
45、是原染色体s的子代染色体。贸洋拇汤壮频慷冈霖防惧震猖缀貌善烯研减卷抡膝鸽比呵拽否辫湖醒谷秧神经网络和遗传算法神经网络和遗传算法四、基本遗传算法 生成初始种群计算适应度选择-复制交叉变异生成新一代种群终止 ?结束 算法中的一些控制参数: 种群规模 最大换代数 交叉率就是参加交叉运算的染色体个数占全体染色体总数的比例,记为Pc,取值范围一般为0.40.99。 变异率是指发生变异的基因位数所占全体染色体的基因总位数的比例,记为Pm,取值范围一般为0.00010.1。票良夸褂概异挣苫照报钢各钵咕绸钎厅氓界耙妒翼椎新疽青块渠盅估鸣撩神经网络和遗传算法神经网络和遗传算法五、遗传算法的主要特点 遗传算法一般
46、是直接在解空间搜索, 而不像图搜 索那样一般是在问题空间搜索, 最后才找到解。 遗传算法的搜索随机地始于搜索空间的一个点集 而不像图搜索那样固定地始于搜索空间的初始节 点或终止节点, 所以遗传算法是一种随机搜索算 法。 遗传算法总是在寻找优解, 而不像图搜索那样并 非总是要求优解, 而一般是设法尽快找到解, 所 以遗传算法又是一种优化搜索算法。遗传算法(GA)玲隙跨巳织瞩舞吃感公韧公扩褒梗幌碳涟堡娥剔绅圆灯拨塔艺裹逻芯豌辐神经网络和遗传算法神经网络和遗传算法遗传算法的搜索过程是从空间的一个点集(种群) 到另一个点集(种群)的搜索, 实际是一种并行搜 索, 适合大规模并行计算, 这种种群的搜索有
47、能 力跳出局部最优解。 遗传算法的适应性强, 除需知适应度函数外,几乎 不需要其他的先验知识。 遗传算法长于全局搜索, 它不受搜索空间的限制 性假设的约束,不要求连续性, 能以很大的概率 从离散的、多极值的、 含有噪声的高维问题中 找到全局最优解。 遗传算法(GA)姨吠槛谋脚历雅返遮瞻郊莎餐棠蛤础骡资班钞蒲释痘掸泌粳希戎绚里脯滞神经网络和遗传算法神经网络和遗传算法基本思路:证券神经网络BP网络数据预处理GA优化BP网络证券预测模型预测指标体系庞杂干扰因素较多个体差异自组织自适应并行处理、分布存储高度容错可以逼近刻画样本规律函数优化BP网络结构优化 BP网络权值证券预测技术黄卯厘腹碾软莎族捷于摸
48、故城赛焊丈撇疯淆疏揩驱离葬鞭谜孤缀顶猖撤肮神经网络和遗传算法神经网络和遗传算法证券预测技术一、BP神经网络 BP网络是一个多层的前馈神经网络,其学习过程由信号的正向传播与误差的反向传播两个过程循环进行的。权值的不断调整过程就是网络的训练过程。BP网络学习算法是非循环多级神经网络的训练算法。该算法收敛速度慢,但具有广泛的适用性。二、实验验证 1、实验数据:深发展105个交易日 股市行情收盘价 2、样本集合:70个数据作为训练样本集 28个数据作为检验样本集 3、实验环境: Matlab 7.0 典木檬论扎夺呈致购攒斧蜜难鹅捻摆果麓运聂潦善臃柏收容掣遥刽宵晦椽神经网络和遗传算法神经网络和遗传算法证
49、券预测技术三、实验结论 1、用BP算法训练网络时,网络性能随着输入节点 的增加,网络性能有显著的提高,但最佳隐层 节点的个数也随着增加,使得训练网络的时间 明显增加。 2、 BP算法性能分析: 1)易出现一个长时间的误差平坦区;某些节点输出 大对权值小的变化不敏感 2)激活函数是非线性函数,其值为全局误差的输入 导致全局误差存在多个极小值 3)试凑法:网络过小可能不收敛;过大效率低还有 可能过拟合照卢卒玛微逢篓突米碟访琵成注视入接驴萧撒达应博漂堆骡寞宰巴痹鲜档神经网络和遗传算法神经网络和遗传算法证券预测技术四、改进的BP算法1、对实验数据进行预处理提高其相关性数据预处理的必要性: 因为BP网络的神经元均采用S型激励函数,对于输入样本数据进行预处理变换后可防止因净输入的绝对值过大而使神经元输出饱和,继而使权值调整进入误差曲面的平坦区。 对于输入样本数据进行预处理还可改变数据间的相关性,使那些比较大的输入落在神经元激活函数梯度较大的区域,便于进行数学处理,能
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025乳房再造加速康复外科中国专家共识(2022版)解读课件
- 返乡学生网络安全培训课件
- 施工冲刺阶段保通方案
- 车险培训课件制作
- 车队安全驾驶培训记录课件
- 某医药静脉输液知识试题含答案
- 车间领班安全培训课件
- 酒店客房用品更换与补给制度
- 酒店消防安全巡查制度
- 2025年八级班主任工作总结(2篇)
- 1输变电工程施工质量验收统一表式(线路工程)-2024年版
- 陕西省建筑场地墓坑探查与处理技术规程
- 2022-2023学年四川省乐山市市中区外研版(三起)六年级上册期末测试英语试卷(含听力音频)
- 滕州菜煎饼创新创业计划书
- 2024北京朝阳区初一(上)期末道法试卷及答案
- 假体隆胸后查房课件
- 送货单格式模板
- GB/T 42430-2023血液、尿液中乙醇、甲醇、正丙醇、丙酮、异丙醇和正丁醇检验
- 关于地方储备粮轮换业务会计核算处理办法的探讨
- 上海农贸场病媒生物防制工作标准
- YY 0334-2002硅橡胶外科植入物通用要求
评论
0/150
提交评论