版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
神经网络构建神经网络构建第1页普通地,BP网络输入变量即为待分析系统内生变量(影响因子或自变量)数,普通依据专业知识确定。若输入变量较多,普通可经过主成份分析方法压减输入变量,也可依据剔除某一变量引发系统误差与原系统误差比值大小来压减输入变量。输出变量即为系统待分析外生变量(系统性能指标或因变量),能够是一个,也能够是多个。普通将一个含有多个输出网络模型转化为多个含有一个输出网络模型效果会更加好,训练也更方便。输入/输出变量确实定及其数据预处理神经网络构建第2页
因为BP神经网络隐层普通采取Sigmoid(S形)转换函数,为提升训练速度和灵敏性以及有效避开Sigmoid函数饱和区,普通要求输入数据值在0~1之间。所以,要对输入数据进行预处理。普通要求对不一样变量分别进行预处理,也能够对类似性质变量进行统一预处理。假如输出层节点也采取Sigmoid转换函数,输出变量也必须作对应预处理,不然,输出变量也能够不做预处理。预处理方法有各种多样,各文件采取公式也不尽相同。但必须注意是,预处理数据训练完成后,网络输出结果要进行反变换才能得到实际值。再者,为确保建立模型含有一定外推能力,最好使数据预处理后值在0.2~0.8之间。神经网络构建第3页普通认为,增加隐层数能够降低网络误差(也有文件认为不一定能有效降低),提升精度,但也使网络复杂化,从而增加了网络训练时间和出现“过拟合”倾向。Hornik等早已证实:若输入层和输出层采取线性转换函数,隐层采取Sigmoid转换函数,则含一个隐层MLP网络能够以任意精度迫近任何有理函数。显然,这是一个存在性结论。在设计BP网络时可参考这一点,应优先考虑3层BP网络(即有1个隐层)。普通地,靠增加隐层节点数来取得较低误差,其训练效果要比增加隐层数更轻易实现。对于没有隐层神经网络模型,实际上就是一个线性或非线性(取决于输出层采取线性或非线性转换函数型式)回归模型。所以,普通认为,应将不含隐层网络模型归入回归分析中,技术已很成熟,没有必要在神经网络理论中再讨论之。神经网络拓扑结构确实定隐层数神经网络构建第4页2.2隐层节点数在BP网络中,隐层节点数选择非常主要,它不但对建立神经网络模型性能影响很大,而且是训练时出现“过拟合”直接原因,不过当前理论上还没有一个科学和普遍确实定方法。当前多数文件中提出确实定隐层节点数计算公式都是针对训练样本任意多情况,而且多数是针对最不利情况,普通工程实践中极难满足,不宜采取。实际上,各种计算公式得到隐层节点数有时相差几倍甚至上百倍。为尽可能防止训练时出现“过拟合”现象,确保足够高网络性能和泛化能力,确定隐层节点数最基础标准是:在满足精度要求前提下取尽可能紧凑结构,即取尽可能少隐层节点数。研究表明,隐层节点数不但与输入/输出层节点数相关,更与需处理问题复杂程度和转换函数型式以及样本数据特征等原因相关。神经网络构建第5页
在确定隐层节点数时必须满足以下条件:隐层节点数必须小于N-1(其中N为训练样本数),不然,网络模型系统误差与训练样本特征无关而趋于零,即建立网络模型没有泛化能力,也没有任何实用价值。同理可推得:输入层节点数(变量数)必须小于N-1。(2)训练样本数必须多于网络模型连接权数,普通为2~10倍,不然,样本必须分成几个别并采取“轮番训练”方法才可能得到可靠神经网络模型。神经网络构建第6页
总之,若隐层节点数太少,网络可能根本不能训练或网络性能很差;若隐层节点数太多,即使可使网络系统误差减小,但首先使网络训练时间延长,另首先,训练轻易陷入局部极小点而得不到最优点,也是训练时出现“过拟合”内在原因。所以,合理隐层节点数应在综合考虑网络结构复杂程度和误差大小情况下用节点删除法和扩张法确定。神经网络构建第7页BP网络训练就是经过应用误差反传原理不停调整网络权值使网络模型输出值与已知训练样本输出值之间误差平方和到达最小或小于某一期望值。即使理论上早已经证实:含有1个隐层(采取Sigmoid转换函数)BP网络可实现对任意函数任意迫近。但遗憾是,迄今为止还没有结构性结论,即在给定有限个(训练)样本情况下,怎样设计一个合理BP网络模型并经过向所给有限个样本学习(训练)来满意地迫近样本所蕴含规律(函数关系,不但仅是使训练样本误差到达很小)问题,当前在很大程度上还需要依靠经验知识和设计者经验。所以,经过训练样本学习(训练)建立合理BP神经网络模型过程,在国外被称为“艺术创造过程”,是一个复杂而又十分烦琐和困难过程。神经网络训练训练神经网络构建第8页
因为BP网络采取误差反传算法,其实质是一个无约束非线性最优化计算过程,在网络结构较大时不但计算时间长,而且很轻易限入局部极小点而得不到最优结果。当前虽已经有改进BP法、遗传算法(GA)和模拟退火算法等各种优化方法用于BP网络训练(这些方法从原理上讲可经过调整一些参数求得全局极小点),但在应用中,这些参数调整往往因问题不一样而异,较难求得全局极小点。这些方法中应用最广是增加了冲量(动量)项改进BP算法。神经网络构建第9页学习率影响系统学习过程稳定性。大学习率可能使网络权值每一次修正量过大,甚至会造成权值在修正过程中超出某个误差极小值呈不规则跳跃而不收敛;但过小学习率造成学习时间过长,不过能确保收敛于某个极小值。所以,普通倾向选取较小学习率以确保学习过程收敛性(稳定性),通常在0.01~0.8之间。增加冲量项目标是为了防止网络训练陷于较浅局部极小点。理论上其值大小应与权值修正量大小相关,但实际应用中普通取常量。通常在0~1之间,而且普通比学习率要大。学习率和冲量系数神经网络构建第10页4网络初始连接权值
BP算法决定了误差函数普通存在(很)多个局部极小点,不一样网络初始权值直接决定了BP算法收敛于哪个局部极小点或是全局极小点。所以,要求计算程序(提议采取标准通用软件,如Statsoft企业出品StatisticaNeuralNetworks软件和Matlab软件)必须能够自由改变网络初始连接权值。因为Sigmoid转换函数特征,普通要求初始权值分布在-0.5~0.5之间比较有效。神经网络构建第11页训练神经网络首要和根本任务是确保训练好网络模型对非训练样本含有好泛化能力(推广性),即有效迫近样本蕴含内在规律,而不是看网络模型对训练样本拟合能力。从存在性结论可知,即使每个训练样本误差都很小(能够为零),并不意味着建立模型已迫近训练样本所蕴含规律。所以,仅给出训练样本误差(通常是指均方根误差RSME或均方误差、AAE或MAPE等)大小而不给出非训练样本误差大小是没有任何意义。网络模型性能和泛化能力神经网络构建第12页
要分析建立网络模型对样本所蕴含规律迫近情况(能力),即泛化能力,应该也必须用非训练样本(本文称为检验样本和测试样本)误差大小来表示和评价,这也是之所以必须将总样本分成训练样本和非训练样本而绝不能将全部样本用于网络训练主要原因之一。判断建立模型是否已经有效迫近样本所蕴含规律,最直接和客观指标是从总样本中随机抽取非训练样本(检验样本和测试样本)误差是否和训练样本误差一样小或稍大。非训练样本误差很靠近训练样本误差或比其小,普通可认为建立网络模型已经有效迫近训练样本所蕴含规律,不然,若相差很多(如几倍、几十倍甚至上千倍)就说明建立网络模型并没有有效迫近训练样本所蕴含规律,而只是在这些训练样本点上迫近而已,而建立网络模型是对训练样本所蕴含规律错误反应。神经网络构建第13页对同一结构网络,因为BP算法存在(很)多个局部极小点,所以,必须经过屡次(通常是几十次)改变网络初始连接权值求得对应极小点,才能经过比较这些极小点网络误差大小,确定全局极小点,从而得到该网络结构最正确网络连接权值。必须注意是,神经网络训练过程本质上是求非线性函数极小点问题,所以,在全局极小点邻域内(即使网络误差相同),各个网络连接权值也可能有较大差异,这有时也会使各个输入变量主要性发生改变,但这与含有多个零极小点(普通称为多模式现象)(如训练样本数少于连接权数时)情况是截然不一样。另外,在不满足隐层节点数条件时,总也能够求得训练样本误差很小或为零极小点,但此时检验样本和测试样本误差可能要大得多;若改变网络连接权初始值,检验样本和测试样本网络计算结果会产生很大改变,即多模式现象。合理网络模型确实定神经网络构建第14页
对于不一样网络结构,网络模型误差或性能和泛化能力也不一样。所以,还必须比较不一样网络结构模型优劣。普通地,伴随网络结构变大,误差变小。通常,在网络结构扩充(隐层节点数增加)过程中,网络误差会出现快速减小然后趋于稳定一个阶段,所以,合理隐层节点数应取误差快速减小后基础稳定时隐层节点数。
总之,合理网络模型是必须在含有合理隐层节点数、训练时没有发生“过拟合”现象、求得全局极小点和同时考虑网络结构复杂程度和误差大小综合结果。设计合理BP网络模型过程是一个不停调整参数过程,也是一个不停对比结果过程,比较复杂且有时还带有经验性。这个过程并不是有些作者想象(实际也是这么做)那样,随便套用一个公式确定隐层节点数,经过一次训练就能得到合理网络模型(这么建立模型极有可能是训练样本错误反应,没有任何实用价值)。神经网络构建第15页
训练样本试验号臭氧浓度(mg/L)入口UV254UV254去除率(%)11.160.11650.221.350.10459.531.720.07858.841.860.10766.251.970.13665.562.150.08264.572.230.12573.682.480.07676.492.790.12278.5102.850.09279.2113.070.08181.4123.450.06890.3133.590.07793.1143.800.10898.2153.930.12897.3164.140.06398.1174.460.13597.3184.550.07098.8194.840.12696.9205.030.08798.6神经网络构建第16页检验样本试验号臭氧浓度(mg/L)入口UV254UV254去除率(%)11.420.08658.122.510.07178.833.210.10789.644.290.09696.555.240.6597.8神经网络构建第17页进水UV254值臭氧浓度,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院防疫绩效考核制度
- 国企风控制度
- 经络学护理的社会推广与应用
- 公证处绩效考核制度
- 审计政务服务工作制度范本
- 公司审计档案保管制度
- 4s店经员工绩效考核制度范本
- 2026年及未来5年市场数据中国机动车检测行业市场发展数据监测及投资前景展望报告
- 内审审计食堂购卖制度
- 乡镇慢性病绩效考核制度
- DB32∕T 5167-2025 超低能耗建筑技术规程
- 2026年湖南商务职业技术学院单招职业技能测试必刷测试卷及答案1套
- 雨课堂学堂在线学堂云《科学研究方法与论文写作(复大)》单元测试考核答案
- 高考语文二轮复习高中语文选用变换句式练习题含答案
- 异地升学协议书范本
- 水利工程项目法人保证安全生产措施方案
- 《AIGC文案策划与写作》-课程标准
- 企业管理顶层设计方案
- 2025年军事基础知识试题及答案
- 雨课堂在线学堂《资治通鉴》导读课后作业单元考核答案
- 2025年南京市事业单位招聘考试综合类专业能力测试试卷(管理类)真题
评论
0/150
提交评论