基于生产实绩数据的复杂配方建模及其性能、成本优化.doc_第1页
基于生产实绩数据的复杂配方建模及其性能、成本优化.doc_第2页
基于生产实绩数据的复杂配方建模及其性能、成本优化.doc_第3页
基于生产实绩数据的复杂配方建模及其性能、成本优化.doc_第4页
基于生产实绩数据的复杂配方建模及其性能、成本优化.doc_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

重庆科技学院本科生毕业设计(论文)基于生产实绩数据的复杂配方建模及其性能、成本优化院(系) 电子信息工程学院 专业班级 自普本 2006-01 学生姓名 陈群领 指导教师 苏盈盈 讲师 2010年 6 月 8 日重庆科技学院毕业设计(论文)题 目 基于生产实绩数据的复杂配方建模 及其性能、成本优化 院 (系) 电子信息工程学院 专业班级 自普本2006-01 学生姓名 陈群领 学号 2006440676 指导教师 苏盈盈 职称 讲 师 评阅教师 职称 2010 年 6 月 8 日注 意 事 项1. 设计(论文)的内容包括:1) 封面(按教务处制定的标准封面格式制作)2) 题名页3) 中文摘要(300字左右)、关键词4) 外文摘要、关键词 5) 目次页(附件不统一编入)6) 论文主体部分:引言(或绪论)、正文、结论、参考文献7) 附录(对论文支持必要时)2. 论文字数要求:设计(论文)字数理工类不少于1.5万字,文科类不少于1.2万字。3. 附件包括:任务书、文献综述、开题报告、外文译文、译文原文(复印件)。4. 文字、图表要求:1) 文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写。2) 工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画。3) 毕业论文须用A4单面打印,论文50页以上的双面打印。4) 图表应绘制于无格子的页面上。5) 软件工程类课题应有程序清单,并提供电子文档。5. 装订顺序1) 设计(论文)2) 附件按照任务书、文献综述、开题报告、外文译文、译文原文(复印件)次序装订3) 教师指导毕业设计(论文)情况记录表4) 其它重庆科技学院本科生毕业设计 中文摘要学生毕业设计(论文)原创性声明 本人以信誉声明:所呈交的毕业设计(论文)是在导师的指导下进行的设计(研究)工作及取得的成果,设计(论文)中引用他(她)人的文献、数据、图件、资料均已明确标注出,论文中的结论和结果为本人独立完成,不包含他人成果及为获得重庆科技学院或其它教育机构的学位或证书而使用其材料。与我一同工作的同志对本设计(研究)所做的任何贡献均已在论文中作了明确的说明并表示了谢意。毕业设计(论文)作者(签字): 年 月 日摘要由于化工过程具有的复杂性以及非线性特性,使得化工产品配方建模一直是化工领域的研究热点和难点。一个好的配方不仅能改善产品的质量,指导化工过程,更能引领一个市场,促进一个领域的发展。随着计算智能在化工领域的成功应用,国内外广泛开展了基于各种技术的化工产品的配方建模研究,也为人工神经网络和遗传算法在该领域的应用创造了有利条件。本文的研究对象是基于生产实绩数据的氢氰酸配方建模。氢氰酸性能、成本指标可由氢氰酸产量和氨的转化率来衡量。从重庆紫光国际化工有限责任公司氢氰酸生产现场获取的大量绩效数据中,统计出三种原料气每小时的流量、氢氰酸的产量和氨的转化率。运用+3准则、小波去噪和归一化方法对数据进行预处理,然后使用误差反向传播神经网络建立氢氰酸配方与其产量、氨的转化率之间非线性数学模型,再通过遗传算法寻优,在可行解空间找到了三种原料气的最佳配比,并返回BP神经网络中验证,发现在氢氰酸的产量和氨的转化率上确有明显提高。从而解决了氢氰酸配方设计问题,不仅提高了氢氰酸产品性能、降低了原材料消耗,而且能直接提供可靠参数依据,有效指导氢氰酸生产过程,体现出了神经网络和遗传算法在配方建模中的实用价值,也促进了化工领域的发展。关键词:氢氰酸 配方建模 神经网络 遗传优化I重庆科技学院本科生毕业设计 英文摘要ABSTRACTSince it has the characteristics of complexity and nonlinear in the chemical process, it makes the modeling of chemical products a hot topic and a difficulty in the chemical field. A good recipe could not only improve the quality of the product and direct chemical process, but also could lead a market and promote the development of an area. With the application of computational intelligence in chemical field, the research of chemical product recipe modeling has been carried out extensively based on various technologies at home and abroad. It also creates a favorable condition for the application of artificial neural networks and genetic algorithms in this field.The research object of this paper is the modeling of hydrocyanic acid recipe. The property and the cost index of hydrocyanic acid could be weighed by the output and convert ratio. From the help of plenty of performance data in the hydrocyanic acid production field, which is obtained in Chongqing Purple Chemical Co., Ltd, the statistics of three kinds of raw gas runoff per hour and the output and convert ratio of hydrocyanic acid could be done. To preprocess the data by the method of +3rule, wavelet de-noising and normalization and then set the nonlinear mathematical model of the hydrocyanic acid recipe, related to its output and conversion rate of ammonia, by the use of error back-propagation neural network. After that, to search the optimizing solution through genetic algorithm, find out the best ratio of three feed gas in feasible solution space, and get back to BP neural network to be validated. Thus the output of hydrocyanic acid and the conversion rate of ammonia improves obviously. In such case, the problem of hydrocyanic acid recipe design could be solved. It not only improves the performance of hydrocyanic acid products and decreases the cost of the raw material, but also had an effective guidance for hydrocyanic acid producing process by give believable parameters. This reflects the practical value of neural networks and genetic algorithm in recipe modeling. At the same time, it promotes the development of chemical industry.Key words:HCN; Recipe and Modeling; Neural Network; Genetic Algorithm Optimization39重庆科技学院本科生毕业设计 目录目 录中文摘要I英文摘要II1 绪论11.1课题研究的目的和意义11.2国内外配方建模研究现状分析11.3本课题的主要工作和内容安排31.3.1主要工作31.3.2主要内容安排32 氢氰酸生产工艺简介42.1原料气的采集42.2净化过程52.3氧化过程52.4酸洗过程63 氢氰酸配方建模的数据准备73.1数据挖掘的定义73.2挖掘HCN绩效数据的流程83.3 HCN绩效数据预处理94 基于HCN绩效数据的人工神经网络建模144.1神经网络简介144.2神经网络的应用144.3基于HCN生产绩效数据的BP网络建模154.3.1多种神经网络模型比较154.3.2选取最佳网络类型BP网络174.3.3 BP网络的设计194.4 BP网络的训练214.5 BP网络模型的实现234.5.1编程前的准备234.5.2 MATLAB编程244.6 BP网络结果分析245 基于遗传算法的最佳配方优化275.1遗传算法简介275.2遗传算法的特点275.3遗传算法优化HCN配方的解题过程285.3.1准备工作285.3.2由目标函数到适应度函数305.3.3遗传算法的基本操作315.3.4遗传算法寻优的基本流程325.4遗传算法优化配方的实现335.5遗传算法结果分析376 结论与展望39致谢40参考文献41附录1 HCN氧化岗位操作原始记录汇总表附录2 数据预处理主要程序代码附录3 BP网络主要程序代码附录4 GA优化主要程序代码重庆科技学院本科生毕业设计 1 绪论1 绪论生产实绩数据就是实际生产过程中记录的反映生产状况和成果的数据。在本文中指的是HCN生产过程中记录的历史数据,包括衡量HCN性能的指标、三种原材料的流量、温度、压力等。配方1,就是各原材料的搭配,是在一系列标准和规则下反复试探,以求得优化方案的过程。它要求对不同的原材料做适当比例的调整,确保配方产品的性能,还包括成本因素、原配料的可供性和连续性。1.1课题研究的目的和意义本课题旨在挖掘氢氰酸生产实绩数据,通过神经网络建立氢氰酸性能、成本关于各原材料的数学模型,然后用遗传算法优化,搜索最佳的材料配方参数,使得产品质量最好,生产成本最低。重庆紫光国际化工有限责任公司的氢氰酸生产过程是采用安氏法,其转化率达到一定指标后,原材料消耗较高;另外,在重要中间体羟基乙腈的生产中对氢氰酸收率还需进一步提高。造成上述问题的主要原因之一是各种原材料配比缺乏有效地优化,从而导致转化率低、收率低、原材料消耗高、能耗高、产品品质不高。为此,本课题以氢氰酸为研究对象,研究复杂配方建模与优化的问题。在现有配方体系基础之上,在总结前人经验教训基础上,建立相应的复杂非线性数学模型,并用遗传算法搜索最优解,以实现提高氢氰酸的生成速度和产品性能,同时降低材料成本、提高材料利用率的目的,为促进氢氰酸的发展提供可行的理论和实验依据。1.2国内外配方建模研究现状分析配方设计是产品开发和性能提高的关键,应用于各行各业,随着科技的进步,配方建模的研究进入一个高峰期,形成了一种行业。目前,配方行业大多采用传统的统计分析进行指标间的相关分析,由于配方问题内在的复杂性、模糊性和不确定性,使得传统统计方法的进一步应用困难重重。随着人工智能的发展,各种更复杂高级的算法的提出,推动着配方行业的不断发展。传统的配方与工艺条件的优化方法常采用正交试验、多元线性回归或均匀设计等方法,这些方法有的实验次数较多、有的受到因素和水平的限制,因而在实际应用中有一定的局限性。采用神经网络方法进行配方建模与优化具有以下特点2:通过训练网络,可学习隐藏在输入(配方)与输出(性能)之间的关系,建立起输入与输出之间的非线性关系,适用于最优配方的搜索;容错能力强,可区分研究过程中的规律与噪音;数据利用效率高,可采用补充试验的结果对网络进一步训练,以获得更好的学习效果;神经网络采用的是矩阵运算,增加配方因子、试验项目或试验次数,无需进行大的结构改变,因而适用于处理多输入、多输出(即多因子、多性能)的问题。纪奎江3讨论了神经网络在计算机辅助橡胶的配方设计中的应用,认为建立合适的橡胶数据库,采用多种配方设计优化方法,结合神经网络及其它计算机新技术的思想,可到达最终实现配方设计的网络化和智能化;杨朝晖4采用神经网络研究混凝土的强度与其组分之问的非线性关系,证明采用神经网络法所得的预测值优于回归分析法;肖卓豪5研究了人工神经网络在玻璃配方设计中的应用,表明由神经网络技术建立的模型能正确反映玻璃组成与热膨胀系数间的内在规律性;MSchun6采用神经网络预测两种铝合金在热压成型和冷扎时的流动应力、冷扎力和冷扎扭矩等,说明了神经网络应用于合金钢的配方设计与优化的是完全可行的。大多数古典的优化算法是基于一个单一的度量函数(评估函数)的梯度或较高次统计,以产生一个确定性的试验解序列。遗传算法与传统的算法不同,它不依赖于梯度信息,而是通过模拟自然进化过程来搜索最优解,它利用某种编码技术,作用于称为染色体的数字串,模拟由这些串组成的群体的进化过程。它的优点有:对可行解表示的广泛性;群体搜索特性;并行计算能力;易于扩展和混合使用。曹志勇7就遗传算法在数值优化问题求解的应用上,基于饲料配方做了一些初步工作,提出了基于遗传算法的研究技术路线和饲料配方模型,并重点对标准遗传算法进行了优化和改进设计;姜昌华8基于遗传算法研究了物流系统中的库存优化问题及车辆路径问题,对遗传算法进行了分析研究,针对遗传算法的一些缺陷提出了相应的改进方法,有效地降低了物流成本;陆海燕9以遗传算法和准则法为工具,开展了优化混合算法的研究,对高层建筑优化设计的一系列问题提出了可行可操作的方案,并提出了一种求解多目标优化问题的基于模糊综合评价技术的遗传算法。1.3本课题的主要工作和内容安排1.3.1主要工作全面了解氢氰酸生产过程,补充理论知识。去重庆紫光化工公司实习,实地了解氢氰酸生产过程,明确研究对象,抽象模型形象具体化;大量阅读有关神经网络和遗传算法等数据挖掘知识方面的书籍,重点关注配方建模方面的应用。挖掘企业生产实绩数据,探求材料配方的潜在规律。在紫光化工氢氰酸生产线获得近七个月绩效数据作为样本数据,并对样本数据做统计分析,为神经网络建模做好准备。建立氢氰酸性能、成本关于其材料配方复杂系统的数学模型。运用BP网络的函数逼近功能,建立结构两层BP网络,然后训练和验证,达到试验要求的精度为止。遗传算法搜索最佳材料配方,并返回模型中验证。运用遗传算法寻优,在可行解空间寻找最佳配方,并通过所建立的BP网络模型验证寻优效果,直至达到实际生产要求为止。在氢氰酸实际生产线上验证寻优结果的实际应用,再不断分析调试,最终达到指导生产实际,提高产品质量,提升劳动生产率,降低原材料消耗、控制生产成本、降低能耗。1.3.2主要内容安排第二章,了解重庆紫光化工HCN生产工艺,把研究问题具体化;第三章,挖掘氢氰酸生产实绩数据,进行数据准备工作;第四章,运用BP神经网络建立氢氰酸性能、成本关于其材料配方的数学模型,并训练仿真,分析结果;第五章,运用遗传算法搜索氢氰酸最佳材料配方,并返回BP网络中验证,并分析结果。重庆科技学院本科生毕业设计 2 氢氰酸生产工艺简介2 氢氰酸生产工艺简介氢氰酸(HCN)的生产过程主要包括原料气的采集、净化、氧化和酸洗四个工段。其中最重要的是氧化工段。如HCN生产工艺流程图2.1所示,三种原料气采集通道各不相同,各自经过净化后混合,然后在氧化工段反应生成HCN气体,再进入酸洗工段,获得较纯净的HCN气体,供其他岗位使用。图2.1 紫光化工氢氰酸工程流程图2.1原料气的采集生产氢氰酸的原料气有三种,分别是:氨气(NH3)、天然气(CH4)和空气。氨气由液氨蒸发而来,外购的液氨存放在液氨储罐;天然气是由天然气公司供给的;空气取自大自然。三种原料气都要经过适当的处理后才能进入净化工段。2.2净化过程三种原料气的净化都是单独的通道,不过净化原理大同小异。具体流程如下:氨气的净化流程只是在净化前需要先蒸发和加热。控制液氨的温度很重要,以防止液氨结晶,堵塞管道发生危险。至小混合器液氨加热稳压蒸发活性炭过 滤呢 袋过 滤图2.2 氨气的净化流程图天然气的净化主要是为了去除其中掺杂的H2S等杂质,并使其温度压力等指标在正常范围内。至小混合器天然气二级氨洗水洗一级氨洗活性炭过 滤呢 袋过 滤图2.3 天然气的净化流程图生产氢氰酸所需的空气要求为两个大气压(或称两公斤),并且没有杂质,因此要对自然界的空气进行净化处理,主要是去除水蒸气,并使温度压力等指标满足所需。空气至大混合器空压机稳压缓冲冷却尼袋过滤图2.4 空气的净化流程图2.3氧化过程净化后的氨气和天然气各自经过流量调节阀后在小混合器中混合,如图2.5所示,然后在大混合器中和经过流量调节的空气混合均匀,三种混合气在纸板过滤器中进一步过滤机械杂质,最后进入反应器生成氢氰酸气体。气体进入混合器时均采用下进上出的方式。混合器的作用是充分混合气体,并调节混合气体的温度。汽包中的软水吸收反应过程所放出的热量,以利于反应正常进行。然后在反应器中,在1100C左右,铂铑合金(Pt-Rh)催化作用下,反应生成HCN气体。主反应式为: (2.1) 净化后空气大混合器小混合器净化后NH3净化后CH4纸板过滤阻火器反应器软水贮罐汽包酸塔图2.5 氧化流程图三种原料气的混合比例是非常重要的控制参数,是配方设计的关键之一。根据主反应式,并考虑到副反应,一般的经验控制范围如表2.1所示。表2.1 配方控制指标表指标名称单位控制范围原料气配比体积比氨气 1013甲烷 1115空气 73782.4酸洗过程从酸塔底部进入的HCN和NH3的混合气体经过下、上两段酸洗,除去其中的氨气(称为残氨),同时也降低了HCN的温度。流程如图2.5所示。在酸塔中稀硫酸和残氨反应生成的硫酸铵在硫酸铵工段经过处理后可用作化肥。从酸塔出来后,便获得了较纯净的HCN气体,此后HCN气体就用于518A等工段。酸塔过滤下段酸循环罐反应器518A石墨冷却过滤上段酸循环罐石墨冷却图2.5 酸洗流程图重庆科技学院本科生毕业设计 3 氢氰酸配方建模的数据准备3 氢氰酸配方建模的数据准备本文的生产实绩数据是氢氰酸反应岗位操作原始记录,来自重庆紫光化工氢氰酸生产现场,如图3.1所示,共记录了2009年7月25日至2010年2月19日近七个月5000余组数据,汇总数据表见附录。由此可见数据来源可靠、样本容量大、可信度高、代表性强,因而能充分反映紫光化工的HCN实际生产情况。通过数据挖掘和预处理,尽量降低干扰影响,抓住重点,挖掘可信的、新颖的、有效的、具有潜在价值的并能被人理解的模式,最终指导实践,提高产品性能,降低成本。图3.1 氢氰酸操作原始记录3.1数据挖掘的定义数据挖掘10(DM)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,抽取隐含的、以前未知的、具有潜在应用价值的信息的过程。数据挖掘是知识发现(KDD)最核心的部分。数据挖掘与传统分析工具不同11的是数据挖掘使用的是基于发现的方法,运用模式匹配和其它算法决定数据之间的重要联系,是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息具有先未知,有效和实用三个特征。3.2挖掘HCN绩效数据的流程本课题的精髓就在于数据的挖掘,做好数据挖掘,不仅能使课题继续下去,更是课题价值的体现,是整个毕业设计的重中之重。通用的数据挖掘过程一般由三个主要阶段组成(五个部分):数据准备、数据挖掘(狭义)、结果解释,如图3.2所示。数据集成数据筛选预处理数据挖掘结果解释数据挖掘数据准备结果解释图3.2 数据挖掘的基本过程图数据准备数据挖掘所处理的数据集通常不仅具有海量数据,而且可能存在大量的噪声数据、冗余数据、稀疏数据或不安全数据等。解决数据的应用质量问题是数据挖掘的基础;充分利用有用的数据,清除虚假无用的数据是数据挖掘技术的基础。数据准备包括数据抽取、清理、转换和加载,具体包括数据的清理、集成、选择、变换、规约,以及数据的质量分析等步骤。数据挖掘在数据挖掘过程中,一般公认的数据挖掘技术大致包括:统计方法、聚类分析、决策树分类、人工神经网络、遗传算法、规则归纳、粗集理论,以及可视化技术等。统计方法作为传统数据分析的基本方法,是最成熟的数据挖掘技术之一,在数据挖掘中已得到广泛的应用。本文采用的是统计方法、人工神经网络和遗传算法相结合的方法进行数据挖掘的。结果解释结果解释指的是根据设定的目标,利用专业知识,对数据挖掘的结果进行评估和解释等。一个数据挖掘系统在完成一个挖掘算法之后,常常会获得成千上万的模式或规则。那么如何对数据挖掘步骤所获得的挖掘结果进行有效地评估解释,以便最终能够获得有(实际应用)价值的模式或规则知识?这就需要数据挖掘回答以下三个问题:什么样的模式是有价值的,一个数据挖掘算法能否产生所有有价值的模式(知识),一个数据挖掘算法能否只产生有价值的模式(知识)。数据挖掘过程是多个步骤相互连接、反复进行人机交互的过程。数据挖掘技术在化工领域的应用很广泛。近十年来,许多研究者将数据挖掘技术应用于复杂配方建模的研究,并取得了极具实用价值的研究成果,为化工配方建模和性能、成本优化提供了一种新途径,也为数据挖掘技术的应用开辟了一个新领域。3.3 HCN绩效数据预处理数据预处理是数据挖掘的前期准备工作的重点,其质量好坏直接影响到挖掘结果的优劣。一般来讲,作为数据挖掘对象的数据集有三个显著特征:数据比较脏(有噪声)、样本容量大(观测个数多)和数据维数高(变量个数多)。解决第一个问题的常用手段是数据整理;解决第二个问题的方法是数据采样;而解决第三个问题的方法是应用降维技术。HCN绩效数据中三个问题皆有。根据紫光化工HCN生产数据的特点,分别从三个特征入手,采用了一些有针对性的数据预处理方法。数据整理这方面的工作包括对记录的筛选、对变量的筛选、对数据进行小波去噪和归一化处理以及对一些特殊记录的处理。由于种种原因,生产实际数据中的缺失值现象不可避免,常用的解决办法有:直接剔除这些数据、根据经验解释或根据历史数据估值。在统计学中,奇异值的存在对数据分析影响很大,通常的处理方式是将其删除,也可将其单列出来让技术部专家决定其去留。本文先对变量进行筛选,然后对缺失值和奇异值直接删除。本文用到的变量为三种原料气的流量,而温度、压力等指标对配方建模几乎无影响,因此可以直接从汇总数据表中删除。在HCN生产过程中遇到计划停车(如表3.1所示,空白处为停车时间段)、生产调度、放假等特殊情况时,数据出现不完整,对于这类数据直接删除;由于操作人员记录时的人为错误(如表3.2所示,斜体字表示),或由于电子信号的显示滞后等,使得数据超常,对于这类数据也直接删除。表3.1 出现计划停车时的数据记录表6:0028.8 1101 24.6 1308 32.4 6572 7:0029.1 1099 24.6 1314 31.8 6586 8:0029.3 1099 25.3 1307 32.8 6314 9:0010:0011:0012:0013:0033.9 1001 31.3 1190 36.7 5987 14:0035.0 1000 31.7 1181 36.0 6015 15:0033.1 999 30.6 1192 34.8 6015 表3.2 出现人为错误时的数据记录表12:0038.9 1100 36.2 1302 39.0 6575 13:0039.7 1101 38.7 1311 40.6 6623 14:0039.9 1103 40.0 1313 41.6 6603 15:0040.1 1100 40.5 1303 41.8 6604 16:0039.7 1097 39.3 1291 40.8 558117:0039.5 1109 38.8 1309 40.0 6567 18:0037.4 1099 38.4 1310 38.3 6578 19:0034.6 1097 37.3 1309 35.0 6601 20:0032.7 1100 35.8 1309 33.9 6607 经过这样的删除数据后,再运用概率统计学中的+3准则,进一步对数据进行筛选,并绘出各变量的分布图。然后分析图中变量的取值范围,对数据进行处理,一来检查是否有超出+3范围的点,二来检查异常数据。发现有的数据明显高于左右的数据,成为“毛刺”,对这种数据直接剔除。这个过程可以用程序实现。如图3.5所示。图3.5 删除“毛刺”示意图图3.5是NH3的流量分布图,从中可以看出,确实有的点超常,经查实,有的是人为记录时的输入错误,有的是操作人员手误。由此,想到数据应该要进行信号滤波。鉴于MATLAB强大的功能和完备的工具箱,直接选用小波包去噪(wavelet package de-noising),其效果如图3.6所示。图3.6 小波包去噪后的效果图为了更清楚的看到小波包去噪的效果,现将图3.6放大,只取局部观看去噪效果,如图3.7所示。可以看出小波包去噪后数据变得很平滑。图3.7 小波包去噪效果局部图由于样本数据太大,为了便于计算,采用归一化处理。对于输入样本数据根据表2.1,采用经验值作为上下限来归一化,而目标样本HCN产量采用自身的上下限进行归一化。目标样本归一化前后的效果图如图3.8所示。(a)归一化前(b)归一化后图3.8 HCN产量分布归一化前后效果图数据采样根据实际问题确定的目标数据集可能很大,也可能并不充分,这就需要经过数据采样技术从中抽取或从数据集市中补充有意义的数据,以便下一步分析。这里的数据采样技术包括:随机抽取样本、按一定的间隔抽取样本、按聚类结果抽取样本等。本文采用按一定的间隔抽取样本的方法。在程序中按照每三行选择一组数据的原则来选取样本,得到的抽取样本曲线如图3.9所示。实现程序为:p=xlsread(HCN生产绩效数据);row,col=size(p); %获得p的行和列p1=p(1:3:row,2:4);%选取的是三种原料气的流量t1=p(1:3:row,17); %选取的是HCN产量plot(p1(:,1);图3.9 抽取样本曲线示意图数据降维数据降维的目的就是在保存尽量多的信息的前提下,寻找合适的变量或变量组合,以求在后续工作中实现高效率。在降维的同时,也可以对数据去除噪声,提出更加可用的信息。根据降维后的变量与原始数据集中变量的关系,降维技术可以分为直接从原始数据集中抽取变量和取原始数据集中变量组合两类。由于本文配方建模选取的决策变量个数较少,三种原料气的流量作为输入,氢氰酸的产量或氨的转化率作为输出,故不需做降维处理。重庆科技学院本科生毕业设计 4 基于HCN绩效数据的人工神经网络建模4 基于HCN绩效数据的人工神经网络建模4.1神经网络简介人工神经网络12(ANN),简称神经网络(NN),正是在人类对其大脑神经网络认识理解的基础上人工构造的能够实现某种功能的神经网络。它是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。它实际上是由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统。人工神经网络吸取了生物神经网络的许多优点,因而有其固有的特点:高度的并行性;高度的非线性全局作用;良好的容错性与联想记忆功能;十分强的自适应、自学习功能。4.2神经网络的应用神经网络最大特点在于它能以任意精度逼近任意非线性连续函数10,即所谓的“万能函数逼近器”。随着人工神经网络级数的发展,其用途日益广泛,应用领域也在不断拓展,已在化工领域展现出其独特之处。总而言之,人工神经网络技术可用于如下信息处理工作:函数逼近、感知觉模拟、多目标跟踪、联想记忆及数据恢复等。具体而言,其主要用于解算下列几类问题:模式信息处理和模式识别;最优化问题计算;信息的智能化处理;复杂控制;信号处理。人工神经网络是人工智能方法,利用神经元网络能够映射任意函数,它不像回归方程那样需要预先给定基本函数,而是以试验数据为基础,经过有限次的迭代计算而获得的一个反映试验数据内在联系的数学模型,具有较强的非线性处理、自组织调整、自适应学习及容错抗噪能力5,特别适用于研究HCN复杂配方建模,建立配方与HCN性能、成本之间的非线性系统。4.3基于HCN生产绩效数据的BP网络建模选用BP神经网络来建立模型,是通过多种神经网络模型的比较分析,结合HCN配方组成和HCN产量、氨的转化率之间的复杂非线性关系,最后做出的选择。BP神经网络的特点就是能够恰当地逼近输入输出之间的非线性函数关系,而在理论上改进的BP神经网络是最合理有效的建模方式之一。4.3.1多种神经网络模型比较1943年建立的第一个神经元模型MP(模拟生物神经元)模型13,即图4.1神经元模型图,为神经网络的研究与发展奠定了基础。至今,已建立了多种神经元模型,发展了上百种神经网络,取得了相当的成果,但大部分网络都是几种典型网络的变形和组合。典型的前向网络有单层感知器、自适应线性网络和BP网络等。Pnawb1图4.1 神经元模型感知器感知器实际上是在MP模型的基础上加上学习功能,使其权值可以调节的产物。它的简化结构如图4.2所示。图4.2 感知器简化结构感知器在分类问题上是有效的,它可以很好的划分线性可分的输入矢量。但是由于自身结构的制约,使其应用被限制在一定的范围内,只能用来解决简单的分类问题,不能解决“异或”问题。另外感知器还有一个缺点,当输入矢量中有一个数相比其它数过大或过小时,可能导致较慢的收敛速度。自适应线性网络自适应线性网络也是早期神经网络模型之一,它是在感知器的研究基础上建立发展起来的。它与感知器的主要不同之处在于其神经网络输出节点有一个线性激活函数,这允许输出可以是任意值,而不仅仅只是像感知器中那样只能取0或1。另外,它采用的是W-H学习算法13,14,也称最小均方差(LMS)规则对权值进行训练,从而能够得到比感知器更快的收敛速度和更高的精度。它的简化结构如图4.3所示。图4.3 自适应线性网络简化结构图自适应线性元件的主要用途是线性逼近一个函数式而进行模式联想。另外,它还适用于信号处理滤波、预测、模型识别和控制。BP网络人工神经网络按照网络拓扑结构可分为前向网络和反馈网络(Recurrent Network)两大类。前向网络的特点是:信号的流向是从输入通向输出。而反馈网络的主要不同点表现在它的输出信号通过与输入连接而返回到输入端,从而形成一个回路。误差反向传播神经网络(Back-Propagation Network,简称BP网络),是一种无反馈的前向网络,是将W-H学习规则一般化,对非线性可微分函数进行权值训练的多层网络。它是前向网络的核心部分,体现了人工神经网络最精华的部分。具有一个隐含层的BP网络的结构图如图4.4所示。输入x期望输出t网络输出y误差反传,改变连接强度输入x样本数据x,t输入x-误差图4.4 具有一个隐含层的BP神经网络BP网络经常使用的是S型激活函数和线性函数。从S型激活函数的图4.5中,可以看出是一个连续可微的函数,其一阶导数存在。对于多层网络,这种激活函数所划分的区域不再是线性划分,而是由一个非线性的超平面组成的区域。它是比较柔和、光滑的任意界面,因而它的分类比线性划分精确、合理,这种网络的容错性较好。另外一个重要特点是由于激活函数的连续可微,它可以严格利用梯度法进行推算,它的权值修正的解析式十分明确,其算法被称为误差反向传播法,也简称BP算法。BP算法是由两部分组成:信息的正向传递与误差的反向传播。在正向传播过程中,输入信息从输入经隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态。BP网络的关键在于误差反向传播过程,这个过程是通过使实际输出与希望输出之间的误差平方和最小化来实现的。 (a)带偏差的对数S型激活函数 (b)带偏差的双曲正切S型激活函数图4.5 S型激活函数图BP网络主要应用于:函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数;模式识别:用一个特定的输出矢量将它与输入矢量联系起来;分类:把输入矢量以所定义的合适方式进行分类;数据压缩:减少输出矢量维数以便于传输或存储。4.3.2选取最佳网络类型BP网络在目前的众多神经网络模型中,最具代表性的、使用的最多的是误差反向传播的多层前馈式网络,即BP网络。在人工神经网络的实际应用中,80%90%的人工神经网络模型是采用BP网络或它的变形形式12。在数据挖掘中常用的神经网络结构有多层前馈BP网络、径向基网络(RBF)、模糊网络和自组织网络(ART和SOFM)。BP网络的拟合精度高,但训练速度慢且可解释性不好;RBF网络可用于快速建模,但是他的精度不及BP网络,特别是在处理高维数据的情况下;模糊网络建模快,精度也高,但是外推性差;自组织网络是一种能自动地向环境学习以获取知识的神经网络,一般用于聚类分析。当然在数据挖掘中还不断有新的网络结构被提出10。BP网络具有以下优点16,8:网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解缺乏专家经验,难以得到确切的解析解却能够转化为模式识别或非线性映射的问题。网络能够通过学习带正确答案的实例自动提取“合理的”求解规则,即具有自学习能力,并且允许存在少数较大的误差样本甚至是错误样本。网络具有一定的推广、概括能力。对于超出训练范围内的非样本数据,经过训练的网络也能完成从输出空间到输入空间的正确映射,这种能力成为网络的泛化能力,是衡量神经网络性能的重要方面。BP网络的缺陷和改进17为:需要较长的训练时间对于一些复杂的问题,BP 算法可能要进行几小时甚至更长时间的训练。这主要是由于学习速率太慢造成的。可采用变化的学习速率或自适应的学习速率来加以改进。完全不能训练这主要表现在网络出现的麻痹现象上。在网络的训练过程中,当其权值调得过大,可能使得所有的或大部分神经元的加权总和偏大,这使得激活函数的输入工作在S型激活函数的饱和区,导致其导数非常小,从而使得对网络权值的调节过程几乎停顿下来。通常为了避免这种现象的发生,一是选取较小的初始权值,二是采用较小的学习速率,但这又增加了训练时间。局部极小值BP算法可以使网络权值收敛到一个解,但它并不能保证所求为误差超平面的全局最小解,很可能是一个局部极小解。较现实的改进方法是,训练网络使其具有足够低的可接受的误差,或者增加神经元层数,增加神经元数,还可以改变学习算法。基于以上分析和总结,虽然BP网络的缺点也是很明显的,但相对于其他方法,本课题还是采用BP网络来建立HCN配方与其性能、成本之间的非线性模型。原因有三:配方建模属于复杂非线性问题,能解决非线性问题的前馈网络就属BP网络效果最好,所以首选BP网络。BP网络的理论较完善,在配方建模方面的应用也趋于成熟。从理论和实践上都证明了BP网络能很好地完成配方建模问题。BP网络的各种改进算法,一定程度上弥补了它的不足,改善了它的性能,提高了训练和验证的精度。所以BP网络处理配方建模问题还是很恰当、实用的。4.3.3 BP网络的设计在进行BP网络的设计时,一般应从网络的层数、每层中的神经元个数和激活函数、初始值以及学习速率等几个方面来进行考虑。各自有其选取的原则。网络的层数两层神经网络足以实现任意非线性映射。生产HCN的原料气有三种,而HCN性能、成本可由HCN的产量或NH3的转化率来衡量。故网络的输入为的矩阵,输出为一行向量。本课题选取具有一个隐含层的两层神经网络,由此可知,网络采用结构。表示隐含层神经元个数。增加网络的层数主要可以更进一步的降低误差,提高精度,但同时也使网络复杂化,从而增加了网络权值的训练时间。而误差精度的提高实际上也可以通过增加隐含层中的神经元数目来获得,其训练效果也比增加层数更容易观察和调整。所以一般情况下,应优先考虑增加隐含层中的神经元数。隐含层的神经元数网络训练精度的提高,可以通过采用一个隐含层,而增加其神经元数的方法来获得。这在结构实现上,要比增加更多的隐含层简单得多。可是究竟选取多少个隐含层节点才合适,这在理论上并没有一个明确的规定。在具体设计时,比较实际的做法是通过对不同神经元数进行训练对比,然后适当地加上一点儿余量。网络隐含层节点数的选取有一个比较广的范围,不过从网络实现的角度考虑,倾向于选择较少的节点数。一般地选择原则12是:在能够解决问题的前提下,再加上1到2个神经元以加快误差的下降速度即可。选择隐层节点数的经验公式是: (4.1) 其中:为输入节点个数,为输出节点个数,为1到10之间的常数。针对本文取值范围为312,在具体分析时可以适当加大范围。分别取隐含层神经元个数为S=3,4,5,20,训练神经网络,得到训练过程和验证过程的均方误差,如表4.1所示,然后绘制均方误差曲线图4.6。从中可以看出,随着隐含层神经元个数的增加,训练过程的均方误差基本上呈下降趋势,而验证过程的均方误差先降低后又上升。综合考虑的话,还是选取S=11。表4.1 选取隐含层神经元个数训练与验证表隐含层神经元个数训练SSE验证SSE训练MSE验证MSE31.58151.55260.0015280.001541.38481.37630.0013380.0013351.39171.43720.0013450.00138961.26791.32060.0012250.00127671.28021.3010.0012370.0012

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论