(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf_第1页
(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf_第2页
(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf_第3页
(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf_第4页
(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(控制理论与控制工程专业论文)数据挖掘技术在热风炉系统中的应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 近年来,随着计算机技术、网路技术及数据处理等技术的发展,特别是数据库 技术的应用和普及,在各个领域都积累了大量的数据。即使在一个企业,随着工业 企业自动化程度的提高,企业中都储有数以几十或几百g b ( 1 0 9 字节) 计的生产经营 数据。这些数据蕴含着大量的信息和知识。8 0 年代术才起步的数据挖掘技术与决策 支持系统相依相辅,数据挖掘技术采用全新的数据组织方式,对大量的原始数据进 行各种处理并转换成有用的信息,用户可以通过分析这些信息从而作出策略性决 策。本文系统介绍了数据挖掘的特点,国内外发展现状、体系结构,挖掘算法等, 详细介绍了一种数据挖掘算法,即基于实例的推理方法( c b r ) ,对它的基本原 理,系统组成,及其关键技术进行了讨论,尤其在c b r 系统中,对权重系数的确定 方法进行了比较。该应用研究的目的是为了将数据挖掘技术应用于复杂工业过程控 制中,从海量数据中提取有用的知识、规则,以新的视角为复杂工业过程系统的监 控开辟新的途径。 本文在对以上研究的基础上,结合复杂工业领域数据挖掘的模型将基于实例的 推理( c b r ) 方法应用于热风炉自动控制系统中。实现热胍炉自动控制的目的是为 了提高高炉热风炉的热风温度,降低炼铁生产成本,节约能源。而提高热风炉的热风 温度的关键之一是能通过有效手段提前对刚结束燃烧期的热风炉的送风温度趋势加 以准确预测。本文详细阐述了热风炉自动控制的研究现状,比较了国内外对热风炉 热风温度预测的方法。进而提出并详细介绍了利用c b r 方法对刚结束燃烧期的热风 炉的送风温度趋势进行预测的具体过程,包括利用人工神经网络方法确定热风炉系 统中各特征属性的权重系数。预测结果表明,这是一种实用有效的热风温度预测手 段,和基于数学模型的方法相比,具有算法简单、结果准确等优点。 图1 0 表8 参5 5 关键词:数据挖掘;基于实例的推理方法;权重;热风炉;预测 分类号:1 1 p 1 8 河j b 理:j :大学硕士学傅论文 a b s t r a c t i nr e c 锄ty e a r s ,诵t ht 1 1 ed e v e l o p l e n to fm o d e mc o m p u t e rs c i e n c e ,n e 抑o r ka n dd a t a p r o c e s s i n gt e c h n i q u e ,t l l e r ea r c 锄o u n t so fd a t ai ne a c hf i e l d e v e ni na ne n t e 叩r i s e ,a l o n g w i t ht h ei n c e n s e m e n to f t l ”i n d u s 田a u t o m a t i o n ,i th a ss a v e ds e v e r a l1 0g bo rs e v e r a l1 0 0 g bp r o d u c t i o na i l dm a i l a g e m e md a t a t h e s ed a t ac o n t a i n sag r e a td e a lo fi 1 1 f b r n l a t i o n 锄d k n o w l e 电e d a t am i n i n gt e c h i l i q u cw h i c hj u s tb e 百n sa tt h ee n do f8 0 sd e p e n d so n m u t u a l l yt h ed e c i s i o na n ds u p p o r ts y s t e m d a t am i l l i n gt e c m q u ea d o p t sa l ln e wd a t a o 唱a l l i z a t i o nm e m o d ,a i l dc 删e so nv a r i o i l sp m c e s s i n gd a 协a n dt l l e nc o n v e nt ot l l e i n g r e a tq u a l l t i t i e so fu s e 如li n f o 瑚a t i o n 1 1 1 eu s e rc a na t l a l y s i st h i si n f b 蛐a t i o na i l dt l l e n m a k eas 昀t e g yd e c i s i o n t i l i sp a p e ri n t m d u c et h ec h a r a c t e r i s t i c s ,p r e s e n td e v e l o p i i 培 c o n d i t i o no f d o m e s t i ca i l di i 此m a t i o n a i ,t h es y s t e ms t n l c t u r ea n dt 1 1 ea s t l l m a 士i c so f t h ed a t a m i n i n g t 1 l e ni td e t a i l e di n 扛d d u c et l l cm c 廿l o do fc a s e - b a s e dr e a s o n i n g ( c b r ) ,ak i n do f d a 忸m i n i n g sa s m m a t i c s i tc o n t a i n sc b r sb a s i cp r i n c i p l e ,t h es y s t e m sc o n s t i t u t e ,a n d i t sk e yt e c 蜥q u e sc 枷e do nm ec b r ss y 曲n p a n i c l l l a d y ,i n 也es y s t 锄o fc b r ,t l l i s p a p e rc a r r i e so nt h ec o m p a r i s o nt ot h em e t h o d so fd e t e 衄血i r i gt h ew e i g h t i n gc o e 任i c i e n t t h ep u r p o s eo ft l l i s a p p l i c a t i o ns t u d yi sf o ra p p l y i n gd a 协m i n i n gt e c h i l i q u et om e c o m p l i c a t e di n d u s 仃yp m c e s s i n gc o n 的l ,f o rw i t b d r a w i n gt h eu s e f mk n o w l e d g e 趾dr u l e 丘d mt l l e 锄o i l l l to f s e ad a t a ,a 1 1 df o rd e v e l o p i n gm en e wp a i l l 埘t l ln c wa n 出eo fv i e wf o r t i l ec o n 扛d lo f 也ec o m p l i c a t c di n d u s t i yp m c e s s i n gs y s t e m t h i sp a p e rc o m b i n e sm cd a t am i n i n gm o d e lo ft h ec o m p l i c a t e di n d l l s y6 e l d 跚l d a p p l i e sm em e u l o do fc b ri n 恤锄t o m a t i o nc o n t r o lo fh o tb l a s ts t o v e 1 1 1 ep u r p o s et l l a t c 枷e so u tt l l ea u t o m a 6 0 nc o m r o lo f h o tb l a s ts t o v ei st or a i s et l l eb l a s tt e m p e r a t t l f e ,l o w e r t l l ep m d u c t i o nc o s to f i r o n ,a i l dc c o o i i z ct h ee n e r g y b u to n eo f 山ek e yf a c t o r so fr a i s i n g t l l eb l a s tt e m p e r a t i l r ei sa d v a n c e dp r e d i c t i r 培b l a s ta i rt e m p e r a 加r eo fm es t o v ej l l s t t e 姗i n a t e di t so n g a sp h a s e t h i sp a p e rd 捌l e de l a b o r a t e sm er e s e a r c hp r e s e n tc o n d i t i o n o ft h eh o tb l a s ts t o v e ,a n dc o m p a r e st l l em e t t l o do fp r e d i c 廿n g l eb l a s ta i rt e m p e r a t i l r ei l l d o m e s t i c 锄di n 蛔:1 1 a t i o n a lr e s e a r c h t h c ni tp u t sf o n v a r da l l dc o n c f e t e l yi 曲r o d u c e st h e p m c e d u r eo f a p p l ) ,i n gt l l em e t l l o db 船c do nc b r t op r e d i c tt h eb l a s ta i rt e m p e r a t u r ep m n l e , i n c l 戚n gm a k i n gu s eo fm ca n i i a in e m ln e 柳o r k ( a n n ) m e m o dt od e t e r i n 沁m e w e i 曲t i n gc o e m c i e n ti nh o tb l a s t 蛐m ss y s t e mb a s e d0 nc b r n 把r e s u l to fp r e d i c t i n g s h o w sl l l i sc b rm e t b o di se 髂i e rt ob ei m p l e m e n t e dm a nm eo t h e rm a t h e m a t i c a lm o d e l m e t b o d s 锄di t sp r c d i c t i o np r e c i s i o ni sq u i t es a t i s f i e d f i g u r e 1 0 ;t a b l e8 ;鼬f b r e n c e5 5 k e y w o r d s :d a t am i n i n g ,c a s eb a s e dr e a s o n i n g ,w e i g 始n gc o e 伍c i c n t ,h o tm a s ts t o v e , p r e d i c t c h i n e s eb o o k sc a t a l o g :t p l 8 独创性说明 本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得 河北理工大学或其他教育机构的学位或证书所使用过的材料。与我一同 工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表 示了谢意。 签名:盈蛔嘲且年鲫 关于论文使用授权的说明 本人完全了解河北理工大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学 校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复 制手段保存论文。 ( 保密的论文在解密后应遵循此规定) 签名:j 垒连宴 导师签名:趣日期:里色年生月翌日 引言 数据是一种宝贵的资源,就像矿减一样,必须经过挖掘、提炼爿能使潜在的资 源变成财富【1 1 2j 。数据挖掘的历史虽然较短,但从2 0 世纪9 0 年代以来,它的发展 速度很快,目前,它一经广泛应用于商业、金融、保险、军事等领域。随着计算机 技术的发展和工业企业自动化程度的提高,即使是发展中的我们中国,在一个企业 中有数以几十或几百g b ( 1 0 9 字节) 计的生产经营数据己不是什么稀奇的事情了。这 些数据中包含着各种工业过程参数和产品质量指标记录等1 3 】。这些堆积如山的数据 无异于一个巨大的宝库。如果数据仅仅表现为存储,那么不经过任何分析和处理的 原始数据对人们般是没有直接价值的,因此能否经过分析、推理从海量数据中挖 掘出对企业具有指导意义的信息和知识已经成为人们迫切的需求,如何将数据挖掘 技术应用到过程控制中,寻求一种针对复杂工业过程控制对象的新的控制技术和方 式已经成为热点研究问题。目前数据挖掘己成为国际上信息决策领域最前沿的研究 方向之,具有1 j 分广阔的应用前景。 基于实例的推理( c a s e b a s c dr e a s o n i n g ,简称c b r ) 是人工智能领域中较新崛起 的一种重要的基于知识的问题求解和学习的方法,它以其独特的推理风格和成功的 应用,向人们展示了很强的生命力,它是根据过去的成功的或失败的实例来推导出 新问题的解,它是一种知识库同推理机融为一体的新的推理技术。它以其独特的推 理风格和成功的应用,向人们展示了很强的生命力,在国际a i 界引起了广泛的兴 趣。 本文首次利用数据挖掘技术结合c b r 方法应用于热风炉自动控制系统对热风温 度变化趋势进行预测对热风炉自动控制提供控制决策。 河北理l 一人学硕十学位论文 1 1 研究背景 1 1 1 数据挖掘技术综述 l综述 在过去的几十年中,计算机硬件持续、稳定、及其惊人的进步导致了功能强大 的计算机、数据收集设备和存储介质的大量供应。这些技术大大推动了数据库和信 息产业的发展,使得大量的数据库和信息存储用于事务管理、信息检索和数掘分 析。 数据库系统特别是关系数据库系统的成功,使我们有了强有力的事务处理l 具。在计算机的辅助下,人们可以将传统的事务处理做得更好。当然人类不会满足 于仅仅让计算机进行事务处理。人类不断地将数据库技术应用到更j 。泛的领域,导 致了对时问数据库、空间数据库、多媒体数据库、工程数据库、统计数据库等面向 特殊应用的数据库系统的研究与开发。各种各样的数据库系统的开发,商务、科学 和行政事务的计算机化,以及由文本和图像扫描平台到卫星遥感系统的数据收集工 具的进步,使得更多的数据以前所未有的速度收集到计算机中。进入九十年代,伴 随着因特网( i n t e m e t ) 的出现和发展,以及随之而来的企业内部网( i n t r a n e t ) 和企业外 部网( e x t r a n e t ) 以及虚拟私有网( v p n ,v i n u a lp r i v a t en e t 、v o r k ) 的产生和应用,将整个 世界联成一个小小的地球村,人们可以跨越时空地在网上交换数据信息和协同工 作。这样,展现在人们面前的己不是局限于本部门,本单位和本行业的庞大数据 库,而是浩瀚无垠的信息海洋,数据洪水正向人们滚滚涌来。当数据量极度增长 时,如果没有有效的方法,人们也会感到面对信息海洋像大海捞针一样束手无策。 据估计,一个大型企业数据库中数据,只有百分之七得到了很好的应用。这样,相 对于“数据过剩”和“信息爆炸,人们又感到“信息贫乏”和“数据天在牢笼 中”,卜= 如j o h nn a i s b i n 在大趋势一书中所说“w ea r ed r o w n i n 2i ni n f o 肌a i i o n , b u ts t a r v i n gf o rk n o w l e d g e ”。存储数据的爆炸性增长,没有强有力的数据分析工 具,要理解这些数据己经远远超出了人的能力,这样决策者往往根据自己的直觉作 决定,而不是基于丰富的历史数据,因而导致决策的低效甚至失误1 4 “。人们希望计 算机帮助我们分析数据、理解数据,帮助我们基于丰富的数据作出决策,作出人力 所不能及的事情。现实的需求导致技术的进步,正是这种需求导致了数据挖掘研究 一2 一 l 综述 的蓬勃开展,人们利用数据挖掘技术消除数据和信息之间的鸿沟,将数据坟墓转换 成知识“金块”。数据挖掘是自动的模式提取,这些模式代表隐藏在大型数据库、 数据仓库或其它大量信息存储中的知识。在实际中,人们往往不严格区分数据挖掘 和数据库中的知识发现,把两者混淆使用。人们把原始数据看作是形成知识的源 泉,就像从矿石中采矿一样。原始数据可以是结构化的,如关系数据库中的数据, 也可以是半结构化的,如文本、图形、图像数据,甚至是分布在网络上的异构型数 据。发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是 归纳的。发现了的知识可以被用于信息管理、查询优化、决策支持、过程控制等, 还可以用于数据自身的维护。因此,数据挖掘是一门很广义的交叉学科,它汇聚了 不同领域的研究者,尤其是数据库、人工智能、数理统计、可视化、并行计算等方 面的学者和工程技术人员。近年来,数据挖掘引起了信息产业界的极大关注。 数据挖掘技术从一开始就是面向应用的。目前,在很多重要的领域,数据挖掘 都可以发挥积极的作用。尤其是在银行、电信、保险、交通、零售等商业应用领 域。数据挖掘能够帮助解决许多典型的商业问题,其中包括:数据库营销( da _ 油船e m a r k e 6 n 曲、客户群体划分( c u s t o m e rs e g m e n t a t i o n & c i a s s i f i c a t i o n ) 、背景分析 ( p r o f i l ea a i y s i s ) 、交叉销售( c r o s s s e l l i n g ) 等市场分析行为,以及客户流失性分析 ( c h 啪a n a l ”i s ) 、客户信用评分( c r e d i t s c 硎n g ) 、欺诈发现( f r a u d d e t e c t i o n ) 等等。 1 1 ,2 常用的数据挖掘方法 数据挖掘的一个重要的技术基础是人工智能,但数据挖掘仅仅利用了人工智能 中一些成熟的算法和技术,从不同的角度看,数据挖掘有多种分类方法,如根据发 现的知识的种类、挖掘的数据库类型、挖掘方法、挖掘的途径等进行分类。目前, 常用的数据挖掘方法包括“:决策树方法( d e c i s i o nt r 优s ) 、神经网络方法( a n i f i c i a l n e u r a ln e t w o r k s ) 、粗糙集( r o u g l ls e t ) 方法、邻近搜索方法( n e a r e s tn e i g l l b o r m e t h o d ) 、基于规则的推理( r i 】1 eh l d u c t i o n ) 、遗传算法等。 1 决策树方法 利用信息论中的互信息( 信息增益) 寻找数据库中具有最大信息量的字段,建立 决策树的一个结点,再根据字段的不同取值建立树的分支;在每个分支集中重复建 立树的下层结点和分支的过程,即可建立决策树,从而可从中生成分类规则,并利 用规则和决策树生成复杂的知识结构。 2 神经网络方法 3 。 河北理:【:大学硕十学位论文 神经网络方法是基于生物神经系统的结构和功能而建立起来的模拟人脑神经元 方法,以m p 模型和h e b b 学习规则为基础,可以建立三大类神经网络模型: 1 ) 前馈式网络。它以感知机,反向传播模型,函数型网络为代表,可用于预 测,模式识别等方面。 2 ) 反馈式网络。它以h o p f i e l d 的离散模型和连续模型为代表,分别用于联想记 忆和优化计算。 3 ) 自组织网络。它以a r t 模型,k o h o l o n 模型为代表,用于聚类。基于神经网络 的数据分类通常具有较小的分类误差和对噪声较强的鲁棒性,其应用过程的关 键性问题为:网络的构建和训练,根据属性的数目和类型的数目可以确定相应 的网络输入输出模式,并形成合适的网络结构;网络删减,在不影响分类误差 的前提下,去除多余的网络节点和链接。经过删减的网络可以提供简洁和有意 义的分类规则;规则提取,即从经过删减的网络中提取分类规则。 3 粗糙集( r c i u 曲s e t ) 方法 在数据库中将行元素看成对象,列元素看成属性( 分为条件属性和决策属性) 。 等价关系r 定义为不同对象在某几个( 或几个) 属性上取值相同,这些满足等价关系 的对象组成的集合称为等价关系r 的等价类。条件属性上的等价类e 与决策属性上的 等价类之间有3 种情况:下近似:y 包含e ;上近似:y 和e 的交非空:无关:y 和e 的 交为空。对下近似建立确定性规则,对上近似建立不确定性规则( 含可信度) ,对无 关情况不存在规则。 4 基于实例的推理( c b r ) 的方法 运用已有的实例来构造一个近似模型,或者说是根据已有的类似例子对新的问 题进行预测求解。基于实例的方法要求提供一个评价数据之间距离的度量标准。此 外,该方法和非线性回归方法一样,具有很强的近似表示能力。 一般地,c b r 用在d m 中有两个方法,一是使用c b r 技术作为知识发现过程 的环境以用于数据挖掘操作,二是向c b r 过程提供信息以便取得更好的挖掘效果。 具体地如下: 1 1d m 的搜索过程本身作为实例:d m 只是k d d 过程中的一个步骤,d m 搜索 也是很费时的。关于搜索结果的信息和整个k d d 过程可以存储在实例库中, 以便相同信息的挖掘只进行一次。d m 的方法学就是提供一个获取和重新使用 以往经验的框架。在这一点上,c b r 方法是非常符合嘶的技术目标的。 4 1 综述 2 ) c b r 提供信息:c b r 可以用来提供一些关于数据库特征项的背景知识,如分 类器重特征项的权重可以用c b r 工具来学习。c b r 还可以用来为d m 算法提 供应用时的实用性、参数、精确度和新颖性的度量计算函数。 5 遗传算法 这是模拟生物进化过程的算法,由3 个基本算子组成:繁殖( 选择) 。是从1 个 旧种群( 父种选出生命力强的个体,产生新种群( 后代) 的过程。交叉( 重组) 。选择 两个不同个体( 染色体) 的部分( 基因) 进行交换,形成新个体。变异( 突变) 。对某 些个体的某些基因进行变异( 1 变o ,o 变1 ) 。这种遗传算法可以起到产生优良后代的 作用。这些后代需满足适应度值,经过基若干代的遗传,将得到满足要求的后代( 问 题的解) 。遗传算法已在优化计算和分类机器学习方面显示了明显的优势。 6 聚类 聚类是人类认识未知世界的一种重要的认知手段。在生产和生活中,人们往往 面对非常复杂的事和物,如果能够把相似的东西归为一类,有明显区别的事物分属 在不同的类别中,处理起来就大为简便。正所谓“物以类聚,人以群分”。聚类是 数据挖掘的一类重要技术。它是一种在无导师的情况下,根据样本问的相似程度自 动地进行分类的方法。聚类分析已经广泛地用在许多应用中,包括模式识别,数据 分析,图象处理,以及市场研究4 ,5 。传统的统计聚类分析方法有k 一均值、k 一中心 点等。目前许多著名的统计分析和数据挖掘软件如s p s s 、s a s 等都已加入这些聚类 工具。 就数据挖掘功能而言,聚类能够作为一个独立的工具获得数据的分布状况,观 察每一簇数据的特征,集中对特定的聚簇集合作进一步的分析。聚类分析还可以作 为其它数据挖掘任务( 如分类、关联规则等) 的预处理步骤。 1 1 3 基于实例的推理技术c b r 概述 c b r 是近十几年来人工智能( a i ) 中发展起来的区别于基于规则推理的一种推 理模式,它是指借用旧的事例或经验解决问题、评价解决问题、解释异常情况或理 解新情况。c b r 兴起的主要原因是传统的基于规则的系统存在诸多的缺点,如:在 知识获取问题上存在困难,对于处理过的问题没有记忆,导致推理效率低下,不能 有效地处理实例外情况,整体性能较为脆弱,等等,而c b r 恰好能解决以上问题。 实例的定义是:实例是一段带有上下文信息的知识,该知识表达了推理机在达到其 河北理工人学硕士学位论文 目标的过程中能起关键作用的经验。在c b r 中,把当前面临的问题或情况称为目标 实例,而把记忆的问题或情况称为源实例。 c b r 很接近人类的决策过程,专家每当遇到一个问题时,他总是首先在头脑中 回想一下过去曾解决过的类似问题,从中获得对当前问题的求解思路。它的最好的 例证就是:我们在看病时,喜欢找有经验的老医生或者专家给我们看病,尽管刚毕 业的年轻医生有着最新的诊断和医疗知识,而且比有经验的老医生有着更多的医疗 前沿知识,但我们更愿意选择老医生或专家看病,因为老医生或专家以前大都看过 或治疗过许多类似的病例,从本质上讲,我们考虑医生的经验时,更多的是根据他 们曾经处理过多少病历作为主要的判断依据。 在实现自动或半自动的设计过程中,人们较多采用的方法是基于规则的方法, 但是,每当要把设计经验形式化成规则,即要获取设计知识时,就显得很困难了。 c b r 技术的进展给设计者提过了启迪:可以把c b r 的思想和方法用之于设计领域, 因为设计是一个典型的运用过去设计实例解决现行问题的领域。 c b r 技术和基于规则( r b r ) 、基于模型( m b 砌的推理技术相比很好的支持了经 验的表示和存储,包括那些无法用规则和模型表示的经验。c b r 比砌j r 、m b r 具有 如下潜在的优势: 1 获取知识就是获取或收集以往的实例( c a s e ) ,很好地支持了经验的表达,这 样就避开了“知识获取瓶颈的问题” 2 c b r 无需精确的领域模型,即使在无法得到领域模型时也能进行推理,使得 它的应用范围更为广泛。 3 c b r 系统能够很快提供一个解决方案,从而避免了每次都是从头再来。 4 每当获取一个实例,c b r 系统能反映出使用者的经验来,在解决下一次问题 时就多了一个参照实例。当实例库很大时,解决新问题时就很方便。 5 c b r 系统能够把新的知识转化为实例而存储在实例库中,实现自学习的过 程。 6 用先进的数据库技术,使实例查找和大量的实例管理更加方便,系统维护较 为容易。 c b r 技术在国外发展已经有几十年的历史,己经在医疗诊断、软件重用等很多 领域内得到发展,解决的问题也越来越复杂。在国内,c b r 用于广告设计、故障诊 断、医疗诊断等方面己有一些进展,但还有待于进步完善和发展。 一6 一 综述 1 1 4 热风炉简介 在高炉炼铁生产过程中,需要向高炉内鼓入大量的助燃空气,以促进高炉内炼 铁反应的进行,由于高炉内部温度很高,鼓入常温空气将会导致高炉内部温度急剧 下降,不利于炼铁反应的进行,因此需要鼓入高温的空气,热风炉就是这样一种提 供高温热风的大型设备。 热风炉最早于1 8 2 8 年在美国丌始使用,当时采用的是管式热交换器,构造很简 单,用煤作燃料,烧煤加热铁管,空气从灼热的铁管中通过后受热成为热风送给高 炉,热风温度只能达到3 1 5 0 c ,但高炉炉况有显著改善,产量提高,焦比降低3 5 。 随着高炉技术的发展,从1 8 5 7 年开始,逐渐使用蓄热式热风炉来代替换热式热风 炉,蓄热式热风炉最初也使用煤作燃料,后来开始使用煤气作为热风炉的燃料。按 照燃烧室和蓄热室的布置不同,蓄热式热风炉分为内燃式、外燃式、顶燃式三种。 目前普通内燃式热风炉仍占绝大多数。这种热风炉当拱顶温度不高于1 3 2 0 0 c ,风温 为9 8 0 l 1 1 0 0 0 c 时,使用良好。但是随着风温和风压的提高,这种热风炉就不能适应 生产的需要。国外2 0 世纪6 0 年代推广外燃式热风炉,日本、德国等还普遍采用陶 瓷燃烧器,风温可达1 3 0 0 1 3 5 0 。c 。所以,目前采用外燃式熟风炉己成为提高风温的 主要途径。新建大型高炉大多采用外燃式,中型高炉则内燃式、外燃式并存。 1 1 5 热风炉提高风温的重要性 在高炉炼铁生产中,热风炉的送风风温是高炉生产中的一项重要指标。高炉炼 铁使用高风温是当今世界炼铁技术发展的方向。高风温是强化高炉冶炼、降低焦 比、增加生铁产量、提高生铁质量和降低生铁成本的有效措施之一。热风温度每提 高1 0 0 可降低焦比2 0 一2 5 公斤吨铁,同时可增产3 一5 ,还可允许增加喷吹煤粉4 0 公斤吨铁,或增加喷吹重油2 5 公斤吨铁,相应地进一步降低焦比。提高风温给高 炉带来的益处表现为:由热风炉带入高炉的热量在高炉内能全部被利用,提高风温 可提高炉炉缸温度,使炉缸热量充沛,改善炉缸工作状态。高风温对增加煤粉喷吹 量、改善煤粉燃烧效果具有积极意义,是氧煤强化炼铁的必要条件。高风温是炼铁 工艺技术发展的重要组成部分,是推动炼铁技术进步和产生巨大经济效益的有效途 径。因此,国内外都在努力提高热风炉的风温。 7 一 河北理二 大学硕+ 学位论文 1 1 6 高炉热风炉控制的意义 热风炉是炼铁生产过程中的重要设备之一,它供给高炉的热量约占炼铁生产中 耗热的四分之一,它消耗的高炉煤气约占高炉产生的煤气的一半,因此提高热风炉 的热效率对降低能耗具有很大现实意义。 现代高炉都是大型化高炉,要求热风炉稳定地提供规定风温和风量的热风。热 风炉也是耗能大的设备,故其有效操作是至关重要的,而满足其高风温条件下实现 热风炉系统的全部自动化则尤为关键。热风炉自动控制是保持热风炉生产连续稳定 进行的重要手段,实现良好的热风炉过程控制,对于提高热风炉热效率,优化热风 炉操作,延长热风炉寿命,提高热风温度,保障向高炉供给连续的、风温稳定的高 温热风,具有重要意义。目前先进国家高炉的热风温度已达到了1 2 0 0 以上,且呈 不断上升趋势。因此,实现稳定可靠的热风炉自动控制,对于强化冶炼,降低焦比 有着十分重要的现实意义。 1 1 7 热风炉控制系统发展的概况及趋势 自2 0 世纪7 0 年代以来,由于高炉的大型化需要高风温和较大风量,因此要求热 风炉提供稳定的、满足高炉生产需要的、具有一定温度和流量的热风,而且要节省 能源,所以发达国家的热风炉都装有完善的自动化系统。国际上通用的热风炉全自 动化系统是以完善的基础自动化加上数学模型或智能控制组成的,但基础自动化所 设置的仪表和控制回路较多,特别是要在四个热风炉中设置,故投资相当大,至于 设置数学模型,需要设置自动分析加热煤气各种成分的分析器,这种仪器比较昂贵 且需要良好的维护,很多工厂难以实现所以要使数学模型有效,要求有良好的完善 基础自动化。因此,数学模型虽然有效,但在国内除宝钢以外,很少有工厂设置并 得到应用的。 目前,国内很多大型钢铁厂的大型高炉大都使用较简单的系统,即只有煤气总 管压力控制和煤气及空气调节阀位或流量自动控制,然后人工控制阀位或流量的设 定值或开度。人工控制,不但需要专人操作,且难以在热风炉整个燃烧时期各个阶 段及时设定煤气和助燃空气流量,也难以在预热煤气和空气温度变化时、高炉所需 鼓风温度和流量变化时、助燃空气压力变化时、热风炉蓄热量尚有富裕时,一一及 时修正热风炉加热的煤气和空气量,因而达不到节能和优化热风炉操作的目的。故 要面对我国的操作和自动化以及维护水平的实况,而需要开发适合于我国的实际情 8 一 1 综述 况的,成本较低的且便于推广的热风炉自动控制系统。 1 2本文的工作和研究意义 1 2 1 本文的工作 提高热风炉送风温度的一个有效途径就是克服人为因素的影响,采用热风炉的 自动控制。而实现有效的热风炉的自动控制,其关键之一就是能够提前对刚结束燃 烧周期将要进入送风周期的热风炉的送风温度加以准确预测。本文首次利用数据挖 掘技术结合c b r 方法应用于热风炉系统对送风温度变化趋势进行预测,这是调节处 在燃烧的后半段、将要进入送风阶段的热风炉燃烧状态的重要依据。本文详细介绍 了应用c b r 技术实现热风温度趋势预测的方法,给出了c b r 预测初始实例库的构 造、实例库的组织和实例检索方法,同时尝试了应用人工神经网路方法确定热风炉 风温预测c b r 系统中的各特征属性权重系数的方法,最后给出了预测过程的具体步 骤,以及2 个热风温度预测的实际例子。预测结果表明,这是一种实用有效的热风 温度预测手段,和基于数学模型的方法相比,具有算法简单、结果准确等优点。现 代工业生产过程中广泛存在以计算机为核心的各种控制系统,使得能够采集存储大 量关于工业生产过程的历史和当前运行状态的丰富有价值的数据,包括产品质量变 量、过程变量、设备状态等。以往人们往往过分重视控制算法的开发,而忽视了对 系统运行中有关操作人员的行为特征、经验、设备状态及生产过程状态的大量数据 的全面分析利用,更难从中发现知识。数据挖掘技术的产生为解决这些问题提供了 强有力的工具。将数据挖掘技术应用于工业过程控制中,从海量数据中提取有用的 知识、规则,以新的视角为复杂工业过程系统的监控开辟新的途径。 1 2 1 本文的研究意义 热风炉是高炉炼铁生产中的重要设备,它承担着将燃烧煤气所产生的热量传递 到高炉鼓风的关键作用。热风炉系统在高炉炼铁中,不同于其它系统,从炼铁生产 的发展历史可以看到,热风炉生产在整个高炉生产中占有重要的地位,它生产高温 热风,是高炉强化冶炼、降低焦比的主要措施,其优劣直接影响着高炉生产的各项 指标,其生产的稳定性、可靠性、安全性在高炉生产中居首要地位。经过一段时间 的运行,热风炉控制系统已经存储了大量的历史数据和趋势,这些数据中蕴含着丰 富的经验( 成功的调节) 和教训( 失败的调节) ,从另一角度看,经过一段时间的 9 - 河北理l 人学硕十学位论文 摸索和尝试,操作工也会掌握一些燃烧控制的诀窍和技巧,通过及时、准确和认真 地调节煤气量和空气量,也能达到较好的控制效果。因此,已经积累和记录下来的 大量历史数据,以及这些数据中所蕴含的客观控制规律,则为将c b r 技术应用于热 风炉控制打下了十分坚实的基础。 一l o 2 数据挖掘技术 2 1 数据挖掘概述 2 1 1 数据挖掘的定义 2 数据挖掘技术 数据挖掘最早是在1 9 9 5 年,美国计算机年会( a c m ) 上提出的概念,数据挖掘 ( d a t am i n i n g ,简称d m ) 就是从大量的、不完全的、有噪声的、模糊的、随机的数 据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过 程。它是一门交叉性学科,涉及机器学习、模式识别、统计学、智能数据库、知识 获取、数据可视化、高性能计算、专家系统等领域。 2 1 2 数据挖掘的任务 数据挖掘的两个高层次目标是预测和描述,前者指用一些变量或数据库的若干 己知字段预测其它感兴趣的变量或字段的未知的或未来的值;后者指找至q 描述数据 的可理解模式f 8 】。 挖掘后获得的知识包括关联规则、特征规则、区分舰则、分类规则、聚类规则、 总结规则、偏差规则、序列规则、模式分析和趋势预测等【8 。 2 1 _ 3 数据挖掘的特点 1 处理的数据规模十分庞大,达到g b 、t b 数量级; 2 与其它学科有很强的联系,是交叉学科; 3 。对数据进行前端处理,查询需要靠系统本身寻找可能感兴趣的东西 4 数据变化迅速,要求快速作出相应反应,随时提供决策支持: 5 规则的发现不必适用所有数据,当达到某一临界值时,即认为有效 6 规则是动态的,需要随时对其进行更新【s l 。 2 1 4 数据挖掘的方法和技术 数据挖掘的几种常用的方法有:人工神经网络;遗传算法;决策树方法;统计 分析方法;模糊论方法;覆盖正例排斥反例方法;集合论的粗集方法;概念树方 法;公式发现;规则归纳;聚类分析和模式识别;最近邻技术:可视化技术等。 河北理:l :大学硕十学位论文 2 1 5 数据挖掘研究和应用所面临的挑战 数据挖掘研究和应用所面临的挑战如下【1 m 1 1 l : 1 挖掘算法的效率和可扩放性; 2 待挖掘数据的时序性; 3 互联网络上的知识发现; 4 和其它系统的集成。 2 1 6 数据挖掘的过程 数据挖掘的整个过程可分为三个阶段1 21 3 】:数据准备,挖掘操作,结果表达和 解释。见图1 示。并且在整个挖掘过程中,离不开用户的参与,整个过程是个反复 精炼的过程。 图1 数据挖掘的过程 f i g1 p r o c e s so f d a 纽m i n i n g 1 数据准备 这个阶段又可进一步分成三个子步骤1 4 】:数据集成、数据选择、数据预处理。 数据集成将多文件或多数据库运行环境中的数据进行合并处理,解决语义模糊性, 处理数据中的遗漏和清洗脏数据等。数据选择的目的是辨别出需要分析的数据集 合,缩小处理范围,提高数据挖掘的质量,预处理是为了检查数据的完整性和一致 性,对噪音数据进行统计处理,丢失数据用统计方法补充。 1 2 2 数据挖掘技术 2 挖掘操作 根据数据挖掘的目标和数据的特征,选择合适的挖掘算法。 以下是常见和应用最广泛的算法和模型: 决策树方法、神经网络方法、粗糙集方法、邻近搜索方法、基于规则的推理、 遗传算法等。在第一章中已有详细介绍。 3 表达和解释 对数据挖掘的结果进行评价,选择最优的模型,作出评价,使用可视化和知识 表示技术,向用户提供挖掘的知识,运用于实际问题,并且要和专业知识结合对结 果进行解释。 对于以上数据挖掘的过程需要说明以下几点: 1 ) 数据挖掘质量的好坏受两个因素的影响: 一是所采用的数据挖掘是算法的有效性,二是挖掘的数据的质量和数量( 数据 量的大小) 。如果选择了错误的数据或不适当的属性,或对数据进行了错误的转 换,则有可能得到不正确的挖掘结果,即所谓的g a r b a g ei ng a r b a g eo u t 。所以,数 据预处理对于数据挖掘来讲也是非常重要,同时,数据预处理也是数据挖掘中的一 个重要研究课题。 2 ) 整个挖掘过程是一个不断重复的过程。 假如用户在挖掘过程中发现选择的属性或数据有偏差,或者使用的挖掘技术产 生不了预期的结果,这时就需要根据反馈结果,不断重复先前的过程,甚至从头重 新开始,最终得到令人满意的挖掘结果。 3 1 可视化在数据挖掘的各个阶段都扮演着重要的作用。 在数据准备阶段,用户可能要使用散点图、直方图等可视化统计技术来显示有 关数据,以便对数据有一个初步的理解,从而为更好地选取数据打下基础。在挖掘 阶段,用户有可能使用与领域问题有关的可视化工具,来选择挖掘算法或者调整挖 掘算法的参数。在结果表示阶段,则可能又要用到其它的可视化技术,以利于用户 对挖掘结果的理解。 1 3 河北理工大学硕十学位论文 2 2 数据挖掘技术的研究现状 2 2 1 国外研究现状 目前,国际上知识发现( k d d ) 的研究主要以知识发现的任务描述,知识评价 和知识表示为主线,以有效的知识发现算法为中心。研究重点近年来逐渐从发现方 法转向系统应用,注重多种发现策略和技术的集成,以及多种学科之间的相互渗 透。1 9 9 8 年在美国纽约举行的第四届知识发现与数据挖掘国际学术会议不仅进行了 学术讨论,并且有3 0 多家软件公司展示了他们的数据挖掘软件产品,不少软件己在 北美、欧洲等国得到应用。如针对军事领域的a d v a n c e ds c o u t 系统、针对天文学的 s c a t 系统 1 5 】、针对网管的t a s a 系统、针对健康保健的k e f i r 系统【1 6 】等。通用 数据挖掘工具则通过分析提取常规应用的共性,面对常见的数据类型和任务要求开 发具有较广适用范围的应用软件。如i b m 公司h a d e n 研究所开发的o u e s t 系统、 s g i 公司开发的m i 矾s c t 系统、s i i i l o nf m s t e r 大学开发的d b m i n e r 系统等。 2 2 2 国内研究现状 与国外相比,国内对k d d 的研究稍晚,没有形成整体力量。1 9 9 3 年以来,各 个科研单位和高校开展了对于知识发现的基础理论及其应用的研究【i ”,涉及的领域 有:数据立方体代数、模糊方法在知识发现中的应用、关联规则开采算法的优化和 改造、非结构化数据的知识发现以及w e b 数据挖掘等掣。但无论是从理论技术还 是从应用系统角度讲,都没有达到期望的速度。目前数据挖掘技术于商业、金融、 制造业、财务金融保险、通讯及医疗服务领域已有不少成功案例。 2 3 数据挖掘技术在现代工业中的应用 2 3 1 数据挖掘在现代工业中应用的重要性 近年来,随着计算机技术的发展,特别是数据库技术的应用和普及,在工业企 业中,积累了海量的数据。它们以流水形式、汇总形式以及其它各种形式存储在企 业的生产数据库中,这些数据中包含大量关于工业生产过程的过去( 历史) 和当前运 行状态( 动态) 的丰富有价值的数据( 包括,产品质量变量、过程变量、设备状态) 。 有数据表明,进入二十世纪9 0 年代,人类积累的数据量以每月高于1 5 的速度增 一1 4 2 数据挖掘技术 加,如果不借助强有力的挖掘工具,仅依靠人的能力来理解这些数掘是不可能的 ”。以往人们往往过分重视控制算法的开发,而忽视了对系统运行中有关操作人员 的行为特征、经验,设备状态及生产过程状态的大量数据的全面分析利用,更难从 中发现知识。部分原因由于系统的复杂性、处理数据量的庞大和缺乏相应的技术手 段,而d m 的产生为解决这些问题提供了强有力的工具。它可以充分利用积累的历史 数据和当前数据,提取潜在的模式、规则,以新的视角为复杂工业过程系统的监控 开辟新的途径。这使得在复杂

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论