(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf_第1页
(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf_第2页
(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf_第3页
(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf_第4页
(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(应用化学专业论文)ANN及其改进算法对大气VOCs的自动识别和定量分析.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文利用傅里叶变化红外光谱一人工神经网络( f t i n - a n n ) 联用技术。对多组分 的v o c s 进行了自动识别和定量分析,并且利用改进的a n n 方法,结合平滑基函数 最小化算法( s b f m ) 重构得到大气中各种污染物在二维平面上的浓度分布图。首先 采用模拟的光谱数据,引入逼近度的概念确定最优网络模型,避免了网络陷入局部极 小,成功地实现了单组分和多组分污染物的同时鉴勇和定量分析。然后,利用非线性 迭代偏最小二乘( n i p a l s ) 法和奇异值分解( s v d ) 法分别对网络的输入变量进行主成 分提取,结果表明,人工神经网络的训练速度显著提高,预测性髓明显改善,并且两 种方法相比,n i p a l s 法所得结果明显优于s v d 法。最后,将n i p a l s m 叮n 模型和 遥感f t i r 联用,定性定量分析了模拟的污染区域中的v o c s ,并引用s b f m 算法, 重构出了各种气体在二维平面上的浓度分布,根据重构图可以预测出v o c s 气体的扩 散范围,以及浓度的最大区域,以便及时发现污染源并采取相应的措施控制污染范围 的扩大。本研究为大气中v o c s 的定性和定量分析提供了种新途径,为工业废气等 大气污染物的在线、连续和实时监测提供了一种有效方法。 关键字:人工神经网络;遥感f t i r ;v o c s ;多组分分析;主成分分析;重构;s b f m 算法 堕室墨三查堂堡主堂竺堡壅垒巡墨苎墼垄苎鲨型查墨竺! 塑皂垫望型塑塞苎坌塑 一 a b s t r a c t 1 1 坞t e c h n i q u ec o m b i n i n gt h ea r t i f i c i a ln e u r a ln e t w o r k ( a n n ) w i t hf t i rs p e c t r o s c o p y w a sa p p l i e dt ot h es i m u l t a n e o u sr e c o g n i z i n ga n dq u a n t i f i c a t i o no fa i rv o c s i na d d i t i o n t h eg a sd i s p e r s i o ni nat w o d i m e n s i o n a lp l a n ew a so b t a i n e dw i t hi m p r o v e dn e u r a ln e t w o r k s a n dt h es m o o t hb a s i sf u n c t i o nm i n i m i z a t i o n ( s b f m ) m e t h o d f i r s t l y , t h eo p t i m u mn e t w o r k w a sd e t e r m i n e do nt h ed e g r e eo fa p p r o x i m a t i o n w h i c hm a d et h en e t w o r ka v o i do v e r f i t t i n g i tw a ss h o w nt h a tt h es i n g l ec o m p o n e n ta n dm u l t i c o m p o n e n tp o l l u t i o n sw e r e i d e n t i f i e da n dq u a n t i f i e d s u c c e s s f u l l y t h e n ,n o n l i n e a ri t e r a t i v ep a r t i a ll e a s ts q u a r e s ( n i p a l s ) a n ds i n g u l a rv a l u ed e c o m p o s i t i o n ( s v d ) w e r ei n t r o d u c e dt oe x t r a c tt h e p r i n c i p l ec o m p o n e n t s ( p c s ) ,w h i c hw e r eu s e da st h ei n p u t so fa n n r e s u l t si n d i c a t e dt h a t t h e t r a i n i n gs p e e da n dp r e d i c t i v ea b i l i t yo fa n nw e r ea ! s i g n i f i c a n t l yi m p r o v e d c o m p a r i s o nb e t w e e nt h e mi l l u s t r a t e dt h a tt h ef o r m a lm e t h o dw a sb e t t e r f i n a l l y , t h e f i e l d - m e a s u r e dp o l l u t i o na r e a si n c l u d i n gv o c sw e r ea n a l y z e dw i t hn i p a l s - a n nm o d e l a n do p e n p a t hf t i rs p e c t r o m e t e r t or e c o n s t r u c tt h eg a sd i s p e r s i o ni nat w o d i m e n s i o n a l p l a n e , t h es b f mm e t h o dw a su s e d 。n ea r 髓p o l l u t e dc a l lb ed e t e r m i n e da n dt h ef o u l e s t a r e ac a na l s ob eo b t a i n e d o nt h eb a s i so f t h er e s u l t s ,p o l l u t e ds o u r c ec a l lb ef o u n da ss o o n 器p o s s i b l e ,a n dm e a s u r e m e n t sc a nb em a d et oe o n t r o ld i f f u s e n e s so ft h ep o l l u t e ds o a l e 1 1 l i sp r o j e c tp r o v i d e san e wa p p m a c hf o rt h es i m u l t a n e o u si d e n t i f i c a t i o na n dq u a n t i f i c a t i o n o f v o c sa n di ta l s oo f f e r sa i le f f e c t i v em e t h o df o rr e a l - t i m e a u t o m a t e d s e d a t ea n di ns i t u m e a s u r e m e n t s k e yw o r d s :a r t i f i c i a ln e u r a ln e t w o r k s ;o p e np a t hf t i r ;v o c s ;m u l t i - c o m p o n e n ta n a l y s i s ; p r i n c i p l ec o m p o n e n ta n a l y s i s ;r e c o n s t r u c t i o n ;s b f m ; i i 7 6 3 4 9 3 声明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:埠翊季一 加。j - 年月如日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的全部或部分内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的全部或部分内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:凿! 曼蓬 m 年f 月7 一日 f 塑室翌三查堂堡主堂垡笙塞垒型墨基垦壅苎兰翌盔皇! 坚! 塑鱼垫望型塑! 堂塑一 1 绪论 1 1 本课题的研究背景 大气是指包围在地球周固的气体,其厚度达1 0 0 0 1 4 0 0 k i n ,它维护着人类及生 物的生存,在自然界和人类的发展过程中,人和其它生物都已经逐渐适应了正常的大 气环境。然而随着人类生产活动的发展和生活水平的提高,特别是隧着工业和交通运 输业的发展,以及化石燃料的开采和使用,将许多有害物质排放到了大气中,使局部 地区中这些物质的含量增加,当其浓度超过环境所能允许的极限并持续一定时间层, 就会破坏自然的物理、化学和生态平衡,从而危害人们的生活和健康,这些有害物质 被称为大气污染物。 大气污染物的种类很多,其中大部分是有机化合物,包括高挥发性有机化合物 ( v e r yv o l a t i l eo r g a n i cc o m p o u n d s ,v v o c s ) 、挥发性有机化合物( v o l a t i l eo r g a n i c c o m p o u n d s ,v o c s ) 、半挥发性有机化合物( s e m i v o l a t i l eo r g a n i cc o m p o u n d s ,s v o c s ) 和 颗粒状有机化台物( p m t i c u l a t eo r g a n i cc o m p o u n d s , p o m ) 。这些有机污染物主要是对人 的中枢神经、免疫系统以及各器官、各组织有毒害作用,直接或间接地影响人的健康, 可使人产生多种症状,如记忆迟钝、头晕头痛、呕吐、疲劳、精力难以集中、咽喉不 适等。其中,v o c s 是指室温下饱和蒸气压超过1 3 3 3 2 p a 的有机物,如苯、卤代烃、 氧烃等。v o c s 是人们关注的室内空气污染物的主要有机物,具有毒性和刺激性,有 些还有致癌作用,主要来自燃料的燃烧、烹调油烟和装饰材料、家具、日用化学品释 放的蒸气,以及室外污染气体的扩散。这些有机物浓度虽低,但释放时间较长,对人 体健康潜在性威胁较大,因此,对v o c s 的监测已变成一项非常艰巨的任务,世界各 国已经颁布了严格的环境标准和规章制度【l 】。 分析化学中用于v o c s 监测的传统方法是根据气相色谱和层析技术连用、质谱和 传感器等方法,这些监测手段虽然能够说明区域性的环境质量,但由于采样手段、采 样频率、采样数量等限制。不能及时地监铡环境质量的变化,预铡变化的趋势。2 0 世纪8 0 年代,美国h e r g e t l 2 1 提出了一个基于d a l l - k i r k h a m 望远镜的优秀设计,构成 了发射遥感系统,简称r o s e ( r e m o t eo p t i c a ls e n s i n go f e m i s s i o n ) ,后来,n i c o | e t 公 司在r o s e 系统的基础上,设计出了1 7 0 r s 型遥感傅里叶变化红外( o p f t i r ) 光谱仪, 为大气中v o c s 的实对自动、连续在线监测提供了重要工具。随着f f 破光谱仪的不 断更新和完善,迄今为止,开路f t i r ( o p f t i r ) 技术已被认为是环境质量监测中很有 实力的技术唧。与传统的环境监测方法相比,o p - f t i r 光谱技术具有以下几个优点f 4 啕: 南京理工大学硕士学位论文a n n 及其改进算法对大气v o c s 的自动塑型塑室墨坌堑 ( i ) 它能同时提供多组分的、大量的表征其化学和物理特征的分子光谱信息,进 行多组分同时定量测定; ( i i ) 可进行主动式或被动式遥感测定,并可以进行2 4 小时连续监测; ( 1 1 1 ) 无须预先知道待测对象、无须取样、无须样品的预处理,这样不仅避免干扰 待测参数,丽且保护了测量仪嚣不受污染; ( ) 可对热红外辐射源的绝对光谱能量分布和温度等物理参数进行遥感测定。 然而,由于大气中的v o c s 常常是多组分并存,并且各组分的红外光谱图重叠严 重,此时,o p - - f t i r 光谱仪测得的谱图解析复杂,这一点严重限制了该技术的广泛 应用【9 l 。目前,利用o p - f t i r 光谱对大气中有机污染物进行定性和定量的数据处理方 法中,主要是光谱差减法( s p e c t r a ls u b t r a c t i o n ) 、经典最小二乘法( c l s ) 和偏最小二乘法 ( p l s ) ,但这几种方法都存在一些问题。如:光谱差减法的主要思想是得到实测光谱 后,把被分析物的参照光谱乘以某系数,然后用实测光谱与参照光谱作差,依次将光 谱分开。但该方法中系数很难确定,并且当光谱比较复杂时,被分析物的种类也很难 确定。使用c l s 前,大气中的h 2 0 和c 0 2 的旋转振动光谱必须得到补偿,但到目前 为止,未出现一种可用于实践的光谱补偿技术。虽然p l s 的使用不如上述方法严格, 但p l s 主要侧重定量分析。当被测样中有未知物存在时,p l s 的预测灵敏度就大大 降低。近年来,a n n 被认为是模式识别和定量分析中非常有用的工具,而且还能处 理那些传统方法所不能解决的问题,因此,本研究选择人工神经网络( a n n ) 法对f t i r 光谱图进行解析。 1 2o p - f t i r 在气体污染物铡定中的应用现状 o p f t i r 在大气污染物监测中的优越性,在很多文献中都得到了肯定【1 0 ,“l 。它 既可以测定室内易挥发有机气体的浓度,也可以以铡定燃烧产物的浓度、各种发动机 尾气的浓度以及工厂排放的废气的浓度等,该技术在连续、直接、迅速地对气体污染 物进行遥感实时监铡方面具有很大的应用潜力和价值。 h a u s 等人【n l 采用k 3 0 0 f t i r 光谱仪测量了实验室周边的大气,得到了c o ,c 0 2 , n o n 0 2 ,n 2 0 ,n h 3 ,c i - h ,s 0 2 ,h 2 0 ,h c i 和h c h o 的浓度,所得浓度与采样 测量法得到的浓度相比,误差的平均值是( 1 1 6 ) 。该结果表明:在可接受的误差范 围内,本技术可用于实际测量豹情况。 a r r i g o n c 等人1 1 3 j 利用b r o k e r 公司的e q u i n o x 5 5 型f t i r 光谱仪对发动机废气中 的乙烯和其它碳氢化合物进行了监凋。利用f t i r 光谱仪涮得吸收光谱后,根据各种 物质的特征峰得出了它们的浓度,其中废气中的主要成分乙烯的浓度大约是 o 。1 5 m g l 。 m o d i a n o 等人i “j 采用f t i r 光谱仪监测了c f 3 b r 、c 3 f 7 h 等火焰抑制灭火过程中 2 南京理工大学硕士学位论文 a n n 及其改进算法对大气v o c s 的自动识别和定量分析 的气体。结果发现:这些卤代碳氧类灭火剂在抑制火焰过程中,会产生大量的酸性气 体( h f 和h b r ) 以及c f 2 0 。同时,本文利用f t i r 光谱对h f 、h b r 、h c i 和c f 2 0 进 行了定量分析,得出这些有毒气体的检出浓度介于几个p p m 到几十个p p m 。 o p f t i r 不仅可以提供大气污染物的浓度,而且还可以与计算机层析技术联用对 污染物的浓度在空间上的分布进行描绘。计算机层析技术( c o m p u t e rt o m o g r a p h y , 简称 c n 是近三十年发展起来的一门技术,除应用于医学成像、材料科学、天文学和晶体 学等方面外,与遥感傅里叶变换红外光谱联用,在测量大气污染物的空间浓度分布方 面也得到了广泛应用。 2 0 世纪9 0 年代初。t o d d 和l e i t h i ”,1 6 】将o p f t i r 与层析技术用于重构室内空间 气体浓度分布轮廓图,他们用旋转对称模型模拟出气体浓度分布的轮廓图,并由轮廓 图产生全光程积分浓度数据。 1 9 9 4 年,y o s t 等人1 17 l 首先对遥感层析( o r s c t ) 技术理论进行了实验研究,他们 在通风厨里放置一个能不断释放痕量气体的点源,通过o p f t i r 光谱仪测定后,利 用c t 重构,得到了准稳态下的气体浓度分布纵剖面图,并将该方法预测的浓度与取 点测定的浓度进行了对比。 早期的重构算法主要是采用离散平面测量和a r t 算法,但这些方法都存在许多 缺点,( 1 ) 需要构造极其复杂的交错光路;( 2 ) 扫描时间较长;( 3 ) 需要采用许多平 面镜和角镜;( 4 ) 噪声大,重构结果不唯一等。后来发展的平滑基函数最小化算法 ( s b f m ) 克服了其中的某些缺点。d r e s c h e r 等人5 1 毋的研究结果表明,s b f m 法能够很 好地拟合全光程积分浓度,定性和定量结果非常接近于真实值。 d e r s c h e r 等人1 1 9 】利用f t 瓜光谱仪和s b f m 重构算法测量了室内气体s f 6 的浓度 分布图。由分布图可以得到某一点的浓度,该浓度与取样法测得的浓度值进行了比较, 结果发现:两种方法的测量值比较吻合,两者得到的峰位置和峰形状都相同。 w u 等人1 2 0 1 通过o p - f t i r 光谱测定点源释放的n 2 0 气体,并用s b f m 算法进行 二维重构,重构图与点样测得的k r i g e d 图形一致。该法可在1 2 m 范围内确定浓度峰 位置,重要的是,该方法明显地简化了复杂的交错光路。 s b f m 算法对气体浓度分布进行重构是通过预先建立一个参数模型,而不是基于 单个象素点,因此,该方法避免了复杂的交叉光路,减少了所需要的仪器设备,降低 了成本,在实际应用中,更加方便、简捷。 1 3 人工神经网络在多组分分析中的应用现状 人工神经网络f i c i a ln e u r a ln e t w o r k ,a n n ) 是以神经生理学和心理学相结合,模 拟人脑思维过程的一门科学,它主要借鉴了人脑神经系统处理信息的过程,以数学网 络拓扑结构为理论基础,由大量简单单元以及这些单元的分层组织大规模并行连接而 3 堕室堡三查堂堡主兰竺堡奎垒型墨茎垦堂簦鎏型查皇! q 望竺鱼垫望型塑塞墨坌堑一 成的一种网络,它能模拟人脑进行信息处理,具有自学习、自组织、自适应能力以及 很强的容错性,分布存储与并行处理信息的功能和高度非线性表达能力,可以有效地 对模型不确定的数据进行大规模的非线性自适应处理,自动调节不同类型的非线性响 应,其处理复杂信息的能力是传统方法无可比拟的。 自2 0 世纪8 0 年代出现以来,人工神经网络在许多方面都得到了广泛的应用,如 红外光谱口1 2 3 “紫外可见光谱 2 4 - 2 6 1 、核磁共振谱【2 7 - 2 9 1 、质谱 3 0 - 3 2 1 和传感器【3 3 - 3 5 1 等方面。 a n n 模型用于鉴定和定量分析具有以下几个优点: ( i ) 能够精确逼近一些非线性关系的函数m 3 7 ; ( ) 具有较强的适应能力,可以向一些数据学习且能发现其中很微妙的关系娜l ; f i ) 具有较强的泛化能力,因此可处理一些不可靠或不完全的数据; ( i v ) 具有高度并行处理能力,可对许多相互独立的操作同时进行处理p 。 鉴于上述较强的非线性校正能力,人工神经网络吸引了许多科学家和光谱学家的 高度重视 4 0 - 4 6 1 ,刘培义等 4 7 1 采用a n n 对粉末药品甲氧苄胺嘧啶进行了非破坏快速分 析,用甲氧苄胺嘧啶粉末的近红外漫反射光谱建立了人工神经网络模型,并用该模型 对未知样品进行定量预测,所得相对误差最大不超过o 9 7 ,结果令人满意。 赵琛等【4 s 】人用反向传播网络( b p 触州) 建立了近红外光谱数据与氨基酸、精氨酸 和总氨酸含量阃的定量关联模型,三者的预钡4 标准偏差分别为0 0 8 、0 0 7 和o 3 6 ,该 方法为近红外光谱快速测定中药组分的含量提供了条新途径。 余煜棉等f 4 9 j 采用紫外分光光度计测定了息喘灵片制剂的多组分体系,并用反向传 播网络处理数据,预测了一片息喘灵片中茶碱、盐酸麻黄碱和异戊巴比妥三组分的质 量,预溺的准确率分别为1 0 0 4 、9 7 ,2 和1 0 1 3 。测定的变异系数分别是2 3 、 4 7 和3 8 。 随着a n n 方法的不断完善和发展,在大气气体污染物的监测中,也越来越显示 出其不可比拟的优点。李燕【5 0 】等采用b p a n n 对红外谱图严重重叠的五种有机气体 混合体系进行了定量分析,预测结果较好,各物质的百分标准预测误差( s e p 呦均小 于1 ,并且当组分数增加到十组分时,也能得到很好的结果【5 j j 。 v a n g 9 等研究了在o p - f t i r 红外光谱中,多层前向神经网络鉴定化合物的可能 性。最优网络模型建立后,标准谱库中的单组分光谱和含干扰物的光谱被网络预测, 结果表明:网络不但对标准单组分光谱进行了准确预测,而且多达9 中干扰物存在的 情况下,网络仍能对1 0 9 中化合物的任何一种物质的存在与否作出准确判断。另外, 最优网络还对实测的开路傅里叶变换红外光谱进行预测,当最大吸收大于或等于o 0 5 时,网络对实测光谱的预测准确度比较令人满意。 另外,通过与其它化学计量学方法的比较证明,a n n 用于多组分气体的分析明 显优于其它化学计量学方法。 南京理工大学硕士学位论文a n n 及其改进算法对大气v o c s 鲤垒垫塑型塑窒墨坌堑 h a m m e r 【5 2 l 等人利用o p f t i r 红外光谱和m 州法对三氯乙烯口c e ) 的存在进行了 自动检测,正确鉴定比率超过9 9 ,错误检测比率不足0 5 。该方法与p l d a 分析法 进行了对比,结果表明,b p - a n n 算法优于p l d a 分析法。 方锐【5 3 l 等人采用砧州和紫外吸收光谱x 寸n 0 3 j 和n 0 2 1 的浓度进行了同时测定, a n n 对重叠严重的吸收光谱进行了准确解析,n 0 3 d 和n 0 2 。的平均相对误差为i 8 9 8 6 和2 7 7 3 6 ,而利用p l s 进行数据处理时,平均相对误差高达1 4 9 7 0 0 和3 5 1 3 8 。 y a n g 5 4 1 等对于三氯甲烷和二氯甲烷的混合体系分别用a n n 、传统线性p l s 、多 项式p l s 和样条函数p l s 算法测定了三氯甲烷的浓度值,结果表明:a n n 法更适合 处理非线性问题。 高建波、胡东成【5 5 i 利用小波变换和人工神经网络法对f t i r 红外光谱进行了定量 分析,所得结果与k 矩阵法和主因子分析法所得结果相比,a n n 法明显优于其它两 种方法。 上述研究成果证明,a n n 是一种有效实用的多元非线性校正方法,在已知的多 组分气体监测中发挥了重要的作用。并且,l o n g 等l s 6 曾经预言,心i n 将会成为对光 谱数据进行非线性校正的有效工具,因此,心州和o p f t i r 技术联用对易挥发有机 气体进行分析具有很好的应用前景。 1 4 人工神经网络的改进研究 虽然人工神经网络已经得到了广泛应用,但由于其原理尚不完善,在实际应用中 还存在一些问题,如局部极小、学习速度慢、网络收敛速度慢、训练时间过长等问题, 为此,许多学者对人工神经网络进行了改进性研究。 陈善广等人5 7 1 和李建峰等人【5 8 】通过改进误差函数和激励函数对b p 网络进行了 改进,结果两种方法都在不同程度上提高了学习速度,加快了网络的收敛,避免了网 络陷入局部极小。 宋云龙等人1 5 川利用人工神经网络对喜树碱类化合物进行定量构效关系研究时,采 用了主成分分析法对初始变量进行降维,仅采用少数几个主成分作为人工神经网络的 输入值,结果不仅大大加快了训练速度,而且还提高了网络的拟合精度和预测能力。 杨海澜等人1 6 0 1 利用人工神经网络对焊接过程进行质量控制时,为了提高网络的工 作性能,先对输入数据进行了归一化处理,然后对送丝速度、干伸长、焊接速度、气 体流量、焊接电压及焊接电流等参数进行了主成分提取,提取出的影响熔宽的4 个主 要参数作为网络新的输入值,结果得到了非常满意的结果。 h e m m a t e e n e j a d 等人1 6 l j 采用遗传算法一主成分分析一人工神经网络模型 ( g a - p c a - a n n ) 研究了c a 2 + 在不同的阻断药分子中的活性。作者首先利用主成分分析 法将所有分子的不同参数进行了主成分提取,然后利用遗传算法从主成分中选择出变 5 南京理工大学硕士学位论文a n n 及其改进算法对大气v d c s 的自动识另! 塑塞曼坌堑 量的最佳组合方式,并将该组合方式作为人工神经网络新的输入变量。结果c a 2 + 的活 性预测精度有了明显提高,与原始网络的预测结果比较,结果的相对标准预测误差 ( r s e p ) 由原来的6 8 5 降为4 6 1 。 s h a m s i p m 等人【叫利用人工神经网络研究了( 邻) 氨基苯甲酸、烟酸、吡啶酸和对 氨基苯磺酸四组分混合物中各种酸的浓度,与溶液的p h 值之间的关系。对不同溶液 的p h 值构成的矩阵,先进行主成分分析,然后将所得的主成分作为三层b p 网络的 输入变量。结果表明:p c a n n 可以处理滴定数据,并且相对误差小于4 0 d 。 文献中介绍的a n n 的改进方法,主要有两种,一种是在基本的激励函数或误差 函数基础上进行修正,以便避免网络陷入局部极小,但该方法所得的改进效果并不明 显,而且修正后的函数不具有普遍适用性;另一种方法是对输入信号进行主成分提取, 目的是提高网络的训练速度和预测能力,目前,提取主成分时通常采用主成分分析法, 但该方法处理数据时未考虑输出变量的影响,所得得主成分不能很好地表达输入变量 与输出变量之间的关系。总结前人经验后,本文首先引入了新的误差函数一逼近度, 避免网络出现局部极小问题,该函数可适用于任何情况。另外,本文利用偏最小二乘 法提取输入变量的主成分,该方法充分考虑了输出变量的影响,所提取的主成分更精 确地表达了输入变量与输出变量之间的关系,所得结果与主成分分析法所得结果进行 比较,结果发现,前者所得结果明显优于后者。 1 5 本论文的研究内容 本文利用遥感f t 光谱技术和人工神经网络法对多组分v o c s 混合物进行自动 识别和定量研究,并采用改进的a n n 对实测的遥感傅里叶变换红外光谱图进行解析, 结合s b f m 算法重构得狲了气体在二维平面上的浓度分布图。本文的研究内容如下: ( 1 ) 利用f t i r 技术和a n n 法分别对单组分污染物和多组分污染物进行定性鉴别 和定量分析。对单组分进行分析的结果表明:人工神经网络法对污染物进行鉴别时, 准确率可达1 0 0 ,定量分析结果的标准预测误差( s e p ) 均小于3 。在对单组分进行 定性和定量分析的基础上,通过增加训练集种类和增大训练集个数,建立了包含五种 组分的人工神经网络数据库。通过数据库的搜索,准确地对2 5 组未知样品进行了定性 鉴别和定量分析。 ( 2 ) 通过对网络的输入变量进行主成分提取对三层b p 网络进行改进。结果 显示:不仅网络的输入变量变少,网络模型非常简单,而且网络的迭代次数明显减少: 计算时间也随之缩短;网络对未知样品的预测误差大大减小,网络的预测能力显著提 高。 ( 3 ) 利用o p - f t i r 测量大气中v o c s 的二维空间浓度分布。利用遥感f t i r 和 n i p a l s - a n n 分别对两组分、三组分和四组分易挥发有机物构成的污染区域进行了 南京理工大学硕士学位论文a n n 及其改进算法对大气v o c s 的自动识别和定量分析 测量和分析,得到了红外光谱的全光程积分浓度,然后利用s b f m 算法对各种有机 物在二维空间上的浓度分布进行了重构,得到了在二维平面上各种组分的最大浓度, 以及最大浓度所对应的位置。 该研究成果在实际应用中,能够给人们提供有关大气气体污染物的相关信息,了 解污染源所排出的有害物质是否符合现行排放标准的规定,分析它们对大气污染的影 响。以便对其加以限制。并且通过长时间的定期监测积累数据,也可为进一步修订和 充实排放标准及制定环境保护法规提供科学依据。 7 南京理工大学硕士学位论文a n n 及其改进算法对大气v o c s 的自动识别和定量分析 2a n n 法和f t i r 技术连用对v o c s 的定性和定量研究 随着人们对v o c s 监测的重视,对那些已知组分的混合气体,科学家们已有了大 量的研究,而实际情况中,通常污染物的组成是未知的,并且污染物一般都是混合物, 因此,对多组分污染物的定性识别和定量分析成为科学家们新的研究难题。 目前,对化合物进行定性识别时,一般方法是将输出信号设为0 或1 ,如果某化 合物存在,则化合物对应的输出值为l ,否则输出值等于0 。鉴于上述方法,本研究 选择不同类型的训练样本,构建了多种物质共存的数据库,并把网络的输出信号设为 l 之间,当网络的输出值是0 时,表示对应的物质不存在,如果输出值是非零值时, 表示相应的物质存在,并且输出值即为物质的浓度值。该方法不仅对混合气体中的组 分进行了快速识别,而且网络也同时输出了各种组分的浓度。 2 1 反向传播网络( b p - a n n ) 运算的基本原理【6 硒l 目前,在应用和研究中采用的神经网络模型有3 0 多种,比较具有代表性的是自组 织映射网络( s m o ) 、自适应线性网络( a d a l i n e ) 、反向传播网络( b p a n n ) 、单层前馈 9 回络( h o p f i e l d ) 等类型,其中,应用最广泛的为反向传播网络( b p a n n ) 6 7 ,6 8 1 ,据统计, b p a n n 在分析化学中的应用占所有网络的9 0 t 删。b p m 州中应用最广泛的是三层 反向传播网络,它包括输入层、一个隐含层和输出层,其网络模型示意图如图2 1 1 。 解析傅里叶变化红外光谱时,网络的输入信号是光谱图中的吸光度值( 薯,岛,x 。) , 输出信号根据具体情况确定。 f i g 2 1 1s c h e m a t i cd i a g r a mo f at h r e e - l a y e rb - pn e n v o r k 塑塞堡三查堂堡主兰垡笙塞竺型墨茎塾鲎苎鎏型查皇! 旦! ! 塑皇垫望型塑塞墨坌堑一 节点是人工神经网络的基本元素,不同层的节点之间通过一系列权( 。) 联系起 来,这样每个节点都有一个加权化的输入信号,加权后的输入信号之和通过一个线性 或非线性的传递函数连接起来。在处理非线性问题时,最常用的传递函数为s i g r n o i d 函数,此时第_ ,个神经元的输出y j 为: y ,= 厂o ,) = 击 ( 2 1 1 ) ”,= ( 嘞一q ) ( 2 1 2 ) 式中,材,为神经元突触后电位的累加值;口。为阈值;g 表示神经元非线性的参数。称 增益值( g a i n ) ,当g = 1 时,传递函数为对数函数( 1 0 9 s i g ) ;当g = 2 时,为双曲正切函 数( t a n s i g ) 。每个隐含层节点的输出传递到每个输出层的节点,输出层节点的输出值与 期望值之间进行比较,即正向传播阶段,得到输出误差后,这些误差再向输入层逆向 传播,并根据该误差对连接权进行修正,该过程为逆向传播阶段,两个阶段交替进行, 直到输出值与目标值的偏差满足工作所需的精度。 在训练阶段。输出层节点的误差6 。为( 以第p 个样本为例) 艿肚= ( t 砷一d 肚) d 肚( 1 0 肚) ( 2 1 3 ) 隐含层节点,的误差厶与输出层节点_ i 和隐含层节点,之间的权重4 有关: = ( 1 一o p j ) 缸( 0 0 ( 2 1 4 ) 在反向传播阶段,输出层和隐含层的误差在网络中反向传播,同时调节各节点间的权 值。权值的改变如下式所示: a c o ( h ) = ,如0 + m c a c o j i ) ( 2 1 5 ) 国目( 。) = 加靠0 脚+ i n c a c o 目( 。- 1 ) ( 2 1 6 ) 式中,a 国是隐含层节点_ ,和输入层节点j 之间的权的变化。魄,是隐含层节点- ,和 输出层节点七之间权的变化,为输出层节点k 的期望输出值,0 衅是输出层节点k 的 实际输出,0 。是隐含层节点,的输出,l r 为学习速率,m e 是动量因子,柠和一一1 是 迭代次数。 网络训练好之后,根据学习速率i r 、动量因子m e 和各节点的连接权( ) ,即可 以对未知样本进行定性或定量分析。 2 2 网络的评价标准 人工神经网络模型的最优标准般是训练集的预测误差最小,但这样极易产生 9 堕塞翌三盔兰堡主堂堡堕奎垒型墨茎整堂苎鎏整查皇9 竺! 箜旦塑堡型塑里量坌堑一 过拟合现象,即网络过度逼近训练样本,不仅学习了训练样本的共性,而且也很好地 学习了样本的个性,导致了网络对预测样本的预测能力较差。也有改用以监控集预测 误差最小为标准的,但该法忽略了训练集的预测结果,为此,本研究引用了新的评价 标准逼近度【7 0 1 。定义逼近误差: 铲( 昝+ 【昝+ l e i - e 2 i ( 2 2 1 ) 式中,e l 为训练集标准预测误差,p :为监控集标准预测误差。”。为训练集样本点数, 疗:是监控集样本点数,疗是已知样本点数。逼近度d 。为: d :塑( 2 2 2 ) 。 e d 其中,q 和e :分别是标准校准误差( & 1 c ) 和标准预测误差( s e p ) ,计算公式如下: 脚詈l 掣 s e p :,l o o c 。 ( 气一勺) 2 2 ( 2 2 3 ) ( 2 2 4 ) 式( 2 2 3 ) 中,气是测得的第f 个校准样本中第,个组分的含量,c f 是第f 个校准样 本中第_ ,个组分的目标含量,n 。是校准样本的个数,。是1 个校准样本中第_ ,个组 分的平均含量。式( 2 2 4 ) e e ,毛是测得的第f 个预测样本中第,个组分的含量,勺是 第f 个预测样本中第,个组分的目标含量,n 2 是预测样本的个数,i 是:个校准样 本中第,个组分的平均禽量。 l o 塑塞翌三查兰堡主堂垡垒苎垒型墨基蔓鲎茎鲨型查皇! 旦望堕宴垫塑型塑堡苎坌堑一 2 3a n n 和f t i r 联用对单组分化合物的定性鉴别和定量分析 2 3 1 实验部分 2 3 1 1 数据的准备 本文所用的气体f t i r 光谱数据取自美国环境保护协会标准谱库( e v a ) 。所选物质 是苯乙烯( s t y r e n e ) 和l ,3 丁二烯( 1 ,3 - b u t a d i e n e ) ,其特征吸收峰分别为1 4 9 9 ,9 0 9 ,6 9 5 c m l 和1 5 9 6 ,1 0 1 4 ,9 0 8 c m 1 。苯系物是严重的致癌物之一,并且苯乙烯的沸点非常低, 常温下极易挥发到大气中,因此两种苯系物的监测非常重要,但由于两者的特征吸收 峰非常接近,吸收峰之间存在严重干扰,这一点限制了朗伯一比尔定律的使用。 本研究共合成样本5 1 种,其中,两组分的混合光谱2 5 种,苯乙烯和l ,3 丁二烯的 单组分光谱图各1 3 种。5 1 种模拟样本分为两组,其中3 5 种作为训练样本,包括1 5 种两 c o m p o u n d ( xl o 也( r a g l ) )c o m p o u n d ( x l o 也( m e l ) ) n o l ,3 b u t a i i e n cs t y r e n e n o 。 l ,3 b u t a d i e n e s t ) t e n e 11 6 62 8 61 9 2 9 8 21 7 72 1 32 0 3 1 9 32 13 1 92 1 3 4 4 1 4 43 42 2 3 6 2 51 3 32 5 52 3 3 8 3 6 1 12 3 424404 71 8 83 6 22 54 - 2 5 81 54 _ 2 52 61 2 1 9 1 3 32 7 6 2 71 3 3 1 01 5 52 9 82 81 4 4 1 l1 2 13 8 32 91 5 5 1 21 9 92 5 53 01 6 6 1 31 6 63 3 23 l1 7 7 1 4 2 2 14 0 43 21 8 8 1 52 13 43 31 9 9 1 6 2 3 43 4 2 1 1 7 2 3 4 3 52 2 1 1 8 2 5 5 南京理工大学硕士学位论文a n n 及其改进算法对大气v o c s 的自动识别和定量分析 n o c o m p o u n d ( x | o 2 ( m f l ) ) n o c o m p o u n d ( x 0 2 ( m p _ f l ) ) 1 , 3 - b u t a d i e n es t y r e n e1 , 3 - b u t a d i e n e s t y r e n e l1 4 13 3 291 8 83 8 3 21 7 74 2 5l o1 5 53 4 0 31 9 92 5 51 1 2 8 9 41 3 33 7 41 2 2 - 3 8 51 2 12 1 31 3 3 1 5 6 1 1 03 1 91 41 2 1 72 1 6 2 3 81 51 4 8 一 8 1 6 32 8 11 62 1 2 一 组分混合光谱和单组分光谱各1 0 种。1 6 种作为监控样本,包括1 0 种两组分混合光 谱和单组分光谱各3 种。训练样本和监控样本的组成分别见表2 3 i 1 i 和表2 3 1 1 2 。 网络训练时,数据的取点方式为特征吸收峰处取点,文献【7 1 】已证明这种方法效 果较好。 2 3 1 2 运行软件和硬件 实验中数据的采集和处理都由f t i r 光谱仪以及“o p u s i r ”软件完成,其它计算均 在2 5 6 兆内存和2 4 g 的c p u 的奔腾个人电脑上完成。所用人工神经网络算法程序由 m a t l a b6 5 编写,网络由n e w f 涵数创建,恤i n 酣m 函数训练,s i m 函数仿真,程序在内 存为2 5 6 兆、c p u 为2 4 g 的奔腾的p c 机上w i n d o w s 操作系统下运行。 2 3 2 参数的优化 b p - a n n 的参数很多,其中最重要的有四个:隐含层节点数、学习速率、动量因 子和迭代次数。目前为止,它们的确定方法尚无成熟的理论规则可循,一般是根据误 差最小原则,在尽可能宽的参数范围内选择多个数值,然后将这些参数下得到的误差 通过作图或由计算机排序,找出最佳的参数,该方法被称为“尝试误差”法( t h et r i a l a n de r r o rm e t h o d ) 。 2 3 2 1 隐含层的节点数 隐含层节点数是模拟非线性问题时很重要的参数,一般情况下,隐含层节点数越 1 2 南京理工大学硕士学位论文 a n n 及其改进算法对大气v o c s 的自动识别和定量分析 多,网络模拟非线性的能力就越强;隐含层节点数过少,则网络不能充分反映输入节 点与输出节点阃的复杂函数关系,从而导致测试误差较大。但是,当隐含层节点数过 多时,被训练的网络不仅学习了训练样本的共性,而且也很好地学习了样本的个性, 导致网络出现过拟和现象【7 2 1 。本研究通过比较不同节点数时神经网络的逼近度大小来 确定隐含层节点数。图2 3 2 1 1 以苯乙烯( s t y r e n e ) 为例,显示了隐含层数在2 1 3 时与 逼近度和误差之间的关系。由图可知,当隐含层数由2 增大到5 时,训练集和监控集 的误差都明显减小,逼近度明显增加,当隐含层数继续增加时,误差开始增大,逼近 度开始减小,即网络的预测能力下降。因此,本研究取隐含层节点数为5 。 卜 弘 嘈 舅o 1 毒 0 l 3 5791 l1 3 t h en u 瑚b 群。o f h i 饿nn 制l r o l l | 巍2 3 0 1 1 譬峨o f h i a a l an l l r 蝴s 雠 + s 嚣c o f 巍w 托e 斗爨 黝o f 铷”嫩o 1 卜t h ed t f e co f 印p f 能h 瓶姐( 叔 幽削1 2 3 2 2 学习速

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论