(计算数学专业论文)神经网络技术在edxrf分析的基体效应校正中的应用.pdf_第1页
(计算数学专业论文)神经网络技术在edxrf分析的基体效应校正中的应用.pdf_第2页
(计算数学专业论文)神经网络技术在edxrf分析的基体效应校正中的应用.pdf_第3页
(计算数学专业论文)神经网络技术在edxrf分析的基体效应校正中的应用.pdf_第4页
(计算数学专业论文)神经网络技术在edxrf分析的基体效应校正中的应用.pdf_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 神经网络技术在e d x r f 分析的基体效应 校正中的应用 作者简介:武慧敏,女,硕士,1 9 8 1 年9 月1 1 日出生,2 0 0 4 年9 月从师于卢玉 蓉、龚灏两位副教授,2 0 0 7 年6 月毕业于成都理工大学计算数学专业。 摘要 在e d x r f 分析的发展过程中,基体效应一直是影响e d x r f 分析灵敏度和精确 度的客观因素,并制约着分析检出限的水平。因此e d x r f 分析中基体效应校正方 法的研究也更加深入。传统的基体效应校正方法主要是:实验校正方法和数学校 正方法,这些方法在满足一定条件下能够校正基体影响,提高分析精度,但上述 方法的有效性都依赖于待测样品与标样类型的一致性,即:上述方法适合于简单 样品的e d x r f 分析,对于复杂样品的e d x r f 分析,现在的基体效应校正手段遇到 了挑战。 本文中提出了采用神经网络方法对e d x r f 分析的基体效应校正进行研究,从 全新的角度为e d x r f 分析研究提供了新的科学依据。本文首先介绍了神经网络技 术方法,重点介绍了s o f m 网络以及r b f 网络,然后描述了e d x r f 分析的基本特 点,分析论证了使用神经网络技术的可行性,以及用此方法研究的技术路线,主 要采用s o f m 网络,结合攀枝花矿区土壤复杂样品的特点,对e d x r f 分析得到的 复杂样品数据进行了自动分类研究,由此给出了e d x r f 分析的分类规律;然后使 用r b f 网络对其中同一类型的样品进行了基体效应的动态非线性校正研究,建立 了相应的数学模型。通过测量有限标样,达到对未知样品进行自动分类;同时将 同类样品中各元素含量与其x 射线记数率之间的非线性映射关系通过数学模型 抽象出来,建立了非线性动态预测模型,达到了解决复杂样品e d x r f 基体效应校 正的目的。 关键词:e d x r 分析基体效应神经网络技术s o f m 网络r b f 网络 摘要 u s i n g a n aiy s n e u r a in e t w o r kt e c h n oio g yint h ee d x r f sb a s ai b o d yd o m in oo f f e c tc o rr e c tio n a b s t r a c t i nt h ed e v e l o p m e n tp r o c e s so ft h ee d x r fa n a l y s i s ,t h eb a s a lb o d yd o m i n oo f f e e th a s b e e nt h eo b j e c t i v ef a c t o rw h i c hi n f l u e n c e st h ee d x r f a n a l y s i ss e n s i t i v i t ya n da c c u r a c ya n dh a s r e s t r i c t e dt h el e v e lo fa n a l y s i sd e t e c t i o nl i m i t s ot h ee d x r fa n a l y s i sb a s a lb o d yd o m i n oo f f e c t c o r r e c t i o nm e t h o dh a sg o n ed e e pi n t om u c hm o r e t h et r a d i t i o n a lb a s a lb o d yd o m i n oo f f e c t c o r r e c t i o nm e t h o d sm o s t l yi n c l u d e :e x p e r i m e n tc o r r e c t i o nm e t h o da n dm a t h m a t i c sc o r r e c t i o n m e t h o d t h em e t h o d sc a nc o r r e c t b o d y b o d y i n f l u e n c ew h i l e s a t i s f y i n g t h ec e r t a i n c o n d i t i o n ,e x a l t a t i o na n a l y s i sa c c u r a c y , b u tt h eu s e f u l n e s s e so fa b o v e m e n t i o n e dm e t h o da l la r e d e p e n d e do ni nc o n s i s t e n c yt h a tu s e dt ob em e a s u r e ds a m p l ea n dm a r kk i n dt y p e w h i c hi st os a y : t h ea b o v e - m e n t i o n e dm e t h o d sb e s e e mt h ee d x r fa n a l y s i so fs i m p l es a m p l e t ot h ee d x r f a n a l y s i so f t h ec o m p l i c a t e ds a m p l e ,t h eb a s a lb o d yd o m i n oo f f e c to f n o wc o r r e c t e dm e a st om e e ta c h a l l e n g e a n a l y z e dar e s e a r c ht op r o v i d ean e ws c i e n c eb a s i cf o rt h ee d x r ff r o mt h ea l ln e w a n g l e , t h i st e x ti n t r o d u c e dt h et e c h n i q u em e t h o do f t h en e r v en e t w o r k ,t h ep o i n ti n t r o d u c e ds o f m n e t w o r ka n dr b fn e t w o r k ,t h e nd e s c r i b e dt h ee d x r fa n a l y t i c a lb a s i cc h a r a c t e r i s t i c s ,a n a l y z e d a r g u m e n ta nu s a g et h et e c h n i c a lp o s s i b i l i t yo ft h en e r v en e t w o r k , a n du s e dt h et e c h n i q u et h e t e c h n i q u er o u t eo ft h em e t h o dr e s e a r c h t h ec o m p l i c a t e ds a m p l ed a t am a i n l ya d o p t e das o f m n e t w o r k ,c o m b i n e dac h a r a c t e r i s t i c so ft h ec o m p l i c a t e ds a m p l eo fp a n z h i h u am i n e r aa r e as o i l ,g o t t ot h ee d x r fa n a l y s i sc a r r i e do na na u t o m a t i cc l a s s i f i c a t i o nar e s e a r c ha n dg i v e dt h ee d x r f a n a l y t i c a lc l a s s i f i c a t i o nr e g u l a t i o n t h e nn s ear b fn e t w o r ka st oi t sw o ns a m p l eo ft y p et oc a r r y o nab a s i cb o d yd o m i n oo f f e c tt h ed y n a m i cs t a t eo ft h ee f f e c tn o tt h el i n ec o r r e c ta r e s e a r c h ,b u i l d i n g u ph o m o l o g o u s m a t h e m a t i c sm o d a l p a s st om e a s u r el i m i t e dm a r k s m n p l e ,a t t a i n d i n gt h er i g h t n e s su n k o w nt h es a m p l ec a r r i e so na na u t o m a t i cc l a s s i f i c a t i o n ;s h o o t e a c he l e m e n tc o n t e n ti nt h es a m ek i n ds a m p l ew i t hi t sxi nt h em e a n t i m et h a tt h el i n e r e c o r d sf e wr a t e sn o tt h el i n er e f l e c tt os h o o tar e l a t i o nt oc o m eo u tt h r o u g ham a t h e m a t i c s m o d e la b s t r a c t i o n ,b u i l d i n gu pn o tl i n ead y n a m i cs t a t ea ne s t i m a t em o d e l ,c o m i n gt oat o s o l v et h ep u r p o s et h a tt h ec o m p l i c a t e ds a m p l ee d x r fb a s a lb o d yd o m i n oo f f e c tc o r r e c t i o n k e y w o r d s :e n e r g yd i s p e r s i v ex r a yf l u o r e s c e n c e ;b a s a lb o d yd o m i n oo f f e c t ;n e u r a ln e t w o r k t e c h n o l o g y ;s e l f - o r g a n i z i n gf e a t u r em 印n e t w o r k ;r a d i u sb a s i sf u n c t i o nn e t w o r k 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得盛壑堡王太堂或其他教 育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何 贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者导师 学位论文作者签名 。0 年歹月l 。日 学位论文版权使用授权书 本学位论文作者完全了解盛壑堡王太堂有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权盛塑理王盍堂可以将学位论文的全部或部分内容编入有关数 据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:诫慧波 ? 口b7 年f 月o 日 第一章引言 1 1 选题依据 第一章引言 自伦琴发现x 射线后,x 射线荧光( x r a yf l u o r e s c e n c e ,x r f ) 分析逐渐 发展成了基于不同硬件技术的两个分支:1 ) 、h f r i e d m a n 和l s b i r k s 开创的x 射线光谱分析( x r fs p e c t r o s c o p y ,x r f s ) 。2 ) 、l e v e q u e 开创的能量色散x 射 线荧光( e n e r g yd i s p e r s i v ex r f ,e d x r f ) 。除硬件因素外,在e d x r f 的发展过 程中,样品中基体效应( 被侧对象中物质成分变化和其他因素引起的对目标元素 特征x 射线的影响的统称) 一直是影响并制约着分析元素的测量准确度和分析精 确度,是给x 射线荧光分析方法带来误差的主要因素。 土壤样品主要有s i 、0 、a 1 、t i 、f e 、m g 、c a 、n a 、k 等元素构成,这些元 素约占土壤总量的9 8 以上,对x 射线荧光分析来说,其特点是散射能力较强, 因而提供了较高的散射背景。但是由于土壤的母质来源及形成条件不同,不同土 壤中的上述元素含量也不完全相同,尤其是对质量吸收系数有明显影响的元素, 如f e 、t i 、c a 等,在不同的土壤中的含量往往变化很大。由于这些元素的含量 的变化,引起样品的质量吸收系数变化改变,从而使同一元素以相同的数量存在 于不用的土壤基体中时,其谱线的荧光强度和散射背景均明显不同,形成明显的 基体效应( 这里指吸收一增强效应) 。 当入射辐射进入样品后,沿路要受到物质的吸收,土壤内部所产生的荧光x 射线从样品中射出,沿路也要受物质的吸收,即使样品中待测元素的百分含量不 变,由于样品平均原子序数的改变,样品对入射辐射和荧光辐射的减弱程度也会 不同,在样品外侧量到的被侧荧光强度也不同,都会造成测量准确度下降,这种 现象称作吸收效应。实验表明,当样品中对入射辐射和荧光辐射具有较大的质量 吸收系数的另一种元素的含量超过1 时,这种含量变化就会明显地影响定量分析 的准确度。另一方面,当样品中原子序数较大的元素被激发时,它发出的特征x 射线也能激发待侧元素,从而导致被侧荧光强度的增加,这种现象称作增强效应。 当增强元素的特征x 射线能量刚好膏腴被增强元素( 待测元素) 的吸收,而且增 强元素含量高,被增强元素含量较低时或者入射辐射能量过高不能有效激发待测 元素时,这种效应更加严重。或者可见,样品中元素的吸收一增强效应是由样品 的成分来决定的,通常样品往往是未知的,正因为样品的不确定性,造成了基体 效应校正方法难度大的后果。由此可见,在x 射线荧光分析技术中,吸收效应和 增强效应是基体效应最主要部分,基体效应的大小主要跟入射辐射能量、荧光x 射线能量、荧光元素的种类和含量以及跟基体效应中各元素的种类和含量等等都 成都理工大学硕士论文 有关系。可以看到,在一般情况下,只有在荧光元素含量在有限的范围内变化时, 才能认为荧光强度和荧光元素含量程线性关系。可见,土壤样品中荧光和荧光 与元素含量之间的这种非线性关系,也是产生基体效应的重要因素之一。( 参考 文献1 ) 传统的基体效应校正方法主要是:实验校正方法和数学校正方法,这些方法 在满足一定条件下能够校正基体影响,提高分析精度,但上述方法的有效性都依 赖于待测样品与标养类型的一致性,即:上述方法适合于简单样品的e d x r f 分析, 对于复杂样品的e d x r f 分析,现在的基体效应校正手段遇到了挑战。 e d x r f 分析七l 十年代就在金属和非金属矿产资源勘查中发挥了重要作用, 现在,e d x r f 的应用已经扩展到包括冶金、建材、地质、农业、环境等几个大的 领域,取得了显著的经济和社会效益。据业内估计,目前,国内使用的e d x r f 分 析仪已达数千台之多。e d x r f 分析在地学及很多领域都发挥了重大的作用,但是, 应该看到,除硬件技术之外,在e d x r f 的发展过程中,基体效应一直是影响e d x r f 分析灵敏度和精确度的客观因素,并制约着分析检出限的水平。长期以来,基体 效应的校正是e d x r f 分析方法推广和应用中需要解决的的重点和难点,也一直是 从事e d x r f 研究的学者关注的前沿课题之一。e d x r f 分析的基体效应校正具有重 要的研究意义。( 参见文献1 、2 ) 神经网络理论是在2 0 世纪提出的,自此以后,由于自身固有的超强适应能 力和学习能力,神经网络在很多领域获得了极其广泛的应用,解决了许多传统 方法难以解决的问题,发挥了巨大的作用。迄今为止,神经网络在自动控制,计 算机科学,机器学习,故障诊断与检测,心理学乃至经济学等领域都有大量的应 用。神经网络有着广泛的实用性和强大的解决问题的能力。目前,已经有一些比 较成熟的神经网络软件包。其中,应用最为广泛的软件包之一就是m a t l a b 的神 经网络工具箱,在本文中,我们就是主要采用了m a t l a b 的神经网络工具箱进行 的研究。( 参见文献7 ) 因为不同类型样品其基体效应影响特点不用,而同类样品基体效应影响规律 是相似的。因此将不同样品分类处理,可以大幅度降低基体效应校正的复杂程度, 在实际测量中,大部分样品是无法依靠人力进行分类的,必须在测试中实现自动 分类( 参见文献1 ) ;自组织特征映射( s e l f o r g a n i z i n gf e a t u r em a p ,s o f m ) 网络是2 0 世纪8 0 年代发展起来的一种使用非监督学习算法的人工神经网络,这 种方法的特点是可以将数据自动分到一个二维空间而尽量保存原始空问的拓扑 结构不变。这使得网络更易于学习,整个过程不需要借助人工的分类。这种方法 的另一个特点是可以从数据库中提取有用的信息,而且能够利用相似特性将样本 自动聚类。由于该网络具有自组织功能,网络可以通过自身的训练,自动对输入 第一章引言 模式进行分类,整个过程无需人工参与的特点,根据该网络的优越特性,结合我 们的实际的土壤复杂样品的特点,因此我们选用s o f m 网络实现对复杂样品进行 自动分类的研究。( 参见文献4 、5 ) 完成对复杂样品的分类研究之后,我们要对其中同一类型的样品进行基体效 应的动态非线性校正研究。即:将同类样品中各元素的含量与其x 射线记数率之 间的非线性映射关系通过数学模型抽象出来,建立非线性动态预测模型,取代传 统意义上的固定方程,使之具有任意精度的泛函逼近能力、较快的收敛速度等特 点。径向基函数( r a d i u sb a s i sf u n c t i o n ,r b f ) 网络是以函数逼近理论为基础 构造的一类前向网络,是有p o w e l lm j d 于1 9 8 5 年提出的。径向基函数方法是 用于严格多变量插值的一种传统方法,1 9 8 8 年b r o o m h e a d 和l o w e 最早将r b f 用 于神经网络设计,构造了径向基函数神经网络( r b f n n ) ,随着研究的日趋成熟, r b f n n 由于它具有结构自适应,输出与初始权值无关,结构简单、算法简便等优 良特性,被广泛的应用于函数逼近、系统识别、时间序列预测、语音识别、自动 控制等很多领域。( 参见文献1 5 ) r b f 是一种三层前向式网络,由输入层、隐含层和输出层组成。输入层的节 点的作用是传递信号到隐层;隐层节点由径向基函数构成;输出层节点是简单的 线性函数。一般,从输入层到隐含层的变换是非线性的,隐层的作用是对输入向 量进行非线性变换,而从隐含层到输出层的映射却是线性的,也就是网络的输 出是隐接节点输出的线性加权和,符合e d x r f 非线性基体效应校正的实际情况。 r b f 神经网络结构简单,训练简洁而且学习收敛速度快,能够逼近任意非线性函 数,该网络模型中各变量之间的相关关系经过训练隐含于网络权植之中,在其内 部建立隐含的复杂结构,完成复杂的输入输出非线性映射( 参见文献1 1 ) 。应 用该网络,我们建立了相应的数学模型。通过测量有限标样,达到对未知样品进 行自动分类;同时将同类样品中各元素含量与其x 射线记数率之间的非线性映射 关系通过数学模型抽象出来,建立了非线性动态预测模型,达到了解决复杂样品 e d x r f 分析基体效应校正的目的。 1 2 国内外研究现状 在e d x r f 得到迅速发展的同时,影响e d x r f 分析技术的基体效应校正方法的研 究也不断深入,国内外众多学者先后提出了特散比法、r a y l e i g h c o m p t o n 背散射 比值法、影响系数法、基本参数法、差值法、偏最d , - - 乘法回归( p l s ) 、准绝对 测量法、经验分类法、吸收因子法、列线图法、稀释法、增量法、a 系数法、饱 和曲线法、补偿法和单滤片法等多种方法。这些方法在满足一定条件的情况下能 够校正基体影响,提高分析精度。 成都理工大学硕士论文 上述基体效应的校正方法基本上可分为两种:一是实验校正方法;另一种是 数学校正方法。无论那种方法都都强调了样品类型的一直性对基体效应校正的重 要意义。实验校正方法一般是用制样、混合或配制样品,使各种试样的物质成分 中主量元素趋于一致,维持比例系数的稳定性,使基体效应的影响减少,甚至可 以忽略;或者根据其它宏观物理参数对测量对象进行分类、比较等手段处理样品 及测量数据;或者使标样与待测试样的基体趋于一致,再进行比较,以达到减小 基体效应影响的目的。 目前,数学校正是e d x r f 分析中应用最广泛的方法,它实际上是一种建立在 相对测量或准绝对测量基础上利用统计、归纳、计算等方法的数学模式,主要特 点是将基体中元素间的影响加以量化,用一定数量的样本通过实验求取数学表达 式中的待定系数,将实验求取的系数代入数学表达式,计算未知样品中待侧元素 的含量。数学校正方法的好坏,除标样的准确度外,还取决于以下几点:1 、因 为数学校正的结果依赖于标样与待侧试样的相似性。所以待侧样品与标样组成成 分应基本相似、基本影响规律相同,要属于同类样品。2 、元素间的相互影响应 该具有线性关系。实际上,由于实侧样品的来源和组成成分很难一致;e d x r f 中 元素间的激发、吸收一增强效应与组成成分之间一般都是非线性函数关系。在 e d x r f 分析中要满足上述两点比较困难。我们可以理解为:现有的数学校正方法 的有效性依赖于待侧样品与标样种类的一致性,e d x r f 的基体效应体现了待侧元 素含量与各种影响元素之间的一种非线性函数关系,是一种非线性基体效应。 显然,在对复杂样品的e d x r f 分析中,现在的基体效应校正手段遇到了挑战, 或者说存在着不足。习惯上,把组成成分复杂、影响因素多的样品称为复杂样品, 如岩石、土壤样品,核地球物理勘探工作中测量的大都是此类样品。所谓复杂样 品,其表现形式有以下几点:1 ) 、类型复杂,即有限的样品中存在众多非亲缘 性的样品种类。2 ) 、元素含量与影响因素呈非线性关系。3 ) 、预见性差,无法 对样品进行人工分类,甚至无法预见样品的种类和含量范围。由于以上因素的影 响,套用现有的校正方法分析复杂样品,效果并不理想( 参见文献1 ) 。 除前述校正方法外,还有学者将复杂函数描述和神经网络方法用到了x r f 的 基体效应校正中。2 0 世纪8 0 年代,4 0 1 所 中国原子能研究院 就提出用函数拟合 方法进行复杂谱的重峰分解,同时开展了标准谱剥谱和其它方面的研究。英国 p o t t s 1 9 9 5 ,1 9 9 9 等人以散射射线作为内标,建立了e d x r f 中描述特征射线、散 射射线和样品粒度、表面效应的复杂数理方程。9 0 年代后期,龙先灌等人 1 9 9 6 , 2 0 0 0 率先将人工神经网络方法引入谱峰的分解;最近的研究是针对散射蜂干扰 和直线拟合精度差等问题,采用了最优线性联想记忆( 0 l a m ) 神经网络方法解谱, 4 第一章引言 研究无散射峰标准谱的产生和本底干扰问题。郭盘林等 1 9 9 9 在x r f 定量分析中 对比研究了人工神经网络和最小二乘回归。对于非线性基体效应的影响,罗立强 等人 2 0 0 1 提出了用神经网络基本参数一n n f p 算法,并将其应用于x r f 分析,与q 系数法相比,n n f p 算法提高了非线性基体效应校正能力和预测准确度。但这些方 法主要是用在x r f s 上,而且没有直接针对复杂样品的分类,尤其没有针对e d x r f 的分类研究。( 参见文献2 ) 我校申请者( 庹先国等) 自1 9 9 7 年以来在先后承担的科技部、国土资源部、 四川省和相关课题中,把克服复杂样品的e d x r f 基体效应校正作为主攻研究方向 之一。明确提出了对于e d x r f 中复杂样品的基体效应要实现先分类、后建模 的思想,设计了利用特征参数分类的方法,特征参数分类的基本设想是: 排除其它因素,某元素m 被激发后产生的特征x 射线) ( m 一般应满足: 如= f ( 鳓,z q :,幺,q ) f 11 、 式中q m ,q z ,q x ,q s 分别代表m 的含量、增强效应、吸收效应、散射射线强 度总量。当函数中的任意自变量发生较大变化即意味着基体变化,上式可改写为: = f ( 9 0 ,( q 。,q :,) ,( q - ,姨:,) ,( q j - ,q :, ( 12 1 所谓基体变化,在上式中即表现为自变量发生较大变化。如果样品中只有q m 值有所变化,而其它自变量具有相似的增减规律,则认为是同类样品;试验证明 曹利国1 9 9 7 ,庹先国1 9 9 9 :同基体样品中q m 的变化小于5 时,此区间内特征 x 射线强度与q m 值之间的线性关系较好。由此可见,根据待测样品中某些元素含 量( 实测中用某元素特征x 射线强度近似表示) ,可以用来对该批样品进行类型划 分,分类的依据就称之为特征参数。该方法有以下效果:1 ) 、根据给定条件,可 以自动地对样品分类( 类型较少时效果好) ;2 ) 、能自动地用同类样品建立数学 模型,并由此计算出待测元素的含量。 由于研究范围的局限性和研究内容的深度不够,特征参数分类方法校正复杂 样品基体效应问题的能力还及其有限,存在着以下不足:1 ) 、没有系统地研究和 归纳e d x r f 的基体影响特征和物理化学参数的变化规律;2 ) 、需人为指定特征参 数,无自学能力;3 ) 、数据库中应包括所有类型样品( 实际上不可能) ;4 ) 、计 算模型是静止模型。可见,由于特征参数校正法没有自学能力、需庞大的信 息量、只有固定的模型,因而现有研究工作还远不能解决复杂样品分类和非 线性基体效应问题。( 参见文献2 ) 因为不同类型样品其基体效应影响特点不同,而同类样品基体效应影响规律 是相似的。因此将不同类型样品分类处理,可以大幅降低基体效应校正的复杂程 成都理工大学硕士论文 度。在实际测量中,大部分样品是无法依靠人力进行分类的,必须在测试中实现 自动分类。针对样品的复杂特征,在现有特征参数分类的基础上,研究建立复杂 样品自动分类的有效神经网络模型,使其具有记忆新类型、联想已有类型、学习 未知类型的功能,达到对复杂样品的自动分类,降低复杂样品对基体效应和测量 结果的影响几率。 1 3 本论文研究的主要内容 本论文的研究过程中,在充分研究、学习、吸收前人已有成果基础上,以自 主开发的基于s i p i n 半导体探测器和2 0 4 8 道谱仪的e d x r f 分析仪为工具,以攀 枝花矿区土壤和区内水系沉积物重金属污染元素( a s 、p b 、c u 、c d 、z n 、n i 、c r 等) 的e d x r f 测量为样本数据,该数据共有两组,分别是8 9 个与8 7 个样本数据, 合计1 7 6 个样本数据;重点开展了复杂样品e d x r f 分析的自动分类技术和同一类 型样品的基体效应校正的动态非线性预测模型的研究,两个过程分别采用了s o f h 网络与r b f 网络技术,达到提高e d x r f 的分析精度、降低分析检出限的目的,从 而为复杂样品e d x r f 基体效应的校正提供了一种新的方法和模式。主要有以下研 究内容: 1 使用s o f m 算法,以其中的一组样本8 9 个为训练样本,对另外一组数据8 7 个样本进行了测试,并且根据实际背景需要,选择了适当的权值,得到了 对8 7 个数据的自动分类结果,建立了e d x r f 分析的自动分类模型。 2 通过对数据特点的分析,我们又选用了经典的动态聚类算法( k - m e a n 算法) , 对8 7 个测试样本再次进行分类,根据实际问题需要,选择适当的系数k , 得到了分类结果,我们分别把两种方法得到的结果进行比较分析,再与实 际问题相结合,可以得出结论,在进行e d x r f 分析自动分类中,s o f m 算法 明显优于k m e a n s 算法,所以,我们最终选择了使用s o f m 网络进行e d x r f 分析的自动分类研究。并且用s o f m 网络得到的分类结果为下一步进行非线 性基体效应校正提供了科学的数据依据。 3 根据步骤1 中的s o f m 算法得到的分类结果,我们选择其中的第二类数据中 的2 7 个数据进行下一步的同一类型样品的基体效应校正的动态非线性预 测模型的研究,在建立同一类型样品的基体效应校正的动态非线性预测模 型模型中,我们采用了r b f 神经网络。( 具体模型见本文第4 章) 4 本论文以e d x r f 分析的自动分类技术与其基体效应校正的非线性动态预测 模型研究为主线,采用“理论研究一实物模型( 样品) 测试一建立校正模 型一实验检验“的总体技术路线,实现最终研究目标。技术路线见下图: 6 第一章引言 e d x i 弭分析中基体效应的产生机理研究 基体效应的影响因素分析及复杂样品的特征参数提日 一 i l 数据预处理及模型化l 建立分类规则 形成自动分类器及模型 否令 动态非线性数据处理及模型 e d x p 砰 分析中基体效应校正的模型及软件 图1 - 1 技术路线流程图 f i g u r e ,1 1t e c h n o l o g yr o u t i n ef i o w c h a r t 1 4 论文特点及创新 本文是在前人的研究基础上大胆尝试一种新的理论方法即:神经网络的方 法进行e d x r f 分析的基体效应校正研究。本文的创新点主要有以下几点: 1 e d x r f 分析基体效应校正的神经网络理论和方法技术。通过上述研究,将 e d x r f 分析中复杂的问题简单化,把具体的问题模型化; 2 将自动分类技术与基体效应校正的动态非线性预测模型结合起来用于 e d x r f 分析技术研究,提高e d x r f 技术对复杂样品的分析精度,降低分析 检出限的水平; 3 建立的模型具有直观性、整体性、较好的应用性。 成都理工大学硕士论文 第二章s o f m 神经网络理论及在e d x r f 分析 自动分类中的应用 由于样品中元素的含量变化,引起样品质量吸收系数改变,从而使同一元素 以相同数量存在与不同的土壤基体中时,其谱线的荧光强度和散射背景均明显不 同,形成基体效应,为了使不同基体中的同一元素进行比较,必须对这种效应进 行校正。基体是否属于同一类型,是解决问题的关键。e d x r f 分析中任何一种基 体效应校正方法都强调了样品类型一致性( 属于同类样品) 对于基体效应校正效 果的重要意义,但是实际分析中单一类型的样品很少。因此在对复杂样品进行 e d x r f 分析中,需要把复杂样品进行分类,使相同基体类型的样品归为一类,使 同一类样品对应相应的数学模型,这样可以消除元素间的吸收增强基体效应。对 同类样品进行基体效应校正,效果将会更加理想。 传统的聚类方法主要包含了基于距离的动态聚类法( k - m e a n s 算法) 、系统 聚类法( h i e r a r c h i c a lc l u s t e r ) 等经典算法。在经典聚类方法中,应用最多的 是系统聚类法,但是根据8 种距离( 最短距离法、最长距离法、重心法等8 种) 定 义的不同,得到的分类结果都往往不相同。只有在样本较少时,8 种不同的系统 聚类法得到的分类结果才比较一致;样本较多时,得到的类别各不相同,所以对 于大样本数据不适合用系统聚类法。动态聚类法是一种适合大样本数据分类的聚 类算法,因此选用动态聚类分析的k m e a n s 算法进行e d x r f 分析的动态聚类。( 参 见文献3 ) 除了上述经典的聚类分析法外,利用神经网络进行分类也是有效的方法。使 之在分类方面逐渐成为有效的方法。例如a d o r f 和j o h n s t o n 于1 9 8 8 年首先使用 神经网络进行天体分类 4 ;h i p p e l 等人使用人工神经网络进行恒星光谱分类; 在b a i l e r j o n e s 等人的一系列文章中,将传统的人工神经网络和主元分析( p c a ) 方法应用到光学恒星光谱的 ( 分类;b a i l e r - j o n e s 在博士论文中也有讲述所 有的文献均表明人工神经网络是非常有效的分类方法。( 参见文献4 ) 因此,在本文中,首先选用动态聚类算法对e d x r f 测量得到的数据进行聚类 分析;再选用人工神经网络中的自组织特征映射方法( s o f m 算法) 对e d x r f 分 析进行了自动分类;最后将两种方法的分类结果进行了对比分析,得出分析研究 结论。 第二章s o f m 神经网络理论及在e d x 阡分析自动分类中的应用 2 1 动态聚类法在e d x r f 分析聚类中的应用 2 1 1 动态聚类法的基本原理 动态聚类的的基本原理是首先按照一定的原则选择一批凝聚点( 聚核) , 然后让样品向最近的凝聚点凝聚,这样就由点凝聚成类,得到初始分类。初始分 类不一定合理,可按最近距离原则进行修改,直到分类合理得到最终分类为止。 动态聚类法的聚类框图如下图2 - 1 : 图2 1 动态聚类的聚类框图 f i g u r e 2 1f r a m e c h a r to fd y n a m l cc i u s t e r i n g 2 1 2 动态聚类在e d x r f 分析聚类中的应用 我们选取攀枝花矿区土壤和区内水系沉积物重金属污染元素( a s 、p b 、c u 、 c d 、z n 、n i 、c r 等) 的e d x r f 钡f j 量的8 7 组样本数据( 每个样本有1 0 个指标因子) 为原始数据。对标准化后的数据进行动态聚类分析。由于动态聚类要求给出分类 数k 的值,为了选择合适k 值,我们可以通过m d s ( 多维标度法) 把这8 7 个样本二 维平面图展示出来,它的二维平面图可以直观的反映各个样本所在的位置,然后 通过其二维图选择合适的分类数,如下图2 2 所示: 9 成都理工大学硕士论文 d e r i v e ds t i m u l u sc o n f i g u r a t i o n e u c l i d e a nd i s t a n e em o d e i 。哗芬 c * t 力 。 ;一 c 苷e8 s c m p o c a e s 5 3 7 d 目自肇l 算 c a s t 赫l “鼍 。 。攫s 整美。宠。等懑 口c 0 舱鞠:j l 7 zo c “| 氍nc * e i 旰of c 罐爵e 寺l d o 口一二一帮 口口 一 j - 54- 3z- 1o d i m e n s i o n1 图2 2 样本的二维平面图 f i g u r e 2 2t w od i i r o n s i o ni c h n o g r a p h yo fs t y i e b o o k 我们可以根据它样本的二维平面图的分布情况可以看出,这些样品有一些 异常样品例如6 0 ,4 5 ,7 3 等,除了这些异常样本外,我们可以以它的所在位置大 致划分为2 类或者3 类或者更多的类,由于每个异常值可能要单独成为一类,所以, 我们的k 值可以取稍微大一些的值,所以,在下面的动态聚类过程中,分别选择 k = 3 ,4 ,5 ,6 ,7 这四个值分别观察其分类结果的特点。如下表2 - 1 所示: 加 坫 占 咕 i_b一雄18ujo 第二章s o f m 神经网络理论及在e d x r f 分析自动分类中的应用 表2 1 动态聚类的结果 t a b 2 - ir e s u i t so fd y n a m i cc i u s t e ri n g 分第1 类第2 类第3 类第4 类 第 第 第 类 56 7 数 类类 类 k 1 3 ,7 ,8 ,1 0 2 3 ,2 5 4 4 ,4 8 54 ,5 ,6 ,9 ,2 4 ,4 5 ,4 7 ,5 1 , 4 6 ,6 0 一 0 ,5 2 ,5 4 5 6 ,5 9 ,6 4 6 9 ,7 4 - 75 3 ,5 7 ,5 8 ,6 卜6 3 ,7 0 一7 3 一 3 8 ,8 0 8 6 ( 6 5 ) ,7 9 ,8 7 ( 2 0 ) k 1 3 ,7 ,8 ,1 0 2 3 ,2 5 4 4 ,4 8 5 4 - 6 ,9 ,2 4 ,4 7 ,5 1 ,4 6 ,5 7 。4 5 一 0 ,5 2 ,5 4 5 6 ,5 9 ,6 4 6 9 ,7 4 7 5 3 ,5 8 ,6 1 - 6 3 ,7 0 7 3 ,6 0一 4 8 。8 0 8 6 ( 6 5 ) 7 9 ,8 7 ( 1 8 ) k l ,2 ,7 ,1 0 1 2 ,1 6 ,1 8 ,2 0 2 3 ,4 6 ,9 ,2 4 ,4 6 ,4 7 ,5 1 ,5 33 ,8 ,1 3 1 4 56 0 一 2 5 3 7 ,3 9 4 4 ,4 8 5 0 ,5 2 ,5 4 ,5 7 ,5 8 ,6 1 - 6 3 ,7 0 7 2 ,5 ,1 7 ,1 9 , 一 5 5 6 ,5 9 ,6 4 - 6 9 ,7 7 8 ,8 0 8 4 , 7 9 ,8 7 ( 1 9 )3 8 ,7 3 ,8 5 8 6 ( 5 6 )( 1 0 ) k 1 ,2 ,7 ,1 0 1 2 ,1 6 ,1 8 ,2 0 一2 3 ,4 - 6 ,9 ,2 4 ,4 6 ,4 7 ,5 1 ,5 33 ,8 ,1 3 1 4 56 07 3 一 2 5 3 7 ,3 9 4 4 ,4 8 5 0 ,5 2 ,5 4 ,5 7 ,5 8 ,6 卜6 3 ,7 0 一7 2 ,5 ,1 7 ,1 9 , 一 6 5 6 ,5 9 ,6 4 6 9 ,7 4 7 8 ,8 0 8 4 ,7 9 ,8 7 ( 1 9 )3 8 ,8 5 ( 9 ) 8 6 ( 5 6 ) 4 5 k 1 ,2 ,7 ,1 0 1 2 ,1 6 ,1 8 ,2 0 一2 3 5 ,6 ,9 ,2 4 ,5 3 ,6 1 6 3 ,3 ,8 ,1 3 4 ,4 6 ,4 7 ,6 07 3 一 。2 5 3 7 ,3 9 一“,4 8 5 0 ,5 2 ,5 7 0 一7 2 ,7 9 ,8 7 ( 1 3 )1 5 。1 7 ,15 1 ,5 7 ,5 8 一 7 4 5 6 ,5 9 ,6 4 - 6 9 ,7 4 7 8 ,8 0 9 ,3 8 ,8 5( 6 ) 8 4 。8 6 ( 5 6 )( 9 ) 从上面分类对比结果,我们可以看出,虽然分类数k 取的值不同,但除了几 个异常的样本4 5 ,6 0 ,7 3 等,当k = 3 或4 时,其余8 0 多个样本可以分为两类;当k :5 或6 时,其余8 0 多个样本可以分为三类;当k = 7 时,类别又可以进一步划分为4 类, 并且与前面样品的二维平面图分布也比较吻合。运用动态聚类法的优点是计算量 小、速度快,适合大样本的快速聚类,但是该方法的缺点是需要事先给出分类数 k 的值,在e d x r f 分析的分类中,我们不能确定分为几类,所以该方法不适合于 e d x r f 分析的分类,但是该方法却能够在给定分类数后,快速而且很直观的给出 每个样本所在的类别,还可以把异常样本分出来,而且可以用该方法去检验其他 分类方法的效果。 成都理工大学硕士论文 2 2s o f m 网络在e d x r f 分析分类中的应用 2 2 1 人工神经网络概述 人工神经网络( 简称神经网络) ,是近年来发展起来的- - i i 交叉学科,它涉 及生物、电子、计算机、数学、物理等学科,有着十分广泛的生物背景和前景。 简单地说,神经网络就是物理上可以实现的器件、系统和现有的计算机来模拟人 脑的结构和功能的人工系统。它是大量简单神经元经广泛互连构成的一种计算结 构,在某种程度上用以模拟人脑生物神经系统的工作过程。近年来,神经网络的 研究取得了令人瞻目的成就,这不仅使人工智能研究出现了重大发展,同时也引 起了不同领域众多研究者的极大兴趣。 人工神经网络也是一种由许多简单的并行处理单元组成的系统,其功能取决 于网络的结构、连接强度以及各单元的处理方式。它是在对人脑神经网络的基本 认识的基础上,从数理方法和信息处理的角度对人脑神经网络进行抽象,并建立 某种模型。它不是人脑生物神经网络的真实写照,并只是对它的简化、抽象与模 拟。神经网络的信息处理由神经元之间的相互作用来实现;知识与信息的存储表 现为网络元件相互联结的分布式的物理联系、网络的学习和识别决定于各种神经 元连接权系的动态演化过程。 人工神经网络是一个具有高度非线性的超大规模连续时间的动力系统,其主 要特征为:分布存储和容错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论