(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf_第1页
(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf_第2页
(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf_第3页
(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf_第4页
(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf_第5页
已阅读5页,还剩57页未读 继续免费阅读

(光学工程专业论文)某些常用光学材料(薄膜)的椭偏测量.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

国防科学技术大学研究生院学位论文 摘要 在膜系设计和镀膜工艺研究中,获取薄膜材料在一定光谱范围内准确的色散关系具有 十分重要意义。本文在利用v a s e 。型椭偏仪获得高精度椭偏数据的基础上,编程并对某些 薄膜材料的色散关系进行了拟合计算,得到了所测薄膜材料的色散曲线。 首先,论文在对椭圆偏振测量的基本原理进行了简单介绍和推导后,对光学薄膜系统 的椭圆偏振测量进行了分析,在此基础上,讨论了椭圆偏振测量中椭偏参数关于薄膜参数 的灵敏度以及入射角对椭偏参数的影响,并进行了具体的仿真分析。 其次,在椭偏数据处理部分,针对仪器自带数据处理软件在使用中出现的问题,从理 论上分析讨论了仪器自带数据处理软件所选择的l e v e n b e r g m a r q u a r d t 算法存在的不足,并 成功的将遗传算法引入到椭偏数据处理中来。结合具有全局最优、无需赋给初始值的遗传 算法和具有局部最优、优化结果稳定的使用导数最优化方法,进行了椭偏数据处理程序的 设计,很好地克服遗传算法结果的不稳定性和使用导数优化方法中赋初始值的问题。 最后在m a t l a b 7 1 中编写了能够独立运行的数据处理软件,对薄膜样品的椭偏测量数 据进行了处理分析,得到较准确的色散关系,并通过与高精度单波长透反射率测量仪的测 量结果比较,验证了数据处理软件的有效性和正确性。 关键词:光学薄膜椭偏测量术光学常数遗传算法数据处理 第1 i l 页 国防科学技术大学研究生院学位论文 a b s t r a c t t h eh i g ha c c u r a t ed i s p e r s i o nc u r v eo ff i l mm a t e r i a l so p t i c a lp a r a m e t e r si ns p e c i f i cs p e c t r a l r e g i o ni sv e r yi m p o r t a n c ei nt h ea r e ao fo p t i c a lc o a t i n gd e s i g na n dd e p o s i t i o nt e c h n i q u e s a t t e n t i o n sa r ec o n c e n t r a t e do nh o wt oc o m p u t et h ea c c u r a t es p e c t r a ld i s p e r s i o nc u r v eo fu s u a l f i l mm a t e r i a l s o p t i c a lp a r a m e t e r si nt h ed i s s e r t a t i o nb yu s i n gv a r i a b l ea n g l es p e c t r o s c o p i c e l l i p s o m e t r y , o n eo ft h ei n t e r n a t i o n a ls p e c t r o s c o p i ce l l i p s o m e t r yw i t ht h eh i g h e s tm e a s u r e m e n t a c c u r a c ya tp r e s e n t f i r s t l y , t h et h e o r yo fe l l i p s o m e t r yi si n t r o d u c e da n dt h es e n s i t i v i t yo fe l l i p s o m e t r i cp a r a m e t e r s w i t hr e s p e c tt of i l m p a r a m e t e r s i n e l l i p s o m e t r ya n dt h ei m p a c to fi n c i d e n ta n g l eo nt h e m e a s u r e m e n to fe l l i p s o m e t r i cp a r a m e t e r sa r ea n a l y z e da n dd i s c u s s e d ,a n dt h e ns i m u l a t e d c o n c r e t e l yi nt h ed i s s e r t a t i o n s e c o n d l y , t h e f a u l to fl e v e n b e r g - m a r q u a r d t a l g o r i t h m w h i c hu s e di nv a r i a b l e a n g l e s p e c t r o s c o p i ce l l i p s o m e t r y sd a t ap r o c e s s i n gs o f t w a r ei sa n a l y z e d f o rt h ep u r p o s eo fs o l v i n gt h e p r o b l e mi nt h e u s eo ft h es o f t w a r e ,g e n e t i ca l g o r i t h mi si n t r o d u c e di n t ot h ep r o c e s so f e l l i p s o m e t r i cp a r a m e t e r sw i t hi t sg o o dg l o b a ls e a r c hc a p a c i t ya n du n n e c e s s a r yi n i t i a lv a l u e s t h e c o m b i n a t i o no fg e n e t i ca l g o r i t h ma n do p t i m a lm e t h o d sb a s e do nd e r i v a t i v ei so fg r e a tf a v o ri n t h ep r o g r a m m i n gd e s i g n e df o rp r o c e s s i n ge l l i p s o m e t r i cp a r a m e t e r sb ys o l v i n gt h eu n c e r t a i n t yo f r e s u l t so b t a i n e db yg e n e t i ca l g o r i t h ma n dt h en e c e s s i t yo fi n i t i a le s t i m a t ev a l u eo fo p t i m a l m e t h o d sb a s e do nd e r i v a t i v e f i n a l l y , as t a n d a l o n ed a t ap r o c e s s i n gs o f t w a r eb a s e do nt h ea l g o r i t h ma b o v eh a sb e e n d e s i g n e dw i t ht h eh e l po fs o f t w a r eo fm a t l a b 7 1 b yu s i n gt h es o f t w a r e ,e x p e r i m e n t a l s p e c t r o s c o p i ce l l i p s o m e t r yd a t ao fs o m ef i l mm a t e r i a l sa r ea n a l y z e dc o r r e c t l ya n dt h ef i ts p e c t r a l r e f r a c t i v ed i s p e r s i o nc u r v ea r ew i t hg o o da c c u r a c yc o m p a r e dw i t ht h er e s u l t so fm e a s u r e m e n t s y s t e mo ft r a n s m i t t i v i t ya n dr e f l e c t i v i t y , w h i c hp r o v e st h ee f f e c t i v e n e s sa n dr e l i a b i l i t yo ft h ed a t a p r o c e s ss o f t w a r ed e s i g n e di nt h ed i s s e r t a t i o n k e y w o r d s :o p t i c a lf i l me l l i p s o m e t r yo p t i c a lc o n s t a n t s g e n e t i ca l g o r i t h m d a t ap r o c e s s i n g 第1 v 页 独创性声明 本人声明所呈交的学位论文是我本人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已 经发表和撰写过的研究成果,也不包含为获得国防科学技术大学或其它教育机构的学 位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文 中作了明确的说明并表示谢意。 学位论文题目:苤些堂塑左堂越整( 羹蹙! 鲍煎堡型量 学位论文作者签名:且睦 魄夕川年f f 月2 7 日 学位论文版权使用授权书 本人完全了解国防科学技术大学有关保留、使用学位论文的规定。本人授权国 防科学技术大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档,允 许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索, 可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密学位论文在解密后适用本授权书。) 学位论文题目:墓些鲎腰崖堂盐糙i 薹蹙2 鲤煎堡型量 学位论文作者签名: 作者指导教师签名: 日期:沙d 7 引m 7 日 日期:砷年,月矽日 国防科学技术大学研究生院学位论文 第一章绪论 随着电子工业的发展和信息产业的兴起,薄膜材料和薄膜技术越来越多的被广泛应用 在信息存储电子元器件、航天技术及光学仪器等领域,薄膜光学参数( 折射率n ,消光系 数k 和薄膜厚度d ) 的高精确度测量逐渐成为薄膜研究的重要方向。 薄膜光学参数的测量方法有干涉测量法、x 射线法、光谱扫描法和椭圆偏振测量术等, 其中椭圆偏振测量术能同时测定薄膜厚度和光学常数,还可以测量解算出多层薄膜系统中 各层的厚度和光学常数,且测量的膜厚范围广,具有非扰动性、非破坏性及相当高的灵敏 度和精确度等诸多优点,是现代薄膜测量中应用最广泛的方法之一。 1 1 椭圆偏振测量术的发展 椭圆偏振测量术从理论的产生发展到今天的广泛应用已经有近百年的历史。1 8 8 7 年, d r u d e 第一次提出椭圆偏振测量理论,并建立了第一套实验装置,成功地测量了1 8 种金属 的光学常数堙1 ;1 9 4 5 年r o t h e n 第一次提出了“椭偏测量术( e l i i p s o m e t r y ) 一词口1 ;在2 0 世纪6 0 年代,研制出了马达驱动自动消光椭偏仪和利用电光效应的自消光椭偏仪,但椭偏 测量中的大量数据处理和复杂的函数计算限制了椭偏测量术的发展。直到2 0 世纪7 0 年代, 蓬勃兴起的计算机处理技术解决了椭偏测量中数据处理的问题,使得椭偏测量术得到了新 的发展。1 9 7 5 年,美国贝尔研究室的a s p n e s 利用光栅单色仪产生可变波长,测量了不同波 长下固体材料的光学特性,由此揭开了现代椭圆偏振光谱( s e ) 测量的序幕h 3 。此后各国 的固体光谱研究室相继开展了这方面的研究。1 9 8 8 年,f e r r i e u 等提出了一种旋转起偏器 的椭偏仪( r p e ) 瞄3 ;1 9 9 6 年,t a c h i b a n a 等利用相位调制反射吸收光谱仪,光栅偏振片和 红外探测器组装了一台傅立叶变换红外位相调制椭偏光谱仪嗍。经过技术的不断积累和准 备,在现代高精密技术和计算机自动化技术的支持下,目前,国外的椭偏仪已经商品化和 小型化,自动化程度高,测量波长范围已包括红外波段、可见光波段和紫外波段。市场上 国外典型的产品有美国的瓦拉姆( w o o l l a m ) 公司的m 一4 4 m 一8 8 型多波长回转检偏器( r p e ) 型 椭偏仪和可变角度光谱椭偏仪( v a s e 。) 系列两类;美国r u d o l p hr e s e a r c h 公司的4 6 3 e l l i p s o m e t e r 椭偏仪;法国若屏一伊洪( j o b i n y v o n ) 公司的u v i s e l 超快光谱椭偏仪;法国 的索泼拉( s o p r a ) 公司的e s 4 g 光谱椭偏仪等口1 。 我国的椭偏测量术最早始于2 0 世纪7 0 年代初,在物理学家黄昆院士的建议下,中山大 学莫党教授等开始研究椭偏测量术。7 0 年代中期,由莫党教授等设计制造出我国第一台单 波长消光椭偏仪t p 一7 5 型睛1 。1 9 8 2 年又研制出t p p 一1 型旋转检偏器式波长扫描光度椭偏仪, 波长范围为2 6 0 2 8 0 n m 。随后在8 0 年代中后期分别实现了激光光源椭偏仪和椭偏光谱仪的 第1 页 国防科学技术大学研究生院学位论文 自动化,在1 9 9 2 年进一步提高了自动化程度及测量精度。1 9 9 3 年复旦大学研制出了一种同 时旋转起偏器和检偏器的新型全自动椭偏仪凹1 。总体来说我国在椭偏测量方面的研究虽然 起步较晚,但发展迅速,目前,部分领域已经跻身世界前列。 1 2 椭偏测量术的应用 椭偏测量技术不仅能测得单层膜的厚度和光学常数,而且能同时测量计算出多层膜的 各层膜厚和光学常数、表面和界面的粗糙度及材料的微结构。随着薄膜技术应用与需求的 扩大,椭偏测量已广泛应用在半导体制造业、电子工业、光学工业、材料科学、化学化工、 生物和医学等领域口1 0 1 。具体可分为: ( 1 ) 体形材料的光学性质和薄膜材料的光学性质及厚度信息。 ( 2 ) 在微电子领域中研究薄膜生长过程、薄膜厚度、半导体的表面状况以及不同材 料的界面情况、离子注入的损伤分布等。 ( 3 ) 与薄膜相关的其它行业:半导体工业的各种薄膜和多层结构、光电子工业的涂 层、数据存储工业的磁膜、平板显示工业的i t 0 薄膜和薄膜晶体管的结构、化学工业、生 物和医学的各种有机层、分子膜等。 1 3 论文研究的主要工作 椭偏数据处理的主要过程为:依据试样进行模型的选取,通过将实验测量出椭偏参数 ( h - ,) 代入合适的数值优化算法中进行数值反演运算,最终得到所需要的试样的光学参 数( 试样厚度,折射率及消光系数) 。以前,研究室中具有的高精度单波长透反射率测量 仪和单波长消光椭偏仪只能实现单波长的高精度的测量,无法在光谱范围内进行测量,不 能满足研究工作的需要。现在研究室拥有目前国际上测量精度最高的光谱椭偏仪之一的 v a s e 。型椭偏仪,能够在一定的光谱范围内对光学材料的折射率进行高精度的测量,但是在 实际使用中,发现仪器自带的椭偏数据处理软件经常得不到好的拟合结果。因此,本文的 主要工作在于结合研究室所使用w o o ll a m 公司的v a s e 型椭偏仪,运用现代最优化算法 遗传算法和使用导数最优化算法相结合,设计一种新的拟合方法,拟合出准确的光学薄膜 材料色散曲线,这对研究室的膜系设计及镀膜工艺的研究具有重要意义。 论文的主要内容包括: ( 1 ) 对椭圆偏振测量术的基本原理进行了简述,并对光度法基本原理进行了详细推 导分析; ( 2 ) 分析了椭偏测量术的复杂性,仿真分析了椭圆偏振测量中椭偏参数关于薄膜参 数的灵敏度以及入射角对椭偏参数的影响; 第2 页 国防科学技术大学研究生院学位论文 ( 3 ) 讨论了w 0 0 1 1 a m 公司的v a s e 9 型椭偏仪自带软件的数据处理方法,分析了其优劣。 引入遗传算法,并将其与使用导数的最优化方法相结合,编写了新的数据处理程序; ( 4 ) 利用自编的数据处理程序对薄膜样品的椭偏测量数据进行处理分析,得到较准 确的色散关系,并通过与高精度单波长透反射率测量仪的测量结果比较,验证自编数据处 理程序的有效性和正确性。 第3 页 国防科学技术大学研究生院学位论文 第二章椭圆偏振测量的基本原理 椭圆偏振测量术是研究两媒质间界面或薄膜中发生的现象及其特性的一种光学方法, 其原理是利用偏振光束在界面或薄膜上的反射或透射时出现的偏振变换n 川。 2 1 光的偏振 由光的电磁理论可知,光是横波,光矢量在垂直于光线的平面上作二维振动,呈现为 不同的振动方式。光矢量的振动方式称为光波的偏振态,按照光的偏振程度不同可分为自 然光、部分偏振光和偏振光。偏振光又可分为线偏振光、圆偏振光和椭圆偏振光,其中圆 偏振光是椭圆偏振光中长轴等于短轴的特殊情形。光矢量的振动方向只限于某一确定方向 上的光波称为线偏振光,光矢量端点在垂直于光线的平面上的轨迹为圆或椭圆的光波称为 圆偏振光或椭圆偏振光1 1 3 1 。 设有一沿z 方向传播的单色光波,根据场的横向性将其电矢量在x 幂l j y 方向上进行分解, 得到两分量的表达式为: 雠e 岛。墨c o s ( ”r 4 - 箬 汜l , 【b =y) 式中f = 6 a t k z ,正和万,分别是两分量的相位。为了求得电场矢量的端点所描绘的曲线, 把上式中参变量f 消去,得到方程: 2 + 科一2 爰e 驴砰占 汜2 , 式中万= 万。一万。表示x 分量与y 分量的相位差,万 万 2 万。由于s i n 2 万0 可判断出此曲 线为一椭圆,即电矢量的端点描绘出的曲线为一椭圆。 对于空间中某一固定点,电矢量的端点随时间的演化有两种可能的旋向,即顺时针旋 转或逆时针旋转两种情况,一般规定:当观察者迎着光线射来的方向看去,对于空间某一 固定点电矢量( 或磁矢量) 的端点按顺时针方向转动的为右旋偏振光,逆时针方向转动的为 左旋偏振光。图2 1 是右旋光矢量的分布图。 图2 1 某一时刻右旋光的光矢量 第4 页 国防科学技术大学研究生院学位论文 根据定义,当0 艿 万时,式( 2 2 ) 表示的是一个右旋椭圆;当1 万 2 万时,式( 2 2 ) 表示的是一个左旋椭圆;当万= o 或万= 万时,式( 2 2 ) 表示的是一条直线;当e o 。= 磊y 且 万= 三或万= 等时,式( 2 2 ) 表示的是一个圆。具体表示形式如图2 2 所示。 川 占- ;占一三艿- 孚 j 。f 宙囫囹圈田 j = 詈j 孚占= 了7 1 j z 石 占;孚 圈囹囫田围 图2 2 万为各种不同值时的椭圆偏振光 2 2 椭偏测量理论 偏振光从镀有单层膜基片上的反射是椭偏测量中一种比较重要的情况。如图2 3 所示, 假设具有平面平行界面、厚度为d 的薄膜,夹在半无限大环境媒质和基片之间。环境媒质、 薄膜和基片都是均匀各向同性的。 l 2 图2 3 光在单层膜上的反射和折射 光束从环境媒质中入射,入射角为磊,环境媒质复折射率为i ,折射角为欢,薄膜复 折射率为,厚度为d ,基底的复折射率为m ;入射光束中包含p 分量和s 分量。光束 从环境媒质入射到薄膜中时,由于界面1 和界面2 对光束的多次反射和折射,在界面1 上 的总的反射光波是经多次反射光波干涉叠加的结果。 为了简单起见,这里的计算暂时略去了所有的界面反射系数中有关角标p 和s ,分别 用:、 :和眨,、如,表示界面l 和界面2 处的菲涅耳反射系数和透射系数,则在环境媒质 中合成总反射光波的各分波的复振幅分别为,i :巨,t , 2 f 2 l 厂2 3e x p ( - i 2 8 ) e j , 第5 页 国防科学技术大学研究生院学位论文 2 如1 1 2 磅e x p ( 一i 4 d ) e ,t 1 2 t 2 。2 2 3 3e x p ( 一i 6 6 ) e , ,这里2 万表示相邻的两束反射光的相位差: 2 6 4 ,zd n :c 。s 欢:竿d 压j 丽两 ( 2 3 ) 将以上各分波相加便得到表述总反射光波的复振幅e r ,即有 e = l ”五t 1 2 t 2 1 函r 2 3e x 夏p 而( - i 2 d ) 卜 ( 2 4 ) l l 一吒l 吒3e x p l z 2 dj j 在界面1 两侧根据斯托克斯公式有巧:= - r 2 。和,1 :t 2 。= 1 一巧;,代入( 2 4 ) 式计算得到: e 。:r u + r 2 3e x p ( - i 2 _ _ _ 粤d ) e ( 2 5 ) 7 +l3 一,1 r 2 r 2e x p ( i 2 5 ) 为了接下来的讨论,将角标p 和s 分别标上,可以得到薄膜对入射光波的p 分量和s 分量的总的反射系数: r :垒生型二塑 p l + f 2 1 p l 2 3 pe x p ( - i 2 6 ) ( 2 6 ) 足:量:! 垒! :! 兰旦! 二! 三鱼1 5 1 + r 2 l j r 2 3 ,e x p ( 一i 2 d ) 式中万对p 偏振和s 偏振都相同,在( 2 6 ) 式中的界面1 和界面2 处的菲涅耳反射系数和 菲涅耳透射系数分别为: 1 2 p = ( 2c o s 矽1 一n lc o s 欢) ( n 2c o s 办+ n ic o s e c ) 吃3 尸2 ( 3c o s 改一n 2c o s 么) ( 3c o s 织+ 2c o s 绣) ( 2 7 ) _ 2 ,= ( n ic o s 旃一n 2c o s 0 2 ) ( n ic o s 办+ 2c o s 矽2 ) r 2 3 s = ( 、n 2 c o s # 2 一n 3 c o s 0 3 ) ( n 2 c o s 0 2 + n 3 c o s e c ) 根据s n e l l 定律可以给出光波传播方向与薄膜界面法线之间的三个角度办、欢和绣间 的相互关系为: 1s i n o l = n 2s i n 欢= 3s i n 0 3 ( 2 8 ) 为了研究倾斜入射的光波经薄膜反射后的振幅和相位的变化,将总的复振幅反射系数 用其绝对值和相位角来表示: r p = lr | 口ie x p ( i aj ,) ( 2 9 ) 足= i 足ie x p ( i a ,) ( 2 1 0 ) r 。l 和i 尺,| 分别表示p 偏振光和s 偏振光经薄膜系统反射时振幅衰减;a p 和a ,分别表示 p 偏振光和s 偏振光经薄膜系统反射时的相移。 根据式( 2 8 ) 可知,p 偏振光和s 偏振光的界面菲涅耳反射系数是不同的,由式( 2 6 ) 国防科学技术大学研究生院学位论文 显而易见,对这两种偏振情况,薄膜系统总的反射系数也是不同的。这正是椭偏测量术测 量薄膜系统的依据,即通过测量入射光和反射光的偏振改变来计算薄膜系统的某些参数。 定义椭偏参数与总反射系数之间关系为: t a n o ) e x p ( i a 却= 鲁= 剖e x p f ( a p - a s ) 】 ( 2 由式( 2 1 1 ) 可知椭偏参数具有明确的物理意义,它们直接反映出经过薄膜系统反射 前后光的偏振态的变化,在测量时能够直接得到椭偏参数的测量计算值。一般规定椭偏参 数的范围为:0 甲 万2 ,0 a o ,为波尔兹曼常数;c ( t ) 是一个与温度和系统均相关的系数。由式( 4 1 ) 分析可知, 在同一温度下,停留在能量小状态的概率比停留在能量大状态的概率要大,并且随着t o 分子能量停留在最低能量的概率趋于l ,即系统能量趋于最小啪3 。 在具体问题计算中,模拟退火算法是将“优化问题的目标( 评价) 函数替代系统的 能量,用“待求参数的变化”替代退火过程中分子的移动,用“优化迭代过程中的步长 等效温度的变化速度,若在优化过程中让迭代步长变化足够缓慢,并且以波尔兹曼概率运 第2 5 页 国防科学技术大学研究生院学位论文 动,就可能获得一个最小的目标函数值,即达到该优化问题的最优解。模拟退火算法具有 全局搜索能力,被广泛地应用于许多领域。 4 1 2 人工神经网络算法乜5 瑚1 人工神经网络是指由大量与自然神经系统的神经细胞类似的人工神经互联而成的网 络,广义上讲,可以理解成由大量像生物神经元的处理单元高度并联,互联而成的具有某 些智能功能的系统,其基本思想是从仿生学的途径对人脑的智能进行模拟,使系统具有模 拟人类感知、学习和推理行为能力。最常用的神经网络模型一逆向传播网络( b a ck p r o p a g a ti o nn e t s ,简称b p 网) 的基本结构有三层:输入层、隐层和输出层。每一层均 由类似人类大脑神经元的简单处理单元组成,层与层之问的神经元相互连接,输入层接受 来自外界的输入,而输出层则把处理信息传送到外界,隐层可以视为一个储存规则、数学 模型的“大脑”。前人工神经网络的应用已渗透到各个领域,在信号处理、智能控制、模 式识别、机器视觉、非线性优化、自动目标识别、传感技术等方面取得了非常大的进展。 4 1 3 遗传算法n 鲫 遗传算法是模仿自然界生物进化机制发展起来的随机全局搜索和优化方法。其通过模 拟自然选择和遗传中发生的复制,交叉和变异等现象,从任一初始种群出发,进行随机选 择,交叉和变异操作,产生一群更适应环境的个体,使群体进化到搜索空间中越来越好的 区域,这样一代一代地不断繁衍进化,最后收敛到一群最适应环境的个体,求得问题的最 优解。 遗传算法作为一种实用,高效的优化技术,提供了一种求解复杂系统优化问题的通用 框架,它不依赖于问题的具体领域,对问题的种类有很强的适应性,被广泛地应用于很多 学科,例如组合优化、生产调度问题、自动控制、图像处理、人工生命、机器学习等。 4 1 4 使用导数的最优化方法2 1 m 2 1 在求解最优化问题中,根据是否计算目标函数的导数可以分为两类:一类是直接方法, 即在优化计算中不需要计算目标函数的导数;另一类是在优化计算中要用到目标函数的导 数值,主要包括梯度法、牛顿法、拟牛顿法以及最4 , z 乘法等。 在无约束最优化问题 r a i n 厂( 蟊) ,元r ” 中,设厂( i ) 是二次可微实函数,i 是f ( f f ) 的极小点的一个估计,把f ( 2 ) 在i 展开成 t a y l o r 级数,取二阶近似 第2 6 页 国防科学技术大学研究生院学位论文 厂( 冤) 矽( i ) :厂( ) + 耵( ) r ( i 一) + 昙( i 一) r v 2 厂( ) ( 冤一) ( 4 2 ) 其中v 2 厂( i 。) 是厂( i ) 在i 处的h e s s e 矩阵。为求矽( i ) 的平稳点,令v 矽( 元) = 0 ,即 v 厂( i 。) + v 2 厂( j 。) ( i i 。) = 0 ( 4 3 ) 得到牛顿法的迭代公式 i 。+ 1 = 孑一v 2 厂( i ) 一1 v 厂( i 。) ( 4 4 ) 牛顿法具有收敛速度快和二次终止性等特点,但是也存在一些不足,例如在迭代时目 标函数值上升、收敛到鞍点以及当h e s s e 矩阵奇异时,无法确定迭代的后续点等。为了克 服这些不足,引入了修正牛顿法,具体算法细节可以参见文献 4 2 4 3 。 为了克服牛顿法缺点,还提出了拟牛顿法,其基本思想是用不包含二阶导数的矩阵近 似牛顿法中的h e s s e 矩阵的逆矩阵。为了构造该矩阵,首先分析牛顿法中的h e s s e 矩阵的 逆矩阵与一阶导数的关系。 设在第k 次迭代后,得到点i “n ,将函数f ( 2 ) 在点勇“1 展开成t a y l o r 级数,并取二 阶近似,得到 厂( 冤) ( i ( 川) + w ( i m ) 7 ( i i ( 川) + 昙( i 一贾( 川) r v 2 厂( 孑( ) ( i i 川) ( 4 5 ) 对式( 4 5 ) 两边同时取一阶导数,得 v 厂( i ) v f ( i + 1 ) + v 2 厂( i 2 + 1 ) ( 元一冤。+ 1 ) ( 4 6 ) 令i = i ( 舶,贝u 有 1 盯( i ) v f ( i 。+ 1 ) + v 2 厂( i 。+ 1 ) ( i 一孑+ 1 ) ( 4 7 ) 记 面( ) = i ( “n i ( ( 4 8 ) 则有: 虿。= v f ( i + 1 ) 一v f ( 孑。) ( 4 9 ) 虿v 2 f ( 2 川) p 又设h e s s e 矩阵v 2 2 2 ( 面“1 ) 可逆,则得到: ( 4 1 0 ) p v 2 ( i 。+ 1 ) 一1 虿 ( 4 1 1 ) 这样根据计算出的p 和牙,由式( 4 1 1 ) 估计在孑“1 处的h e s s e 矩阵的逆。因此为了 第2 7 页 国防科学技术大学研究生院学位论文 用不包含二阶导数的矩阵鼠+ 。取代高斯一牛顿法中的h e s s e 矩阵的逆矩阵。有理由令凰+ 。 满足: 卢”= 鼠+ l 虿 ( 4 1 2 ) 有时也讲上式称为拟牛顿条件。 拟牛顿算法常用的算法主要有d f p 算法和b f g s 算法。拟牛顿算法是无约束最优化方 法中最有效的一类算法乜。它有许多优点,比如,计算中仅需计算一阶导数,一般情况都 具有超线性收敛速率。 由牛顿法和拟牛顿法的理论可知,计算中要用到目标函数导数的这一类最优化算法基 本计算过程为:在最优解可能存在的地方选择一个初始点,然后通过分析目标函数的特性, 由初始点移到一个新的点,然后再继续这个过程。这类优化算法中均要求先选择一个初始 点,而且其计算的最优结果很大程度上依赖于初始点要在最优点附近这个条件,这就使得 它们的有效性和适用性受到了一定的限制。但是一旦初始点能够选择在最优点附近的话, 针对无约束的最优化问题,这类算法往往具有可靠的、稳定的优化结果。因此在实际优化 计算中,这类优化算法有它们不可替代的优势,被广泛地应用于各类优化问题中。 4 2v a s e 型椭偏仪的数据处理方法 v a s e 。型椭偏仪自带的数据处理软件选择l e v e n b e r g m a r q u a r d t 算法为优化反演算法, 对评价函数进行求最小值计算,即求评价函数 脚= 志善c c 半) 2 + c 半) 2 】= 志z 2 的最小值。 在反演拟合计算中,假设拟合计算得到的椭偏参数用y ( 置;历) 表示,其中薯表示所有己 知的模型参数( 例如入射角度值、波长值等) ,历表示所有可变的拟合模型参数,因此在历 中的每一个元素就表示一个膜厚值或光学常数值等,它们用口,表示,其中j 表示从1 到m , m 为拟合参数的总个数。仃表示第i 个数据点的测量误差。 根据上面的定义,可以将评价函数写为: 以矿善 鼍爿 对式( 4 1 4 ) 两边对吼作一阶微分,得到评价函数的梯度方程为: 篆卅;| ; 竽警 国防科学技术大学研究生院学位论文 定义展:一丢娑为下降方向,根据梯度法,可以得到梯度法中迭代步长方程为: zd 口o a 【女+ 1 ) :历( + 五万( 2 ( 4 1 6 ) 即该迭代步长方程为梯度法的下降步长,使得评价函数的值随着步长的变化而减小,最终 寻到初始值附近的一个局部极小值。这就是梯度法的基本原理。由此可见梯度法下降方向 反映了评价函数的一种局部性质:从局部来看,梯度下降方向是评价函数下降最快的方向, 选择这样的下降方向是有利的;但是从全局来看由于在接近极小点的时候,存在锯齿现象, 即条件数越来越大,收敛速度大为减慢。可见梯度法并不是很好的求极小值方法,但是可 以作为计算过程的前期下降迭代,能迅速下降到极小值点的附近,再次用其他算法进行计 算。因此对梯度法再进一步分析,同时对式( 4 1 6 ) 两边对珥作一阶微分,得到h e s s e 矩 阵: 磊- 2 剿掣掣也叫枷,】哿l 忉 8 n k 8 c i l乞a 弋8 n ka a i 。l 一。q 8 n k 8 n i 定义: :! 旦 ( 4 1 8 ) 2 2 卫a a k a a t ( 4 于是根据高斯一牛顿法,得到高斯一牛顿迭代步长方程为: m 巧= 鼠 ( 4 1 9 ) f - i 当迭代初始点在极小值附近,高斯一牛顿法能够很快地,而且比较准确地找到评价函 数的极小值。但是当初始点选择不合适时,优化结果往往不佳。 l - m 算法是在高斯一牛顿法的基础上进行改进的,其迭代步长方程为: m 瓦巧= 展 i = l ( 4 2 0 ) 其中,以= ( 1 + 五) ,五为常数;当七,时,以= 。 根据上述理论分析,可知当旯很大时,l m 算法退化为高斯一牛顿法;当五等于零时, l - m 算法近似退化为梯度法。理论上l - m 算法结合了梯度法和高斯一牛顿法的优点,能在 较大范围内寻得最小值,但是其仍然不是全局最优算法。当初始值选择不合适时,仍然会 陷入局部极小值,得不到全局最优解。 使用v a s e 9 型椭偏仪的数据处理程序进行拟合计算时,如果初始值选择合适,一般能 在相对较大的范围内迅速找到初始值附近的最优点。但是当使用者对初始值选择不是很精 国防科学技术大学研究生院学位论文 确,相差较大时,经常会出现陷入局部极小值的情况,得不到满意的拟合结果。 另外,在椭偏数据处理中,不得不时刻记住拟合参数之间的相关性对拟合计算的影响, 尤其是在使用导数的最优化方法中。在该方法中,要使用导数或构造类似导数的下降方向 来使得评价函数减小,获得最优解。若拟合参数白j 的相关性很强时,它们彼此互相影响着, 这时候利用导数计算出来的下降方向往往不是真正下降方向,很难计算得到满意的最优 解。 基于以上分析,可知v a s e 。型椭偏仪的数据处理程序存在一定的缺陷和不足。在实际 的操作使用中,经常不能得到符合实际的结果。 4 3 遗传算法基本原理及其在椭偏数据处理中的应用 遗传算法是一种高效、并行、全局搜索的方法,它能在搜索过程中自动获取和积累有 关搜索空问的知识,并自适应地控制搜索过程以求得最优解。目前已经被广泛地应用在众 多领域中n9 1 。 4 3 1 遗传算法基本原理及特点 遗传算法模拟了自然选择和遗传中发生的复制,交叉和变异等现象,从任一初始种群 出发,通过随机选择,交叉和变异操作,产生一群更适应的个体,使得群体进化到搜索空 间中越来越好的区域,这样一代一代地不断繁衍进化,最后收敛到一群最适应的个体,求 得问题的最优解。遗传算法的主要运算过程为: ( 1 ) 编码:解空间中的解数据x ,作为遗传算法的表现形式。从表现型到基因型的 映射称为编码。遗传算法在进行搜索之前先将解空间的解数据表示为遗传空间的基因型串 结构数据,这些串结构数据的不同组合就构成了不同的点; ( 2 ) 初始种群的生成:随即产生n 个初始串结构数据,每个串结构数据称为一个个 体,n 个个体构成了一个群体。遗传算法以这n 个串结构作为初始点开始迭代。设置进化 代数计数器t = o ;设置最大进化代数t ;随即生成m 个个体作为初始种群p ( 0 ) ; ( 3 ) 适应度值评价检测:适应度函数表明个体或解得优劣性。对于不同的问题,适 应度函数的定义方式不同。根据具体问题,计算群体p ( t ) 中各个个体的适应度; ( 4 ) 选择:将选择算子作用于群体; ( 5 ) 交叉:将交叉算子作用于群体; ( 6 ) 变异:将变异算子作用于群体; 群体p ( t ) 经过选择,交叉,变异运算后得到下一代群体p ( t + 1 ) ( 7 ) 终止条件判断:若t t ,则以进化过程中所 第3 0 页 国防科学技术大学研究生院学位论文 得到的具有最大适应度的个体作为最优解输出,终止计算。 在上述运算过程中其主要三个基本操作为:选择( s e l e c t i o n ) ,交叉( c r o s s o v e r ) 和 变异( m u t a t i o n ) 。( 1 ) 选择就是根据各个个体的适应值,按照一定的规则或方法从上一代 群体中选出优良的个体遗传到下一代群体中。选择操作使优良个体从当前群体中选出,有 机会作为父代来繁衍下一代,体现出了达尔文的适者生存原则。( 2 ) 交叉是遗传算法中最 主要的遗传操作。通过交叉操作可以得到新一代个体,新个体组合了父辈个体的特性,体 现出了信息交换的思想。( 3 ) 变异是在群体中随机选择一个个体,对选中的个体以一定的 概率随机改变串结构数据中某个串的值。变异为新个体的产生提供了机会,有阻止局部最 优收敛的作用。遗传算法的流程图如图4 1 所示。 图4 1 遗传算法流程图 大多数传统优化算法都是基于一个单一的评价函数的梯度或较高次统计,以产生一个 确定性的试验解序列,例如使用导数的最优化方法等传统算法:而遗传算法则与之不同, 其不依赖于梯度信息,而是通过模拟自然进化过程来搜索最优解。遗传算法自身具有很多 优点: ( 1 ) 对可行解表示的广泛性。遗传算法的处理对象不是参数本身,而是针对那些通 过参数集进行编码得到的基因个体。此编码操作使得遗传算法可以直接对结构对象进行操 作。这一特点使得遗传算法具有广泛的应用领域。 ( 2 ) 群体搜索特性。许多传统的搜索方法都是单点搜索,这种点对点的搜索方法对 于多峰分布的搜索空间常常会陷入局部的某个单峰极值点。而遗传算法采用的是同时处理 第3 l 页 囝防科学技术大学研究生院学位论文 群体中多个个体的方法,即同时对搜索空间中的多个解进行评估。这一特点使得遗传算法 不容易陷入局部极值中去。 ( 3 ) 不需要辅助信息。遗传算法仅用适应度函数的数值来评估基因个体,并且该适 应度函数不受连续可微的约束,可以任意设定。 ( 4 ) 内在启发式随机搜索特性。遗传算法不是采用确定性规则,而是采用概率的变 迁规则来指导它的搜索方向,因此实际上它有明确的搜索方向,而非盲目搜索。 ( 5 ) 遗传算法在搜索过程中不容易陷入局部最优。 综上所述,遗传算法是一种全局有效的随机搜索方法,具有传统最优化算法所不具备 的一些非常有用的特点。 4 3 2 遗传算法在椭偏数据处理中的应用 曾有人将遗传算法引入到椭偏数据处理中来4 l ,对单点拟合得到了一定的成功。本文 是利用遗传算法的无需赋初值,能在较大范围内迅速寻找到一个接近最优解的特点,对光 谱椭偏数据进行初值计算。 根据4 1 节可知在一般的椭偏测量中,椭偏数据处理问题都是归结为:通过不断的调 整如薄膜的光学常数,2 、消光系数k 以及薄膜的厚度d 等待拟合参量的值,计算出对应的 椭偏参数( y ,) 值,使得评价函数式( 4 1 3 ) 达到最小值,此时得到的拟合参量值认为是 最佳拟合解。于是将椭偏数据处理问题简化为求评价函数最小值的优化问题。根据遗传算 法优化理论,将其应用到椭偏数据处理中来显然是可行的。 根据4 3 1 节所介绍的遗传算法理论,在遗传算法中可以将椭偏数据处理问题作个对 应的假设简化:将数据处理问题中待拟合的参数( r l ,k ,d ) 看成遗传算法中的个体。将评 价函数m s e 来表示各个个体的适应度函数。遗传算法中对应的操作就是对待拟合的参数( n , k ,d ) 进行操作。 在遗传算法的具体优化过程中,椭偏数据处理的具体操作步骤包括: ( 1 )对拟合参数进行编码。可以选择二进制编码也可以选择十六进制编码; ( 2 ) 在搜索范围内随机产生一组初始种群,即产生很多个个体,每个个体代表一组 待拟合参数( n ,k ,d ) ; ( 3 ) 计算初始种群中每个个体的适应度函数值,即椭偏数据处理中的评价函数m s e 的值; ( 4 ) 根据计算的适应度函数值对种群进行选择、交叉和变异操作。若有其中某个个 体的适应度函数值满足终止条件时( 一般终止条件包括最多的遗传代数和终止计算的最小 第3 2 页 国防科学技术大学研究生院学位论文 评价函数值) ,输出该个体作为最优解,终止运算;若没有满足终止条件,返回之步骤( 3 ) , 继续计算。 通过上述的计算步骤,得到当评价函数m s e 值达到最小值时,对应输出拟合参数( n ,k , d ) 的最优解。根据遗传算法的理论,在处理非线性超越方程的椭偏数据处理问题中,遗传 算法能避开传统算法中许多弊端:第一,不需要设置初始值。很多传统优化算法在椭偏数 据处理问题中,都必须要人为赋予一个初始值,当初始值赋予不恰当时,由于椭偏数据处 理的复杂性,常常会使得传统优化算法失效或是得到的优化结果不能满足要求。第二,遗 传算法不依赖于评价函数的梯度信息或较高次统计。椭偏数据处理问题中,拟合参数之间 常常具有一定的相关性,而传统优化算法中一般都需要评价函数的梯度信息来指导优化方 向,当拟合参数之间的相关性较大时,这种依赖梯度信息的优化方向就可能失效。遗传算 法则不会出现这种情况。第三,遗传算法在优化过程中是用一个种群去搜索优化,而传统 优化算法则是根据评价函数的特性,由一个点到新的一个点的搜索优化,显然在某些复杂 问题中种群搜索要强于单点搜索,例如在椭偏数据处理问题中。 遗传算法自身也存在一些不足:( 1 ) 遗传算法中编码不规范及编码存在表示的不准确 性;( 2 ) 遗传算法通常的效率比其他传统的优化方法低;( 3 ) 遗传算法对算法的精度、可 信度、计算复杂性等方面尚没有有效的定量分析方法。 这些不足使得遗传算法在实际应用中存在着一些弊端:( i ) 遗传算法的优化结果不稳 定。这个不稳定是指遗传算法的优化结果一般都能在最优解的附近分布,而很难准确地找 到最优解,而且

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论