已阅读5页,还剩96页未读, 继续免费阅读
(模式识别与智能系统专业论文)面向农业领域数据的智能化模型研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国科学技术大学硕士论文 摘要 摘要 人工智能技术日新月异的发展,必然带动现代化农业的迅速发展。然而日积月 累,现在农业领域已积累了大量的宝贵数据,急需新的技术去挖掘、利用现有农 业数据之间的内在规律和本质,利用现代的信息技术去更好的服务农业,提高农 业的运作效率,减轻农民负担。本文将遗传程序设计( g e n e t i cp r o g r a m ,简称g p ) 和人工神经网络( a r t i c i a ln e u t r a ln e t w o r k ) 等技术运用于现代化的施肥模型 构造中,并与传统的施肥模型构造方法做出对比,以指出传统建模方法的不足之 处。 本文的主要工作及所作贡献如下: ( t ) 分析了进化计算中的g p 的运行机理,从g p 存在的问题出发,以提高算法搜 索效率加强收敛性能为目的,对遗传程序设计结合本实验项目作进一步改进及其 在实验室中的运用。引入一种新的符号回归算法g e p ,它集g p 和g a 的优点。 ( 2 ) 神经网络是一种有效的智能化模型建立、优化的方法,它具有一般统计方 法无可比拟的特殊优势。针对b p 算法在施肥模型建立过程的缺陷,做出了一些改 进。采用l e v e n b e r g - m a r q u a r d t 算法,可变学习速率算法,动量算法训练b p 网络, 结合仿真试验,以提高算法运行效率加强收敛性能为目的,对这几种改进算法进 行了分析和对比,同时利用g p 对神经网络的激励函数进行优化。 ( 3 ) 针对现有的施肥模型优缺点进行探讨及其将不同的建模方法应用到施肥过 程中,最后以安徽省肥西县三组施肥数据作为数据源,进行四种不同施肥模型的 试验数据比较和对比。 ( 4 ) 针对智能化施肥模型系统进行需求分析,给出了系统设计的基本框架和主 要功能设计,介绍了对历史数据可能存在异常、噪声甚至遗漏的情况等不一致数 据进行预处理。在介绍系统开发中所采用的关键技术基础上,设计了三种施肥智 能化优化模型。 关键字:遗传程序设计基因表达式程序设计人工神经网络肥料效应函数 施肥模型构造 中国科学技术大学硕士论文 a b s t r a c t a r t i f i c i a li n t e l l i g e u tt e c h n o l o g y sr a p i dd e v e l o p m e n tm a k e sm o d e ma g r i c u l t u r e d e v e l o pr a p i d l y h o w e v e r ,i nr e c e n t l ya b o u t2 0y e a r s ,a m o u n to fa g r i c u l t u r a ld a t ai s a c t u a t i n g , w en e e dn e wt e c h n o l c 。g yt om i n ea n dm a k eu s eo ft h ea v a i l a b l ec l a r a si n n e r r u l ea n de s s e n c e ,a n ds e r v ew e l lf o ra g r i c u l t u r e ,h e i g h t e na g r i c u l t u r a lp r o c e s s n e a r t i c l ea p p l i e st e c h n o l o g yo fg pa n da n nt oc o n s t r u c t i o no fm o d e mf e r t i l em o d e l ,t o p o i n to u tt r a d i t i o n a lm o d e l i n g ss h o r t c o m i n g s ,c o m p a r i n gw i t ht r a d i t i o n a lm e t h o d sf o r c o n s t r u c t i o no f f e r t i l em o d e i 1 h em a i nc o n 舡i b u 矗o n so f t h i st h e s i sa r ea sf o l l o w s : ( 1 ) f i r s t l y ,i te x p a t i a t e so ni d e ao fg p b a s e do ng p se x i s t i n gp r o b l e m , i no r d e rt o i m p r o v es e a r c he f f i c i o n c ya n di m p r o v ec o n v e r g e n c ep e r f o r m a n c e , s o m ei m p r o v e m e n t s a r ca p p l i e dt og p i nl i g h to ft h el a b sp r o j e c :t a n di n t r o d u c t i o nt oi t sa p p l i c a t i o ni no u r l a b 砀ef e r t i l em o d e lc r nb ea u t o m a t i c a l l ya c h i e v e dw i t hs e l f - a d a p t i v eo p t i m i z a t i o n a n di n t e l l i g e n ts e a r c h i n t r o d u c t i o no f an e w h y b r i ds y m b o l i cr e g r e s s i o na l g o r i t h m ( g e p ) ,w h i c hc o m b i n e st h ea d v a n t a g e so fg pa n dg a ( 2 ) s e c o n d l y ,m sa r t i c l es y s t e m a t i c a l l ye l a b o r a t e do nt h eb a s i ct h e o r yo fn e u r a l n e t w o r k s ,a n da n a l y z e do fb bs h o r t c o m i n g s i na s p e c to ft r a i n i n ga l g o r i t h m , t h i sp a 洳, r c o m p a r e ss t a n d a r db pw i t hm o m o n t u ma l g o r i t h m , v a r i a b l el e a r n i n gr a t ea l g o r i t h ma n d l e v e n b e r g - m a r q u a r d ta l g o r i t h mb yt h ec o n v e r g e n c ea n dc o n v e r g e n c er a t eo fn e u r a l n e t w o r ka n dt h i sp a p e ra l s op r o v i d e ss i m u l a t i o ne x a m p l e sf o ra i lm e t h o d su s i n gt h e f e r t i l es y s t e m m e a n w h i l ei n c e n t i v ef u n c t i o no f n e u t a ln e t w o r ki so p t i m i z e db yg p ( 3 ) t h i r d l y a d v a n t a g e sa n dd i s a d v a n t a g e so f t r a d i t i o n a lf e r t i l em o d e la r ed i s c u s s e d a n dm a n ym e t h o d so fm o d e l i n ga r ea p p l i e dt of e r t i l ep r o c e s s f i n a l l y ,b a s e do i lf e r t i l e d a t ao ff e i x ic o u n t yi np r o v i n c eo fa u l a u i ,r e s u l t so ff o u l d i f f e r e n tf e r t i l i z a t i o nm o d e la l e c o m p a r e d ( 4 ) f i n a l l y , t l l i st h e s i sf i n a l l ys h o w st h et e c h n i c a ld e t a i l so f i n t e l l i g e n tf e r t i l em o d e l s y s t e m ,t h e r em a yb en o i s ea n dt h ed a t am a yb em i s s i n gi nt h ee o u t s eo fh i s t o r yd a t a t r a n s m i s s i o n d i f f e r e n ta l g o r i t h m sa r eu s e df o rd a t ap r e p r o c e s s i n g f i n a l l y ,t h e ef e r t i l e m o d e l sa r ec o n s t r u c t e d k e y w o r d s :g e n e t i cp r o g r a mg e n e t i c e x p r e s s i o np r o g r a m a r t i f i c i a ln e tw o r k e f f e c t i v ef u n c t i o no ff e r t i l i z e rc o n s t r u c t i o no f f c r t i l em o d e l n 中图科学技术大学硕士论文 第一章绪论 众所周知,对于近年来出现的农业生产中存在的深层次问题( 如施肥模型的 的构造和优化、农产品价格预测、各种病虫害等级的预测等) ,迫切需要计算机技 术和智能化信息处理方法来解决,建立集知识、信息、智能技术等生产经营诸要 素为一体的开放型、高效化、高科技的新型农业,更好为现代化农业服务,提高 农业的运作效率。将遗传程序设计方法及人工神经网络等智能工具应用到旌肥模 型构造、预测研究中,大大简化了决策难度,为实施正确、有效和科学的决策提 供了方便。 1 1 智能计算概述 智能计算方法是8 0 年代初兴起的具有智能化的计算方法。它包括进化计算以 及人工神经网络( a r t i f i c i a ln e u t r a l ,a n 等现代化优化计算方法。 1 1 1 进化计算 生物进化过程就是生物对环境逐步适应的一种优化过程。早在2 0 世纪3 0 年 代就有入设想可以通过模拟生物进化过程来达到学习与优化的目的【1 】。在生物界, 一种生物中个体之间的差异是由包含在生物体内的染色体之间的差异来体现的, 这种差别既反映在生物体自身的结构上,也反映在它们所处的环境的行为上;而 结构与行为的不同又表现在它们生存与繁殖率的不同。在环境中,性能好的生物 体( 适应性更强的个体) 具有更高的生存与繁殖率;反之,生存与繁殖率则较低。 经历过若干代之后,就整体而言,生物群体逐渐包含了更多的个体,其染色体的 结构在环境中表现出更加优良的性能。这样,随着时间的推移,群体中个体的结 构由于自然进化而发生变化。这就是达尔文在物种起源中描述的适者生存和 自然选择的概念。从某种意义上讲,达尔文的进化论。物竞天择,适者生存,不 适者淘汰”实际上就描述了一种强壮的搜索、竞争与优化机理。在生物的每一个 层次,如细胞、组织、个体和群体,其进化过程都极其复杂,要用数学方式完全 描述其过程并发展相应的优化理论方法是不现实的,人们只能对进化过程进行简 化模拟,从中抽象出本质特征,并用适当方法来描述,生物进化的历史可以用群 体和种群内部或其之间所发生的物理过程来解释,从大的方面来讲,这些过程是 繁殖( r e p r o d u c t i o n ) 、变异( m u t a t i o n ) 、竞争( c o m p e t i t i o n ) 和选择( s e l e c t i o n ) 。 这样,在对生物进化过程进行模拟时,就应在总体上( 宏观上) 抽象地描述这四 中国科学技术大学硕士论文 绪论 个过程。在2 0 世纪6 0 年代初期,有一些学者开展了这方面的研究工作,并最终 形成了一类具有鲜明特色定优化方法,即进化计算方法。典型的代表有美国 j h h o l l a n d 教授提出的遗传算法( g e n e t i ca l g o r i t h m ,简称g a ) 、美国j 0 h nk o z a 教授提出的遗传规划( g e n e t i cp r o g r a m m i n g ,g p ) ,美国科学家l j f o g e l 的进化 规划( e v o l u t i o a n r yp r o g r a m m i n g ,简称e p ) ,德国科学家i r e c h e n b e r g 的进化策略 ( e v o l u t i o ns l x a t e g i e s ,简称e s ) 等【2 】。这四种典型的优化方法均属于随即优化方 法,原理上可以以较大的概率找到优化问题的全局最优解。 它们的基本的流程如下; 随机初始化种群p ( 0 ) 5 算l ,x 2 ,h ,t = 0 ; - t - gp ( o ) 中个体的适应值; w h i l e ( 不满足终止规则) d o 由唧) 通过遗传操作形成新的种群p ( ,+ 1 ) ; 计算p ( f + 1 ) 中个体的适应值,t = t + l ; 这四种方法具有相同的框架,又具有各自的特点,如e p ( 进化规划) 与g a ( 遗传算法) 在原理上相似,在具体实现方面有差别。e s ( 进化策略) 与e p ( 进 化规划) 之间具有一定的类似性。两者之间的区别主要包括两个方面。首先两者 采用的选择方法不同,e s 的选择方法是确定的,而e p 则是随机的。其次,e s 中 可以引入交叉算子,而e l 中确不需要。另外g p 与g a 的实现过程也有较大的差 异,主要表现在编码不同和初始化种群的产生方式不同。g a 常常采用二进制的 0 1 字符编码,而g p 组成群体的个体是动态的树状结构。树的结点有终止符、原 始函数与运算符组成。这种树状的层与结点是可变化的。每个分层结构的树对应 问题的一个可能解。也可以理解为求解该问题的一个计算机程序。遗传算法的初 始种群由若干具有定长字符串的个体组成。而遗传程序设计的初始群体由随机组 成的个体树组成。个体树又由符合问题范围的函数和变量组成。初始群体的生成 也可采用不同的方法;常用的有完全法、生长法和混合法。 到目前为止,进化算法方法主要是求解组合优化问题以及存在不可微的目标 函数或约束条件复杂的非线性规划问题,较常规的基于梯度寻优的数学优化技术 为优,该方法无可微要求,适应范围广,带有随机优化特性,有较大的概率求得 全局最优解。 2 中啻科学技术大学硕士论文 绪论 1 1 2 遗传程序设计的应用领域 一个实际应用领域,如果具备以下若干或是全部特征,则该领域就特别适合 于遗传程序设计的应用:在一个领域中,传统的数学分析方法没有或不能提供解 析结果:对相关变量之间的内在联系了解得很少或者现有阿理解很可能是错误的; 找出问题的解的形状和大小是问题的一个主要部分;近似解是可以接受的,或者 只可能得到近似解;有大量的数据需要检查、分类和集成,并且数据可用计算机 程序表示;能够很容易衡量在性能方面的微小改进,并且获得高效能。 遗传程序设计的应用范围广阔,可分为四大类:面向计算机科学、面向科学、 面向工程以及面向艺术和娱乐。下面就这几个方面进行简要讨论。 在计算机科学方面,算法的生成是受关注的一个焦点。g p 是一个操纵符号结 构,采用自然选择和进化机制的搜索方法。它从研究排序算法、缓存算法、随机 数生成器以及并行代码的自动生成到加速函数评价的机器代码的进化,g p 在计算 机科学上的应用,存在的总趋势是尝试对各种各样的算法实现设计过程的自动化。 在科学方面,典型的应用是建模和模式识别。对物理和化学的某个过程进行 建模有助于更好地理解所研究的系统。g f 是生物化学领域的一种数据挖掘方法, 若从特征获取的角度来讨论问题,可以使用g p 进行特征分析和数据分类。 在王程方面,g p 在控制领域有很大的潜力,因为许多控制问题很难或不可能 用现有的分析方法来解决,其中过程控制和机器人控制是g p 的主要应用,在性 能上可与其它的计算智能方法,如神经网络或模糊系统相竞争,g p 还可以与这些 智能方法结合起来解决工程问题。 在艺术和娱乐方面,g p 可用来进化真实的动画和引人入胜的可视图形,还可 以从音乐制作中提取信息,使得自动合成音乐片段成为可能。 1 , 1 3 人工神经网络概述 人工神经网络( a n n ) 是近几年来根据对人脑结构及人的认知、思维原理的研究 成果发展起来的十分热门的交叉学科。它涉及生物、电子、计算机、数学和物理 等学科,为当今的科研及工程实践提供了行之有效的手段,具有非常广阔的应用 前景,它的发展将会对今后科学的发展产生了重大的影响。 a n n 是由大量简单的信息处理单元( 神经元) 广泛连接而成的复杂网络,用来 模拟人脑神经系统的结构和功能,是一种简化的人脑数学模型。从解剖学和生理 学来看,人脑是一个复杂的并行系统,它是由大量的神经细胞组合而成的,每个 神经元具有独立的接受、处理和传递电化学( e l c c l x o c h e m i c a l ) 信号的能力。这种 传递经由构成大脑通信系统的神经通路所完成。图1 1 所示是生物神经元及其相 3 中国科学技术大学硕士论文 绪论 互联接的典型结构。 人工神经网络是采用物理可实现的系统来模仿人脑神经网络的结构和功能的 系统。它是由很多处理单元有机的联系起来,进行并行的工作,每个处理单元十 分简单,其工作“并行”进行,它的信息传播、存储方式与人体的神经网络相似 它没有运算器、存储器、控制器这些现代计算机的基本单元,而是相同的简单处 理器的组合。它的信息是存储在处理单元之间的连接上,因而它不同于传统的 n e u m a n n 式计算机,更重要的是它具有“认知”、“意识”和“感情”等高级脑功 能。 神经网络具有大规模并行信息处理、自适应与自学习等许多特性,神经网络 既是高度非线性动力学系统,又是自适应组织系统,可用来描述认知、决策及控 制的智能行为,它的中心问题是智能的认知和模拟。8 0 年代初,神经网络的崛起 己对认知和智力的本质的基础研究乃至计算机产业都产生了空前的刺激和极大的 推动作用。 图1 - 1 典型的生物神经兀 进入到9 0 年代以后,随着计算机的普及以及计算能力的迅速提高,神经网络 计算机向更加智能化的方向发展,与人的大脑的功能愈来愈相似。现代的神经网 络已经从线性向非线性过渡,向大型化,复杂化,广义化的方向发展了,神经网 络也变得越来越复杂,涉及的方面也越来越广,应用领域也越来越大。这些领域 主要包括:模式识别、信号处理、知识工程、专家系统、优化组合、机器人控制 等。随着大量神经计算机和神经元芯片应用于高科技领域,人工神经网络将会具 有更加诱入的前景。 近十年来,神经网络理论与实践有了引人注目的进展,它再一次拓展了计算 概念的内涵,使神经计算、进化计算成为新的学科,神经网络的软件模拟得到了 广泛的应用。 近年来,我国“8 6 3 ”计划、攻关计划、“攀登”计划和国家自然科学基金等,都 对神经网络的研究给予了资助,吸引了大量的优秀人才从事神经网络领域的研究 工作,促进我国在这个领域取得世界上的领先地位。因此,在2 1 世纪科学技术发 4 中国科学技术大学硕士论文 展征途中,神经网络的发展将日新月异。 l - 2 本课题的研究意义及主要研究工作 本课题将智能计算中的遗传程序设计和人工神经网络技术应用于农业领域的 施肥模型构建和施肥量预测中众所周知,对于近年来出现的农业生产中存在的深 层次问题( 如施肥模型的的构造和优化、农产品价格预测、各种病虫害等级的预 测等) ,迫切需要计算机技术和智能化信息处理方法来解决,建立集知识、信息、 智能技术等生产经营诸要素为一体的开放型、高效化、高科技的新型农业,更好 为现代化农业服务,提高农业的运作效率。将遗传程序设计方法及人工神经网络 等智能工具应用到施肥模型构造、预测研究中,大大简化了决策难度,为实施正 确、有效和科学的决策提供了方便。 本论文的主要研究工作如下: ( 1 ) 分析了进化计算中g p 的运行机理,从c a p 存在的问题出发,以提高算法搜索 效率和加强收敛性能为目的,对遗传程序设计在优化方面结合本实验室方向做进 一步改进在g p 和g a 的基础上引入一种新的模型建模方法g e p 。 ( 2 ) 分析了人工神经网络的运行机理,针对应用较广泛的b p 网络存在的缺陷, 采用l e v e n b e r g - m a q u a r d t 算法,可变学习速率算法,动量算法训练b p 网络,结 合仿真试验,以提高算法运行效率加强收敛性能为目的,对这几种改进算法进行 了分析和对比。针对b p 网络的函数逼近能力理论分析了神经网络函数逼近的运行 机制。 ( 3 ) 对现有的施肥模型优缺点进行探讨及其将不同的建模方法应用到施肥的实际 实践中,加以比较,最后实现此建模系统。 ( 4 ) 详细说明了智能计算施肥模型优化系统的设计原理、框架、重要技术指标及关 键技术的实现。 1 3 本论文的结构框架 全文共分为6 章,安排如下: 第t 章绪论:本章描述以进化计算、神经网络等技术构成的智能计算方法的 诞生和发展,为农业领域数据的建模、优化问题提供了一条有效的途径。接着详 细介绍了进化计算和神经网络的背景知识。最后归纳了本课题的研究意义和主要 研究工作,并大致概括了本论文的结构框架。 第2 章遗传程序设计理论概述:本章首先对g p 算法的产生机理做了分析: 个体以树状层次结构表示:初始个体生成有三种方法:完全法、生长法和混合法, 5 中国科学技术大学硕士论文绪论 其中以混合法最为有效;适应度评价有原始适应度,标准适应度、调整适应度和 归一化适应度之分:通过一定的选择策略选择个体参加基本遗传操作如复制、交 叉和变异等:这些选择策略常用的包括适应度一比例选择,贪婪选择,基于排名 的选择和竞赛选择,其中竞赛选择使用较多;遗传程序设计通过一定的人为干预 终止演化过程,并将合适的输出结果作为最终问题的解;控制参数都有相应的默 认值,恰当地选取对进化过程有很大的影响。其次,分析了g p 在本实验中的实 际运用情况,g p 在云南病虫害预测预报系统中解决了病虫害预测预报建模,能够 较准确得统计出病虫害发生规律,较好预测来年病虫害发生情况。在实际的运用 中,发现了g p 存在的主要问题:慢而耗时、早熟收敛以及代码膨胀。针对这些 问题,从多个方面对g p 进行了改进,提高g p 运行效率。另外设计了混合g p g a 算法,通过仿真实验可以看出,混合g p g a 比单纯的遗传程序设计明显提高了算 法的拟合率和预测率,而且g p g a 中遗传算法采用适当的小种群效果更好。在 g p g a 基础上引入一种新的建模方法g e p ,它克服了g p 常见的代码冗余和运 行速度缓慢的缺陷。 第3 章神经网络理论概述:本章首先分析了神经网络的基本组成单元人工神 经元,介绍了人工神经元的基本组成以及激活函数,并且简单介绍了人工神经元 的拓扑结构。然后对神经网络的运行过程进行了分析介绍。人工神经网络的拓扑 结构是多种多样的,但其工作过程大体可分为两个阶段:网络的学习阶段和网络 的联想阶段。同时针对其运行过程中的学习规则进行了分析。其次,介绍了b p 神经网络的网络构成,训练过程并且给出了标准b p 学习算法。另外,讨论了b p 算法的缺陷,比较了标准b p 算法、动量算法、可变学习速率算法和 l e v e n b e r g m a r q u a r d t 算法这几种方法的收敛性能以及收敛速率,并通过m a t l a b 仿 真实例进行了仿真,从仿真结果看出这几种算法的收敛速率各不相同。在相同条 件下,标准b p 算法收敛速率最慢,l e v e n b e r g - m a r q u a r d t 算法收敛速率最快。对 于b p 网络收敛速率慢,甚至不收敛的问题,提供了有益的思路。 第4 章施肥模型的构造与总结:本章首先对施肥模型的研究意义进行了分析, 针对现有的施肥模型,阐述了优缺点,并加以改进。其次将g p 、人工神经网络、 线性回归技术运用于旌肥模型构建、优化过程中,并对施肥量进行预测:对三种 模型的特点加以分析。然后通过仿真实验,以安徽省肥西县三组旅肥历史数据为 例,进行了四种模型构造和施肥量预测,并对实验结果进行了对比和对照,做出 了理论上的分析。 第5 章智能计算施肥模型优化系统开发研究:本章首先对施肥模型进行了需 求分析,确立了系统的目标及设计原则,给出了系统的基本框架和主要功能设计。 其次针对施肥历史数据可能存在异常、噪声甚至遗漏的情况对这些含有噪声、不 6 中围科学技术大学硕士论文 一致或不完整的数据进行预处理。另外,为了提高b p 网络的训练速度和灵敏性, 要对训练数据进行标准化和正规化处理。然后,介绍了系统开发过程中所采用的 关键技术,包括m v c 模式、观察者模式等,并对这些技术在系统中的实现方法 作了介绍和分析。最后根据施肥历史数据设计了基于g p 、人工神经网络、线性回 归算法,并综合以上技术实现了实用化的施肥模型优化系统,并给出了系统运行 的部分界面。 第6 章结论与展望:本章回顾总结了全文的工作,并讨论了今后课题发展的 进一步研究方向。 1 4 本章小结 本章重点描述了以进化计算、神经网络等技术构成的智能计算方法的诞生和 发展,为农业领域数据的智能优化问题提供了一条有效的途径。接着详细介绍了 进化计算和神经网络的背景知识。最后归纳了本课题的研究意义和主要研究工作, 并大致概括了本论文的结构框架。 7 中国科学技术大学硕士论文遗传程序设计概述及改进研究 第二章遗传程序设计概述及改进研究 遗传程序设计( g e n e t i cp r o g r a m m i n g ,o p ) 由遗传算法( g e n e t i ca l g o r i t h m , g a ) 派生而来,引入层次化的计算机程序更灵活地处理遗传算法中的表示策略。 而遗传算法是受到遗传学的启发而发展的,因此在介绍遗传程序设计之前,有必 要了解一下生物进化理论和遗传学的基本知识。 2 1 生物学基础 生命的基本特征包括生长、繁殖、新陈代谢和遗传与变异。生命是进化的产 物。现代的生物是在长期迸化过程中发展起来的。1 8 5 8 年【3 】,达尔文用自然学说 ( n a t u r a ls e l e c t i o n ) 来解释物种的起源和生物的进化,包括以下三个方面: ( 1 ) 遗传( h e r e d i t y ) :这是生物的普遍特征,亲代把生物信息传给子代,子代按照所 得信息而发育、分化、因而子代总是和亲代具有相同或相似的性状。生物有了这 个特征,物种才能稳定存在。 ( 2 ) 变异( v a r i a t i o n ) :亲代和子代之间以及子代的不同个体之间总有些差异。这种现 象称为变异,变异是随机发生的,变异的选择和积累是生命多样性的根源。 ( 3 ) 生存斗争和适者生存( s u r v i v a lo ft h ef i t t e s t ) :自然选择来自繁殖过剩和生存斗 争。由于弱肉强食的生存斗争不断进行,其结果是适者生存,具有适应性变异的 个体被保存下来,不具有适应性变异的个体被淘汰,通过一代代的生存环境的选 择作用和物种变异,性状逐渐和原来的祖先不同,演变为新的物种。 遗传程序设计就是借用生物进化的规律,通过繁殖、遗传、变异、竞争,实 现优胜劣汰,一步一步逼近问题的最优解,它的运算原则常常与生物进化及遗传 学说吻合,而且其术语也常常仿照生物学的术语。 遗传程序设计的运算基础是树状结构的计算机程序,它相当于生物学中的染 色体。树状结构由一系列函数和终止符组成,每个树结点都有其特定含义,反映 所解决问题的某个特征,这就相当予基因,亦即染色体瑚吒a 的片断。在进行交叉、 变异操作时,遗传程序设计只涉及树状结构的某些子树,这就类似于遗传过程只 涉及某些基因而不是整个染色体。 在生物学中,生物个体所表现出来的性状被称作表现型,把反映表现型的基 因组称作基因型。与此相对应,在遗传程序设计中,表现型就相当于所求问题的 特征,如可行解、可行策略等,基因型则视作树状结构。 8 中国科学技术大掌硕士论文遗传程序设计概述及改进研究 2 2 机理分析 遗传程序设计提出了种全新的结构描述方法,其实质是用广义的层次化计 算机程序描述问题,这种广义的计算机程序能够根据环境的变化动态地改变其结 构和大小。基本思想是:随机产生一个适合于给定环境的初始群体,即问题的搜 索空间,构成群体的个体都有一个适应度值,依据达尔文适者生存原则,用遗传 算子处理得到高适应度的个体,产生下一代的群体,如此进行下去,给定问题的 解或近似解将在某一进化代上出现。为了产生最终给定问题的个体,遗传程序设 计的算法如下; 在描述g p 算法之前作如下约定: j r :适应度函数,评估种群尸中的每一个个体p 的适应性程度。这是个体演化的主 要推动力: 3 :用作终止条件的允许误差; 毋:种群p 的规模; ,:交叉概率; :变异概率; 五:用作可选终止条件的限制( 运行时间或代数等) ,小于旯表示未达到限度; 由此g p 算法给出如下: g p ( 厂,3 ,p ,弘,旯)( 2 1 ) 具体流程描述如下; ( i ) 初始化种群p ,随机产生粤个个体树: ( 2 ) 对于种群尸中每一个体p ,计算其适应度值f ( p ) ; ( 3 ) 当( ( m i n ( i f ( p ) 1 ) p d 劝 ( o)(214) 由( 2 1 3 ) 和( 2 1 4 ) 式易知,建模问题实际上可以看成如下的一个优化问题: r a ,i 。n 以( ,( ) ) ,) )( 2 1 5 ) 传统的优化算法,需要将所解决的问题用数学式子表示,常常要求该数学函 数具有一阶或二阶导数,即要求具有连续、可微、单峰等特性。这样,方法的限 制性太强,计算公式复杂,准各工作量大。 另一方面,传统的解决建模问题的方法有数据拟合、回归分析及逼近论等方 法。这时问题转化为确定某一给定函数( 也称为模型) 厂( 置w ) 中的参数 1 9 中国科学技术大学硕士论文遗传程序设计概述及改进研究 w = ( w 。,w :,w 。) 去拟合、插值或逼近已知数据对。显然,模型八w ) 的选择对 这类方法是至关重要的。因为不适合的模型选择即使具有最优参数也不能很好的 用来估计和外推系统的行为,从而使建模过程失去意义。然而,针对一个问题, 即是对原问题的背景知识比较了解,如何选择一个合适的模型及进行参数估计也 是很困难的。 建模的另一类方法是使用人工神经网络。虽然,人工神经网络可以作为一种 抽象模型来处理建模问题中对系统进行分类或外推等问题,但是神经网络的性能 极大地依赖于网络结构和权值。而就具体问题设计一个神经网络( 包括网络结构的 确定及权值的优化) 本身也很困难。而且,神经网络不能很好地观察到数据结构, 即,在演化神经网络模型时无法确定输入和输出结点之间的内在联系,属于“黑 箱”操作。但很多情况下需要了解潜在的过程结构j 以及精确的数值预测。 2 3 2g p 建模在云南病虫害预测预报系统中的运用 本系统( 系统总体结构图如2 6 ) 是基于云南省地理环境,结合省内土壤信息与 病虫害发生情况开发出一套基于地理信息系统的土壤养分、专家系统推广信息、 病虫害预测预报系统。该系统将地理信息和病虫害的预测结合起来,可以直观的 预报病虫害程度和病情分析,并且能够查询、分析相应的n 、p 、k 分布。 在本系统的病虫害预测预报模块中,预测模型是病情预测的关键,它反映了 病情与影响因子之间的数学关系。农业病虫害流行的规律复杂,影响因素众多。 因此,为了提高模型的准确性,采用基于g p 的智能建模方法,根据预测区域的 病虫害历史数据,寻找“影响因子”间的内在关系,建立相应的数学模型,最终 实现训练数据误差平方和最小。 下面我们以云南省屏边县为例,根据1 9 9 6 2 0 0 5 年共l o 年的水稻纹枯病资料 分析,筛选出四个关键预测因子:x 1 :温度( ) ;x 2 :相对湿度( ) ;x 3 :品种 抗病性;x 4 :密度( 万株) ;各因子数据见表2 3 。 中国科学技术大学硕士论文 遗传程序设计概述及改进研究 图2 6 系统的总体结构框架图 表2 3 云南屏边县病虫害历史数据的案例 。m历史年份病虫害名称温度( l相对瀑度( )7 品种抗病性离发( j ,株)病虫害等缓 l1 9 9 6 水稻纹枯病 2 8 9 621 23 21 9 9 7水稻纹枯病 3 l9 02 1 23 3 1 9 9 8水稻纹枯病 2 6 9 321 3l 41 9 9 9 水稻纹枯病 1 7 9 421 23 52 0 0 0水稻纹枯病 2 98 92i2 5 3 62 0 0 l 水稻纹枯病 3 l 9 621 24 72 0 0 2 水稻纹枯病 2 2 7 62l2 5 5 82 0 0 3 水稻纹桔病 2 58 02 1 21 92 0 0 4水稻纹枯病2 4 9 82l2 5l 1 0嬲 水稻纹枯病 2 69 02 1 2i 注:品种抗病性:1 为高抗,2 为中抗,3 为低抗。耩虫吝;1 轻发生,2 倔轻发生t 3 中等发生。4 偏重发生。5 大发生。 为了和g p 建模模型进行对比分析,我们采用最d , - 乘法获得了系统的线性 回归模型: t ;3 0 7 4 8 + 0 0 8 * x l + 0 2 5 1 l x 2 + o 0 4 2 x 3 + 0 0 5 x 4 ( 2 1 6 ) 而通过g p 自适应建模所得的模型为: i 气( 】2 ( ( s 缸c o s ( ( x l x 2 ) ) ) + ( c o s ( ( ( x l x 3 ) ( ( o 1 2 7 x 4 ) + x 3 ) ) y ( ( ( o 1 2 7 。x 4 ) ( ( 1 2 2 3 s i n ( x 3 ) y s i n ( s i n ( 1 6 7 1 ) ) ) m ( 1 2 2 3 - x 2 ) ,s i s i n ( ( x 2 ) “) ) ) ) ) ) h - 1 0 9 ) ) h ( ( ( ( o 1 2 7 x 4 h ( c o s ( x 2 h s i n ( s i n ( x 1 ) ) - ( 1 0 9 ) ) ) + c , o s ( ( ( s i n ( o 5 5 9 卜o 5 5 9 ) 卜x 4 ) ) ) 卜( ( ( c o s ( x 2 y s i n ( 1 6 7 1 ) ) c o g ( ( s i n ( o 5 5 9 ) + o 5 5 9 卜) 【3 ) ) w ( 0 1 2 7 x 3 h 2 ) ) ) + ( s j n ( ( ( s i n ( o 5 5 9 ) + 0 5 5 9 ) ( s i n ( x 1 ) ( s i n ( ( x 2 x 3 ) 卜0 1 2 7 ) ) ) ) ( x l x 2 ) ) ) + ( c o s ( x 1 ) ( ( ( s i n ( ( c o s ( c o s ( ) 【) 卜x 2 ) 卜s i n ( 1 6 7 1 ) ) e o s ( ( x 3 - ( 0 5 5 9 - ( x 3 - 1 1 4 7 ) ) ) ) h ( c o s ( s i n ( 1 6 7 1 ) ) ( ( ( 1 2 2 3 - c o s ( x 1 ) 1 ) s i n ( 1 6 7 1 ) ) ( - 1 0 9 ) ) m ( s i n ( ( 1 2 2 3 s i n ( x 1 ) ) h ( ( 1 2 2 3 - x 1 ) c o s ( x 1 ) ) + x 4 ) ) ( ( 1 2 2 3 - x 2 ) c o s ( ( 1 2 2 3 - ( 0 1 2 7 + x 3 ) ) ) ) ) ) ) ) ” ( 2 1 7 ) 2 1 中国科学技术大学硕士论文遗传程序设计概述及改进研究 表2 4g p 模型和线性模型的对比分析。 f 毒嚣i 等 嚣# 芒蓦j 甜# 匮蓼雾霉攀嚣零谶零零譬鬻黧琴要鬻露翠鬻覆葱 实际等缀 ;鬟渗鞣篆ji 缸瓤;藩嚣睡圣j轰囊鐾辩i 叠 ! 。,一 1 9 9 632 3 1 2 0 9 23 0 0 0 8 9 6- o 2 2 9 3 0 3o 0 0 0 2 9 9 擎臻 1 9 9 732 6 3 5 4 9 73 o 1 0 9 4 8- o 1 2 1 5 0 10 0 0 3 6 4 9 隧 1 9 9 8ll6 0 5 9 4 90 9 9 2 4 0 4o 6 q 5 9 4 9- 0 0 0 7 ,9 6 1 9 9 932 4 6 5 2 3 32 0 d 7 3 2 2- o 1 7 8 2 5 6m 3 3 0 8 9 3 2 0 ( ) 032 4 2 4 6 8 730 0 3 8 7 0m 1 9 1 7 7 1o 0 0 1 2 9 0 翳 2 0 0 l 4 33 5 3 7 9 039 5 6 9 7 90 1 6 1 5 5 2旬0 1 0 7 5 5 2 0 0 2548 8 9 0 8 44 9 9 0 4 6 00 0 2 2 1 8 3- 0 0 0 1 9 0 8 圈 2 0 0 3li 7 1 9 4 5 lo 9 9 5 3 0 80 7 1 9 4 5 l1 0 0 ( 1 4 6 9 2 2 0 0 41i 6 7 4 7 7 31 0 1 6 1 2 60 6 7 4 7 7 30 0 1 6 1 2 6 黔蠲 2 0 ( ) 5l1 4 3 5 9 5 80 9 9 5 1 9 3o 4 3 5 9 5 80 0 0 1 4 8 0 7 嚣轰葱篓嚣隧戮磷鬻黼缫霾鬻鬟鬈琵霆 o 5 3 4 0 8 90 2 7 5 8 8 8 瘸虫害等投趋势图 图2 7 回归模型与g p 预测病虫害等级图 由表,回归模型的均方根误差值为0 5 3 4 0 8 9 ,而g p 模型的仅为0 2 7 5 8 8 。g p 模型的最大预测误差为0 3 3 0 8 9 3 ( 1 9 9 9 年) ,而回归模型的最大预测误差为 o 7 1 9 4 5 1 。通过g p 自适应获取的模型,能够较准确得揭示各因子与病虫害发生等 级之间的内在规律,从而较传统建模方法,准确度大大提高。由图2 7 可以看出, g p 模型能很准确地拟合病虫害发病灾情,能揭示病虫害发病内在规律和来年发病 走势。 臻瓣抑研冁 中国科学技术大学硕士论文 遗传程序设计概述及改进研究 2 4g p 的性能改进 2 4 1g p 在实际运用中存在的主要问题 由于具有自组织、自学习和自适应的优越特性,遗传程序设计在早期就被应用 于解决工业和学术界的很多实际问题。尽管它在理论上十分完备并且也取得了应 用上的成功,但是仍有一些为解决的问题阻碍遗传程序设计的效率得到进一步的 提高,这些问题主要包括如下几个方面; ( 1 ) 遗传程序设计是慢而耗时的过程,需要消耗很大的计算资源。g p 程序需 要在内存中存储计算机程序进行多次迭代的运算( 适应度评估和遗传操作) 。另外, g p 需要较大的种群数目来获得问题的最优解,这也势必会增大其资源开销。 ( 2 ) 遗传程序设计常常受早熟( p r e m a t u r ec o n v e r g c n c 宅) 的困扰。即遗传程序 设计易形成具有相似语法树或近似适应度值的子代个体。早熟问题将会使整个种 群演化过程停滞不前或很缓慢,较难发现更好个体。 ( 3 ) 代码膨胀( c o d eb l o a t i n g ) 也是困扰遗传程序设计的一个问题。代码膨胀 问题几乎出现在遗传程序设计的所有应用中,是g p 慢和耗费资源的主要原因。 2 4 2 本课题组对g p 性能改进所傲的工作 我们在将g p 运用于建模中,遇到如下的问题: ( 1 ) 群体中的个体经过一定代数迭代之后,明显感觉到群体缺乏多样性。即种 群中相似的个体太多,不利于演化和找到最优解。 改进措施:维护种群的多样性 此类问题属于早熟现象,它会使整个种群演化过程停滞不前或很缓慢,最主 要原因是缺乏群体的多样性。研究者们虽然提出了多种方法来维护种群的多样性, 包括表现型和遗传子型。这些方法需要在每代计算像结构距离、熵、方差等这样 的测度值,虽然在一定程度上抑制了早熟现象,但是却比原g p 系统更耗费时间。 本实验受l e o n a r d ov a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 教师教学督导与反馈制度
- 幼儿院幼儿护理与保健制度
- 幼儿园学生健康档案制度
- 2026年上半年云南特殊教育职业学院招聘人员(6人)笔试备考试题及答案解析
- 2026年绍兴高新技术产业开发区控股集团有限公司专业人才公开招聘2人笔试备考题库及答案解析
- 2026山东事业单位统考济宁高招聘4人笔试备考题库及答案解析
- 赣州市人力资源有限公司现面向社会公开招聘派遣制员工1名笔试备考试题及答案解析
- 2026湖南长沙市长郡梅溪湖中学春季学期代课教师招聘10人笔试备考题库及答案解析
- 2026河南郑州高新区春藤路第一幼儿园招聘3人笔试模拟试题及答案解析
- 2026上半年云南事业单位联考残疾人联合会直属事业单位公开招聘人员笔试参考题库及答案解析
- 2025内蒙古电力集团招聘笔试考试笔试历年参考题库附带答案详解
- 交通警察道路执勤执法培训课件
- 十五五学校五年发展规划(2026-2030)
- 洗浴员工协议书
- GB/T 17642-2025土工合成材料非织造布复合土工膜
- 清欠历史旧账协议书
- 乙肝疫苗接种培训
- 心衰患者的用药与护理
- 食品代加工业务合同样本(版)
- 车间管理人员绩效考核方案
- 安全生产应急平台体系及专业应急救援队伍建设项目可行性研究报告
评论
0/150
提交评论