遗传算法XX讲解材料

上传人：小*** IP属地：四川上传时间：2020-04-01 格式：DOC 页数：10 大小：98.39KB 积分：15 举报 版权申诉

已阅读5页，还剩5页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

遗传算法遗传算法XXXX讲解材料讲解材料遗传算法遗传算法的基本思想是基于Darwin进化论和Mendel的遗传学说的 Darwin进化论最重要的是适者生存原理它认为每一物种在发展中越来越适应环境物种每个个体的基本特征由后代所继承但后代又会产生一些异于父代的新变化在环境变化时只有那些能适应环境的个体特征方能保留下来 Mendel遗传学说最重要的是基因遗传原理它认为遗传以基因形式包含在染色体内每个基因有特殊的位置并控制某种特殊性质所以每个基因产生的个体对环境具有某种适应性基因突变和基因杂交可产生更适应于环境的后代经过存优去劣的自然淘汰适应性高的基因结构得以保存下来遗传与进化的系统观生物的所有遗传信息都包含在染色体中染色体决定生物的性状染色体是由基因及其有规律的排列构成遗传进化过程发生在染色体上生物的繁衍由基因的复制过程完成通过同源染色体之间的交叉或染色体的变异会产生新物种使生物呈现新性状对环境适应性好的基因比适应性差的基因有更多机会遗传到下一代遗传算法的基本概念由于遗传算法是由进化论和遗传学机理而产生的直接搜索优化方法故而在这个算法中要用到各种进化和遗传学的概念这些概念如下串 String 它是个体 Individual 的形式在算法中为二进制串并且对应于遗传学中的染色体 Chromosome 群体 Population 个体的集合称为群体串是群体的元素群体大小 Population Size 在群体中个体的数量称为群体的大小遗传算法的基本概念串结构空间S S在串中基因任意组合所构成的串的集合基因操作是在结构空间中进行的串结构空间对应于遗传学中的基因型 Genotype 的集合参数空间S P这是串空间在物理系统中的映射它对应于遗传学中的表现型 Phe notype 的集合非线性它对应遗传学中的异位显性 Epistasis 适应度 Fitness 表示某一个体对于环境的适应程度遗传算法的基本实现编码GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型数据这些数据的不同组合便构成了不同的点初始群体的生成随机产生N个初始串结构数据每个串结构数据称为一个个体 N个个体构成了一个群体 GA以这N个串结构数据作为初始点开始迭代适应性值评估检测适应性函数表明个体或解的优劣性不同的问题适应性函数的定义方式也不同遗传算法的基本实现选择选择的目的是为了从当前群体中选出优良的个体使它们有机会作为父代为下一代繁殖子孙遗传算法通过选择过程体现这一思想进行选择的原则是适应性强的个体为下一代贡献一个或多个后代的概率大选择实现了达尔文的适者生存原则交换交换操作是遗传算法中最主要的遗传操作通过交换操作可以得到新一代个体新个体组合了其父辈个体的特性交换体现了信息交换的思想变异变异首先在群体中随机选择一个个体对于选中的个体以一定的概率随机地改变串结构数据中某个串的值同生物界一样 GA中变异发生的概率很低通常取值在0 001 0 01 之间变异为新个体的产生提供了机会遗传算法的基本实现 GA的计算过程为选择编码方式产生初始群体计算初始群体的适应性值如果不满足条件选择交换变异计算新一代群体的适应性值一遗传算法的描述例子为四个连锁饭店寻找最好的经营决策其中一个经营饭店的决策包括要做出以下三项决定 1 价格汉堡包的价格应该定在50美分还是1美元 2 饮料和汉堡包一起供应的应该是酒还是可乐 3 服务速度饭店应该提供慢的还是快的服务目的找到这三个决定的组合以产生最高的利润共有8种表示方案用遗传算法解这个问题的第一步就是选取一个适当的表示方案饭店编号价格饮料速度二进制表示1高可乐快0112高酒快0013低可乐慢1104高可乐慢010表表1饭店问题的表示方案其中的4个群体规模N 4第0代i串x i适应值f x i 10113x和12最小值1平均值3 00最大值6表表2初始群体中经营决策的适应值一个简单的遗传算法由选择交叉变异三个算子组成第0代交叉池i串x i适应值f x i f x i f x i 串f x i 101130 250113xx10 081106311060 501106401020 170102总和12 17最小值12平均值3 004 25最大值66表表3使用选择算子后产生的交叉池1 选择算子比例选择2 交叉算子采用单点交叉作用过程a 产生一个在1到l 1之间的随机数i b 配对的两个串相互对应的交换从i 1到l的位段例如从交叉池中选择编号为1和2的串进行交叉且交叉点选在2 用分隔符表示交叉算子作用的结果为01 101011 0111对交叉池中指定百分比的个体应用交叉算子假设交叉概率p c 50 交叉池中余下的50 个体仅进行复制运算即复制概率p r 50 第0代交叉池第1代i串x i适应值f x i f x i f x i 串f x i 交叉点x if x i 101130 250113xx2xx10 08110621117311060 501106 110640102 0 170102 0102总和121717最小值122平均值3 004 254 25最大值66 7表表4使用复制和交叉算子的作用结果遗传算法利用复制和交叉算子可以产生具有更高平均适应值和更好个体的群体3 变异算子以一个很小的概率p m随机改变染色体串上的某些位对于二进制串就是将相应位上的0变为1或将1变为0 例如选交叉池中编号为4的串进行变异且变异点在2 则010000变异算子相对而言是次要算子但在恢复群体中失去的多样性方面具有潜在的作用小结上述遗传算法描述了从第0代产生第1代的过程然后遗传算法迭代地执行这个过程直到满足某个停止准则在每一代中算法首先计算群体中每个个体的适应值然后利用适应值信息遗传算法分别以概率p c p r和p m执行交叉复制和变异操作从而产生新的群体应用遗传算法求解问题需完成四个主要步骤1 确定表示方案 2 确定适应值度量 3 确定控制算法的参数和变量 4 确定指定结果的方法和停止运行的准则基本遗传算法的构成要素1 染色体编码方法最常用的是二进制编码对于离散性变量直接编码对于连续性变量先离散化后再编码 2 适应度函数评估函数用来评估一个染色体的优劣的绝对值适应度函数评估一个染色体相对整个群体的优劣的相对值的大小 3 遗传算子复制算子交叉算子变异算子 4 基本遗传算法运行参数 N群体大小即群体中所含个体的数量一般取20 100 T遗传算法的终止进化代数一般取100 500 p c交叉概率一般取0 25 0 75 p m变异概率一般取0 01 0 2 p r复制概率三基本遗传算法的一般框架算法过程1 随机产生一个由确定长度的特征串组成的初始群体 2 对串群体迭代地执行下面的步 i 和步 ii 直到满足停止准则 i 计算群体中每个个体的适应值 ii 应用复制杂交和变异算子产生下一代群体 3 把在任一代中出现地最好的个体串指定为遗传算法的执行结果这个结果可以表示问题的一个解或近似解 GEN 0产生初始群体是否满足停止准则指定结果结束计算每个个体的适应值i 0i N 以概率选择遗传算子GEN GEN 1选择一个个体选择两个个体选择一个个体执行复制i i 1执行变异复制到新群体执行交叉插入到新群体将两个子代串插入到新群体i i 1是否是否 p rp cp mGEN 当前代数N 群体规模定理收敛性定理如果在代的演化过程中遗传算法保留最好的解并且算法以交叉和变异作为随机化算子则对于一个全局优化问题随着演化代数趋向于无穷遗传算法将以概率1找到全局最优解遗传算法极限特性的分析表明算法能够对搜索空间进行持续的搜索因此遗传算法特别适合于在全局优化问题中应用遗传算法的特点1 搜索过程不直接作用在变量上而是在参数集进行了编码的个体此编码操作使得遗传算法可直接对结构对象集合序列矩阵树图链和表进行操作不存在求导和函数连续性的限定 2 遗传算法不是从单个点而是从一个点的群体开始搜索同时利用了多个搜索点的信息 3 具有内在的隐并行性和较好的全局寻优能力 4 采用概率寻优方法能自动获取搜索过程中的有关知识并用于指导优化自适应地调整搜索方向不需要确定的规则 5 鲁棒性数据挖掘数据挖掘的概念网络之后的下一个技术热点是什么让我们来看一些身边俯拾即是的现象纽约时报由60年代的10 20版扩张至现在的100 200版最高曾达1572版然而在现实社会中人均日阅读时间通常为30 45分钟只能浏览一份24版的报纸大量信息在给人们带来方便的同时也带来了一大堆问题第一是信息过量难以消化第二是信息真假难以辨识第三是信息安全难以保证第四是信息形式不一致难以统一处理人们开始提出一个新的口号要学会抛弃信息人们开始考虑如何才能不被信息淹没而是从中及时发现有用的知识提高信息利用率数据挖掘的概念数据爆炸但知识贫乏另一方面随着数据库技术的迅速发展以及数据库管理系统的广泛应用人们积累的数据越来越多激增的数据背后隐藏着许多重要的信息人们希望能够对其进行更高层次的分析以便更好地利用这些数据目前的数据库系统可以高效地实现数据的录入查询统计等功能但无法发现数据中存在的关系和规则无法根据现有的数据预测未来的发展趋势缺乏挖掘数据背后隐藏的知识的手段导致了数据爆炸但知识贫乏的现象数据挖掘的概念数据挖掘就是从大量的数据中挖掘出有用的信息它是根据人们的特定要求从浩如烟海的数据中找出所需的信息来供人们的特定需求使用据国外专家预测随着数据量的日益积累和计算机的广泛应用在今后的5 10年内数据挖掘将在中国形成一个新型的产业数据挖掘的进化历史进化阶段商业问题支持技术产品厂家产品特点数据搜集 60年代过去五年中我的总收入是多少计算机磁带和磁盘IBM CDC提供历史性的静态的数据信息数据访问 80年代在新英格兰的分部去年三月的销售额是多少关系数据库 RDB MS 结构化查询语言 SQL ODBC Oracle Sybase Informix IBM Microsoft Oracle Sybase Informix IBM Microsoft在记录级提供历史性的

人人文库> 全部分类> 办公材料 > 办公文档

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

遗传算法XX讲解材料

文档简介

温馨提示

最新文档

评论

遗传算法XX讲解材料

文档简介

温馨提示

最新文档

评论

相关文档