遗传算法与机器学习.ppt

上传人：伐*** IP属地：宁夏上传时间：2020-04-08 格式：PPT 页数：84 大小：351.55KB 积分：20 举报 版权申诉

已阅读5页，还剩79页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第六章遗传算法与机器学习概述分类器系统cs 1 holland 学习系统ls 1 smith 组织学习方法 wilcox 6 1概述学习是一个由未知到知的过程学习的目的是获得尽可能接近真实的知识学习过程包含了对已有知识的继承和对未知知识的探索学习本身是一个进化的过程将进化计算应用于学习是自然的合理的 6 1概述概念学习可以看作是对概念描述空间的一种启发式搜索概念描述空间是对原始数据即由教师或环境向学习系统提供的某些概念的实例使用一定推理规则得到的概念学习中所隐含的这种搜索机制以及它所采用的符号表示方法使得遗传算法在概念学习领域有其用武之地遗传算法本身固有的鲁棒性使得基于遗传算法的概念学习系统具有更少的限制性 6 1概述 1978年holland等实现了第一个基于遗传算法的机器学习系统一级认知系统cs 1 cognitivesystemlevelone 1986年 holland提出桶队算法 bucketbrigade 整个系统被称为分类器系统 1980年 smith提出ls 1系统在某些重要方面如染色体的表示反馈方式等 ls 1和cs 1有明显差异 1993年 dejong和spears提出gabil系统实现基于ga的概念学习 6 1概述从应用角度来说这些系统对顺序决策这类学习问题较为合适该类问题可以描述如下一决策主体以回复方式与一具有离散时间状态的动态系统交互在每个时间步的开始系统处于某确定状态该主体依当前状态根据决策规则从有限的动作集中选择一个动作供动态系统执行并进入到一个新的状态同时向主体反馈一个补偿 payoff 其目的是发现一决策规则集以使补偿最大化 6 2遗传机器学习系统的结构大多数学习系统都具有一个共同的特性即它们都能够产生结构上的变化来提高其内部知识结构的一致性和广泛性发现和利用一些有意义的概念增强其在环境下完成任务的能力 6 2遗传机器学习系统的结构通常可以将遗传学习系统分为两个子系统一个基于ga的用于产生合适的结构变化的学习子系统和一个用于完成外部环境任务的任务子系统系统通过任务探测器从外部环境中获取环境信息任务子系统则对这些信息进行处理并产生一个对外部环境信息的响应这个响应通过任务效应器作用到外部环境上性能探测器对任务子系统对外部环境所产生的影响进行检测并将所检测到的信息传送到学习子系统中学习子系统利用这些信息对任务子系统的性能进行评估并由此改变任务子系统的内部结构以提高系统的性能 6 2遗传机器学习系统的结构改变任务子系统结构的方式有三种 1 用ga改变一组预先定义的控制参数 2 改变控制任务子系统行为的更加复杂的数据结构如议程表 2 直接修改任务子系统的控制程序 6 3匹兹堡方法与密西根方法将产生式系统引入遗传机器学习领域后产生了两种重要的实现方法匹兹堡方法和密西根方法匹兹堡方法将整个规则集合表示为一个个体 ga维护一个包含一定数目的候选规则集的种群由匹兹堡 pittsburgh 大学的dejong和他的学生smith所提出密西根方法认为每个个体就是一条规则而整个种群就是规则集合由密西根 michigan 大学的holland和他的学生reitman提出一般认为密西根方法更加适合于在线实时的环境在这种环境下系统行为上的激进的变化是不能容忍的而匹兹堡方法更适合于离线的环境在这种环境下更加从容不迫的搜索和更加激进的变化是可以接受的匹兹堡方法首先要选择适当的表示方法一种表示方法将单个规则作为一个基因而将整个分类器系统作为一个基因串个体交叉算子提供规则的新的组合方式而变异算子则提供新的规则为了使得交叉算子和变异算子能够产生合法的个体一种最简单的方法就是将所有的规则用固定长度固定字段格式的二进制串来表示这样这些 if then 规则就很自然地表示为一组固定数目的待匹配的传感器模式和一个在此模式下的动作匹兹堡方法也可以采用更加灵活的表示方法用不定长的串来表示规则这种情况下需要对遗传算子进行修改才能保证得到合法的个体一种方式就是在串中加入标点符号并通过这些标点符号来区分各条规则和标注规则的内部结构和表示方法相关的另外一个问题就是每个个体所包含的规则数目若将规则集合看做是一个程序或者是一个知识库那么规定每个个体包含相同数目的规则是极不自然的 smith成功地设计了一种ga 这种算法中的个体长度是变化的密西根方法 holland认为对于一个特定的人认知实体的知识经验的更自然的观点是将知识看做是一组规则这组规则在与环境的交互作用下不断改变这一组知识并不是通过每一代中进行的选择和交叉来进行演变相反这一组知识是在个体尽力使自己适应环境的过程中实时积累的分类器系统认知模型在分类器系统中 gas所操作的个体不是规则集合而是单独的规则分类器系统中最重要也是最困难的问题是信度分配问题也就是如何将适应度值分配到各条规则上去的问题桶队算法 6 4分类器系统 cs 1 分类器系统是一种学习系统它通过学习句法规则来指导系统在外部环境中的行为分类器系统由三部分构成 1 规则和消息系统 2 信度分配系统 3 遗传算法分类器系统结构图 6 4分类器系统 cs 1 规则和消息系统是一种特殊的产生式系统规则的一般形式为 ifthen其含义是若满足条件c 则产生动作a 也就是说若满足条件则规则被激发分类器所产生的动作实际上也是一种消息它可能会使得效应器产生一个动作也有可能激发另一个分类器还有可能不产生任何作用 6 4分类器系统 cs 1 分类器系统中采用长度一定的字符串表示一条规则分类器这样就可以保证句法上的合法性同时这种基于字符串的表示方法还使得应用遗传算子变得比较方便 0 1 l 0 1 l 消息和条件进行匹配时的匹配原则是 1 与 1 匹配 0 与 0 匹配是通配符与 0 和 1 都可以匹配 6 4分类器系统 cs 1 假设有一条消息为m 00100 则以下条件都与它相匹配 00 00 00100 100 冲突解决机制分类器系统中通过一种拍卖的方式让所有的候选分类器通过竞争花钱购买来获得被激活的权利 6 4分类器系统 cs 1 信用分配机制桶队算法对于分类器系统来说衡量每个分类器的性能非常困难但是为了应用ga对分类器进行改进又必须要对每个分类器在系统中的作用做出一个评价从外部环境信息到效应器响应动作之间就形成了一条响应链这条响应链建立了外部信息到效应器响应之间的映射关系分类器之间以交易的形式传递消息消息总是传递给报价最高的那个分类器 6 4分类器系统 cs 1 报价的计算匹配精度的定义匹配精度用于衡量消息与分类器的条件的相似程度匹配精度越高两者之间的相似性越强若分类器c的激发条件与消息m相匹配则匹配精度可以定义为p c m 1 r c 其中 r c 代表c的激发条件中通配符的数目假定一个分类器c在t时刻的适应值为strength c t 那么当它成为候选分类器时它给出的报价为bid c t cbid r c strength c t 其中 cbid为一常数称报价系数从上述定义中可以看出候选分类器的报价与它的适应值成正比与匹配精度成反比 6 4分类器系统 cs 1 也可以将报价简单定义为bid c t cbid strength c t 若定义一个分类器在 t 1 时刻出售过一条稍息则在t时刻它将获得收入i t 那么一个候选分类器消费一条消息后它的适应值为strength c t 1 strength c t bid c t i t 6 4分类器系统 cs 1 若一个分类器一直没有被激活它就可以一直保持它的适应值不变但是若一条规则一直不被激发那么这条规则也就没有存在的必要所以必须采用一定的方法来防止出现这种不思进取的现象一种解决方法就是在每一个时间步对所有的分类器征收人头税 t c t t c t ctax strength c t 那么分类器c在t 1时刻的适应值可以表示为 strength c t 1 strength c t bid c t t c t i t 上式可以化简为strength c t 1 1 k strength c t i t 其中 k cbid ctax 6 4分类器系统 cs 1 分类器重组机制遗传算法分类器系统用ga来生成新的可能具有更好性能的分类器并且淘汰一部分适应值较低的分类器以使分类器系统的整体性能不断提高一般来说为保证学习系统性能的稳定性不采用完全取代的方法而是选取一定比例的染色体来取代需要确定一个时间步数tga 这个参数表示两次调用ga对分类器进行重组间的时间间隔 tga可以任意确定在实现时可以设置一些触发条件当满足这些条件时就调用ga对规则进行重组由于分类器中使用了三元字符表 0 l 所以需要对经典变异算子进行一定的修改当发生变异时从原来的字符变异到另外两个字符的概率相等即p 0 l p 0 p l 0 p 1 p 0 p 1 6 4分类器系统 cs 1 holland给出的在分类器中采用遗传算法的核心步骤根据分类器的强度从分类器集合中成对挑选分类器强度越大被选出的可能性越大对选中的分类器对应用交叉变异算子生成新的分类器用生成的后代替换强度最弱的那些分类器 6 4分类器系统 cs 1 分类器系统中的遗传算法 begint 0 随机生成集合bt 它由m个分类器组成计算bt中全体分类器的平均强度vt 对每个分类器赋予一个标准化强度值st cj vt 给bt中的每个分类器cj赋一个与其标准强度值成正比的概率并根据bt中的概率分布从bt中选取n对分类器其中n m 对每对分类器应用交叉算子生成2n个新的分类器将bt中的2n个强度值最低的分类器用新生成的2n个取代 t t 1 返回步骤2 end 6 4分类器系统 cs 1 生物进化的目的并不是要产生出单一的超级物种而是要产生出彼此相互适应的物种群组成的生物圈同理利用遗传算法的目的也不是为了控制个别规则和策略的演变而是为了控制由许多规则构成的分类系统的演化竞争的压力并不能孤立地筛选出最优规则但是可以引起大系统的进化 6 4分类器系统 cs 1 如果按每条规则产生的正确行动的数目对其评分只会有利于演化出个别超级规则而不利于寻找到一组相互之间发生有效作用的规则系统所以必须改变策略强迫这些规则去争夺对行动的控制权每条满足条件的规则都要与其他满足条件的规则进行竞争并且由其中最有力的规则来决定系统在某种情况下的行动如果系统的行动成功了获胜的规则将被加强反之它们将被削弱 6 4分类器系统 cs 1 可以把每条规则看成是关于分类系统的一种假设 hypothesis 只有当某条规则自称与当前情况有关时它才参加角逐它的竞争力取决于它对解决同类问题所做的贡献大小随着遗传算法的运作强有力的规则发生组配形成融合上一代基因块为一体的后代规则这些后代取代了最弱小的规则它们相当于一些似乎可能但还未经证实的假设 6 4分类器系统 cs 1 规则之间的竞争为分类系统应付层出不穷的新情况提供了巧妙的手段如果分类系统具有响应某种情况的有力规则就等于分类系统的某些假没已经被证实只有在满足某些条件的有力规则不存在的情况下也就是只有当分类系统不知所措的时候那些生来就比上一代弱小的后代规则才有出头之日可能赢得竞争并影响分类系统的行为如果它们的行为对于分类系统有所帮助它们便生存下去否则它们很快就被取代所以在分类系统很有经验的情况中后代并不会干涉分类系统的行为它只是作为关于在新情况下应该如何行动的假设在一旁静静地等候着 6 4分类器系统 cs 1 增加这样的竞争对于分类系统的演化有很大的帮助分类系统在开始运行的初期先发展出条件简单的规则即那些把很多情况当作相同情况对待的规则分类系统把这些规则作为缺省规则在缺乏更详细信息的情况下用它们来说明分类系统应采取的某种行动不过缺省规则只能作为肤浅的判断因为它们经常出错因而强度得不到加强随着分类系统获得经验繁殖和交叉使得更复杂和更专用的规则得到发展这些规则迅速得到增强很快成为各种特殊情况下分类系统行为的主宰 6 4分类器系统 cs 1 最终分类系统发展成为一种层次结构处于下层的例外规则层处理大多数情况当详细规则无法满足情况的条件时处于层次结构上层的缺省规则就发挥作用这种缺省层一方面带来了针对新情况的有关经验同时也使分类系统不至于陷入过于详细的选项之中而不能自拔促使进化中的分类系统成为处理新情况的专家的那些特征同样善于应付某次行动的效果要等到该行动很久之后才能显示出来的情况 6 5学习系统 ls 1 在holland提出分类器系统之后 dejong和他的学生smith也提出了一种基于遗传算法的机器学习系统 ls 1 smith所提出的这种机器学习方法是匹兹堡方法的代表 ls 1的个体不是表示一条规则而是表示一个规则集合只对规则集合进行操作可以避开信度分配问题但是缺乏信度分配机制也是ls 1的最大缺陷由于反馈信息不够充分 ls 1系统的学习速度比较慢需要进行大量的训练才能够得到较好的效果但是通过学习 ls 1系统可以得到很好的性能 ls 1学习系统的结构 6 5学习系统 ls 1 ls是分类器系统和一般的产生式系统的结合它包含了一个推理引擎和一些规则工作存储区由一组无序的固定长度的单元构成每个工作区单元又被细分为信号部分和数据部分产生式规则存储区由一组无序的规则构成其中每条规则是一个固定长度的字符串规则的前件条件由k个固定的模式组成最初的i个模式与系统探测器所发出的环境消息所匹配剩下的k i个模式与工作存储区中的信号相匹配在ls中所有匹配的规则同时被激发但是若规则导致效应器产生了一个动作则不能同时激发此时系统对这些规则进行标记并让这些被标记的规则向它们将要激活的效应器投票然后系统通过随机选择来决定产生哪一个效应器动作进行选择时每个效应器动作被选中的概率等于它的得票率 6 5学习系统 ls 1 规则实例 1 00 0 1 x0 0 x001y 011reassert y 学习系统中的规则前件被分为了两个部分一个是环境模式部分 1 00 0 另一个是工作存储区模式部分 1 x0 0 x001y 代表逻辑非运算表示对匹配结果取反工作存储区状态 6 5学习系统 ls 1 工作存储区模式中的字符 x y 是变量其第一次出现时要对它赋值赋值时取相应工作存储区消息的数据区的值设立数据区变量使得学习系统具有了辨识数据区信息是否相等的基本能力更重要的是设立数据区变量使得一条规则可以在它的前件和后件之间传递信息对规则进行匹配时要自左向右对规则进行扫描首先对环境模式进行匹配若可以匹配再对工作存储区模式进行匹配 6 5学习系统 ls 1 若一条规则的前件能够完全匹配则这条规则被激发此时这条规则首先在工作存储区中搜索一个可用的空位然后将后件中的消息粘贴到这个空位的信号区中而后这条规则将计算后件中数据区的值再将这个值添加到空位的数据区中 6 5学习系统 ls 1 规则集合的重组系统对规则集合的重组通过gas进行此处gas使用了四种算子复制变异交叉倒序复制和变异算子与一般的ga算子相同交叉算子和倒序算子则需要进行一些修改交叉算子因为规则集合的长度有可能不相同包含不同数目的个体所以必须保证交叉后生成的后代有合法个体倒序算子由于ls系统的规则具有一定的格式所以在应用倒序操作时必须要保证生成的后代个体中的规则在语法上的合法性 6 5学习系统 ls 1 在ls i中交叉通过三个步骤来进行对齐选择交叉点交换对齐进行对齐时首先要在两个规则集合中随机选择一个分隔符然后将两个规则集合在选定的分隔符处对齐选择交叉点在对齐后要选择一个交叉点交叉点既可以选择在规则之间的边界上也可以选择在规则内部系统用一个参数pc rb来控制交叉发生在规则边界上的概率若交叉点在规则边界上则可以保证规则本身不发生变化而仅仅是规则集合发生了变化若交叉点选择在规则内部则规则本身会发生变化而且规则集合也发生了变化交换在确定了交叉点后就将两个规则集合在交叉点以后的部分互换这样就得到了两个新的规则集合 6 5学习系统 ls 1 例如 a r1 r2 r3 r4 b r5 r6 r7 r8 r9 r10 对齐 a r1 r2 r3 r4 b r5 r6 r7 r8 r9 r10 6 5学习系统 ls 1 交叉 a r1 r2 r3 r4 b r5 r6 r7 r8 r9 r10 a r1 r7 r8 r9 r10 b r5 r6 r2 r3 r4 6 5学习系统 ls 1 在ls系统中进行倒序操作时倒序串的端点必须在规则边界上 r1 r2 r3 r4 r5 r6 r7 r8 r9 r10 r1 r2 r8 r7 r6 r5 r4 r3 r9 r10 6 5学习系统 ls 1 ls 1的性能 smith用ls 1来玩扑克牌游戏以检测系统的学习能力实验结果表明 ls 1最后的规则集合中82 的规则与已知的著名的扑克牌游戏公理是相符合的这表明了ls 1确实能够通过学习获取正确的游戏策略组织学习方法 wilcox借鉴了经济学家coase所提出的降低交易代价的方法提出了一种组织学习方法这种方法通过自适应地搜索一个规模合适的规则集合组织来提高算法的性能一组织的增长1 交易代价经济领域中的交易代价理论是用于解释经济某个环境中组织机构如何形成的一种理论由于分类器中的交互作用可以看做是进行交易那么就有可能利用交易代价理论来帮助我们在分类器系统中自动地建立组织结构组织学习方法交易代价是内于缺乏知识造成的参与交易的双方都不知道应当与谁进行交易即使在交易双方会面后双方也不知道对方的真实价格如何 2 降低交易代价的机制一些经济学家指出降低交易代价的努力导致了市场组织和一些其他的经济结构的出现和发展其中记录交易者的声誉和生成交易组织是降低交易代价的两种最基本的方法另一种减少交易代价的方法是建立特殊市场以减少交易双方寻找交易对象的代价组织学习方法 3 组织增长模型wilcox构造了一种简单的组织增长模型ogm来研究如何调节组织增长 ogm通过让群体组成多个组织来对个体和集合同时进行演化各个不同的组织为获得适应值而进行竞争这样组织的行为就既具有个体行为的特征也具有集合行为的特征这个简化的ogm主要包含以下几个组成部分 1 个体和组织 2 适应度函数 3 组织算子 4 选择算子组织学习方法个体和组织组织中包含任意数目的个体由于构造这个简单的ogm的目的仅仅是为了研究如何调节组织的增长因此对个体的行为进行了简化个体不产生任何实质性的动作唯一的行为只是加入或脱离一个组织所以组织的适应度函数也只是与它所包含的个体数目有关而不是与它所包含的个体的行为有关适应度函数这个模型的目标是让个体和组织获得最大的利益而一个组织的好坏取决于组织中的个体的收益所以适应度函数可以表示为各个组织的资本收益比组织学习方法在实验中用到了三种类型的收入函数 1 常量r m k 2 线性式r m k0 k1 m 3 多项式r m k0 k1 m k2 m2 在实验中用到了三种类型的支出函数 1 常量c m k 2 线性式c m k0 k1 m 3 多项式c m k0 k1 m k2 m2 通过对不同类型的收入函数和支出函数进行组合可以得到多种不同的适应度函数组织学习方法组织算子组织算子是用于控制生成新组织的算子它作用于一对被选择的组织上并且生成一对新的组织 1 增一这个算子从一个组织中移动一个个体到另一个组织中 2 减一与增一运算相反这个算子将一个个体从组织中转移到一个空组织中 3 合并如同增一算子这个算子从一个组织中移动全部个体到另一个组织中生成一个包含父代组织中所有个体的组织和一个空组织 4 剪切如同减一算子这个算子将随机数目的个体从组织中转移到一个空组织中在实际使用时增一减一与合并剪切总是成对使用组织学习方法选择算子选择算子使整个种群中的个体数目保持不变为了达到这一目的后代组织需要与父代组织进行竞争当一个算子生成一组后代组织后选择算子在父代组织和后代组织中进行一次联赛选择具有最高适应值的组织进入下一代其他的组织则被淘汰由于后代组织中所包含的个体数目与父代个体中包含的个体数目相等所以种群中的个体数日保持不变组织学习方法 4 组织增长模型的实验结果实验结果表明组织增长模型确实能够产生最优的组织使用合并剪切算子可以缩短系统搜索到第一个最优组织的时间但是并不会缩短系统收敛的时间且当使用合并剪切算子时系统在收敛过程中会产生震荡而使用增一减一算子则系统的收敛比较平缓改变系统的适应度函数将改变最优组织中所包含的个体数目但它并不影响系统的收敛能力组织学习方法二自主组织学习1 寄生行为桶队算法无法解决寄生现象所谓寄生是指不做出贡献而获益 smith的研究结果表明当寄生分类器在整个种群中的比例增加时系统的性能将会迅速下降在一个复杂的分类器系统中想要找出寄生分类器是非常复杂的一个问题组织学习方法社会是如何对付寄生行为呢最重要的方式就是通过立法来保证正常的交易秩序不遵守交易秩序的就会受到惩罚除此之外声誉也会起重要的作用可以将分类器系统看做一个市场分类器在这个市场中交换消息和信用度一个分类器所发出消息有可能导致另一个有用的分类器产生一个无用的动作这时就可以认为发出消息的分类器产生了一次寄生行为因为我们希望系统能够从环境中得到最多的报酬所以可以将导致系统收益偏离最大化的分类器视为寄生分类器组织学习方法 2 记忆深度向题smith以记忆深度问题为例来考察分类器系统如何解决要求记忆深度大于零非刺激响应的问题记忆深度问题是一个要求系统根据以前的状态来决定当前采取的动作的问题对于记忆深度问题来说最关键的一点是要求分类器同时使用环境状态和内部消息来确定下一步动作组织学习方法一阶记忆深度向题一阶记忆深度问题要求系统能够记住外部环境在前一时刻的状态分类器系统将外部环境在前一时刻的状态存储在内部消息队列中这样就使得系统可以记住外部环境在前一时刻的状态一个分类器只有同时匹配外部环境的当前状态环境消息和前一时刻的状态内部消息才能够被激发分类器被激发后将粘贴一条消息到内部消息队列中并且对外部环境产生一个动作组织学习方法外部环境含有两个状态变量一个用于保存前一时刻的状态另一个是当前状态外部环境每次随机地生成一个新的当前状态然后将原来的当前状态变成前一时刻状态若分类器系统所产生的动作消息与前一时刻状态相同则分类器系统将从外部环境中得到一个报偿组织学习方法环境状态有四个取值 a b c d 相应地分类器消息也有四个取值 a b c d 一个典型的分类器为ifa bthena b它表示若外部环境状态为a 内部消息为b 则将a粘贴到内部消息队列中并对环境发送动作消息b 由于外部环境的前一时刻状态为 b 而发送到外部环境中的动作消息为 b 所以分类器系统将从外部环境中得到一个报偿显然由于外部环境和内部消息各有四个取值那么分类器总共有16个独立条件部分同理分类器总共有16个独立的动作部分所以总共有256个不同的分类器对于这个问题理想的分类器系统只需要16条规则组织学习方法 smith的研究结果表明系统中存在三种类型的寄生分类器第一类寄生分类器这类分类器可以产生正确的内部消息但是不能够向外部环境发送正确的动作稍息第二类寄生分类器这类分类器不能够产生正确的内部消息但是能够向外部环境发送正确的动作消息第三类寄生分类器这类分类器既不能产生正确的内部消息又不能够向外部环境发送正确的动作稍息为了观察寄生分类器对系统性能所造成的影响 smith进行了一组实验实验采用了一个简单分类器系统 scs 来求解上述一阶记忆深度问题由于实验的目的是为了检验寄生分类器对分类器系统的影响所以实验中scs没有应用gas来对规则进行演化实验中scs的分类器集合是预先设定的其中都包含16个理想的分类器组织学习方法实验1 16个理想分类器实验2 16个理想分类器加上1个第二类寄生分类器实验3 16个理想分类器加上8个第二类寄生分类器实验4 16个理想分类器加上5个第一类寄生分类器 6个第二类寄生分类器 5个第三类寄生分类器实验5 16个理想分类器加上16个第二类寄生分类器实验6 32个理想分类器加上32个第二类寄生分类器实验7 16个理想分类器加上32个第二类寄生分类器组织学习方法设计以上这7个实验主要是为了研究三个因素对系统性能的影响 1 寄生分类器比例系统中寄生分类器数目与理想分类器数目的比值它代表了系统中的噪声大小 2 寄生类型三种不同类型的寄生分类器会对系统的性能产生不同的影响 3 尺度系统中的分类器数目组织学习方法 smith用了三个指标来衡量各次实验中分类器的性能 1 正确率系统发送到外部环境的动作消息获得报偿的百分比它衡量一个分类器系统使其收入实现最大化的能力 2 错误次数实验结束后分类器系统中适应值大于1 0的寄生分类器数日若系统收敛则错误次数实际上是指成功地欺骗了系统的寄生分类器数目若系统不收敛则这个指标没有明确的含义 3 收敛时间分类器系统的正确率收敛到一个稳态值所需要的时间增加寄生分类器的比例会降低系统的性能o第二类寄生分类器比第一三类寄生分类器更不容易被系统发现更容易成为系统稳态工作集合小的一部分增加分类器的数目会降低系统的收敛能力组织学习方法 3 组织分类器系统在前面的实验中可以看出 scs不能有效地识别出寄生分类器 wilcox提出可以通过声誉来识别寄生分类器 wilcox认为声誉就是关于分类器以前的性能的信息 wilcox指出传统的分类器系统只使用一个单独的适应值来估计分类器的性能若能够在不同的时间尺度上使用不同的值来表示一个分类器的性能将有可能使得系统更容易识别出寄生分类器的欺骗行为组织学习方法在研究分类器系统时可以将分类器的适应值看做是一种对于分类器未来性能的预测冲突解决机制使用适应值来确定哪一个分类器被激发并通过斗链式算法来对适应值进行更新一个分类器的适应值是一种显示这个分类器为系统带来多少收益的声誉值所以冲突解决机制利用适应值来降低它所选择的分类器不能使得系统收益最大化的风险但是当系统发生变化时冲突解决机制就需要探索其他的选择组织学习方法在这种情况下冲突解决机制有一个在当前形势下查找最佳分类器的短期目标而同时分类器系统又有一个寻找使得系统本身获得最大收益的分类器集合的长期目标在理想状况下分类器应当选择一个既具有很好的长期性能又非常适应当前形势的分类器不幸的是适应值所反映的是分类器的长期性能不能很好地反应分类器在某一时期内的短期性能在这种情况下冲突解决机制可能会选择一个并不适应当前形势的分类器组织学习方法针对这种情况 wilcox提出可以使用两种不同的声誉值短期声誉 str 和长期声誉 ltr 每一个组织和组织中的个体都既有一个短期声誉值又有一个长期声誉值 str代表个体或组织在最近一段时间内表现出的性能而ltr则代表个体或组织从系统远行开始直到目前为止表现出的性能在组织内部冲突解决机制通过分类器的str来选择被激发的分类器最近一段时间表现出性能最好的分类器被激发组织学习方法同时组织使用分类器ltr来决定是否应当让这个分类器保留在组织中在整个系统运行期间表现出性能不佳的分类器将被淘汰 ltr使得系统能够生成性能更好的组织这样冲突解决机制就既能够满足短期目标又能够通过ltr来保证冲突机制的贪婪搜索策略不会降低系统的长期效益组织学习方法在系统中冲突解决机制通过组织的ltr来决定哪一个组织中的分类器可以向外部环境产生一个动作在整个系统运行期间表现出性能最好的组织将获得向外部环境产生一个动作的权力同时系统通过组织的str来决定是否应当增加一个组织中的分类器数目最近一段时间内表现出高性能的组织将可以增加它所包含的个体数目基于这种思想 wilcox提出了组织分类器系统ocs ocs将分类器系统和前面所讨论的组织增长模型结合在一起使得系统可以自主地形成组织结构组织学习方法 ocs的主要目的是要让分类器系统更有效地识别出寄生分类器从而提高系统性能 ocs由以下三部分组成 1 产生式系统 2 信度分配机制和冲突解决机制 3 组织增长模块 ocs的结构组织学习方法 1 产生式系统ocs与匹兹堡方法的相似之处在于ocs中的个体都是分类器集合不同之处有两点 a ocs中的分类器集合可以含有不同数目的规则 b ocs中的分类器集合是相互作用的 ocs与密西根方法的相似之处在于 ocs中也具有内部消息队列分类器可以向消息队列粘贴消息不同的是 ocs中每个组织都有自己的内部消息队列分类器只能将消息粘贴到自己所属组织的内部消息队列上组织学习方法 2 信度分配机制信度分配机制将信度分别分配到组织和个体上冲突解决机制则利用ltr和str来调节分类器之间的相互作用和组织之间的相互作用与密西根方法不同的是 ocs中每个组织和个体都有两个

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

遗传算法与机器学习.ppt

文档简介

温馨提示

最新文档

评论

遗传算法与机器学习.ppt

文档简介

温馨提示

最新文档

评论

相关文档