(计算机应用技术专业论文)敌意规划的应对规划.pdf_第1页
(计算机应用技术专业论文)敌意规划的应对规划.pdf_第2页
(计算机应用技术专业论文)敌意规划的应对规划.pdf_第3页
(计算机应用技术专业论文)敌意规划的应对规划.pdf_第4页
(计算机应用技术专业论文)敌意规划的应对规划.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 规划是自动问题求解的特例,是人工智能研究的重要子领域。人工智能主要研究用 人工的方法和技术来模仿、延伸及扩展入的智能,从而实现机器智能。特别令人关心的 是,智能系统怎样推断出适当的目标,然后构造试图达到目标的动作序列,这个过程常 称为规划( p l a r m i n g ) 。 智能规划( i n t e l l i g e n tp l a n ) 和规划识别0 l 姐r e c o g n i t i o n ) 是一个涵盖知识表达、知识 推理、非单调逻辑、人机交互和认知科学等方面的多领域交叉性学科,其发展不仅对于 人工智能领域具有重要的意义,甚至会从根本上改变我们使用计算机的传统方式。 受生物学应激反应、学习与记忆的神经生物学、神经元细胞和分子生物学的启发, 本文对敌意规划的应对规划所做的研究工作如下: 1 敌意规划的应对规划模型:给出应激反应的概念,构建了应激反应系统模型, 研究了应激计算算法。此模型及其相关算法使得敌意规划的应对规划可以像生物学的应 激反应一样迅速做出反应。 2 应对规划的启动机制:给出应对规划启动标志位的概念,使规划识别器( 规划 识别系统) 能根据观察到对方部分的、离散的动作( 网络攻击动作) ,识别出对方完整 的敌意规划和攻击目标,并且能据此对对方的后继攻击动作进行推断与预报。 3 应对规划的解搜索:将现实世界空间引入动力系统中,建立粗动力系统。以粗 动力系统对所有可能状态进行规划解搜索。 4 应对规划库的建立:为了使应对规划对已识别过的敌意规划具有永久抵抗的能 力,本文模拟人的主要学习记忆神经回路,以神经元群为独立单元构建分布式神经网络, 以神经元群的刺激水平值作为学习记忆的传导信号。 5 本文采用突变理论建立应激突变函数,给出了一类敌意规划即由多个非敌意的 琐碎动作累加成敌意攻击的敌意规划的应对规划。 本文的研究重点是生物学、生理学、细胞分子生物学等学科和计算机科学、网络与 通信等学科的交叉融合,将其运用到敌意规划的应对规划的系统研究中。用人工智能和 智能规划的技术模拟生物学应激反应、学习和记忆神经回路,可使智能体对敌意攻击表 现出对抗实时性,启动及时性,应对高效性和永久防御性。由于智能规划技术本身的独 立性,此项研究对于竞赛机器人、游戏角色设计、智能用户接口的设计、自然语言理解、 多a g e n t 系统等许多领域的研究,具有广泛的应用前景。 关键词:敌意规划;应对规划;应激计算;粗动力系统;应激突变函数;神经元群; 神经元群的刺激水平值 a b s t r a c t p l a n n i n gi sas p e c i a lc a s eo fa u t o m a t i cs o l u t i o np r o b l e m i t sa l s oa ni m p o r t a n ts u b - f i e l d i na i t h em a i nr e s e a r c hi na ii si l s ea r t i f i c i a lm e t h o da n dt e c h n o l o g yt oi m i m t e ,e x t e n da n d e x p e n dh u m a ni n t e l l i g e n c ea n da b i l i t y t h i sc a nm a k em a c h i n eh a v ei n t e l l i g e n c ea n da b i l i t y a sh u m a n w h a tw em o s tc :0 n c c mi sh o wt h ei n t e l l i g e n c es y s t e md e d u c e sag o a lp r o p e r l y , a f t e rt h a t h o wi tm a k e sa na c t i o ns e q u e n c ew h i c ha t t e m p tt oa c h i e v et h eg o a l t h i sp r o c e s si s c e l l e dp l a n n i n g i n t e l l i g e n c ep l a na n dp l a nr e c o g n i t i o ni sas u b j e c tw h i c hi n v o l v ek n o w l e d g ee x p r e s s , k n o w l e d g ei n f e r e n c e ,n o n m o n o t o n i c i 哆l o g i c s ,c o g n i t i o ns c i e n c ea n ds oo n n er e s e a r c ho n i n t e l l i g e n c ep l a na n dp l a nr e c o g n i t i o nc a nm a k ep r o f o u n dm e a n i n g si na i e n l i g h t e n e db yb i o l o g ys t r e s sr e a c t i o n ,n e u r o b i o l o g yo fl e a r n i n ga n dm e m o r y , c e l la n d m o l e c u l a rb i o l o g y , t h er e s e a r c ho nr e p l yp l a no fa d v e r s a r i a li nt h i sp a p e ri si ns e v e r a la s p e c t s , a sf o l l o w : 1 t h er e p l yp l a no fa d v e r s a r i a lp l a nm o d e l :d e f i n eac o n c e p t i o no fs t r e s sr e a c t i o n ,s e tu p as t r e s sr e a c t i o ns y s t e mm o d e l ,s t u d yt h es t r e s sc a l c u l a t ea l g o r i t h m t h es t r e s sr e a c t i o ns y s t e m m o d e la n di t sr e l a t i v ea l g o r i t h mc a nm a k et h ea d v e r s a r i a la n dr e p l yp l a nr e a c ta sr a p i d l ya s b i o l o g ys t r e s sr e a c t i o n 2 t h es t a r tm e c h a n i s mo nr e p l yp l a n :d e f i n eac o n c e p t i o no fr e p l yp l a ns i g n ,i tc a n m a k ep l a nr e c o g n i t i o n a nr e c o g n i t i o ns y s t e m ) r e c o g n i z ea l li n t e g e rp l a no fo p p o n e n ta n d a t t a c kg o a lf r o mt h ep a r t l ya n dd i s p e r s e da c t i o n s ;a n dc a nf o r e c a s tp o t e n t i a ld a n g e rf r o m o p p o n e n t ss u c c e e da c t i o n s 3 t h es o l u t i o ns e a r c ho nr e p l yp l a n :u s et h er e a l i t yw o r di nd y n a m i cs y s t e m ,t h i sp a p e r b u i l d sar o u g hd y n a m i cs y s t e mt od ot h es o l u t i o ns e a r c hu n d e ra l lt h ep o s s i b l es t a t e 4 t h ee s t a b l i s ho fr e p l yp l a ns t o c k :s i m u l a t et h em a i nl e a r n m e m o r yn e r v ec i r c u i to f h u m a n ,u s en e u r o ng r o u pa sai n d e p e n d e n tu n i o ns e tu pad i s t r i b u t i o nn e u r a ln e t w o r k ;u s e n e u r o ng r o u ps t i m u l u sv a l u ea st h es i g n a lo fl e a r na n dm e m o r y t h i sc a l lm a k et h er e p l y p l a n h a v et h ep e r m a n e n tr e s i s t a n tc a p a c i t yt oa na d v e r s a r i a lp l a nw h i c hh a sb e e nr e c o g n i z e d 5 u s ec a t a s t r o p h et h e o r yd e f i n e saf u n c t i o n - - - s t r e s sr e a c t i o nc a t a s t r o p h ef u n c t i o n ( s r c ) 1 0r e p l yac l a s so fa d v e r s a r i a lp l a nw h i c hm a k e su pb ym a n yn o n - a d v e r s a r i a la c t i o n s u s ea ia n di n t e l l i g e n c e p l a nt e c h n i q u et o i m i t a t eb i o l o g ys t r e s sr e a c t i o na n d l e a r n m e m o r yn e r v ec i r c u i tc a l lm a k ei n t e l l i g e n th a st h ec h a r a c t e r s :r e s i s to nr e a l - t i m e ,s t a r t o nt i m e ,r e p l ye f f e c t i v e l ya n dd e f e n dp e r m a n e n t l y t h i sr e s e a r c hh a sa ne x t e n s i v ea p p l i e d p r o s p e c ti nc o n t e s tr o b o t , g a m er o l ed e s i g na n dm u l t i - a g e n ts y s t e ma n ds oo n ,r 一 k e yw o r d s :a d v e r s a r i a lp l a n ;r e p l yp l a n ;s t r e s sc a l c u l a t i o na l g o r i t h m ;r o u g hd y n a m i cs y s t e m ; s t r e s sr e a c t i o nc a t a s t r o p h ef u n c t i o n ( s r 6 3 ;n e u r o ng r o u p ;n e u r o ng r o u ps t i m u l u sv a l u e 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外, 论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东 北师范大学或其他教育机构的学位或证书而使用过的材料。与我一同工 作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示谢意。 学位论文作者签名:之f 髦。日期: 学位论文版权使用授权书 本学位论文作者完全了解东北师范大学有关保留、使用学位论文的 规定,即:东北师范大学有权保留并向国家有关部门或机构送交学位论 文的复印件和磁盘,允许论文被查阅和借阅。本人授权东北师范大学可 以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影 印、缩印或其它复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权 学位论文作者签名:扫l 盗 指导教师签名: 日 舰啤期日 飙越 学位论文作者毕业后去向: 工作单位: 通讯地址: 电话: 邮编: 引言 本文主要是对具有敌意的动作( 敌意规划) 的这一类智能规划进行研究。受生物学 应激反应、学习与记忆的神经生物学、神经元细胞和分子生物学的启发,本文系统研究 在生物学理论框架下的应对规划理论,并引入突变理论完成了对一类敌意规划的应对规 划研究。 敌方( 竞争对手) 所执行的,规划目标为对我方不利的规划,称为敌意规划( 对手 规划) 。对敌意规划( 对手规划) 进行应对的规划,称为应对规划。应对规划机制需要: 1 根据观察到的对方的部分的、琐碎的动作( 网络攻击动作) ,识别对方完整的全面 的规划和目标( 攻击目标) 。 2 根据环境参数的变化识别出的对方的后继动作和目标,利用智能规划机制针对对 方的攻击目标做出应对。 3 反应迅速,应对高效。 规划识别器( 如,规划识别系统) 能根据观察到对方部分的,离散的动作( 如,网 络攻击动作) ,识别出对方完整的规划和攻击目标,并且能据此对对方的后继攻击动作 进行推断与预报。应对规划则能够对正在执行的敌意规划进行应对,对将要执行的敌意 规划预先做好防范。研究生物学应激反应、学习与记忆的神经生物学、神经元细胞和分 子生物学是因为应对规划的启动机制必须像生物学的应激反应一样迅速;具有学习和记 忆功能,以便对已识别过的敌意规划具有永久抵抗的能力。 应激机制是生物体对外界刺激的反应,而应对规划是智能体对敌意攻击的反应;应 激是生物体感受器和效应器中介,而应对规划是智能体识别出敌意攻击和应对敌意攻击 的中介:因此,利用生物学的应激机制研究应对规划的启动机制是非常合理且自然的。 应激是生物体的本能反应,生物体经过长时间的刺激后,可以形成条件反射。用人工智 能和智能规划的技术模拟并实现之,可使智能体对敌意攻击表现出对抗实时性,启动及 时性和应对高效性。 什么是学习和记忆? 行为学认为:学习是引起个体对特殊环境条件所产生的适应性 行为的全部过程( 或者说,学习是经验引起的一种适应性行为变化,记忆是过去经验的 贮存和回忆) ;生理学认为:记忆是一种心理过程,由识记保持,再认或回忆组成;神 经生理学认为:学习与记忆是脑的一种功能或一种属性,并且是一个多阶段的动态神经 过程。普遍认为学习主要是指人或动物通过神经系统接受外界环境信息而影响自身行为 的过程。记忆是指获得的信息或经验在脑内贮存和提取( 再现) 的神经活动过程。因为 具有学习和记忆等自适应能力,使得人类在进化过程中不断适应并改造环境,不断增长 智慧,增进生存能力。研究如何在应对规划中模拟实现人的学习能力,可使应对规划表 现出应对高效性;模拟人的记忆能力,可使应对规划对已识别过的敌意攻击( 敌意规划) 表现出永久对抗性。 根据学习与记忆的神经生物学、神经元细胞和分子生物学等学科得到的实验结论, 认为神经元的突触可塑性,突触的长时程增强等是学习和记忆的重要基础。本文采用神 经网络模拟学习和记忆过程。神经网络研究旱在2 0 世纪4 0 年代就已兴起。1 9 4 3 年由 m c c u l l o c h 和p i t t s 提出了m c c u l l o c h p i t t s 网络,其中的神经元有o n 和o f f 两个状态 但网络的连接是不能改变的,即网络没有学习能力。为了说明记忆和学习功能,1 9 4 9 年h e b b 描述了一种记忆机制以沟通心理学和神经生理学的联系,这就是h e b b 学习规 则;在此基础上,r o s e n b l a t t 提出了p e r c e p t r o n ( 感知器) 模型。1 9 8 2 年h o p f i e l d 的重 要论文发表产生了广泛影响,这主要是因为h o p f i e l d 建立了神经网络与电子实现电路之 间,物理系统和神经网络之间的联系。h o p f i c l d 使用能量函数的方法还导出了一个不很 有效的联想记忆模型,这也是神经网络的优化问题研究的开端。关于学习问题的研究, r u m e l a r t ,h i n t o n 和w i l l i a m 提出了最有影响的多层网的b p ( b a c k p r o p a g a t i o n ) 学习算 法,解决了多层感知器的学习问题。 由于系统间的相互作用是不可避免的,因此本文的工作不仅对于计算机系统安全甚 至国家安全具有重要意义,而且在系统分析和设计方法学上也具有重要的学术价值。由 于智能规划技术本身的独立性,此项研究对于竞赛机器人、游戏角色设计、智能用户接 口的设计、自然语言理解、多a g e n t 系统等许多领域的研究,也有广泛的应用前景。 2 1 1 智能规划 第一章敌意规划的应对规划概述 1 智能规划的概念 智能规划是人工智能研究的重要子领域。智能系统怎样推断出适当的目标,然后构 造试图达到目标的动作序列,这个过程常称为智能规划( p l a n n i n g ) 。 智能规划是一个涵盖知识表达、知识推理、非单调逻辑、人机交互和认知科学等方 面的多领域交叉性学科,其发展不仅对于人工智能领域具有重要的意义,甚至会从根本 上改交人类使用计算机的传统方式。 2 智能规划的发展 智能规划的研究最早可追溯到2 0 世纪5 0 年代后期,当时人们利用程序来模拟人类 的问题求解能力。第一个系统是由n e w e l l 和s i m o n 设计的逻辑理论家程序,随后他们 又设计了通用问题求解器( g p s ) 阿,这个系统采用分析当前状态和目标状态间差别的 启发式方法来执行状态空间搜索,它在人工智能领域中具有非常重要的地位。 2 0 世纪7 0 年代出现了非线性规划( 部分序、因果链接) 方法,它在域独立规划中 占有主导地位。基于此方法,1 9 7 1 年f i k e s 和n i l s s o n 设计了s t r i p s l 6 】规划系统,它是 历史上最具影响力的规划系统之一在s t r i p s 域中,状态是公式的集合,状态描述的 改变由操作从集合中添加和删除公式来实现,搜索使用类似于g p s 系统的启发式方法。 这一系统采用的与文字相关的术语直到今天仍在使用,引入的s t r i p s 操作符使得规划 可以非常容易地进行描述和操作,原来很神秘的规划问题求解从此变得明朗清晰起来。 此后至1 9 7 7 年,先后出现了h a c k e r 、w a r p l a n 、n 叮e r p l a n 、a b s t r i p s 、n o a h 、 n o n l i n 等规划系统。 2 0 世纪8 0 年代,对智能规划的研究陷入了低谷。1 9 8 7 年,c h a p m a n 在此基础上 详细全面地分析了利用定理证明理论解决规划问题中的关键阀题:模型与规划解的对应 关系,提出了著名的模态真值标准理论,并设计了规划系统t w e a k l 7 1 。 2 0 世纪9 0 年代,规划系统的效率得到了明显提高,这种提高主要来源于规划领域 的三种新方法。第一种方法是1 9 9 2 年k a u t z 等把规划问题求解转化为可满足( s a t ) 问 题i s , 9 ,1 0 1 ,这种方法使得命题推理系统中的新技术可以直接应用于规划系统,从而有效 地推动了规划研究;第二种方法是1 9 9 5 年由b l u m 和f u r s t 提出的图规划1 1 4 ,1 5 1 ,这种方 法第一次采用图的方式来解决规划问题,开辟了规划求解的新途径,使智能规划领域取 得了革命性进展【1 6 1 ;第三种方法是1 9 9 8 年由b o n c t 和g e f f n e r 提出的启发式1 1 7 1 ,这种方 法利用启发式函数来指导状态空间搜索,实践证明采用启发式的规划器比没有采用启发 式的规划器表现出了更强的问题求解能力,比较典型的规划器如f f l 8 1 ,h s p i 切,g r 一1 9 1 , a l t a l 1 4 2 0 ,m i p s t m 2 2 1 和s t a n i l 都采用了启发式搜索的思想。另外,需要关注的是, 3 在1 9 9 8 年两年一次的国际规划竞赛首次召开,再一次掀起了规划研究的热潮,大赛为 规划器的优劣提供了测试平台,对智能规划的理论研究起到了巨大的推动作用。 进入2 1 世纪以来,到目前为止国际规划竞赛又成功地召开了三届,不断涌现出杰 出的规划器,在理论上也取得了很多重大突破。由于智能规划研究的难度大、应用广, 未来此领域无疑将继续成为一个富有挑战性的国际研究热点和人工智能领域中最活跃 的分支之一。 1 2 应对规划 敌意规划的应对规划是智能规划的一个研究领域,在复杂环境或复杂交互过程中存 在的敌方( 竞争对手) 所执行的,规划目标为对我方不利的规划,称为敌意规划( 对手 规划) 。对敌意规划( 对手规划) 进行应对的规划,称为应对规划。 1 2 1 应对规划的研究内容 随着网络技术和通讯技术的发展,对于一个在开放性的复杂环境中活动的规划系 统,必然会和其他系统包括其他规划器产生作用。这时,不考虑其他系统或过程的影响 是不可想象的,而这种影响对于我们的规划器可能是帮助的、中立的、甚至敌意的。由 此引出了智能规划的一个研究领域:敌意规划及其应对规划。 从本质上来讲,无论对方规划系统对于我们的规划系统是友好的还是敌意的,处理 的基本方法应该只限于一种情况:根据对方的动作,做出相应的对策,最终达到自己的 规划目标。对于一个敌意规划的应对规划机制需要具有以下特点: ( 1 ) 根据观察到的对方的部分的、琐碎的动作( 网络攻击动作) ,识别对方完整的 规划和目标( 攻击目标) 。 ( 2 ) 根据环境参数的变化识别出对方的后继动作,推断其攻击的目标,利用智能 规划机制针对对方的敌意规划做出应对。 敌意规划主要是识别出对自己不利的规划攻击,而应对规划则主要对已识别出的敌 意规划组织应对策略,这同其它类型的智能规划一样,需要进行规划解的搜索。 目前有两种主流搜索规划方式:第一种搜索方式,其搜索空间是环境中所有可能状 态的集合,搜索的目的是找到一个能使目标得到满足的状态,算子对应于现实状态的转 移动作。能够完成从初始状态到成功( 目标) 状态间转移过程的算子序列,称为一个成 功的规划。这种对状态空间进行搜索的规划方法,称为状态空间搜索法( s t a t e s p a c e s e a r c h ) ;第二种规划搜索方式,其搜索的空间包括所有可能的规划。算予通过增加或者 重排对应于动作的规划步骤来实现规划间的转换。这种规划的优点是可以将每个规划表 示成多个半序动作的序列的集合,而不是一个简单的动作序列。规划最终得到的可以是 空间中多个规划的半序动作序列的组合,这样就使得在不严格要求动作执行顺序的时 候,大大增加规划的灵活性。 半序规划的空间搜索:在最小约束规划中,规划定义为一个算子序列的集合,而算 4 子序列本身又蕴涵了算子执行顺序间的半序,因此这种规划方法又称为半序规划 ( p a r t i a l l yo r d c r e x lp l a n ) 。图1 - 1 表示以下算子序列 1 ,2 ,3 ,4 ,5 ) , 1 ,3 ,2 ,4 , 5 , 1 ,3 ,4 ,2 ,5 ) ) 一一口:i :! : :日 托 一一a 卜_ : : 朽 三于 丑j 彤拱4 图1 - i5 个步骤的半序规划,虚线表示步骤问的顺序 针对现今网络系统中所存在风险的不确定性和随机性,本文为应对规划定义了一种 租动力系统的解搜索过程。 搜索应具有可靠、完备、系统化的特点,即一个搜索过程,如果它对搜索空间中的 节点至多访问一次,则称该搜索过程是系统化的;一个搜索过程,如果在它任意时刻返 回的规划中,所有与半序一致的全序步骤都可以使初始状态最终转移到目标状态,则称 该搜索过程是可靠的;一个搜索过程,如果它始终能够在存在解的情况下求得解,则称 该搜索过程是完备的。当然,如果不存在解,则不能保证搜索过程结束。 1 2 2 应对规划的研究前景 近年来,智能规划领域已经获得了长足发展。这些卓有成效的方法使得规划系统的 效率得到了显著提高,并在现实世界中得到广泛应用。在智能规划自身强大优势的感召 下,许多学者对该方向产生了极大兴趣,学者们致力于使规划系统解决的问题更多、求 解的速度更快、求出的规划解更优。此领域的研究呈现出一派生机勃勃的景象,进入了 一个崭新的突飞猛进的时代。但是,长久以来,研究者主要关心的是单个智能规划系统 在一个和它的能力目标相适应的封闭环境中的反应、计划、推理和学习。对于一个在开 放性的复杂环境中活动的规划系统,必然会和其它系统包括其它规划系统同时产生作 用。而这种作用对于我方规划系统可能是帮助的、中立的、甚至敌意的。现实世界中的 不确定性和随机性是客观存在的,在今天盛行的网络传输过程中自然的继承了这两种性 质。仅就网络方面而言,为了保证网络传输的安全性,有必要寻找一种模型对网络的入 侵以高效、快速,准确的应对。因此,敌意规划的应对规划已经成为研究价值很高的未 解决问题和未来的发展方向。敌意规划的应对规划是智能规划和规划识别的一个发展方 向。由于智能规划技术本身的独立性,此项研究对于竞赛机器人、游戏角色设计、智能 5 翠 用户接口的设计、自然语言理解、多a g e n t 系统等许多领域的研究,具有广泛的应用前 景。 6 第二章应激计算:应激反应系统模型研究 应对规划的启动机制是本章研究的应激反应系统要解决的重要问题之一受生物学 应激反应启发,本章给出了应激反应系统的几个概念,建立了应激反应系统模型,研究 了应激计算算法。此模型能对外来敌意攻击表现出实时反应的特性,能进行自我学习和 记忆。模型使用抑制链对敌意攻击所进行的对抗反应进行抑制,以免造成过度反应。本 章研究的应激反应系统对信息安全、竞赛机器人等许多领域都有重要意义。 2 1 研究背景 规划识别器( 规划识别系统) 能根据观察到对方部分的、离散的动作( 网络攻击动 作) ,识别出对方完整的规划和攻击目标并能据此对对方的后继攻击动作进行推断与预 报。应对规划则能够对正在执行的敌意规划进行应对,对将要执行的敌意规划预先做好 防范。研究生物学的应激机制是因为应对规划的启动机制必须像生物学的应激反应一样 迅速。 应激机制是生物体对外界刺激的反应,而应对规划是智能体对敌意攻击的反应;应 激是生物体感受器和效应器中介,而应对规划是智能体识别出敌意攻击和应对敌意攻击 的中介;因此,利用生物学的应激机制研究应对规划的启动机制是非常合理且自然的。 应激是生物体的本能反应,正是因为如此,生物体经过长时间的刺激后,可以形成 条件反射。用人工智能和智能规划的技术模拟实现之,除了使智能体可对敌意攻击表现 出实时性以外,还能使智能体根据记忆对遇到的信息进行类比、归纳学习,推理出此信 息是否是敌意攻击,无需再次进行识别。具有免疫性质的记忆与学习模型能使智能体将 其对敌意攻击的记忆在适当环境下转为己用。 2 2 基础知识 1 规划:如果一个实体在初始状态下,经过执行一系列动作,动作1 、动作2 、 动作n ,最后到达目标状态,那么,这一系列动作序列动作1 、动作2 、动 作n 就叫一个规划。 2 智能规划:目前还没有统一的定义,一般来说,智能规划就是设计某个规划动 作序列的过程,即是说智能规划主要解决怎么做,而不是解决为什么做。 3 敌意靓划:敌方( 竞争对手) 所执行的、规划目标为对我方不利的规划,称为敌 意规划( 对手规划) 。 4 应对规划:对敌意规划或对手规划进行应对的规划,称为应对规划。 5 识别:其作用和目的就是面对某一具体事物时,将其正确的归入某一类别。 7 2 3 应激反应的基本概念 1 应激反应:由多种伤害性刺激引发的,由肾上腺皮质介导的机体异性反应,这 些反应统称为应激反应。 2 应激计算:模仿生物应激反应机制来解决应对问题的优化算法,此算法是种 群体型操作,该操作以群体中的所有个体为对象。应激计算算法的主要操作有: 识别、启动。 3 免疫系统:表现为对“非已”物质的抵抗力。在一定的临界范围内,免疫系统 能通过其精细调节,维持机体内环境的相对平衡;若超出此临界范围,则可能 打乱机体内环境而致病。 4 具有免疫性质的记忆:以免疫学为基础,运用人工智能等现代方法模拟细胞免 疫或神经免疫的工作方式,使智能体具有推断、记忆的能力。 2 4 算法描述 2 4 1 应激计算算法描述 1 应激计算算法描述 扎接受信息; b 在规划识别器中分类和识别信息,如果信息为敌意攻击转c 步,否则转d 步; c 启动应对机制( 即启动效应器工作) ; d 如果还存在未规划的信息,转b 步,否则转e 步; e 将信息整理输出; 退出。 2 算法工作流程图( 图2 1 ) 2 4 2 具有免疫性质的记忆算法描述 1 算法描述 a 接受已识别出敌意攻击的信息; b 如果在记忆中存在类似的信息,转c 步,否则转d 步; c 根据类比与归纳机制对信息进行推测; d 如果在记忆中存在相同的信息,转e 步,否则转f 步; e 对相同的信息按已经处理过的办法进行处理: 将其作为新记忆送入记忆系统,并进行分类处理; 舀如果还有未记忆的信息,转b 步,否则转h 步; h 启动应对机制( 即启动效应器工作) : i 退出。 2 算法工作流程图( 图2 2 ) 8 图2 1 应激计算流程图 图2 2 :具有免疫性质的记忆算法流程图 9 2 4 3 效应器算法描述 1 算法描述 a 接受已规划好的敌意信息; b 如果存在应对的规划,转d 步,否则转c 步: c 寻找其应对规划,转d 步; d 在抑制链的控制下,处理信息: e 退出。 2 算法工作流程图( 图2 3 ) 图2 3 ;效应器算法流程图 2 - 5 应激反应系统模型 1 模型描述 a 接受外界信息; b 用规划识别器对信息进行识别和分类,如果为敌意信息转c 步,否则转d 步; c 启动应对机制( 即效应器) 并将信息送入学习与记忆系统; d 。对非敌意信息进行分类,使其适应不同的应用平台; c 输出信息至应用平台。 2 模型流程图( 图2 4 ) 2 6 本章结论和进一步工作 基于免疫的学习与记忆系统 图2 4 :应激反应系统模型 为解决应对规划的启动机制,受生物学应激反应的启发本章建立了应激反应系统模 型,研究了应激计算算法。此项研究工作刚刚开始,未来将进一步完善此项研究工作, 探讨如何将应激反应系统嵌入到应对规划系统中,以及如何嵌入到其它信息安全系统 中。相信此项研究是非常有价值的。 1 1 第三章应激反应模型的启动机制研究 本文在应激反应模型1 1 1 的基础上,研究其应对规划的启动机制,方法是将模型中的 抑制链模块作为可变资源,在入侵到来时,将其用于搜索应对规划;当找到规划解,并 启动应对规划时,将其用于抑制系统的过度反应。这极大地利用了现有资源,将在有限 资源下的抢占资源变为资源的多元利用,提高了系统的速度。 3 1 研究背景 现实世界中的不确定性和随机性是客观存在的,在当今盛行的网络传输过程中自然 继承了这两种性质。为了确保网络传输的安全性,有必要寻找一种模型对网络的入侵以 高效、快速、准确的应对。应激反应模型正是针对这一应用问题建立起来的。本章对其 内部功能模块一抑制链进行功能改进以达到快速启动应对规划的目的。用抑制链控制 函数来控制抑制链要实现的功能,确定其参与搜索应对规划及进行抑制系统过度反应的 时刻。文中定义了一个能给出安全域值的函数,安全域值用于刻画人们用自然语言描述 的安全级别。安全域值函数是随时间不断变化的:在检测到有入侵的那一时刻,安全域 值取到最大值( 这个最大值是由具体的应用环境和应用时机的要求人为给定的常数) 以 达到保护网络的目的;在应对规划启动的那一时刻开始,安全域值随时间的增加而逐渐 减小,直至取到最小值( 设为o ) ,表示非法入侵的威胁已解除,网络安全。这是因为, 随着时问的增加,应对规划正在逐渐的解除检测到的威胁,安全域值随之逐渐减小,当 安全域值取零值的时刻,即使应对规翔完成的时刻。这个过程使得应激反应模型表现出 自适应地保护网络安全的能力。此外,文中将现实世界空间引入动力系统中,建立了租 动力系统。通过粗动力系统对应对规划进行规划解搜索。 3 2 基础知识 1 应激反应模型:受生物学应激反应的启发,给出的一种应用于应对规划的模型, 此模型下的应对规划具有启动快速、应对高效、可自适应调节等特点。 2 抑制链:在应激反应模型中,用于对应对规划的执行操作进行抑制,以免造成 过度反应,带来不良后果。 3 殴几里得空间:一个定义了内积的实数域上的向量空间称为殴几里得空间。 其中内积是指与实数域r 上向量空间e 中任意对向量u ,v 唯一对应的实数, 这个实数记作( u ,v ) ,并满足: ( 1 ) ( u ,v ) = “u ) ; ( 2 ) ( u l + u 2 ,v ) = ( u 1 ,v ) + ( u 2 ,v ) ; ( 3 ) ( a u ,v ) = a “,v ) ; ( 4 ) ( u ,u ) = o 当且仅当u = 0 时( u ,u ) = 0 ,式中u l 1 1 2 ,u ,v 是e 中的任意向量,a 是任意 实数 4 动力系统:有一个由所有可能发的各种状态构成的集合x 并有与时间t 有关的 动态规律帆:x 一x 。这样,一个状态随时间t 变动而成为状态垂t ( x ) 。如果x 是殴几里得空间或一般是一个拓扑空间,时间t 占满区域( 一* ,+ * ) 。动态规律 h 还满足: ( 1 ) 初值条件:0 ( x ,o ) r a g ; ( 2 ) 0 ( x ,t ) 对x ,t 一并连续: ( 3 ) 群的条件:即对任意z ,任意t 1 ,t 2 j ,有0 ( x ,t 1 + t 2 ) = q b ( 巾c x ,t 1 ) ,t 2 ) ; ( 4 ) 垂( x ,t ) 对t 可微;则得一动力系统。 5 入侵检测;入侵是指任何试图危及计算机资源的完整性、机密性或可用性的行 为,而入侵检测是对企图进行的入侵、正在进行的入侵或者已经发生的入侵的 识别过程。 3 3 应激反应启动机制及其相关概念 1 安全域值函数s ( t ) :是一个开关如图3 1 所示,随时间变化的单调递减函数,用 于给出安全域值。s 【o ,s 】其中s 一是人为设定的常数。t s 表示安全域值以最 小值0 的那一时刻。 s 。 s m a x 0 t | 图3 1 :安全域值函数 2 入侵检测标志位( f ) :是一个布尔型变量,定义如下: r f 一1 检测出入侵 i f o 未检测出入侵 3 应对规划启动标志位( s t a r t ) :是一布尔型变量,定义如下: 1 3 r s t a r t 一1 应对规划启动 1 s t a r t 一0 应对规划结束 4 线性相关值( z ) :用于度量两个向量之间的线性相关性,定义如下: z 一ns e d ( x i 。x t 0 了= i 其中s e d 表示两个向量间的殴几里得距离,i e o ,1 。 5 抑制链控制函数i ( ) :控制抑制链何时参与搜索应对规划,何时参与抑制作用, 定义如下: ,( f , s t a r t ,一戌萼嘉箸荏驴娄:怒二: 6 现实世界空间:由于现实世界的不确定性,不能满足殴几里得空间所定义的x 在x ( 所有可能发生的状态构成的集合) 中存在唯一的映射,因此用状态满意度( x 对x 中一个状态的满意程度1 对每一个x 在x 中寻找其最满意的状态。这种用 状态满意度度量的空间称为现实世界空间。 7 粗动力系统:一个由所有可能发生的状态构成的集合x 和一个与时间t 有关的 动态规律籼:x x 。这样,个状态在动态规律m 控制下变动而成为状态由。( x ) 。 如果x 是现实世界空间,时间t 占满区域( 一m ,+ * ) 。动态规律舐还满足: ( 1 ) 初值条件:巾( x ,o ) = x ; ( 2 ) 垂( x ,t ) 对x ,t 一并连续; ( 3 ) 垂( x ,t ) 对t 可微,则得到一个粗动力系统。 3 4 操作预处理 进行操作预处理的目的是将接收到的数据转化成一维全序序列。 3 4 1 输入为维数据的情况 对于一维数据,只需按接收时闻的先后对数据进行简单的排序。设输入的数据为 x 一仁;j i s 册,则输出为y - 扛。,t 。主i n ,n 一1 2 ,3 ) 。t 表示时间 3 4 2 输入为二维数据的情况 1 二维数据一维化 设输入的数据为瓦,一乜j s 鼙l ,1 s v s n : ,对其进行“之”字行排序,输出 为y 。 y u ,1 s “5 n ,n 一l + n :) 。排列顺序如图3 2 所示,其中的数字表示顺序。例如: 有输入如图3 3 所示的二维数据,则输出为 y 。,y 。,y ,蚝,) ,5 ,y 2 ,乃,y 6 ,y ,7 1 2y 廿,y l 。, y 7 ,) ,l l ,y 1 4 ,y 1 5 。 1 4 2 全序排序 将得到的一维数据按时间先后进行排序,则】,一 ( 儿,t 。s “sn ,厅- 1 , 2 , 3 。t 表 示时间。 图3 2 :之字行排序示意图图3 3 :例图 3 5 入侵检测标志位 当z s 时,存在非法入侵,将入侵检测标志位f 置1 ,搜索应对规划解,启动应对 规划,将应对规划启动标志位s t a r t 置1 ;当z s a t i s f a c t i o n l s a t i s f a c t i o n 2 则状 态伍,0 的应对规划解为憨。 基于应激反应模型下的网络安全系统具有不确定性、不精确性等特点。因此,采用 粗动力系统对上述应对规划进行解搜索。 3 8 本章结论和进一步工作 未来的工作将致力研究更准确的抑制链结构,并对粗动力系统的求解做进一步优化, 以得到最优解。 第四章应对规划库的学习与记忆 应对规划是对敌意规划进行对抗的一种智能规划,应对规划库的质量直接关系到对 敌意规划的对抗性能,是应对规划解搜索策略之外的另一个需要解决的关键技术,本章 以人的主要学习与记忆神经回路和分子生物学为基础,构建了应对规划库的学习与记忆 神经网络。 4 1 学习与记忆概述 4 1 1 学习与记忆 学习是指人和动物获得关于外界信息的神经过程,记忆是将获得的信息储存和读出 的神经的过程。 学习分为:非联合型学习( 1 3 0 1 1 a s s o c i a t i v el e a r n i n g ) 和联合型学习( a s s o c i a t i v e l e a r n i n g ) 。非联合型学习即在刺激和反应之间不形成某种明确的联系;经典条件反射和 操作式反射属于联合型学习。 记忆分为:( 1 ) 短时记忆和长时记忆:长时记忆( 1 0 n g - t e r mm e m o r y ) 有时又可分 为中间型( i n t e r m e d i a t e ) 和真正的长时记忆两种。区别两者的主要区别是记忆保持的时 间。短时记忆( s h o r t t e r mm e m o r y ) 又分为若干类别:( a ) 最短的短时记忆是影像记忆 ( i c o n i c m e m o r y ) ,( b ) 即刻记忆( i m m e d i a t em e m o r y ) ,( c ) 初级记忆( 晒m a r ym e m o r y ) 定义为一时即过丙仍留在意识中的记忆和对事件的选择性注意,这种记忆的时程常常可 以由记忆者依赖思维和复述来调控。( d ) 工作记忆( w o r k i n gm e m o r y ) ,主要指在执行 某些认知行为过程中的一种暂时的信息存储,这种记忆需要对时间上分离的信息加以整 合,因此这种记忆也称为操作记忆( o p e r a n to rp r o v i s i o n a lm e m o r y ) 。 ( 2 ) 陈述性记忆和非陈述性记忆:根据信息存储和回忆方式,记忆可分为陈述性 记忆( d e c l a r a t i v em e m o i ) ,) 和非陈述性记忆( n o n - d e c l a r a t i v em e m o r y ) ,非陈述性记忆又 称为反射性记忆( r e f l e x i v em e m o r y ) ,反射性记忆具有自主或反射的性质,它的形成或 读出不依赖于意识或认知过程。反射性记忆要经过多次反复测试才能逐步形成。陈述性 记忆依赖于对信息获得和回忆的意识表达,依赖于评价、比较和推理等认知过程。 4 1 2 学习与记忆的基本过程 学 - j 与记忆的基本过程分三个阶段:获得( a c

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论