(森林经理学专业论文)基于神经网络森林经营辅助决策的知识获取.pdf_第1页
(森林经理学专业论文)基于神经网络森林经营辅助决策的知识获取.pdf_第2页
(森林经理学专业论文)基于神经网络森林经营辅助决策的知识获取.pdf_第3页
(森林经理学专业论文)基于神经网络森林经营辅助决策的知识获取.pdf_第4页
(森林经理学专业论文)基于神经网络森林经营辅助决策的知识获取.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 在基于知谈的系统中,尤其是在专家系统中,知识的获取是一个十分困难的问题,它 一直被公谈梵是一个“瓶颈”。本论文系统造介绍了人工神经网络知识获毂技术斡有关理 论和成用技术,提出了一种在森林经营决策中的应用方法,并在m a t l a b 软件环境下,对 文章提出的应用方法和理论进行了验证,初步实现了基于神经网络的自学习知识获取过 程。 本文利用知识获取技术,根据森林资源连续瀵查的固定样地调查资料,建立地类、林 种预测帮森栋来来收获量颈 吉的神经网络里模型( 包括龄组结构预测帮林分采伐量预测) , 并对所建立的模型进行适应性检验。检验结集表明用人工神经网络的方法对地类、林种的 动态变化鞠林分收获薰进行预测是可以满足林业生产经营的精度要求,霹该神经网络获取 的知识是可行的。利用所获取的知识分别对福建建阳地区各地类、林种未来几年的动态变 化趋势以及福建杉木林分发展趋势和森林采伐壁进行预测、分析,从中找出控制发展的关 键所在,捧遗秘学酶决策,这对维护生态平衡、合理发震林监生产有重大麴现实意义。 本文用人工神经网络来实现知识的自动获取,无需由知识工程嫦来整理、总结、消化 领域专家的知识,只需熙领域专家解决闻题的实铡或范例来训练神经瓣络,使得在弱样的 输入条件下入工神经网络能够获得与专家给出的解答尽可能相同的输出。 关键字:人工神经网络、森林经营决策、知识获取、预测模型 a b s t r a c t i nt h ek n o w l e d g e b a s e ds y s t e m , e s p e c i a l l yi nt h ee x p e r ts y s t e m ,t h e a c q u i s i t i o no fk n o w l e d g ei sav e r yd i f f i c u l ti s s u e ,a n di th a sb e e nr e c o g n i z e d a sa “b o t t l e n e c k ”i nt h i sp a p e r is y s t e m a t i c a l l yi n t r o d u c e dt h et h e o r ya n d a p p l i c a t i o nt e c h n o l o g yo fk n o w l e d g ea c q u i s i t i o nb a s e do na r t i f i c i a ln e u r a l n e t w o r kt e c h n o l o g ya n dp r o p o s e da na p p l i c a t i o nm e t h o di nf o r e s t m a n a g e m e n t d e c i s i o n m a k i n g t h e n ,i nt h em a t l a bs o f t w a r ee n v i r o n m e n t ,t h ea p p l i c a t i o na n d t h e o r yp r o p o s e di nt h ea r t i c l ew a sv e r i f i e da n dt h es e l f - l e a r n i n gk n o w l e d g e a c q uisitio np r o c e s sb a s e do nt h en e u r a ln e t w o r kw a sa c hie v e d b yu s i n gk n o w l e d g ea c q u i s i t i o nt e c h n i q u e s ,a c c o r d i n gt ot h ef o r e s tr e s o u r c e s f o rt h ei n v e n t o r yd a t a ,ie s t a b lis h e dt h en e u r a ln e t w o r kf o r e c a s tm o d e lo ft h e c a t e g o r yo ff o r e s tl a n dt y p e sa n dt h ef o r e s tf u t u r eh a r v e s t ( i n c l u d i n gt h ea g eg r o u p s t r u c t u r ep r e d i c t i o na n dt h ep r e d i c t i o no ff o r e s th a r v e s t ) a 1 s o ,it e s t e dt h e m o d e l t e s tr e s u l t ss h o w e d t h a tu s i n gt h ea r t i f i c i a ln e u r a ln e t w o r km e t h o dt o f o r e c a s tt h ed y n a m i cc h a n g eo ff o r e s tl a n dt y p e sa n dt h ef o r e s th a r v e s tc a nm e e t t h ea c c u r a c yr e q u i r e m e n t so ff o r e s t r yp r o d u c t i o na n do p e r a t i o n t h a tt h ek n o w l e d g e a c q u i s i t i o nb a s e do na r t i f i c i a ln e u r a ln e t w o r ki sf e a s i b l e a c c o r d i n gt o t h e k n o w l e d g ea c q u i r e d ,ip r e d i c t e da n da n a l y z e dt h ed y n a m i cc h a n g et r e n d so ff o r e s t l a n dt y p e si nj i a n y a n go ff u ji a na n dt h ed e v e l o p m e n tt r e n d s o fc h i n e s ef i ra n d t h ef o r e s th a r v e s ti nf u j i a n t of i n dt h ek e yt ot h ed e v e l o p m e n ta n dm a k ea s c i e n t i f i cd e c i s i o n ,w h i c hi so fg r e a tp r a c t i c a ls i g n i f i c a n c et ot h em a i n t e n a n c e o fe c o l o g i c a lb a l a n c ea n dr a t i o n a ld e v e l o p m e n to ff o r e s t r yp r o d u c t i o n i nt h i sp a p e r ,u s i n ga r t i f i c i a ln e u r a ln e t w o r kt oa c h i e v et h ea u t o m a t i c a c q u i s i t i o no fk n o w l e d g e ,n o1 0 n g e rn e e d e db yt h ek n o w l e d g ee n g i n e e r st oo r g a n i z e , s u m m a r i z ea n dd i g e s tt h ek n o w l e d g eo fe x p e r t si nt h ef i e l d ,o n l yn e e d e dt h e p r o b l e m s o l v i n ge x a m p l e so fe x p e r t si nt h ef i e l dt ot r a i nt h en e u r a ln e t w o r k ,s o t h a ti nt h es a m ei n p u t ,a r t i f i c i a ln e u r a ln e t w o r kc o u l dg e tt h es a m eo u t p u tg i v e n b ye x p e r t sa sm u c ha sp o s s i b l e k e yw o r d s :a r t i f i c i a ln e u r a ln e t w o r k 、f o r e s tm a n a g e m e n td e c i s i o n 、k n o w l e d g e a c q u is i t i o n 、f o r e c a s tm o d e l i i 独创性声明 本人声明,所呈交的学位( 毕业) 论文,是本人在指导教师的指导下独立完成的研究 成果,并且是自己撰写的。尽我所知,除了文中作了标注和致谢中融作了答谢的地方外, 论文中不包含其他入发表或撰写过的研究成果。与我一同对本研究做出贡献的同志,都在 论文中作了明确的说明并表示了谢意,如被查有侵犯他人知识产权的行为,毒本人承担应 有的责任。 靴弹蚴做储糕獬:妖 b 瓤:劲6 9 es 论文使用授权的说明 本入完全了解福建农林大学有关保留、使用学使( 毕鲎) 论文的规定,帮学校有权送 交论文的复印件,允许论文被查阅和借阅:学校可以公布论文的全部或部分内容,可以采 用影印、缩印或其他复制手段保存论文。 保密,在年后解密可适用本授权书。 器 不保密,本论文属于不保密。b 学位( 毕业) 论文作者亲笔签 指导教师亲笔签名: 名:嗽嗍嬲心 臣痧眺形砂 福建农林大学2 0 0 8 届硕士学位论文 1 绪论 1 1 研究的意义 , 森林资源是陆地生态系统的主体,它具有生态效益、社会效益和经济效益,是人类生 存的必要条件,也是人类社会极为重要的财富。森林资源经营是对现有森林进行科学培育 以提高其产量和质量的经营活动的总称。森林经营工作范围广,持续时间长,应在生态学 的基础上达到既能取得较大的经济效益,又能充分发挥森林的生态效益,使森林的多种效 益得到持续增长的目的。森林经营过程是一个大系统,它有多层次、多目标、多途径、多 因子的特点,这些因子又具有多种联系的特点,其变化过程既具有模糊性,又有随机性, 在控制过程中还有风险性。因而森林经营决策过程必须以系统科学为指导,协调各专业学 科,以运筹全过程为目标,运用系统工程的理论和方法,从定性到定量,定性指导定量, 以计算机为工具,使思想、理论、方法、工具统一起来,从总体上如实反映整个复杂的过 程。 森林经营决策是综合运用森林经理学、森林生态学、森林生物学和经济学等专业知识, 结合各林业生产单位的具体情况,通过综合分析来合理地组织森林经营,以取得最优的经 济和生态效益。随着信息量的不断增长,森林资源经营管理单位将会面临信息多元化、信 息冗余、资源信息分析困难,从而带来经营决策的困境或者经营决策不合理。因此,森林 资源信息数字化管理之后带来的问题就应该采用具有析取有用数据的决策知识获取,从而 辅助决策者采用科学、有效、合理的措施。用决策科学的一般逻辑,探索森林资源管理的 复杂性,进而提出相应的科学决策的思路和手段,是很有意义的工作。 森林经营是国家适应新时期新林业发展与社会主义市场经济发展的需要而做出的选 择,但森林资源的公益效能并不能因此而降低。因此森林经营决策的正确与否,不仅意味 着森林资源资产经营者经济目的能否实现,从而保障森林资源资产经营者的利益需求,更 重要的是森林资源资产经营以森林资源为物质内涵的本质不会改变,经营决策正确与否也 影响着森林资源资产经营企业内部产业结构的平衡和合理安排,更关系着国家与社会对于 自然资源的优化配置及其对森林资源综合效益需求的满足程度。因此,只有科学地进行森 林资源的资产经营决策,才能使森林资源的资产经营满足经营者、国家、社会不同需求以 获得稳定协调发展,最终实现可持续经营的目标。 森林经营决策根据建立的模型过程分为经验模型和机理模型。经验模型存在的问题是 模型的选择带有一定的随意性,主要根据经验或数学方法进行选择,对不能线性化的非线 性函数拟合存在计算上的困难,而且由于模型系统在许多情况下具有明确的生物学意义, 因而难以对模型系数进行实验归纳估计,模型确定实验工作量大、模型的普适性差。机理 模型的参数一般要求有明确的生物学意义,可以通过简单的试验加以初步确定,参数的变 化范围与趋势可以估计,因而可以对以往实验加以归纳,花较少的代价建立模型,可对参 数适当调整适应环境背景以及种类、品种等的变化。模型的解释能力强,适应性广。机理 基于神经网络森林经营辅助决策的知识获取 模型的模型结构反映复杂过程的能力有限以及参数与驱动变量相关,然而许多模拟模型都 基于参数不受或很少受驱动变量的影响。由于这种相互作用,机理模型经常需要经过调整 参数来提高拟合精度,往往导致使模型适应一组特定的数据,使模拟降级为曲线配合,而 且模型结构的确定是一项需要高度抽象与艺术的工作。模拟模型的这些局限性使森林经营 决策模拟模型在林业生产经营中的应用受到限制,而神经网络的方法可在一定程度上加以 克服阳1 。神经网络是由相互作用的、按层次组织的大量神经元构成的并行处理网络,以模 拟生物神经系统的方式处理信息。神经网络具有学习能力和并行处理结构,从而具有了有 效的知识获取手段,客服了e s 只是获取的瓶颈问题n 0 1 。 1 2 研究的现状 知识获取,在森林资源经营决策研究中大多处于构想之中,多数也只是在决策系统中 提及其构成,如李晓宝n 司等提出了建立森林经营方案决策支持系统的设想但未涉及知识库 系统的内容;武刚用系统的观点,探讨区域森林资源管理中的决策行为,进而利用对策论 或信息经济学的方法,分析了区域森林资源管理的决策机制,在总结决策支持系统( d s s ) 发展历程基础上,指出了开展区域森林资源管理决策支持系统( l f r m d s s ) 研究的必要性, 并就其框架、结构、集成方案进行了设计n 引;陈钊探讨了森林资源灾害应急智能决策系统 的初步构架、系统的目标、功能、结构,为建设森林资源灾害应急智能决策系统提供了思 路和基本的模式,研究了福建永安森林资源灾害应急智能决策系统技术平台的功能结构, 初步开发了基础数据库子系统和应急决策模拟等部分模块n 副。吕勇提出了以中国森林资源 清查体系,特别是二类资源清查系统为基础,构建中国森林资源核算与绿色g d p 系统的设 想,将森林资源资产评估方法与过程等专家知识建立专家知识库,编辑推理机,建立森林 资源资产评估专家系统n 引。d o n a l dn u t e 乜们等阐述了森林经营的多目标决策支持系统n e d 一1 软件( n o r t h e a s td e c i s i o nm o d e l ) 构成,并探讨了人工智能( a r t i f i c i a li n t e l l i g e n c e ) 在系统中的应用;在应用g i s 工具后,开发了基于a g e n t 的森林生态系统经营决策支持系 统n e d 一2 软件乜,该系统具有知识库系统的功能。所以森林资源经营决策知识获取研究并 未深入,而构建专家系统、决策系统,必然要求知识库是一个从理论到关键技术都细化的 体系,为此研究森林资源经营决策知识获取具有重要的意义。 森林资源经营决策的知识获取,一般采取领域专家与知识工程师交流的非自动知识获 取。而基于神经网络的知识获取是利用计算机在领域专家和知识工程师的配合下,直接从 样本中获取知识,是一种自动的知识获取乜副。它的一个重要特点是:当输入中存在噪声或 数据不完备时,它们将产生近似的答案,而非错误的答案。借用生物学的术语,这成为“退 化现象”。类似地,当输入数据虽然仍在样本范围内,但与样本相差甚远时,它们将产生 在样本输出之间合理插值后的输出数据。神经网络可应用于不同的任务。在森林经营决策 知识获取中,网络将给定的一组输入数据和一组特定的输出联系起来,尽管连接这两者的 函数并不知道,或是一阶的非线性函数。因此,对于那些无法简单测量到的,但通过某种 复杂途径与其他各种可能测量到的变量相关的重要变量来说,神经网络提供了一种有用的 2 福建农林大学2 0 0 8 届硕士学位论文 知识获取技术。神经网络模拟人的大脑思维,能对复杂的森林经营决策信息进行知识获取, 并具有自适应性、自组织、自学习和容错性好的特征乜副。即能同时处理与森林经营决策有 关的信息,如虽然单个神经元的动作速度不快,但网络的总体处理速度极快。由于神经网 络包含的信息是分布存储的,即使网络某些单元和连接有缺陷,它仍然可以通过联想得到 全部或大部分信息。可以通过学习不断适应环境,增加森林经营决策的知识容量。 1 3 研究的主要内容及方法 知识获取,就是使得在同样输入的条件下,神经网络能够获得与专家给出的解答尽可 能相同的输出。从而使该网络具有了与专家解决此类领域问题相似的能力,即神经网络具 有了专家知识,其智能行为在生物学上表现为神经元之间连接权重的变化。 1 本文的主要研究内容如下: ( 1 ) 森林资源信息及经营决策知识 分析森林资源信息:把森林资源信息进行分类,归纳,进行模式处理,从中提取常识 性知识;确定森林资源信息的原数据模型;对森林资源信息经营决策知识论域范围进行探 讨,分析该领域的数据类型、信息流和基本因果、时间和空间关系。 ( 2 ) 森林资源经营决策知识获取源 知识的来源大多是通过领域专家和知识工程师获得领域知识素材。探讨森林资源经营 决策知识获取的各种途径,对领域专家模型进行分类,分析等。 ( 3 ) 森林经营决策的知识获取 初始化领域知识。选取森林经营决策中各参数的数据作为神经网络的培训和测试样 本集。 初始化神经网络。按转译规则,将形式化知识转化为神经网络所用的编码形式,确 定森林经营决策的神经网络结构,以及网络的输入和输出。 选择合理的森林经营决策的神经网络学习算法。 通过测试获取森林经营决策的知识。采用森林资源连续清查资料,对今后各分期( 五 年为一期) 各地类、林种面积的占有率和动态变化进行分析预测,并作出合理控制的决策。 同时,利用森林资源连续清查资料进行林分龄组结构和采伐量的分析预测,从中找出问题 所在,作出科学决策,这对合理发展林业生产,制定林业发展规划和国民经济计划具有重 大的现实意义。 神经网络学习过程即是获取知识的过程,对于数值型知识形成的训练和测试样本集, 直接可以作用于网络而获得表示输入和输出之间关系的知识。 2 本文的关键技术学习流程图如图1 - 1 所示。 基于神经网络森林经营辅助决策的知识获取 图1 1 学习过程的流程图 t a b 。l 一王f l o w c h a r to fl e a r n i n gp r o c e s s 4 福建农林大学2 0 0 8 届硕士学位论文 2 基于神经网络结构学习的知识获取 知识获取是指在人工智能或知识工程系统中,通过非自动方法或自动方法实现计算机 从知识源获取知识的过程。知识源包括专家、书本、数据库以及人们的经营等。知识获取 的目的是通过计算机对专家的丰富知识高速度地加以收集、整理,通过建立各种高性能的 知识系统,以帮助人类解决那些单靠人自己难以解决或解决起来太慢、效率太低的各种问 题8 i 。 在基于知识的系统中,尤其是在专家系统中,知识的获取是一个十分困难的问题。他 一直被公认为是一个“瓶颈”,许多人工智能学者致力于开展这方面的研究工作,也取得 了一些成果,但距离知识完全自动获取这一目标还有许多理论及技术上的困难尚待解决。 在早期专家系统的建立过程中,知识获取工作主要是由知识工程师与领域专家密切配合, 以人工方式实现的。知识的采集、提炼、表示、编码以及调试修改都是由知识工程师完成 的。为了减轻知识工程师的负担,加快知识获取的进程,目前,人们将智能化编辑和编译 技术应用于知识系统,它负责把知识转换为计算机可存储的内部形式,然后存入知识库, 从而构成非自动型的知识获取方式。下面将主要介绍非自动、自动两种知识获取方式。 2 1 知识获取的方式 1 非自动知识获取 非自动知识获取方式分两步进行:由知识工程师从领域专家或有关的技术文献那里获 取知识;由知识工程师用某种知识编辑软件输入到知识库中。其工作方式如图2 - i 所示。 图2 1 非自动知识获取 t a b 2 一ln o n a u t o m a t i ck n o w l e d g ea c q u i s i t i o n 非自动方式是专家系统建造中用得比较普遍的一种知识获取方式。在非自动知识获取 方式中,知识工程师起着关键作用,因为领域专家一般不熟悉知识工程,不能强求他们把 自己的知识按专家系统的要求抽取并表达出来,所以知识工程师的主要任务如下: ( 1 ) 组织调查。以反复提问的方式启发领域专家按知识处理的要求回答问题,并详 细纪录专家的答案。 ( 2 ) 理解和整理材料。在充分理解的基础上对领域专家处或书本上得到的答案进行 选择整理、分类、汇集并形成用自然语言表达的知识条款。 ( 3 ) 修改和完善知识。把整理分类好的知识条款反馈给领域专家,进行修改、完善 和精化,最终的结果要得到领域专家的认可。 基于神经网络森林经营辅助决策的知识获取 ( 4 ) 知识的编码。把最终由专家认可的知识条款按一定的表达方式或知识表示语言 进行编码,得到知识编辑器所能接受的知识条款。 2 自动知识获取 由于知识工程师本身知识的局限性和沟通上的困难,经常将错误的知识输入到知识库 中。要解决这个难题,就必须建立一套没有知识工程师介入的知识获取系统,即领域专家 可以直接将知识输入到知识库中,这种方法就是自动知识获取。自动知识获取又称为机器 学习,就是让计算机直接从环境中获取全部信息。要实现完全自动的知识获取,涉及机器 感知、机器识别和机器学习等研究领域的问题,下图2 2 给出了完全自动的知识获取的过 程框图。 图2 2 完全自动知识获取模型 t a b 2 - 2a u t o m a t i ck n o w l e d g ea c q u i s i t i o nm o d e l 若要得到进一步的知识,必须经过机器学习系统和机器识别系统处理。经过机器知识 系统处理后可以得到信息的分类知识、信息的特征以及信息的结构知识等。而机器学习系 统可以提供更高层次的知识,它根据环境信息形成概念,进行归纳推理、文法推断、假设 猜想乃至科学发现等一系列高层次的知识。机器学习是一门研究机器获取新知识和新技 能、并识别现有知识的学问。这里所说的机器就是指计算机。 2 2 知识获取的步骤 知识获取是一个不断循环和不断完善的过程,应当分阶段完成。图2 - 3 给出了知识获 取过程的分阶段流程图。从图中可以看出,整个知识获取由5 个阶段( 步骤) 构成,即问 题识别、概念化、形式化、实现和测试嵋3 。 6 福建农林大学2 0 0 8 届硕士学位论文 问题识 别阶段 概念化 阶段 形式化 阶段 实现 阶段 测试 阶段 图2 3 知识获取的步骤 t a b 2 3k n o w l e d g ea c q u i s i t i o ns t e p s 也就是说知识获取从知识收集开始,接着就是对知识进行解释和分析。最后,知识收 集的方法就设计出来,它创造了一个自然循环过程。 ( 1 ) 收集 收集是指从专家获取知识的任务。这个努力是知识提取循环中最难的任务。在项目 的早期阶段,首先要获得对问题的基本理解。在后期阶段,将努力收集特定的信息。 ( 2 ) 解释 收集信息之后下一个任务就是解释。这涉及到对收集到的信息的评述和对关键知识的 辨识。在早期阶段,对材料信息的评述,在专家的帮助下建立问题的目标、约束和范围。 在后期阶段,将使用正式方法解释这个任务中所揭示的知识。 ( 3 ) 分析 通过解释任务中的学习所发现的关键知识,将为知识组织理论和问题求解策略的形成 提供建议。在早期的努力中,将识别专家所用的重要概念。也可以决定概念关系以及专家 如何使用这些关系来解决问题。 ( 4 ) 设计 完成收集、解释和分析任务之后,就该对问题有一些新的理解了,这样有助于进一步 研究。这个努力应该产生出需要进一步研究的新概念和问题求解策略。 一些人可能难以接受没有清晰结束点的知识获取循环。从学术上看,专家系统开发没 有终止条件。开发专家系统有点象教孩子新科目。当孩子获得有关这个科目更多的知识时, 7 慕予神经网络森林经营辅助决策的知识获取 纯就理解得更好,并能使扇这种理解解决闷题。专家系统按照相似方式可以通过获取受多 知识继续提高其性能。从实际意义来看,开发周期有个终止点,即系统性能满足最初的规 范要求。 2 3 基于神经网络结构学习的知识求精 神经网络是在研究人脑的奥秘中得到肩发,采用大量的处理单元( 人工神经元、处理 元件、电子元件等) 模仿入脑季枣经系统黪结构和工作视理。入工享孛经网络中,信息的处理 是豳神经元之间熬相互作雳来实现的,知识与信息的存储表现为网络元件置连闯分布式的 物理联系,网络的学习和识别取决于和神经元连接权值的动态演化过程瞳6 1 。 2 。3 。王人工神经网络的结构 神经网络是由大量神经元相互连接构成的复杂网络。一个典型的具有r 维输入、s 个 神经元的单层神经网络模型可以用图2 4 来加以描述。 辕人毒誊经元层 、 厂 一 n 一 r 。r _一s r入霸 f s t 臣yi 、 圣, ! 兰!兰 a = f ( w p + b ) 图2 - 4 单层享孛经网络模蘧 t a b 2 - 4m o n o l a y e rn e u r a ln e t w o r km o d e l 在图2 - 4 中,p 为r 1 维的输入矢量,网络层由权值矩阵w ( s r ) 、阈值矢量b ( s 王、求和单元秘传递遁数运算单元f 组成,s 个神经元缀成了s l 维的神经网络输畿矢 量o f ( w p + 6 ) 其中,输入层网络权值矩阵w 和闽值矢量b 的具体形式如下: b = : 熟 如 良 ( 2 - 3 - 1 ) 在单层神经网络基础上可以构造多层神经黼络,一个典型的三层神经网络模型如图 8 詹 壤 演 魄毪 一 怠 童 矗 m d 矗 d 屹 一吩 ,j。,。,。l = 矽 福建农林大学2 0 0 8 届硕士学位论文 2 - 5 所示。 输入 输入艨中间层 输出层 麓1 1 w 埘舻扩 蠢2 _ f 至联五1 麓l 妒a 3 = t a ( l w 3 a - a :b 3 ) 图2 5 三层神经阏络模型 我玉。2 5t h r e e l a y e r sn e u r a ln e t w o r km o d e l 产生神经网络最终输出的网络层称为输出层,中间层也称为隐层。图2 - 5 所示的神经 网络三层神经元的数爨分别为:s 1 、乎、。其中薹铲j 有教师学习是在有“教师 指导和考察的情况下进行学习的方式,如图2 - 6 所示。 9 基于神经网络森林经营辅助决策的知识获取 图2 - 6 有教师学习方式 t a b 2 - 6t h ew a yt os t u d yh a v i n gt h et e a c h e r 这种学习方式,“教师 绘出了与所有输入模式p 对应的输出模式的“正确答案 ,郎 期望输出t ( 目标) ,用于学习过程的输入输出模式的集合称为训练样本集;神经网络的 学习系统根据一定的学习规则进行学习,每一次过程完成后,“教师”都要考察学习的结 果,即实际输出a 与期望输出t 的差别( 误差e ) 以此决定网络是否需要再次学习,并根 据误差信号调整学习的进程,使网络实际输出和期望输出的误差随着学习的反复进行而逐 渐减小,直至达到要求的性能指标为止。 对误差信号可以有不同的定义,常用的有: ( 1 ) 均方误差m s e ( m e a ns q u a r e de r r o r ) ( t l at ) m s e = e e 墨三l 以 式中:n 输出单元数; a k _ 第k 个输出单元的实际值; t 广第k 个输出单元的期望值。 ( 2 ) 平均绝对误差m a e ( m e a na b s o l u t ee r r o r ) ( 2 - 3 - 3 ) k 一拉量| m a e = l 一 ( 2 - 3 - 4 ) 甩 ( 3 ) 误差平方和s s e ( s u ms q u a r e de r r o r ) s s e = ( t k 一致) 2z _ 一 7 k = l ( 2 - 3 - 5 ) 2 无教师学习( 无监督学习) 无教师学习不存在“教师 的指导和考察,是靠神经网络本身完成的,如图2 7 所示。 1 0 福建农林大学2 0 0 8 届硕士学位论文 p 输 a 输出 图2 - 7 无教师学习方式 t a b 2 一? t h ew a yt os t u d yh a v i n gn ot h et e a c h e r 嘲于没有现成的信息作为响应的校正,学习则是根据输入的信息,根据其特有的网络 结构和学习规则来调节自身的参数或结构( 这是一种自学习、自组织过程) ,从而使网络 的输懑反映输入的某种溺有特性( 如聚类或某种统计上的分布特征) 。 3 强化学习( 再励学习) 强化学习介于上述两种学习方式之闻,如图2 - 8 所示。 p 输 a 输密 圈2 - 8 强佬学习方式 t a b 2 - 8s t r e n g t h e n e ds t u d y w a y 外部环境对学习后的输入结果只给出评价信息( 奖或惩) ,两不给出正确的答案。神 经网络的学习系统通过强化那些受奖励的行为来改善自身的性能。 2 。3 3 人工神经网络的知识求精 由于人工神经网络吸取了生物神经网络的部分优点,因此具有以下特点: 1 人工种经网络在结构上是由很多小的处理单元互穗连接焉成,大量处理单元集体 的、并行的活动得到预期的识别、计算的结果,具有较快的速度。 2 入工神经网络具有缀强的学习功能,人工神经霹络中的连接权和连接的结构都可 以通过学习而得到;具有自适应、自组织、自学习能力;可通过训练样本,根据周围环境 来不断改变自己的网络,并根据变化的信息,调整自身的结构,从训练样本中自动获取知 识。 3 人工神经网络所记忆的信息是存贮在神经元之间的权值中,从单个权中看不出其 贮存信息的内容,因而是分布式的存贮方式。 4 人工神经网络具有很强的容错性,信息于分布方式存储于整个网络中,即使网络 局部受损,也不会对整个网络造成很大影响,还可以根据不完整或模糊的信息联想凄完整 基于神经网络森林经营辅助决策的知识获取 的信息,导出正确的输出。这些特点使得如果利用人工神经网络来实现知识的自动获取, 就不再需要由知识工程师来整理、总结、消化领域专家的知识,只需要用领域专家解决问 题的实例或范例来训练神经网络,使在同样输入的条件下人工神经网络能够获得与专家给 出的解答尽可能相同的输出口引。 知识获取是研制专家系统的瓶颈问题,对知识获取的主要步骤及其一般模式,学者们 提出了种种见解。而知识求精是知识获取必不可少的步骤。一般来说得到的初始知识库常 常有些问题,比如知识不完全、知识之间不一致、有的知识不正确等,因此需要调试、修 改和补充,即知识求精。 一般来说,求精问题是指: 已知:初始知识库( 指规则集) ;专家例证 求解:用已知例证检测初始知识,并对它进行修改、删除和补充,使加工后的知识达 到预期的运行性能。 基于神经网络结构学习的知识求精方法的流程如图2 9 所示,图中的初始规则集即初 始知识,训练样本即专家例证。它由三个步骤组成: ( 1 ) 转化:初始规则集转化为初始神经网络; ( 2 ) 训练:用训练样本和学习算法训练初始神经,即知识求精过程。 ( 3 ) 提取规则:提取求精的规则知识。 第一步:初始规则集转化为神经网络,一般通过下面的映射关系:最终结论一输 出节点;支持的事件一输入节点;中间结论一隐含节点;依赖关系一连接权值和阈值。 利用这个映射关系,可以将知识库中的待求精的知识转化为初始神经网络。 第二步:训练初始神经网络。现有方法( 如k b a n n ) 都采用b p 学习算法。据统计, 在众多的神经网络算法中,应用最广泛的要首推b p 网,约占8 0 以上,因此本论文 讲采用这一相对比较成熟的神经网络算法。 第三步:提取求精后的规则知识。通过上述算法训练好的神经网络实际上是求精 的神经网络,其只是分布表示于网络结构和权值中,是一种隐式表达,不易于理解。 所以要从神经网络中提取相应的规则。 图2 - 9 知识求精流程图 t a b 2 - 9k n o w l e d g er e f i n e m e n tf l o w c h a r t 1 2 橘建农林大学2 0 0 8 届硕士学位论文 3 。知识获取技术的设计与实现 3 1 软件平台的选取 考虑到神经丽络大规模、并行和矩阵计算的特点,选爝m a t l a b 作为神经网络知识获 取系统的实现环境。m a t l a b 是m a t h w o r k s 公司推出的一套高性能的数值计算和可视化软 侮,冀强大的扩震功能为用户提供了强有力酶支持:它集数学计算、图形计算、语言设计 和神经网络等3 0 多个工具箱与一体,具有极高的编程效率5 瑚3 。 神经网络工具箱将神经网络理论中所涉及到的公式运算和操作,全都编写成了 m a t l a b 环境下的子程序。我们只需要根据自己的需要,通过直接调用函数名,输入变量, 运行函数,便可得到结果,从而节省了编程和调试时间。 神经网络工具箱以入工神经网络理论为基础,用m a t l a b 语言构造出典型神经鼹络的 激活函数,那么对选定网络输出的计算,就变成对激活函数的调用。另外,根据各种典型 的学习规则和网终的训练过程,用m a t l a b 编写出各种网络权值训练子程序。我们可以根 据需要调用工具箱中有关神经网络的设计与训练的程序,使自己从繁琐的编程中解脱出 来,集中精力去思考问题和解决问题,从而提高效率和解题质量。 3 2 神经网络学习模块 神经网络学习模块是知识获取子系统的核心,丽神经瘸络结构的设计又直接影响瓣络 学习的效果和速度。因此,本论文首先给出具体的算法流程,在实验的基础上将不断对 神经网络的结构进行优化。a n n 学习模块的算法流程图如墼3 - 1 所示。 1 3 撼予神经网络森林经营辅助决策的知识获取 图3 - ia n n 学习训练流程图 t a b 3 - 1a n nl e a r n i n gt r a i n i n gf l o w c h a r t 条件参数列表和结果参数列表均按定的对应关系输出到a n n 的输入层和a n n 的输出 层。被设计人员选定的设计参数均按实际数值赋给,其它的神经单元初始值均设为o 。 3 3 神经网络结构的设计 3 3 1 数据的标准化处理 我们对于具体对象的真实样本还要进行预处理,将其对应到区间 o ,1 之中。对于归 一化计算公式的选择,原则上没有限制,只要能将培训样本变成区间 0 ,1 上的数即可。 本文采用的公式为: x 名口墨二垄随+ b( 3 3 1 ) 彳蟠一舅幽 式中:一样本归一化后的数值; x 。一学习样本数值; ) ( - ;广样本系列中的最小值; 卜样本系列中的最大值; 考虑到b p 算法的激励函数,s 型函数在自变量接近0 ,l 时曲线平缓,收敛速度慢, 建议输入变鬟与输出变量变换在【a ,b 之间,这样s 型蚕数在该区问内变化梯度增大,网 1 4 福建农林大学2 0 0 8 届硕士学位论文 络收敛速度提高,网络性能改喜。把样本归一到a 到b 的区域内,最大地节约了网络资源, 减轻了网络的学习负担,能够加快网络收敛并且较大地改善了网络的训练结果h 到。 3 3 2 b p 网络模型的构建 b p ( b a c k p r o p a g a ti o nn e t w o r k ) 神经网络是指基于误差反向传播算法( b p 算法) 的多 层前向神经网络,它是d e r u m e l h a r t 和j l m c c e l l a n d 及其研究小组在1 9 8 6 年研究并 设计出来的。髀算法己成为目前应用最广泛的神经网络学习算法。 典型的b p 神经网络是一种三层或三层以上的多层神经网络。每层由若干个神经元组 成。墅3 2 表示韶网络的拓羚结构,由输入层、隐层( 一层或多层) 、输出层组成。输入 层节点个数、输出层节点个数分别对应于b p 网络可感知的输入、输出数据的维数,隐层 节点数依据需要确定,各节点层间连接的权值、阈值可调。 x l x z y i y 2 y 3 图3 2b p 网络的拓扑结构 t a b 3 - 2b pn e t w o r kt o p o l o g y 在对输入的样本进行过标准他处理后,便得到对应的输入输出向量集。下面的任务就 是将样本送到基于b p 算法的多层前馈神经网络中去。而此时最重要的任务就是要对b p 网络进行设计,主要包括| 以下内容h 射: 1 隐含层数的确定:理论分析已经表明,隐含层数虽多两层即可。唯当要学习不连 续函数时,才霈要两个隐含层,髓具有单隐含层的神经网络能映射一切连续函数。在一般 情况下,采用一到二层隐含层比较合适,因为层越多,误差向后传递的过程计算就越复杂, 相应的训练时间也增加。隐含层增加后,局部最小误差也会增加,网络在训练过程中,往 往容易陷入局部最小误差而无法摆脱,两络的权值也就难以调整到最小误差处。因此本文 主要用三层b p 网络构建神经网络模型,在有必要时才用四层( 双隐层) b p 网络。 关于何时才有必要溺四层嚣嬲络,本文在此梭据神经元数、权值数与误差或精度之间 的变化规律,提出一种简单有效的确定方法。现将该方法论述如下: 以秘表示3 p 网络的输入节点数,m 表示输鲞节点数,s 表示三层网终的隐层节点数,长,s , 分别表示四层网络的第一、二隐层节点数,w n ,黼。分别表示第三层、第四层网络的权值 基于神经网络森林经营辅助决策的知识获取 个数。为便于比较,又不失一般性,设s 。+ s := j ,并且按网络的最大连通度( 权值数最多) , 当s 为偶时,取s l = j 2 = s 1 2 ;当s 为奇时,取s l = ( s + 1 ) 2 ,s 2 = 0 1 ) 2 。在这些约定之下, 可以得出: 聊也= 仍+ m ) s ( 3 3 2 ) w a r 4 = p 2 + 2 ( n + r e ) s 4 ( s 为偶)( 3 3 3 ) 黟a 厂4 = j 2 + 2 ( 刀+ 脚) j + 2 ( 刀一所) 一1 4 ( s 为奇) ( 3 3 4 ) 以s 表示聊,= w n 。时神经元数,可以解出: s = 2 ( n + 朋) ( s 为偶) ( 3 3 5 ) s = ( 玎+ m ) + o 5 4 ( 刀+ ,z ) 2 一( 2 刀一2 m 一1 ) 】) o 5 ( s 为奇)( 3 3 6 ) 由图3 - 3 可直观看出: 当s j 时,翮也w n 4 ( 3 3 7 ) 当s s 。时,吼聊4 ( 3 3 8 ) 图3 - 3w n 随s 变化的情况 t a b 3 - 3w nc h a n g i n gw i t hs 根据模型精度与权值个数的关系,可以得出以下结论: 当s j 时,用四层网络较好,理由与以上相反。 1 6 福建农林大学2 0 0 8 届硕士学位论文 在实际应用时,求出s 先用三层网络,训练s s + 的网络结构,能达理想的效果,则 用三层网络作为所求,否则换四层网络。用同样的思路可以确定l 层与l + i 层权值个数相等 时的神经元数s ,本文称之为b p 网络的层数转换点。由于五层以上的b p 网络极少用,故在 此略。 2 输入层、输出层神经元数的确定:这两层神经元数目的确定完全依赖于输入输出 向量各自的维数。以x 表示输入向量,以y 表示输出向量,则x 与y 的关系,可用一般函数表 达为o y = ( x )( 3 3 9 ) 神经网络模型的输入节点由式( 3 3 9 ) 中x 的分量确定,一般设x 受n 个因素影响, 即将x 表达为: x = i i ,x 2 ,x 。 ( 3 3 1 0 ) 由此确定要建的网络模型由n 个输入节点构成。 神经网络的输出节点由式( 3 3 9 ) 中y 的分量确定,一般设有m 个变量,即将y 表达为: y 2 乃,弘y , ( 3 3 1 1 ) 由此确定要建的网络模型由m 个输出节点构成。 3 隐含层神经元数的确定:采用适当的隐含层神经元数是非常重要的,可以说选用 隐含层神经元数往往是网络成败的关键。隐含层神经元数选用太少,网络难以处理比较复 杂的问题,隐含层神经元数过多,将使网络训练的时间急剧增加,而且过多的处理单元容 易使网络训练过度,也就是说网络具有过多的信息处理能力,甚至将训练组中没有意义的 信息也记住,这就使网络难以分辨数据中真正的模式。 一般来说,可以用几何平均规则来选择隐含层神经元数。假设设计一个三层的神经网 络,具有n 个输入单元和m 个输出单元,则: 隐含层神经元数= 朋+ ,z + l + 口( 3 3 1 2 ) 式中:a = l 1 0 。 或:隐含层神经元数= 2 n + 1( 3 3 一1 3 ) 找到隐含层神经元数很费时间,但对于设计网络结构很重要。首先可以从较小的隐含 层处理单元开始试验,选择合适的准则来评价网络的性能,训练并检验网络的性能。然后 稍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论