




已阅读5页,还剩59页未读, 继续免费阅读
(车辆工程专业论文)基于cbr的轿车购买智能决策支持系统.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于c b r 的轿车购买智能决策支持系统 摘要 本文简要阐述了基于c b r 的智能决策支持系统的相关技术,分析了我国当 前的轿车市场现状、消费需求因素以及消费者的购买决策因素,在此基础上提 出将基于c b r 的智能决策支持系统应用于轿车购买决策领域。通过分析比较 c b r 和r b r 的优缺点,说明二者结合的必要性,给出c b r 乘1 r b r 融合框架,建 立混合推理系统的整体框架,并建立案例的相似度计算模型。从轿车购买决策 因素的基本特征属性出发,分析决策因素属性相关的知识表示和知识获取的要 求,使用框架表示和面向对象表示法设汁相应的案例结构和案例库。通过案例 获取网络以及将案例属性分组,实现案例的高效率获取。通过测试,表明系统 的设计合理、有效。 关键词:智能决策支持系统轿车购买案例推理相似度计算案例获取 s t u d y o fc a rp u r c h a s ei n t e l l i g e n td e c i s i o ns u p p o r ts y s t e m b a s e do nc a s e - b a s e dr e a s o n i n g a b s t r a c t t h ep a p e rb r i e f l yi n t r o d u c e st h eb a s i ct h e o r yo fi n t e l l i g e n td e c i s i o ns u p p o r t s y s t e mw h i c hb a s e do nc a s e b a s e dr e a s o n i n g ,a n da n a l y z e st h ec u r r e n tc a rm a r k e to f c h i n a ,t h ec o n s u m p t i o nd e m a n df a c t o r sa sw e l la st h ep u r c h a s ed e c i s i o nf a c t o r so f c o n s u m e r b a s e do nt h e s et h ep a p e rp r e s e n t st h a ta p p l y i n gt h eb a s e do nc a s e b a s e d r e a s o n i n gi n t e l l i g e n td e c i s i o ns u p p o r ts y s t e mt oc a rp u r c h a s ed e c i s i o n a c c o u n t sf o r n e c e s s i t yo fc o m b i n i n gc b r 、v i t hr b ra f t e ra n a l y z i n gt h ed e f e c t sa n dm e r i t s c o n s t r u c t st h er e a s o n i n gf r a m e w o r kw h i c hi n t e g r a t e sc b ra n dr b r ,a n db u i l d st h e s i m i l a r i t ym e a s u r em o d a lf o rc a s e f o rt h eb a s ep r o p e r t yo fc a rp u r c h a s ef a c t o r s ,t h e r e q u e s t so fk n o w l e d g ee x p r e s sa n dk n o w l e d g er e t r i e v ef o rc a rp u r c h a s ed e c i s i o n f a c t o r sa r ea n a l y z e d ,a n df r a m ee x p r e s sa sw e l la so b j e c to r i e n t e di su s e dt od e s i g n t h ek n o w l e d g ef r a m e w o r ka n dk n o w l e d g e - b a s e ,w h i c hr e a l i z e st h eh i g he f f i c i e n c y f o rc a s er e t r i e v et h r o t i 曲c r na n dg r o u p i n gc a s ep r o p e r t y t h r o u g ht e s t ,t h es y s t e m p a s s e d ,w h i c hi l l u s t r a t e st h ed e s i g nr e a s o n a b l e a v a i l a b l e k e yw o r d s :i d s s c a rp u r c h a s e c a s e b a s e dr e a s o n i n g s i m i l a r i t ym e a s u r e c a s e r e t r i e v e 图l - 】 图2 1 图3 一l 图3 2 图3 3 图3 4 图3 5 图3 6 图3 7 图3 8 图3 9 图3 1o 图3 1 1 图3 12 图3 一 图3 一 图3 图3 一 图3 17 图4 1 图4 2 图4 3 图4 4 图4 5 插图清单 消费者购车决策时间6 基于案例的推理过程8 1 9 8 3 2 0 0 4 年我国轿车产量占汽车产量比例图18 消费者的决策过程21 消费者决策制定的认知模型21 影响消费者购车的主要因素2 2 消费者最喜爱的汽车品牌2 4 消费者选择品牌的原因2 4 不同原产地对消费者购车决策的影响25 消费者最喜爱的车系25 潜在消费者对车系的不同选择2 6 购买决策时间与性别的关系2 6 购买决策时间与年龄的关系2 6 不同年龄群体的购车预算27 不同家庭月收入群体的购车预算27 c b r 和r b r 融合框架30 混合决策系统的整体框架31 简化后的时间间隔与相似度关系曲线3 4 简化后的相同时f 自j 洲隔内购车时间与相似度关系曲线3 4 数据、信息和知识38 面向对象的轿车购买案例结构4 4 基于框架的轿车购买案例结构t “45 轿车购买案例获取网络图48 案例获取网络数据库耦合实现4 9 表格清单 表3 1 我国汽车保有量与人均可支配收入19 表3 2c b r 与r b r 的性能比较2 8 表3 3 新旧案例相似度计算3 6 表4 1 案例相似特征类型4 4 表4 - 2 信息实体与案例相关度4 8 表4 3 案例获取网络数据库耦合实现5 0 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。掘我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得金胆王些太堂或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的 任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:高寸秀签字日期:二d 护g 年乡月2 7 日 学位论文版权使用授权书 本学位论文作者完全了解金蟹王些盍堂有关保留、使用学位论文的规 定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被 查阅和借阅。本人授权盒胆王些太堂可以将学位论文的全部或部分内容编入 有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位 论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:高才为 签字日期:知一占年岁月2 7 日 导师签名: 盼髦怖 签字日期:。6 够腑 学位论文作者毕业后去向: 工作单位:国躲p ;x 产棚号钶局电话:驴,口,。 ”p 牛 通讯地址:北京中海淀压蓟门拼西 邮编:如口g i 土事j ;l 踌号 致谢 感谢我的导师陈朝阳教授和张代胜教授,他们的悉心指导和热情关怀 给了我学习的动力和勇气:他们深厚的专业知识、严谨的学术作风和虚怀 若谷的态度激励我保持锲而不舍的钻研精神。我攻读硕士学位期间取得的 每一滴知识都离不开两位老师的教诲和帮助。 感谢教研室其他老师的帮助( 张树强副教授、谭继锦副教授) 和 同学( 陈宗好、肖悦、肖海萍、李庆欢、李华香、李增辉、王亚晴、李忠 奎、顾福勇) 的帮助。 感谢我的父母,他们以浓浓的亲情理解我、支持我。不仅给予我物质 上的支持,而且在精神上也不断给我鼓励,至今我无以为报。 最后,向所有关一t l , 爱护我的人们表示衷心谢意! 作者:高扬 2 0 0 6 年5 月 第一章绪论 1 1 智能决策支持系统的现状和发展趋势 智能决策支持系统( i n t e l l i g e n td e c i s i o ns u p p o r ts y s t e m ,i d s s ) 是决策支持系 统( d e c i s i o ns u p p o r ts y s t e m ,d s s ) 与人工智能( a r t i f i c i a li n t e l l i g e n t ) 技术, 特别是专家系统( e x p e ns y s t e m ) 相结合的产物,使决策支持系统具有人工智 能的行为,能够充分利用人类的知识,既充分发挥了专家系统中知识及知识处 理的特长,也充分发挥了传统决策支持系统中数值分析的优势,既可以进行定 量分析,又可以进行定性分析,能有效的解决半结构化的问题,扩大了决策支 持系统的应用范围,提高了系统求解问题的能力1 。 目前,i d s s 已经成为决策支持系统的发展方向,具有很强的生命力,这体 现了决策支持系统的研究方向转向了基于知识的研究。这一认识也使决策支持 系统的研究转向与专家系统的结合,吸收专家系统的“知识库+ 推理机”原理, 导致了专家型决策支持系统的发展。近年来,决策支持系统的研究重点进一步 由专家型决策支持系统逐步转移至u i d s s 的模型系统、知识处理单元、i d s s 生成 器和分布式i d s s 上来,许多先进的人工智能技术如机器学习、知识表示、人工 神经网络,自然语言处理,遗传算法,数据挖掘,分布式智能系统都被融入到 i d s s 的研究中旧。 1 1 1i d s s 的研究现状 按照智能决策方法,大致可以把i d s s 分为3 类 1 i 1 1 基于人工智能的i d s s 6 ( 1 ) 基于专家系统的i d s s 专家系统是目前人工智能中应用较成熟的一个领域,一般由知识库、推理 机和数据库组成,它使用非数量化的逻辑语句来表达知识,用自动推理的方式 进行问题求解,而决策支持系统主要使用数量化方法将问题模型化后,利用对 数值模型的计算结果来进行决策支持 】。 ( 2 ) 基于机器学习的i d s s 机器学习是通过计算机模拟人类的学习来获得人类解决问题的知识。机器 学习由于能自动获取知识,在一定程度上能解决了专家系统中知识获取“瓶颈” 问题。 机器学习通过在数据中搜索统计模式和关系,把记录聚集到特定的分类中, 产生规则和规则树。这种方法的优势在于不仅能提供关于预测和分类模型,而 且能从数据中产生明确的规则。递归分类算法、神经网络、模糊逻辑、遗传算 法、粗糙集理沦等被广泛应用于机器学习。 ( 3 ) 基于a g e n t 的i d s s a g e n t 是目前人工智能领域的研究热点,主要有智能型a g e n t 研究、 m u l t i a g e n t 系统研究和a g e n t o r i e n t e d 的程序设计研究三个方面。a g e n t 自身应具 有知识、目标和能力。知识是a g e n t 对其周围环境和要求解的问题的某种描述。 目标是a g e n t 解决问题能力所能达到的程度。能力就是a g e n t 自身具有的解决问 题的技能。 针对不同的具体任务,人们构造不同种类的a g e n t 来满足需要。界面a g e n t 是由人和计算机通过人机界面组成的一个有机的整体。信,宫, a g e n t 是对系统中的 信息进行各种操作的一种智能体。移动a g e n t 是指能在复杂的网络系统中自由移 动,并通过与服务设施和其它a g e n t 相互协作来完成全局性目标。协作a g e n t 是 定义a g e n t 之间的协作关系的a g e n t ,包括各种协作协议、策略、对协作的处理 和评估。 1 1 1 2 基于数据仓库的i d s s 数据仓库通过多数据源信息的概括、聚集和集成,建立面向主体、集成、 事变、持久的数据集合,从而为决策提供可用信息。与数据仓库同时发展起来 的o l a p ( 联机分析处理) 技术通过对数据仓库的即时、多维、复杂查询和综合 分析,得出隐藏在数据中的总体特征和发展趋势。o l a p 进行的多维数据分析有 切片和切块、旋转、钻取等方式。 1 1 1 3 基于案例推理的i d s s 基于案例推理( c a s eb a s e dr e a s o n i n g ,c b r ) 是从过去的经验中发现解决 当前问题线索的方法。过去事件的集合构成一个案例库,即问题处理的模型。 当前处理的问题成为目标案例,记忆的问题或情境成为源案例。基于案例推理 处理问题时,先在案例库中搜索与目标案例具有相同属性的源案例,再通过案 例的匹配情况进行调整。基于案例推理简化了知识获取的过程,对过去的求解 过程的复用提高了问题求解的效率,对有些难以通过计算推导来求解的问题, 可以发挥很好的作用眇”1 。 1 1 2i d s s 的发展方向 1 1 2 1 注重基于知识的人机交互 决策支持系统强调决策过程的交互性,对人机对话系统有较高的要求,长 期以来,人们对数据、信息和知识的认识仅限于数据信息知识的单链 条关系,实际上,从数据中获得信息,再从信息中获得知识,仅仅是决策过程 的开始。对数据、信息和知识的关系的研究表明,对其它关系的研究对提高决 策质量也具有重要意义。在如何从数据中提取信息、信息如何呈现给决策者等 问题中,知识发挥着重要作用,对这些问题的研究产生了数据知识信 息知识数据的循环或网状关系等。 1 1 - 2 2 分布式并行化决策求解 决策环境的复杂性常常会超出人的求解能力,促使研究者抛开传统的模型 求解方法,转而寻求新的技术。同时技术的不断进步,尤其是i t 的进步,也在 为i d s s 的研究提供更为有力的手段和工具。目前随着计算机网络的发展,决策 环境出现了新的特点:分析、决策中使用的数据不再集中于一个物理位置,而 是分散到不同的地区、部门;运行在i n t e m e t i n t r a n e t 环境罩的分析、决策模型及 知识处理方法也从集中式处理发展为在网络环境下的分布、或分布再加上并行 的处理方式。 同时,决策的可行解本身也存在计算效率问题,有时候i d s s 的顺序计算结 构也会成为决策的瓶颈。对复杂决策问题的并行求解已得到广泛关注,分布式 数据仓库、分布式决策处理的研究以及分布式人工智能技术的应用、并行决策 计算等已成为新的研究热点。 1 ,1 2 3 注重各种相关技术的集成应用 i d s s 的核心是知识和知识处理。决策中用到的知识总是和特定应用领域相 关,不同的领域对知识的表示和处理具有不同的特点,不同的智能决策方法有 其特点和适用范围,方法的综合成为提高系统决策能力的重要途径。同时,决 策信息来源的多样性对信息融合也提出了新的要求。如何综合来自不同方面的 信息为一个决策目标服务是决策中的常见问题,经历了从简单叠加到优化的线 性组合的过程,采用逻辑、线性优化、决策树和神经网络等可以实现不同层次 的信息融合,目前采用证据理论、贝叶斯网络等不确定性推理技术进行信息融 合也取得了一些成果。这一领域的更高目标是要寻找更为一般的知识表示和推 理算法。 1 1 2 4 决策过程的理解 决策过程的理解是建立智能决策支持系统的基础。目前,对人类决策过程 的理解还仅限于具有明确过程性和可计算性的部分,对更高级的人类决策过程 还缺乏明确的认识。事实上,人类决策包含的问题识别、问题分解与求解过程 等多个方面,需要多种知识和方法的综合。人类的认知能力几乎是无限的,只 有人类能在复杂多变的环境中,在具有不完备、不确定甚至是错误的信息的情 况下,做出正确的决策,对人类决策的理解是建立更高智能的决策支持系统的 关键。对决策过程的理解实际上是对人类智能的认识。目前为止,还没有更好 的方法对人的思维过程进行精确模拟。 1 1 2 5 时空与多维决策过程 目前,决策支持系统的研究大多集中在决策问题的求解过程方面,而决策 行为总是与决策过程和决策环境的各个方面相联系。在决策过程中引入时间、 空间等多维准则,可以突破时空限制,优化和改进决策过程,提高决策支持效 果。时间是决策的内部维,决策者在决策过程中能够感知自身的存在,并与决 策问题的时间要求相联系,如在决策的实时性要求较高的场合,时间可能就是 最重要的决定因素;空间维则用来观察外部世界,与决策环境的空间因素相联 系,一般用来描述对决策具有重大影响的因素,如不同意见及其带来的额外信 息等。很多决策过程已经对时间和空间因素提出相当高的要求,这些因素反过 来又对决策支持系统的理论和方法提出了新的挑战。 1 1 3c b r 系统的关键技术和目前存在的问题 如何快速地检索到一个最相似的案例和如何改写案例是c b r 的关键技术。 与此同时,c b r 系统的固有缺陷是新问题求解的质量主要取决于相似案例的检 索和案例改写1 1 6 a 7 。到目前为止,这些问题还没有得到很好的解决。这主要表 现在以下几个方面: ( 1 ) 案例表示:案例推理是对人类形象思维的模拟。目前知识( 即案例) 在大脑中的记忆的研究仍不成熟。人工智能的知识表示方法,如产生规则、语 义网络、神经网络、框架和面向对象等,只是知识从不同角度的映射。在类比 学习中,这些表示方法存在局限性。因为知识的记忆要求知识是一个有结构和 组织的体系,而且还应易于检索、存取和记忆。案例表示与案例推理的效率密 切相关,研究面向智能计算的记忆结构有助于实现案例的合理表达。 ( 2 ) 案例检索:目前大多数的c b r 检索模型采用了相似度准则( 最相近邻 法) 。强调的是案例的一对一的属性匹配。而不同的应用领域研究者给出了不同 的相似度准则,目前还没有一个通用的公式可用。这种方法在结构不良的复杂 环境下,明显存在下列不足: 相似度的标准欠妥。以往案例的相似性取决于相似度的计算,而相似度 的计算对于难于定量化的定性属性和不确定属性难以处理。此外,还有属性之 间的耦合等问题没有解决; 案例之间相似性的评价不一定是看新旧案例的属性匹配如何,而是依赖 于旧案例能否合理解释当前案例; 根据h s i m o n 的有限理论,任何决策都是在信息不完全的情况下做出来 的。对新案例的情况不熟悉,就难以全面把握其主要特征,简单地比较新旧案 例的特征是不足取的; 案例检索的相似度准则应综合考虑表层特征和深层信息。表层特征可以 直接获取,而深层信息则需要推理。表层特征常常导致盲目搜索,而深层信息 不仅减小搜索空间,而且可以获取因表层特征不相似遗漏的重要案例,增加匹 配成功度。 ( 3 ) 案例的调整:大多数案例调整是通过深层知识,即启发性规则的指导 来完成的。但调整规则获取的难度不次于领域知识的获取,所以不容易实现。 ( 4 ) 精炼案例库:案例学习是一种增量式学习,但案例库越大,案例检索 效率就降低,而且还可能出现冗余和矛盾。目前有关这方面的文献还不多。 总之,i d s s 的成功与否,很大程度上取决于其设计是否符合人类的思维特 点、模式,也就是两者之间是否存在认知匹配。而人的特点之一是善于学习和 收集案例,推理得出结论。因此,近年来对智能决策支持系统的案例推理系统 的研究,已经越来越引起人们的注意1 i 8 - 2 2 1 。在购买决策方面,目前已广泛应用 于机械设备、医学药品、房地产的购买决策上【2 2 5j 。轿车购买决策虽然是个复 杂过程,而且专业性强,但消费者制定购买决箢时或多或少都会借鉴别人的购 买经验和使用经历,非常适合应用基于案例推理的智能决策支持系统进行决策 支持。针对本课题而言,研究的关键在于对消费者购买习惯和购买心理的分析 与模拟,以及案例相似度的计算模型和案例库的构建。 12 课题研究的目的与意义 近年来,随着我国国民经济的快速发展和人均收入水平的不断提高,我国 汽车工业尤其是轿车工业进入高速增长期,轿车厂商不断地细分市场,针对不 同的消费群体推出新车型或改进型丰富市场,同档次的汽车在性能和品质上的 差异已经越来越小,也有不少汽车厂商通过不同的配置增加新的车型来满足更 多消费群体的需求。汽车是价值高、专业性强的产品,消费者( 尤其是第一次 购车的消费者) 在选购新车时很慎重,考虑的因素很多,如汽车的价格、品牌、 原产地、性能、配置、用途、费税、零配件供给、可使用年限等都是决定车辆 成交的关键因素。此外,汽车的服务项目也很多,拥有汽车必然涉及使用中的 各种费用和问题,如维修保养、配件识别、保险、按揭、转让、寄售、抵押、 置换、拍卖、年审、过户、延期、证件遗失补办、车辆鉴定估价、报废回收等, 这些也会影响消费者的决策啦睨”。正因为汽车产品本身的复杂性和品种的多元 化以及消费者的理性消费,让消费者在决策时难以取舍。有调查显示,消费者 购车决策时间多集中在1 年以上,其比例为3 0 2 :而购车决策时间在3 6 个月和 1 3 个月的比例差别不大,分别为1 8 o 和1 7 8 ;购车决策时间在1 个月以内、 6 - 9 个月、9 1 2 个月的选择比例都在1 0 左右,如图1 1 所示。而且从目前来看, 尽管消费者在经济上已具备一定实力,但汽车信息的获取渠道却相对欠缺。在 购车决策时他们需要更全面、更详尽、更专业的介绍。但现在多数的媒体、销 售人员把“推销”作为向消费者进行车型介绍的主要目的,该款车型的优点会 被介绍得淋漓尽致,而其不足之处则会被轻描淡化,直至使用过程中问题出现, 消费者才会意识到自己所购车型还存在着某些问题。 1 年以上 3 - 卧月 1 3 个月 9 一1 2 个月 1 个月以内 6 - w t - 月 1 3 10 2 0 3 0 4 1 3 图1 1 消费者购车决策时间 1 8 万元以下的经济型轿车和中级轿车是我国轿车市场的主体,符合我国的 国情,而且车型丰富,令消费者难以决策,本课题主要以1 8 万元以下的汽车销 售信息和轿车购买客户的购买习惯与决策因素为研究对象,应用基于c b r 的智 能决策支持系统技术,建立具有完整、规则的车型数据库和轿车购买案例数据 库的轿车购买智能决策支持系统,为消费者提供全面详细的车型信息和购买决 策支持。消费者在使用轿车购买智能决策支持系统时,系统通过模糊化将不规 则的客户需求转换为规则的决策目标,并根据决策目标对车型数据库中的信息 进行数据挖掘,将挖掘出来的信息通过信息检索、筛选和基于模糊神经网络的 信息评价模型的处理,通过案例推理,与案例库中的购买案例进行比较,选出 符合客户需求的几款撮优车型,达到提高消费者决策正确性和效率的目的。对 指导消费者正确高效决策、推动家用轿车市场理性消费有着积极意义。 1 3 本文研究的主要内容 本课题的主要目的在于为家庭轿车消费者提供轿车购买智能决策支持系统 的整体框架和设计方法,具体以国产经济型轿车和中级轿车为研究、验证对象, 以m i c r o s o f t a c c e s s 为数据库管理、开发工具构造后台知识库与案例库,并在其 基础之上利用m i c r o s o f lv i s u a lc + + 6 0 为开发工具建立人机交互界面,编制相关 的运作逻辑与算法,开发轿车购买决策支持系统原型。 本文研究的主要内容是: ( 】) 基于c b r 的智能决策支持系统的研究以及轿车购买决策应用人工智 能的可行性研究,主要是将c b r 与r b r 融合推理模型引入到轿车购买决策领 域,并建立混合决策系统的整体框架。 ( 2 ) 案例与案例库建构模式的研究,其中包括: 案例表示方法的研究; 案例库建构模式的研究。 ( 3 ) 案例获取方法的研究,其中包括: 相似度计算模型的研究: 案例获取网络的研究。 第二章基于案例推理的l o s s 的相关技术 2 1 案例推理概述 基于案例推理( c a s eb a s e dr e a s o n i n g ,c b r ) 起源于r o g e rs c h a n k 在1 9 8 2 年出版的动态记忆中所做的工作,是人工智能发展较为成熟的一个分支, 它是一种基于过去的实际经验或经历的推理,它使用的主要知识不是规则而是 案例,这些案例记录了过去发生的种种相关情节或情景。对基于案例推理来讲, 求解一个问题的结论不是通过链式推理产生的,而是从记忆力或案例库中找到 与当前问题最相关的案例,然后对该案例作必要的改动以适合当前的问题。 c b r 技术之所以能够得到认可与研究,主要是因为它符合人类来自实践并 用之于实践的认知过程。它的主要思想是:当一个新问题出现时,系统根据索 引,从案例库中检索出与当前问题最相近的案例,依据求解该案例的经验和方 法柬解决当前问题。从推理方法的角度看,案例推理是从一个案例到另一个案 例的类比推理;从认识过程的角度看,案例推理是基于记忆,利用检索技术查 找过去的经验来指导现在的问题的一种方法l 】。 基于案例的推理的过程可以分为四个部分4 川,如图2 1 所示 学习过 - 新案例 问题 一工 ? 专? 炎 , ,、 案例库_ j 日案例 验证后的方案初步建议方案 幽2 - 1 基于案例的推理过程 ( 1 ) 获取相似的旧案例( r e t r i e v e ) 。推理系统通过一系列的搜索和相似性 的计算,将案例库中的案例过滤,取出与本次待解问题最相似的若干案例。 ( 2 ) 使用获取案例中的信息和知识提出解决方案( r e u s e ) 。推理系统比较 黼聊 【 一 蒜 二院 一攀 嗜 , 龃剃r 新、旧案例的差异,将被用户选取认可案例的解决方案略加修改后提交给用户。 ( 3 ) 对解决方案修改或重新设计( r e v i s e ) 。若用户对前阶段系统给出的方 案不满意,推理系统则将此方案进行修改或重新设计后提交给用户。如果用户 仍不满意或推理系统认为调整修改的代价太大,则停止此阶段工作。 ( 4 ) 回收新案例( r e t a i n ) 。保留这次工作中有价值的经验和知识,分析新 案例,若有必要则将其纳入案例库中。 在把上述c b r 工作过程各阶段分解后,其各阶段任务为: ( 1 ) 案例获取阶段:辨识问题特征案例搜索初始匹配案例选 择。 ( 2 ) 案例重用阶段:方案复制案例调整。 ( 3 ) 案例调整阶段:评价方案修复错误。 ( 4 ) 案例回收阶段:多案例整合知识抽取案例索引。 与规则推理相比,案例推理有许多优点: ( 1 ) 问题的唯一精确表示是其本身。案例能比一组规则提供更多的信息, 这是因为人的主观能动性和有限性,而从大量实例归纳出来的规则只取出了实 例的共同本质: ( 2 ) 避免了知识增加时知识库的完整性和一致性问题; ( 3 ) 案例推理是一种增量式学习方法。随着案例的增加,案例库的覆盖度 ( 求解问题的范围) 逐渐提高:同时由于案例比规则获取容易,不需要完整的 领域模型,使案例推理逐步实用化; ( 4 ) 直接重复过去的求解经验( 成功的和失败的) ,不需要完整的领域模 型,也不必像产生式推理那样从头开始,避免了匹配冲突和组合爆炸问题,求 解效率高; ( 5 ) 案例推理是类比推理的子类,它具有类比推理的基本特点,能够充分 发挥人的创造思维,对难以充分理解的领域做出假设和预测,并指导人们避免 重犯过去的错误; ( 6 ) 从显示角度讲,案例推理能兼顾专家的偏好,而产生式系统的柔性不 足。 但是,与规则推理相比,案例推理也有其不足之处: ( 1 ) 它的推理过程在整体上依赖于经验和案例。经验案例的质量对系统的 影响极大,不像基于规则推理系统,规则一旦提取出来,就具有概括性,其正 确性是有保证的; ( 2 ) 对结论的指导性不强。因为对内在机理把握不强,所以给用户提供的 只是初级感受下的方案,而且结论往往是不严格的; ( 3 ) 一般来说,匹配案例的结论需要修正后才可适用于当前问题,这需要 有关问题领域的知识。目前的c b r 系统在案例修正方面还缺少有效的方法。 2 2 基于案例推理的智能决策支持系统的相关技术 2 2 1 案例的表示和案例库的组织 由于基于案例推理的智能决策支持系统是基于知识的系统【2 8 ”j ,案例本身 是介于数据和知识之间的最为常见的信息表达形式,是隐式规则,是支持适应 性策略的最基本的知识表达式,案例库是介于文本文件库和知识库之间的,因 此案例的表示应尽量遵循知识表示的原则,但又不受它的拘束。案例描述由两 部分组成,即问题描述和解描述。问题描述是案例表示的关键,是建立案例索 引、进行案例检索的基础。由于案例有其共性和规律,因此可以提出很多特征 点( 如一些附有含义的段、节) ,组成特征向量,这些特征点基本上描述了案例的 主要信息,当然要综合考虑用户关心的问题。每一个案例可以看成是个案例 特征向量,所以可以认为案例特征向量组成了案例空间。大量的案例可以形成 决策的解空间的子集。由于用户决策问题属于问题空间,通过分析也可以找到 决策空间的特征点,决策空间是案例特征向量的集合,同时不同特征点对于案 例的重要程度不同,表达的内容侧重点不同,因此要根据案例的重要程度给予 其不同的权重。权重的确定是一个很困难复杂的过程,需要很多经验知识和大 量的统计数据。由于在很多情况下,权重对环境非常敏感,同一案例在不同环 境下,所得的结果可能完全相反,所以可以采用变权思想进行调整,形成问题 特征向量,而此时问题特征向量是案例特征向量的一部分( 另外一部分是决策向 量) ,所以决策问题就转变成了为了问题特征向量在案例空间中的搜索匹配问 题。 多层信息表示则是把案例特征向量分成若干层,其中最基本的有两层,即 问题信息层和决策信息层,前者是问题向量,后者是决策向量,两者组成案例 特征向量。如果把一个案例看成是一条规则:i f 条件t h e n 结论的话,那么问题 向量就是条件,决策向量就是结论。这样案例空间就变成如此的规则集合,通 过把用户决策问题演变为条件,在规则集合中搜索到条件,那么结论就是决策 结果。唯一不同的是这里涉及到的是模糊决策。另外,问题向量中的分量可分 为必要项和辅助项,比如用户决策时一定要指出决策问题的大体内容或方向, 而其它时间和地点等信息只不过是辅助信息。 这种案例的表示和案例的组织方法具有下列优点: ( 1 ) 有利于检索; ( 2 ) 易于组织,可以把它们连接成树形层次或者网络; ( 3 ) 易于管理。知识的改变只对局部产生影响; ( 4 ) 有利于知识的共享。 2 2 2 相似性 新问题的向量表示和案例的条件特征向量是相对应的,如果二者是相似的, 则认为新问题的求解方案与该案例的求解方案是类似的。而对于新问题的向量 与案例的条件特征向量的匹配,则要看各个属性上相似性的计算了【32 1 。案例中 包含了丰富的信息,其中一部分对案例的本质特征和结构起着决定性作用,并 且这些信息是判断案例是否相似的关键,即为案例的属性。而另一部分则不具 有这些功能。案例属性是指能反映出案例某一方面的特征和结构的使案例区别 于其它案例的数据。 属性集是指一个案例的部分或所有属性组成的集合。在某个属性子集下其 属性值相同或相近的案例称为属性相似案例,这些案例自身可以具有同一个或 不同的属性集。 以下来讨论检索属性相似案例的方法。 2 , 2 2 1 目标案例的输入 目标案例是指待求解的案例。在本文中,用户将设定的突发事件场景通过 人机界面输入系统,作为目标案例。人机界面采用填表方式,即填写案例前提 条件表。 2 2 2 2 相似案例的检索 ( 1 ) 案例相似性度量 c b r 方法假定:当两个问题是相似的时候,他们的解也应该是相似的。因 此,在输入了目标案例以后,需要在案例库中查找与当前场景最相似的案例, 这些案例称之为该目标案例的源案例。由于场景千变万化,不可能有完全相同 的案例,所以采用比较案例相似程度的方法。 设相似函数: s i r e : u c 叶l o ,1 l ( 2 1 ) u 为对象域即目标案例集合,c 为案例库中的案例集合。 用s i m ( x ,y ) 表示目标案例x 与源案例y 的相似程度。其中:x u ,y c 。 显然有: 0 s i m ( x ,y ) 1 ( 2 - 2 ) s i m ( x ,x ) = 1 ( 2 3 ) s i m ( x ,y ) = s i m ( y ,x ) ( 2 - 4 ) ( 2 ) 总体相似与局部相似 比较两个案例的相似程度称其为总体相似,但在计算总体相似之前首先要 计算局部相似,例如品牌、车系、原产地、排量、价格、年龄、性别、工作单 位、职位、年收入、家庭成员数、购车目的等属性的相似,属于局部相似。这 说明相似度的计算应从最底层的表项( 属性) j r 始,然后再从下往上逐层进行。 ( 3 ) 相似度的计算 最近相邻法 s 舭= w i w , ( 2 5 ) 上面的公式是最近相邻法的相似度定义。其中s 时表示案例n 和案例k 的相似度, w f 表示第i 个属性在案例中的权重,表示案例n 和案例k 的第i 个属性的相似 度,n l 表示案例的属性个数。 最近相邻法认为两个案例的属性集是一样的,且两个案例的属性权值完全相 同。这样案例的表示和权值的赋予是比较简单的。 t c 相似法 = 币 协e , 1 。7 ”。一i :j i i 。i j :i :) :j e :i 而 2 6 上面的公式是t c 相似法的相似度定义。其中a 。表示案例n 的属性全集,4 表示案例k 的属性全集,彤m 表示案例d 和k 之间的相似度。 t c 相似法适用于属性可以用二进制表示的应用领域。 改进t c 相似法 1 屋m i ,厶mm i ) 2 vi = 1仨l ( 2 7 ) 上式是改进的t c 相似法的相似度定义。其中w :表示第i 属性在案例n 中的权 值,w ;表示第i 属性在案例k 中的权值,的意义同最近相邻法,n l 表示属性的 个数, 犯献表示案例n 和k 的相似度。 改进t c 相似法考虑了属性集中的各属性对于两个案例具有不同的权值。对 于属性集相同、权值不同的案例可以用这种方法求相似度。对于属性集不同的 两个案例可以设置属性集为两案例属性集的并集,案例k 有而案例n 没有的设w : 为0 ,同样对案例1 1 有而案例k 没有的设w :为0 ,这样就可以求得案例n 和案例k 的 相似度。 上面的几种模型都有缺陷,共同的缺陷有两点: ( 1 ) 上面的模型都是在两个案例之间求得相似度,对于输入的新案例需要 和案例库中的每一个案例求相似度,对于大型的案例库需要大量时间。 ( 2 ) 上面的模型没有提出两个属性相似的定义,在具体的应用领域中这一 点是难于定义的。一般的,应用公式时用以下两个公式定义属性相似: : = l x :一x :l t : ( 2 8 ) 以嵋 引 = 时 们 :1 一一x ;批 其中,x :表示案例n 的第i 个属性的值, 示属性i 的墩值范围。 2 2 3 案例的检索 ( 2 - 9 ) x :表示案例k 的第i 个属性的值,r f 表 案例检索是c b r 技术中非常重要和关键的技术盼” 。案例检索是从案例库 f c a s eb a s e ) 中找到一个或多个与当前问题提出的需求最相似的案例:c b r 系统 中的知识库不是以前专家系统中的规则库,它是由领域专家以前解决过的一些 问题的处理过程总结组成。案例库中的每一个案例包括以前问题的一般描述。 当接受了一个求解新问题的要求后,c b r 汞j 用从案例库中找出与当前问题最相 近似的最佳案例。后面所有工作能否发挥出应有的作用,很大程度上依赖于这 一阶段得到的案例质量的高低。因此,这一步最为关键。 案例的检索可以分为三个子过程:特征辨识、初步匹配、最佳选定。 特征辨识是指对问题进行分析,提取有关特征。特征提取方式有: ( 1 ) 从问题的描述中直接获得问题的特征; ( 2 ) 对问题经过分析理解后导出的特征,如图像分析理解中涉及的特征提 取; ( 3 ) 根据上下文或知识模型的需要从用户那罩通过交互方式获取的特征, 系统向用户提问,通过人的提示启发以缩小检索范围,使检索的案例更加准确。 初步匹配是指从案例库中找到与当前问题相关的候选案例集。这是通过使 用上述特征作为案例库的索引来完成检索的。由于一般不存在完全匹配,因此 要对案例之间的特征关系进行相似度的估计。它可以是基于上述特征的与领域 知识关系不大的表面估计,也可以是通过对问题进行深入分析后的深层估计。 具体做法是通过对特征赋以权值来体现不同特征具有不同的重要性。 最佳案例是指在候选集中选取一个或者几个与当前问题最为相关的案例。 这一步与领域知识关系密切,具体做法是,由领域知识模型对候选案例进行解 释或生成某些期望的结果,然后对这些解释或结果进行有效性测试或评估,最 后依据某种度量标准对候选集中的候选案例进行排序,得分最高为最佳案例。 一般来说,案例匹配都不是精确的,只能是部分匹配或近似匹配。因此要求有 一个相似度的评价标准。该标准评价的好,会使得检索快速,并且得到的案例 准确而有效。 为了便于检索,可以把案例分为两部分:1 案例类别和案例特征;2 方法和 措施。因此案例库相应的分为两个子库:决策因素子库、决策结果子库,二者 通过因素子库中的案例条件标识关联起来。实际决策时我们把当前新问题的 条件录入,与决策因素子库中的案例条件逐一匹配,找到条件相似度满足要求 的案例条件后,通过其标识在决策结果子库中找到该条件下的决策结果,提供 给决策人员。简单的说,案例的搜索其实就是以问题空间的一个问题信息为依 据,从案例库中搜索案例的特征信息中的问题信息与给定问题信息相匹配的案 例。 案例的检索应采用两种搜索方法:确定性搜索和不确定性搜索。 确定信息搜索利用确定的信息搜索与当前案例相似的案例。适用于检索案 例时要求有确定的问题案例属性值,可以采用基于模糊矩阵运算的模糊匹配方 法。 具有共同属性集扫l ,p 2 p 。 的m 个相关事件之间 a 1 ,a 2 a 。 的关系可 用模糊关系矩阵a 表示模糊相关性,其中a 。表示已知事件的属性i 对于事件卡目似 程度的影响。 根据模糊关系矩阵,运用模糊关系方程,通过一定的模糊算法,实现事件 之间的模糊推理。模糊方程如下: s a = f( 2 1 0 ) 其中“”是某种模糊合运算算子,可根据要求选择不同形式的模糊运算; s 是事件属性的特征向量【s 1 ,s 2 s 。) :f 是对事件的评判向量( x l ,x 2 x 。) 。向 量f 中的各分量值表明了求解事件和已知事例k 之间的相似程度。 尽管确定信息搜索能够解决很多搜索问题,但是现实问题的环境往往是动 态和不确定性的,对问题的描述往往也不完整,这样就用到了不确定信息搜索。 不确定信息搜索利用待解决问题的己知的有限信息( 某几个属性的值) ,在案例 中找到与当前情形相似的案例。搜索时在案例库中难免会同时有几个案例符合 当前的条件。此时,就需要用到相似度的计算来确定最佳方案。 c b r 系统中应用的检索评估方法主要有以下三种:最近相邻法,归纳法, 知识导引法。 最近相邻法:根据案例中各组成部分的权值进行加权,并把结果作为衡量 问题案例与旧案例的依据。适用范围:事例的内容易于用包含属性数值的向量 表示。 归纳法:提取案例间特征上的差异,并根据这些特征将这些案例组成一个 类似判断网络的层次结构。检索是采用决策树搜索。适用于案例特征相互独立 或推理结果只是案例中的某一特征的情况。适用范围:事例的内容易于分层组 织,特征信息选取的不能太具体也不能太抽象。 知识导引法:采用一套规则进行搜索控制,根据已知知识来决定案例的哪 些特征在进行案例检索时是最重要的,并根掘这些特征来组织检索,使案例的 组织与检索具有一定动态性。对于大型系统的建设而言,建立完备的基于知识 的检索很困难。适用范围:事例中包含有丰富的经验知识,内容不易分层组织。 4 2 2 。4 模糊决策 知识的不确定性,使决策结果也具有不确定性,使得问题解决方案往往没 有最优解 3 3 - 3 5 】。与其徒劳的寻求最优解,不如务实的寻找满意解或相对满意解。 由于系统建立在不确定知识的基础上,运用模糊规则,进行模糊推理或检索, 得到模糊解决方案。不同属性对于案例的重要程度不同,要根据重要程度给与 不同权重。权重的确定是个复杂过程,需要大量经验知识和统计数据。 2 2 5 案例库的维护机制 案例库的维护主要指案例的加入、修改和淘汰。随着时间的推移,一些旧 案例不能适应变化而淘汰,并需要加入一些颏案例,而有些案例部分失效,需 列失效部分进行修改。故必须建立一个维护机制,通过评定案例库中的案例来 决定取舍或修改o 。“j 。 可以根据领域专
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年九年级语文上册 第一单元 第3课《乡愁》说课稿 新人教版
- 2025年高考生物试题分类汇编免疫调节(解析版)
- 2025购销合同简易范本
- 2025餐饮服务员与餐厅承包合同书范本
- 小班国庆节题目及答案
- 向善而行文章题目及答案
- 线段讨论题题目及答案
- 现场模拟试讲题目及答案
- 2024人教版七年级生物下册期末复习知识点提纲填空版(无答案)
- 2025年解除商业店铺租赁合同模板
- 第十八讲文学批评(三)·形式主义课件
- (完整版)5社会体育导论教学教案
- 高中生物开学第一课(走近生物)(共34张)
- 3.3《用橡皮筋驱动小车》课件
- GB/T 43071-2023植保无人飞机
- 关于成立社会工作服务中心的可行性报告(民办非企业单位成立可行性报告标准示范)
- 能源的转换与利用课件
- 人美版七年级美术当卢浮宫遇见紫禁城公开课一等奖课件省赛课获奖课件
- 酒店预订确认函
- 空调器抽真空工艺规范
- 比亚迪海豚说明书
评论
0/150
提交评论