




已阅读5页,还剩49页未读, 继续免费阅读
(计算机应用技术专业论文)基于cbr车险公估系统的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于c b r 车险公估系统的应用研究 摘要 随着汽车数量的不断增加,汽车事故也越来越多,保险公司对汽车遇险进 行正确公估是一项颇为繁重和复杂的工作。目前我国车险公估行业还不是很规 范,公估人员的专业素质和市场的不规范化都影响公估的结果。如何利用计算 机和人工智能的技术,辅助公估人员进行快速的、准确的定损、公估,如何积 累和发展车险公估的经验,确保车险公估行业能够有一定的标准可循是车险公 估行业的重要课题。本课题拟应用c b r 技术建立一个车险公估案例库模型,并 将其应用于“车险公估系统”中,实现科学合理地车险公估,提高工作效率和准 确性。论文的主要工作如下: ( 1 ) 对c b r 的理论进行了深入分析研究,针对车险公估的特点,比较了 c b r 与专家系统、神经网络、机器学习等几种人工智能技术的特点,详细讨论 了c b r 方法在车险公估系统中的应用。 ( 2 ) 在案例的表示方法上使用了框架表示法和基于特征的表示法相结合的 方法,并且在此基础上采用了分类策略来构造车险案例库。 ( 3 ) 在案例的检索中,采用了基于层次分类模型的索引策略,构建了车险 公估案例库的分层多级索引树,并在案例的匹配过程中使用带权值的近邻法判 断案例间的相似度。 ( 4 ) 将c b r 的方法引入车险公估中,构建了车险公估系统的模型,设计 并实现了其原型系统,完成了预定的功能。通过原型系统的运行,证明了该设 计思想是科学、合理的,实现的方法是有效的。 关键词:案例推理知识表示相似度计算 汽车保险公估 r e s e a r c ha n d a p p l i c a t i o no fa u t o m o b i l ei n s u r a n c ea s s e s s s y s t e mb a s e do nc a s e b a s e dr e a s o n i n g a b s t r a c t w i t ht h ei n c r e a s i n go ft h ea u t o m o b i l e s q u a n t i t y , t h et r a f f i ca c c i d e n t sa r e b e c o m i n gm o r ea n dm o r e t oa s s e s sd a m a g e da u t o m o b i l ec o r r e c t l yi sat o i l s o m e a n dc o m p l i c a t e dj o b n o w ,t h ea u t o m o b i l ei n s u r a n c ea s s e s st r a d e si sn o tv e r y s t a n d a r di no u rc o u n t r y t h er e s u l to fa s s e s si si n f l u e n c e db e c a u s et h ep r o f e s s i o n a l q u a l i t yo fa s s e s sp e r s o n n e la n dt h es t a n d a r di nt h em a r k e ta r en o tv e r yg o o d h o w t oh e l pa s s e s sp e r s o n n e la s s e s sq u i c k l ya n de x a c t l yt h r o u g hc o m p u t e rs y s t e ma n d a r t i f i c i a li n t e l l i g e n c et e c h n i c a la n dh o wt oa c c u m u l a t ea n dd e v e l o pt h ee x p e r i e n c e o fi n s u r a n c ea s s e s s ,g u a r a n t e et h i st r a d e st oh a v eas t a n d a r di sa ni m p o r t a n tt a s k t h i sd i s s e r t a t i o ni n t e n d st ou s et h et e c h n o l o g yo fc b rt ob u i l dam o d e lo f a u t o m o b i l ei n s u r a n c ea s s e s s t h i sm o d e li s a p p l i e dt ot h e “a u t o m o b i l ei n s u r a n c e a s s e s ss y s t e mb a s e do nc a s e b a s e dr e a s o n i n g ”i tc a nm a k et h ea u t o m o b i l e i n s u r a n c ea s s e s sm o r er e a s o n a b l ea n di m p r o v et h eq u a l i t ya n de f f i c i e n c y t h em a i n c o n t e n t sa r ea sf o l l o w s : ( 1 ) t h eb a s i ct h e o r i e so fc b r h a v eb e e nd e e p l ya n a l y z e da n dr e s e a r c h e d t o t h ef e a t u r e so fa u t o m o b i l ei n s u r a n c ea s s e s s ,c o m p a r et h ef e a t u r e so fc b rw i t h s o m eo t h e ra r t i f i c i a li n t e l l i g e n c et e c h n i c a ls u c ha se x p e r ts y s t e m ,n e u r a ln e t w o r k , m a c h i n el e a r n i n ga n de t c t h ea p p l i c a t i o ni na u t o m o b i l ei n s u r a n c ea s s e s ss y s t e mi s d i s c u s s e d ( 2 ) t h ec a s ee x p r e s s i o nm e t h o di sc o m b i n e df r a m ee x p r e s s i o nw i t he x p r e s s i o n b a s e do nf e a t u r e a n dc o n s t r u c t i n gt h ea u t o m o b i l ei n s u r a n c ea s s e s sd a t a b a s ew i t h t h em e t h o do fc l a s s i f i e dt a c t i c sb a s e do ni t ( 3 ) t h ei n d e xt a c t i c sb a s e do nm u l t i - l a y e r e di su s e dw h e ns e a r c h i n gf o rt h e c a s e s b u i l d i n ga na u t o m o b i l ei n s u r a n c ea s s e s s m u l t i l a y e r e di n d e xt r e e d u r i n g m a t i n gt h ec a s e s ,i tu s e sn e a r e s tn e i g h b o ra p p r o a c hw i t hw e i g h tt oj u d g es i m i l a r i t y m a t c hb e t w e e nc a s e s ( 4 ) u s i n gt h et e c h n o l o g yo fc b r t oe s t a b l i s ham o d e lo fa u t o m o b i l ei n s u r a n c e a s s e s ss y s t e m ap r o t o t y p es y s t e mi s d e s i g n e da n di m p l e m e n t e d ,w h i c hh a s c o m p l e t e dt h ep r e d e s t i n a t ef u n c t i o n t h et e s tt ot h es y s t e mp r o v e dt h er e a s o n a b i l i t y a n dt h ev a l i d i t yo ft h ed e s i g n k e yw o r d s :c a s e - b a s e dr e a s o n i n g ;k n o w l e d g ee x p r e s s ;s i m i l a r i t ym e a s u r e ; a u t o m o b i l ei n s u r a n c e ;a s s e s s 表格清单 表4 1 事故车辆受损案例表示j 2 7 表4 2 车辆零部件特征属性数据库数据表3 0 表4 3 车险公估信息决策表3 6 图2 1 图2 2 图3 1 图3 2 图3 3 图3 4 图4 一l 图4 2 图4 3 图4 4 图4 5 图4 6 图4 7 插图清单 基于c b r 推理的工作流程6 零件损坏情况案例库的结构索引1 2 系统框架图2 2 案例参数分类模型2 2 车险公估系统流程示意图2 4 系统主要模块2 5 车险公估案例库数据表及联系3 0 案例层次结构索引33 系统的主界面3 8 案例查询界面39 详细信息显示界面3 9 案例修正界面4 0 数据库管理界面4 0 v i i 独创性声明 本人卢明所甲交的学何论文是本人住导师指导卜进行的研究l :作及取得的训f 究成果。据我所 知,除了文中特别加以标,占利致谢的地方外,论文中不包含其他人已经发表或撰弓过的研究成果, 也不包含为获得金e 巴! :些厶:兰: 或其他教育机构的学位或证i5 而使川过的材料。! j 我一同i :作 的同忠对本研究所做的任何贡献均己住论文中作了明确的说明丌表示谢意。 学位论文作者签字: 垃娅 签字日期加a 7 年尸月r 日 - 学位论文版权使用授权书 本。学何论文作者完全了解 盒8 垦! 二些厶望:有关保留、使川学何论文的舰定,有权保留爿:向 国家有关部j 或机构送交论文的复印什利磁盘,允许论文被! 卉 阅或借阅。本人授权 盒8 坠! :些厶 :! l 可以将:学 奇论文的全部或部分论文内容编入有关数据库进行检索,可以采j - | j 影印、缩印或 描等复制手段保存、汇编学何论文。 ( 保密的学位论文在解密后适川本授权l5 ) 学何论文者签名: ( 戡( 签字日期少7 年f 月f 乒 学位论文们;者毕业后上向: i :作单位: 通讯地址: 翩魏研 签字日期: 电请: 邮编: 咱每 致谢 本人在两年半的硕士研究生课程学习和撰写学位论文的过程中,自始至终 得到了我的导师周国祥教授的悉心指导,无论从课程学习、论文选题,还是到 收集资料、论文成稿,都倾注了周国祥老师的心血,由衷感谢周国祥老师在学 业指导及各方面所给予我的关心以及从言传身教中学到的为人品质和道德情 操,老师广博的学识、严谨的治学作风、诲人不倦的教育情怀和对事业的忠诚, 必将使我终身受益,并激励我勇往直前。 同时,真诚感谢计算机与信息工程学院的全体老师,他们的教诲为本文的 研究提供了理论基础,并创造了许多必要条件和学习机会;也感谢各位领导和 同仁们,在我课程学习和论文撰写期间,给予我的大力支持。 感谢所有的同学给予的帮助。 i v 作者:汪淼 2 0 0 9 年4 月13 日 1 1 课题研究的背景及意义 第一章绪论 随着汽车市场的繁荣,目前私家车的使用量越来越多,相对应的一系列配 套服务也越来越丰富,并且充满着行业间的竞争。例如:汽车保险业。我国的 保险行业起步较晚,而作为保险行业的一个重要组成部分一一保险中介行业相 对于国外也显得较为薄弱。特别是在信息化发展迅速的今天,保险中介行业中 的保险公估业的发展,已经远远跟不上国民经济发展的需求,尤其在车险这一 方面。目前的状况是:当被保险的车辆发生交通事故时,保险公司的第一件事 就是安排理赔人员与驾驶员一起核定车辆损失和修理项目。车辆的定损涉及到 车辆的维修等多方面的技术和车主的利益问题,所以它也是整个车险服务中矛 盾比较突出的部分。定损人员通过去现场,拍摄事故照片,查清车辆的损坏部 件,分别确定予以更换或维修,最后确定损失情况。但是,一辆汽车有成千上 万个零件,不同种类的汽车零件的型号与价格都不相同。另外,我国汽车维修 和配件市场信息严重不对称和不透明,国内汽车修理市场型号、价格混乱不堪, 价格变动频繁,即使配件相同,各家保险公司采用的标准也不一致,定损和理 赔方面缺乏标准。专业定损人员也常常由于信息掌握不充分而产生诸多困惑, 感到无所适从,这已成为车辆保险业的症结之一。再者,由于目前公估案例还 处于单个事件单独处理的阶段,对于很多相似案例,要做许多重复或者相似的 工作,所以,整个定损、理赔周期也比较长,效率较低。 针对以上一些问题,本课题拟对“基于c b r 的车险公估系统”进行研究设 计,实现一个车险公估原型系统。本文研究的课题来源于安徽省保监局保险 中介公估系统项目的开发,是该项目中“车险公估”子课题的后续课题。在 车险公估的研究中,既要考虑到车辆故障的描述,经验规则化比较困难,大量 的特征属性相关联等,又要考虑到车辆故障的特征:如车辆故障的交叉性、组 合性等。因此,常规的数学建模不能很好的解决这些问题。 c b r ( c a s e b a s e dr e a s o n i n g ,基于案例推理) 是目前逐渐兴起的一种人工 智能方法学,它具有获取知识方便、容易理解、启发思维等优点,有着较强的 适应性,它非常适合于没有很强的理论模型、领域知识不完全而经验丰富的决 策领域。用这个技术来建立车险公估案例库模型有助于进一步开发完善的车险 公估系统,科学合理地进行车险公估,有效的提高工作效率和准确性,避免由 于人为因素而可能产生的不必要问题。在这个系统中,将建立一个车险公估案 例库,每次公估的时候,通过计算机从案例库里提取相似案例,只需做简单调 l 整便可直接应用于当前案例,并且在后期维护时,可以定期更新和添加新的案 例,更可以达到丰富案例库的目的。由此可见,能够有这样一个基于c b r 的车 险公估系统,会给车险公估行业带来很大的便捷。 另外,一般情况下,当车辆故障仅涉及车物损失的时候,进行车险公估要 填报车辆的型号、主要损坏的部件型号、损坏的程度等。这些都要作为车险公 估的历史记录,即公估案例的属性。但是,由于这些记录的公估案例冗多繁杂, 记录之间可能没有联系,因此并不一定能有效地表示车险公估的经验知识,也 不利于公估人员参考。当相似的故障再次发生的时候,公估人员往往不能快速、 有效地查找到以前的相关故障的经验知识,需要当作新问题重新摸索一次。此 外,由于公估人员的流动性大,也使得公估的经验知识流失严重,无法有效地 共享与继承。所以,这些丰富的车险公估记录与公估人员的经验知识,也是一 笔无形的财富,可以被我们创造、积累、继承、传播。这也是本课题研究的另 一意义所在。 1 2 车险公估行业国内外研究的现状 保险行业发展到现在,已经形成了一个完整的、成熟的保险市场。其主体 由保险人、投保人和中介人三方构成,三者缺一不可。而保险中介人作为保险 市场的一个子系统,又包括保险代理人、保险经纪人和保险公估人。目前,我 国保险代理人已具有相当规模,保险经纪人亦有所发展,而保险公估人还处在 萌芽状态,保险公估人是一种自主执业、自立信誉、自负盈亏的社会法人,不 仅具有市场性的特点,亦具有社会性特征,其经营的成败与否,不仅关系其自 身的生存与发展,也影响保险公司和被保险人的利益。改革开放以来,我国的 保险市场得到了快速的发展,但是中介市场,尤其是保险公估市场对大多数人 而言还是一个陌生的领域。我国的保险公估行业是最近十几年才开始形成的。 其现状可以归纳为五个方面: 保险公估机构历史短、数量少、规模小,主体发展快,市场需求与供给 矛盾突出。 宣传力度不够,市场认同度低。 数据信息基础薄弱,人才匮乏,业务面窄。 国外知名保险公估机构的进入,使国内公估行业面临巨大的发展机遇和 挑战。 保险公估市场的监督结构单一,公估机构的自我约束机制没有建立。这 几种情况已影响到我国保险市场的进一步发展。 机动车辆保险产生于1 9 世纪末,世界上最早签发的机动车辆保险单,是 18 9 5 年由英国“法律意外保险公司 签发的、保险费为10 英镑到1 0 0 英镑的 2 汽车第三者责任保险单,但汽车火险可以在增加保险费的条件下加保。机动车 辆保险的真正发展,是在第二次世界大战后,一方面是,汽车的普及使道路事 故危险构成一种普遍性的社会危险;另一方面则是,许多国家将包括汽车在内 的各种机动车辆第三者责任列入强制保险的范围。因此,机动车辆保险在全球 均是具有普遍意义的保险业务。与其他保险相比,机动车辆的承保与理赔技术 难度并不太高,但业务量巨大,在保险市场上占有举足轻重的地位。在全国范 围内,车险的保费收入大概占了各公司产险的6 0 以上瞄j 。 我国的车险公估业发源于深圳特区,在深圳得到飞速的发展,并迅速成为 一个蓬勃发展的新兴行业。太平洋产险深圳分公司在全国率先引入车险公估机 制,于2 0 0 3 年1 0 月正式开始与民太安汽车保险公估公司建立车险查勘、定损 的全面委托合作关系。目前,保险公司在车险理赔环节引入公估机制的做法已 经开始全国性推广。短短的几年里,车险公估行业发展迅猛,但由于机动车移 动特性所造成交通事故的广泛性和复杂性,公估公司为缓解矛盾,客观界定损 失大小提供了非常重要的依据。在国外成熟的保险市场上,保险公司自身承担 的任务主要在新产品开发、售后服务、风险管理等方面,而查勘、理赔公估等 技术专业性较强的业务,多数由保险公估人经营。在发达国家和地区,就有很 多单独的保险公估机构,比如法国就有上千家,我国的香港地区也有上百家【) j 。 1 3 课题研究的内容和论文组织结构 ( 1 ) 研究的内容 课题研究的目标是:将c b r 的方法引入车险公估中,构建车险公估系统的 模型,设计并实现一个原型系统。研究内容主要包括以下几个方面: 对几种智能决策的方法进行研究,比较几种不同的方法,选择一种最为 适合的用于车险公估系统。 深入研究案例推理技术,针对车险公估的的特点,将其应用在车险公估 系统中。 在系统中,使用了框架表示法来表示案例,并且在此基础上采用了分类 策略来构造车险案例库。在案例的检索中,以构建车险公估案例库的分层多级 索引树作为索引策略,并在案例的匹配过程中使用带权值的近邻法判断案例间 的相似度。 对车险公估系统进行总体设计,实现原型系统。 ( 2 ) 论文组织结构 本论文共分为五章来阐述主要的研究内容: 第一章绪论主要阐述了以下几点内容: 课题研究的背景及意义。提出把c b r 的方法应用到车险公估系统中。 当前车险公估行业国内外的研究现状。由这些现状得出能有一个基于 c b r 的车险公估系统,能给车险公估行业带来很大便捷的结论。 课题研究的内容和论文组织结构。给出整个论文的主要结构和内容。 第二章主要阐述基于案例的推理方法。内容包括: 基于案例推理的基本内容。主要介绍了案例推理的起源和基本思想。 基于案例推理的关键技术。介绍了案例推理的知识工程、案例检索、修 正和学习的相关技术。 基于案例推理的优缺点。通过比较案例推理与其它人工智能技术,认为 案例推理技术更适合本系统。 第三章给出车险公估系统的总体设计。主要包括: 车险公估案例的特点。通过车险公估所涉及到的内容的复杂性得出其案 例的几个特点。 系统的设计目标。以江淮瑞风商务车为模型,研制这一车型的保险公估 原型系统。 设计思想。给出了系统的整体框架。 系统流程。描述了系统的整个流程。 系统的总体结构。详细描述了系统的三大模块:车险案例维护模块、相 似案例检索模块以及新案例模块。 第四章阐述原型系统的关键技术及实现。主要包括: 车险公估系统的知识工程。详细介绍了车险公估案例的表示和组织。 案例的检索。给出了车险公估系统的索引和匹配策略。 基于c b r 的车险公估系统的实现。给出了原型系统的部分功能界面及相 关介绍。 第五章为结束语。包括: 工作总结。对整个课题的完成情况及其意义做总结阐述。 文章的创新点。 研究展望。对本系统中不够理想的地方做了分析,为今后更深一层的研 究打下基础。 4 第二章基于案例的推理方法 2 1 基于案例推理的基本内容 ( 1 ) c b r 的思想起源 基于案例的推理( c a s eb a s e dr e a s o n i n g ,简称c b r ) 的概念最早起源于耶鲁 大学r o g e rs c h a n k 教授在其1 9 8 2 年的著作d y n a m i cm e m o r y ) ) 中所作的描述。 他在研究人类认知科学的过程中,提出了脚本的知识表示概念,并给出了 m o p s ( m e m o r yo r g a n i z a t i o np a c k e t s ,记忆组织包) 为核心的动态记忆理论。这 被认为是人工智能领域中最早描述的c b r 的思想。1 9 8 3 年佐治亚工学院的 j a n e tk o l o d n e r 教授,以动态存储模型和问题求解的m o p 理论为基础,开发了第 一个真正意义上的c b r 系统c y r u s 。德克萨斯大学的p b r u c ep o r t e 教授在强 调机器学习方面,开发了将领域知识和特定的知识整合成一个统一的知识表示 结构的系统p r o t o s 。p r o t o s 被应用在听力临床诊断领域中,通过病人的症 状、病历和检查结果对听力疾病进行分类。p r o t o s 设计的动机是知识表示的 现实世界的约束和学习。马萨诸塞州州立大学的e d w i n ar i s s l a n d 和他的工作小 组研究开发了g r e b e 系统,进一步融合了案例与领域知识,促进了c b r 理论 的发展【4 1 。 ( 2 ) c b r 的基本思想 c b r 是近年来人工智能领域中兴起的一项重要的问题求解和学习的推理 技术。案例推理即利用过去经验中的具体案例来解决新问题。它通过寻找与之 相似的历史案例,把它重新应用到新问题的环境中来。即采用检索历史案例获 得当前工况相似特征参数的匹配案例,根据具体情况对匹配案例的方案进行调 整,进而运用到新的案例中去。 一个典型的c b r 问题的求解过程可以分为四个主要过程:案例检索; 案例重用;案例修正;案例保存。整个推理过程如图2 1 所示: 5 图2 - 1 基于c b r 推理的工作流程 在c b r 的工作流程中,通常把待解决问题称为目标案例,把历史案例称为 源案例,源案例的集合即为案例库。案例检索是指通过一系列新旧案例的特征 属性的匹配和相似性从案例库中检索到一个或多个案例。其中案例检索又可以 分为特征识别、案例索引、案例匹配和案例选择四个步骤。 用c b r 解决问题的基本过程为:当有目标案例时,利用目标案例的描述信 息查询过去相似的案例,即对案例库进行检索,得到与目标案例相似的源案例, 由此会获得对新问题的一些解决方案,若这个解答方案不完全符合要求,将对 其进行相应的调整,以获得一个成功的案例,最后再将这个解决方案作为一个 新的源案例进行保存【5 j 【7 1 。 在整个推理过程中,案例表示、案例检索和案例调整是案例推理研究的核 心问题。案例表示是案例推理的基础和首要问题,是对过去经验的相关的知识 片段的表述,一个案例就是导致特定结果的一系列的特征。案例检索和匹配是 实现案例推理的关键,它是利用案例的索引和组织结构,根据待解决问题的问 题描述,在案例库中找到与该问题或情况最相似的案例。经过案例检索过程得 到的方案,尽管与当前问题最相似,但可能还存在着一些差别,从而导致建议 方案中所记录的解决问题的方法和求解策略不完全适合当前的问题。因此,需 要根据当前问题的具体环境,使用领域知识对不合格的解决方案进行修正,来 适合当前问题的求解,这也是案例推理的一个重点。 目前,随着人们对c b r 研究和应用的逐渐深入,使得c b r 的应用范围和 领域还在不断的扩大。先后在问题求解、法律案例、医疗诊断、机器故障诊断 等方面得到广泛的应用,并证明了c b r 方法的正确性和有效性。作为人工智能 的一种推理技术和学习机制,基于案例推理是一种方法而非一种技术,这种界 6 定使得c b r 技术成为一种开放的系统,可以不断的吸收新的技术和方法,不断 的发展和壮大。 2 2 基于案例推理的关键技术 在c b r 系统中,因为要考虑通过案例间的相似度来提取相似案例,解决新 问题,故相似度算法贯穿着整个推理过程。相似度算法与案例的表示、案例的 分类、案例存储、案例检索及案例的匹配都有着密切的关系。 其中,案例的表示是相似算法的基础,不同的案例表示方法需要有不同的 相似算法。案例分类是建立索引或构造案例库存储结构的基础,所以案例的分 类也属于相似算法的一部分。案例存储则是通过设计来体现本应用领域相似度 定义的存储结构,来提高相似检索的效率。而案例检索是相似算法的目的,相 似算法是案例检索的手段,算法的好坏,直接影响检索的效率及准确度。以下 介绍的案例推理的几种关键技术都要以方便提取案例间相似度为目的。在基于 c b r 的系统建造的过程中有几个关键技术:基于案例推理的知识工程、案例的 检索、案例的修正和案例的学习。 2 2 1 基于案例推理的知识工程 知识工程指的是对知识进行表示、获取和处理。它所研究的问题是如何将 知识用计算机所能接受的形式表示出来。基于案例推理的知识工程的主要内容 包括c b r 系统中的专家知识、案例表示以及案例组织。 ( 1 ) c b r 系统中的专家知识 在整个c b r 系统中,c b r 需要利用领域知识来完成问题的求解工作。跟 传统的专家系统不同的是,它所使用的专家知识不是全部存储在知识库中,而 是体现在整个系统的开发过程当中。案例表示什么内容、用什么形式来表示、 解决什么问题等都需要用到领域专家的知识。在定义案例特征属性值上、比较 新旧案例的特征属性及相似度定义上、确定检索案例的方法上以及最后的修正 学习上也都需要用到领域知识,如: 在案例表示中:领域专家知道在求解的过程中哪些特征属性是相关的, 哪些是可以作为案例检索和重用的特征。 确定哪些特征属性可以作为案例之间的可匹配部分。 确定在案例库中如何能检索出最相似的案例。 所有这些使用到领域知识的步骤都会根据具体的应用做具体处理 8 】。 ( 2 ) 案例的表示 在案例推理过程中,案例的内容和表示是c b r 系统的首要问题。案例的知 识表示一般可表示为一个三元组: 。问题描述 7 是指对求解的问题及周围世界或环境的所有特征的描述,解描述是对问题的求 解方案的描述,效果描述是指修正方案后得到的结果情况是成功还是失败,也 即反馈。案例的内容与具体求解领域不同可能略有差异,对于简单的情况,一 个案例就是导致特定结果的一系列特征的集合。在具体实现案例时,可以用语 义网络、框架表示、谓词逻辑表示法、过程表示法等形式表示【7 j 。 语义网络法: 语义网络是知识的一种结构化图解表示,它由节点和弧线或链线组成。节 点用于表示实体、概念和情况等:弧线用于表示节点间的关系。语义网络法包 括四个部分:词法部分、结构部分、过程部分和语义部分。它具有以下几个特 点: ( a ) 能把实体的结构、属性与实体间的因果关系显示并简明的表达出来,与 实体相关的事实、特征和关系可以通过相应的节点弧线推导出来。这样可以以 联想方式实现对系统的解释。 ( b ) 与概念相关的属性和联系被组织在一个相应的节点中,概念易于受访和 学习。 ( c ) 表现问题比较直观,易于理解,方便知识工程师与领域专家的沟通。语 义网络中的继承方式也符合人类的思维习惯。 语义网络的表达方法虽然有自然性、联想性和高效性的优点,但也有其缺 点,如:( a ) 不能像逻辑方法那样保证推理的严格性和有效性。( b ) 不便于表达判 断性知识。( c ) 不便于表达深层知识,如与时间因素相关的动态知识。( d ) 语义网 络结构的语义解释依赖于该结构的推理过程而没有结构的约定,因而得到的推 理不能保证十分有效。( e ) 节点间的联系可能是线状、树状或网状、甚至是递归 状的结构,使相应的知识存储和检索可能需要比较复杂的过程。 语义网络的推理过程主要有两种:一种是继承,一种是匹配。所谓继承, 就是把对事物的描述从概念节点或类节点传递到实例节点。这种推理过程类似 于人的思维过程。一旦知道了某种事物的身份以后,就可以联想起很多关于这 件事物的一般描述,这种解决的问题比较简单。当解决问题涉及到由几部分组 成的事物时,继承过程不容易直接实现,这时候就需要用到匹配。 框架表示法: 框架表示法是表示案例的常用方法。框架提供了一个结构,一种组织,在 这个结构或组织中,新资料可以从过去的经验中得到的概念来分析和解释,所 以是一种结构化表示法。框架所论的对象可以是一个事物、一个事件或者一个 概念。通常,框架采用语义网络中的节点、槽、值表示架构,所以框架也可以 定义为是一组语义网络的节点和槽,这组节点和槽可以描述格式固定的事物、 行动和事件。框架一般由描述事物的各个方面的槽组成,每个槽可以拥有若干 个侧面,而每个侧面又可以拥有若干个值。这些值可以是程序、条件、默认值 或是一个子框架。这些内容可以根据具体问题需要来取舍,一个框架的一般结 构如下: 对于大多数问题,不能简单的用一个框架来表示,必须同时使用许多框架, 组成一个框架系统。为了能从不同角度来描述事物,可以对不同角度的视图分 别建立框架,然后再把它们联系起来组成一个框架系统。 框架是一种结构比较复杂的语义网络,故在语义网络推理中的匹配和特性 继承在框架系统中也可以实行。除此以外,由于框架用于描述具有固定格式的 事物、动作和事件,因此可以在新的情况下,推论出未被观察到的事实。框架 可以通过三条途径来实现这点:( a ) 框架包含它所描述的情况或物体的多方面的 信息,这些信息可以被引用。( b ) 框架包含物体必须具有的属性,在填充框架的 各个槽时,要用到这些属性。( c ) 框架描述它们所代表的概念的典型事例。若某 一情况在很多方面和一个框架相匹配,只有少部分相互之间存在着对应于当前 情况重要方面的不同之处,则描述也应该对这些不同之处作出解答。 使用一个框架来具体体现一个特定情况的过程并不一定很顺利。但当这个 过程遇到问题时,可以通过几种方法来解决:( a ) 选择与当前情况相对应的现有 的框架片段和候选框架进行匹配,选择最佳匹配。( b ) 保留与当前描述情况不匹 配的框架,因为这些框架可能具有启发性。( c ) 查询框架之间专门保存的链,以 提出应往哪个方向进行试探的建议。( d ) 沿着框架系统排列的层次结构向上移 动,直到找到一个足够通用的、不与已有事实矛盾的框架。 框架系统具有几个特性:( a ) 框架的一个重要特性就是其继承性。为此,一 个框架系统常被表示成一种树型结构。( b ) 框架可以对事物进行描述,而且如果 对其中某些细节作进一步描述,则可以扩充为另一些框架。( c ) 可以通过它对一 些从感官中没有直接得到的信息进行预测。( d ) 可以在它的基础上进行判断推 理。( e ) 可通过它来认识某一类事物。( f ) 可以通过一系列的实例来修正框架对某 些事物的不完整的描述。 根据这些特性,我们认为框架表示法是一种适应性强、概括性好、结构化 9 好、推理方式灵活、能把陈述性知识和过程性知识相结合的知识表示方法。 谓词逻辑法: 谓词逻辑法,主要是由一些谓词符号、变量符号和常量符号组成,用圆括 号、方括号、花括号及逗号分隔来表示域内的一些关系。对于每个谓词符号必 须规定定义域内的一个相应关系;对于每个常量符号必须规定定义域内的一个 相应实体;对于每个函数符号,必须规定定义域内相应的一个函数。 过程表示法: 上面的几种表示方法都是一种静止的表示方法,它所强调的是事物涉及的 对象是什么,是对事物相关知识的静态描述。而过程表示是将有关某一问题领 域的知识,连同如何使用这些知识的方法,均隐式的表达为一个求解问题的过 程。它所给出的是事物的一些客观规律,表达的是如何求解问题。知识的描述 形式就是程序。但因其知识均隐含在程序中,因而难于添加新知识并扩充功能, 适用范围较窄。 从理论上来讲,案例的表示形式没有特别的限制,可以采用各种形式和方 法,它就相当于案例的逻辑视图。但无论使用什么样的表示方法都要能完整的 表示案例,并且要易于后来的搜索和修正。 ( 3 ) 案例的组织 c b r 在很大的程度上依赖于案例的表示和组织。当把案例的内容以某种表 示方法存入到案例中后,还要考虑如何来存储和组织这些案例,以便于更有效 的进行案例的检索。案例的组织结构相当于案例的物理视图,在索引的过程中, 通过输入当前案例的信息,在案例库中寻找相同属性类别的案例,在这个大类 别中进行详细匹配,最后返回的是一个或多个最匹配的案例。案例库中是否有 大量的、丰富的案例可供检索,并且这个索引能否有效的使用,就取决于案例 的组织方法。在c b r 的研究中有两个重要的案例组织方法:动态记忆模型和类 型事例模型。 动态记忆模型: 这个模型是r o g e rs c h a n k 教授在他的著作( ( d y n a m i cm e m o r y ) ) 中提出的。 这种模型是一种层次结构,包括两种单元:实例单元与抽象单元。实例单元就 是具体的案例,抽象单元则是根据具体案例中的某些共同的属性集而构成的更 深一层的抽象,根据具体和抽象形成了动态记忆模型的层次结构。案例是按照 从具体到抽象的关系来进行组织的。 类型事例模型: 这个模型是p o r t e r 教授提出的一种单层的案例组织模型。在这种模型中, 类型表示为拥有一系列共同属性的一个种类。在c b r 系统中这些类型代表了领 域的背景知识,能够表示需要解决的任务。而所有的案例根据属性的重要度分 配不同的权重,在同一类别中按照相似度排序的方式组织起来p h h 】。 1 0 以上的两个模型在应用中都比较复杂。因此,随着c b r 研究的深入展开和 广泛应用,许多c b r 系统依据不同领域的应用需求,提出了其他适合自己应用 领域的案例组织结构。 2 2 2 案例的检索 在案例检索的过程中,会提取出与目标问题相似的案例,根据用户的需求, 动态调整相关的特征的权重和相关特征属性值来提供可参照的结果。案例的检 索包括案例的特征识别、索引、匹配和重用,其中最关键的是案例的索引机制 和匹配。 ( 1 ) 案例的索引机制 案例的索引机制是先通过某种方法对案例库建立索引结构,根据这个结构 进行索引并进一步的缩小匹配的范围,来提高案例检索的效率。好的索引机制 可以快速缩小检索的范围。索引是求解问题相关的关键字的集合,这些关键字 可以将这个案例同其它案例区分开,所以它应是具体、清楚、易识别的。索引 可以是案例的表面属性或导出属性。表面属性包括案例的特征属性和非特征属 性。特征属性能够反映案例某一方面使其与其他案例的特征与结构的不同;非 特征属性则是用来提供案例的相关信息。 根据案例的表示方法和案例库的组织结构,案例索引可以采用不同的方法, 目前常用的方法主要有两种,即:归纳索引和知识引导索引。 归纳索引: 归纳索引是指不断从案例的各组成部分抽取出最能将该案例与其它案例区 分开的成分。这种方法引入了启发式信息信息增益。它用判定归纳树的分 类方法来选择样本分类的属性,这在一定程度上改进了最近相邻算法用固定特 征进行搜索的缺点,但它采用的信息增益的启发函数不是最优启发函数,所以 不能保证找到最小的分类属性数目。这种索引方法能够用树状分层组织案例, 并可以从大量案例中自动地总结案例的特征属性。归纳索引方法可归结为两大 类: ( a ) 一类是群索引,利用聚类、神经网络、遗传算法等模型将案例库中的案 例按属性划分为若干个案例群,并构造一个能代表该群的典型案例。 ( b ) 另一类是结构索引,结构索引是根据案例表示的不同内容和属性,把案 例库组织成链状、树状、网状等结构,使其结构化。这种索引要对应用领域中 案例的属性有全面、深度的了解,一般需要人工完成。 我们在本系统中,将瑞风车损坏零件案例库按受损车辆的型号及零件名称 组织成树状结构的索引模型。如图2 2 所示: 图2 - 2 零件损坏情况案例库的结构索引 知识引导索引: 知识引导索引是c b r 系统通过领域的元知识、结构知识,来确定哪些属性 是案例的特征属性,并且指导案例的组织与索引。这种索引方法准确直观,但 由于需要将知识提炼为规则或模型,所以常常难以将元知识、结构知识代码化, 因而不容易得到完备的知识引导索引。建立索引通常应当遵循以下的原则:( a ) 前瞻性,以便可以充分扩展;( b ) 足够的抽象,以便通用;( c ) 足够的具体,以便 识别案例【l 引。 ( 2 ) 案例的匹配 因为案例的匹配过程是通过比较相似性来进行的,故属性间相似性的度量 问题是解决案例匹配的关键技术,这里涉及到了以下几个理论知识: 确定属性权值的粗糙集理论( r s ) : 在基于案例推理的系统中,从案例库中自动提取有用并具有代表性的案例 是案例推理的一个重要步骤。当推理系统进行案例检索时,首先要对案例的重 要属性进行相似度的匹配。在c b r 方法中进行相似度量时,案例的每个特征起 的作用是不同的,可以通过为每个特征赋上一个合理的权值来反映其在案例相 似性度量中的重要程度,权值估算的恰当与否将直接影响到度量结果的好坏。 粗糙集理论就是从知识分类的角度出发的一种数据推理方法,它是一种研 究不精确、不确定知识的工具,主要用于知识的简约和特征依赖性的分析。用 粗糙集理论处理相似度量中特征权重问题,可以不使用事先假定的信息,只利 用已有的信息来判断所有的特征,从而客观的评估特征的重要程度,并将其作 为特征权值,如果某些特征被认为没有起到预期的作用或干扰了实例检索,可 12 以将其删除【1 3 】【15 1 。 用粗糙集理论进行数据处理的具体步骤为: ( a ) 数据获取和选择。 ( b ) 数据预处理。经过处理,可以有效的减少数据表的大小,提高知识的质 量和有效性。 、 ( c ) 属性约简,即特征提取。市粗糙集理论的核心问题。它是指在保持知识 库的分类和决策能力不变的情况下,删除不相关的或不重要的知识,找到一个 尽可能小的属性子集。 ( d ) 规则提取。也称为值约简,它能使表的形式更简单,又尽可能地保留了 原表的信息1 6 】- 【17 1 。 最近相邻法: 当把案例的重要属性度确定之后,就要利用案例库的索引和组织结构,根 据待解决问题的问题描述,在案例库中找到与该问题最相似的案例。 最近相邻法又称近邻法,是指通过特征的加权和来评价新案例与库中存储 案例的相似度。近邻检索法认为两个案例的特征集是相同的,且同一特征在不 同的案例中具有相同的权重。 带权值的近邻法是目前应用较为广泛的一种案例匹配算法。它的基本思想 是以案例之间的某种距离作为标准,来判断案例的相似程度1 8 】。具体算法如下: ( a ) 案例库:c = ( c l ,c 2 ,c 3 ,c n ) ,其中c l ,c 2 ,c 3 ,c n 是代表每个案例。 ( b ) 案例间距离构造,设两个案例分别为c 1 ,c 2 ,c l = t i l , t 1 2 ,t l n ) , c 2 = t 2 1 ,t 2 2 ,t 2 n ) ,则距离可构造为: 肌 d ( c l ,c 2 ) = wi f l u t 2 j l ( 2 1 ) j = l 。 其中,w j 是特征向量对案例的作用权值。t i i 是指第i 个案例的第j 个特征 向量。 ( c ) 相似度计算。虽然距离d 本身可以作为案例的相似判断标准,但由于实 际问题中的特征向量的数据类型可能不同,若直接使用距离进行相似比较,精 度上得不到保证,采用这种方式是将相似度进行归一化处理,因此,相似度的 最终构造形式为: 1 s ( c l ,c 2 ) = 二一 ( 2 - 2 ) 1 + d ( c ,c ) l2 s 就是两个案例间的相似度根据以上算法得出相似度后,在案例检索过程 中,设定一个可调节的阈值,就可以筛选出匹配的相似案例。可见,最近相邻 算法就是通过累加目标案例与案例库中案例每个特征的相似度值来确定总的相 似度,这是一种比较容易实现和理解的匹配策略【19 1 。 2 2 3 案例的修正及案例的学习 在基于案例推理的过程中,检索出最佳案例之后,尽管可能与当前问题最 相似,但可能还存在着差别,从而导致建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中书法概述课件
- 离婚双方贷款房产分割及共同还款协议
- 生猪、菜牛、菜羊、家禽养殖基地养殖资金购销合同
- 离婚后特殊病患子女抚养权及医疗费用承担协议
- 生物质能源项目贷款合同附共同担保人及环保责任
- 电信IDC机房服务-移动数据业务标包合作协议
- 公务员面试培训咨询服务合同
- 化学工业新产品推广细则
- 物业管理矛盾调解手册
- 园艺工程:参与或观赏园林景观工程
- 《体重管理》课件
- 古茗合同协议书
- 湖北省技能高考(学前教育)专业知识考试必刷题及答案(含往年真题)
- 《跨国供应链管理案例解析》课件
- 临床案例谈护理文书规范化法律意义与纠纷防范
- CNAS-CI01:2012 检查机构能力认可准则
- 麻风病防治知识讲座
- 2023年威海桃威铁路有限公司招聘笔试参考题库附带答案详解
- 急性心梗诊疗(2025指南)解读课件
- 2025至2030年中国综合能源服务产业投资规划及前景预测报告
- 虾滑产品知识培训课件
评论
0/150
提交评论