




已阅读5页,还剩26页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于CBR的知识管理研究 1 思路 2 1知识管理 1 知识的重要性现在 知识已成为社会财富的主要来源 21世纪 什么最重要 人才 农业经济时代 土地 工业经济前期 劳动力 工业经济后期 资本 今天 知识 伴随着人类社会的发展 社会的财富核心发生了一系列的变化 3 2 知识管理 KnowledgeManagement KM 定义1986年维格首次提出KM的概念 并定义为 为最大化企业知识相关的效率及知识资产的回报 企业系统地 显性地 审慎地建立 更新与应用知识的过程 简单地说 知识管理就是通过一定手段 方法 使企业实现知识的共享和应用 知识管理的过程 知识获取与表示 知识的存储 知识集成与传播 知识应用 知识创新计算机技术能提升知识管理的有效性 因此 知识管理的实施平台多借助于知识管理系统 4 2CBR的概念及思想 CBR的概念 案例推理 casebasedreasoning CBR 是人工智能领域里的一种推理技术 源于认知科学中记忆在人类推理活动中所扮演的角色 1982年 美国耶鲁大学罗杰 沙克在 DynamicMemory 一书中提出了动态记忆理论 描述了记忆是如何随着经验的增长而自动修改和发展的 这被看作是CBR思想的正式来源 5 CBR核心思想 在进行新问题求解时 使用以前曾经求解过类似问题的经验 并针对新旧问题的差异做相应调整 从而得到新问题的解 而后将新知识以案例的形式加入到知识库中 CBR方法基于自然界的两条原则 一 世界是有规律的 相似的问题具有相似的解决方法 二 以前遇到的问题极有可能在将来再次遇到 6 3CBR系统流程 典型的案例推理问题求解模型 即4R模型主要包涵了四个过程 案例检索 Retrieve 案例重用 Reuse 案例修正 Revise 和案例保存 Retain 7 4R过程 1 案例检索 Retrieve 一个新案例出现时 利用其描述信息查询与新案例相似的案例 得到最相似的旧案例 2 案例重用 Reuse 借鉴旧案例的解决方法 得到新案例的一些解决方案 3 案例修正 Revise 如果有新旧案例相似的情况 因此要针对新旧案例的差异 进行案例修正 4 案例保存 Retain CBR系统有自动学习的特点 根据与原有案例的相似度与设定阈值的比较结果 对新案例及解法有选择进行保存 8 4 1案例的检索 文献4 案例检索是基于案例推理系统的中心环节 而案例检索算法更是案例检索的重点 案例的检索技术通常有三种 最近邻法 归纳推理法和知识引导法 最近邻法 Nearestneighborapproach 是指用户从案例库中找出与当前情况距离最近的案例的方法 它把输入案例与案例库中的所有案例进行逐索引域的比较 求出案例之间的每个域的相似度 再根据以前定义的加权向量 最终确定所有案例与输入案例的相似度 将相似度超过阈值的案例返回给用户 4CBR系统的关键技术 9 案例的相似度是抽取案例各方面的特征值 并确定各特征的权 通过计算目标案例和源案例的加权距离 来确定案例相似程度的大小 设案例库 第i个案例的属性集为 则案例间的相似度为其中 n为案例的属性个数 为第j个属性的权值 表示案例和案例中第j个属性的相似性 其通常形式为 其中表示第j个特征的取值范围 10 4 2案例重用 案例的重用被公认为是CBR中最具挑战性的问题 也是继案例检索之后的又一个热点 因此 案例的重用是实现CBR目前最困难的问题 不是难在无法构造一种重用的方法 而是构造不出相对通用的重用方法 11 一般来说 在CBR中有两种案例修改的方法 结构修改 就是直接应用规则或公式修改所存储案例的结论以适应新的问题 诱导修改 重用得出以前案例结果的规则或公式 采用这种方法时 需另外存储如何得出案例结论的步骤和知识 以便改写时应用 具体做法有 1 不修改 这种策略适用于有复杂原因 但有简单结论的案例 如在银行贷款中的应用 2 参数调整 属于结构修改 比较源案例和目标案例的特定的参数 在确定的调整方向上进行调整 实际上应用了领域中的一些规则 4 3案例修改 12 3 诱导重放 检索解决原问题的方法和步骤 在新的问题中予以应用 4 模型引导 采用因果关系模型来引导修改 由于很难找到一种相对通用的案例的修改方法 只能具体问题具体分析在实际应用中 多数采用基于规则的推理 RBR 和与人机结合的方式进行案例的修正 13 4 4案例保留 基于案例的推理 CBR 系统采用增量式的学习 能不断积累经验和知识 这来源于对新案例及解法的保留 但若无条件地对案例进行保留势必导致另一个问题产生 即无法控制案例库中案例数目的增长而使系统的运行效率下降 检索成本增加 一种解决策略是 有选择地对新案例及解法进行保留 是否对新案例进行保留 取决于原有案例的相似度与设定阈值的比较 如果相似度的取值在阈值与1之间 则认为很相似 信息量和知识含不高 价值不大 不对案例进行存储 14 5CBR与知识管理的融合 知识管理的过程一般为 知识获取与表示 知识存储 知识集成与传播 知识应用 知识创新 CBR尝试在计算机上将叙述能力与知识管理进行结合 在为知识管理系统的实现提供了基本的技术保障的同时 也拓宽了推理技术的应用 CBR的4R过程模型以及其相关技术为知识管理系统的构建提供了理论和技术基础 15 5CBR与知识管理的融合 CBR与知识管理具有内在一致性 知识获取与表示 案例的知识表示与案例的检索 知识的存储 案例的保存 知识集成与传播 案例匹配 知识应用 案例匹配 案例自学习 知识创新 案例自学习 案例评估 以上可知基于案例的推理过程 本身就涉及到知识管理的过程 可以说是知识管理的实现技术 16 6CBR在知识管理中的应用举例 案例背景以电信长途传输线路故障预案调度为例 介绍如何在知识管理中应用CBR更好的为长途传输线路故障找到合适的预案 建立长途传输线路故障预案调度的目的 就是将故障信息表示成计算机能够分析和处理的数据结构 为案例的组织 检索 学习提供前提条件 并为故障的解决提供相关的支持预案 使故障发生后不会陷入盲目的维护中 而是根据预案有章可循 有据可依的得到解决 通过研究发现 有些故障是重复发生的 以前的解决预案完全可以重用 既便不能完全重用 作适当修改就可以了 深人分析已有的调度预案发现 调度预案是在基于以往调度预案的基础上生成的 所以通过对预案的积累 产生历史上可行的预案库并从中进行抽取分析获得有用的知识是非常有意义的 17 通过研究大量的调度预案 发现故障与问题中某些有限个故障现象因素有关 这些因素组合在一起 就可确定一个问题描述 问题描述经加工成为详细的案例描述 由于问题描述和解决方案之间是一种对应的关系 由此可确定解决方案 问题描述可以看作一个实体 故障形式可以抽取成几个关键现象因素作为问题描述的属性 相应的解决方案也可看作一个实体 据此构建电信长途传输故障预案调度模式 用公式表述为 f A B 其中A为问题描述的故障现象特征因素集合 B为解决方案的集合 对于一个给定的具体案例C而言 Ac Bc 是一个完整的案例及其预案的解决方案集合 Ac Bc是针对某一具体案例C的故障现象特征因素集合和解决预案的集合 18 案例工作模型电信长途传输线路故障预案调度是基于工作流运转的CBR知识管理过程 通过工作流的流转来在角色之间传递案例 完成案例的创建描述 检索匹配 生成预案 维护案例库和预案库以及从中抽取相关知识 电信长途传输线路故障预案调度工作流涉及机房工作人员 工程师 高级工程师 维护人员四个角色 19 案例工作模型 20 机房工作人员创建发现的故障案例 对案例进行描述 一般是各种仪器设备对故障的反应信息 工程师从机房工作人员获取故障案例 然后从案例库里面匹配合适的案例 再根据案例和预案的对应关系从预案库中得到相关联的预案 交由维护人员具体实施预案 如果案例库没有找到合适的案例则工程师则要自己创建对应的预案 新预案由高级工程师审核后交由维护人员实施 并放入预案库中 高级工程师主要是对案例库和预案库进行维护 并通过数据挖掘等算法对案例库和预案库进行分析获得有用的知识 然后将获取的知识放入知识库中 从而使其他角色能方便的从知识库中获取知识 高级工程师根据维护人员实施预案的反馈情况修改案例和预案 根据实际情况放入案例库和预案库中 维护人员主要负责预案的实施和预案实施效果的记录 21 案例基本原理 案例包括案例编号 案例名称 案例内容 案例作者 案例创建日期 案例修改历史记录 案例内容 对应预案编号 案例作者指案例的创建者 案例修改历史记录包括修改人 修改原因 修改内容 修改时间 这里用XMLSchema对案例的表示进行定义 其树形视图见下图 22 案例内容以树形结构来描述 下面定义了节点的四种类型 属性节点 值节点 复合属性节点和根节点 1 属性节点 是故障现象某一方面的具体描述 其子节点为其对应的值节点 其父节点为复合属性节点或根节点 2 值节点 对应某一个属性节点的取值 有唯一的取值 值节点一定为树结构的叶子节点 没有子节点 3 复合属性节点 必须包含一个或多个子属性节点的节点 下面的子节点为属性节点 是故障现象某一方面的抽象描述 4 根节点 树的根节点 汇总所包含的属性节点和复合属性节点 表明了一个案例所有的现象描述的汇总集合 23 举例说明如下 见下图用树的形式描述了一个案例CASEEXAMPLE的内容 案例CASEEXAMPLE的内容 24 匹配过程采用对树结构剪枝的策略高效进行匹配 得到两个案例的相似度 如相似度在阈值和1之间则接受选取的案例 否则不接受选取的案例 1 设定阈值 在0与1之间 越接近0 匹配越不精确 合适的案例也越多 一般可用多次实验设定所用的阈值 2 对案例属性设相应的权值匹配过程 1 首先计算目标案例内容树各节点的内容 从底层叶子节点开始计算直根节点 值节点不做任何处理 属性节点得赋得其值节点的值 复合属性节点赋为其包含属性节点的内容 根节点为所包含属性节点和复合属性节点的内容 比如在CASEEXAMPLE中 处理后属性节点A1 1 A2 0 B1 500 C 100 复合性节点A A1 A2 B B1 根节点R A B C 25 2 其次计算待选案例的节点的内容 方法同目标案例的计算 然后比较两者根节点包含的属性 按照 以目标案例的属性为中心 的原则 匹配每一层的属性直到全部属性匹配完毕 26 计算机中算法的代码简述 计算目标案例内容的各节点取值COMPUTENODE CaseAim 当案例库有未选取的案例时候循环匹配WHILE thereisacasenotbeselectedincaselibrary 计算选取案例内容的各节点取值COMPUTENODE CaseChoice 计算两个案例间相异值 如果相异值在阈值范围之内则添加案例到结果中IFCOMPARECASE CaseAim CaseChoice THENAddSelectedCase CaseChoice ENDIFENDWHILE 27 举例说明匹配过程这里给出一个等选案例CASECHOICE的结构 见下图 计算各节点如下 R A B D A A1 B B1 A1 1 B1 600 D 100 目标案例属性权值如下 WA1 0 4 WA2 0 2 WB1 0 3 WC 0 1 则WA 0 6 WB 0 3 属性A1 A2的取值范围为0 1 B1的取值范围为200 800 C的取值范围为0 1000 待选案例CASECHOICE的内容 28 情况一 阈值 设定为0 2 首先比较根节点 发现待选案例中没有属性节点C 同时忽略待选案例中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学安全全员培训计划课件
- 2025河南新乡市延津县县外在编在岗教师回乡任教的模拟试卷含答案详解
- 2025杭州市上城区采荷街道办事处编外招聘14人考前自测高频考点模拟试题有完整答案详解
- 2025广东计划招募100人模拟试卷及一套参考答案详解
- 安全培训效果验证课件
- 2025年度中南大学湘雅二医院招聘模拟试卷及答案详解(网校专用)
- HER2-IN-22-生命科学试剂-MCE
- 2025江苏连云港市灌云县招聘就业困难人员公益性岗位26人模拟试卷(含答案详解)
- 2025年甘肃省嘉峪关市卫生健康委员会招聘公益性岗位人员10人考前自测高频考点模拟试题及答案详解(名校卷)
- 2025福建三明林校招聘407人模拟试卷及答案详解(夺冠)
- 检验科危急值课件
- 红十字救护员培训理论试题及答案
- 动量守恒定律模型归纳(11大题型)(解析版)-2025学年新高二物理暑假专项提升(人教版)
- 招商银行ai面试试题及答案
- 慢性阻塞性肺疾病(COPD)护理业务学习
- 2025-2026学年北师大版(2024)初中生物七年级上册教学计划及进度表
- 产科危急重症早期识别中国专家共识解读 3
- 医疗器械配送应急预案模板(3篇)
- DB65-T 4803-2024 冰川厚度测量技术规范
- 护理专业新进展介绍
- 大疆无人机培训课件
评论
0/150
提交评论