第二章-信息表知识表达系统PPT课件_第1页
第二章-信息表知识表达系统PPT课件_第2页
第二章-信息表知识表达系统PPT课件_第3页
第二章-信息表知识表达系统PPT课件_第4页
第二章-信息表知识表达系统PPT课件_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第二章信息表知识表达系统 2 知识获取 就是要从大量的原始数据信息中分析发现有用的规律信息 即是将知识从一种原来的表达形式 原始数据表达形式 转换为一种新的目标表达形式 人类或者计算机便于处理的形式 如逻辑规则等 知识表达是智能信息系统的关键 3 基于Rough集理论的知识发现 主要是借助于信息表这样一种有效的数据表知识表达方式 本章就将介绍这种信息表知识表达系统 知识的分类概念信息表知识表达系统决策表 4 知识的分类概念 知识是人类通过实践 认识到的客观世界的规律性的东西 是人类实践经验的总结和提炼 具有抽象和普遍的特性 知识是信息经过加工处理 解释 挑选和改造而形成的 知识是命题 规则等的集合 5 知识一般可分为说明性知识 过程性知识和控制性知识 说明性知识提供概念和事实 例如 一个智能检索系统中 说明性知识包括说明具体事实的数据库内容 用规则表示问题的知识称作过程性知识 智能信息检索系统中利用过程性知识处理说明性知识 用控制策略表示问题的知识称为控制性知识 控制性知识包含有关各种处理过程 策略和结构的知识 常用来协调整个问题求解的过程 6 从认知科学的一些观点来看 可以认为知识来源于人类以及其他物种的分类能力 本书中 我们认为知识即是将对象进行分类的能力 上述的说明性知识可以认为是对现实世界客观个体的描述 即是区分客观个体的知识 过程性知识实质上是通过利用说明性知识对客观个体进行分类的知识 而控制性知识也是关于如何用过程性知识实现对客观个体进行分类的知识 也可以认为是关于对过程性知识的分类 7 对于论域中由等价关系划分出的任意子集X 都可称之为U中的一个概念 这里 我们认为空集 也是一个特殊的概念 论域U中的任意概念族称为关于U的抽象知识 也简称知识 它也是代表了对U中个体的分类 这样 知识就可以定义为 给定一组数据 集合 U和等价关系集合R 在等价关系集合R下对数据集合U的划分 称为知识 记为U R U上的一族划分 对U的分类 称为关于U的知识库 关于U的一个知识库也可以理解为一个关系系统 其中U为论域 R是U上的一族等价关系 根据这些等价关系就可以对U进行不同的划分 知识 每种划分将把U分为不同的子集 概念 8 9 如果我们按照某一个属性或多个属性来描述这些个体 就可以得到不同的分类知识 按照头疼来分类 按照肌肉疼 体温和流感这三个属性分别来分类 按照头疼和肌肉疼这两个属性来共同分类 按照头疼和体温这两个属性来共同分类 按照头疼和流感这两个属性来共同分类 由此 可以看出 我们可以用不同的标准来对论域进行分类 得到不同的概念和抽象 有的概念是我们需要的 有的概念是没有价值的 知识获取就是要探寻有用的概念 并得到概念之间的关系 10 2 2信息表知识表达系统 人之所以有智能行为是因为他们有知识 要让机器具有智能行为的能力 就必须让机器具有相应的知识 它需要以人的知识作为其工作基础 知识表示就是要研究用机器表示知识的可行的 有效的 通用的原则和方法 近年来知识表示的研究引起了广泛的注意 目前 常用的知识表示方法有逻辑模式 框架 语意网络 产生式规则 状态空间 剧本等 这些是知识工程需要研究的内容 本节中 我们将介绍一种基于信息表的知识表达形式 它是Rough集理论中对知识进行表达和处理的基本工具 11 在人工智能研究中 一个实例 现实世界中的一个对象 个体 经常使用属性 值对的集合来表示 实例集就是这样的实例集合 记为U U可被划分为有限个类X1 X2 Xn 使得Xi U Xi Xi Xj i j 对i j 1 2 n且 Xi U 12 信息表知识表达系统 信息表知识表达系统的基本成分是研究对象的集合 关于这些对象的知识是通过指定对象的属性 特征 和它们的属性值 特征值 来描述的 一般地 一个信息表知识表达系统S可以表示为S 这里 U是对象的集合 也称为论域 R C D是属性集合 子集C和D分别称为条件属性集和结果属性集 V r RVr是属性值的集合 Vr表示属性r R的属性值范围 即属性r的值域 f U R V是一个信息函数 它指定U中每一个对象x的属性值 13 信息表 为了直观方便 U也可以写成一个表 纵轴表示实例标记 横轴表示实例属性 实例标记与属性的交会点就是这个实例在这个属性的值 这个表称为信息表 是表达描述知识的数据表格 14 不可分辨二元关系 不分明关系 对于每个属性子集B R 我们定义一个不可分辨二元关系 不分明关系 IND B 即 IND B x y x y U2 b B b x b y 显然 IND B 是一个等价关系 且 每个子集B R也可称为一个属性 当B是单元素集时 称B为原始的 否则称B为复合的 属性B可以认为是用等价关系 在该属性上的取值相等 表示的知识的一个名称 称为标识属性 一个表可以看作是定义的一个等价关系簇 即知识库 15 实际上 信息表这种数据表格知识表达系统是对客观对象的描述和罗列 表达的是属于说明性的知识 当信息表包含的数据足以反映论域的时候 通过属性所对应的等价关系就可以体现论域中的过程知识 即概念之间的逻辑关系或规则知识 事实上 从信息表所表达的说明性知识中发现过程性知识 规则知识 就是知识发现的研究内容 16 表2 2 1给出了一个关于玩具积木的信息表 根据这个信息表 我们可以得到有关的概念描述 如将玩具积木按照颜色 形状和大小分别可以进行如下分类 得到有关玩具积木的概念知识 17 信息表 表示了流感病例的数据信息 信息函数将每个对象的属性取值映射到具体的属性值上 例如f e1 头疼 是 f e2 体温 高 条件属性和结果属性之间还存在一定的关系 如 用信息表来表示知识 我们对系统的实际语意 表中的取值的具体含义内容并不感兴趣 实际上 表中的属性值都是从现实问题中采集得到的 是对客观对象属性的抽象描述 我们以后将把信息表中的属性值仅当作数据来研究 下面 我们再对决策表这种数据表格知识表达系统作形式化的讨论 18 2 3决策表 定义2 3 1一个决策表是一个信息表知识表达系统S R C D是属性集合 子集C和D分别称为条件属性集和结果属性集 D 条件属性C和结果属性D的等价关系IND C 和IND D 的等价类分别称为条件类和决策类 19 一个决策表中的结果属性有时是唯一的 称为单一决策 有时是不唯一的 称为多决策 对于具有多个结果属性的决策表 我们可以通过如下两种方法变换成为单一决策的决策表 20 方法一 如果决策表S R C D是属性集合 子集C和D分别称为条件属性集和结果属性集 且D d1 d2 dn 则可以将该决策表分解成为n个不同决策的单一决策表 S1 S2 Sn 其中Si U是论域 Ri C di 是属性集合 子集C和 di 分别称为条件属性集和结果属性集 Vi r RiVr是属性值的集合 Vr表示属性r Ri的属性值范围 即属性r的值域 fi U Ri Vi是信息函数 21 表2 3 1多决策表 22 方法二 如果决策表S R C D是属性集合 子集C和D分别称为条件属性集和结果属性集 且D d1 d2 dn 则可以构造一个新的决策表S U是论域 R C d 子集C和 d 分别称为条件属性集和新的结果属性集 V r R Vr是属性值的集合 Vr表示属性r R 的属性值范围 即属性r的值域 f U R V 是信息函数 这里 结果属性d的取值要满足如下要求 x y U d x d y d1 x d1 y d2 x d2 y dn x dn y 23 表2 3 1多决策表 24 在我们前面的讨论中 信息表知识表达系统是用 数值 属性 表的方式表达 这种用决策表表达的信息系统不仅利用了数据表的性质来表示知识库的基本性质 而且也是一种具有归纳特征的逻辑方法 是数据分析的有力工具 但是 我们也可以从另外的角度来看待这种数据表 也就是说 它可以被看作是关于现实和结果的一个命题的集合 因此我们可以用逻辑工具来处理 它反映的是决策表完全形式化的性质 具有可区分的条件属性和决策属性的知识表达系统就是决策表 又简称CD决策表 关系IND C 和关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论