粗糙集基本概念_第1页
粗糙集基本概念_第2页
粗糙集基本概念_第3页
粗糙集基本概念_第4页
粗糙集基本概念_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一种对集合一种对集合 A A 的划分就对应着关于的划分就对应着关于 A A 中元素的一个知识中元素的一个知识 面对日益增长的数据库 人们将如何从这些浩瀚的数据中面对日益增长的数据库 人们将如何从这些浩瀚的数据中 找出有用的知识 我们如何将所学到的知识去粗取精 什找出有用的知识 我们如何将所学到的知识去粗取精 什 么是对事物的粗线条描述什么是细线条描述 么是对事物的粗线条描述什么是细线条描述 粗糙集合论回答了上面的这些问题 要想了解粗糙集粗糙集合论回答了上面的这些问题 要想了解粗糙集 合论的思想 我们先要了解一下什么叫做知识 假设有合论的思想 我们先要了解一下什么叫做知识 假设有 8 8 个积木构成了一个集合个积木构成了一个集合 A A 我们记 我们记 A x1 x2 x3 x4 x5 x6 x7 x8 A x1 x2 x3 x4 x5 x6 x7 x8 每个积木块都有颜色属 每个积木块都有颜色属 性 按照颜色的不同 我们能够把这堆积木分成性 按照颜色的不同 我们能够把这堆积木分成 R1 R1 红 黄 兰红 黄 兰 三个大类 那么所有三个大类 那么所有 红颜色红颜色的积木构成集合的积木构成集合 X1 x1 x2 x6 X1 x1 x2 x6 黄颜色黄颜色的积木构成集合的积木构成集合 X2 x3 x4 X2 x3 x4 兰颜色兰颜色的积木构成集合的积木构成集合 X3 x5 x7 x8 X3 x5 x7 x8 按照颜色这个属性我们就把积木集合按照颜色这个属性我们就把积木集合 A A 进行了一个划分进行了一个划分 所谓所谓 A A 的划分就是指对于的划分就是指对于 A A 中的任意一个元素必然属于中的任意一个元素必然属于 且仅属于一个分类 那么我们就说颜色属性就是一种且仅属于一个分类 那么我们就说颜色属性就是一种知知 识识 在这个例子中我们不难看到 在这个例子中我们不难看到 一种对集合一种对集合 A A 的划分就的划分就 对应着关于对应着关于 A A 中元素的一个知识中元素的一个知识 假如还有其他的属性 假如还有其他的属性 比如还有形状比如还有形状 R2 R2 三角三角 方块方块 圆形圆形 大小 大小 R3 R3 大大 中中 小小 这样加上这样加上 R1R1 属性对属性对 A A 构成的划分分别为 构成的划分分别为 A R1 X1 X2 X3 x1 x2 x6 x3 x4 x5 x7 x8 A R1 X1 X2 X3 x1 x2 x6 x3 x4 x5 x7 x8 颜色分 颜色分 类 类 A R2 Y1 Y2 Y3 x1 x2 x5 x8 x3 x4 x6 x7 A R2 Y1 Y2 Y3 x1 x2 x5 x8 x3 x4 x6 x7 形状分 形状分 类 类 A R3 Z1 Z2 Z3 x1 x2 x5 x6 x8 x3 x4 x7 A R3 Z1 Z2 Z3 x1 x2 x5 x6 x8 x3 x4 x7 大小分 大小分 类 类 上面这些所有的分类合在一起就形成了一个基本的知上面这些所有的分类合在一起就形成了一个基本的知 识库 那么这个基本知识库能表示什么概念呢 除了红的识库 那么这个基本知识库能表示什么概念呢 除了红的 x1 x2 x6 x1 x2 x6 大的 大的 x1 x2 x5 x1 x2 x5 三角形的 三角形的 x1 x2 x1 x2 这样的这样的 概念以外还可以表达例如概念以外还可以表达例如 大的且是三角形的大的且是三角形的 x1 x2 x5 x1 x2 x5 x1 x2 x1 x2 x1 x2 x1 x2 大三角大三角 x1 x2 x5 x1 x2 x5 x1 x2 x1 x2 x1 x2 x1 x2 兰色的小的圆形兰色的小的圆形 x5 x7 x8 x5 x7 x8 x3 x4 x7 x3 x4 x7 x3 x4 x6 x7 x7 x3 x4 x6 x7 x7 兰色的或者中的积木兰色的或者中的积木 x5 x7 x8 x5 x7 x8 x6 x8 x5 x6 x7 x8 x6 x8 x5 x6 x7 x8 而类似这样的概念可以通过求交运算得到 比如而类似这样的概念可以通过求交运算得到 比如 X1X1 与与 Y1Y1 的交就表示红色的三角形 所有的这些能够用交 并表示的交就表示红色的三角形 所有的这些能够用交 并表示 的概念以及加上上面的三个基本知识的概念以及加上上面的三个基本知识 A R1 A R2 A R3 A R1 A R2 A R3 一一 起就构成了一个知识系统记为起就构成了一个知识系统记为 R R1 R2 R3R R1 R2 R3 它所决定 它所决定 的的所有知识所有知识是是 A R x1 x2 x3 x4 x5 x6 x7 A R x1 x2 x3 x4 x5 x6 x7 x8 x8 以及以及 A RA R 中集合的并 中集合的并 下面考虑近似这个概念 假设给定了一个下面考虑近似这个概念 假设给定了一个 A A 上的子集上的子集 合合 X x2 x5 x7 X x2 x5 x7 那么用我们的知识库中的知识应该怎 那么用我们的知识库中的知识应该怎 样描述它呢 红色的三角 样描述它呢 红色的三角 的大圆 都不是 无论是的大圆 都不是 无论是 单属性知识还是由几个知识进行交 并运算合成的知识 单属性知识还是由几个知识进行交 并运算合成的知识 都不能得到这个新的集合都不能得到这个新的集合 X X 于是我们只好用我们已有的 于是我们只好用我们已有的 知识去近似它 也就是在所有的现有知识里面找出跟他最知识去近似它 也就是在所有的现有知识里面找出跟他最 像的两个一个作为下近似 一个作为上近似 于是我们选像的两个一个作为下近似 一个作为上近似 于是我们选 择了择了 兰色的大方块或者兰色的小圆形兰色的大方块或者兰色的小圆形 这个概念 这个概念 x5 x7 x5 x7 作为作为 X X 的下近似 选择的下近似 选择 三角形或者兰色的三角形或者兰色的 x1 x2 x5 x7 x8 x1 x2 x5 x7 x8 作为它的上近似 值得注意的是 作为它的上近似 值得注意的是 下近下近 似集似集是在那些所有的包含于是在那些所有的包含于 X X 的知识库中的集合中求并得的知识库中的集合中求并得 到的到的 而 而上近似上近似则是将那些包含则是将那些包含 X X 的知识库中的集合求并的知识库中的集合求并 得到的得到的 一般的 我们可以用下面的图来表示上 下近似 一般的 我们可以用下面的图来表示上 下近似 的概念 的概念 这其中蓝色曲线围的区域是这其中蓝色曲线围的区域是 X X 的区域 紫色曲线围的的区域 紫色曲线围的 部分是内部参考消息 是下近似 红色曲线围的内部部分部分是内部参考消息 是下近似 红色曲线围的内部部分 就是上近似集 其中各个小方块可以被看成是论域上的知就是上近似集 其中各个小方块可以被看成是论域上的知 识系统所构成的所有划分 识系统所构成的所有划分 整个粗集理论的核心就是上面说的有关知识 集合的整个粗集理论的核心就是上面说的有关知识 集合的 划分 近似集合等等概念 下面我们讨论一下关于粗糙集划分 近似集合等等概念 下面我们讨论一下关于粗糙集 在数据库中数据挖掘的应用问题 考虑一个数据库中的二在数据库中数据挖掘的应用问题 考虑一个数据库中的二 维表如下 维表如下 可以看出 这个表就是上面的那个例子的二维表格体可以看出 这个表就是上面的那个例子的二维表格体 现 而最后一列是我们的决策属性 也就是说评价什么样现 而最后一列是我们的决策属性 也就是说评价什么样 的积木稳定 这个表中的每一行表示了类似这样的信息 的积木稳定 这个表中的每一行表示了类似这样的信息 红色的大三角积木稳定 红色的大三角积木稳定 的小圆形不稳定等等 我们的小圆形不稳定等等 我们 可以把所有的记录看成是论域可以把所有的记录看成是论域 A x1 x2 x3 x4 x5 x6 x7 x8 A x1 x2 x3 x4 x5 x6 x7 x8 任意一个列表示一个属 任意一个列表示一个属 性构成了对论域的元素上的一个划分 在划分的每一个类性构成了对论域的元素上的一个划分 在划分的每一个类 中都具有相同的属性 而属性可以分成两大类 一类叫做中都具有相同的属性 而属性可以分成两大类 一类叫做 条件属性 颜色 形状 大小都是 另一类叫做决策属性 条件属性 颜色 形状 大小都是 另一类叫做决策属性 最后一列的是否稳定 下面我们考虑 对于决策属性来说最后一列的是否稳定 下面我们考虑 对于决策属性来说 是否所有的条件属性都是有用的呢 考虑所有决策属性是是否所有的条件属性都是有用的呢 考虑所有决策属性是 稳定稳定 的集合的集合 x1 x2 x5 x1 x2 x5 它在知识系统 它在知识系统 A RA R 中的上 中的上 下近似都是下近似都是 x1 x2 x5 x1 x2 x5 本身 本身 不稳定不稳定 的集合的集合 x3 x4 x6 x7 x8 x3 x4 x6 x7 x8 在知识系统 在知识系统 A RA R 中的上 下近似也都中的上 下近似也都 是是 x3 x4 x6 x7 x8 x3 x4 x6 x7 x8 它本身 说明该知识库能够对这个概它本身 说明该知识库能够对这个概 念进行很好的描述 念进行很好的描述 下面考虑是否所有的基本知识 颜色 形状 大小都下面考虑是否所有的基本知识 颜色 形状 大小都 是必要的 如果我们把这个集合在知识系统中去掉颜色这是必要的 如果我们把这个集合在知识系统中去掉颜色这 个基本知识 那么知识系统变成个基本知识 那么知识系统变成A R R1 x1 x2 A R R1 x1 x2 x3 x4 x7 x5 x6 x8 x3 x4 x7 x5 x6 x8 以及这些子集的并集 如果用以及这些子集的并集 如果用 这个新的知识系统表达这个新的知识系统表达 稳定稳定 概念得到上下近似仍旧都概念得到上下近似仍旧都 是 是 x1 x2 x5 x1 x2 x5 不稳定不稳定 概念的上下近似也还是概念的上下近似也还是 x3 x4 x6 x7 x8 x3 x4 x6 x7 x8 由此看出去掉颜色属性我们表达稳定 由此看出去掉颜色属性我们表达稳定 性的知识不会有变化 所以说颜色属性是多余的可以删除 性的知识不会有变化 所以说颜色属性是多余的可以删除 如果再考虑是否能去掉大小属性呢 这个时候知识系统就如果再考虑是否能去掉大小属性呢 这个时候知识系统就 变为 变为 A R R1 R3 A R2 x1 x2 x5 x8 x3 x4 x6 x7 A R R1 R3 A R2 x1 x2 x5 x8 x3 x4 x6 x7 同样考虑同样考虑 稳定稳定 在知识系统在知识系统 A R2A R2 中的上下近似分别为 中的上下近似分别为 x1 x2 x1 x2 和和 x1 x2 x5 x8 x1 x2 x5 x8 已经和原来知识系统中的上下 已经和原来知识系统中的上下 近似不一样了 同样考虑近似不一样了 同样考虑 不稳定不稳定 的近似表示也变化了 的近似表示也变化了 所以删除属性所以删除属性 大小大小 是对知识表示有影响的故而不能去是对知识表示有影响的故而不能去 掉 同样的讨论对于掉 同样的讨论对于 形状形状 属性也一样 它是不能去掉属性也一样 它是不能去掉 的 最后我们得到化简后的知识库的 最后我们得到化简后的知识库 R2 R3R2 R3 从而能得到下 从而能得到下 面的决策规则 大三角面的决策规则 大三角 稳定 大方块稳定 大方块 稳定 小圆稳定 小圆 不不 稳定 中圆稳定 中圆 不稳定 中方块不稳定 中方块 不稳定 利用粗集的理论不稳定 利用粗集的理论 还可以对这些规则进一步化简得到 大还可以对这些规则进一步化简得到 大 稳定 圆稳定 圆 不稳不稳 定 中方块定 中方块 不稳定 这就是上面这个数据表所包含的真不稳定 这就是上面这个数据表所包含的真 正有用的知识 而这些知识都是从数据库有粗糙集方法自正有用的知识 而这些知识都是从数据库有粗糙集方法自 动学习得到的 因此 粗糙集是数据库中数据挖掘的有效动学习得到的 因此 粗糙集是数据库中数据挖掘的有效 方法 方法 从上面这个例子中我们不难看出 实际上我们只要把从上面这个例子中我们不难看出 实际上

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论