版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
粗糙集的简单应用作者专业主要内容1、粗糙集理论基本概念2、粗糙集的应用工作成绩粗糙集的相关基本概念粗糙集理论由波兰科学家Z.Pawlak于1982年提出,它是一种新的处理模糊和不确定性知识的数学工具。其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。粗糙集的相关基本概念1.信息系统2.知识约简粗糙集1.信息系统
定义1.1信息系统是一个四元组,其中:(1)是对象的非空有限集合,即,称为论域,中的每个称为一个对象;(2)是属性的非空有限集合,即,中的每个称为一个属性;(3),是属性的值域;(4)称为信息函数,它为每个对象关于每个属性赋予了一个信息值,且对于任意,有。在不引起混淆的前提下,信息系统通常可简写为。粗糙集1.信息系统
定义1.2若,且,则中全部等价关系的交集称为上的不可分辨关系,记为:且有
设是上的一个等价关系,表示的所有等价类,或上的划分构成的集合,表示包含元素的等价类。粗糙集1.信息系统
定义1.3设为一知识表达系统,,称为条件属性集,称为决策属性集。具有条件属性和决策属性的知识表达系统称为决策表。
条件属性决策属性患者头痛肌肉痛体温流感a是是正常否b是是高是c否否高是d否是很高否一个信息系统的例子粗糙集1.信息系统
定义1.5若则为粗糙集。否则称为精确集。
定义1.4设为一知识表达系统,,一个等价关系。称为关于的下近似。称为关于的上近似。粗糙集2.知识约简
定义2.1设为一个信息系统,,如果,则称在中是不必要的,否则称是必要的。
定义2.2设为一个信息系统,如果在中都是必要的,则称属性集是独立的,否则称是相关的。
定理1如果是独立的,,则也是独立的。
粗糙集2.知识约简
定义2.3设为一个信息系统,,如果是独立的,且,则称是的一个约简。
定义2.4设为一个信息系统,中所有必要属性组成的集合称为属性集的核,记为。
定理2,其中表示的所有约简。粗糙集2.知识约简
定义2.5设为一个信息系统,是非空属性集,,为决策属性相对于的相对正域。
定义2.6设和都是等价关系族,如果则称是上可约去的;否则是上不可约去的。
粗糙集2.知识约简
定义2.7如果上的每一个等价关系都是不可约去的,则是独立的或者关于是独立的。
定义2.8所有中不可约去的等价关系的集合称为的核,记为。粗糙集2.知识约简
定义2.9设有信息系统,是记录在属性上的值,表示分辨矩阵中第行,第列的元素,被定义为:其中
定义2.10区分函数是从分辨矩阵中构造的。约简算法的方法是先求的每个属性的析取,然后再求所有的合取。分辨矩阵是一个对称矩阵。在实际运用中,一般只列出它的下三角阵。工作成绩粗糙集的应用———基于粗糙集的小型电子商务挖掘模型粗糙集建立模型
数据挖掘的一般过程包括:数据采集、数据清洗、挖掘算法确定、数据挖掘、模式解释及知识评价。从理论研究到应用实现,设计的技术主要有分类技术、聚类技术、粗糙集技术、统计技术和关联技术等。这里,结合粗糙集建立如图所示的挖掘模型。
数据采集粗糙集数据清洗(预处理)粗糙集数据挖掘粗糙集规则提取解释模型得出结论粗糙集数据清洗
下表是某电子商店的购物记录,P、Q、R、S代表四种商品;CustomerNo.为客户号;“Y”表示购买了某商品;“N”表示没有购买某商品粗糙集数据清洗条件属性决策属性CustomerNo.PQRSYYNNYYYYYYYYNYNNNNYNNYYYNNYYNYYY
根据粗糙集理论,论域,条件属性集,决策属性集。粗糙集数据清洗一、利用正域约简
计算正域:粗糙集数据清洗二、利用区分矩阵约简
粗糙集数据挖掘
因此,的约简为{Q,R}。经过粗糙集数据清洗得到下表条件属性决策属性CustomerNo.QRSYNNYYYYYYYNNNYNYYYNYYYYY粗糙集规则提取
定义决策规则为:
其中,为对等价类的描述。
定义规则的确定性因子显然当时,是确定的;当时,是不确定的粗糙集规则提取
提取决策规则可以得到以下确定性规则:(购买Q)且(不购买R)——(不购买S)(购买Q)且(购买R)——(购买S)
不确定规则为:(不购买Q)且(购买R)——(购买S)(不购买Q)且(购买R)——(不购买S)
粗糙集经过挖掘可得到大量的模式和规则,需对规则作进一步的筛选、合并。上述例子经合并后最终得到两条确定性规则。
对于不确定规则,可作参考或直接删除均可。
基于上述规则,可作
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宿州学院《新媒体策划与营销》2024-2025学年第二学期期末试卷
- 山西卫生健康职业学院《材料专业英语》2024-2025学年第二学期期末试卷
- 2026年山东省环保发展集团有限公司招聘(27人)考试参考试题及答案解析
- 2026安徽黄山市九龙建设投资有限公司及下属子公司招聘6人笔试模拟试题及答案解析
- 2026四川自贡东部新城第一实验幼儿园招聘1人笔试备考题库及答案解析
- 2026上海复旦大学智能机器人与先进制造创新学院招聘行政秘书岗位1名考试参考题库及答案解析
- 山东省日照市2025年中考生物试题附答案
- 2026四川泸州市建设工程质量保障中心招聘编外人员1人笔试备考题库及答案解析
- 小部门内部管理制度汇编
- 公司保密制度内部规定
- 2026年春季开学教职工会议校长讲话:以改革之剑破局以实干之力育人
- 2026年部编本三年级下册《23.暴风雨来临之前》教案设计
- 2025版《煤矿安全规程》解读
- 入户申请审批表(正反面,可直接打印)
- 山西美锦华盛化工新材料有限公司化工新材料生产项目环评报告
- 体外放射分析-4 体外分析的质量控制教材课件
- GB/T 37208-2018非金属纸基湿式摩擦材料
- GB/T 15874-1995集群移动通信系统设备通用规范
- GB/T 13471-2008节电技术经济效益计算与评价方法
- 宁夏回族自治区矿产资源探矿权整合实施方案
- 《资源与环境概论》课程教学大纲
评论
0/150
提交评论