




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第4章数据挖掘发现知识的类型Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL41广义知识4.2关联知识43分类知识44预测型知识45偏差型知识Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL41广义知识■从数据分析角度出发,数据挖掘可以分为两种类型描述型数据挖掘以简洁概述的方式表达数据中的存在一些有意义的性质■预测型数据挖掘—通过对所提供数据集应用特定方法分析所获得的一个或一组数据模型并将该模型用于预测未来新数据的有关性质。Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL41广义知识■数据库通常包含了大量细节性数据,然而用户却常常想要得到能以简洁描述性方式所提供的概要性总结(summarized这样的数据摘要能够提供一类数据的整体情况描述;或与其它类别数据相比较的有关情况的整体描述。■此外用户通常希望能轻松灵活地获得从不同角度和分析细度对数据所进行的描述■描述型数据挖掘又称为概念描述,它是数据挖掘中的一个重要组成部分。下面就将主要介绍如何有效地进行定性归纳以获得概念描述的有关内容234概念上的层次Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL第4章数据挖掘发现知识的类型411广义知识的概念定义广义知识是指类别特征的概括性描述知识,也称为概念描述。它反映同类事物共同性质,是对数据的概括、精炼和抽象■广义知识是对大量薮据的归纳、概括,提炼出带有普遍性的、概括性的描述统计知识。Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL第4章数据挖掘发现知识的类型■数据库中数据及对象在基本概念层次包含了许多细节性的数据信息在商场销售数据库的商品信息数据中,就包含了许多诸如:商品编号、商品名称、商品品牌等低层次信息,对这类大量的数据进行更高层次抽象以提供一个概要性描述是十分重要的。例如:对春节所销售商品情况进行概要描述,对于市场和销售主管来讲显然是十分重要的■最简单的描述型数据(广义知识)挖掘就是定性归纳。定性归纳常常也称为概念描述。这里概念描述涉及一组(同类别)的对象,诸如:商店常客等。■概念描述生成对数据的定性描述和对比定性描述定性概念描述提供了一个有关数据整体的简洁清晰描述(概念内涵)对比定性概念描述提供了基于多组(不同类别)数据的对比概念描述(概念外延)6Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL第4章数据挖掘发现知识的类型■给定存储在数据库中的大量数据,能够用简洁清晰的高层次抽象泛化名称来描述相应的定性概念是非常重要的,这样用户就可以利用基于多层次数据抽象的功能对数据中所存在的一般性规律进行探索■例如在商场数据库中,销售主管不用对每个顾客的购买记录进行检查,而只需要对更高抽象层次的数据进行研究即可。如:对按地理位置进行划分的顾客购买总额、每组顾客的购买频率以及顾客收入情况进行更高层次的研究分析。这种多维多层次的数据泛化分析与数据仓库中的多维数据分析,Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL第4章数据挖掘发现知识的类型412广义知识的发现方法要顺利完成概要描述任务,就需要一个十分重要的数据挖掘功能:数据泛化■数据泛化是一个从相对低层概念到更高层概念且对数据库中与任务相关的大量数据进行抽象概述的一个分析过程。对大量数据进行有效灵活的概述方法主要有两种■1.数据立方体2.面向属性的规约Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL1.数据立方体■数据立方的维是通过一系列能够形成层次的属性或网格,例如:日期(date)可以包含属性天、周、月、季和年,这些属性构成了维的网格。■利用数据立方方法(又称为OLAP方法)进行数据泛化,就是在数据立方中存放着预先对部分或所有维(属性)的聚合计算结果通常数据立方中的数据需要经过费时复杂的运算操作(如:sum、count、average),不同的抽象层次均需要进行这类运算,将这些运算与操作结果存放在这些数据立方中,最终所获得的这些数据立方可用于决策支持、知识发现,或其它许多应用。Valadononry.chAsposeslidesforNET4odientPEvaluationonly.CreatedwithAsposeSlidesforNET4.0dientProfilo71Copyright2019-2019AsposePtyL1.数据立方体■对多维数据立方的数据泛化和数据细化工作,可以通过rollup或drilldown操作实现上卷(roll-up):汇总数据消减数据立方中的维数(维规约),或将属性值泛化为更高层次的概念(概念分层向上攀升)下钻(dri-down):上卷的逆操作由不太详细的数据到更详细的数据,可以通过沿维的概念分层向下或引入新的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年演讲与口才考试试题及答案
- 2025年循环经济与环境保护基础知识考试卷及答案
- 2025年融资与投资管理考试题及答案
- 2025年民法学考试试题及答案
- 2025年经济学学位论文答辩试题及答案
- 2025年环境工程专业考核试卷及答案
- 2025年广告设计师考试模拟题及答案
- 我的同学700字10篇
- 中考英语满分创建和谐校园14篇范文
- 人文素养启蒙课程-初中自然历史研究教案
- 校园监控安防系统
- 2025年初中语文名著阅读《林海雪原》知识点总结及练习
- 直击重点:2024年演出经纪人资格证试题及答案
- T-GSEE 14-2024 额定电压6kV( Um=7.2kV)到35kV( Um=40.5kV)交联聚乙烯绝缘电力电缆熔接头
- 气管插管术的配合与护理课件
- RPA技术在国有企业数智化转型中的应用研究
- 腰池腹腔分流
- 宁夏水利建筑工程预算定额
- 2025年广东广州市越秀区建设街招聘劳动保障监察协管员1人历年高频重点提升(共500题)附带答案详解
- 《电梯安全法规解读》课件
- 2025年重庆环卫集团有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论