《数据仓库与数据挖掘》课件-第6章:数据挖掘基础_第1页
《数据仓库与数据挖掘》课件-第6章:数据挖掘基础_第2页
《数据仓库与数据挖掘》课件-第6章:数据挖掘基础_第3页
《数据仓库与数据挖掘》课件-第6章:数据挖掘基础_第4页
《数据仓库与数据挖掘》课件-第6章:数据挖掘基础_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据分析实务

第1章 数据仓库与数据挖掘概述

第六章数据挖掘基础6.1 数据挖掘任务 6.2 数据挖掘实施 6.3 知识表示方法

6.1数据挖掘任务数据挖掘的任务是从数据中发现模式预测型模式描述型模式凡是胎生的动物都是哺乳类动物凡是石邮院电子商务专业的学生都要学大数据分析70%的表面被水覆盖,30%是土地银河系中包含太阳系6.1数据挖掘任务数据挖掘的任务具体可分为6.2数据挖掘的实施数据挖掘基本过程6.2数据挖掘的实施数据挖掘实施难点6.3知识表示方法数据挖掘的主要目标是为了找到有价值的知识。知识找出来后如何用适当的模式表示出来,如何存储在计算机中使得后续能够更好的利用这些知识,是人工智能研究的一个重要方面,这就是所谓的知识表示问题。知识表示是对知识的一种描述,或者说是一组约定,是一种计算机可以接受的用于描述知识的数据结构,对知识进行表示就是把知识表示成便于计算机存储和利用的某种数据结构。6.3知识表示方法知识表示方法主要有:6.3知识表示方法产生式表示方法产生式表示方法主要用于表示因果关系的知识其表示的含义是ifPthenQ,也就是如果出现P,那么会有结果Q或执行Q所规定的操作6.3知识表示方法产生式表示方法产生式规则不但可以表示确定性知识,也可以表示不确定性知识6.3知识表示方法产生式表示方法的特点6.3知识表示方法产生式系统设计一套合理的产生式规则,并使得这些规则可以互相配合,协同工作。也就是,一个产生式规则的结论可以作为另一个产生式规则的前件,依次推理最终求得问题的解,这样的系统成为产生式系统。一个典型的产生式系统由规则库、综合数据库、推理机三个基本部件构成。6.3知识表示方法产生式系统:规则库规则库用于描述相应领域内知识的产生式集合称为规则库。规则库是产生式系统进行问题求解的基础,其中的知识是否完整、一致,表达是否准确,对知识的组织是否合理等,不仅直接影响系统的性能,而且影响系统的运行效率,在建立规则库时应注意以下问题:知识是否能有效表达是否能对知识进行有效的组织和管理6.3知识表示方法产生式系统:规则库R1:if动物有毛发then动物是哺乳动物R2:if动物有奶then动物是哺乳动物R3:if动物有羽毛then动物是鸟R4:if动物会飞and会生蛋then动物是鸟R5:if动物吃肉then动物是食肉动物R6:if动物有犀利牙齿and有爪and眼向前方then动物是食肉动物R7:if动物是哺乳动物and有蹄then动物是有蹄类动物R8:if动物是哺乳动物and反刍then动物是有蹄类动物6.3知识表示方法R9:if动物是哺乳动物and是食肉动物and有黄褐色and有暗斑点then动物是豹R10:if动物是哺乳动物and是食肉动物and有黄褐色and有黑色条纹then动物是虎R11:if动物是有蹄类动物and有长脖子and有长腿and有暗斑点then动物是长颈鹿R12:if动物是有蹄类动物and有黑色条纹then动物是斑马R13:if动物是鸟and不会飞and有长脖子and有长腿and有黑白二色then动物是鸵鸟R14:if动物是鸟and不会飞and会游泳and有黑白二色then动物是企鹅R15:if动物是鸟and善飞then动物是信天翁6.3知识表示方法产生式系统:规则库该系统是用来识别7种动物的,但并不是简单地只设计7条规则分别直接用于识别7种动物。规则设计的基本思想是:首先把动物划分为若干类,如“哺乳动物”、“鸟”、“食肉动物”、“有蹄类动物”等,根据“类”的识别特征建立若干条规则,如规则R1~R8;然后对各类的各个动物根据其个性的识别特征建立各自相应的规则,如规则R9~R156.3知识表示方法产生式系统:规则库对规则库中的知识进行适当的组织,采用合理的结构形式,可避免访问那些与当前问题求解无关的知识,从而提高问题求解的效率。根据“哺乳动物”和“鸟”这两类动物的识别规则将15条规则分为两个子集:{R1、R2、R5、R6、R7、R8、R9、R10、R11、R12}{R3、R4、R13、R14、R15}6.3知识表示方法产生式系统:综合数据库综合数据库用于存放问题求解过程中各种当前信息,例如,问题的初始事实、原始证据、推理中得到的中间结论,如上例中的“动物是哺乳动物”、“动物是鸟”等。当规则库中某一条产生式的前提可与综合数据库中的某些已知事实匹配时,该产生式规则就被激活,并把用它推出的结论放入综合数据库中,作为其后推理的已知事实。可见,综合数据库的内容随着推理的进行是在不断动态变化的。6.3知识表示方法产生式系统:推理机推理机又可称为控制机构,由一组程序组成,实现对问题的推理求解按某种策略,把规则(规则库)与事实(综合数据库)匹配匹配出多条规则,推理机需进行选择把得到的结论添加到综合数据库中对于不确定知识,执行规则时需检测其不确定性6.3知识表示方法产生式系统:推理机问题的求解过程是一个不断从规则库中选取可用规则与综合数据库中的已知事实进行匹配的过程,规则的每一次成功匹配与执行都使得综合数据库增加了新的事实,并向着问题的解前进了一步,这个过程称为推理。6.3知识表示方法6.3知识表示方法6.3知识表示方法6.3知识表示方法6.3知识表示方法6.3知识表示方法6.3知识表示方法分别建立熊猫和鲸鱼的规则库If动物有奶then动物是哺乳动物If动物是哺乳动物and动物有黑白相间斑点then动物是熊猫If动物是哺乳动物and动物会游泳then动物是鲸鱼6.3知识表示方法框架知识表示框架是描述对象(一个事物、一个事件或一个概念)属性的一种数据结构,在框架表示法中,框架被看成是知识表示的基本单位。不同的框架之间可以通过属性之间关系建立联系,从而构成一个框架网络,充分表达相关对象间的各种关系。6.3知识表示方法框架知识表示一个框架由若干个被称为“槽”的结构组成,每一个槽又可根据实际需要分为若干个“侧面”。一个槽用于描述对象的某一方面的属性,一个侧面用于描述相应属性的一个方面。槽和侧面所具有的属性值分别称为槽值和侧面值。在一个用框架表示知识的系统中都含有多个框架,需要给它们赋予不同的框架名。同样,对一个框架内的不同槽和不同侧面也需要分别赋予不同的槽名和侧面名。6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示继承6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法框架知识表示6.3知识表示方法一阶谓词逻辑表示谓词逻辑是一种形式语言,也是目前能够表达人类思维活动的一种最精确的语言,它与人类的自然语言比较接近,可以方便地存储到计算机中并被计算机处理。因此成为最早应用于人工智能中表示知识的一种逻辑表示方法。6.3知识表示方法一阶谓词逻辑表示谓词逻辑适合于表示事物的状态、属性、概念等事实性的知识,也可以用来表示事物间确定的因果关系,即规则。谓词公式:6.3知识表示方法一阶谓词逻辑表示6.3知识表示方法一阶谓词逻辑表示用谓词公式表示知识时,首先需要定义谓词,给出每个谓词的确切含义,然后用连词把有关谓词连接起来表示一个更复杂的含义。对谓词公式中的变元,根据知识表示的需要,把需要约束的变元用相应的量词予以约束。1.王林是计算机系的学生,但他不喜欢编程序。2.人人爱劳动。6.3知识表示方法一阶谓词逻辑表示COMPUTER(x) 表示x是计算机系的学生LIKE(x,y) 表示x喜欢yLOVE(x,y) 表示x爱yMAN(x) 表示x是人6.3知识表示方法一阶谓词逻辑表示谓词逻辑是一种接近于自然语言的形式语言,人们比较容易接受,用它表示知识比较容易理解。谓词逻辑是二值逻辑,谓词公式的真值只有“真”与“假”,因此可用它表示精确知识。谓词逻辑表示的知识可以比较容易地转换为计算机易于存储与处理的内部表示模式,便于实现对知识的增加、删除与修改。6.3知识表示方法一阶谓词逻辑表示谓词逻辑表示法的弊端一阶谓词逻辑(1)所有正数均可开平方(2)有些人是大学生(3)猫必捕鼠(4)没有最大的自然数(1)所有正数均可开平方设P(x):x是正数;

Q(x):x可开平方则命题可表示为:

x(P(x)

Q(x))一阶谓词逻辑练习(2)有些人是大学生设R(x):x是人,

S(x):x是大学生,则命题可表示为:

x(R(x)∧S(x))(3)猫必捕鼠设C(x):“x是猫”,

R(y):“y是鼠”,

A(x,y):“

x捕y”,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论