(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf_第1页
(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf_第2页
(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf_第3页
(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf_第4页
(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机软件与理论专业论文)midss中数据挖掘agent的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文作为“基于m a s 的智能决策支持系统”( m a s b a s e di n t e l l i g e n td e c i s i o n s u p p o r ts y s t e m ,m d s s ) 研究的一部分,系统地研究了m d s s 中数据挖掘a g e n t 的研究与实现,本文研究的目的是从来自于企业商务数据库的大量信息中挖掘获 取更有价值的商务决策知识,如何发现这些知识建立相应的数据挖掘模型并将其 用于决策支持是本文的研究重点。本文分以下几部分内容: 一、本文用第一章和第二章介绍了系统的应用背景,相关技术知识和一些典 型的数据挖掘应用,说明了开发电信商务智能决策系统的必要性和紧迫性。同时 介绍了m d s s 的系统体系结构,建立了系统的知识库模型和多a g e n t 通信模型, 实现了部分数据挖掘算法,并分析了事务存储区、通信模块和感知模块的设计。 二、在第三章、第四章和第五章中,结合电信领域中客户流失分析的应用阐 述了本文的研究内容,侧重点位于以下几个方面: 1 、预处理a g e n t 的设计与分析,主要采用了管道过滤机制完成数据预处理。 2 、数据挖掘a g e n t 的设计与分析,其中主要采用了策略设计模式完成数据 挖掘的算法选择和处理。 3 、通过一个客户流失分析的应用案例介绍了m i d s s 的基本功能,说明了企 业决策者如何利用数据挖掘技术得到数据挖掘模型,再经由评估系统得 到知识分析模型,然后利用知识分析模型解决具体的商务问题。 三、最后提出了本系统中有待改善的地方,展望了系统的应用前景。 关键字:决策支持,多代理,数据挖掘 a b s t r a c t a sap a no ft h er e s e a r c ho f ”m u l t i - a g e n ts y s t e mb a s e di n t e l l i g e n td e c i s i o n s u p p o ns y s t e m ”( m i d s s ) ,t h ep a p e re n g a g e d i nt h er e s e a r c hw o r ko fd a t am i n i n g a g e n ti nm i d s s ,t h em a i no b j e c to ft h i sp a p e r i st of i n do u tm em e t h o dt oe x t r a c t d e c i s i o n s u p p o r tk n o w l e d g ef r o me n t e r p r i s e i n f o r m a t i o n s y s t e m a n du s ei tf o r d e c i s i o ns u p p o r t t h ep a p e rc o n s i s t so ft h ef b u o w i n g p a r t s : i i nt h ef i r s tc h a p t e ra n dt h es e c o n dc h a p t e r ,i ti si n t m d u c e dt h a tt h ec u r r e n c y b a c k g r 叭l n da n dt h e c o n e l a t i o nt e c h n o l o g yo fm e s y s t e m ,a n dt h et y p i c a lt e l e c o m a p p l i c a t i o no fd m ,a n da f t e r w a r de x p l a i nt h en e c e s s a r ya n dp r e s s u r et od e v e l o pa b u s i n e s si n t e l l i g e n c es u p p o n e ds y s t e mo ft e l e c o m s f u n h e 肌o r e ,w ec o n s t m c tt h e s o f t w a i a r c h i t e c t u r eo f m i d s s , d e s i g n t h e k n o w l e d g e m o d e la n dt h e c o m m u n i c a t i o nm o d e lo f m a g e n ts y s t e m a n d a n a l y z e t h e i m p l e m e n t o ft h e c o m m u n i c a t i o nm o d u l ea n dt h ep e r c e p t i o nm o d u l e i i i nt h et h i r dc h a p t e ra n dt h ef o r t hc h a p t e r ,t h er e s e a r c ho ft h ep a p e rw i ub e d i s c u s s e dw i t ha n a p p l i c a t i o no fa n a l y z i n gt h ec u s t o m e r sw i t hh i g hp r o b a b i l i t yt o l e a v et h ec o m p a n y ,c o n t a i n i n gt h ef o l l o w i n g k e y s t o n e : i w er e c o m m e n dt h a tt h e d e s i g n o f d a t a p r e p m c e s sa g e n ta d o p t e d t h e m e c h a n i s mo f p i p ef i l t e rt op r e p r o c e s st h ed a t a i i ni s e x p o u n d e dt h a tt h ed e s i g no ft h ed m a g e n tw h i c ha d o p tt h es t r a t e g y p a t t e mi nm ed e s i g np a t t e m t oc h o o s em e d m a 1 9 0 n m m s a n dd a t am i n i n 兽 i i i u s i n gs p e c i f i ce x a m p l e s f o r t e l e c o m s ,t h ep r o c e s so fc h u mp r e d i c t i o n d e s c b e di sb a s e do nt h em i d s st o h e l p b u s i n e s sd e c i s i o nm a k e r st o u n d e r s t a n dt h es o r t so fb u s i n e s si s s u e st h md a t am i n i n gc a na d d r c s s ,h o wt o i n t e r p r e tt h em i n i n gr e s u l t sa n dh o w t od e p l o yt h e mi nt h eb u s i n e s s i i i a tl a s t ,i ti s s u g g e s t e dt h a ti t sd e f i c i e n c ya 1 1 du n d e rc o n c t i o n ,a n db r i n g f o r w a r das c h e m eo ft h ea p p l i c a t i o no fm i d s si nt h et e l e c o m s d o m a i n k e yw o r d s :d s s ,m u l t i a g e n t ,d a t am i n i n g 南京邮电学院坝士学位论文 第一章概述 第一章概述 第一节研究背景 近十几年来,人们利用信息技术进行生产和收集数据的能力大幅度提高,千 万个数据库被用于商业管理、政府办公、科学研究和工程开发等,并且这一势头 人将持续发展下去。虽然人们即将被数据淹没,却饥渴于知识的挑战的险境,于 是,数据挖掘和知识发现技术应运而生,并得以蓬勃发展,越来越显示出强大的 生命力。数据挖掘技术是目前数据仓库领域最强大的数据分析手段。它的分析方 法是利用已知的数据通过建立数学模型的方法找出隐含的商务规则,在很多的行 业已经具有成功的应用。 目前,国内的电信企业已建有大量成熟的数据库业务系统,如管理信息系统 ( m i s ) 、网管系统等、财务系统、计费系统、1 1 2 障碍管理系统、缴费销账系统 等,并产生了大量的业务处理数据。这些系统积累的大量的原始数据和各种业务 处理数据,真实的反映了电信企业各种业务环境的经济动态。然而,这些宝贵的 数据并没有得到企业充分的利用,没有为企业决策提供很好的支持。如果对这些 数据进行重组整合,就能充分这些体现宝贵数据信息的真正价值。电信行业正逐 步利用已知的数据通过建立数学模型的方法找出隐含的业务规则。 在电信商务智能的应用领域主要有客户关系管理,客户欺诈分析,客户流失 分析,客户消费模式分析,市场推广分析等。结合各种数据挖掘技术,高度自动 化地分析企业的原有数据,做出归纳性推理,从中挖掘出潜在的模式,构建商务 智能知识库,然后根据市场反馈信息和客户回头率及流失率分析,评估和调整挖 掘模型,不断完善整个电信商务智能系统。 第二节m s s 的介绍 进入8 0 年代后,人工智能技术尤其是专家系统( e x p e r ts y s t e m s ,e s ) 的蓬勃发 展为d s s 的发展注入了新的血液,使d s s 焕发了新的生机。如何将d s s 同人工 智能技术相结合,以解决不良结构决策问题,即构成智能决策支持系统( i n t e l l i g e n t d e c i s i o n s u p p o r ts y s t e m s ,d s s ) 或称之为基于知识的决策支持系统 ( ( k n o w l e d g e _ b a s e d d e c i s i o ns u p p o n s y s t e m ,k b d s s ) ,便成为d s s 的重要发展趋 势,也是当前引起国内外专家学者广为关注的开拓性工作。 d s s 这一概念最早由美国学者r h b o n c z e k 等人于8 0 年代初期提出,它是 指传统d s s 同a i 相集成的系统,即有d s s + a i = d s s 。s s 主要具有以下特 征: 南京邮电学院顾。i :学位论文 第一章概述 具有友好的人机交互接口,为决策支持提供必须的数据、模型、方法和 知识等,并允许用户干预决策过程及对用户提出的问题做出回答。 将a i 技术、运筹学方法及决策手段有机地融合起来,实现知识推理和数 值运算相结合,提供较传统d s s 更强有力的决策支持能力。 综合运用专家系统和知识工程的思想方法,对整个d s s 实行统一调度、 管理和控制。 充分利用己有的人类专家的知识、经验和判断以及决策案例,辅助决策 者设计重大决策的备选方案和相应的实施途径。 运用足够的知识、推理和综合评价方法,对一系列备选方案进行综合评 价,并向决策者提供某一决策方案且给出实施策略和路线。 强调灵活性和应变性,以适应决策环境及其决策者的决策方法和条件的 变化。 能够启发和引导决策者进行难度较大或根本无从下手的问题的决策求 解。 第三节a g e n t 技术介绍 一个a g e n t 的内部行为表现为:通信管理机接受外部环境的信息( 来自其他 a g e n t 的消息与请求) ,由推理控制机根据这些消息( m e s s a g e ) 、请求( r e q u e s t ) 、 a g e n t 的状态( s t a t u s ) ,进行分析、理解、推理后执行相关的动作( a c t i o n ) 形成 a g e n t 的新状态,由此可能引起进一步的a g e n t 推理活动。a g e n t 的活动行为不 是被动的,而是主动进行的,a g e n t 的推理控制机每隔一个时间片都有检测通信 状态和自身的状态,完成一次推理活动。 多a g e n t 系统( m a s :m u l t i a g e n ts y s t e m ) 两个方面。d p s 主要研究如何分 解某特定问题,并将其分配到一组拥有分布知识并相互协作的结点上:m a s 是 指一些自主的a g e n t 通过协作共同完成某些任务的计算系统,它侧重研究如何协 调一组a g e n t 的行为,即研究这组a g e n t 为了联合采取行动或求解问题时,如何 协调各自的知识、目标、策略和计划等。目前,m a s 主要研究多a g e n t 理论、 通信和交互技术、体系结构和组织形式、面向a g e n t 的程序设计方法和语音以及 多a g e n t 间的协调、协作和协商等。 - 典型软件a g e n t 的体系结构包含以下几个基本模块: 通信接口用来与其他软件a g e n t 或应用进行通信。 感知模块对输入信息进行过滤与分类。 推理模块根据a g e n t 自身知识对信息进行推理。 决策模块对推理结果进行评价和决策。 南京邮电学院颂卜学位论文 第一章概述 计划模块根据决策制订行动计划。 执行模块按照计划执行动作。 知识库对推理、决策、计划等提供支持。 第四节知识管理与知识模型 知识是在企业内成功进行商业活动的首要条件,它反过来为产品和服务的接 受者创造价值。知识管理是为了促进人们共享知识,增加人们之间的联系。有人 认为知识管理是平衡软和硬两方面的轻量活动,其实它具有促进作用,帮助产生 知识动力,而不是按照固定的结构最后产生信息过载。本系统的知识模型包括三 部分( 见图1 1 ) ,每一部分包含一组相关的知识结构。我们将每一部分称为知识 范畴。 图ll 知识模型 第一个知识范畴称为领域知识。这个范畴详细说明了特定领域知识和在一个 应用中我们所讨论的信息类型。例如,一个电信用户反欺诈系统应用的领域知识 将会包括客户通信量、客户的业务营收情况、客户抱怨项目次数、业务项目次数 等数据以及它们之间关系的定义。 知识模型的第二个范畴包含任务知识。任务知识描述一个应用所要达到的目 标是什么以及如何通过将任务分解成子任务来实现这些目标。例如,一个电信用 户欺诈分析应用可以将d i a g n o s i s ( 诊断) 作为其高层任务,并且认为这个诊 断可以通过一连串重复执行的“假设”和“评估”过程来实现。 知识模型的第三个范畴是推理知识。推理知识描述了使用领域知识的基本推 理步骤。最好是将这些推理看作推理机的构件。在电信用户欺诈分析应用中的推 理是将客户通信量、客户的业务营收情况、客户抱怨项目次数、业务项目次数等 一些历史数据和欺诈的事实相联系,用于确定特定用户的具体的情况是欺诈的可 能性有多大。 第五节数据预处理技术概述 本系统采用了将抽取数据的基本信息配置进入知识库中,数据抽取部分可以 南京邮电学院坝i j 学位论文 第一章概述 根据知识库中的配置实现同步实时抽取和异步数据抽取;对于数据预处理的策略 也可以根据源数据逻辑复杂程度和实现复杂程度等因素的权衡加入知识库中配 置起来。使用知识库配置源数据信息使得系统获得了更多地灵活性和解决复杂问 题的能力。由此可见,大量历史数据是在数据仓库中存储的,少量的准实时数据 是由数据抽取部分获取的,统计、汇总数据和其它衍生数据,例如各种需要通过 计算才能确定的数据是由数据转换和数据离散化处理得到的。 数据清洗可以分为有监督和无监督两类。有监督过程是在领域专家的指导 下,分析收集的数据,去除明显错误的噪声数据和重复记录,填补缺值数据;无 监督过程使用样本数据训练算法,使其获得一定的经验,并在以后的处理过程中 自动采用这些经验完成数据清洗工作。本论文的数据清理主要包括噪声数据、 重复数据和缺值数据的有监督处理。 数据转换主要是找到数据的特征表示,用维变换或转换方式减少有效变量的 数目或找到数据的不变式,包括规格化、归纳、变换和投影等操作。数据转换是 将源数据变为目标数据的关键环节,它包括数据格式转,换数据类型转换、数据 汇总计算、数据拼接等等。 数据加载有两个部分,一是把合法数据文件装入临时表中,该装入过程没有 汇总部分:另外是把初次汇总表加载到临时汇总表,根据不同类型的数据,可能 会有二次汇总。当到临时汇总表的数据完毕以后,再把数据装入到数据仓库中。 本系统没有对数据加载编写专门的程序。 数据归约分三种:删除列( 属性归约) ,删除行( 记录归约) 和减少列中值 的数量。它们都是通过删除不必要的数据来保留原始数据的特性,以达到用最小 的测量和处理量获得最好的性能。本论文中使用了两种数据归约方法:基于粗糙 集的属性归约和基于归纳法的记录归约。 通过数据离散化,可以有效地减少数据表的大小,提高分类的准确性。本论 文的数据离散化主要包括等距离散化、等频离散化、最大熵法和动态概念分层。 数据采样的目的是减小数据挖掘a g e n t 所使用的数据样本空间,同时也要尽 量保证采样空间与源数据的特征分布相类似。本论文的数据采样主要包括随机采 样、分层采样、分类采样、聚类采样和窗口采样。 第六节数据挖掘技术与应用 1 6 1 数据挖掘技术的介绍 数据挖掘技术从一开始就是面向应用的。它不仅面向特定数据库的简单检索 查询调用,而且要对这些数据进行微观乃至宏观的统计、分析、综合和推理,以 指导实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来 堕塞l 堕! 堂堕堡! :兰竺堡苎j 竺! 塑查 的活动进行预测。这样,就把人们对数据的应用,从低层次的末端查询操作,提 高到为各级经营决策者提供决策支持。 在实际应用中,数据挖掘主要采用以下几种方法进行模式的发现:分类分析、 关联分析、时间序列分析和聚类分析等。 1 6 2 数据挖掘在电信商务智能中的典型应用 1 6 2 1 固定电话使用行为分析 对话费行为的分析还可以是通过对通话起止时间及通话时长分析可得到各 类用户的通话时段分布情况及日消费高峰、月消费高峰;长话的消费时间、消费 次数,及什么地方的用户消费能力较高,什么地方的用户消费能力偏低;以及话 费流失的分析。如我们可以获得某月的固话统计数据样本如下表1 1 :( 费用单位 为元) 编号长话使用费网话使用费 信息台使用费数据使用费客户信用度 11 0 0 - 2 0 0 1 0 0 2 0 0o 2 0o 2 0e x c c l l e n t 35 0 1 0 05 0 - 1 0 0 o 2 02 0 - 5 0 f a l r 4o 5 05 0 l o o 0 2 00 2 0f a l r 50 5 0o 一5 0 0 2 00 2 0b a d 表1 1 固话统计数据样本 根据关联分析我们可以挖掘出以下规则:( r n j 虬s u p = 3 0 ,m i n _ c o n f _ 5 0 ) 信用度为e x c e l l e n t 的客户长话使用费用比较高,一般大于l o o 元,月 ( s u p p o r t = 3 0 ,c o n f i d e n c e = l o o ) ; 信用度为f a i r 的客户网话使用费一般在5 0 1 0 0 元月之间 ( s u p p o r t = 4 0 ,c o n f i d e n c e = 7 5 ) ; 信用度为 f a i r的客户数据使用费大于2 0元月 ( s u p p o r t = 5 0 ,c o n f i d e n c e = 5 7 ) ; 信息台使用费已经普遍偏低为2 0 以下( s u p p o r t = 1 0 0 ,c o n f i d e n c e = l o o ) 。 1 6 2 2 欠费和动态防欺诈行为分析 欠费和动态防欺诈行为分析就是在总结各种骗费、欠费行为的内在规律后, 在数据仓库的基础上建立一套欺骗行为和欠费行为规则库,当用户的话费行为与 陔库中规则吻合或相似就发出告警。如我们可以对长话记录进行欺诈检测,得到 以下某月的样本统计数据( 见表l 2 ) : 编号通活时长增长率通活次数长话费用是否增k =客户信用度是否欺诈 11 0 0 h i g h f a i rn o 21 0 o h i 曲 e x c e l l e n cn o 30 1 0 h i g h n 0f 撕ry c s 南京邮电学院倾 学位论文 第一章概述 l 。l o 一2 0 m e d i u mn 0 f a l ry c s i s1 0 2 0 l o w y e sf 甜ry e s i 表1 2 欺诈样本统计数据 从而确定根节点为“通话时长增长率”,再次递归操作得到反欺诈决策树模 型如图1 2 : 厦欺诈决策树模裂 图l2 反欺诈决策树模型 根据决策树中的每条从根节点到叶节点所形成的一条路径,可以得到一条判 断客户是否欺诈的规则。 1 6 2 3 经营成本与收入分析 经营成本与收入分析就是对各种类型的经济活动进行成本核算,比较可能的 业务收入与各种费用之间的收支差额,分析经济活动的曲线,得到相应的改进措 施和办法。我们可以得到某年的营业前台受理信息统计如下表1 3 月份装机移帆拆机综合业务 i , 1 3 2 5 62 l1 2 5 l z5 64 8l l1 0 6 l 37 86 23 27 9 41 5 83 91 81 2 0 51 5 44 21 07 0 69 32 32 71 0 0 71 0 85 31 89 6 81 2 84 61 38 7 98 93 42 l6 9 1 01 1 25 l4 27 9 l l1 0 63 7 3 59 7 1 21 5 32 4 3 91 0 3 表1 3 经营成本与收入样本数据 南京邮电学院硕卜学位论文 第一章概述 以装机为例,采用序列模式技术的趋势分析法,利用3 阶移动平均统计,减 少数据的波动性,再利用加权处理除去月份内无规律的变化,只留下月份之间的 变化规律:( 见图1 3 ) 图1 3 经营成本与收入趋势分析图 由上图分析业务主管可以预测来年的装机收入是1 1 6 部月,从而可以预测 来年的装机总收入:同理可以分别预测移机、拆机和综合业务的收入:“部月, 2 4 部月,9 4 个月;同样可以根据蓝线的数据来指导预测来年各个月的收入。 南京邮电学院硕j :学位论义 第一二章系统体系结构 第二章系统体系结构 2 1 1m i d s s 总体构架 第一节总体构架 例21m i d s s 总体结构图 如图2 1 所示,本系统是基于m u l t i a g e n t 的分布式结构,主要由七个主要部 分组成:人机交互a g e n t 、数据预处理a g e n t 、数据挖掘a g e n t 、w 曲挖掘a g e n t 、 知识评价a g e n t 、通信服务器以及系统知识库。各部分的功能描述如下: 人机交互a g e n t :在与使用者不断交互的过程中积累交互经验,熟悉用户的 使用习惯和动态了解用户的兴趣,建立用户模型。为应用系统的使用者提供更加 友好和自然的交互方式,支持和提供一种主动的协助。 数据预处理a g e n t :用于完成从企业分布在各个子系统中的业务数据源中抽 取数据,对数据进行清洗、转换、离散化和将数据加载到数据仓库中,同时为数 据挖掘a g e n t 及其他a g e n t 提供样本数据。 数据挖掘a g e n t :对指定任务和特定样本数据集的进行数据挖掘并产生相应 的数据挖掘模型。其中主要实现了分类和关联算法,可以完成分类、预测、关联 分析、分配、计划等类型的挖掘任务。 w 曲挖掘a g e n t :用于完成w 曲挖掘功能,主要实现w e b 文本的分类、摘要、 利用w e b 文档进行趋势预测以及基于w 曲的数据抽取等功能。 知识评估a g e n t ;对数据挖掘a g e n t 建立的数据挖掘模型以及出此得出的规 则和知识进行评价,并利用评价得出的优质知识分析模型满足用户的认知和决策 南京| | | | j l 乜学院硕士学位论文 第二章系统体系结构 需求。 通信服务器:用于实现系统中各a g e n t 之间的通信。a g e n t 之间的通信消息 通过通信服务器进行广播和转发。 系统知识库:系统知识库用于存储各a g e n t 公用的知识库,实现新加入a g e n t 的初始化学习功能和系统中各a g e n t 的知识共享,各a g e n t 通过自身的知识库代 理实现本地知识库与系统知识库之间的同步与更新。 2 1 2 本系统的基本特征 自制性( a u t o n o m y ) :数据挖掘a g e n t 是一个独立的计算实体,具有不同程度 的自制能力。它能在非事先规划、动态的环境中解决实际问题。在没有用户参与 的情况下,独立分析和分解用户的挖掘任务,发现和索取符合用户挖掘任务的控 制策略和推理模板。数据预处理a g e n t 可以完全代表具体某个企业运营管理系统 的变化。 主动性( a c t i v i t y ) :数据挖掘a g e n t 能够遵循承诺采取主动,表现面向目标的 行为。例如,它能够主动发现影响挖掘目标任务完成的不利因素,并向数据预处 理a g e n t 、w e b 挖掘a g e n t 、人机界面a g e n t 及知识库a g e n t 求助。进而能够在 i n t e m e t 上的漫游全网,为用户收集信息,并将信息用于数据挖掘。同时数据预 处理a g e n t 也会主动地向外界发送最新的数据通知消息。 反应性( r e a c t i v i t y ) :数据挖掘a g e n t 能感知外部环境,并对环境做出适当的 反应。如,通过与其他a g e n t 的交互,数据挖掘a g e n t 会适当的调整数据挖掘策 略。数据预处理a g e n t 通过监视具体应用系统的数据库或者其他运行情况,与它 们进行信息交互,及时的调整样本数据的采集和生成策略。 社会性( s o c i a la b i l i t y ) :数据挖掘a g e n t 具有一定的社会性,即它可能同代 表用户的人机界面a g e n t 、代理各种系统资源的知识库和知识评价a 譬e n t 、代理 w w w 外部资源w e b 挖掘a g e n t 或者其他a g e n t 进行交流。 智能性( i n t e l l l g e n c e ) :数据挖掘a g e n t 的智能性包括推理到自学习等一系列 的智能行为。它会根据用户既定的任务和目标,自我改善推理过程和参数选择, 并且根据专家以往的挖掘策略选择习惯,智能的调整算法选择标准和算法默认参 数。数据预处理a g e n t 会根据用户既定的任务和目标,自我改善预处理过程,并 且根据专家以往的预处理策略选择习惯,智能的调整处理策略选择标准和默认方 式。 合作性( c o l l a b o r a t i o n ) :实际上可以认为数据挖掘a g e n t 是更高一级的代理, 它是由多个内部模块和外部a g e n t 分工合作,共同完成单个a g e n t 无法完成的任 务。它的内部模块包括感知模块,控制模块、推理模块和数据挖掘模块,它们在 一起共同协作完成挖掘任务。 塑塞塑堂兰堕塑! 兰些堡茎一一兰三兰j 墅垄堕! ! ! 童塑 2 2 1 知识模型的定义 第二节知识库模型与实现 k n o w l e d g e m o d e l := k n o w l e d g e - m o d e lz m d w p d 占已,l o d 已z 一咒n ,h f d o m a i n k n o w l e d g e i n f e r e n c e - k n o w l e d g e t a s k h l o w l e d g e e n d k n o w l e d g e - m o d e l 【露蚪口谢# 始8 帆口如2 喂a m 】 2 2 2 领域知识的定义 d o m a i n k n o w l e d g e := d o m a i n - s c h e m a 幽,”n 讯j 乩d w z 已矗g e n 口,九已 【k e y w o r d s :“t e x r l d o m a i n s c h e m aik n o w l e d g e - b a s e + e n dd o m a i n - s c h 锄a 【d o 巩口f n 忌n d w l 8 d g 已一n d m e 】 d o m a i n s c h e m a :;d o m a i n s c h e m a 面m 以m s 曲已巩口n n m 已 【d o m a i n c o n s t m c t 】+ e n dd o m a j n - s c h e m a 【c 如,n 口f n - j c p ,咒“一n n ,n 已】 d o m a i n c o n s t r u c t := c o n c e p ti r e l a t i o ni n 1 1 e t y p eiv a l u e - t y p e c o n c e p t := c o n c e p tc d ”c p r 。n 以埘p d e s c r i p t i o n :“t e x t ” t a b l e - n a m e :“t e x t ”】 【s u b t y p e - o f :c o n c e p t 】 【h a s - p a r t s :h a s p a r t + 】 【p a r t - o f :c o n c e p t 】 【a t m b u t e s 】 e n d c o n c e p t c d n c 号p r 口,n p 】 h a s - p a r 【:= c o n c e p t 【r o l e :”t ex t ,】 c a r d i n a l i t y 】 a t t r i b u t e s := a t t r i b u t e s a t t n b u t e + e n da t t r i b u t e a t t r i b u t e := a t t r i b u t e 以f f 一6 “f 已n 以, e t y p e - r a n g e 】 【d b c o l u m n - n a m e :1 色x t ”】 1 0 - 塑塞坚皇兰堕堡:! :兰堡笙壅 兰三童墨堕堡墨堕翌 【d e s c r l p t i o n :“7 i b x t ” e n da t t r i b u t e 【d 玎r f 6 “耙一n d m e t y p e 稍n g e := p r i m i t i v e ,t y p eip r i i n i t i v e m g el v a l u e - 啪ell s t r i n g ) 州m i t i v e t y p e := n u m b e rii n t e g e ri n a t u r a l i r e a i ii 啪g e l s t r i n g1 b o o l e a n i u n i v e r s a l l d a t e i t e x t p r n i l i t i v e r a n g e := n u m b e h a n g e ( n u m b e r m a x n u m b e r ) i i n t e g e r _ r a n g e ( i n t e g e r ,m a x - i n t e g e 0 v a l u e t y p e := v a l u e t y p ev 口f m e f ) p p n ,n 已 【t y p e :n o m i n a ll o r d i n a l v a l u e l i s t : v h l u e ) 【v a l u e s p e c i 矗c a t i o n :“1 b x r e n d v a i u e - t y p e v d z “p f ) p 已一n 日,打已 r u l e t y p e := r u l e _ t y p e 刚k 。r ) p p 。n d m 已 r u l e t y p e b o d yla b s t r a c t i o n t y p e - b o d y e x a m p l e s :“t e x t ” e n dr u l e t y p e ,。“f p - o p e - n d 棚已 r u l e t y p e - b o d y := a n t e c e d e n t :r e l a t i o nlc o n c e p t c a r d i n a l i t y c o n s e q u e n t :c o n c e p t c a r d i n a l i t y a b s t r a c t i o n t y p e - b o d y := u s ec o n c e p t f r o md o m a i n s c h e m a 【a b s t r a c t i o n a t b u t e :1 b x t ”】 r e l a t i o n := r e l a t i o n ,f 口r f d n n 口,扎e a r g u m e n t :a 唱u m e n t + r e l a t e :“t e x t ” e n dr e l a t i o n ,f a f f d n - n d ,扎已 a r g u m e n t := a r g u m e n t t y p e m l e :“t e x t ” 【c a r d i n a l i t y a 唱u m e n t - t y p e := c o n c e p ti r e l a t i o n k n o w l e d g e b a s e := k n o w l e d g e b a s e m d w k d 占p 一6 以s p 心口,n 口 u s e :k n o w l e d g e b a s e u s e , e x p r e s s i o n s :k n o w l e d g e b a s e e x p r e s s i o n 】 e n dk n o w l e d g e - b a s e d w z 已d 占已一6 口5 p - n 4 ,n p 】 k n o w l e d g e - b a s e u s e := r u l e t y p ef r o md o m a i n s c h e m a k n o w l e d g e - b a s e e x p r e s s i o n := e q u a t i o ni ”1 1 e x t ” 南京邮电学院硕上学位论文 第二章系统体系结构 2 2 3 任务知识的定义 t a s k k n o w l e d g e := t a s k - k n o w i e d g ef n j 七一舰d w k 妇p - h 口m g t a s k + e n d t a s k - k n o w l e d g e 【f n s 七一- 七n d w z 已巧音已- n 以m 已】 t a s k := t a s k 托础。门以m 已 t a s klt a s k d e f i n e e n d t a s k ( 把晒七一h d m 已 t a s k d e f i n e := t a s k i d :“t e x t ” d o m a i n - n a m e :d o m a i n k n o w l e d g e n 枷e 】 t a s k - d e s c r i p t i o n :“7 i e x t ”】 t a s k - t y p e :t a s k - t y p e g o a l :“t e 【o b j e c t - t y p e :o b j e c t t y p e 】 【u s e :t a s k - b a s e u s e , p r e c o n d i t i o n :”t 色x t ” 【a c t i o n - l i s t :a c t i o n + t a s k 。t y p e := c l a s s i f i c a t l 0 nia s s e s s n t i d i a g n o s i s p r e d i c t l 0 n i a s s i g n m e n t i p l a n n i n g i s c h e d u l i n g l d e s i g n i o b j e c t t y p e := e f f i c i e n c yiu r g e n c y 1w h o l e n e s s t a s k - b a s e u s e := m l e t y p ef r o md o m a i n s c h e m a a c t i o n := a c t i o nd c f f d n n ,h p a c t i o n i d :i n t e g e r a c t i o n - n a m e :”t b x t ” c l a s s n a m e :”t 色x t ” m e t h o d a m e :”t 色x t ” 【d e s c r i p t i o n :”t c x t ”】 e n d a c t i o n c f f d h n 口,扎已】 1 2 查塞! ! ! ! ! ! ! 兰堕堕主兰垡堡壅 塑三童墨竺竺! ! ! 塑 2 2 4 推理知识的定义 i n f 色r e n c e k n o w l e d g e := i n f e r e n c e k n o w l e d g ef ,毛,翟,已n c 已加d w k d g 已n 口,九p 【c o n t m l 一m e t h o d _ b a s e 【i n f e r e n c e - t e m p l a t e - b a s e 】 【d a t a m i n i n g a l g o r i t h m s - b a s e 】 p r e p m c e s s i n f e r e n c e t e m p l a t e _ b a s e 】 p r e p r o c e s s a l g o 打t h m s _ b a s e i n f e r e n c e m l e - b a s e 】 e n di n f e i 屯n c e k n o w l e d g e f h 序圮n c 已- 加o w f 已妇e n 以m e c o n t r 0 1 一m e t h o d b a s e 见第四章的4 2 3 小节 i n f e r e n c e t e m 口l a t e _ b a s e 见第四章的4 4 3 小节 d a t a m i n i n g a l g o r i t h m s b a s e 见第四章的4 3 3 小节 p r e p r o c e s s i n f e r e n c e t e m p l a t e 七a s e 见第三章的3 2 3 小节 p r e p m c e s s a l g o r i t h m s - b a s e 见第三章的3 3 3 小节 i n f e r e n c e m l e 七a s e := i n 托r e n c e - r u l e _ b a s e 坼旭n 卵- 抛s 已一m e m 已 u s e :i n f e r e n c e b a s e u s e e x p r e s s i o n s :i n f e r e n c e - b a s e e x p r c s s i o n 】 e n d i n f e r e n c e - r u i e - b a s e f ,奢,它n c 已一6 口s 已n d ,”p i n f e r e n c e _ b a s e u s e := n l l e t y p ef r o m d o m a i n s c h e m a i n f e i e n c e _ b a s e e x d r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论