基于本体的数据挖掘技术在商务智能中的应用_图文_第1页
基于本体的数据挖掘技术在商务智能中的应用_图文_第2页
基于本体的数据挖掘技术在商务智能中的应用_图文_第3页
基于本体的数据挖掘技术在商务智能中的应用_图文_第4页
基于本体的数据挖掘技术在商务智能中的应用_图文_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、收稿日期:2008-05-07基金项目:国家自然科学基金(70771077作者简介:宋远芳(1984-,女,硕士研究生,研究方向为本体与数据挖掘;导师:向阳,教授,研究方向为本体与自然语言理解。基于本体的数据挖掘技术在商务智能中的应用宋远芳(同济大学,上海201804摘要:在阐述了商务智能及数据挖掘的基础上,阐明了数据挖掘在商务智能中的重要意义。鉴于本体在数据挖掘中的应用,提出了一种基于本体的数据挖掘技术在商务智能中的应用,并从理论上阐述了该技术的可行性。在数据挖掘过程中引入本体,挖掘来的信息更加全面、准确,减少了可能由主观因素和人为失误所带来的不良后果。关键词:本体;数据挖掘;商务智能中图分

2、类号:TP311文献标识码:A 文章编号:1673-629X (200901-0184-03Application of Data Mining B ased on Ontology in Business IntelligenceSON G Yuan 2fang(Tongji University ,Shanghai 201804,China Abstract :Introduces the important meaning of data mining in business intelligence on the basis of introduction of business in

3、telligence and data mining.On consideration of the application of ontology in data mining ,puts forward a kind of technology of the application of the da 2ta mining in business intelligence based on ontology ,and elaborates the feasibility of this technology on theory.Introducing ontology to the pro

4、cess of data mining make the information dug out more overall and more accurate ,and decrease the ill consequences caused by sub 2jective factors and man -made misplay.K ey w ords :ontology ;data mining ;business intelligence0引言随着信息技术的不断推广应用,企业进入一个信息爆炸的时代,空前的信息量使得企业决策过程越来越复杂,严重影响了企业对市场的快速响应,因此,在这个全球

5、经济步入信息分析的时代,管理者需要将大量的、不完全的、有噪声的、模糊的、随机的实际应用数据转化成有用的商业信息,问题是如何才能从这些海量信息中发现其中存在的关系和规则,根据现有的数据预测未来的发展趋势,以辅助决策的智能化从而带来各种巨大的信息价值。传统的信息处理工具已经不能满足这一要求,管理者需要一种自动分析数据、自动发现和描述数据中隐含的商业发展趋势、对数据进行更高层次分析的方法1。1商务智能商务智能(Business Intelligence 1989年由G artherGroup 的Howard Dresner 首次提出,他将商务智能定义为一类由数据仓库(或数据集市、查询报表、数据分析、

6、数据挖掘、数据备份和恢复等部分组成,以帮助企业决策为目的的技术及其应用。它是一种汇集了来自机器学习、模式识别、数据库、统计学,以现代管理理论为指导,信息技术为支撑核心的集成系统;描述了一系列的概念和方法,通过应用基于事实的支持系统,来辅助商业决策的制定;是对数据仓库(DataWarehouse 、联机分析处理(OnLine Analytical Processing ,OLAP 、数据挖掘(DataMining 的综合运用。如图1所示。BI 技术提供帮助企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业各处,供决策者使用。商务智能的实现过程也就是

7、数据的存储与流动过程,智能商务系统的数据流程(如图2所示有以下几个部分:1数据获取:即源数据采集、筛选、整理、转换及存储。2数据管理:主要负责数据仓库的内部维护和管理,它涵盖了数据存储的组织、数据的维护、数据的分发、数据安全、数据提取、数据清晰、数据转换等,通过第19卷第1期2009年1月计算机技术与发展COMPU TER TECHNOLO GY AND DEV ELOPMEN TVol.19No.1Jan.2009数据管理实现数据的提取、净化、过滤及数据标准化等。3数据分析:这个阶段是实现商务智能系统真正智能化的阶段,主要利用联机分析处理和数据挖掘技术,对从数据仓库中提取的数据进行汇总和多维

8、分析,挖掘出数据背后隐藏的知识。4信息展现:是将以上数据分析所得到的决策知识展现在用户或者是企业管理者面前,支持管理和决策。2数据挖掘随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大( 呈超指 图1商务智能概念图2 商务智能系统技巧与处理数上升,数据理解和数据产生之间出现了越来越大的距离。数据挖掘(Da 2ta Mining 就是为解决这一矛盾而出现的一种新型数据分析技术。数据挖掘旨在能从大型数据库中提取隐藏的预测性信息。它能发掘数据间潜在的模式,找出企业经营者可能忽视的信息,以便以理解和观察的形式反映给用户,并为企业做出有预见性的、基于知识的决策参考意见2,3

9、。为了充分利用企业内外流动的大量商业数据,企业商业智能系统必须采用数据挖掘技术实现商务知识的发现。数据挖掘是从大量数据中挖掘出隐含的、未知的、用户可能感兴趣的和对决策有价值的知识和规则4。数据挖掘的任务需要利用聚类和分类作为基本分析手段,将大规模异种类别的数据按属性相似划分为子集,有利于减小数据处理的规模,简化分析和建造模型的复杂性5。如图3所示。图3数据挖掘在商务智能中的位置一般地,DM 的基本原理可用如下的处理过程加以说明8(如图4所示:1数据选择根据用户要求,从数据库中提取与DM 相关的数据,DM 将主要从这些数据中进行数据提取;2数据预处理与转换从与DM 相关的数据集合中除去明显错误的

10、数据和冗余的数据,进一步精减所选数据中的有用部分,并将数据转换成为有效形式,以使数据开采更有效;3数据挖掘(DM 根据任务的要求,选择合适的数据开采算法(包括选取合适的模型和参数,在数据库中寻求感兴趣的模型,并用一定的方法表达成某种易于理解的形式;4模式解释对发现的模式进行解释和评估,必要时需要返回前面处理中的某些步骤以反复提取;图4数据挖掘过程5知识评价将发现的知识以用户能理解的方式提供给用户,并试用之。但当前企业知识管理中存在着以下典型问题,严重影响了数据挖掘过程:1缺乏统一的知识模型,容易造成对同一知识的描述各不相同,影响用户对这一知识的理解和共享6。581第1期宋远芳:基于本体的数据挖

11、掘技术在商务智能中的应用2缺乏统一的知识存储形式,这就造成各个知识的存储形式各不相同,妨碍了人们对于知识的应用和交流,从而形成知识孤岛。3知识检索和查全率、查准率性,检索到的知识缺少语义和上下文支持。而本体(Ontology 的引入可以很好地解决这些问题。3本体本体(Ontology 最早是一个哲学的范畴,后来随着人工智能的发展,被人工智能界给予了新的定义7。本体是共享概念模型的形式化规范说明,本体的最大好处可能是明确了概念与概念之间的关系,有比较健全的约束,数据的集成以及软件的重用在本体的思想下将变得容易实现8。因此在网络知识管理中引入本体,使知识对象化,必定会给知识的集成和重用也带来益处,

12、而且通过将与之匹配的知识也对象化,可以使与之匹配的知识对象的关系和属性得到完整和清晰的描述;通过这些关系和属性,用户可以获取更适合自己需求的知识,从而避免在知识获取时大量无关信息的混入9。建立某个领域的本体,从这个本体为出发点去引导数据挖掘过程,从而完善数据挖掘的进程,提高获取知识的效率和质量。文中提出了一种基于本体的数据挖掘方法,如图5所示。首先,利用领域知识或背景知识,可在高层次上进行数据挖掘,产生高层次或多层次的规则,甚至是具有语义意义的规则,这些规则由高层次的抽象概念组成,其次,该系统能够自动进行数据挖掘,利用本体进行数据预处理及后处理 。图5基于本体的数据挖掘高层次概念的数据挖掘比低

13、层次数据挖掘有以下优点:首先,高层次规则能提供数据更清晰的概括,一般,数据挖掘系统以低层次形式的信息产生数据库的概要,高层次规则可认为是低层规则的概括。当可能会产生许多形式和内容相似的低层规则时,高层次规则提取就特别有用。其次,高层次抽取的规则数量远少于低层次的数据挖掘,假定使用相似的搜索策略。低层概念一般化成高层概念,从而得到较少的规则,相应的,内容和形式相似的低层次规则将被单个高层次规则所代替。最后,这些发现可在不同层次上泛化及对某个属性的抽象,多层次泛化的数据挖掘导致更有意义的结果,揭示更一般的概念10。4结束语许多数据挖掘方法仅仅在数据内容上产生规则,然而,背景知识的利用可以补充发现过

14、程,从而产生具有语义的规则。提出了基于本体概念的数据挖掘,能在多层次泛化基础上引导挖掘过程,并裁剪规则空间,能产生高层次,甚至是具有语义的规则上产生挖掘结果。数据挖掘中本体的应用具有很好的应用前景,今后的工作主要是不断完善本体库内容,建立可表示且可操作的、粒度足够细的本体知识库,实现智能的人机交互、计算机系统之间的互操作和计算机系统中的知识重用,其次是将知识库与数据库的无缝结合,使该系统能更有效地发现更有意义的信息7。参考文献:1格罗斯R.数据挖掘构筑企业竞争优势M .侯迪,宋擒豹译.西安:西安交通大学出版社,2001.2韩家炜,坎伯,范明.数据挖掘概念与技术M .北京:机械工业出版社,2001.3李水平.数据采掘技术回顾J .小型微型计算机系统,1998(4:74-81.4陈栋,徐洁磐.K DD 研究现状及发展J .计算机科学,1996(6:38-42.5中华论文网.知识发现与数据挖掘EB/OL .2007.http :/.6K antar

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论