数据挖掘研究现状及发展趋势_第1页
数据挖掘研究现状及发展趋势_第2页
数据挖掘研究现状及发展趋势_第3页
数据挖掘研究现状及发展趋势_第4页
数据挖掘研究现状及发展趋势_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、江西理工大学绍了数据挖掘的神经网络法、决策树法、遗传算 联规则法等概念及其各自的优缺点;详细总结了国内外数 ; Abstract :From the definition of data mining ,the paper introduced concepts and and pointed out the development trend of data mining. 积累 检索机制和统计学方法很难获得这些信息,迫切需要能自动 转化为有价值的信息,从而达到为决策服务的目的。在这种 术的研究成果,其应用非常广泛。只要是有分析价值的数 研究、工程诊断等。本文主要介绍数据挖掘的主要算法及 的

2、研究现状及研究热点进行了详细的总结,最后指出其发 12 数据挖掘算法完全的、模糊的、随机的实际应用数据中提 的、甚至是异构型的。发现知识的方法可以是数 。据 据处理数据转换数据据 据处理数据转换数据模式 2.1 神经网络法 测模型,可完成分类、聚类、特征挖掘等多种数据挖掘任务。神经网络的学习方法主要 表现在权值的修改上。其优点是具有抗干扰、非线性学习、联想记忆功能,对复杂情况 能得到精确的预测结果;缺点是不适合处理高维变量,不能观察中间的学习过程,具有 “黑箱”性,输出结果也难以解释;其次是需较长的学习时间。神经网络法主要应用于数 据挖据的聚类技术中。2.2 决策树法 述简单,易于理解,分类速

3、度快;缺点是很难基于多 长处理非数值型数据,而且特别适合大规模的数据处22.3 遗传算法 原理,具有隐含并行性、易 性;缺点是需要的参数太多,编码困难,一般计算量 。2.4 粗糙集法 现、数据意义的评估等问题。其优点是算法简单,不 的信息;缺点是难以直接处理连续的属性,须先进行 。2.5 模糊集法问题进行模糊评判、模糊决策、模糊模式识别和模糊 2.6 关联规则法 等人提出的 Apriori 算法。最小支持度和最小可信度是为了发现有意义的关联规则给定 33 数据挖掘研究现状 g KDD主要体现在 KDD 商业软 转向建立解决问题的整体系统,主要用户有保险公司、大 到目前已开发了一系列技术成熟、应

4、用价值前最主要的数据挖掘软件:(1)Knowledge Studio:由 Angoss 软件公司开发的能够灵活地导入外部模型和产生规 的用户图形界面与多种分析技术如神经网络、关联 软件首次引入了数据挖掘流概念,用户可以在同一4。 Simon Fraser 大学开发的 DBMiner 、HNC 公司开发的用于信用卡诈骗分析的 Database 成熟,目前正处于发展阶段。最 构造模糊系统辨识方法与模糊系统知识模型;构造智 理论模型与实现技术;利用概念进行文本挖掘。我国MSMiner算技术研究所智能信息处理重点实验室开发的多策略通用 DMiner开发的具有自主知识产权的数据挖掘系统。该 来展示分析结

5、果,实现了数据查询结果可视化、数据 iDMiner知识产权的数据挖掘平台。该平台大胆 业界标准,对该软件今后的发展有很大的促进作用,同时也为国内同类 且大多数研究项目都是由政府资助,主要的研究方向 方面以及实际应用。研究的产品尚未得到国际市场的 54 数据挖掘的研究热点及发展趋势就目前来看,数据挖掘的几个研究热点主要包括网站的数据挖掘 (Web Site Data Mining)、生物信息或基因 (Bioinformatics/Genomics)的数据挖掘及其文本的数据挖掘 别不大,但是其数据格式很大一部分来自于点击率,与传统的数据库格 基因的不同之处,进而对其加以改变,这就需要 困难,目前还

6、没有真正的具备分析功能的文本挖掘 均有不少成功的应用案例。为了提高系统的 6掘在处理特定应用问题时存在局限性,因此,目前的 。(6)数据挖掘与数据库系统和 Web 数据库系统的集成:数据库系统和 Web 数据库已 5 结语各自的优缺点及其所适用的领域,并根据目前国 挖 的数据分析,在国外像金融业、零售业等这样一些对数据 功地采用了数据挖掘技术来辅助决策。尽管如此,数据挖 挑战,如超大规模数据集中的数据挖掘效率有待提高,开 挖掘方法,网络与分布式环境下的数据挖掘,动态数据和 深刻了解期望解决问题的领域,理解数据,了解其 的结果,从而促使挖掘模型的不断完善和提高,使 7参考文献 6 QULINLAN J R. C4. 5: Programs for MachineLearningM.San Mateo , Calif:Morgan 21(4):82-84.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论