数据挖掘导论教学课件资料讲解_第1页
数据挖掘导论教学课件资料讲解_第2页
数据挖掘导论教学课件资料讲解_第3页
数据挖掘导论教学课件资料讲解_第4页
数据挖掘导论教学课件资料讲解_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章数据挖掘导论给你如下的数据,你能从中得到哪些信息,你会如何利用它们呢?某电子商务网站的运营数据,包括用户资料、历史订单、价格信息和用户评论社交网络的数据,包括用户资料、发帖、回帖医保系统数据电信业务数据智能手机的位置信息本章内容数据挖据的定义确定哪些商业问题可以通过数据挖掘来解决数据挖掘的任务■使用各种数据挖掘技术数据挖掘项目的生命周期案例参考书目数据挖掘一实用机器学习技术机械工业出版社■数据挖掘一概念与技术机械工业出版社Clementine数据挖掘方法及应用电子工业出版社数据挖掘原理与SPSSClementine应用宝典电子工业出版社数据挖掘技术一市场营销、销售与客户关系管理领域应用机械工业出版社1.1什么是数据挖掘从信息技术的角度讲,数据挖掘属于商业智能(BusinessIntelligence,BI)的一个子集。数据挖掘的理论包括数据库、统计学、人工智能、优化等方面数据挖掘的较为理论的定义可以使用名词"机器学习“来解释分析数据,使用自动化或半自动化的工具来挖掘隐含的模式(决策树、规则、聚类或数学公式)。数据挖掘过程有时也称为知识发现,或者数据库中的知识发现(knowledgediscoveryindatabases,KDD)数据挖掘的产生社会产生了海量的数据来源:商业,科学,医学,经济,地理,环境,体育数据是潜在的有价值的资源人类积累的数据量以每月高于15%的速度增加,如果不借助强有力的技术方法,仅依靠人工的方式来理解这些数据是不可能的,需要技术来自动地从这些数据中提取信息数据挖掘的产生问题:数据丰富,但信息贫乏快速增长的海量数据收集存放在大型数据库中,没有强有力的工具,理解它们已经超出了人的能力。■收集在数据库中的文件成了“数据坟墓”需要从海量数据库和大量繁杂信息中提取有价值的知识,进一步提高信息的利用率产生了一个新的研究方向:基于数据库的知识发现(KnowledgeDiscoveryinDatabase),以及相应的数据挖掘(DataMining)理论和技术的研究信息的重要性例:奶牛的筛选■已知:描述奶牛的700多个特征,包括年龄、健康问题、生产记录、不良性情问题:选择被淘汰的奶牛,每年挤奶季节结束时只留下1/5的奶牛,其余卖到屠宰场数据:奶牛特征和奶农决策的历史记录数据挖掘:从商业的角度大量的数据被收集和存储Web数据,电子商务商场的销售数据银行卡交易ATM计算机变得越来越价格便宜和功能强大竞争压力越来越大n在领域中提供更好的个性化的服务(如客户关系管理)挖掘海量数据集一动机通常信息隐藏在数据之中,并不容易发现要人工分析数据得到有用信息可能要花费数周很多数据根本没有机会被分析4,000,0003,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论