




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
讲师:XXX
>>人工智能专业DataMiningTechnology数据挖掘技术课程名项目一:搭建数据挖掘环境揭开数据挖掘面纱搭建数据挖掘环境运行第一个程序1.11.21.3项目一:搭建数据挖掘环境揭开数据挖掘面纱搭建数据挖掘环境运行第一个程序1.11.21.3任务描述项目组接到一个数据挖掘项目,今天我们将进行该项目的项目启动会,以便了解项目的整体情况,并对各个环节的工作要求有一个清晰的认识和了解,为日后协同开展工作做准备。“知己知彼,才能百战百胜“,我们先要进行数据挖掘系统的构建规划,理解数据挖掘商业模式和业务流程,构思好项目的总体架构,这样才能在编写页面时游刃有余。”这就是我们完成的第1个任务:揭开数据挖掘面纱。在facebook有40亿的信息扩散会有60张照片上传到网络ONESECONDONEMINUTEONEDAY会有60小时视频上传到视频网站youtube每个智能手机用户平均会安装65个应用有2940亿封邮件发出,相当于美国两年的纸质信件数量发出的社区帖子达200万个,相当于《时代》杂志770年的文字量互联网产生的全部内容可以刻满1.68亿张DVD1.1.1认识数据挖掘为什么需要数据挖掘——数据爆炸VS知识匮乏人们积累的数据越来越多
目前这些数据还仅仅应用在数据的录入、查询、统计等功能,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,导致了“数据爆炸但知识贫乏”的现象。1.1.1认识数据挖掘数据挖掘的提出1.1.1认识数据挖掘什么是数据挖掘数据挖掘是从数据中,发现其有用的信息,从而帮助我们做出决策(广义角度)1.1.1认识数据挖掘什么是数据挖掘数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程(技术角度)1.1.1认识数据挖掘1.1.1认识数据挖掘1.1.2数据挖掘的应用领域数据挖掘的其他应用领域商业领域金融领域交通领域......1.1.2数据挖掘的应用领域抖音的大数据通过识别大数据,分析每个内容,通过点赞,停留等动作识别用户的兴趣标。然后分别给内容和用户打上大量的标签,精准给用户匹配相关内容。农夫山泉用大数据卖矿泉水在强大的数据分析能力做支持后,农夫山泉近年以30%-40%的年增长率,在饮用水方面快速超越了原先的三甲:娃哈哈、乐百氏和可口可乐。1.1.2数据挖掘的应用领域soul的大数据soul提出的心灵匹配算法(可以看到两个人心灵的契合程度)1.1.2数据挖掘的应用领域1.1.3数据挖掘的模型1.1.4数据挖掘的数据类型数据库数据数据仓库数据事务处理数据库数据其他类型的数据数据挖掘能被应用于任何对目标应用有意义的数据类型最基本的形式有:1.1.3数据挖掘的数据类型数据库数据数据库管理系统(DBMS)数据仓库数据数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造。1.1.4数据挖掘的数据类型事务处理数据库数据
传统的数据库系统不能做这种商业分析。但是基于交易数据的数据挖掘能够发现这种频繁模式,即发现那些商品会被一起经常购买。其他类型的数据时间相关的数据和序列数据(历史记录,股票交易)数据流(视频监控和传感器数据)空间数据(地图)工程设计数据(系统部件和集成电路)超链接和多媒体数据(文本、图像、音频和视频)图数据和网络数据(社会和信息网络)web数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农发行衡水市深州市2025秋招信息科技岗笔试题及答案
- 农发行石家庄市正定县2025秋招群面模拟题及高分话术
- 农发行邢台市襄都区2025秋招无领导小组面试案例库
- 定安县中储粮2025秋招网申填写模板含开放题范文
- 恭城瑶族自治县中储粮2025秋招笔试粮食政策与企业文化50题速记
- 内科医生个人工作总结(集锦15篇)
- 2025年度周口西华县中医院校园招聘17名考前自测高频考点模拟试题有完整答案详解
- 焦作市中石化2025秋招笔试模拟题含答案炼油设备技术岗
- 县城市供水突发事件应急预案范文(9篇)
- 2025年合肥热电集团社会招聘5人考前自测高频考点模拟试题及答案详解一套
- 煤矿安全规程2025版解读
- 哈里伯顿Sperry定向钻井介绍专题培训课件
- 2021年江苏省徐州市中考生物试卷(附详解)
- JJF 1704-2018 望远镜式测距仪校准规范
- 石油化工设备维护检修规程通用设备12
- 《三角形的面积》教学设计方案
- GB/T 14667.1-1993粉末冶金铁基结构材料第一部分烧结铁、烧结碳钢、烧结铜钢、烧结铜钼钢
- 带状疱疹及带状疱疹后神经痛
- 2022年毕节市农业发展集团有限公司招聘笔试试题及答案解析
- 卒中单元中的护理
- 中药鉴定学习题集全
评论
0/150
提交评论