机器学习与数据挖掘_第1页
机器学习与数据挖掘_第2页
机器学习与数据挖掘_第3页
机器学习与数据挖掘_第4页
机器学习与数据挖掘_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机器学习与数据挖掘,基本问题,何为机器学习、数据挖掘?,计算机的功能 替代人的大脑进行思维 最简单的:+-*/ 稍复杂:圆、方、直线 按规则推理 传统的人工智能 更复杂的思维能力? 学习、综合、推广、创新 用计算机全面替代人的大脑进行思维是计算机学界的终极理想,何为机器学习、数据挖掘?,计算机的功能 计算机“思维”水平的现状 人类已深刻理解的过程 使用准确的数学模型进行计算 各种运算:+ - * / sin log 边缘提取:各种算子 几何形状提取:Hough 变换,y=ax+b,X,Y,A,B,a,b,何为机器学习、数据挖掘?,计算机的功能 计算机“思维”水平的现状 人类尚未深刻理解的过程?

2、 尚未有好的办法解决 人类是如何解决的? 学习 如果计算机可如人类一样学习,则可极大提高计算机应用范围和效果 机器学习,何为机器学习、数据挖掘?,何为“学习”? H. Simon: Any process by which a system improves its performance M. Minsky: Learning is making useful changes in our minds R. Michalsky: Learning is constructing or modifying representations of what is being experienced

3、 L. Valiant: Learning is the process of knowledge acquisition in the absence of explicit programming ,何为机器学习、数据挖掘?,学习的基本模型 人类是如何学习的? 基本过程:观察响应,热,红色,跳动,火,何为机器学习、数据挖掘?,学习的基本模型 人类是如何学习的? 学习过程的本质是对因果律求逆,火,内在实体:不可直接观测,因果律,热,红色,跳动,可观测特征,学习,意识中的实体,何为机器学习、数据挖掘?,学习的基本模型,概念空间,特征空间,因果律,物理过程,学习过程,何为机器学习、数据挖掘?,学

4、习的基本模型 基本要素 问题:所需要的输出(类别、数值) 特征属性:可观测的物理量 样本:特征组合和输出类别的一些对应关系,何为机器学习、数据挖掘?,学习的基本模型 目标 通过对少量样本的分析,获得一个特征和输出类别的一般性对应关系 基本数学模型 强:给定一组(X, F(X),求F 如不对F进行很强的限制,一般难以实现 弱:给定一组(X, F(X),对新的X,求F(X) “举一反三” 仍然是很难的问题,何为机器学习、数据挖掘?,学习的基本模型 应用过程,原始数据,人工分析,机器学习,训练样本,模型,新数据,结果,离线过程,在线过程,数学方法,决定性步骤 尚无有效的理论指导,机器学习与数据挖掘研究内容,样本准备 对象分割 对象在文档中可能只占很小比例 用整个文档提取的特征含有大量噪声 特征与特征提取 使用什么样的特征?如何计算?如何进行预处理? 样本选择 正负样本数可能严重失衡(1:10,1:100) 样本可能包含噪声,机器学习与数据挖掘研究内容,样本预处理 特征选择 并非所有特征都对学习有帮助 过多的特征会带来大量噪声 特征降维 消除特征之间的相关性,降低特征维数 过多的特征会带来大量噪声,机器学习与数据挖掘研究内容,训练算法 算法选择

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论