人工智能、大数据与深度学习之间的关系和差异_第1页
人工智能、大数据与深度学习之间的关系和差异_第2页
人工智能、大数据与深度学习之间的关系和差异_第3页
人工智能、大数据与深度学习之间的关系和差异_第4页
人工智能、大数据与深度学习之间的关系和差异_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、据与深度学习之间的关系和差异网络上从不缺乏对数据科学术语进行比较和对比的文章。文笔各 异的人写出了各式各样的文章,以此将他们的观点传达给任何愿意倾 听的人。这几乎是势不可挡的。所以我也记录一下,对于那些疑惑此文是否也是雷同的帖子。对, 为什么再来一帖?我是这样想的,尽管可能有很多分散观点在定义 和比较这些关联术语,但事实上是,这些术语中的大部分是流动变化 的,并不完全约定俗成,坦率地说,与他人观点一同暴露是测试和优 化自己的观点的最好方法之一。所以,虽然大家可能不会完全(甚至是极低限度地)同意我对这些术 语的大部分看法,但仍然能从中获得一些东西。数据科学中的一些核 心概念需要被解释,或者至少在

2、我看来是重要的,我会尽力阐述他们 如何关联,以及答疑这些个体概念组合在一起时遇到的困惑。在独立地思考概念之前,有个不同观点的例子, KDnuggets 的 Gregory Piatetsky-Shapiro 的维恩图,概述了我们将要讨论的数据科 学术语之间的关系。建议读者将此维恩图与目前 Drew Conway 的著 名的数据科学维恩图,以及我下面的讨论和帖子底部的修改过程 /关系 图进行比较。我认为,尽管存在差异,但这些概念具有一定的相似性。现在我们将对上述维恩图中圈选的 6 个核心概念进行分析,并提 供一些关于如何将它们融入数据科学的洞察。我们很快就会摒弃过去 术语。大数据(Big Dat

3、a)有各种各样的文章在定义大数据,我不打算花太多时间在这个概 念上。简单地来说,大数据通常被定义为“超出常用软件工具捕获, 糊 又准确,足以捕捉其主要特征。至于其他的概念,我们将通过调查,很好的获得搜索字词的流行 度和 N-gram 频率模型的一些初步了解,以便将这个难点与热点炒作 至 2008 年, N-gram 频 率模型作为一个“旧”的概念被阐述。 以及最后一个逐渐下降但有明显的下降。请注意,由于已经对数据进行了定量分析,大数据未包含在上述图形中。继续阅读,以便进 机器学习(Machine learning)据 Tom Mitchell 在关于这个主题的创作书中阐述,机器学习“关 心的问

4、题是如何构建计算机程序使用经验自动改进”。机器学习本质 上是跨学科的,采用计算机科学,统计学和人工智能等方面的技术。 机器学习研究的主要工作是促进经验自动改进的算法,可以应用于各 我不认为有人会怀疑机器学习是数据科学的核心组成。我在下面 给出数据科学的详细描述,如果你认为在一个非常高的水平上其目标 是从数据中获取洞察力,其实机器学习是允许此过程自动化的。机器 学习与古典统计学有很多共同点,因为它使用样本来推断和概括。数 据统计更多地侧重于描述性(尽管可以通过外推来预测) ,机器学习对描 述性分析的关注很少,并且仅将其用作中间步骤以便能够进行更好预 测。机器学习通常被认为是模式识别的同义词 ;真

5、的不会从我这里发生 太多的分歧,我相信,模式识别这个术语意味着实际上是一个比 机器学习更不复杂和更简单化的过程,这就是为什么我倾向于回避它。机器学习与数据挖掘有着复杂的关系。数据挖掘(Data Mining) 中提取模式的特定算法的应用”。这表明,在数据挖掘中,重点在于 算法的应用,而不是算法本身。我们可以定义机器学习和数据挖掘之 间的关系如下:数据挖掘是一个过程,在此过程中机器学习算法被用 作提取数据集中的潜在有价值模式的工具。语,也是数据科学的关键。 在数据科学术语爆发泛滥之前,事实上,数据挖掘在 Google 搜索 术语中取得了更大的成功。看看 Google 趋势比上图显示的还要早 5

6、年,数据挖掘曾经更受欢迎。然而,今天,数据挖掘似乎被划分 为机器学习和数据科学之间的概念。若有人同意上述解释,数据挖掘 是一个过程,那么将数据科学视为数据挖掘的超集,那么后续的术语深度学习(Deep Learning)尽管在早期的在线搜索急剧爆发之前它已经存在,深度学习 仍是一个相对较新的术语。由于学术研究和工业的蓬勃发展,其在不 同领域取得了巨大成就,深度学习是应用深层神经网络技术 (即具有多 个隐藏层的神经网络架构 )来解决问题。深度学习是一个类似数据挖掘 的过程,它采用深层神经网络架构,这是特定类型的机器学习算法。深度学习已经取得了令人印象深刻的成就。有鉴于此,至少在我 看来,务必要注意

7、几点:深度学习不是灵丹妙药 对于每个问题来说,并不是一个简单一 这不是传说中的万能算法 深度学习不会取代所有其他机器学习 算法和数据科学技术,至少还没有被证明是这样。适度的期望是必要的 尽管最近在各种类型的分类问题上,特别 是计算机视觉和自然语言处理以及强化学习等领域已经取得了巨大的 进步,但当代深度学习并没有扩大到非常复杂的问题,例如“解决世 深度学习和人工智能不是同义词。深度学习可以帮助数据科学以附加过程和工具的形式解决问题, 而在这种观察中,深入学习是数据科学领域的一个非常有价值的补充。人工智能大多数人发现人工智能很难用一个精确的,甚至是广泛的定义讲 出来。我不是一个人工智能研究者,所以

8、我的答案可能与其他领域的 人差别很大。多年来通过对 AI 的思想哲学研究,我得出的结论是,人 工智能,至少我们通常认为的想法的概念,实际上并不存在。在我看来, AI 是一个标尺,一个移动目标,一个渴望而不可及的 目标。每当我们迈向 AI 成就之路,不知何故,这些成就似乎又变成了 我曾经读过如下内容:如果你在上世纪60 年代问 AI 的研究人员, 他们对 AI 的想法是什么,他们可能会一致认为,可以帮助我们预测下一步行动和欲望,所有人类知识可以随时获取,一个适合我们口袋的 小型设备就是真实的 AI。但是今天我们都携带智能手机,很少有人会 AI 适合数据科学?嗯,正如我所说,我不认为 AI 真的是

9、有形的, 我想很难说它适合任何地方。但,一些数据科学和机器学习相关领域, 人工智能可以提供助力,有时与实体一样有价值 ;计算机视觉肯定会引 起注意,现代深度学习研究也是如此,得益于人工智能的精神气质, AI 可能是研究和开发设备,从来没有在同名行业中产生任何东西。 我想说,从 AI 到数据科学的这条路径可能不是查看两者之间的关系的 最佳方式,但是两个实体之间的许多中间步骤已经被 AI 以某种形式开 数据科学(Data Science)那么,在讨论这些相关概念和数据科学的地位之后,数据科学究 竟是什么呢?对我来说,这是试图精确定义的一个最难的概念。数据科 学是一个多方面的学科,包括机器学习和其他

10、分析过程,统计学和相 关的数学分支,越来越多地从高性能科学计算中借鉴,以便最终从数 据中发现洞察,并使用这些新发现的信息来讲述故事。这些故事通常 伴随着图片(我们称之为可视化) ,并针对行业,研究甚至是我们自己, 目的是从数据中获取一些新的想法。数据科学采用相关领域的各种不同工具(请参阅上面所有内容)。数 据科学既是数据挖掘的同义词,也是数据挖掘概念的超集。数据科学产生各种不同的结果,但它们都具有共同的洞察力。数 据科学是这一切,而且对你而言,它可能还有别的东西,而且甚至还 没有涵盖获取,清理,判别和预处理数据 !顺便说一下,什么是数据呢 ? 它总是大吗?我认为我的关于数据科学困惑的观点,至少可以通过上图的版本 来代表它,以及这篇文章的顶部的 Piatetsky-Shapiro 的维恩图。我也 建议大多数与 Drew Conway 的数据科学维恩图一致,尽管我会补充 一点:我认为他非常合理且实用的图像实际上是指数据科学家,而不是数据科学。这可能是吹毛求疵,但我不认

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论