论大数据理论的基本原理及其价值创造_第1页
论大数据理论的基本原理及其价值创造_第2页
论大数据理论的基本原理及其价值创造_第3页
论大数据理论的基本原理及其价值创造_第4页
论大数据理论的基本原理及其价值创造_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、论大数据理论的基本原理及其价值创造华南师范大学陈俊欢步入大数据时代如今,我们已经进入了一个大数据的时代。Facebook在2012年平均每个月 有300亿条内容被创建,每天处理的数据量多达500TB(1TB=1000GB)。并且 至今Facebook已存1400亿张图片,今年将增700亿张。据YouTube公布数据显 示,目前用户每分钟上传的视频长度为72小时。eBay的分析平台每天处理的数 据量高达100PB(1PB=1000TB),超过了纳斯达克交易所每天的数据处理量。另 外根据IDC(国际数据公司)的监测统计,2011年全球数据总量已经达到 1.8ZB(1ZB等于1万亿GB),而这个数值

2、还在以每两年翻一番的速度增长,预计 到2020年全球将总共拥有35ZB的数据量,增长近20倍。事实上大数据绝不仅仅是数据的总量增大了,大数据指的是以一种集合的形 式来包含所有数据,其大小或复杂性使得无法通过常用技术以合理的成本,并在 可接受的时限内对其进行捕获、管理和处理。大数据时代的成因我们先来看看大数据时代形成的原因,并且从以下三个方面来进行解释。2.1信息生产方式的改革信息生产方式的变革可以从两个方面来说,一是随着电脑,手机,小型摄像 机等信息生产设备的普及,每位拥有者都能很轻易地创建自己的信息;二是信息 的生成方式越来越多样化,以前人们一般都是通过纸张来记录信息的,如今我们 还可以用短

3、信,语音,视频,照片,微博等丰富多样的方式把各种信息记录下来。2.2信息传播方式的改革传统的三种信息传播渠道(报纸,电视,广播),无论是在传播的及时性还 是广度始终都受到一定的限制,然而随着互联网的出现,这种情况则完全改变了。 互联网使得我们每个人都能通过网络来传播我们的信息,而且传播的速度非常 快,并且能轻易到达世界上的每一个角落。2.3信息记录方式的改革如果按照美国国会图书馆的容量来保存信息的话,恐怕几百个美国国会图 书馆也装不下一个Facebook公司的数据。但是随着信息存储技术的发展,我们 不仅能够把如此庞大的数据给生产出来,而且还能把他很完整的保存起来。因此,在这三者的影响下,我们进

4、入大数据时代的条件已经被满足了。信息生产方式变革(信息生产者增多,信息生产形式多样)大数据时代信息传播方式变革(特别是互联网的出现)信息存储方式变革(主要依靠科学技术)大数据理论的本质依据自从人类诞生之始,我们就不停地探索着世界的运行规律,随着我们探索的 越多,我们所了解的也越多。“知道更多”可以说是我们人类存在的一个终极追 求,千万年来我们无时无刻不做着这件事情。这时或许有人会反驳说,我们除了 知道结果还应该知道过程,或者说是还应该知道他们之间的一种关系,这并没有 错,但事实上我们要知道过程的原因也只是为了以后能更加便捷地知道更多的 结果。毫无疑问,这个世界的运行总是遵循着某一规律的,即自然

5、之规律。所谓规 律,其实可以分为三种。一者是恒常规律,如日出日落,生老病死,绝无异常; 二者是混沌规律,凡事不可捉摸,无法确定;三者即为浮动规律,有迹可循却又 无法准确把握。恒常规律混沌规律浮动规律实际当中,恒常规律和混沌规律都是极少出现的,那么则可以说无论是在我 们的生活领域还是经济领域上最常会出现的一个规律就是浮动规律。事实上这一 点几乎所有人都知道,也都隐含于每个人的意识之中。那么,这样的一条规律或 者说这样的一种意识又会对我们造成了怎样的影响呢?让我们先来看看我们现在主流的方法是如何来认知我们所在世界的规律的。 通常我们会遇到某一个问题,比方说公司的市场份额下降了,然后我们马上会找 出

6、其内在的原因,收集数据样本作出分析,接着就会制订出一系列的指导方案, 再去执行,最后再来印证实施的情况是否符合原假设,如果符合则代表我们的认 知是正确的,反之如果不符合则又要从新构造模型,建立假设。诚然,在数据量小的时候,这种精确性的因果分析研究是唯一可行的方法, 因为上文已经提到我们这个世界的运行规律本来就是浮动性的,如果分析过程再 不要求精准,那么最终的结果更是相差甚远。然而事实上,这种基于有限样本的 因果关系分析只是在数据量较小时的一种无奈之举。不仅操作过程非常麻烦,而 且推测结果的有效性也往往难以得到保证。然而,如果我们拥有了足够的海量的数据,情况就会变得完全不同了。无论 一件事情它有

7、着多么复杂或隐秘的内在规律,但是只要这件事情一旦发生了,它 就一定会有所表现,也就是说它会表现出这件事情所拥有的特征。就比如使人感 到难过的原因有千种万种,错综复杂,或许我们根本就无法探至。但是不论如何, 只要一个人感到难过了,他就一定会表现出难过所拥有的特征,例如落泪,一言 不发,甚至是独自喝酒.又比如说这个月浅绿色的衣服突然变得好卖了,这件 事情的原因可能非常复杂,但是无论其成因到底是怎样,我们只需要知道浅绿色 衣服的销量增加了,接着我们就采购更多的浅绿色衣服就行了。当数据量小的时 候,我们总会是寻求因果关系分析,想知道产生这些情况的原因到底是什么,但 事实上这可能很难,甚至我们根本连这些

8、现象都未必能发现的了。但是借助于大 数据的力量,我们能从无数的例子当中得出:如果一个人落泪了或者是流露出闷 闷不乐表情,那么他很有可能是感到难过了。并且浅绿色的衣服销售量猛增,我 们也是通过统计全部的数据才得知的。所以大数据理论真正的魅力就是在于它把 所有的理论分析全部都屏蔽掉了,我们无需再从构建假设入手,分析,计划,实 施,最后印证这样一步步地推演过来,它直接就能够把最终的结果告诉你。实际上大数据理论的核心依据就是表现理论。在1884年,心理学家威廉詹 姆斯提出了一种特殊的学说,这个学说认为,情绪只不过是对于身体所发生的变 化的感觉,如果没有了身体变化(如肌肉紧张、心中加剧)等,也就没有什么

9、情 绪。这种学说我们可以称之为表现理论,关于这种理论的正确性我们暂且不论, 但是如果我们将这个理论引伸一下,就能够得出一个有趣并且极其重要的结论: 我们能够通过一个事物所表现出来的特征来认识该事物。然而,这样一个简单的 结论却足以颠覆我们的思维模式!因为我们不需要再从原点开始一步一步地分析 下去得出结论,如果我们能够收集到足够多的数据,那么这些大量的数据就能够 很完整地把该件事物描绘出来,这样最终的结论就显而易见了。结论逻辑*推演.a正向理论研究,(因果关系)+一特征AI反映反向,大数据分析(相关关系)大数据理论思想4.1数据量更大(核心思想:数据的量变到质变)上文已经论及大数据理论的依据就在

10、于表现理论,当数据总量较小时(样本 模式),样本的数据不足以准确完整地反映该事物,因此这样的样本不能满足表 现理论,而只能用来推演和预测。然而当数据量的规模足够大或者是在全数据模 式下,当它超过了表现理论所需的临界值,我们就能够直接用大数据来描述该事 物了。4.2数据形式更杂(核心思想:混杂即能更全面)随着信息时代的到来,信息的特征也在发生着重要的变化。4.2.1信息的记录形式越来越丰富(多样化)包括语音,视频,电子邮件,GPS记录的地理位置信息,微博上面发的内容华华等等。4.2.2信息之间的组合方式越来越多(非结构化)据调查,未来10年结构化数据的增速约为32%,而非结构化数据的增速则 将达

11、到63%,非结构化信息将占到未来10年新生数据的90%。例如我们要收集 一个人的信息,除了他的姓名,电话号码,家庭地址等结构化信息,还可以借助 互联网查看他的网页浏览记录,在Facebook上查看他的社会交际网以及上传的 图片或者发布的信息等等。4.3数据反映的关系更直接(核心思想:关联物一预测的关键)事物的内在规律是通过一系列的特征而表现出来的。特征一 特征三特征五模型一(目标已知)关键点:关联性目k特征二标特征四k特征六从目标纷繁的表象中找出与之最相关的一个作为关联物。模型二(目标未知)关键点:交叉性通过数据之间的交叉与组合来发现新的问题,创造新的价值。大数据理论模式的总结:数据总量更大特

12、征数据更加全面(混杂)表现理论的临界线相关关系直接反映数据量变数据质变大数据的价值创造在大数据技术与大数据思维的影响下,传统的交易行为将会发生重大的改 变,并且从中创造出巨大的价值。大数据价值创造的应用包括两个方面,分别从企业和顾客的角度出发将大数 据应用分为顾客大数据和商品大数据。顾客大数据是指企业收集顾客的信息而建 立起来的一种大数据营销模式;商品大数据是指消费者借助企业所提供的大数据 服务来为自己做消费规划和消费决策。在顾客大数据中,企业先收集顾客的历史交易数据,还有通过顾客关系管理 所收集到的的交互数据,然后通过技术处理对数据进行分析,得出用户的特征, 洞察用户的喜好,建立顾客档案。还

13、可以使用一些其他的方法,收集顾客的网站 浏览数据、社交数据和地理追踪数据等,使得消费者描述更加完整更加细致。而 一旦在我们的数据库中有了完整的顾客描述之后,我们就能用数据来分析顾客的 购物行为并且准确地预测他们下一步的消费。另外,我们通过顾客的消费信息研 究其购买习惯,并且能识别出潜在的更有价值的目标群体。进一步,我们就能够 优化自身的营销策略,调整商品库存与商品之间的组合,向目标顾客推荐他们最 感兴趣的产品和服务,从而达到个性化的精准营销。在这个过程中,企业能够把 自身的资源最大程度地利用起来,减少了不必要的资源浪费,还能使得每位顾客 都享受到了最贴心最个性化的服务,甚至企业还能从中挖掘出潜

14、在的新的价值。然而另一方面,在传统的交易过程中,消费者一方往往会处于“信息洼地” 的不利位置。但是随着大数据的发展,消费智能将会成为一个重要的趋势。智能 消费是企业将数据分析作为一种服务提供给消费者,而不是像在商业智能时代, 数据仅被用作企业内部的业务分析和决策支持。在传统的消费过程中,顾客都是 根据以往自身的购物经验来进行消费的,这其实又是一个从分析,计划,实施, 最后再到检验的一种传统认知模式。但是在大数据所带来的新型消费模式下,这 种情况也会得到改变。诚然依靠顾客自己是很难收集到大量的数据的,而且也完 全没有必要。但是这种数据服务可由企业来提供,并且相关的数据分析处理过程 也交由企业来完

15、成。比如在日用品行业,如果有顾客想要购买一瓶洗发水,他首 先就会依据以往的购物经验来作出选择,如果他想要尝试新的品牌那么他只好听 从销售员的推荐。但是在大数据支持下的智能型消费模式则完全不同,首先顾客 会依据自己的喜好来为洗发水做特征描述,例如想要什么功效什么香味等等,并 且输入自己可接受的价格范围,这时企业后台的大型数据库系统就会做出数据分 析,找出最符合顾客描述的商品,以及该商品以往的销售记录和销售趋势,并且 连接互联网在网上自动搜寻其他顾客对该商品的评价。除此之外,企业还能为顾 客提供个人的消费规划建议,根据搜集到的消费记录告诉顾客每个月应该在什么 时候需要购置什么商品,商品的价格趋势会怎么变

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论