大数据读书笔记_第1页
大数据读书笔记_第2页
大数据读书笔记_第3页
大数据读书笔记_第4页
大数据读书笔记_第5页
免费预览已结束,剩余11页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据读书笔记大数据读书笔记大数据读书笔记V:1.0精细整理,仅供参考大数据读书笔记日期:20xx年X月大数据读书笔记【篇一:大数据读后感】从徐子沛的《大数据》中得到的感悟数据,对于我们现代社社会来说,已经是再熟悉不过了。大量化(volume)、多样化(variety)、快速化(velocity)和大价值(value)。这四个v就是大数据的基本特征。每天我们都不得不和数据打交道,比如我们平常所说得“眼观六路,耳听八方,”就是生活中一个很好的的收集数据的例子。还有,在我们平时的学习中,我们对于一些学习上的数据的整理等等。可以说,数据已经成为了我们的影子一样,无时无刻的在我们的身边活动。拿到《大数据》这本书时,吸引我的不是书评的内容,而是书的封面上的一句话“除了上帝,任何人都可以用数据说话。”也就是说,上帝可以不用数据来说话,但是,作为一个平常人,我们做事,言论等都必须用数据来说话。用数据论来证我们的观点正确性。那么数据真的就是那么重要吗其实不然,数据果真有那么的重要。作者在书中大量应用世界头号强国美国的例子来说明美国是如何利用数据以及数据在美国人的利用下,是如何造福美国人的。使得美国人走上了民主、发展的道路。书中还引用了大量的利用数据的案例,以及利用数据会有什么样的后果。当然,作者在书中也很明确的表达了自己观点,也就是数据要被人利用,利用的好了,造福人类,否则,祸害无穷。毫无疑问,我们正处在一个真正意义的大数据时代。但是,大数据浪潮的来龙去脉如何数据技术变革何以能推动政府信息的公开、透明和社会公正又何以给我们带来无限的商机,既便利又危及我们每个人的生活《大数据》给了我们一个很好的答案。在拿到徐子沛《大数据》时,与其说这是个新概念,还不如说就是一个现实。信息技术的迅速发展和普遍应用,存储能力的膨胀,网络传输的便捷,必然产生巨大的数据量。即使是一个公司,经过多年的积累,产生的数据也是惊人的。每天繁多的数据,这就是要求企业要很好地存储数据,利用数据通过数据,使得数据说话,提升企业的业绩和知名度。对于一个企业来说,比较实际的倒是关注一下企业微观大数据,如何充分利用现有的、能够得到的和自己创造的数据,采用《大数据》里提及的新技术、新方法、新理念,筛选、组织、关联、分析,精细化管理和挖掘数据,探索规律性的东西,指导企业活动。尽可能多的获取数据,首先是要有心,对于公司员工来说,随时随地注意收集客户数据、需求数据、产品数据、市场数据、资源数据等,经过整理,把它变成公司的数据资产;然后是要有据,信息与数据最大的不同,就是数据是能够度量或者确定的信息,不能“毛估估”,收集数据要精细化,要准确;其次要有序,数据需要存储,更加需要整理,单个数据没有很大意义,静止的数据也没有很大意义,有价值的数据是流动的、与其他数据交互作用的。一个大杂烩的数据库,在需要时让人找不到北,没有任何意义。再次,需要技术支持,大量的数据如何检索,如何关联,单靠人脑是不行的,需要建立基于特定理论的数据处理系统来分析管理。对于一个企业,最理想的是建立一个类似人类神经系统的数据管理系统,采用各种信息终端采集内部和外部信息,通过分析、归纳、筛选,形成管理数据,某些数据可以成为系统的“本能”,一旦触发能够自动做出反应;某些数据可以成为组合信息提交大脑综合分析,作出决策和反应。数据应该为人服务,这是一条基本原则。在大数据时代始终发挥人的主观能动性,采用先进的理念和技术驾驭数据,让人们生活更方便,工作效率更高,劳动强度降低,为社会创造更多的物质财富和精神财富。《大数据》是一本视野独特的书。它以数据为轴线,描绘了美国走过的改革创新的过程,行文如流水,引人入胜。书中,我读到的不是大数据处理技术,更多的是与大数据相关的美国政治、经济、社会和文化的演进,从民主和国家战略的层面细解大数据的影响力。美国是全书的主体,但又处处反观中国当下的现实。内容非常值得我们身处改革开放前沿的政府工作者深思。它让我们更加深刻地理解了汪洋书记提出的“坚持用数据说话、用数据改进管理、用数据推动创新”的深刻内涵和殷切期望。我们只有重视数据,加强对数据的收集、分析和使用,才能更好地应对正在到来的数据革命的挑战。那么,作为与数据打交道、用数据说话的前线统计工作者,如何应对大数据时代的种种挑战对比《大数据》,结合平时工作和学习的实际情况,我认为最少应该认真思考和解决好三个问题:一、提供什么样的数据在中国,统计部门提供的数据,是各级政府部门和广大人民群众了解国家社会经济发展和人民生活状况主要渠道。只有真实可靠统计数据,才能使政府决策有的放矢,人民了解国家经济与人民生活的真实状况。如果统计数据虚假不实,就会误导政府和人民,让政府失信于人民。因此,我们一定把握好数据的生命线—质量关,确保给国家和人民提供准确、真实、可靠、无误的数据。二、如何高效有序地收集数据面对信息大爆炸时代海量数据,必须充分利用高科技手段,高效有序地收集整理各种数据,以满足政府和人民群众越来越广泛的信息需求。为此,我们需要建立完善数据收集网络,包括部门内部的纵向数据收集网络和部门之间的横向数据收集网络,通过这种纵横结合的网络数据收集系统,针对特定主题,持续不断地收集相关数据,为大数据发展提供基础。需要运用互联网、电子计算机等现代技术手段,加快数据收集、加工数据的速度,确保政府和人民及时得到所需数据。三、如何加强数据分析利用能力收集数据的目的是为分析利用数据。通过数据分析挖掘数据背后隐含的经济规律及有利于提高效率、改进工作的因素,提高政府管理、决策和人民生活水平,实现“用数据改进管理”。因此,作为统计人,不仅要做好数据收集的及时有效和真实正确,更重要的是要善于分析利用数据,写好专业分析报告,发现问题、支撑决策、评估绩效的目的。此外我们还可以看到不少政府机构或者其他一些组织也在开始大数据解决他们遇到的一些问题。在本书的最后一章,作者告诉了我们大数据可能带来的坏处。如:通过大数据可能我们的个人各种信息、隐私会很容易地被大数据的拥有者找到,这些信息,可能被政府用来监管我们等;通过大数据可以预测可能发生的事,或者预测我们人个人本书即将做的行为,书中有个例子:警察通过大数据分析得出一个人即将可能犯罪,并把它逮捕了,但事实上这个人现在并没有犯罪。也许这就限制、约束了我们个人的自由。看完这本书,颠覆了自己之前的一些想法:以前我们认为错误的数据是没有用,我们需要保证统计的数据的准确性,但是在大数据中,错误的数据也是有用的,它和其他所有相对正确的数据一起构成了整体,也就算不了什么了。我们同样可以从这些数据中得出比较正确的预测和分析。google利用人们搜索的关键字来预测和判断某个地区是否发生流感,google通过分析这个地区的人们搜索和流感有关的词的数量等来分析得出。google从互联网抓取数以亿记的各种语言、各种翻译水平的翻译结果,使用其翻译出来的准确率比那些微软使用正确的词库翻译出来的句子准备率更高。我自己的感想是,其实大数据无处不在,只要我们细心,我们就可以挖掘出身边的那些大数据,并做一些有意义的是,就像书中说的那样,我们不需要强求每条数据都那么真实准确,但是从大量的数据中我们就可以得出相对准备的结果。未来成功的公司必定是是那些拥有大量数据、并使用那些数据为大众提供服务的公司。公布官员财产美国是怎么做的,美国能让少部人腐败起来吗,美国式上访是怎么回事,凭什么美国矿难那么少,全民医改美国做得到吗,美国总统大选有什么利器才能赢,下一轮全球洗牌我们世界工厂会被淘汰吗除了上帝,任何人都必须用数据来说话。也就是是【篇二:《大数据时代》读书笔记-】大数据意味着什么——《大数据时代》读书笔记自英国人维克托.迈克.舍恩伯格(viktormayerschonberger)2013年写了一本叫《大数据时代:生活、工作和思维的大变革》的互联网专著,“大数据”一夜之间成为全球互联网领域的核心关键词,无论国外的谷歌、亚马逊、facebook、twitter,还是国内的新浪、腾讯、淘宝、京东、当当、百度等互联网企业及传播学者、新媒体研究者、媒体人都将注意力转移到这一核心关键词上面,仿佛这年头如果你还对大数据浑然不知,走出去都不好意思跟传播学大家谈互联网,谈新媒体,谈如今如火如荼的电子商务。那么,到底什么是大数据大数据有哪些特征大数据对互联网、对普通网民意味着什么呢去新华书店搬回来这本大部头,一口气读完,维克托用生动的案例幽默的语言,针对上述问题娓娓道来。提起“数据”,大家都知道是一种用0、1等计算机语言表示的信息,而所谓的“大数据”就是一种流量、存储量超级大(以tb计算)数据。谷歌地图街景(图片)是大数据,每一个微博用户在微博上产生的全部内容合起来作为一个整体是一种大数据,淘宝店主和每一位淘宝用户在淘宝这个平台上产生的所有信息作为一个整体是一种大数据,国内最大的搜索引擎百度里面所有的无数条的类目信息合起来也是一种大数据,这些都是互联网企业普遍存在的大数据,事实上,大数据在我们的日常生活中还有更为普遍的应用:超级市场里每一位会员刷卡购物(非会员购物买单时留下的购物清单也是大数据的一部分)时留下来的信息是大数据,百货大楼、大商场里面各个角落里安装的摄像头拍下每一位顾客进出商场及在商场中活动的画面是大数据,甚至汽车里面安装的电子狗、导航系统作业时也能带来大数据。细数身边常接触的这些大数据,仿佛还不得不信维克托这位号称“大数据商业应用第一人”大胆提出的“大数据”这个新概念的存在。大数据最大的特征就是数据量大、庞大、巨大。因为数据量大,所以才能商业特别是互联网企业带来不可估量的现时或潜在的价值,如果百度里面的数据量不够大,可供网民搜索的类目和条目不够多,那它毫无可能成为网民的“移动的百科全书”。如果超级市场里面顾客和会员没有留下大量的数据,那么超级市场根本无从精确判断下个月该进多少货,该进哪些货品。这,就是数据量够大带来的变革之一。其次,大数据还具有巨大的商业价值。除了刚才举到的两个案例,再譬如汽车里面安装的导航系统如果除了导航还增加实时测速、安全气囊爆破记录甚至刹车、加速、减速记录功能,那么它形成的大数据对保险公司定制车险套餐,汽车维修店开发新业务具有强大的参考借鉴价值。再譬如,每一位微博用户,哪怕你从不发微博(内容)只是围观,对于新浪微博也具有商业价值,因为新浪微博大数据的构成离不开每一位微博用户。当然,大数据的商业价值远非于此,下文还会讲到。大数据的第三个特征是具有相关性。因为数据与数据之间具有相关性,大数据才可供分析,分析的结果才能带来更多的价值。但是在本书中,维克托主张一种观点,就是无需在乎数据之间的因果关系,只要能看到数据之间的相关关系即可。譬如汽车安全气囊爆破的概率和车祸之间没有必然的因果关系,但是安全气囊爆破和保险公司为车主定制更为精准的保险套餐之间却有相关关系,用户只要关注后者即可,而不必纠结与因果关系。除此之外,大数据还具有非精确性、免费和可重复利用等特征。第三个问题:大数据对普通人意味着什么,即大数据能给普通人的生活带来哪一些影响呢当然,提到影响就必然要分正面的和负面的来谈。首先谈谈大数据的正面影响。用维克托在《大数据时代》中提到的两个印象深刻的经典案例来说明这个问题。第一个案例是,facebook前几年通过搜集上亿条有关流感的信息进行分析,从而预测美国各大城市何时会发生流感,以让大家为预防流感提前做好准备。这是大数据给普通人带来实实在在正面影响的典型,此外这一案例还反映了大数据一个强大的功能,那就是预测功能,而维克托的这本书本身就是面向未来的,书中所提到的案例极少是已经实现了的,维克托提出的“大数据”这个新概念给互联网的未来描绘了一幅看起来前途无限光明的蓝图,而他提到的利用大数据进行商业和管理的案例大多有待进一步开发和尝试。当然,facebook、twitter上的信息既然能够预测流感,那它肯定还能够预测像电影票房这样的普通数据。第二个案例是,乔布斯利用大数据治疗癌症的例子。大家都知道乔布斯是因为胰腺癌于2011年去世的,但可能大家并不清楚乔布斯事实上早在好多年前就知道自己患了癌症并让他的医生给他做23对基因碱基配对,根据配对结果再制定用药计划,而基因碱基配对可以得出无数种(n+n+n+...)数据,这就意味着乔布斯在去世之前其实已经尝试了n种治疗方案了,而还未等到他尝试所有因基因碱基配对制定的药物治疗疗程就去世了。这个案例说明,大数据原来还可以在医疗领域进行应用。除了上述两个案例,维克托给人们描绘的大数据的强大用途还体现在商业运营、企业管理等领域,想了解更多大数据的用途建议有兴趣者去阅读这本书。前面谈到任何事物都具有两面性,大数据对人们的影响除了正面的积极影响,同时也存在隐患和负面影响。作为一本学术专著,维克托在这本书的最后也提到了大数据带来的最大隐患就是侵犯隐私和保护隐私权的问题。谷歌地图街景功能的开发应用,将普通人的生活毫无保留地呈现在公众面前,尽管在被控诉之后谷歌已对高清街景的隐私部分打了马赛克,作了模糊处理,但依然无法减少大家对这它的抱怨和恐惧。写至此,我不得不说,大数据确确实实正在改变着商业,管理甚至普通人的工作、生活和思维,我们特别是互联网企业也领略到了大数据带来的诸多便利和好处,与此同时,大数据也带来了侵犯隐私等问题,大数据是一种信息,或者说是一种媒介,它是好是坏完全取决了利用大数据的人,一方面可以大胆想象并开发大数据的潜在功能和价值,为人们带来好处,另一方面,我们也应防止大数据的滥用。【篇三:大数据时代读书心得】生活,工作以及思维的大变革——读《大数据时代》有感及所思读了《大数据时代》后,感觉到一个大变革的时代将要来临。虽然还不怎么明了到底要彻底改变哪些思维和操作方式,但显然作者想要“终结”或颠覆一些传统上作为我们思维和生存基本理论、方法和方式。在这样的想法面前,我的思想被强烈震撼,不禁战栗起来。本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观点,也就是大数据的精髓在于我们分析信息时的三个转变,这三个转变将改变我们的理解和组建社会的方法。并且作者将生活,工作思维的大变革和这几个方面紧紧联系在一起。第一个转变是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。也就是说样本等于总体;第二个转变是对研究数据不会追求精度,而且追求混杂性,小数据时代下,追求精确度是合理的,因为我们收集的数据很少,所以要越精确越好,包括如今仍然也在使用这种办法;但是在某些时代,尤其是在大数据时代背景下,快速获得一个大概轮廓和发展脉络,要比精确性重要得多,既然选择了整体性,肯定要忽视细节和确定性;第三个改变是不是因果关系而是相关关系,在大数据时代,我们更需要了解一个东西是什么,而不是为什么,要找到关联无,通过一个良好的关联物的相关关系可以帮助我们捕捉预测未来。这三个方面是大数据时代所给我们带来的思维上的改变,所谓思路决定出路,思路有了创新,有了拓展,相应的社会也就会有很大的变化。紧接着第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。这本书给我感触最深的就是这三个转变,或者说是三个观点,可以说是哲学上说的世界观,因为世界观决定方法论,所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论