《数据科学导论》-2_第1页
《数据科学导论》-2_第2页
《数据科学导论》-2_第3页
《数据科学导论》-2_第4页
《数据科学导论》-2_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.1啤酒与尿布2.1.1案例详析“啤酒与尿布”(图2-1)的故事可以说是营销界的经典段子。打开谷歌搜索一下,你会发现很多人都在津津乐道于“啤酒与尿布”,可以说100个人中就有100个版本的“啤酒与尿布”的故事。故事的时间跨度从20世纪80年代到21世纪初,甚至连故事的主角和地点都会发生变化—从美国跨越到欧洲。认真地查阅一下资料,便可以发现,沃尔玛的“啤酒与尿布”案例是正式刊登在1998年的《哈佛商业评论》上面的,这应该算是目前发现的最权威报道。返回2.1啤酒与尿布2.1.2数据挖掘技术数据的含义很广,不仅指321,897这样一些数字,还指“abc”“李明”“96/10/11“等符号、字符、日期形式的数据。我们讨论的数据是指存放在计算机系统中的任何东西,例如,“数字”“字符”“声音”“图像”“照片”……甚至处理数据的计算机程序本身也可作为计算机的“数据”。随着国民经济和社会信息化的发展,人们在计算机系统中存放的数据量越来越大。我们发现这些数据是人们工作、生活和其他行为的记录,是企业和社会发展的记录,也是人与自然界本身的描述。这就是说,在计算机系统中形成了庞大的“数据资源”。因此,发现这些数据所含的规律也就是发现我们工作、生活和社会发展中的规律,发现人与自然界的规律,就相当于在数据资源中发现金矿。下一页返回2.1啤酒与尿布这就是数据资源的开发利用,是非常有价值的工作。而数据挖掘是目前最先进的数据资源开发利用技术。那么数据挖掘是一种什么样的技术呢?数据挖掘(DataMining,DM),是目前人上智能和数据库领域研究的热点问题。所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人上智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,从而做出正确的决策。上一页下一页返回2.1啤酒与尿布数据挖掘是通过分析每个数据,从大量数据中乎找其规律的技术,主要有数据准备、规律乎找和规律表示3个步骤。数据准备是从相关的数据源中选取所需的数据,并整合成用于数据挖掘的数据集;规律乎找是用某种方法将数据集所含的规律找出来;规律表示是尽可能以用户可理解的方式(如可视化)将找出的规律表示出来。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演奎分析,等等。在具体实施数据挖掘应用时,还要有一个步骤就是结果评价。这是因为数据算法守-找出来的是数据的规律,其中有些是人们感兴趣的、有用的,还有一些可能是不感兴趣的、没有用的。这就要对已乎找出的规律进行评估。上一页下一页返回2.1啤酒与尿布近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理、生产控制、市场分析、上程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想:①来自统计学的抽样、估计和假设检验。②人上智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。其他一些领域也起到了重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集时非常重要。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起时更是至关重要。上一页下一页返回2.1啤酒与尿布2.1.3购物篮分析法研究商品关联关系的方法就是购物篮分析法,曾经是沃尔玛秘而不宣的独门武器。在购物篮分析方面做得比较成功的,一个是美国的沃尔玛,另一个是日本的7-11便利店。同样是购物篮分析,沃尔玛强调找出商品之间的关联关系,比如啤酒与尿布;而7-11便利店的重点在于找出影响商品销售的所有因素,比如碳酸饮料与气温的关系,等等。换句话说,沃尔玛的重点是分析购物篮内商品之间的关联关系,而日本7-11便利店的重点是从购物篮外面找到影响商品销售的关联关系。上一页下一页返回2.1啤酒与尿布让我们来分析一下这两种购物篮分析方法的区别:(1)美式购物篮分析。以沃尔玛(图2-2)为代表的美食购物篮分析的目标一般是卖场面积巨大,通常都是上万平方米,商品种类繁多,大多在10万种以上,所以要通过购物篮分析,找出淹没在不同区域商品之间的关联关系,并将这些关联关系用于商品关联陈列、促销等具体工作中,是很难通过人上完成的。比如,啤酒在酒类区域,尿布在婴儿用品区域,两个商品陈列区域相差几十米,甚至可能是“楼上、楼下”的陈列关系,用肉眼很难发现啤酒与尿布存在关联关系的规律。这里把找出购物篮中商品之间关系的方法称为“美式购物篮”分析法,这种方法适合应用于类似沃尔玛这样的大卖场,用于找出不同陈列区域商品之间的关系。英国的Tesc。连锁超市、Safeway连锁超市也都是这种购物篮分析的高手。上一页下一页返回2.1啤酒与尿布(2)日式购物篮分析。日本这个国家很神奇,虽然身为岛国,但是经济发达。分析日式购物篮确实能够看到日本人在经商方面的巧妙之处。日本的超市以7-11便利店(图2-3)为典型,7-11便利店营业面积都很小,一般只有100-250平方米,商品品种有3000-10000种,是典型的“螺蜘壳里做道场”。如我们在电影或者泡沫剧里面所见的,日本很多门店的经营面积十分狭小,站在门店里的任何一个角落,所有的商品转个身就全看见了一一真正的抬头不见低头见。所以找出商品关联关系不是日本7-11便利店的重点:你就是找出来啤酒与尿布之间有“暗恋”关系,也没用!因为啤酒与尿布本来就在一起。上一页下一页返回2.1啤酒与尿布所以,日本人的重点是分析所有影响商品销售的关联因素,比如天气、温度、时间、事件、客户群体等,这些因素称为商品相关性因素。日本人对于所有影响商品销售的关联因素研究得非常透彻,因此,日本才会有碳酸饮料指数、空调指数、冰激凌指数。而且就不难理解为什么日本7-11便利店会设置专门的气象部门,更能够理解为什么日本7-11便利店会要求门店每天5次将门店内外的温度、湿度上传回总部,供总部与商品销售进行对比分析。与商品之间的关联关系相比,日本7-11便利店认为这些关联因素更为重要。由于这是日本7-11便利店大量采取的方式,这种方法也被称为“日式购物篮”分析法。上一页下一页返回2.1啤酒与尿布2.1.4对我们的思维模式启示“啤酒和尿布”故事是零售行业中运用数据科学的最典型的例子,那么它给我们带来了什么启示呢?启示一:不要只见树木,而不见森林沃尔玛的“啤酒和尿布”故事并不是偶然产生的,它提示了我们在大数据时代,一定要更多地去从更为全面的角度去看问题,要看到事物之间的联系。启示二:注重相关关系的研究“啤酒与尿布”故事的依据是商品之间的相关性(也称关联性),商品相关性是指商品在卖场中不是孤立的,不同商品在销售中会形成相互影响的关系(也称关联关系),比如在“啤酒与尿布”故事中,尿布会影响啤酒的销量。上一页下一页返回2.1啤酒与尿布启示三:深挖数据背后的含义要想找到“啤酒与尿布”之间的关联关系,就要对客户手中的购物篮进行计算。我们将单个客户一次购买商品的总和(以收银台结账为准)称为一个购物篮。上一页返回2.2比价网站的成功2.2.1Farecast案例详析目前在美国,很多人都知道利用大数据分析的结果是购买飞机票可以给自己省钱,而这要归功于美国著名计算机专家奥伦·埃齐奥尼的贡献。2003年,奥伦·埃齐奥尼准备乘坐从西雅图到洛衫矶的飞机去参加弟弟的婚礼。他知道飞机票越早预订越便宜,于是他在这个大喜日子来临之前的几个月,就在网上预订了一张去洛衫矶的机票。在飞机上,埃齐奥尼好奇地问邻座的乘客花了多少钱购买机票。当得知虽然那个人的机票比他买得更晚,但是票价却比他便宜得多时,他感到非常气愤。于是,他又询问了另外几个乘客,结果发现大家买的票居然都比他的便宜。下一页返回2.2比价网站的成功对大多数人来说,也许下了飞机,就忘记这件事情了。如果真是这样,Farecast也就不会出现了。可是,当时埃齐奥尼已经是美国最有名的计算机专家之一,从担任华盛顿大学人工智能项目的负责人开始,他就创立了许多非常典型的大数据公司,而那时候还没有人提出“大数据”这个概念。1994年,埃齐奥尼帮助创建了最早的互联网搜索引擎Metacrawler,该引擎后来被InfoSpace公司收购。他联合创立了第一个大型比价网站Netbot,后来把它卖给了Excite公司。他创立的从文本中挖掘信息的公司C1earForest则被路透社收购了。在他眼中,世界就是一系列的大数据问题,而且他认为他有能力解决这些问题。上一页下一页返回2.2比价网站的成功飞机着陆之后,埃齐奥尼下定决心,要利用大数据的相关技术,开发一个系统,用来推测当前网页上的机票价格是否合理。作为一种商品,同一架飞机上每个座位的价格本来不应该有差别。但实际上,价格却千差万别,其中缘由只有航空公司自己清楚。埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是分析从一个旅游网站上搜集来的所有特定航线机票的销售价格,并确定票价与提前购买天数的关系,而后建立一个系统,预测当前的机票价格在未来一段时间内会上涨还是下降。如果一张机票的平均价格呈下降趋势,系统就会帮助用户做出稍后再购票的明智选择。反过来,如果一张机票的平均价格呈上涨趋势,系统就会提醒用户立刻购买该机票。上一页下一页返回2.2比价网站的成功这个预测系统建立在41天内价格波动产生的12000个价格样本基础之上,而这些信息都是从一个旅游网站上搜集来的。这个预测系统并不能说明原因,只能推测会发生什么。也就是说,它不知道是哪些因素导致了机票价格的波动。机票降价是因为很多没卖掉的座位、季节性原因,还是所谓的周六晚上不出门,它都不知道。这个系统只知道利用其他航班的数据来预测未来机票价格的走势。这也正是数据科学的思维特点。不再构泥于因果关系,而是注重相关关系。而后,埃齐奥尼的这个项目逐渐发展成为一家得到了风险投资基金支持的科技创业公司,名为Farecast。通过预测机票价格的走势以及增降幅度,Farecast票价预测工具能帮助消费者抓住最佳购买时机,而在此之前还没有其他网站能让消费者获得这些信息(图2-4

)。上一页下一页返回2.2比价网站的成功这个系统为了保障自身的透明度,会把对机票价格走势预测的可信度标示出来,供消费者参考。系统的运转需要海量数据的支持。为了提高预测的准确性,埃齐奥尼找到了一个行业机票预订数据库。有了这个数据库,系统进行预测时,预测的结果就可以基于美国商业航空产业中,每一条航线上每一架飞机内的每一个座位一年内的综合票价记录而得出。点击机票预测的Tip,你可以看到它的详细解释。目前Farecast网站支持70多个北美城市,预测服务的条件是双程、经济舱、旅行时间2到8日、3个月内的机票,这应该包括了大多数查询机票的情况了。2013年,Farecast已经拥有惊人的约2000亿条飞行数据记录。利用这种方法,Farecast为消费者节省了一大笔钱。上一页下一页返回2.2比价网站的成功2008年,埃齐奥尼计划将这项技术应用到其他领域,比如宾馆预订、二手车购买等。只要这些领域内的产品差异不大,同时存在大幅度的价格差和大量可运用的数据,就都可以应用这项技术。但是在他的计划实现之前,微软公司找上了他,并以1.1亿美元的价格收购了Farecast公司。而后,这个系统被并入必应搜索引擎。到2012年为止,Farecast系统用了将近十万亿条价格记录来帮助预测美国国内航班的票价。Farecast票价预测的准确度已经高达75%,使用Farecast票价预测工具购买机票的旅客,平均每张机票可节省50美元。上一页下一页返回2.2比价网站的成功Farecast是大数据公司的一个缩影,也代表了当今世界发展的趋势。5年或者10年之前,奥伦·埃齐奥尼是无法成立这样的公司的。那时候他所需要的计算机处理能力和存储能力太昂贵了!虽说技术上的突破是这一切得以发生的主要原因,但也有一些细微而重要的改变正在发生,特别是人们关于如何使用数据的理念。2.2.2Decide案例详析2013年3月,总部位于美国西雅图(Seattle)的线上比价网站D宣布获得800万美元的C轮融资,主要投资者是VulcanCapital和MadronaVentureGroup。目前,D已经获得总计1700万美元的融资。上一页下一页返回2.2比价网站的成功D提供一种“大数据”的比价服务,它能够抓取亚马逊、百思买等国外多家电商的网站商品数据,把这些数据整合后提供给消费者,方便消费者进行比价决策(图2-5)。D提供的数据服务十分全面,不但提供比价数据,还把这些数据整合成“价格趋势”“购买指标”等指标供消费者决策。例如,D会给一件衣服的出售价格打分,如果这件衣服获得90分,就证明经过数据分析,这件衣服以这个价格是十分值得购买的。D使用大数据的方式对全网络160万件产品进行数据分析,对商品的价格趋势以及购买指标给出分析,使得消费者能够及时购买到物美价廉的商品。目前D也推出了移动客户端,让消费者可以随时了解自己想购买商品的价格信息。上一页下一页返回2.2比价网站的成功D是2011年6月上线的。这家比价预测网站显然很早就意识到了“在互联网时代,固定价格已是过去式”这一点,如今,它已成为美国最为热门的购物风向标,每月用户访问量达数十万户,页面浏览量则超过100万次,并且仍在高速增长。Decide的比价无远弗届(图2-6)。Decide第一个神奇之处就在于,仅靠概念就获得850万美元的投资,这无疑是一个非常典型的美国创新和创业项目,而它的创始人和项目团队同样很传奇。它的联合创始人奥伦·埃齐奥尼,前面已经提到过了,是Farecast的创始人。而首席执行官麦克·弗雷德根则是Farecast的前市场营销和产品开发副总裁,与他们一同起家的还有Farecast的几名工程师。上一页下一页返回2.2比价网站的成功此外,Decide还吸纳了PriceYeti(跟踪网购商品价格变化,并在降价时使用邮件通知用户)、Eggsprout(编撰简历数据)的早期开发人员。在网站上线之前,他们潜心闭关了两年时间,虽然对自己将要开展的业务守口如瓶,但是凭借“让电子购物空前透明化”的口号,他们从Maveron,MadronaVentureGroup、谷歌创始董事会成员拉姆·施拉姆、Expedia前首席执行官埃里克·布拉克福特及其他渠道募得了总计850万美元的融资。在Decide的网站上,他们这样描述自己,“Decide完全利用数据和科技来帮助买家,而不是市场推广的手段”。拥有如此豪华的技术人才阵容,Decide无疑是典型的技术驱动型创业公司,作为一家产品搜索类公司,这是至关重要的。上一页下一页返回2.2比价网站的成功2.2.3对我们的思维模式启示启示一:重要的是思维模式的转变奥伦·埃齐奥尼刚开始开发机票价格预测系统Farecast时,他建立了一个数学模型,以反映票价和提前购买天数之间的关系,最初的预测只是基于41天之内的12000个价格样本。12000个价格样本绝对不符合大数据的4V定义。但是,通过埃齐奥尼卓越的建模能力,人们可以初步窥见价格与日期之间的相关关系,随后再对系统“喂入”新的数据,不断优化模型,提高预测的准确性。所以,Farecast的启示在于,大数据的核心在于思维,而非数据或者技术本身。上一页下一页返回2.2比价网站的成功启示二:数据的极致利用Decide的目的是要解决两个问题:电子产品更新速度过快和市场价格变化过快。通过解决这两个问题,他们希望给潜在购物者提供最好的购物时机建议,而这一切的背后是技术驱动下对数据的挖掘和极致利用。上一页返回2.3基于大数据的个性化推荐系统2.3.1基于亚马逊云的个性化推荐系统亚马逊被誉为在线商城,尤其是个性化推荐的领袖。过去十年,该公司已投入了大量的金钱和智力来建成一套智能推荐系统,它会考虑你的历史浏览记录,过去的购买记录和其他购物者的记录一一所有这些都是为了确保你能买东西。据统计,亚马逊销售额的1/3来自于它的个性化推荐系统。从一开始,亚马逊就从每一个客户身上捕获了大量的数据。比如,他们购买了什么书籍?哪些书他们只浏览却没有购买?浏览了多久?哪些书是他们一起购买的?根据这些数据,亚马逊就能够判断出客户个人的购物喜好,并为客户推荐相关的书籍。有了它,很多大型书店和音乐唱片商店就不得不歇业。下一页返回2.3基于大数据的个性化推荐系统许多电商网站会为用户做出各种推荐,亚马逊也不例外。这家零售巨头的推荐系统基于用户自己的购买浏览记录和行为历史,利用这种“物品到物品的协作筛选”算法来为回头客订制浏览体验。一名数码爱好者可能会发现,登录页面上充满了各种设备推荐;而一位初为人母的妈妈则可能发现推荐给她的都是婴儿产品。除了上述的常规自动推荐外,亚马逊在人上推荐上也花了不少心思。据亚马逊内部员上透露,亚马逊会为员上提供众多基于用户购买和浏览行为的分析上具,但是最终的推荐行为还是由员上自己来做的。如果某位员上需推广一部电影,比如《美国队长》,他就会找出看过其他类似电影的用户,lb他们发送E-mail推荐《美国队长》。上一页下一页返回2.3基于大数据的个性化推荐系统亚马逊的员上在推荐过程中也会关注邮件的打开率、点击率等一些常见指标,但是很独到的一点是,亚马逊会使用一种内部竟争的策略来精选推荐给用户的商品。比如,同时有一本书和一款游戏都可以推荐给一名用户,利润较高的商品会在内部评估中胜出,然后以邮件的形式推荐给用户。你可以想象一下,这一策略推广到所有商品分类时会是一个什么情况:可能会有许多商品都能推荐给一名客户,但是最终只有效率最高的商品推荐邮件被推送到他的邮箱中。这一策略不仅可以有效地预防用户的邮箱被塞满来自亚马逊的邮件,同时又能使销售转化效率最大化。事实上,人上推荐的转化率要远比网络上的自动推荐高出许多。上一页下一页返回2.3基于大数据的个性化推荐系统2.3.2潘多拉(Pandora)--基于基因的推荐系统亚马逊的系统相当棒。它是一个协作购物和自动化的天才,几乎没法复制。这个系统花了亚马逊十年的时间来建造和完善。它基于一个超大的物品和集体行为数据库,该数据库“记住”了你在几年以前和几分钟以前的行为。新公司要怎么样才能跟它竟争呢?事实上,确实是有方法的。答案在一个与在线购物没什么关系的领域找到—遗传学。如你所知,这门科学主要是研究DNA片段,即基因是怎么对人类的特征和行为进行编码的。比如说,一个家庭的成员相貌和行为是相像的,因为他们有相同的基因片段。上一页下一页返回2.3基于大数据的个性化推荐系统遗传学作为一门科学已经存在150多年了,它为医学和历史学提供了强大的上具。但是在2006年1月6日,事情发生了意想不到的转变一一蒂姆·威斯特伦和他的朋友们决定将遗传学的概念应用到音乐上。这就是潘多拉,一个基于基因的推荐系统。8000万以上的注册用户,80亿次以上的点击次数,用户月平均在线时长达10小时以上,并且新用户以每秒一人的速度疯狂增长,它不是Facebook或Twitter成长过程中的一段缩影,这是一家名为“潘多拉”的网络电台,占据着全美前20大网络电台50%以上的市场份额(以时间计)。潘多拉媒体在2月份首次向SEC提交了S-1文件(IPO文件),正准备向华尔街打开它充满魔力的“潘多拉盒子”(图2-7)。上一页下一页返回2.3基于大数据的个性化推荐系统新注册用户首次打开潘多拉网络电台网页时,一个简单精致的音乐盒子出现在面前,我们需要输入自己喜欢风格的歌曲或者歌手的名字,例如我们输入迈克·杰克逊的“BeatIt“。然后单击潘多拉系统自动联想的第一个选项“BeatItbyMichaelJackson”,这样之后,我们就创建了一个名为“BeatIt”的私人电台,"BeatIt”电台主要向用户推送与“BeatIt”风格类似的歌曲。图2-8、图2-9为潘多拉的展示。与传统播放器不同,潘多拉电台并不是直接播放我们选择的歌曲“BeatIt”,而是为我们推送一首风格与“BeatIt”十分相近的“TheWayYouMakeMeFeel”(也可能是其他歌手的歌曲)。图2-10为潘多拉自定制的电台音乐。上一页下一页返回2.3基于大数据的个性化推荐系统那如果厌倦了某种音乐风格怎么办?别急,我们可以通过输入不同风格的歌曲新建另一个“私人电台”,潘多拉网络电台允许每名用户最多建立100个私人电台,然后潘多拉的系统将基于这首不同风格的歌曲重新进行推送。潘多拉网络电台在S-1文件中透露,公司总计拥有14亿个“私人电台”,平均每名注册用户拥有的“私人电台”达17个左右。潘多拉网络电台中最有意思的是它的“基因组计划”。CEO威斯特伦在创立公司的最初专注于打造一款能够分析歌曲的音乐推荐引擎,最后这成了潘多拉网络电台为用户推送音乐的核心。图2-11为潘多拉电台App。上一页返回2.4Target的大数据营销2.4.1案例详析美国第二大超市Target塔吉特)是最早玩大数据的零售商,他们拥有专业顾客数据分析模型,可通过对购买行为的精确分析,判断出早期怀孕人群的类别,然后先于同行精准地向他们营销商品。2012年,在美国发生了一件趣闻,一名男子闯入了他家附近的超市--Target“你们怎么能这样!”男人向店铺经理大吼道,“你们竟然给我17岁的女儿发婴儿尿片和童车的优惠券,她才17岁啊!”店铺经理不知道发生了什么,立刻向来者道歉,表明那肯定是个误会。然而,经理没有意识到,公司正在运行一套大数据系统。一个月后,这个愤怒的父亲打来电话道歉,因为Target发来的婴儿用品促销广告并不是误发,他的女儿的确怀孕了。Target比这位父亲知道他女儿怀孕的时间足足早了一个月(图2-12

)。下一页返回2.4Target的大数据营销原来是Target超市在运行一套大数据系统。这套系统会记录每一位客人在店内的消费行为(就是买过什么东西),然后通过已建立的数学分析模型,推导出客人在接下来一段时间中可能会购买的东西。Target能够通过分析女性客户的购买记录,“猜出”哪些是孕妇。分析部门通过“迎婴聚会”的登记表上的数据得到启发,许多孕妇从第2个妊娠期开始,便会购买许多大包装的无香味护手霜;在怀孕的最初20周,大量购买补充钙、镁、锌的善存片之类的保健品。最后他们选出了25种典型商品的消费数据,构建了“怀孕预测指数”,通过这个指数,Target能够在很小的误差范围内预测出顾客的怀孕情况,因此,Target就能精确地把孕妇优惠广告寄发给顾客。Target把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优惠广告当中,这样顾客就不知道Target判断出她怀孕了,Target做到了没有千扰的销售。上一页下一页返回2.4Target的大数据营销结果,其孕期用品销售呈现了爆炸性的增长。2002-2010年,Target的销售额从440亿美元增长到了670亿美元。大数据的巨大威力轰动了全美。我们难以想象,许多孕妇在浑然不知的情况下成了塔吉特的忠实拥夏,许多孕妇产品专卖店也在浑然不知中破产。如果不是在拥有海量的用户交易数据基础上实施数据挖掘,Target不可能做到如此精准的营销。2.4.2给我们的思维模式启示启示:数据科学的应用己经渗入生活的方方面面。诸如此类的应用,在国际零售行业巨头中己屡见不鲜,我们以Target作为首例,是因为它的案例的确留给人们强烈的印象:数据的力量,不仅使商家提升了业绩,还让客户为之心甘情愿买单。上一页返回2.5社交网络数据之于对冲基金案例评析。对冲基金通过剖析社交网络Twitter的数据信息,可以来预测股市的表现,这已经成为了事实。早在2011年,DerwentCapitalMarkets(英国对冲基金)便建立了一个规模为4000万美元的对冲基金,矛!{用Twitter来帮助公司投资。这个世界首家基于社交媒体的对冲基金会通过关注Twitter内容(Tweet),即时地感知市场情绪,然后再进行投资。“很久以来,投资者都已经广泛地认可金融市场是由恐惧和贪婪所驱使的这一事实,但是我们此前从未拥有一种可以量化人们情感的技术或者数据。”DerwentCapitalMarkets的创始人保罗·霍汀在其发给大西洋月刊的邮件中表示。他认为有了Twitter,投资者终于有了一扇可以了解“恐惧世界”的窗。下一页返回2.5社交网络数据之于对冲基金老道的投资者为什么会放弃他们的专业知识转而相信Twitter来进行高达几百万美元的投资?让我们来看一下该基金的运作方式。我们这样想,如果Twitter可以预测公众情绪,而公众情绪可以预测股票市场,那么Twitter可以预测股市吗?多年前,股票交易者就已开始通过了解人们的共同情绪来预测股价的走势。但是现在,专家们发现,Twitter消息由于具有直接性的特点,因而可以更准确地测量人们的情绪。以前,人们以为股市的跌落会导致人们产生负面情绪,但是,现在看来事实正好相反。位于英国伦敦中部梅菲尔的基金公司DerwentCapitalMarkets的分析师,通过一套分析程序来评估人们的共同情绪是高兴、悲伤、焦虑,还是疲惫,从而确定他们的投资行为。因为他们相信,这样做能够预测到股市的涨跌行情。上一页下一页返回2.5社交网络数据之于对冲基金这套分析程序原本是由印第安纳州大学信息和计算机系教授约翰·博伦设计的。它随

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论