




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据整体生态环境分析报告一、背景介绍2008年末,“大数据”得到部分美国知名计算机科学研究人员的认可,业界组织计算社区联盟(ComputingCommunityConsortium),发表了一份有影响力的白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》。它使人们的思维不仅局限于数据处理的机器,并提出:大数据真正重要的是新用途和新见解,而非数据本身。此组织可以说是最早提出大数据概念的机构。2016年,中国已经全面进入了大数据时代,大数据时代的出现简单的讲是海量数据同完美计算能力结合的结果。确切的说是移动互联网、物联网产生了海量的数据,大数据计算技术完美地解决了海量数据的收集、存储、计算、分析的问题。随着移动互联网、电子地图、电商的崛起,所产生的大量数据及用户所使用的流量及其内容更成为一个个大数据应用的主战场!如何分析加工应用这些大数据,及整体的大数据是有哪些发展趋势,有哪些应用场景本文将一一介绍!二、大数据的应用场景大数据时代最有意义就是利用大数据及大数据技术创造价值,大数据的企业应用场景就是介绍大数据在行业的应用,体现大数据商业价值。大数据的应用场景会将提升企业对大数据的关注,鼓励企业大数据产业中投入更多的资源,利用大数据这个工具,为人类社会造福。大数据的应用可以分为企业应用和政府应用,其关注点有所不同,我们分开介绍,先从大数据在企业应用开始谈起。1)医疗行业医疗行业拥有大量的病例,病理报告,治愈方案,药物报告等等。如果这些数据可以被整理和应用将会极大地帮助医生和病人。我们面对的数目及种类众多的病菌、病毒,以及肿瘤细胞,其都处于不断的进化的过程中。在发现诊断疾病时,疾病的确诊和治疗方案的确定是最困难的。在未来,借助于大数据平台我们可以收集不同病例和治疗方案,以及病人的基本特征,可以建立针对疾病特点的数据库。如果未来基因技术发展成熟,可以根据病人的基因序列特点进行分类,建立医疗行业的病人分类数据库。在医生诊断病人时可以参考病人的疾病特征、化验报告和检测报告,参考疾病数据库来快速帮助病人确诊,明确定位疾病。在制定治疗方案时,医生可以依据病人的基因特点,调取相似基因、年龄、人种、身体情况相同的有效治疗方案,制定出适合病人的治疗方案,帮助更多人及时进行治疗。同时这些数据也有利于医药行业开发出更加有效的药物和医疗器械。医疗行业的数据应用一直在进行,但是数据没有打通,都是孤岛数据,没有办法起大规模应用。未来需要将这些数据统一收集起来,纳入统一的大数据平台,为人类健康造福。政府和医疗行业是推动这一趋势的重要动力。2)生物技术主要是指大数据技术在基因分析上的应用,通过大数据平台人类可以将自身和生物体基因分析的结果进行记录和存储,利用建立基于大数据技术的基因数据库。大数据技术将会加速基因技术的研究,快速帮助科学家进行模型的建立和基因组合模拟计算。基因技术是人类未来战胜疾病的重要武器,借助于大数据技术的应用,人们将会加快自身基因和其它他生物的基因的研究进程。未来利用生物基因技术来改良农作物,利用基因技术来培养人类器官,利用基因技术来消灭害虫都即将实现。3)金融行业大数据在金融行业应用范围较广,典型的案例有花旗银行利用IBM沃森电脑为财富管理客户推荐产品,美国银行利用客户点击数据集为客户提供特色服务,如有竞争的信用额度。,5)数据云服务(DAAS)DaaS的服务主要有WindowsAzureMarketplace、Datasift、SpaceCurve、Factual等6)商业智能产品BI产品主要有Oracle的Hyperion、SAPBusinessObjects,MicrosoftBusinessIntelligence、IBMCongnos,SAS,HP的Autonomy、QlikView等这些产品通常具有分析和可视化能力。7)分析和可视化应用主要产品有SAS,TeraDataAster,EMCGreenplum,TableauSoftware,Tibco等。8)日志应用主要产品有Splunk、Loggly、SumoLogic。其中Splunk是一个可运行于各种平台的IT数据、日志分析软件。9)广告/媒体应用主要产品有MediaScience、BlucefinLaps、RocketFuelDataXu,RecordedFuture.其中RocketFuel是一家广告优化公司,每天处理15亿次品牌广告展示,广告效果完全基于数据来改善。10)垂直应用主要有PredictivePliciing、BloomReach,Myrrix,Atigeo.其中BloomReach公司面向市场开发大数据应用(BDA),通过机器学习,网络爬虫和搜索技术来挖掘数据,对网站的数据进行分析,然后为网站带来更多的流量,从而给他们的客户带来更多的利润。国内的互联网企业在大数据应用和研发方面处于较好的水平例如淘宝、百度、腾讯、新浪等。但是在大数据产品和技术服务领域却落后于国际厂商。国际主流大数据产商包括Cloudera、Hortonworks、MapR,IBM,Oracle,EMC,Intel,SAP,Teredata。四.大数据产业链介绍由于大数据及大数据技术是一个工具,无法像互联网企业那样形成一个大数据生态圈,形成闭环。但是从数据的收集,存贮,处理,分析,销毁等方面分析,可以形成大数据产业链。数据的收集主要是指各种数据通过传感器或其他方式被采集,大数据的的采集除了传统的互连网入口、社交平台、搜索引擎、电商交易数据、在线问答、企业业务数据外,移动互联网的App将是一个重要的数据入口,例如通过手机APP内嵌的SDK将手机App上的用户行为数据集中进行收集和处理,TalkingData目前是这一领域的领先的大数据厂商,他们既有大数据又有数据管理平台DMP。摄像头采集的数据、导航地图的轨迹数据、物流信息、移动互联网App的LBS位置数据等都大数据的重要来源。在这个阶段主要是指拥有大数据的公司例如BAT,通讯行业、互联网企业、物流行业、零售行业、医疗行业等,它们需要大数据采集和存储产品。数据的存储主要是指利用何种方式进行数据存贮,对于中小企业,云存储是以个不错的原则,对于金融行业和其他对数据保有权较为重视的企业,私有云将是一个不错的选择。政府主导的大数据存储平台可以作为参考。如果认为云平台无法采用时,采用低端的并行计算机可能是一个经济的方案,但是由于没有云操作系统,其存储的效率是个较大的挑战。EMC、NetAPP、日立的NAS存储可以考虑。SAN存储由于成本过高,不建议用于大数据存储,但是土豪除外。数据处理数据处理主要是指数据处理平台,采用了SAAS概念的大数据处理平台都可以考虑,企业在考虑处理平台时建议,循序渐进,以未来2年内的数据处理量为参考,千万不要一次投资到位,因为数据处理的技术发展是几何级数的,两年后采用新的技术平台,其ROI将会大大降低,采用Cloudera,Hortonworks,MapR的Hadoop产品都可以,如果其在中国没有成熟团队建议考虑IBM,HP,Oracle的解决方案,他们的案例较多。数据分析主要是指如何对处理完的数据进行商业分析,业务需求和技术需求必须有本企业技术和商业人员主导,外部厂商很难了解企业自身的商业需求,但是数据展现形式和分析方式可以交给厂商来做,主要涉及的厂商是传统的商业智能产品和可视化应用,包括Oracle的Hyperion、Teredata、SAPBusinessObjects,IBMCongnos,SAS,HP的Autonomy、QlikView等。数据销毁主要是指数据如何进行安全管理,对于不再需要的数据如何进行销毁,鉴于数据的数量较大,存储需要重用,因此数据索引删除、数据空间7次重写,数据混淆、数据对称加密等方式都可以用作数据销毁,目前此阶段市场需求不多,因此还没有较为成熟的方案和厂商,未来将会用安全厂商进入此领域。由于目前大数据产业的商业模式和盈利模式还在探索之中,大数据带来的直接收益还没有明确,目前主要的商业形式还是大数企业自身的大数据应用(例如,大数据计算平台,大数据采集和分析,数据分析报告),行业应用处于一个探索的阶段,在大数据较为集中的电信行业,并没有成立数据事业部,数据被当作资产良好的保存起来,国外的大数据投资`在2005年就开始了,很多高科技企业已经大数产业链上投入巨资进行技术开发和行业应用。五.大数据隐私保护大数据的隐私和伦理已经争论了很多年,由于其涉及我们每个人的自身利益,大数据隐私保护是大数据产业需要正面面对的问题。大数据在采集过程中必定会涉及到隐私数据,的收集,如果其保护的不好将会造成严重的后果,成为大数据产业发展的瓶颈。过度强调大数据的商业应用而忽视了大数据产业的隐私保护,将会产生灾难性的后果,大数据产业的发展可能会因此被禁止。过度强调隐私保护而不发展大数据产业也是一个错误的选择,人类可能会错失一个高速发展的机遇。大数据产业发展要建立在隐私保护基础之上,同时隐私保护也将通过适当约束来助推大数据产业的发展。大数据企业在采集外部数据时,应该注意尽量不要收集可以识别出个人的PII信息,参照美国个人隐私定义者,PII信息包括姓名、地址、手机号码、身份证号、驾驶证号、银行帐号、借记卡/信用卡号。大数据企业在使用自身拥有的信息时也要注意保护敏感信息例如民族、政治意见、宗教信仰、健康/医疗信息,婚姻状况、性生活、年龄、性别、犯罪记录、个人喜好、标准IP地址等。大数据企业应该在其公司的章程和文件中体现对个人隐私数据的保护,坚持遵守全球隐私保护7条原则;1)知晓权(透明性):应该通知本人关于所收集信息的目的2)选择权:提供机会选择或放弃所提供的个人信息是否被使用或如何被使用3)同意权:再符合知晓权和选择权的情况下才可以向第三方透露个人数据信息4)安全权:采取负责的措施保护个人信息免受丢失、滥用、未授权获取、泄露、篡改、毁坏的威胁5)数据完整性:确保个人信息在最终用途、合理防护方面的可靠性,确保信息精确、完整、无误。6)可查询:提供本人查询个人信息的途径7)责任性:企业有责任遵守上述法则,并应确保合规的机制。大数据企业面对的数据分为公开数据,授权数据,隐私数据。公开数据来源于公共媒体因此可以无须强调保护,授权数据来源于数据收集过程中,客户对企业的授权,需要依据签订的协议使用范围来使用,不能过越权进行数据转让和贩卖,大数据企业仅能在签署的授权范围内部进行使用,企业在使用大数据时尽量使用分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC TS 62453-53-90:2025 EN Field Device Tool (FDT) Interface Specification - Part 53-90: Communication implementation for CLI and HTML – IEC 61784 CPF 9
- 【正版授权】 ISO/IEC 14763-5:2025 EN Information technology – Implementation and operation of customer premises cabling – Part 5: Sustainability
- 2025年中级经济师考试卷及答案
- 2025年药学专业附加考试试卷及答案
- 2025年非遗传承人资格考试试题及答案
- 2025年大数据分析专业考试试题及答案
- 2025年核工程与核技术专业考试卷及答案
- 一级安全考试题库及答案
- 吊装运输合同协议书
- 高三文科政治备考工作方案
- 大风天气下的物流运输安全措施
- 老旧小区加装电梯使用公约协议
- 新生儿护理安全用药
- 2025年湖北省新华书店集团有限公司招聘笔试参考题库含答案解析
- 医疗护理医学培训 临时起搏器的使用及参数调整课件
- 《中国妇女妊娠期体重监测与评价》(T-CNSS 009-2021)
- 情境教学法在初中函数教学中的实践研究
- 2025年湖南湘西自治州公开招募“三支一扶”高校毕业生高频重点提升(共500题)附带答案详解
- 2024年国家公务员考试行测真题附解析答案
- 店长晋级管理制度内容
- 行政组织学 课件 第6章 行政组织决策
评论
0/150
提交评论