数据湖还是数据沼泽_第1页
数据湖还是数据沼泽_第2页
数据湖还是数据沼泽_第3页
数据湖还是数据沼泽_第4页
数据湖还是数据沼泽_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

KSGKSG案-数数? 1不要让数据湖成数据沼泽述数数数通数驱数数。数数数数。将器。备统达0。为。企。

数遵:保数来数力数时文各数建理和数为T数。问,。性自目数式应关种目数数术数各来保数数数合。OstIem™数下化如emetAnys提的持数数的sAP或Hadoop数数。

通程监可年5收举延。图境传数数数数,数数数跟数化通数数式越以传持数数很。在数据湖环境中,原始数据以原始状态推送到存储。这可以是结构化、非结构化,blob形式等。与数据库一样,您不需要预先定义数据元素如何相互关联(数据模型),当您从数据湖中检索数据时才创建据关系。这也是数据湖的主要缺点。借助数据库和据仓库,业务人员(而非IT人员)可以在复杂的

据模型中查询数据,而数据建模工作是由IT专家事先完成的。在数据湖的情况下,用户需要具有数据科学家的知识,才能分析各种数据块并将它们连接在一起以便合理使用。表1总结了数据仓库与数据湖的键特征。对理的构构量数用本计配定配重新配置性士数等表数数湖”“失,之“。图2:数据处理的“完美世界”。缺了什么?案由。能特不型原有

位性远。安数图概述化数集。数供监。对数据进行集成和标准化访问的益处数提了数业数程可程整通个在整位佳位重速当T数一

数备整所施这施上重新程的最时通于年5美收举设。个要交大集成了数据湖的时序数据架构时序或实时架构技术的选择取决于企业的特点和求。实时架构系统的市场有以下几种情况:基于供应商的自动化,如霍尼韦尔PHD、或横Exaquatum等基于开源系统的InfluxDB、GraphitePrometheus基于大型设备供应商,如西门子XHQ独立于供应商的系统,如OSIsoftPISystem基于自动化供应商的时序数据架构像霍尼韦尔和横河这样的自动化供应商有他们自己用的实时架构。这些工具很好地集成在他们的自动工具包中。缺点是与其他工具包相比,这些工具的析能力有限,不能很好地整合到大数据环境中。开源的时序数据架构InfluxData等系统起源于从联机系统收集实时信息进行性能监控和警报。2013年推出InfluxData后不久,用于收集实时数据的接口在社交媒体中迅速扩展。在物联网世界持续延展。InfluxData是各种开源计划的整合:Telegraf用于连接、InfluxDB用于时序数据存储、Chronograf用于可视化、Kapacitor用于检测和警报。

基于设备的时序数据架构西门子等设备供应商需要专门的系统来优化他们提的服务。他们需要时序系统对大型旋转设备(如风涡轮机)进行远程监控。涡轮机市场的增长也推动这些平台的发展。基于独立供应商的时序数据架构独立供应商开始填补数据收集、分析和可视化等方面的空白。两个供应商在这个领域脱颖而出:开发了InfoPlus21系统的AspenTech以及开发了System时序数据架构的OSIsoft。InfoPlus21专注于小规模、类似MES的功能和本地工厂;而OSIsoftPISystem则被设计为一个通用的实施架构管理范围从风力涡轮机等单一资产到整个工厂。需要捕获、共享和分析数据的企业、企业社区、供应商和监管机构都可以使用PISystem。支持不同类型数据源(450+)的各种接口是OSIsoftPISystem工具的主要优点之一。数据没有任何障碍便可进入系统。这意味着客户不需要额外的开发或意外的IT成本来连接数据源。同时,具有流式分析功能的完整上下文引擎可确保捕获数据的巨大体量和多样性,并将实时数据转化为有价值的信息供不同的人员使用-从工工程师到从事数据湖工作的数据科学家。述表表较-续键为数数保数数数据近建每数发数并提下为通解单数。图4:将操作数据流式传输到多个应用程序。每个义压温任位位置

流和有户,名将数。

常非T构所和将的+系。 据 软ue云 成 就Ost的Iem模数射由emetAnys提短。换模图5:利用ElementAnalytics加速实现数据结构数数何数量数通过数数数对数等数序。数如Ost的Bunsgr用emetAnys,是T数大

数像Cemx备数要6具将分Ost并值T数,务C论工数存数推数数据数数数工数行关数入保数化。工味工数数:界标的实营图6:企业运营基础架构是确保数据能够分析,进而支持数据计划的基础。tIem级及集使t的Iem补。

此外,PISystem构建在自助服务模型上,使用时需要额外的软件开发和复杂的IT基础架构。无需型(昂贵)的IT团队,OSIsoftPISystem就能功实施。大多数业务创新可以由关键业务用户(主专家)自己完成。易于集成、无需进行额外开发以使用简单这些特性大大降低了这类基础架构的总体拥有成本(TCO)。O

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论