版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主讲人:王超宁波城市职业技术学院工业互联网数据采集技术——工业大数据平台序言面对海量的工业数据,传统的数据处理方式已然不能满足当下的行业需求,针对企业大量的数据存储与数据分析需求,该如何高效的进行快速处理?目录CONTENTS静态数据和流数据1批量计算与流式计算2大数据平台--Hadoop3静态数据和流数据01PARTONE01静态数据和流数据静态数据01静态数据和流数据B数据顺序不规律系统无法控制将要处理的新到达的数据顺序。C数据量大例如:发电风机峰值状态下,两万台风机每秒会产生逾千万条数据。A数据回传速度快例如:某企业发电风机数据回传频率高达每秒50组/s。D整体价值注重数据的整体价值,不过分关注个别数据。流数据的特征02PARTTWO批量计算与流式计算批量计算与流式计算02外部系统联机事务处理系统OLTP文档批量加载数据仓库静态数据数据集市联机事务分析系统报表查询图表数据源数据存储与管理挖掘与分析引擎数据应用02批量计算与流式计算输入数据流SparkStreamingSparkEngine数据切片输出结果02批量计算与流式计算计算模式批量计算流式计算数据到达计算开始前数据已准备好计算进行中数据持续到来计算周期计算完后会结束计算一般会作为服务持续运行应用场景时效性要求低的场景时效性要求高的场景03PARTTHREE大数据平台--Hadoop03大数据平台--Hadoop产品物料产线工艺质量设计客户市场供应链数据来源对象感知实时采集数据核查批量路由批量采集数据采集数据预处理数据存储数据预处理与存储用户建模产品建模产线建模工厂建模设备建模工艺建模数据可视化数据开放数据融合数据挖掘数据建模数据分析虚拟仿真资产优化虚拟仿真资产优化柔性制造供需匹配智能服务远程维修智能化生产协同化组织个性化定制服务化制造决策与控制应用大数据平台--Hadoop03多台机器每台机器上部署不同组件集群分布式多台机器每台机器上部署相同组件
分布式、集群是两个不同的概念,但口语中经常混淆二者。大数据平台--Hadoop03
分布式、集群的共同点是:都是多台机器(服务器)组成的;
因此口语中混淆两者概念的时候都是:相对于单机来说的。系统A服务器1系统B系统C服务器2服务器3系统A服务器1.1系统A服务器1.2系统A服务器1.3系统A组成的集群大数据平台--Hadoop03单机存储有瓶颈多台机器分布式存储单机计算能力有限多台机器分布式计算如何计算?如何存储?
数据大爆炸,海量数据处理场景面临问题大数据平台--Hadoop03MapReduce分布式计算Yarn资源调度HDFS数据存储大数据平台--Hadoop03数据块Client写复制DataNodesDataNodesClientNameNode读取元信息读取数据块元信息(Metadata)大数据平台--Hadoop03Split0Split1Split2Split3Split4输入数据Mapper
TaskMapper
TaskMapper
TaskReducer
TaskReducer
TaskOUTPUT输出数据Map阶段Shuffle阶段Reduce阶段中间结果大数据平台--Hadoop03Deer
Bear
RiverCar
Car
CarDeer
Car
BearDeer
Bear
RiverCar
Car
CarDeer
Car
BearDeer
1Bear
1River
1Car
1Car
1River
1Deer
1Car
1Bear
1Beer
1Bear
1Car
1Car
1Car
1Deer
1Dear
1River
1River
1Beer
2Car3Dear
2River
2Bear
2Car
3Dear
2River
2输入输出SplitMapShuffleReduce小结静态数据与流数据批量计算与流计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 评估压疮的风险因素
- 家庭教育子女成长辅导指南
- 数据接口对接安排确认函3篇范文
- 团队协作效率提升九项方法指南
- 个人数据分析技能提升手册
- 剖腹产产妇的床上活动与护理
- 2026年营销管理高级笔试模拟题集
- 妇产科护理副高:不孕不育护理知识
- 2026年高企申报知识产权流程
- 文明礼仪公约倡议书(6篇)
- 智能网联汽车计算平台部署与测试 课件 5.6 ROS通信系统的构建
- 2024年新高考I卷数学高考试卷(原卷+答案)
- 商务数据分析基础与应用(微课版)王华新课后题答案
- 家具公司品质检验流程手册
- 拜访函公文格式范文8篇-20210830125246
- DLT 5293-2013 电气装置安装工程 电气设备交接试验报告统一格式
- 医疗机构放射防护管理规范
- 餐饮从业人员有害生物防治知识培训
- 人工智能对人类生活的影响与改变
- 煤矿智能供电系统技术导则
- 抑郁病诊断证明书
评论
0/150
提交评论