版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
负责人:黄金凤010203目录信息来源数据类型来源大数据的构成大数据的来源1信息来源信息来源主要从信息管理系统、网络信息系统以及物联网系统中获取大量信息。信息来源1.信息管理系统信息管理系统主要通过用户输入和系统二次加工的方式产生数据,其产生的数据大多数为结构化数据,通常存储在数据库中。2.网络信息系统在本质上,网络信息系统是信息管理系统的延伸,是专属于某个领域的应用,具备某个特定的目的。3.物联网系统物联网是新一代信息技术,其核心和基础仍然是互联网,是在互联网基础上延伸和扩展的网络。数据类型来源数据类型来源主要有三大类型分别是:传统商业数据、互联网数据以及物联网数据。数据类型来源1.传统商业数据(1)来自企业ERP系统、各种POS终端及网上支付系统等业务系统的数据。(2)传统商业是主要的数据来源。2.互联网数据(1)具有大量化,多样化,快速化等特点。(2)指网络空间交互过程中产生的大量数据。(3)互联网是大数据信息的主要来源。3.物联网数据物联网数据是除了人和服务器之外,在射频识别、物品、设备、传感器等节点产生的大量数据,包括射频识别装置、音频采集器、视频采集器、传感器、全球定位设备、办公设备、家用设备和生产设备等产生的数据。大数据的构成目前围绕Hadoop体系的架构包括:传统大数据架构、流式架构、Lambda架构以及Kappa架构。大数据的构成传统大数据架构数据分析的业务没有发生任何变化,但是因为数据量、性能等问题导致系统无法正常使用,需要进行升级改造,那么此类架构便是为了解决这个问题。依然保留了ETL的动作,将数据经过ETL动作进入数据存储。数据分析需求依旧以BI场景为主,但是因为数据量、性能等问题无法满足日常使用。流式架构在传统大数据架构的基础上,流式架构数据全程以流的形式处理,在数据接入端将ETL替换为数据通道。经过流处理加工后的数据,以消息的形式直接推送给了消费者。存储部分在外围系统以窗口的形式进行存储。适用于预警、监控、对数据有有效期要求的情况。大数据的构成Lambda架构Lambda架构算大数据系统里面举足轻重的架构,数据通道分为两条分支:实时流和离线。实时流依照流式架构,保障了其实时性,而离线则以批处理方式为主,保障了最终一致性。适用于同时存在实时和离线需求的情况。Kappa架构Kappa架构在Lambda的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代。因此对于Kappa架构来说,依旧以流处理为主,但
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 特种设备作业复工安全培训
- 淋巴引流排毒操作规范
- 疫霉菌综合防治操作规范
- 危险废物规范化管理处置办法
- 肩颈理疗标准流程操作服务指引
- 平行线的判定(第1课时)(课件)2025-2026学年人教版七年级数学下册
- 肩颈理疗项目标准操作流程
- 果树溃疡病杀菌剂使用规范
- 亚健康状态评估调理方案
- 银行从业资格证个人贷款试题及解析
- 山东德百温泉生态科技有限公司地热井矿山地质环境保护与恢复治理方案
- 5.7 三角函数的应用 课件(共22张PPT)
- 2021广州中考语文试题及答案
- YB 4091-1992炭素材料真密度测定方法(蒸馏水煮沸法)
- GB/T 9019-2001压力容器公称直径
- 脑性瘫痪的运动疗法
- GB/T 22036-2017轮胎惯性滑行通过噪声测试方法
- GB/T 18838.5-2015涂覆涂料前钢材表面处理喷射清理用金属磨料的技术要求第5部分:钢丝切丸
- 胸腔积液鉴别诊断课件
- 《重庆谈判》微课课件
- (最新整理)深度学习与卷积神经网络基础理论与实例分析课件
评论
0/150
提交评论