版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hcatalog1.了解Hcatalog基础知识
2.知道为什么选择HCatalog
3.掌握HCalalog架构1.HCatalog简介
2.为什么选择HCatalog
3.HCalalog架构
HCatalog简介HCatalog是Hadoop的表存储管理工具。它将HiveMetastore的表格数据公开给其他Hadoop应用程序。使得具有不同数据处理工具(Pig,MapReduce)的用户能够轻松将数据写入网格。它确保用户不必担心数据存储在何处或以何种格式存储。HCatalog像Hive的一个关键组件一样工作,它使用户能够以任何格式和任何结构存储他们的数据。为什么选择HCatalog为正确的作业启用正确的工具Hadoop生态系统包含用于数据处理的不同工具,如Hive,Pig和MapReduce。虽然这些工具不需要元数据,但它们仍然可以从中受益。共享元数据存储还可以使跨工具的用户更容易地共享数据。数据加载和使用MapReduce或Pig进行标准化然后通过Hive分析的工作流程非常普遍。如果所有这些工具共享一个Metastore,则每个工具的用户可以立即访问使用其他工具创建的数据。不需要加载或传输步骤。为什么选择HCatalog捕获处理状态以启用共享HCatalog可以发布您的分析结果。所以其他程序员可以通过“REST”访问您的分析平台。您发布的schemas对其他数据科学家也很有用。其他数据科学家将您的发现用作后续发现的输入。为什么选择HCatalog将Hadoop与其他一切集成在一起Hadoop作为处理和存储环境为企业开辟了很多机会;然而,为了推动采用,它必须与现有工具合作并扩大现有工具。Hadoop应作为分析平台的输入或与运营数据存储和Web应用程序集成。组织应该享受Hadoop的价值,而无需学习全新的工具集。REST服务使用熟悉的API和SQL类语言为企业打开了平台。企业数据管理系统使用HCatalog与Hadoop平台进行更深入的整合。HCatalog支持以任何可以编写SerDe(串行器-解串器)的格式读取和写入文件。默认情况下,HCatalog支持RCFile,CSV,JSON,SequenceFile和ORC文件格式。要使用自定义格式,您必须提供InputFormat,OutputFormat和SerDe。HCalalog架构HCatalog建立在HiveMetastore的顶部,并结合了Hive的DDL。HCatalog为Pig和MapReduce提供了读写接口,并使用Hive的命令行界面来发布数据定义和元数据探索命令。HCa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考研面试问答题目及答案
- 压疮预防操作考核试题及答案
- 【高中语文】《望海潮》课件+统编版高二语文选择性必修下册
- 2026初级经济师计量经济模块考题及速记答案
- 2023液碱安全隐患排查专项试题及答案解析
- 2024中储粮笔试过线必刷题及超全答案解析
- 2022年幼师同工同酬招聘笔试模考卷附答案解析
- 2023安宁疗护专科护士考核历年真题及参考答案
- 2026年成语故事园测试题及答案
- 保险行业的数字革新-透过科技迎接保险未来
- 数据中心搬迁规划方案
- 2-半乳甘露聚糖产品介绍北京瓜尔润
- 酒店英语面试问题及回答
- 天津高考英语词汇3500
- 历史专业英语词汇
- 吴冬冬:长方体和正方体的认识PPT
- 水文学课件ppt版 课件第七章
- 房屋租赁缴费明细表Excel模板
- GB/T 2677.8-1994造纸原料酸不溶木素含量的测定
- GB/T 20703-2006船舶电气装置取暖和烹调电器
- 医学统计学二项分布 课件
评论
0/150
提交评论