HBase分布式数据库技术与应用 课件1项目一-任务一-认识HBase_第1页
HBase分布式数据库技术与应用 课件1项目一-任务一-认识HBase_第2页
HBase分布式数据库技术与应用 课件1项目一-任务一-认识HBase_第3页
HBase分布式数据库技术与应用 课件1项目一-任务一-认识HBase_第4页
HBase分布式数据库技术与应用 课件1项目一-任务一-认识HBase_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《HBase分布式数据库实战》课程核心知识:HBase安装、部署、配置、HBaseShell语法、HBaseAPI编程。课程介绍:以能力为本位、以职业实践为主线、以项目课程为主体。培养技能目标:HBase安装、部署、配置能力、HBaseShell操作能力、HBaseAPI编程能力。课程简介课时分配基础篇HBase分布式数据库实战HBase是一个分布式存储、数据库引擎,可以支持千万的QPS、PB级别的存储,这些都已经在生产环境验证,并且在广大的公司已经验证。特别是阿里、小米、京东、滴滴内部都有数千、上万台的HBase集群。篇章引入章节任务HBase分布式数据库实战项目一认识HBase任务一浅谈Hbase的由来任务引入淘宝的实时个性化推荐服务,中间推荐结果存储在HBase中,广告相关的用户建模数据也存储在HBase中,用户模型多种多样,可以用于多种不同场景,例如,针对特定用户投放什么广告,用户在电商门户网站上购物时是否实时报价等。任务概要任务描述:本任务将讲解大数据分布式数据库HBase的发展历史和使用场景,让大家对HBase有初步认识。任务教学目标:了解HBase的由来、使用场景。一数据创新二海量数据与NoSQL教学内容三HBase的由来四HBase的崛起五HBase的使用场景数据创新知识点一挑战需要实现更快地传输数据、高效存储和访问数据。5G、人工智能和边缘智能设备等技术结合在一起。2020英特尔新闻发布会上,英特尔公司首席执行官司睿博表示:2015年以来全球数据量每年增长25%,50%的数据来源于边缘端,全球560亿设备,相当于每个人有7个。到2025年,全球数据量估计达到175ZB(一)数据创新海量数据与NoSQL知识点二(二)海量数据与NoSQL关系型数据库的优缺点关系型数据库的优缺点优点缺点保持数据的一致性(事务处理)大量数据的写入处理(这点尤为重要)由于以标准化为前提,数据更新的开销很小(相同的字段基本上都只有一处)为有数据更新的表做索引或表结构(schema)变更可以进行Join等复杂查询字段不固定时应用对简单查询需要快速返回结果的处理HBase的由来知识点三(三)HBase的由来Google的三驾马车BigTableGFSMapReduceHadoopHBase1.HBase的由来(三)HBase的由来1.HBase的由来HBase历史年份事件Nov2006谷歌公布BigTable文件。Feb2007最初的HBase原型创建由

Hadoop

贡献。Oct2007随着Hadoop0.15.0,第一个可用的HBase也发布了。Jan2008HBase成为

Hadoop的子项目。Oct2008HBase0.18.1发布。Jan2009HBase0.19发布。Sept2009HBase

0.20.0

发布。May2010HBase成为Apache的顶级项目。HBase的特点数据多版本面向列大数据类型单一稀疏无模式(三)HBase的由来2.HBase的特点HBase的崛起知识点四HBase是一个分布式的、面向列的开源数据库,该技术来源于FayChang所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。HBase的定义(四)HBase的崛起列的可以动态增加,并且列为空就不存储数据,节省存储空间。HBase自动切分数据,使得数据存储自动具有水平scalability。HBase可以提供高并发读写操作的支持。不能支持条件查询,只支持按照Rowkey来查询。(四)HBase的崛起2.HBase崛起的原因HBase的使用场景知识点五HBase为语料库中的文档提供了存储。Bigtable支持行级的访问,以便抓取工具可以插入或更新单独的文档。爬虫不断抓取互联网新的页面。这些网页都存储在Bigtable的文档记录。MapReduce的作业运行在整个表上,为页面搜索应用程序生成搜索索引。用户发起网络页面搜索请求。网络页面搜索应用程序查询搜索索引,然后直接从Bigtable中找出匹配的文档。查询的结果返回并呈现给用户。(五)HBase的使用场景1.典型互联网搜索问题在本任务中,我们主要学习了以下内容:数据创新海量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论