版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
NoSql课后习题[复制]第1章
1.(多选)下列关于数据库的叙述错误的是()*A)数据库系统是一个独立的系统,不需要操作系统的支持(正确答案)B)数据库按照特定数据模型来组织、描述、存储和管理数据C)数据库系统就是数据库管理系统(正确答案)D)数据库应用程序可以直接访问数据库中的数据(正确答案)2.(单选)下列数据库技术的出现顺序哪个是正确的()[单选题]*A)层次数据库->网状数据库->NoSQL型数据库->关系型数据库->NewSQL型数据库B)层次数据库->网状数据库->NoSQL型数据库->关系型数据库->NewSQL型数据库C)层次数据库->网状数据库->关系型数据库->NoSQL型数据库->NewSQL型数据库(正确答案)D)层次数据库->NoSQL型数据库->网状数据库->关系型数据库->NewSQL型数据库3.(多选)下列数据库哪些不是开源免费的()*A)Oracle(正确答案)B)MySQLC)SQLServer(正确答案)D)DB2(正确答案)4.(多选)下列数据库哪些属于非关系型数据库()*A)MongoDB(正确答案)B)MySQLC)Redis(正确答案)D)HBase(正确答案)5.(多选)下列数据库哪些是国产数据库的代表()*A)TiDB(正确答案)B)MySQLC)DM(正确答案)D)GuassDB(正确答案)6.(多选)关系模式分解可以解决关系型数据库的哪些问题()*A)数据冗余(正确答案)B)插入异常(正确答案)C)修改异常(正确答案)D)删除异常(正确答案)7.(多选)传统关系型数据库无法处理具有4V特征的大数据的原因是()*A)无法高效存储大规模数据(正确答案)B)执行复杂关联查询的效率低(正确答案)C)无法存储半结构化、非结构化数据(正确答案)D)不擅长执行OLAP和数据挖掘(正确答案)8.(多选)NoSQL适用于数据规模大和并发用户多的大数据时代,主要原因如下()*A)保留了传统关系数据的一些优点:无插入、删除、修改异常(正确答案)B)克服了传统关系数据的一些缺点:并发访问性能不高,存储数据量不大,单列读写速度慢,聚合操作效率低(正确答案)C)具有关系型数据库没有的新特性:可水平扩展,面向列存储,能动态增加列,空值不占用实际存储空间,数据冗余存储,多时间版本,无固定数据类型,适应半结构、非结构化数据的存储等D)擅长联机事务处理OLTP,支持多行事务,擅长多表关联查询9.(多选)下列关于NewSQL数据库的叙述哪些是正确的()*A)相比OldSQL更具有性能和容量上的优势(正确答案)B)相比OldSQL同样支持SQL和ACID特性(正确答案)C)相比NoSQL同样具有大规模数据的存储管理能力(正确答案)D)相比NoSQL能支持事务处理和复杂关联查询(正确答案)10.(多选)下列关于数据库技术的叙述哪些是错误的()*A)传统关系型数据库OldSQL已经因过时而被取代(正确答案)B)非关系型数据库NoSQL不再使用SQL语言(正确答案)C)NewSQL是对各种可扩展、高性能的新型数据库的统称D)OldSQL、NoSQL和NewSQL会同时存在、互为补充、共同发展第2章
1.(多选)下列关于集中式系统的叙述正确的是()*A)所有数据和应用都集中部署在一个中心计算机节点(正确答案)B)所有功能服务都由中心节点集中处理(正确答案)C)用户少、业务闲、数据小、并发低,负载轻(正确答案)D)业务系统多部署在广域网2.(多选)下列关于分布式系统的叙述正确的是()*A)运行在多台普通计算机所组成的集群上(正确答案)B)所有数据和应用在空间上散布在不同计算机节点(正确答案)C)用户多、业务忙、数据大、并发高、负载重(正确答案)D)用户感觉有多个高性能服务器在提供服务3.(多选)分布式系统可能出现哪些问题()*A)网络通信异常(正确答案)B)系统节点宕机(正确答案)C)系统网络分区(正确答案)D)系统整体失效4.(多选)下列对分布式系统CAP定理的叙述正确的是()*A)分布式系统不可能同时满足一致性、可用性和分区容错性(正确答案)B)分布式系统可以同时满足一致性和分区容错性(正确答案)C)分布式系统的分区容错性必须满足(正确答案)D)分布式系统可以同时满足一致性和可用性5.(多选)下列对分布式系统BASE理论的叙述正确的是()*A)对CAP定理中的一致性和可用性进行折中权衡(正确答案)B)即使出现不可预知的故障仍能基本可用(正确答案)C)不要求数据一直保持强一致状态(正确答案)D)系统能在有限时间内最终达到数据的一致性(正确答案)6.(多选)下列对HBase的介绍哪些是正确的()*A)是Apache软件基金会顶级开源数据库项目(正确答案)B)源于谷歌公司发表的BigTable论文(正确答案)C)能处理上亿行、上百万列数据组成的一张庞大数据表(正确答案)D)是面向行存储的非关系型数据库7.(多选)下列对HBase和谷歌BigTable的比较哪些是正确的()*A)HBase是谷歌公司BigTable的开源实现(正确答案)B)文件存储:BigTable使用谷歌GFS,HBase使用HadoopHDF(正确答案)C)海量数据处理:BigTable使用谷歌MapReduce,HBase使用HadoopMapReduce(正确答案)D)分布式协调服务:BigTable使用谷歌Chubby,HBase使用ZooKeeper(正确答案)8.(多选)下列对HBase和关系型数据库的比较哪些是正确的()*A)硬件架构:HBase部署在分布式集群,关系型数据库运行在传统多核架构服务器(正确答案)B)数据容量:HBase数据容量大,关系型数据库数据容量相对较小(正确答案)C)存储方式:HBase采用面向列的存储方式,关系型数据库采用面向行的存储方式(正确答案)D)可扩展性:HBase能实现灵活水平扩展,传统关系型数据库难以实现水平扩展(正确答案)9.(多选)下列哪些是HBase的适用场景()*A)持久化存储大量规模数据(正确答案)B)要求有良好的随机读写性能(正确答案)C)需要执行跨行的数据库事务D)需要处理历史数据和时间版本(正确答案)10.(多选)下列对HBase和Hadoop关系的叙述哪些是正确的()*A)正确选择对应的Hadoop支持版本,对于HBase能否安装部署成功很关键(正确答案)B)Hadoop的HDFS在底层为HBase提供分布式文件存储系统(正确答案)C)Hadoop的MapReduce能直接对HBase数据进行分布式批处理(正确答案)D)HBase在底层对Hadoop没有依赖第3章
1.(多选)下列关于HBase基本组成架构的叙述正确的有哪些()*A)HBase自身运行时主要有HMaster和HRegionServer两个守护进程(正确答案)B)HBase的正常运行依赖于ZooKeeper(正确答案)C)生产环境下HBase通常使用外部Hadoop集群的HDFS作为底层存储(正确答案)D)HBase不能使用本地Linux文件系统作为底层存储2.(多选)HBase正常运行时可能所需要运行的守护进程有哪些()*A)HBase的两个守护进程HMaster和HRegionServer(正确答案)B)内置ZooKeeper守护进程HQuorumPeer(正确答案)C)外部ZooKeeper集群会运行守护进程QuorumPeerMain(正确答案)D)外部Hadoop会运行守护进程NameNode和DataNode(正确答案)3.(多选)下列关于HBase的部署方式的叙述正确的有哪些()*A)单机部署方式是HBase的所有组件都部署和运行于单台计算机节点(正确答案)B)单机部署方式下HBase的单个守护进程都只部署运行在唯一的物理计算机节点上(正确答案)C)集群部署方式是HBase的所有组件都分布和运行于多台计算机节点组成的集群(正确答案)D)集群部署方式下HBase的多个守护进程分别部署运行在不同物理计算机节点上(正确答案)4.(多选)下列关于HBase部署方式与运行模式组合的叙述正确的有哪些()*A)最简单的单机部署HBase在单台主机上运行,处于单进程运行模式(正确答案)B)完全分布式部署HBase仍然部署在单台主机上,处于多进程运行模式C)伪分布式部署(使用内置ZooKeeper)需要若干台计算机组成小型集群D)完全分布式部署(使用外部ZooKeeper集群)需要多台计算机组成中、大型集群(正确答案)5.(多选)下列关于不同用途的HBase部署方式和运行模式选择叙述正确的有哪些()*A)对于小规模学习、测试用途,建议使用HBase单机部署(正确答案)B)对于企业生产环境,建议使用HBase集群部署方式和完全分布式运行模式(正确答案)C)在完全分布式集群模式下,可以实现HMaster的HA高可用(正确答案)D)生产环境中会使用HBase伪分布式6.(多选)小规模学习、测试用途下HBase所需安装环境的准备工作有哪些()*A)安装虚拟机软件(正确答案)B)安装Linux系统(正确答案)C)下载并解压HBase安装包(正确答案)D)设置主机名和IP地址映射(正确答案)7.(多选)安装运行完全分布式HBase所需满足的依赖条件有哪些()*A)安装JDK并正确设置Java开发环境(正确答案)B)设置各主机节点之间SSH免密登录(正确答案)C)已经安装配置运行Hadoop(正确答案)D)已经安装配置运行ZooKeeper(正确答案)8.(多选)HBase单机部署方式和单进程运行模式的配置参数正确的有哪些()*A)hbase-env.sh文件中HBASE_MANAGES_ZK=true(正确答案)B)hbase-site.xml文件中hbase.cluster.distributed参数值为trueC)hbase-site.xml文件中hbase.rootdir参数值为file:///root/hbase/hbase(正确答案)D)hbase-site.xml文件中perty.dataDir参数值为/root/hbase/zookeeper(正确答案)9.(多选)HBase单机部署方式和多进程运行模式的配置参数正确的有哪些()*A)hbase-env.sh文件中HBASE_MANAGES_ZK=true(正确答案)B)hbase-site.xml文件中hbase.cluster.distributed参数值为false(正确答案)C)hbase-site.xml文件中hbase.rootdir参数值为file:///root/hbase/hbase(正确答案)D)hbase-site.xml文件中perty.dataDir参数值为/root/hbase/zookeeper(正确答案)10.(多选)HBase伪分布式的配置参数正确的有哪些()*A)hbase-env.sh文件中HBASE_MANAGES_ZK=true(正确答案)B)hbase-site.xml文件中hbase.cluster.distributed参数值为true(正确答案)C)hbase-site.xml文件中hbase.rootdir参数值为hdfs://hbase:8020/hbase(正确答案)D)hbase-site.xml文件中perty.dataDir参数值为/root/hbase/zookeeper(正确答案)11.(多选)HBase完全分布式集群(使用内置ZooKeeper)的配置参数正确的有哪些()*A)hbase-env.sh文件中HBASE_MANAGES_ZK=falseB)hbase-site.xml文件中hbase.cluster.distributed参数值为true(正确答案)C)hbase-site.xml文件中hbase.rootdir参数值为hdfs://hbase:8020/hbase(正确答案)D)hbase-site.xml文件中perty.dataDir参数值为/root/hbase/zookeeper(正确答案)12.(多选)HBase完全分布式集群(使用外部ZooKeeper)的配置参数正确的有哪些()*A)hbase-env.sh文件中HBASE_MANAGES_ZK=true(正确答案)B)hbase-site.xml文件中hbase.cluster.distributed参数值为true(正确答案)C)hbase-site.xml文件中hbase.rootdir参数值为hdfs://hbase:8020/hbase(正确答案)D)hbase-site.xml文件中hbase.zookeeper.quorum参数值为master,slave1,slave2(正确答案)13.(多选)HBase伪分布式运行成功后,应该运行以下哪些进程()*A)HMaster(正确答案)B)HRegionServer(正确答案)C)HQuorumPeer(正确答案)D)QuorumPeerMain14.(多选)HBase完全分布式集群运行成功后,master节点应该运行()进程,slave1节点应该运行(BCEF)进程,slave2节点应该运行(BCE)进程*A)HMaster(正确答案)B)HRegionServer(正确答案)C)QuorumPeerMain(正确答案)D)NameNode(正确答案)E)DataNodeF)SecondaryNameNode15.(单选)启动HDFS和HBase的脚本命令分别是()[单选题]*A)start-dfs.sh和hbase-start.shB)dfs-start.sh和hbase-start..shC)start-dfs.sh和start-hbase.sh(正确答案)D)dfs-start.sh和start-hbase.sh第4章
1.(多选)下列关于逻辑模型和物理模型的叙述有哪些是正确的()*A)系统的逻辑模型是对整个系统从逻辑上进行建模(正确答案)B)系统的物理模型是对整个系统从物理上的进行部署(正确答案)C)计算机网络的星形物理部署就是一种典型的逻辑模型D)计算机网络的网状模型是一种典型的物理模型2.(多选)下列关于数据库数据模型的叙述有哪些是正确的()*A)数据库的数据模型是对数据库的逻辑数据结构和物理存储结构的抽象建模(正确答案)B)数据库的逻辑数据模型主要用于数据库系统的分析和设计(正确答案)C)数据库的逻辑数据模型需要考虑逻辑数据结构在物理存储上的具体实现D)数据库的物理存储模型主要用于数据库系统的实现和部署(正确答案)3.(多选)下列关于面向行和面向列存储方式的叙述有哪些是正确的()*A)面向行数据存储方式的数据是以一行数据为单位在物理上连续存储(正确答案)B)传统关系型数据库一般都采用面向列的存储方式(正确答案)C)面向列数据存储方式的数据是以一列数据为单位在物理上连续存储(正确答案)D)HBase是一种面向行存储的分布式数据库系统4.(多选)下列关于面向行和面向列存储方式优缺点的叙述有哪些是正确的()*A)面向行的存储方式擅长增、删、改等数据写入操作(正确答案)B)面向列的存储方式擅长查询、分析等数据读取操作(正确答案)C)面向行的数据存储方式数据查询时会读取无关列(正确答案)D)面向列的存储方式不擅长增删改等写入次数较多的操作(正确答案)5.(多选)下列关于面向行和面向列存储方式适用场景的叙述有哪些是正确的()*A)面向行的存储方式适用于适用于查询操作多OLAP型业务B)面向列的存储方式适用于适用于增删改操作多的OLTP型业务C)面向行的数据存储方式适用于无需经常进行聚合运算的场景(正确答案)D)面向列的存储方式适用于适用于需要聚合运算和数据分析的场景(正确答案)6.(多选)传统关系数据模型具有以下哪些特点是正确的()*A)采用面向行的数据存储方式,主键唯一标识一行数据(正确答案)B)关系表的结构是不是固定的,可以动态增加或删除列C)每个列中允许包含子列D)某个列字段无数据,必须保存一个空值字符NULL(正确答案)7.(多选)在某些新的应用场景中,传统关系数据模型遇到哪些新问题()*A)无法在不修改关系表结构的前提下增加新的列(正确答案)B)某一列中不能保存多个列值(正确答案)C)无数据的空值列会占用物理存储空间(正确答案)D)对于空值很多的稀疏表,会造成物理存储空间的浪费(正确答案)8.(多选)HBase数据模型如何解决以上新问题()*A)可以在不修改表结构的前提下动态增加新的列(正确答案)B)某一列中的值可以有多个时间版本(正确答案)C)空白单元格不占用实际物理存储空间(正确答案)D)逻辑上是一张稀疏表,物理上是面向列连续存储(正确答案)9.(多选)HBase逻辑数据模型具有不同于关系数据模型的哪些新特点()*A)把数据全部保存在一张大表中(正确答案)B)允许表的列中包含子列,且子列是不固定的(正确答案)C)如果子列中没有数据,成为无需保存任何值的空白单元格(正确答案)D)空白单元格不占用实际物理存储空间(正确答案)10.(多选)子列从上到下纵向排列的HBase逻辑数据模型具有哪些特点()*A)具有若干个固定的主列,主列名称是事先定义的(正确答案)B)每个主列下面包含多个纵向排列的子列,子列是动态插入的,子列名称是不固定的(正确答案)C)每个子列由子列名和子列值组成,构成一个名值对的对应关系(正确答案)D)每个子列都对应有唯一的主键,所有主键相同的子列都属于相同行(正确答案)11.(多选)HBase物理存储模型具有以下哪些特点()*A)每个物理数据存储单元由行键、主列名、子列名和子列值四个字段构成(正确答案)B)面向列的数据存储方式,所有物理存储单元连续存储数据(正确答案)C)可以看成由连续多个键值对<Key,Value>组成的物理存储表(正确答案)D)每个子列都对应有唯一的主键,所有主键相同的子列都属于相同行(正确答案)12.(多选)把不同主列的数据分开存储的HBase物理存储模型具有以下哪些特点()*A)属于不同主列的子列数据在物理上完全分开、独立存储的(正确答案)B)属于相同主列且行键相同的的数据在物理上是一起存储的(正确答案)C)行键是可重复、冗余的,存储属于不同主列的不同子列数据的行键相同(正确答案)D)可以理解为由行键、主列、子列名三个维度坐标唯一确定一个单元格值(正确答案)13.(多选)带有时间版本的HBase物理存储模型具有以下哪些特点()*A)增加了新字段“时间版本”,数据具有时间版本(正确答案)B)由“行键、主列名、子列名、时间版本”四个字段共同唯一确定一个子列值(正确答案)C)一个单元格可以存储多个值,一个当前值和若干个历史值(正确答案)D)具有保存数据历史版本的能力,具有时间数据库的特征(正确答案)14.(多选)用标准术语定义HBase数据模型包括以下哪些主要概念()*A)表(Table)(正确答案)B)行键(RowKey)(正确答案)C)列族(ColumnFamily)(正确答案)D)列限定符(Qualifier)(正确答案)E)单元格值(Cellvalue)(正确答案)F)时间戳(TimeStamp)(正确答案)15.(多选)下列关于表(Table)概念的叙述哪些是正确的()*A)即“一张HBase大表”(正确答案)B)HBase使用一张大表来存储数据(正确答案)C)是一张多维的稀疏表,不存储空值(正确答案)D)表名是字符串(正确答案)16.(多选)下列关于行键(RowKey)概念的叙述哪些是正确的()*A)即用于唯一标识一行数据的“主键”(正确答案)B)每行数据都由行键唯一标识(正确答案)C)所有数据行都根据行键进行字典排序(正确答案)D)行键无数据类型,视为一个字节数组(正确答案)17.(多选)下列关于列族(ColumnFamily)概念的叙述哪些是正确的()*A)HBase表可在横向划分为一到多个列族(正确答案)B)HBase表的所有数据行都具有相同列族(正确答案)C)在创建HBase表时预先定义(正确答案)D)列族数量可以无限多18.(多选)下列关于列限定符(Qualifier)概念的叙述哪些是正确的()*A)用于定位列族中的数据列(正确答案)B)HBase表的所有数据行都具有相同的列限定符C)在插入新列时任意添加、动态定义(正确答案)D)不同数据行的列限定符不必一致(正确答案)19.(多选)下列关于单元格(Cell)和单元格值(Cellvalue)概念的叙述哪些是正确的()*A)单元格是“保存子列值的存储空间”(正确答案)B)HBase表通过行键、列族、列限定符和时间戳唯一确定一个单元格值(正确答案)C)单元格值没有数据类型,视为一个字节数组(正确答案)D)每个单元格值对应一个时间戳,保存数据的一个时间版本。(正确答案)20.(多选)下列关于时间戳(TimeStamp)概念的叙述哪些是正确的()*A)用于指定一个数据列所保存数据的某个时间版本(正确答案)B)时间戳不同的单元格值可能相同(正确答案)C)相同列的多个单元格值按照时间戳的降序进行排序(正确答案)D)读取列数据会默认选择时间戳最新的单元格值(正确答案)第5章
1.(多选)下列关于HBase表分区Region的叙述哪些是正确的()*A)HBase表数据不多时,HBase表只有一个Region(正确答案)B)随着表数据的增多,需要把HBase表拆分成多个Region(正确答案)C)每台RegionServer只可容纳一个RegionD)每个Region有固定行键范围的多行数据(正确答案)2.(多选)下列关于数据表的划分方式的叙述哪些是正确的()*A)HBase数据库把一张数据表按横向划分成多个列族B)HBase数据库把一张据表按纵向划分成多个分区C)关系型数据库把一张数据表横向划分成多个分表(正确答案)D)关系型数据库把一个数据库垂直划分成多个数据库(正确答案)3.(多选)下列关于HBase表分区作用的叙述哪些是正确的()*A)与关系型数据库的分表技术类似(正确答案)B)提高读写性能和保证负载均衡(正确答案)C)适应更高并发量的读写请求压力(正确答案)D)适应更大规模的数据存储负载(正确答案)4.(多选)下列关于Store的叙述哪些是正确的()*A)类似把整个蛋糕先横向切、再纵向切而形成的蛋糕块(正确答案)B)是把一张HBase表先横向按行键范围切、再纵向按列族切而形成的数据方块(正确答案)C)所属Region和列族都相同的单元格,位于同一个Store(正确答案)D)是HBase数据存储的最小单元(正确答案)5.(多选)下列关于Store和Region及RegionServer关系的叙述哪些是正确的()*A)属于同一个Region的不同Store的行键范围一定相同(正确答案)B)属于同一个Region的不同Store的数据大小一定相同C)所有Region包含的Store个数不一定相同D)属于同一Region的不同Store一定位于同一台RegionServer(正确答案)6.(多选)下列关于Store组成结构的叙述哪些是正确的()*A)由MemStore和StoreFile两个部分组成(正确答案)B)MemStore位于外存C)StoreFile位于内存D)每个Store只包含一个MemStore(正确答案)7.(多选)下列关于Store组成结构的叙述哪些是错误的()*A)每个Store可包含多个MemStore(正确答案)B)MemStore位于RegionServer的内存中C)每个Store只能包含一个StoreFile(正确答案)D)StoreFile一定存放于RegionServer的本地磁盘(正确答案)8.(多选)下列关于StoreFile和HFile的叙述哪些是正确的()*A)StoreFile只是Store在外存的持久化存储文件的统称(正确答案)B)StoreFile和HFile是一般和特殊的关系(正确答案)C)HFile是存放在HDFS上的数据文件(正确答案)D)StoreFile存放在HDFS文件系统9.(多选)下列关于HFile的叙述哪些是正确的()*A)HFile是一种具体的StoreFile类型(正确答案)B)HFile文件最终以数据块的形式存放在DataNode(正确答案)C)HFile文件的数据块一定位于RegionServerD)HBase负责HFile文件的持久化存储10.(多选)下列关于MemSore的叙述哪些是正确的()*A)每个Store只包含一个MemStore(正确答案)B)MemStore数据写满后,会通过Flush操作刷写到外存(正确答案)C)Flush操作一定会刷写到本地RegionServer的外存中D)MemStore只能执行一次Flush刷写操作11.(多选)下列HBase主要内部组件之间“包含”关系的叙述哪些是正确的()*A)一个HBase集群中包含多个RegionServer(正确答案)B)一个RegionServer中包含多个Region(正确答案)C)一个Region中包含多个Store(正确答案)D)一个Store包含多个StoreFile(正确答案)12.(多选)下列HBase表的列族数量过多会造成哪些问题()*A)列族数量过多,MemStore数量也会过多(正确答案)B)导致每次Flush刷写操作开销过大(正确答案)C)会生成大量的StoreFile文件(正确答案)D)影响后续的读写性能(正确答案)13.(多选)对于HBase经典系统架构图中Client的叙述哪些是正确的()*A)通常指HBase集群计算机上运行的应用程序(正确答案)B)HBase为Client提供了多种访问或调用接口(正确答案)C)使用RPC远程过程调用与HMaster和HRegionServer通信(正确答案)D)Client具有缓存可以加快读写速度(正确答案)14.(多选)对于HBase经典系统架构图中ZooKeeper的叙述哪些是正确的()*A)“一朵云”表示ZooKeeper并非单个节点,而是一个集群(正确答案)B)用于实现HMaster的高可用(正确答案)C)保存HBase的部分元数据,包括即Root表的存放位置(正确答案)D)对于HBase数据读写时的Region寻址没有作用15.(多选)对于HBase经典系统架构图中HMaster的叙述哪些是正确的()*A)是HBase集群中的服务管理节点(正确答案)B)HBase集群只有唯一的ActiveHMaster(正确答案)C)负责管理所有的HRegionServer(正确答案)D)可以直接通过DFSClient访问HDFS(正确答案)16.(多选)对于HBase经典系统架构图中HRegionServer的叙述哪些是正确的()*A)是HBase集群中的分区服务节点(正确答案)B)负责响应Client对HBase表的读写操作请求(正确答案)C)负责维护管理HMaster分配到本节点的Region(正确答案)D)负责对HFiles文件进行合并(正确答案)17.(多选)对于HBase经典系统架构图中HRegion的叙述哪些是正确的()*A)是HBase集群数据划分和负载均衡的基本单元(正确答案)B)一个HRegion只能属于一个HRegionServer(正确答案)C)保存HBase表中行键不连续的一部分数据D)HRegion过大时可以分裂(正确答案)18.(多选)对于HBase经典系统架构图中HLog的叙述哪些是正确的()*A)是一种WAL预写式日志文件(正确答案)B)每个HRegion都各有一个HLog文件C)作用是防止MemStore数据意外丢失(正确答案)D)写数据操作会先将数据写入MemStore,再追加写入HLog19.(多选)对于HBase经典系统架构图中DFSClient的叙述哪些是正确的()*A)是分布式文件系统HDFS提供的客户端B)HBase的所有数据最终通过DFSClient持久化保存到HDFS(正确答案)C)会把数据切分成一个个数据包(典型大小为64K)(正确答案)D)把数据包一个个发送到多个DataNode节点(正确答案)20.(多选)对于HBase的Region寻址的叙述哪些是正确的()*A)Meta表存放着用户表每行数据位于哪个Region及RegionServer的位置信息(正确答案)B)Meta表数据很多,也会拆分成多个Region(正确答案)C)Root表存放着Meta表每行数据位于哪个Region及RegionServer的位置信息(正确答案)D)Root表数据很多,也会拆分成多个Region21.(多选)对于Region寻址中ZooKeeper作用的叙述哪些是正确的()*A)其数据节点中存放了Root表的地址(正确答案)B)HBase不依赖于ZooKeeperC)没有ZooKeeper就无法知道Root表的地址(正确答案)D)没有ZooKeeper无法进行Region寻址和最终的数据读写(正确答案)22.(单选)客户端有缓存的Region寻址过程,运气最差时需要执行()访问请求才能完成Region寻址[单选题]*A)三次B)四次C)五次D)六次(正确答案)23.(多选)HBase具有哪些技术可以提高读数据操作的查找效率()*A)BlockCache(正确答案)B)MemStoreC)BloomFilter(正确答案)D)HLog24.(多选)下列关于HBase块缓存BlockCache的叙述哪些是正确的()*A)BlockCache是用于写数据的缓存B)将最近读取的Block块缓存到BlockCache中(正确答案)C)BlockCache缓存命中就避免了对外存的访问(正确答案)D)可通过列族属性设置是否开启BlockCache(正确答案)25.(多选)下列关于HBase设计理念的叙述哪些是正确的()*A)更有利于写数据而不利于读数据(正确答案)B)写数据速度相对读数据速更较快(正确答案)C)写数据的业务请求具有极高并发量(正确答案)D)读数据的业务请求相对较少(正确答案)26.(单选)下列HBase表读写数据的访问顺序哪个是正确的()[单选题]*A)访问ZooKeeper=>访问Root表=>访问User表=》访问Meta表B)访问ZooKeeper=>访问Root表=>访问Meta表=》访问User表C)访问ZooKeeper=>访问Meta表=>访问Root表=》访问User表(正确答案)D)访问Root=>访问ZooKeeper表=>访问Meta表=》访问User表第6章
1.(多选)下列关于布隆过滤器的叙述哪些是正确的(AD)[单选题]*A)是由数学家布隆提出的一种数学模型(正确答案)B)能确定某个元素一定存在于某个集合中C)不能确定某个元素一定不存在于某个集合中D)能确定某个元素一定不存在于某个集合中2.(多选)下列关于布隆过滤器优缺点的叙述哪些是正确的()*A)优点是查询效率相比其他算法高,存储空间占用少(正确答案)B)优点是对不存在性判定准确,增加和查询元素效率高(正确答案)C)缺点是对存在性判定不准确,有一定误判(正确答案)D)缺点是可以删除元素3.(多选)下列关于布隆过滤器优缺点的叙述哪些是正确的()*A)优点是查询效率相比其他算法高,存储空间占用少(正确答案)B)优点是对不存在性判定准确,增加和查询元素效率高(正确答案)C)缺点是对存在性判定不准确,有一定误判(正确答案)D)缺点是可以删除元素4.(多选)下列现实中存在性判定和不存在判定的例子哪些是正确的()*A)听说话声音是某个人,不一定是这个人(正确答案)B)从箱子中没有摸出红球,箱子中就一定不存在红球C)核酸检测结果为阴性,就一定没被感染D)核酸检测结果为阳性,就一定被感染(正确答案)5.(多选)在计算机软件领域,布隆过滤器的应用场景包括()*A)重复URL判重(正确答案)B)垃圾邮件识别(正确答案)C)黑名单校验(正确答案)D)解决缓存穿透(正确答案)6.(多选)爬虫程序用数据库存放已访问过网页的URL地址有哪些问题()*A)难以存储大数据级别的网页URL地址数据(正确答案)B)数据库的查询操作存在效率问题(正确答案)C)无法实现高效快速的URL查询判重(正确答案)D)不能查询到已经访问过网页的URL地址7.(多选)下列关于把字符串哈希映射到到整数的叙述哪些是正确的()*A)一次哈希函数映射可将一个字符串映射到整数的一个比特位(正确答案)B)一次哈希函数映射可将一个字符串映射到整数的多个比特位C)多次哈希函数映射可将一个字符串映射到整数的一个比特位D)多次哈希函数映射可将一个字符串映射到整数的多个比特位(正确答案)8.(多选)下列关于把网页URL哈希映射到到整数的叙述哪些是正确的()*A)存储整个URL字符串相比存储一个整数更节省存储空间B)合理设置整数位长和哈希次数,可以减少网页URL判重的误判率(正确答案)C)新的URL地址映射的整数比特位已全全部1,说明新的URL地址可能被访问过(正确答案)D)新的URL地址映射的整数比特位未全部置1,说明新的URL地址肯定没被访问过(正确答案)9.(多选)下列关于布隆过滤器误判率的叙述哪些是正确的()*A)误判率与布隆过滤器整数比特位数成反比(正确答案)B)与哈希映射函数个数成正比(正确答案)C)与经过哈希映射的元素数量成反比D)布隆过滤器的误判越低越好10.(多选)下列关于布隆过滤器的比特位数的叙述哪些是正确的()*A)布隆过滤器的整数比特位数越多越好B)当误判率万分之一时,100亿个URL地址需要15G字节的布隆过滤器存储空间(正确答案)C)用更少的存储空间和更快的判重效率,得到可信度较高的判断结果(正确答案)D)整数的按位与运算的效率没有字符串匹配运算的运算效率要高11.(多选)下列关于布隆过滤器在HBase应用的叙述哪些是正确的()*A)很多分布式数据库应用布隆过滤器来提高读查询的效率(正确答案)B)HFile文件通过块索引可以较快查找到要读取的数据(正确答案)C)通过块索引可以避免扫描很多的HFiles文件D)配合使用块索引和布隆过滤器,可以在很多HFile文件中快速查询到要读取的数据(正确答案)12.(多选)下列关于布隆过滤器在HBase应用的叙述哪些是正确的()*A)布隆过滤器是HBase表的配置属性(正确答案)B)开启布隆过滤器会有一定的磁盘存储及内存开销(正确答案)C)布隆过滤器存放在HFile文件的元数据中(正确答案)D)HFile包含BLOOMFILTER的数据结构(正确答案)13.(多选)下列关于HBase布隆过滤器的叙述哪些是正确的()*A)使用方式就是设置开启布隆过滤器或关闭布隆过滤器(正确答案)B)过滤模式有行模式ROW和行列模式ROWCOL两种(正确答案)C)HBase表列族的布隆过滤器属性名是BLOOMFILTER(正确答案)D)BLOOMFILTER参数的默认值是ROW14.(多选)下列关于HBase布隆过滤器过滤模式的叙述哪些是正确的()*A)行模式只根据行键进行过滤(正确答案)B)行列模式根据行键或列名进行过滤(正确答案)C)行列模式的粒度更细,过滤效率相更低,存储开销更高(正确答案)D)哪种过滤模式更好取决于对HBase表数据的读取方式(正确答案)15.(多选)下列关于HBase布隆过滤器过滤模式的叙述哪些是正确的()*A)行模式只根据行键进行过滤(正确答案)B)行列模式根据行键或列名进行过滤(正确答案)C)行列模式的粒度更细,过滤效率相更低,存储开销更高(正确答案)D)哪种过滤模式更好取决于对HBase表数据的读取方式(正确答案)16.(多选)下列HBase哪些情况并不适合开启使用布隆过滤器()*A)所要查找的数据行均匀分布在所有HFile文件中(正确答案)B)所要查找的数据行集中分布在少数HFile文件中C)写操作比读操作更频繁(正确答案)D)HBase存储的数据量还不够多(正确答案)17.(多选)下列HBase哪些情况不适合使用行列模式的布隆过滤器()*A)用户经常执行读取整行的读查询(正确答案)B)经常执行指定行键和指定列的读查询C)用户经常执行整表的扫描(正确答案)D)经常执行指定行键、指定列和时间戳的读查询18.(多选)HFiles文件的合并为什么英文原意是压缩(Compaction)()*A)多个HFies文件的合并过程伴随着对数据的压缩(正确答案)B)HFiles文件的合并才会真正进行数据的删除(正确答案)C)会删除掉原有HFiles文件中的部分数据(正确答案)D)新生成的单个HFile文件大小会小于原有多个HFiles文件大小之和(正确答案)19.(多选)HFiles文件的合并为什么英文原意是压缩(Compaction)()*A)多个HFies文件的合并过程伴随着对数据的压缩(正确答案)B)HFiles文件的合并才会真正进行数据的删除(正确答案)C)会删除掉原有HFiles文件中的部分数据(正确答案)D)新生成的单个HFile文件大小会小于原有多个HFiles文件大小之和(正确答案)20.(多选)除了提高HBase读数据效率,HBase进行HFiles文件压缩合并的原因还有哪些()*A)清除无效的数据,减少数据的存储量(正确答案)B)适应HDFS的存储特点(正确答案)C)减少HDFS的底层磁盘寻址开销(正确答案)D)提高Region数据的本地化率(正确答案)21.(多选)进行HFiles文件的压缩合并,如何提高HBase读数据的效率()*A)减少HFiles文件数量(正确答案)B)增加HFiles文件大小(正确答案)C)减少HFiles文件数量D)提高Region数据的本地化率(正确答案)22.(多选)HFiles文件的压缩合并会清除掉哪些无效的数据()*A)带删除标记的数据(正确答案)B)TTL过期的数据(正确答案)C)本地数据D)版本号超过设定版本号的数据(正确答案)23.(多选)下列关于HFiles文件小缩并(MinorCompaction)的叙述哪些是正确的()*A)合并同一个Store中的相邻HFiles文件(正确答案)B)会清除TTL过期的数据(正确答案)C)会清除带删除标记的数据D)选取IO负载重,数据少的HFiles文件(正确答案)24.(多选)下列关于HFiles文件大缩并(MajorCompaction)的叙述哪些是正确的()*A)合并同一个Store中的全部HFiles文件(正确答案)B)合并不同Store中的全部HFiles文件C)会清除带删除标记的数据(正确答案)D)同一个Store只保留一个较大的HFile文件(正确答案)25.(多选)下列关于HFiles文件大缩并(MajorCompaction)的叙述哪些是正确的()*A)可以同时针对同一列族的所有Store执行大缩并(正确答案)B)生产环境慎执行对整表的大缩并操作(正确答案)C)尽量不要通过自动化脚本自动触发大缩并操作(正确答案)D)尽量在业务不繁忙时手动执行大缩并操作(正确答案)26.(多选)下列关于HFiles文件大缩并(MajorCompaction)的叙述哪些是正确的()*A)可以同时针对同一列族的所有Store执行大缩并(正确答案)B)生产环境慎执行对整表的大缩并操作(正确答案)C)尽量不要通过自动化脚本自动触发大缩并操作(正确答案)D)尽量在业务不繁忙时手动执行大缩并操作(正确答案)27.(多选)下列关于Region拆分的叙述哪些是正确的()*A)把一个较大Region拆分成多个较小Region(正确答案)B)Region不能自动拆分C)Region拆分过程不会影响读写服务(正确答案)D)Region的HFiles文件不会真正拆分(正确答案)28.(多选)下列关于Region拆分的叙述哪些是正确的()*A)把一个较大Region拆分成多个较小Region(正确答案)B)Region不能自动拆分C)Region拆分过程不会影响读写服务(正确答案)D)Region的HFiles文件不会真正拆分(正确答案)29.(多选)下列关于Region拆分原因的叙述哪些是正确的()*A)HBase上层业务场景中可能会产生所谓“热点”(正确答案)B)HBase对热点Region的读数据效率会大大降低(正确答案)C)导致Region之间的大小差异过大(正确答案)D)热点Region导致整个HBase集群负载不均衡(正确答案)30.(多选)下列关于Region拆分方式的叙述哪些是正确的()*A)Region的拆分可以是HBase集群自动完成(正确答案)B)可以手动执行split命令对指定Region进行拆分(正确答案)C)可以通过配置参数设定Region自动拆分的各种触发策略(正确答案)D)Region预分区和表运行时的强制拆分都属于自动拆分31.(多选)下列关于Region预拆分的叙述哪些是正确的()*A)在建表时预先进行Region的划分设定(正确答案)B)需要能在建表前预测HBase数据表行键的大致分布情况(正确答案)C)优点是避免数据写入不均导致HBase数据存储的“热点”问题(正确答案)D)建表时候进行Region的预拆分后,HBase表运行中无需再进行Region的拆分32.(多选)下列关于Region强制拆分的叙述哪些是正确的()*A)通过在HBaseShell终端执行split命令完成(正确答案)B)通常对运行时间较长或写入数据较多的Region进行(正确答案)C)split命令必须指定一个行键作为拆分点D)split命令必须指定一个Region名称33.(单选)把行键范围为[200,300)的Region从RowKey=250进行拆分后生成的两个新Region的行键范围是()[单选题]*A)[200,250]和[250,300)B)[200,250)和[250,300)(正确答案)C)[200,250]和[251,300)D)[200,250)和[251,300)34.(多选)下列关于Region迁移的叙述哪些是正确的()*A)为实现HBase集群的Region负载均衡(正确答案)B)可通过在HBaseShell终端执行move命令完成(正确答案)C)无需移动实际的数据(正确答案)D)Region只能够自动迁移35.(多选)下列关于Region迁移的叙述哪些是正确的()*A)为实现HBase集群的Region负载均衡(正确答案)B)可通过在HBaseShell终端执行move命令完成(正确答案)C)无需移动实际的数据(正确答案)D)Region只能够自动迁移36.(多选)下列关于Region合并的叙述哪些是正确的()*A)能把多个Region“合并”成一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钢结构切割工艺实施方案
- 2026江苏师范大学招聘专职辅导员22人笔试模拟试题及答案解析
- 2026云南保山市市直宣传思想文化系统事业单位校园招聘3人笔试备考试题及答案解析
- 建筑机械设备选型方案
- 老年疼痛护理查房疼痛评估应用
- 老年人心理健康的社区护理
- 中国抗癌协会胆道恶性肿瘤靶向及免疫治疗指南(2022)课件
- 2026广东能源集团管道有限公司招聘1人笔试模拟试题及答案解析
- 供热系统安装方案
- 2026重庆沙区大学生实习招聘笔试参考题库及答案解析
- 2025贵州三支一扶真题
- 2025年民航安全试题简答题及答案
- 第2课《后方大基地》课件-六年级人文与社会下册(黑教版)
- 返乡安全教育
- GB/T 45107-2024表土剥离及其再利用技术要求
- 工程造价咨询服务投标方案(专家团队版-)
- 2mm土工膜长丝土工布检测报告合格证
- DB32T-政务“一朵云”安全管理体系规范 第1部分:安全运行监测
- 混凝土工程合同模板
- DL-T5796-2019水电工程边坡安全监测技术规范
- 高温气冷堆先进燃料元件研发
评论
0/150
提交评论