8月ict大数据模考试题与参考答案解析_第1页
8月ict大数据模考试题与参考答案解析_第2页
8月ict大数据模考试题与参考答案解析_第3页
8月ict大数据模考试题与参考答案解析_第4页
8月ict大数据模考试题与参考答案解析_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

8月ict大数据模考试题与参考答案解析一、单选题(共40题,每题1分,共40分)1.在HDFS中的块默认大小为(____)。A、16MBB、32MBC、64MBD、128MB正确答案:C答案解析:HDFS中的块默认大小为128MB,128MB大于64MB,所以答案选C。2.在Hadoop生态系统中,(____)建立在MapReduce之上,主要用来弥补MapReduce编程的复杂性。A、HBaseB、FlumeC、PigD、Sqoop正确答案:C答案解析:Pig是一种数据流语言和运行环境,它建立在MapReduce之上,为数据分析提供了一种更简洁、更抽象的方式,弥补了MapReduce编程的复杂性。HBase是一个分布式的、面向列的开源数据库;Flume是一个分布式、可靠且高效的日志收集系统;Sqoop是一种用于在Hadoop与传统关系型数据库之间进行数据传输的工具。3.某城市有甲、乙两个区,人口比例为2:3,据历史统计甲区的犯罪率为0.02%,乙区为0.03%,现有一起新案件发生在该市,那么案件发生在甲区的可能性有多大?(____)。A、0.16B、0.6C、0.31D、0.4正确答案:C4.以下不属于网关框架的是()A、EdgeServiceB、ZuulC、SpringBootD、SpringCloudGateway正确答案:C答案解析:SpringBoot是一个用于快速构建Spring应用的框架,它本身不是网关框架。而EdgeService、Zuul、SpringCloudGateway都属于网关框架。5.在云计算平台中,()软件即服务。A、IaaSBB、PaaSCC、SaaSDD、QaaS正确答案:C6.下列关于FusionInsightLibrA数据均匀分布的存储描述错误的是:()。A、解析器从客户端应用获取输入的数据B、解析器对数据解析后,将数据分发诶各个处理单元进行处理C、各个处理单元把接受到的数据存储到各自的逻辑磁盘中D、每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘正确答案:D答案解析:在FusionInsightLibrA中,每一个处理单元的逻辑磁盘可以是服务器自带的物理磁盘,也可以是通过软件定义的虚拟磁盘等,并不局限于服务器自带的物理磁盘。选项A中解析器从客户端应用获取输入的数据是数据处理流程中的一个环节;选项B解析器对数据解析后分发到各个处理单元进行处理也是合理的流程步骤;选项C各个处理单元把接收到的数据存储到各自的逻辑磁盘中符合数据存储的描述。7.私有镜像的创建方式不包括:()。A、整机镜像B、系统盘镜像C、文件夹镜像D、数据盘镜像正确答案:C答案解析:私有镜像创建方式主要有系统盘镜像、数据盘镜像、整机镜像等,并不包括文件夹镜像这种方式。8.大数据最显著的特征是:()。A、数据处理速度快B、数据规模大C、数据类型多样D、数据价值密度高正确答案:B9.Kafka集群中,Kafka服务端的角色是:()。A、BrokerB、ConsumerC、ZookeeperD、Producer正确答案:A答案解析:Kafka服务端的角色是Broker。Broker是Kafka集群中负责存储和转发消息的节点。Consumer是消息的消费者,负责从Broker拉取消息进行消费;Zookeeper是用于协调Kafka集群的分布式系统,提供元数据管理等功能;Producer是消息的生产者,负责向Broker发送消息。10.当云服务器发生灾难性损坏,如系统崩溃云服务器无法正常启动,云服务器故障已不能执行任何操作等,您可以通过()重建一个带有相同业务数据的新云服务器以保证您的业务快速恢复。A、虚机镜像B、云硬盘快照C、虚机备份D、云硬盘备份正确答案:B11.在Flink框架中,下列()是流处理和批处理的计算引擎。A、standaloneB、RuntimeC、FlinkCoreD、DataStream正确答案:B答案解析:>Flink的Runtime是流处理和批处理的计算引擎。它负责执行作业图,管理资源,并提供运行时的各种服务,以确保Flink作业的高效执行。Standalone是Flink的一种部署模式;FlinkCore不是Flink中这样的核心计算引擎概念;DataStream是Flink用于流处理编程的API。12.下列关于HBase的BloomFilter特性理解正确的是:()。A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗D、可以准确判断某条数据不存在正确答案:C13.SDK是消费者在调用API时,需要在请求Header头中添加身份认证信息,而这个操作比较繁琐,故我们为使用者提供了SDK,简化用户操作。目前华为SDK支持:()种语言的支持。A、7B、8C、9D、10正确答案:C14.Elasticsearch是怎么实现Master选举的?A、自行指定B、内部自行选举C、借助ZooKesper远举D、随机生成正确答案:B答案解析:Elasticsearch的Master选举是内部自行选举的。当Elasticsearch集群启动时,节点会尝试通过ZenDiscovery模块来发现其他节点并组成集群。在这个过程中,符合条件的节点会参与Master选举。选举过程基于ZenDiscovery的投票机制,节点会根据自身的状态、集群配置等因素进行投票,最终得票最多的节点会被选举为Master节点,负责管理集群的元数据、分配分片等重要职责。15.Kubernetes无状态工作负载指的是()A、DeploymentB、JobC、StatefulSetD、DaemonSet正确答案:A答案解析:Kubernetes无状态工作负载主要包括Deployment、ReplicaSet等。Deployment提供了一种声明式的方式来创建、更新和管理一组Pod副本,确保应用程序的可用性和弹性,属于无状态工作负载。Job主要用于运行批处理任务,完成后即结束,不是无状态工作负载的典型代表。StatefulSet用于管理有状态应用程序,与无状态工作负载概念不同。DaemonSet确保在集群中的每个节点上运行一个Pod副本,通常用于系统守护进程等,也不属于无状态工作负载。16.云计算通过共享()的方法将巨大的系统池连接在一起。A、CPUB、软件C、基础资源D、处理能力正确答案:C答案解析:云计算通过共享基础资源的方法将巨大的系统池连接在一起。它整合计算、存储、网络等基础资源,以提供灵活的计算服务。选项A的CPU只是其中一部分资源;选项B软件不是共享的主要对象;选项D处理能力也是基于共享基础资源来实现的,所以最准确的是基础资源。17.在配置微服务灰度发布的“发布任务”时,必须要配置的参数不包括()A、微服务应用名B、发布环境C、微服务引擎D、任务名称正确答案:A18.以下关于分布式交换机,说法正确的是?A、当端口类型选择普通时,允许多个VLAN通过B、一个端口组只能对应一个分布式交换机,一个分布式交换机可以对应多个端口组C、上行链路是SR-IOV设备时端口类型应选用普通D、虚拟机一块网卡可以加入多个安全组中正确答案:B答案解析:1.首先分析选项A:-当端口类型选择普通时,普通端口类型通常是接入端口,一般只允许一个VLAN通过,而不是允许多个VLAN通过,所以选项A错误。2.接着看选项B:-一个端口组只能对应一个分布式交换机,这是正确的。同时,一个分布式交换机可以对应多个端口组,用于不同的网络配置需求,所以选项B正确。3.再看选项C:-上行链路是SR-IOV设备时端口类型应选用“VMkernel”,而不是普通,所以选项C错误。4.最后看选项D:-一个虚拟机网卡只能属于一个安全组,不能加入多个安全组中,所以选项D错误。19.以下哪种技术或设备不能隔离广播A、路由器B、VLANC、HubD、防火墙正确答案:C答案解析:Hub是集线器,它工作在物理层,会将接收到的信号进行再生放大并转发到所有端口,不能隔离广播。路由器工作在网络层,可以通过设置访问控制列表等方式隔离广播域;VLAN通过划分逻辑子网来隔离广播;防火墙也可以在一定程度上限制广播流量,起到隔离广播的作用。20.loader页面是基于开源()的图形化数据迁移工具。A、HadoopB、KettleC、HueD、Sqoop正确答案:D21.在SparkSQL中,()便用了新的编码器,其编码的作用是将JVM的对象与表结构进行转换,允许操作序列化数据,可以提高内存利用率A、DataFrameB、RDDC、DataSetD、Table正确答案:C22.采集数据字典首先应该()。A、安装驱动包B、启动extractorC、配置连接信息D、对数据库用户授权正确答案:B23.在FusionInsightHD中,以下()不属于Hive的流控特性。A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制正确答案:C答案解析:在FusionInsightHD中,Hive的流控特性包括支持对已建立的总连接数做阈值控制、支持对每个用户已经建立的连接数做阈值控制、支持对单位时间内所建立的连接数做阈值控制等,但不包括对某个特定用户已建立的连接数做阈值控制。24.FusionInsightHD系统中,Flume数据流在节点内不需要()组件。A、SourceB、SinkC、TopicD、Channel正确答案:C答案解析:在FusionInsightHD系统中,Flume数据流在节点内的基本组成是Source、Channel和Sink。Topic是Kafka中的概念,不是Flume节点内需要的组件。25.在“当前告警”页面,运维人员可以查看()的当前告警,以便掌握最新告警动态。A、实时更新B、已处理C、Top10告警D、Top100告警正确答案:A答案解析:在“当前告警”页面,运维人员可以查看实时更新的当前告警,以便掌握最新告警动态。实时更新能确保运维人员看到最新产生的告警信息,及时采取措施应对,而不是已处理的告警,Top10告警和Top100告警不能涵盖所有当前告警情况。26.哪种负载均衡模式提供了更丰富的HTTP和HTTPS转发能力?A、轮询型B、共享型C、经典型D、都一样正确答案:B27.MVCC用于解决()事务冲突。A、读读B、写写C、读写D、上述都包括正确答案:C28.0中引入了()的概念,它为用户提供了一个统一的切入点来使用Spark的各项功能A、SparkcontextB、SparkSessionC、SparkConfD、SparkText正确答案:B29.Kubernetes属于云计算的什么领域?A、IASSB、PASSC、SASS正确答案:B答案解析:Kubernetes属于容器编排工具,它主要负责管理和编排容器化应用程序。在云计算领域中,PaaS(PlatformasaService,平台即服务)提供了一个平台,让用户可以在上面部署、管理和运行应用程序,而无需管理底层的基础设施。Kubernetes提供了容器编排功能,帮助用户更方便地管理容器化应用,符合PaaS的范畴。IaaS(InfrastructureasaService,基础设施即服务)主要提供计算、存储、网络等基础设施资源;SaaS(SoftwareasaService,软件即服务)则是直接提供软件应用给用户使用。所以Kubernetes属于PaaS领域。30.关于Kerberos的TGT以下说法错误的是:()。A、TGT全称为票据授权服务票据,主要由KDC服务器生成B、TGT一次生成之后,可以无限期使用。C、TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储。D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。正确答案:B答案解析:TGT全称为票据授权服务票据,主要由KDC服务器生成,选项A正确。TGT是有一定有效期的,不是可以无限期使用,选项B错误。TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储,选项C正确。TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称,选项D正确。31.数据湖探索(DataLakeInsight,简称DLI)是支持以下()形式的大数据计算分析服务。A、流式处理B、批处理C、流批一体D、都不支持正确答案:C32.关于数据服务中,app说法正确的是:()。A、一个用户只能创建一个APPB、一个APP只能申请一个API的权限C、一个用户可以创建多个APP,一个APP可以申请多个API的权限D、一个API只能被一个APP使用正确答案:C答案解析:在数据服务中,一个用户可以根据自身需求创建多个APP,用于不同的功能或业务场景。而一个APP为了实现丰富的功能,可以申请多个API的权限,以获取各种数据和服务。选项A中一个用户只能创建一个APP说法过于绝对;选项B中一个APP只能申请一个API的权限不符合实际情况;选项D中一个API可以被多个APP根据各自需求使用。33.“完全独享的CPU和内存,性能长期稳定,不会因为物理机上其它实例的行为而受到影响,适用于对性能稳定性要求较高的应用场景”描述的是以下哪一项性能规格类型()。A、通用型B、独享型C、通用增强型D、鲲鹏通用增强型正确答案:B答案解析:“完全独享的CPU和内存,性能长期稳定,不会因为物理机上其它实例的行为而受到影响,适用于对性能稳定性要求较高的应用场景”描述的正是独享型性能规格类型的特点。通用型、通用增强型、鲲鹏通用增强型都不具备这样完全独享资源且性能不受其他实例影响的特性。34.云计算最大的特征是:()A、计算量大B、可扩展性C、通过互联网进行传输D、虚拟化正确答案:C答案解析:云计算最大的特征是通过互联网进行传输。云计算是基于互联网的相关服务的增加、使用和交付模式,通过互联网来提供动态易扩展且经常是虚拟化的资源。计算量大不是云计算最大特征;虚拟化是云计算的重要特点之一,但不是最突出特征;可扩展性也是云计算的特性,但相比之下通过互联网进行传输更能体现其本质特征。35.数据中台在汇聚生产库的结构化数据时,最多的数据处理操作是:()。A、修改B、统计C、删除D、新增正确答案:D36.下列()用户可以创建用户角色。A、超级管理员B、业务管理员C、普通业务员D、VDC只读管理员正确答案:A答案解析:只有超级管理员具有创建用户角色的权限,业务管理员、普通业务员、VDC只读管理员通常不具备此权限。37.以下关于DataNode的描述不正确的是?A、DataNode执行数据块的读/写操作B、DataNode是用来存储数据块C、DataNode管理数据块元数据D、DataNode的数量受数据规模影响正确答案:C答案解析:DataNode主要负责数据块的存储和读写操作,管理数据块元数据的是NameNode,而不是DataNode。DataNode的数量通常会受到数据规模的影响,数据量越大可能需要更多的DataNode来存储数据块。38.以下哪些选项不属于大数据时代到来的必要条件?A、网络带宽提升B、存储设备容量提升C、CPU计算性能提升D、超级计算机的出现正确答案:D答案解析:大数据时代到来的必要条件包括网络带宽提升以支持数据的快速传输、存储设备容量提升以存储海量数据、CPU计算性能提升以处理大规模数据。超级计算机在大数据时代之前就已出现,它不是大数据时代到来的必要条件。39.下列关于EVS硬盘,哪项不正确()?A、EVS磁盘可以挂载到单个实例B、EVS磁盘始终不受实例运行时间的影响C、将EVS磁盘挂载到实例后,可以像使用其他物理硬盘一样使用它D、可以将EVS磁盘从实例中卸载,不能将其挂载到另一个实例正确答案:D答案解析:EVS磁盘可以挂载到单个实例,始终不受实例运行时间影响,挂载后可像使用其他物理硬盘一样使用,并且可以将EVS磁盘从实例中卸载后挂载到另一个实例,所以选项D不正确。40.卷积神经网络能通过卷积以及池化等操作将不同种类的鸟归为一类。关于卷积神经网络能达到该效果的原因,下列说法不正确的是(____)。A、同样模式的内容(如鸟嘴)在图像不同位置可能出现B、池化之后的图像主体内容基本不变C、不同种类鸟的相同部位(如鸟嘴)形状相似D、池化作用能使不同种类的鸟变得相似正确答案:D答案解析:卷积神经网络能将不同种类的鸟归为一类,原因在于同样模式的内容(如鸟嘴)在图像不同位置可能出现,不同种类鸟的相同部位(如鸟嘴)形状相似,且池化之后的图像主体内容基本不变,从而能提取出相似的特征进行分类。而池化的作用是减少数据维度、保留主要特征,并非使不同种类的鸟变得相似,D选项说法错误。二、多选题(共10题,每题1分,共10分)1.ElasticSearch支持的gateway类型有?A、HDFSB、本地文件系统C、Amazon83D、Amazon85正确答案:ABC2.SeviceStage支持的微服务框架类型包括:()。A、JavaChassisB、MesherC、GoChassisD、SpringCloud正确答案:ABCD答案解析:SeviceStage支持多种微服务框架类型,JavaChassis是华为推出的高性能、轻量级Java微服务框架;Mesher是基于Istio的微服务治理框架;GoChassis是一个面向云原生的Go语言微服务框架;SpringCloud是一系列构建在SpringBoot之上的框架的集合,用于快速构建微服务。所以以上选项中的微服务框架类型SeviceStage均支持。3.针对学习器的泛化误差问题,主要的评估方法有(____)。A、留出法B、交叉验证法C、自助法D、测试误差法正确答案:ABC答案解析:1.**留出法**:将数据集划分为训练集和测试集,用训练集训练学习器,用测试集评估其泛化误差。通过这种方式,可以大致了解学习器在未见过的数据上的表现。2.**交叉验证法**:将数据集进行多次划分,每次划分出不同的训练集和测试集,训练多个学习器并评估,最后综合这些评估结果来更准确地估计学习器的泛化误差。常见的有k折交叉验证等。3.**自助法**:通过有放回地采样从原始数据集中产生多个自助样本集,利用这些样本集训练学习器,然后用初始数据集(未参与采样的部分)来评估泛化误差。这种方法在数据集较小等情况下有独特的应用价值。4.下列关于聚集算子的说法正确的是()A、Hashagg性能最佳,一般聚集算子尽量都用HashaggB、通过设置enable-sort-off,可以关闭sort+GroupAggC、聚集算子需要所有聚集列都支持排序。D、当聚集缩减率较大时使用Hashagg正确答案:BD5.支持创建的数据标签类型有:()。A、规则标签B、组合标签C、手工标签D、实时标签正确答案:ABCD答案解析:规则标签可以根据预先设定的规则来创建数据标签;组合标签是通过对多种条件或已有标签进行组合得到;手工标签是人工手动创建的;实时标签是针对实时数据生成的标签,这几种类型都是支持创建的数据标签类型。6.kafka消息在()情况下被删除。A、被消费完就立即删除B、超过老化时间会被删除C、超过数据保存最大容量D、永远不会被删除正确答案:BC答案解析:Kafka消息删除有两种常见情况,一种是超过老化时间(log.retention.hours等参数设置的时间)会被删除;另一种是超过数据保存最大容量(log.retention.bytes等参数设置的容量)会被删除。并不是被消费完就立即删除,消息也不是永远不会被删除。7.要实现资源检索应配置的前置条件是:()。A、在分类管理中先配置好分类类型和分类模板B、在页面在线配置中配置好表属性“是:否为查询条件”,才能显示动态配置查询条件C、查看资源详情,预览数据需先同步元数据数据源D、创建sap索引正确答案:ABC答案解析:1.选项A:在分类管理中先配置好分类类型和分类模板是实现资源检索的重要前置条件之一。合理的分类体系有助于对资源进行有效的组织和标识,以便后续能够按照分类进行精准检索。如果没有预先设置好分类类型和模板,资源将处于无序状态,无法通过分类进行快速查找。2.选项B:在页面在线配置中配置好表属性“是否为查询条件”,才能显示动态配置查询条件。只有明确了哪些表属性可以作为查询条件,用户才能根据自己的需求灵活地设置查询条件,从而筛选出符合自己要求的资源。否则,无法进行针对性的查询操作。3.选项C:查看资源详情,预览数据需先同步元数据数据源。元数据包含了资源的各种描述信息,如标题、作者、主题等,同步元数据数据源能够确保在进行资源检索、查看详情和预览数据时,系统能够获取到准确、完整的资源相关信息,从而为用户提供正确的资源展示和检索结果。4.选项D:创建sap索引是实现资源快速检索的关键步骤之一,但它并不是前置条件。索引的作用是加快数据的检索速度,在数据已经存在且需要提高检索效率时才会创建索引。如果没有数据,创建索引也就失去了意义,所以它是在数据等相关基础工作完成后的一个提升检索性能的操作,而不是前置条件。8.KafkaConsumer跟踪消费记录需要以下哪几个选项的信息?A、productorB、topicC、partitionD、offset正确答案:CD9.数据复制服务提供的实时迁移功能,适用于以下()使用场景。A、云下数据库迁移上云B、跨云平台数据库迁移C、VPC网络内数据库迁移D、云内数据库迁移出云正确答案:ABCD答案解析:实时迁移功能适用于多种数据库迁移场景,包括云下数据库迁移上云、跨云平台数据库迁移、VPC网络内数据库迁移以及云内数据库迁移出云等,所以ABCD四个选项均正确。10.弹性公网IP提供独立的公网IP资源,可以与()资源灵活地绑定及解绑。A、弹性云服务器B、裸金属服务器C、虚拟IPD、弹性负载均衡正确答案:ABCD三、判断题(共30题,每题1分,共30分)1.同一个region中的存储资源池可以提供给该region所属的其它多个AZ共享使用。A、正确B、错误正确答案:B2.随着数据时代的到来,数据量大小的指数递增,那么0LTP就会慢慢被0LAP所替代?A、正确B、错误正确答案:B3.HDFS运行时,NameNode会将文件系统的元数据从磁盘中全部加载到内存,因此文件系统所能存储的文件总数受限于NameNode的内存容量。A、正确B、错误正确答案:A4.每个DRS备份迁移实例最多支持10个标签配额。A、正确B、错误正确答案:A5.ISA类数据采集的数据源是textfile。A、正确B、错误正确答案:B6.SWR对存储的镜像数量没有限制,可以根据需要上传镜像。A、正确B、错误正确答案:B7.当租户下已创建用户组时,选择为项目关联用户组后,该项目拥有所关联用户组的角色权限。A、正确B、错误正确答案:A8.ElasticSearch作为全文检索的引擎,其功能强大,也可以作为NoSQL数据库使用,能满足海量数据存储的需要,也满足主键和多级索引的实时查询。A、正确B、错误正确答案:A9.HLog日志保证了用户写入的数推不丢失。A、正确B、错误正确答案:A10.云计算不是物联网的一个组成部分。A、正确B、错误正确答案:B11.数据核验可以通过自动和手动执行核验过程,可以选择sql或存储过程。A、正确B、错误正确答案:A12.Flume不支持多级联操作。A、正确B、错误正确答案:B13.Hive中unio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论