ict大数据模拟试题含参考答案解析_第1页
ict大数据模拟试题含参考答案解析_第2页
ict大数据模拟试题含参考答案解析_第3页
ict大数据模拟试题含参考答案解析_第4页
ict大数据模拟试题含参考答案解析_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ict大数据模拟试题含参考答案解析一、单选题(共10题,每题1分,共10分)1.对于云数据库MySQL,使用()后端对接多个数据库实例,实现分布式数据库的透明访问。A、数据管理服务(DAS)B、分布式缓存服务(DCS)C、数据复制服务(DRS)D、分布式数据库中间件服务(DDM)正确答案:A2.以下关于HDPS适合做什么描述不正确的是?A、低延迟读取B、大文件存储与访问C、流式数据读取D、大数据量吞吐正确答案:A3.交叉验证的目的是(____)。A、得到更稳定的模型B、提高分类准确率C、验证结果的准确性D、增大分类的误差正确答案:A答案解析:交叉验证的目的主要是通过将数据集划分为多个子集,在不同子集上训练模型并评估,从而得到更稳定的模型。它不是单纯为了提高分类准确率,虽然在一定程度上可能会提升准确率,但更重要的是让模型在不同数据划分下表现更稳健。验证结果的准确性是验证集的作用,而交叉验证不是增大分类误差,而是减小因数据划分不同导致的模型性能波动。4.超级管理员最多创建VDC的层级是:()。A、三级B、四级C、五级D、六级正确答案:C答案解析:超级管理员最多创建五级VDC。5.Kubernetes无状态工作负载指的是()A、DeploymentB、JobC、StatefulSetD、DaemonSet正确答案:A答案解析:Kubernetes无状态工作负载主要包括Deployment、ReplicaSet等。Deployment提供了一种声明式的方式来创建、更新和管理一组Pod副本,确保应用程序的可用性和弹性,属于无状态工作负载。Job主要用于运行批处理任务,完成后即结束,不是无状态工作负载的典型代表。StatefulSet用于管理有状态应用程序,与无状态工作负载概念不同。DaemonSet确保在集群中的每个节点上运行一个Pod副本,通常用于系统守护进程等,也不属于无状态工作负载。6.在实际工作中,VLAN能实现的功能是哪个A、属于相同vlan的虚拟机应该使用相同地址段的IP地址,否则无法正常通信。B、两个部门的虚拟机使用了不同的VLAN以后,相互之间不能再通信C、属于相同VLAN的虚拟机可以使用不同地址段的IP地址,并能使用广播发现彼此D、属于不同VLAN的虚拟机可以使用相同的IP地址,且不会发生地址冲突正确答案:A7.不是EIP加入共享带宽好处的是:()。A、多个IP共用一条带宽B、方便管理C、节约成本D、提升性能正确答案:D答案解析:共享带宽主要是实现多个IP共用一条带宽,方便管理并节约成本,一般并不能直接提升性能。8.以下关于HiveSQL基本操作描述正确的是:()。A、加载数据到Hive时数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建外部表使用external关键字,创建普通表需要指定internal关键字D、创建表时可以指定列分隔符正确答案:D答案解析:1.**选项A**:加载数据到Hive时,数据可以是本地文件路径(通过`LOADDATALOCALINPATH`),也可以是HDFS的一个路径(通过`LOADDATAINPATH`),所以选项A错误。2.**选项B**:创建外部表时,如果不指定`location`信息,Hive会在默认的仓库路径下创建一个指向数据的链接,并非必须要指定`location`信息,所以选项B错误。3.**选项C**:创建普通表时不需要指定`internal`关键字,Hive中创建普通表就是默认的内部表,创建外部表使用`external`关键字,所以选项C错误。4.**选项D**:创建表时可以使用`ROWFORMATDELIMITEDFIELDSTERMINATEDBY`等语句来指定列分隔符,所以选项D正确。9.关于云解析服务,下列说法错误的是()?A、云解析服务支持IPv4和IPv6地址B、云解析服务仅支持IPv4地址C、云解析服务仅支持同区域的内网解析D、同一VPC不支持关联到两个名称相同的域名正确答案:B10.以下()不属于运营管理员的权限。A、资源池对接B、租户管理C、VDC自运维D、系统配置正确答案:C答案解析:运营管理员权限通常包括资源池对接、租户管理、系统配置等方面,而VDC自运维一般不属于运营管理员的常规权限范畴。二、多选题(共10题,每题1分,共10分)1.下列说法错误的是(____)。A、聚类算法要求数据集无量纲化B、信息是与材料、能源一个层次的概念,不属于客观存在C、特征编码是将非数值型特征转换成数值型特征的方法D、数值和数据是不同的概念,数值在信道上传输之后,转换为信号形式的数据正确答案:BD2.云硬盘挂载到虚拟机依赖于()服务。A、novaB、cinderC、glanceD、swift正确答案:AB3.下面()事数据归约的策略。A、维归约B、数据压缩C、数量归约D、螺旋式方法正确答案:ABC答案解析:数据归约的策略主要包括维归约、数量归约、数据压缩等。维归约是指通过减少数据的属性或维度来降低数据量;数量归约是指通过选择替代的、较小的数据表示形式来减少数据量;数据压缩是指利用编码机制来压缩数据,如无损压缩和有损压缩。而螺旋式方法并不是数据归约的策略。4.以下关于ElasticSearch描述正确的是?A、可作为NoSQL数据库使用B、可作为关系型数据库使用C、一个高性能,基于Lucene的全文检索服务D、一个分布式的RestFul风格的搜索和数据分析引擎正确答案:ACD答案解析:Elasticsearch是一个分布式的RestFul风格的搜索和数据分析引擎,它基于Lucene,提供高性能的全文检索服务,可作为NoSQL数据库使用,不具备关系型数据库的特点,所以选项B错误,选项A、C、D正确。5.网站个性化推荐的背后,可以使用哪些类型的数据实现?A、结构化B、非结构化C、半结构化D、无结构化正确答案:ABC答案解析:网站个性化推荐背后可以使用多种类型的数据来实现。结构化数据是具有固定格式和组织的数据,例如数据库中的表格数据,能清晰地表达特定信息,可用于分析用户的明确行为模式等,所以A正确。非结构化数据如文本、图像、音频等,包含丰富的用户潜在兴趣等信息,通过合适的技术处理能用于个性化推荐,所以B正确。半结构化数据如XML格式的数据,兼具结构化和非结构化的特点,也能为个性化推荐提供有价值的信息,所以C正确。而“无结构化”这种说法不准确,常见的数据类型是结构化、非结构化和半结构化,所以D错误。6.StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括:以下()方式。A、GeneralModeB、AppendModeC、CompleteModeD、UpdateMode正确答案:BCD答案解析:StructuredStreaming在Output阶段支持AppendMode(追加模式)、CompleteMode(完全模式)和UpdateMode(更新模式)。AppendMode只追加新数据;CompleteMode会输出整个结果表;UpdateMode则只更新结果表中发生变化的部分。GeneralMode并不是StructuredStreamingOutput阶段定义的数据写入方式。7.在一个大型企业的省级分公司部署HCS8.0私有云平台会用到()区域。A、RegionB、AZC、zoneD、block正确答案:AB8.分布式消息队列kafka提供了类似于Java消息服务(JavaMessageService,JMS)的特性,具有的增强特性是:()。A、消息持久化B、分布式C、高吞吐D、可靠性正确答案:ABCD答案解析:Kafka提供了类似于Java消息服务(JavaMessageService,JMS)的特性,同时具有以下增强特性:1.**消息持久化**:Kafka能够将消息持久化到磁盘,保证消息不会丢失,即使在服务器故障等情况下也能恢复。2.**高吞吐**:Kafka基于分布式架构设计,采用分区、副本等机制,具备非常高的吞吐量,可以处理海量的消息。3.**可靠性**:通过副本机制实现数据冗余,在部分节点故障时仍能保证数据的可用性和可靠性,确保消息的可靠传递。4.**分布式**:Kafka是分布式系统,支持水平扩展,可以轻松应对大规模的消息处理需求,适合构建分布式应用场景。9.在ManageOne创建VDC关键性步骤有:()。A、基本参数B、资源配置C、配额设置D、区域设置正确答案:AC10.账号登录策略有:()。A、用户启用策略B、用户锁定时长C、用户锁定统计周期D、会话超时策略正确答案:BCD三、判断题(共30题,每题1分,共30分)1.Flink状态快照是同步捕获的,影响正在进行的计算任务。A、正确B、错误正确答案:B2.Oracle数据库根据它自身的发布形态,既可以做OLAP也可以做OLTP。A、正确B、错误正确答案:A3.Kafka中Partitionreplication之间同步数据,从partition的leader复制数据到follower需要线程(replicationFetcherThread),Follower主动从Leader批量拉取消息的,极大地提高了吞吐量。A、正确B、错误正确答案:A4.使用裸金属服务器VHA的约束与限制不支持Windows镜像。A、正确B、错误正确答案:A5.数据库架构设计Shared-Everying是指服务器的所有资源(包含键盘CPU、显卡、网络)都共享。A、正确B、错误正确答案:A6.告警模块可以设置不同的颜色来对应不同的告警级别。A、正确B、错误正确答案:A7.物理资源监控:服务器、网络设备、存储设备、宿主机、主机组等的性能监控。A、正确B、错误正确答案:B8.裸金属服务器(BareMetalServer)为租户提供专属的物理服务器,为核心数据库、关键应用系统、高性能计算业务提供卓越的计算性能以及数据安全,结合云中资源的弹性优势,可实现灵活申请,按需使用。A、正确B、错误正确答案:A9.FusionInsightHD平台中,HBase暂不支持二级索引。A、正确B、错误正确答案:B10.在MapReduce编程中,代码不仅要描述做什么,还要描述具体怎么做。A、正确B、错误正确答案:B11.SparkOnYarn模式下的driver只能运行在客户端。A、正确B、错误正确答案:B12.CIoudera是Hadoop商业版的发布公司。A、正确B、错误正确答案:A13.MapReduce过程中,默认情况下一个分片就是一个块,也是一个mapTask。A、正确B、错误正确答案:A14.任何完整的大数据平台,一般包括以下的几个过程:数据采集à数据存储à数据处理à数据展现(可视化,报表和监控),其中,数据采集是所有数据系统必不可少的一个环节,随着大数据越来越被重视,数据采集的挑战也变的尤为突出。A、正确B、错误正确答案:A15.在Spark中,累加器可以实现高速并行的计数器和变量求和;在Spark的应用程序开发过程中,只有在Driver上获取此计数器的值。A、正确B、错误正确答案:A16.镜像是一个包含了软件及必要配置的服务器或磁盘模版,包含操作系统或业务数据,还可以包含应用软件(例如,数据库软件)和私有软件。A、正确B、错误正确答案:A17.对于N(N>1)副本储存的文件,HDFS客户端发起读取文件请求,如果所读副本节点故障,直接返回失败,不会转到其他副本节点进行读取。A、正确B、错误正确答案:A18.由于Spark是基于内存的计算引擎,因此,一个Spars应用可以处理的数据量不能超过分给这个Spark应用的内存总和。A、正确B、错误正确答案:B19.FusionInsightManager界面上,当收到Kafka磁盘容量不足告警,且该告警的原因排除硬件故障时,系统管理员需要考虑扩容解决此问题。A、正确B、错误正确答案:A20.ElasticSearch作为全文检索的引擎,其功能强大,也可以作为NoSQL数据库使用,能满足海量数据存储的需要,也满足主键和多级索引的实时查询。A、正确B、错误正确答案:A21.向HBase集群中增加RegionServer主机时,必须先停止原集群,原因是HBase不支持动态扩容。A、正确B、错误正确答案:B22.数据订阅成功后,如果不及时进行消费,新产生的数据最多保留3天。A、正确B、错误正确答案:A23.在线迁移中可能因外部因素导致迁移暂时故障,用户根据迁移日志信息解决问题后,可以通过续传功能继续迁移。A、正确B、错误正确答案:A24.Oozie的workflow.xml文件是工作流配置文件。A、正确B、错误正确答案:A25.物联网也将成为云计算最大的用户。A、正确B、错误正确答案:A26.Redis是个多线程模型,客户端的命令是异步执行的。A、正确B、错误正确答案:B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论