ict大数据模拟题(附答案解析)_第1页
ict大数据模拟题(附答案解析)_第2页
ict大数据模拟题(附答案解析)_第3页
ict大数据模拟题(附答案解析)_第4页
ict大数据模拟题(附答案解析)_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ict大数据模拟题(附答案解析)一、单选题(共40题,每题1分,共40分)1.TwoPizza理论主要适用于以下哪种类型应用的组织架构?A、分布式架构B、SOA架构C、单体架构D、微服务架构正确答案:D答案解析:TwoPizza理论是指一个团队的规模应该控制在两个披萨能让团队成员吃饱的人数范围内,这样有利于团队的沟通和协作。微服务架构强调将应用拆分成多个小型、自治的服务,每个服务可以由一个小团队负责开发和维护,符合TwoPizza理论所适用的团队规模和协作方式。分布式架构、SOA架构虽然也有一定的组件拆分,但不如微服务架构那样严格按照小型自治团队的方式;单体架构则是一个整体,不适合TwoPizza理论所强调的小型团队模式。2.要级联删除用户创建的表等数据库对象,使用关键字()。A、STRICTB、CASCADEC、USAGE正确答案:B3.HBase为什么适用于海量数据存储?A、集群规模小B、支持列存表C、多列簇特性D、HDFS做底层存储正确答案:D4.以下()不属于VDC管理员权限。A、管理云资源池B、创建项目C、设置阈值D、导出应用正确答案:A5.Redis中相对于AOF持久化,对RDB持久化描述正确的是?A、内存占用过多,持久化文件尺寸较大B、占用较多的磁盘IO开支C、会丢失最后一次持久化以后的数据D、恢复数据相对较慢,写入数据相对较快正确答案:C答案解析:RDB持久化是将Redis在某个时间点的数据快照保存到磁盘,所以会丢失最后一次持久化以后的数据。A选项内存占用过多,持久化文件尺寸较大是AOF持久化的特点;B选项占用较多的磁盘IO开支也是AOF持久化的特点;D选项恢复数据相对较慢,写入数据相对较快同样是AOF持久化的特点。6.以下()数据不属于半结构化数据。A、HTMLB、XMLC、二维表D、JSON正确答案:C答案解析:半结构化数据是介于完全结构化数据(如关系型数据库中的二维表数据)和无结构数据(如纯文本)之间的数据,它具有一定的结构,但不像完全结构化数据那样严格。HTML、XML、JSON都属于半结构化数据,而二维表是典型的结构化数据。7.以下()组件采用Active-Active高可用模式。A、GTMB、WLMC、CND、DN正确答案:C8.业务中台方面,以业务为导向,优先建设(____)。A、统一数据业务中台和客户服务业务中台B、电网资源业务中台和账务结算业务中台C、统一数据业务中台和账务结算业务中台D、电网资源业务中台和客户服务业务中台正确答案:D答案解析:业务中台方面,以业务为导向,优先建设电网资源业务中台和客户服务业务中台。这两个业务中台对于提升电网运营效率、增强客户服务体验具有关键作用,是业务中台建设中较为核心和基础的部分,能够更好地支撑电网业务的开展和客户相关业务的处理。9.Elasticsearch存放所有关键词的地方是?A、词典B、字典C、索引D、关键词正确答案:C答案解析:Elasticsearch中存放所有关键词的地方是索引。索引是一种数据结构,用于存储和组织文档,文档中包含各种字段和关键词等信息。词典通常是指词汇的集合,字典是对字词等的解释性工具,关键词本身不是存放数据的容器。所以答案是索引,即选项C。10.当机器学习把训练样本自身特点当作所有潜在样本特点,导致泛化性能下降,这种现象在机器学习中称为(____)。A、偏差B、过拟合C、欠拟合D、误差正确答案:B答案解析:过拟合是指模型在训练数据上表现良好,但在新的数据上表现较差的现象。当机器学习把训练样本自身特点当作所有潜在样本特点时,模型会过度适应训练数据,导致泛化性能下降,这就是过拟合的表现。偏差是指模型预测值与真实值之间的期望误差,欠拟合是指模型在训练数据上表现不佳,误差是指模型预测值与真实值之间的差异。因此,正确答案是[B]过拟合。11.以下现象不能直接通过低通滤波器解决的是(____)。A、指纹图像中的去污染问题B、低分辨率文本图像中出现的字符断裂问题C、遥感图像中的扫描线滤除问题D、人脸图像中需要“美容”的去皱纹问题正确答案:A12.(____)的主要目标是提供可扩展的机器学习算法及其实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。A、MahoutB、FlumeC、SqoopD、HBase正确答案:A答案解析:Mahout是一个分布式机器学习库,其主要目标是提供可扩展的机器学习算法及其实现,帮助开发人员更方便快捷地创建智能应用程序。Flume主要用于日志收集等;Sqoop用于在Hadoop与关系型数据库之间进行数据转移;HBase是一个分布式的、面向列的开源数据库。13.AI加速型云服务器常见功能不支持A、离线变更规格B、HAC、克隆D、内存复用正确答案:D14.当前算法为最小连接数,权重可填(),流量最小。A、1B、0C、-1D、100正确答案:B答案解析:最小连接数算法下,权重为0时能使流量最小,[B、]>0满足权重可填的范围,所以答案选[B、]。最小连接数算法的关键在于根据连接数和权重的关系来分配流量,当权重为0时能达到流量最小的效果,在给定的选项中只有[B、]>0这个选项符合权重可填且能实现流量最小的要求。15.从数据库架构设计来看,主要有以下哪些设计思路?A、Shared-DiskB、Shared-EveryingC、shared-NothingD、以上全都正确正确答案:D答案解析:Shared-Disk架构下,多个节点共享磁盘存储;Shared-Everying架构中,所有资源包括CPU、内存、磁盘等都是共享的;shared-Nothing架构里,每个节点拥有自己独立的CPU、内存和磁盘等资源,互不共享。这三种都是常见的数据库架构设计思路,所以以上全都正确。16.对于访问量波动明显的场景(如视频类、电商网站等无法预估业务拓展空间场景),可通过()的方式进行业务部署,为业务提供扩展空间。可以将后端云服务器组与弹性伸缩服务配合使用,在保障业务正常运作的同时最大程度降低成本。A、弹性负载均衡B、弹性伸缩C、弹性ipD、自动扩展正确答案:A17.Hadoop中Reducer执行阶段,同一时间执行(____)阶段。A、shuffle、sortB、都不是同时进行C、sort、reduceD、shffle、reduce正确答案:A18.下面关于pod的描述不正确的是?A、pod是kubernetes的基本调度单元B、一个pod可以包含一个或多个容器C、每个pod都拥有一个唯一的IP地址D、同一个pod里面的容器不能共享一个存储卷的空间正确答案:D答案解析:Pod是Kubernetes的基本调度单元,一个Pod可以包含一个或多个容器,并且每个Pod都拥有一个唯一的IP地址。同一个Pod里面的容器可以共享存储卷空间,所以选项D描述不正确。19.Spark核心层主要关注(____)问题。A、存储B、计算C、传输D、连接正确答案:B答案解析:Spark核心层主要关注的是计算问题,它提供了分布式计算的基础框架,能够高效地处理大规模数据的计算任务。存储、传输、连接等方面虽然也与Spark相关,但不是核心层主要关注的内容。20.以下不属于推断统计的是(____)。A、参数估计B、假设检验C、采样分布D、关联预测正确答案:D答案解析:推断统计主要包括参数估计和假设检验等内容。采样分布是进行推断统计的重要基础概念。而关联预测并不属于推断统计的范畴。21.自动作业(AutoOps)操作不支持哪种脚本语言?A、PythonB、ShellC、C++D、Batch正确答案:C答案解析:自动作业(AutoOps)操作支持多种脚本语言,如Python、Shell、Batch等,但通常不支持C++。C++语言主要用于系统开发、游戏开发等场景,在自动作业这种场景下较少使用。所以答案选C。22.FusionInsightHDHBase默认使用()作为其底层文件存储系统。A、HDFSB、HadoopC、MemoryD、MapReduce正确答案:A答案解析:HBase默认使用HDFS作为其底层文件存储系统,用于存储HBase的数据。Hadoop是一个生态系统,包含多种组件,HBase基于Hadoop,Memory和MapReduce不符合HBase底层文件存储系统的描述。23.每个弹性伸缩组同一时刻支持使用()个伸缩配置。A、3B、1C、5D、7正确答案:B24.企业租户可以通过()分级管理子公司或下级部门的服务。A、资源池B、VDCC、VPCD、项目正确答案:B答案解析:企业租户可以通过VDC(虚拟数据中心)分级管理子公司或下级部门的服务。VDC能够对计算、存储、网络等资源进行逻辑隔离和分配,方便企业按照组织架构进行资源的分级管理和使用,以满足不同子公司或部门的业务需求。25.()的告警为历史告警。A、已确认已清除B、过去时间紧急告警C、过去时间重要告警D、过去时间次重要告警正确答案:A答案解析:历史告警是指已经发生过且当前状态为已确认已清除的告警。选项A符合这一描述;选项B只是提到过去时间的紧急告警,不确定是否已确认已清除等状态,不一定就是历史告警;选项C过去时间的重要告警同理;选项D过去时间的次重要告警也同理。所以答案是A。26.如果虚拟机要和其他虚拟机通讯,下列哪个选项的操作是必须的?A、需要在物理服务器上配置端口绑定B、需要在物理交换机上配置端口绑定C、需要将虚拟机所在的物理服务器联网D、需要为虚拟机添加至少一块网卡正确答案:D27.不是EIP加入共享带宽好处的是:()。A、多个IP共用一条带宽B、方便管理C、节约成本D、提升性能正确答案:D答案解析:共享带宽主要是实现多个IP共用一条带宽,方便管理并节约成本,一般并不能直接提升性能。28.以下()选项不属于数据中台三层架构。A、共享层B、贴源层C、轻度汇总层D、分析层正确答案:C29.私有镜像通过以下哪个功能可以实现本地业务部署和公有云业务部署的统一化持久化?A、镜像市场B、镜像复制C、镜像共享D、镜像导出正确答案:D30.查询集合操作中,表示交集的是:()。A、INTERSECTB、MINUSC、EXECPTD、UNION正确答案:A答案解析:表示交集的操作符是INTERSECT。MINUS是差集操作符;EXECPT不是标准的集合操作符;UNION是并集操作符。31.下面哪项云产品属于数据安全类型()。A、HID(主机入侵检测)B、HVD(主机漏洞检测)C、KMS(密钥管理服务)D、SCS(证书管理服务)正确答案:C32.用户将证书上传到弹性负载均衡中,在创建()协议监听的时候绑定证书,提供HTTPS或TCP服务。A、HTTPSB、HTTPC、TCPD、UDP正确答案:A33.下述哪项是微服务引擎CSE的目标?A、微服务运维生命周期管理B、微服务上线生命周期管理C、微服务开发生命周期管理D、微服务全生命周期管理正确答案:D答案解析:微服务引擎CSE的目标是实现微服务全生命周期管理,涵盖从微服务的开发、上线到运维等各个阶段的管理。34.下列对大数据4V特征理解错误的是(____)。A、数量大,随着信息技术的高速发展,数据开始爆发性增长,存储单位从过去的GB到TB,直至PBB、广泛的数据来源,决定了大数据形式的多样性C、大数据的交换和传播是通过互联网、云计算等方式实现的,远比传统媒介的信息交换和传播速度快捷D、现实世界所产生的数据中,有价值的数据所占比例很高,体现了大数据的价值性正确答案:D答案解析:大数据具有4V特征,即Volume(数量大)、Variety(多样性)、Velocity(高速率)、Value(价值密度低)。其中价值密度低是指现实世界所产生的数据中,有价值的数据所占比例很低,而不是很高。选项A、B、C对大数据4V特征的理解均正确。35.以下两种描述分别对应:()两种分类算法的评价标准。A、Recall,PrecisionB、Precision,RocC、Recall,RocD、Precision,Recall正确答案:D36.以下不属于数据科学主要研究目的是(____)。A、从数据到信息的转换B、从数据到产品的转换C、从数据到知识的转换D、从数据到智慧的转换正确答案:B答案解析:数据科学主要研究目的包括从数据到信息、知识、智慧的转换,重点在于对数据进行分析处理以获取有价值的内容,而从数据到产品的转换更多涉及到工程化等其他领域的内容,不属于数据科学主要研究目的。37.以下哪个不是系统预置用户组?A、VDC管理员B、代维管理员C、VDC业务员D、VDC只读管理员正确答案:B答案解析:系统预置用户组有VDC管理员、VDC业务员、VDC只读管理员等,代维管理员不属于系统预置用户组。38.Hadoop生态系统中,(____)主要解决的是日志类数据的收集和处理问题。A、MahoutB、FlumeC、SqoopD、HBase正确答案:B答案解析:Flume是一个分布式、可靠且高可用的海量日志采集、聚合和传输的系统,主要用于解决日志类数据的收集和处理问题。Mahout主要用于机器学习;Sqoop主要用于在Hadoop与关系型数据库之间进行数据传输;HBase是一个分布式的、面向列的开源数据库。39.关于微服务引擎CSE描述不正确的是()?A、CSE兼容Spring、Dubbo、EDAS等微服务框架B、微服务引擎(CloudServiceEngine)提供对微服务开发、运行、治理的端到端的支持C、CSE支撑微服务架构应用的部署运维,支撑企业应用的微服务化改造D、微服务引擎在应用微服务化的过程可以减轻用户对应用进行微服务化改造的成本正确答案:A答案解析:微服务引擎CSE不兼容Dubbo和EDAS框架,A选项描述错误。B选项,微服务引擎确实提供对微服务开发、运行、治理的端到端支持;C选项,CSE能支撑微服务架构应用的部署运维以及企业应用的微服务化改造;D选项,在应用微服务化过程中可减轻用户微服务化改造成本。40.以下关于角色权限的描述,不正确的是:()。A、运营管理员具有运营管理类的所有权限B、VDC管理员具有所属VDC及下级VDC的管理权限,以及对所有资源具有管理权限C、VDC业务员在其关联的项目内,对所有资源具有管理权限D、VDC中不可以对角色权限进行自定义正确答案:D答案解析:运营管理员拥有运营管理类的全部权限,A选项正确;VDC管理员能管理所属VDC及下级VDC,且对所有资源有管理权限,B选项正确;VDC业务员在关联项目内对所有资源有管理权限,C选项正确;VDC中是可以对角色权限进行自定义的,D选项错误。二、多选题(共10题,每题1分,共10分)1.以下()是裸金属服务器具备的功能。A、使用镜像,免操作系统安装B、可以使用云硬盘C、无性能损失D、支持自动化发放正确答案:ABCD答案解析:裸金属服务器支持自动化发放,能够快速部署;它直接使用物理硬件,无性能损失;可以使用镜像,免去了操作系统安装的繁琐步骤;同时也可以使用云硬盘来满足存储需求。2.在数据同步管理中,创建同步任务的流程为场景选择、同步实例、()、()、预检查、任务确认六步。A、源库及目标库B、实例创建C、源库设置D、设置同步正确答案:AD3.以下关于Flink与其他组件交互说法正确的是:()。A、Flink任务的运行依赖Yarn来进行资源调度B、Flink的checkpoint的实现依赖于ZookeeperC、Flink可以将接受的组件发给KafkaD、Flink在HDFS文件系统中读写数据正确答案:ABCD答案解析:-**A选项**:Flink任务可以运行在Yarn上,依赖Yarn进行资源调度,该说法正确。-**B选项**:Flink的checkpoint机制可以依赖Zookeeper来存储元数据等信息,实现容错等功能,该说法正确。-**C选项**:Flink可以将处理后的数据发送到Kafka等消息系统中,该说法正确。-**D选项**:Flink支持在HDFS文件系统中进行数据的读写操作,该说法正确。4.以下关于Zookeeper的Loader选举说法正确的是:()。A、当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8,则成为leader需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+1,则成为leader需要x票正确答案:AB5.EIP加入共享带宽的好处有:()。A、多个IP共用一条带宽B、方便管理C、节约成本D、提升性能正确答案:ABC答案解析:1.**多个IP共用一条带宽**:共享带宽使得多个EIP能够共同使用一条物理带宽资源,避免了每个EIP单独占用大量带宽导致资源浪费的情况。例如,在一些小型网站集群中,多个网站的EIP可以通过共享带宽来合理分配网络资源,降低总体带宽成本。2.**方便管理**:将多个EIP加入共享带宽后,在带宽管理方面更加便捷。管理员可以统一对共享带宽进行配置、监控和调整,无需针对每个EIP分别进行操作,提高了管理效率。比如,当需要调整带宽大小时,只需在共享带宽设置中进行一次操作,所有相关EIP的带宽都会相应改变。3.**节约成本**:通过共享带宽,企业或用户可以以较低的成本获得所需的网络带宽。相比于为每个EIP单独购买足够的带宽,共享带宽模式可以根据实际流量需求灵活分配资源,从而降低了整体的网络使用成本。例如,对于流量波动较大的业务场景,共享带宽可以在流量低谷期和高峰期合理分配资源,避免了在低谷期带宽资源闲置浪费,高峰期又带宽不足的问题,节约了带宽租赁费用。4.**提升性能**:共享带宽模式在一定程度上也有助于提升网络性能。当多个EIP共享带宽时,如果其中某个EIP的流量突然增大,其他EIP的流量可能会相应减少,从而保证了整个共享带宽环境下的网络性能相对稳定。例如,在某个电商促销活动期间,某个电商网站的EIP流量猛增,此时共享带宽中的其他EIP流量会自动减少,以确保整个共享带宽环境不会因为某一个EIP的高流量而出现网络拥塞,保障了各个业务的正常运行。6.在大数据时代,企业所面临的挑战有:()。A、企业各个部门间数据分散,相同数据在各个部门内部存储格式不一致B、数据结构多样化C、竞争对手的技术进步D、数据在噪音、缺失、储存不规范等问题,需要进行大量的数据预处理工作正确答案:ABCD答案解析:在大数据时代,企业面临诸多挑战。选项A中,企业各部门数据分散且存储格式不一致,这会导致数据整合困难,影响企业对整体数据的分析和利用。选项B,数据结构多样化增加了数据处理和分析的难度,不同结构的数据需要不同的处理方式。选项C,竞争对手的技术进步会给企业带来压力,促使企业不断提升自身数据处理和应用能力以保持竞争力。选项D,数据存在噪音、缺失、储存不规范等问题,必须进行大量预处理工作才能有效利用数据,这无疑增加了企业的数据处理成本和工作量。7.调整角色包含:()。A、删除角色B、角色不同主机之间迁移C、变更角色D、新增角色正确答案:ABD8.FusionlnsightHD中,可以通过()方式查看Oozie作业的调试结果。A、查看Oozie的JAVAAPI返回结果是:否符合预期B、通过Hue的workflow仪表板查看程序运行结果C、通过Hue的workflow仪表板查看程序运行结果D、Oozie自带的Web界面也可以查看作业执行结果正确答案:ABCD答案解析:在FusionlnsightHD中,查看Oozie作业调试结果有多种方式。选项A,查看Oozie的JAVAAPI返回结果可判断是否符合预期;选项B和C,通过Hue的workflow仪表板能查看程序运行结果;选项D,Oozie自带的Web界面也可以用于查看作业执行结果。9.下列关于Worker、Executor、Task说法正确的是:()。A、每个Worker可以运行多个ExecutorB、每个Executor可以运行多个TaskC、每个Executor可以运行不同组件的TaskD、每个Worker只能为一个拓扑运行Executor正确答案:ABC10.以下属于HiveSQL中DDL的是:()。A、修改表B、删除表C、数据导入D、建表正确答案:ABD答案解析:1.**解析-修改表**:修改表的结构等操作属于数据定义语言(DDL)。例如可以使用`ALTERTABLE`语句来修改表名、添加列、修改列的数据类型等。2.**解析-删除表**:`DROPTABLE`语句用于删除表,这是典型的DDL操作,用于定义数据库对象的删除。3.**解析-数据导入**:数据导入主要涉及将数据加载到表中,这属于数据操作语言(DML),比如`LOADDATA`语句,所以不属于DDL。4.**解析-建表**:`CREATETABLE`语句用于创建表,是DDL的重要组成部分,用于定义数据库中的表结构。三、判断题(共20题,每题1分,共20分)1.分布式执行框架采用Producer-Consumer模型。A、正确B、错误正确答案:A2.不同帐号下裸金属服务器可以互通的。A、正确B、错误正确答案:A3.对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求。A、正确B、错误正确答案:A4.执行引擎的主要功能是解析用户输入的SQL查询,生成执行计划。A、正确B、错误正确答案:B5.当租户下已创建用户组时,选择为项目关联用户组后,该项目拥有所关联用户组的角色权限。A、正确B、错误正确答案:A6.由于Spark是基于内存的计算引擎,因此,一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论