版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9月ict大数据模拟试题一、单选题(共20题,每题1分,共20分)1.题目:对于云数据库MySQL,使用()后端对接多个数据库实例,实现分布式数据库的透明访问。选项A.数据管理服务(DAS)选项B.数据复制服务(DRS)选项C.分布式数据库中间件服务(DDM)选项D.分布式缓存服务(DCS)2.题目:一幅大小为512×512的8比特图像,则该图像大小为(____)。选项A.256KB选项B.16KB选项C.128KB选项D.32KB3.题目:以下哪种机制使Flink能够实现窗口中无序数据的有序处理?选项A.窗口选项B.事件时间选项C.检查点选项D.有状态处4.题目:资源注册页面,点击solr增量索引的作用是:()。选项A.增加索引选项B.更新索引选项C.删除索引选项D.创建索引5.题目:以下那种功能不属于分布式服务总线提供的?选项A.消息转发选项B.服务发现选项C.黑白名单选项D.服务注册6.题目:Apriori是一种(____)算法。选项A.决策树选项B.强化学习选项C.聚类分析选项D.关联分析7.题目:以下()组件负责存储业务数据、执行数据查询任务以及向CN返回执行结果。选项A.DN选项B.WLM选项C.CN选项D.GTM8.题目:安装FusionInsightHD的Streaming组件是,Nimbus角色要求安装()个节点。选项A.1选项B.4选项C.3选项D.29.题目:以下()属于VDC只读管理员权限。选项A.对本VDC及其下级VDC中资源、用户、项目、自运维等具有操作权限选项B.创建下级VDC选项C.管理审批流程选项D.对用户、操作日志等具有导出权限10.题目:元数据采集任务的启动方式不包括:()。选项A.手动执行选项B.定时立即执行选项C.循环执行选项D.定时执行11.题目:Hadoop中Reducer执行阶段,同一时间执行(____)阶段。选项A.都不是同时进行选项B.shuffle、sort选项C.shffle、reduce选项D.sort、reduce12.题目:执行以下哪个命令,可以验证文件系统域名是否可以解析到IP地址?选项A.ping选项B.nslookup选项C.scp选项D.wget13.题目:以下哪个适合运行在通用计算型弹性云服务器实例上?选项A.超大内存数据库选项B.轻量级数据库选项C.大型游戏选项D.机器学习14.题目:YARN中默认的资源调度器是:()。选项A.FIFO调度器选项B.容量调度器选项C.以上全部是选项D.Fair调度器15.题目:在留出法、交叉验证法和自助法三种评估方法中,(____)更适用于数据集较小、难以划分训练集和测试集的情况。选项A.留出法选项B.交叉验证法选项C.留一法选项D.自助法16.题目:DRS查看迁移任务中的迁移日志,不能看到的是:()。选项A.描述选项B.创建用户选项C.级别选项D.时间17.题目:云计算采用()存储的方式来保证存储数据的可靠性。选项A.双备份选项B.日志选项C.校验码选项D.冗余18.题目:()利用报文里的连接ID字段进行一致性hash算法,得到一个具体的数值,同时对后端服务器进行编号,按照运算结果将请求分发到对应编号的服务器上。选项A.加权轮询算法选项B.加权最少连接选项C.源IP算法选项D.连接ID算法19.题目:Kubernetes无状态工作负载指的是()选项A.StatefulSet选项B.Deployment选项C.DaemonSet选项D.Job20.题目:ELB七层基于()实现。选项A.Nginx选项B.LVS选项C.Apache选项D.Haproxy二、判断题(共20题,每题1分,共20分)1.题目:Append算子可能存在左右子节点。选项A.正确选项B.错误2.题目:Hive是一种数据仓库处理工具,使用类似SQL的HiveSQL语言实现数据查询功能,所有Hice的数据存储都存储在HDFS中。选项A.正确选项B.错误3.题目:由于Spark是基于内存的计算引擎,因此,一个Spars应用可以处理的数据量不能超过分给这个Spark应用的内存总和。选项A.正确选项B.错误4.题目:ELB支持通过内网、EIP两种方式访问。选项A.正确选项B.错误5.题目:云计算可以为各种不同的物联网应用提供统一的服务交付平台。选项A.正确选项B.错误6.题目:Redis命令区分大小写选项A.正确选项B.错误7.题目:元数据按用途的不同分为三类:技术元数据、业务元数据和应用元数据。选项A.正确选项B.错误8.题目:FusioninsightHD中,Oozie在提交作业前需要先上传本作业所依赖的配置文件和jar包到HDFS。选项A.正确选项B.错误9.题目:Kettle中有两种脚本文件transformation(转换ktr结尾)和job(任务kjb结尾)选项A.正确选项B.错误10.题目:实时检索部署不仅支持双平面组网,也支持单平面组网。选项A.正确选项B.错误11.题目:如果该安全组的入站规则是放通的,那无论出站规则如何,都将允许入站请求的响应流量可以出站。选项A.正确选项B.错误12.题目:导入数据字典的excel中,字典类型代码在系统中不存在且在excel中不存在,否则导入失败。选项A.正确选项B.错误13.题目:对于SparkStreaming的应用,在一个JVM中,同一时间只能有一个StreamingContext处于活跃状态。选项A.正确选项B.错误14.题目:离线批处理,通常是指对海量数据进分析和处理,形成结果数据,供下一步数据应用使用,离线处速对处理时间要求不高。选项A.正确选项B.错误15.题目:HLog日志保证了用户写入的数推不丢失。选项A.正确选项B.错误16.题目:Flume传输数据的过程中,Sink取走数据并写入目的地后,会将events从channel中删除。选项A.正确选项B.错误17.题目:CIoudera是Hadoop商业版的发布公司。选项A.正确选项B.错误18.题目:Flink状态快照是同步捕获的,影响正在进行的计算任务。选项A.正确选项B.错误19.题目:采用Nestloop算子实现连接操作没有限制。选项A.正确选项B.错误20.题目:Zookeeper的增强性包括在审计日志中添加ephemeralnode被删除的审计日志。选项A.正确选项B.错误答案与解析一、单选题答案1.答案:【A】2.答案:【A】3.答案:【B】答案解析:Flink通过事件时间机制,结合窗口和有状态处理,能够实现窗口中无序数据的有序处理。事件时间是指数据产生的时间,通过使用事件时间,Flink可以基于数据的实际产生时间进行处理,而不受数据到达顺序的影响。窗口操作则是对数据进行分组和聚合的手段,有状态处理允许Flink保存和更新窗口内的数据状态,从而在处理无序数据时能够正确地计算窗口结果。检查点主要用于故障恢复,确保作业在失败后能够从正确的状态重新启动,与窗口中无序数据的有序处理并无直接关联。4.答案:【B】答案解析:点击solr增量索引的作用是更新索引。增量索引是指只对自上次全量索引或上次增量索引以来发生变化的数据进行索引更新,而不是重新创建整个索引,所以其目的是更新索引,而不是创建、增加或删除索引。5.答案:【A】6.答案:【D】答案解析:Apriori算法是一种用于关联分析的算法,用于发现数据集中项集之间的关联关系。它通过逐层搜索的方式,从候选频繁项集中找出真正的频繁项集,从而挖掘出有价值的关联规则。聚类分析是将数据对象分组为不同的类或簇;决策树是基于树结构进行决策的方法;强化学习是智能体在环境中通过不断试错来学习最优策略的过程。这些都与Apriori算法的功能不同。7.答案:【A】8.答案:【D】9.答案:【D】答案解析:只读管理员权限可以对用户、操作日志等具有导出权限,对本VDC及其下级VDC中资源、用户、项目、自运维等具有只读操作权限,不能创建下级VDC,也不能管理审批流程。选项A中说具有操作权限不准确,应该是只读操作权限;选项C创建下级VDC不是只读管理员权限;选项D管理审批流程也不属于只读管理员权限。10.答案:【C】答案解析:元数据采集任务常见的启动方式有定时执行、手动执行、定时立即执行等。循环执行并不是元数据采集任务典型的启动方式。定时执行是按照预先设定的时间周期来启动任务;手动执行是由操作人员手动触发任务启动;定时立即执行是在某个特定时间点马上启动任务。11.答案:【B】12.答案:【B】答案解析:nslookup命令用于查询DNS域名系统,可验证文件系统域名是否可以解析到IP地址。scp是用于远程文件传输的命令;wget是用于下载文件的命令;ping是用于测试网络连通性的命令,它们都不能直接验证域名到IP地址的解析,所以选A。13.答案:【B】答案解析:轻量级数据库对资源的需求相对较为适中,通用计算型弹性云服务器实例可以满足其运行要求。超大内存数据库通常需要专门的高内存型云服务器来提供足够的内存支持;大型游戏一般对图形处理能力等有较高要求,更适合图形处理型云服务器;机器学习任务可能需要强大的计算能力和并行处理能力,通用计算型弹性云服务器可能不太能充分满足其需求,可能更适合高性能计算型云服务器。14.答案:【B】15.答案:【D】答案解析:自助法是对数据集进行有放回采样,从原始数据集中随机抽取数据构成训练集,剩余数据作为测试集。这样可以在数据集较小难以划分训练集和测试集时使用,因为它不需要事先划分数据集,而是通过采样的方式来生成训练集和测试集。留出法需要明确划分训练集和测试集,在数据集小的时候不太方便。交叉验证法是将数据集进行划分然后多次训练和测试,也依赖于对数据集的合理划分。留一法是交叉验证法的一种极端情况,同样需要对数据集进行划分,在小数据集上实施也有一定难度。所以更适用于小数据集难以划分情况的是自助法。16.答案:【B】答案解析:迁移日志中通常会记录时间、级别、描述等信息,用于反映迁移任务的执行情况和相关细节,但一般不会记录创建用户的操作内容。17.答案:【D】答案解析:云计算采用冗余存储的方式来保证存储数据的可靠性。冗余存储是指在多个存储设备上存储相同的数据副本,当其中一个存储设备出现故障时,其他副本可以保证数据的可用性,从而提高了数据的可靠性。双备份只是冗余的一种形式;日志主要用于记录操作等信息,与保证数据可靠性的直接关系不大;校验码主要用于检测数据传输或存储过程中是否出现错误,但相比冗余存储,不是保证数据可靠性的核心方式。18.答案:【D】答案解析:连接ID算法利用报文里的连接ID字段进行一致性hash算法,得到一个具体的数值,同时对后端服务器进行编号,按照运算结果将请求分发到对应编号的服务器上。19.答案:【B】答案解析:Kubernetes无状态工作负载主要包括Deployment、ReplicaSet等。Deployment提供了一种声明式的方式来创建、更新和管理一组Pod副本,确保应用程序的可用性和弹性,属于无状态工作负载。Job主要用于运行批处理任务,完成后即结束,不是无状态工作负载的典型代表。StatefulSet用于管理有状态应用程序,与无状态工作负载概念不同。DaemonSet确保在集群中的每个节点上运行一个Pod副本,通常用于系统守护进程等,也不属于无状态工作负载。20.答案:【A】答案解析:ELB七层是基于Nginx实现的。Nginx是一个轻量级的高性能HTTP服务器和反向代理服务器,它在处理高并发连接方面表现出色,适合用于实现ELB七层的功能,能够高效地进行流量分发、负载均衡等操作。而LVS主要用于四层负载均衡;Hapro
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年黑龙江省同江市高二生物下册期末考试考试卷审定版附答案
- 2026年江苏省新沂市高二生物下册期末考试模拟卷及答案【真题汇编】
- 2026年江西省井冈山市高二生物下册期末考试试卷附完整答案(名校卷)
- 2026年江苏省海门市高二生物下册期末考试模拟卷含答案(夺分金卷)
- 2026年四川省彭州市高二生物下册期末考试试卷一套附答案
- 2026年辽宁省瓦房店市高二生物下册期末考试模拟卷及一套参考答案
- 2026年江苏省兴化市高二生物下册期末考试模拟卷附答案【完整版】
- 2026年安徽省桐城市高二生物下册期末考试考试卷(夺冠系列)附答案
- 2026年湖北省枣阳市高二生物下册期末考试模拟卷及完整答案【名校卷】
- 2025年云南省芒市高二生物下册期末考试试卷附答案【典型题】
- 初中英语外研版七年级首字母填空专练1(有答案)
- 《机械制图》职业院校机械类专业全套教学课件
- 2025年高考语文复习备考复习策略讲座
- 齿根弯曲疲劳强度计算
- MOOC 大学英语跨文化交际-黑龙江大学 中国大学慕课答案
- 分析仪器荧光光谱仪课件
- 教师权力与学生权利
- 意大利(百得)TBG 系列燃烧机说明书
- 部编版四年级语文下册全册八个单元知识点考点总结归纳(含字词句段篇)
- 《沈醉回忆录 全5册 》读书笔记
- YY/T 0681.1-2018无菌医疗器械包装试验方法第1部分:加速老化试验指南
评论
0/150
提交评论