版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:大数据开发基础大数据开发基础(习题卷73)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据开发基础第1部分:单项选择题,共54题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.(__)的学习目的是生成一颗泛化能力强,即处理未见示例能力强的决策树。A)线性回归B)贝叶斯分类器C)神经网络D)决策树答案:D解析:[单选题]2.在HDFS中,用于保存数据的节点是()A)namenodeB)datanodeC)secondaryNodeD)yarn答案:B解析:[单选题]3.在情感分析中,下面哪个词不属于影响词?A)识别B)开心C)难过D)无聊答案:A解析:[单选题]4.Flume的输出叫做()。A)接收器B)源C)数据流D)通道答案:A解析:[单选题]5.以下关于数据产品特征的描述不正确的是A)数据产品往往能达到极高的准确度,并且保持稳定B)数据产品所使用的数据包含很多差数据C)数据产品会随着环境的改变发生变化D)数据产品的决策会直接影响业务的表现答案:A解析:[单选题]6.Redis不适用于以下哪个应用场景?A)获取PB级Value数据B)获取TOPN操作C)获取手机验证码D)获取最新N个数据的操作答案:A解析:[单选题]7.某二叉树共有12个结点,其中叶子结点只有1个。则该二叉树的深度为(根结点在第1层)___________。A)8B)12C)6D)3答案:B解析:[单选题]8.以下SQL语句编写正确的是()。--A)SELECT*FROMsh_goodsWHERE0;B)SELECT*FROMsh_goodsGROUPBYcategory_iD、WHEREprice>5;C)SELECT*FROMsh_goodsLIMIT3ORDERBYprice;D)以上选项都不正确答案:A解析:[单选题]9.以下哪个不是技术组的职责()A)负责组织编制泛在电力物联网建设方案和规划B)组织审核各单位泛在电力物联网建设方案C)负责泛在电力物联网组织优化诊断D)统一组织项目管控和架构管控答案:C解析:[单选题]10.下列对图数据库描述正确的是?A)存储图片的数据库B)以?图?数据结构存储和查询数据的数据库C)数据仓库的一种D)与关系型数据库类似的数据库答案:B解析:[单选题]11.有以下两个程序。程序一:x=[1,2,3]deff(x):x=x+[4]f(x)print(x)程序二:x=[1,2,3]deff(x):x+=[4]f(x)print(x)下列说法正确的是()A)两个程序均能正确运行,但结果不同B)两个程序的运行结果相同C)程序一能正确运行,程序二不能D)程序一不能正确运行,程序二能答案:A解析:[单选题]12.图像的形态学处理方法包括()。A)图像增强B)图像锐化C)图像分割D)腐蚀答案:D解析:[单选题]13.下列关于Python的说法中,错误的是()A)Python是从ABC发展起来的B)Python是一门高级计算机语言C)Python只能编写面向对象的程序D)Python程序的效率比C程序的效率低答案:C解析:[单选题]14.云计算平台层(PaaS)指的是什么?A)操作系统和围绕特定应用的必需的服务B)将基础设施(计算资源和存储)作为服务出租C)从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个模型D)提供硬件、软件、网络等基础设施以及提供咨询、规划和系统集成服务答案:A解析:[单选题]15.Python安装扩展库常用的是()工具。A)pyinstallB)pipC)popD)post答案:B解析:略。[单选题]16.关于文档数据库的说法,下列哪一项是错误的:()A)数据是规则的B)性能好(高并发)C)缺乏统一的査询语法D)复杂性低答案:A解析:[单选题]17.业务中台方面,以业务为导向,优先建设()和客户服务业务中台,后期逐步视情况拓展账务结算等业务共享服务A)电网服务业务中台B)电网资源业务中台C)电网优化业务中台D)电网环境业务中台答案:B解析:[单选题]18.消费信息是否属于用户信息?()A)属于B)不属于C)未定义D)以上都不对答案:A解析:[单选题]19.关于Adaboost算法的描述中,错误的是:A)AdaBoost模型是弱分类器的线性组合B)提升树是以分类树或者回归树为基本分类器的提升方法,提升树被认为是统计学习中最有效的方法之一。C)AdaBoost算法的一个解释是该算法实际上是前向分步算法的一个实现,在这个方法里,模型是加法模型,损失函数是指数损失,算法是前向分步算法D)AdaBoost同时独立地学习多个弱分类器答案:D解析:[单选题]20.Hive常被用来处理()场景。A)事务性处理B)批量计算C)实时性计算D)流计算答案:B解析:[单选题]21.使用Maxcomputetunnel命令上传数据时,下列()参数可以设定是否忽略脏数据。A)-dbrB)-fdC)-dfpD)-rd答案:A解析:[单选题]22.以下关于Saoop数据导入原理的描述中,错误的是哪-项?A)Sqoop会根据传入的num-mappers来确定划分几个区域。B)Saoop根据不同的split-by参数值来进行切分,然后将切分出来的区域分配到不同map中。C)num-mappers越大效率越高。D)Saoop在import时,需要指定split-by参数。答案:C解析:[单选题]23.数据管理成熟度模型将机构数据管理能力定义为(__)个不同成熟度等级,并给出了(__)类关键过程域,共(__)个关键活动。A)3,7,21B)4,6,24C)5,6,25D)6,7,28答案:C解析:[单选题]24.已知一组数据的协方差矩阵,下面关于主分量说法错误的是()。A)主分量分析的最佳准则是对一组数据按一组正交基分解,在只取相同数量分量的条件下,以均方误差计算截尾误差最小B)在经主分量分解后,协方差矩阵成为对角矩阵C)主分量分析就是K-L变换D)主分量是通过求协方差矩阵的特征值得到答案:C解析:K-L变换与PCA变换是不同的概念,PCA的变换矩阵是协方差矩阵,K-L变换的变换矩阵可以有很多种。如二阶矩阵、协方差矩阵、总类内离散度矩阵等。当K-L变换矩阵为协方差矩阵时,等同于PCA。[单选题]25.()负责组织制定电力监控系统数据安全保护方案,并对安全保护措施技术落实情况进行检查。A)国调中心B)国网安质部C)国网信通部D)网络安全和信息化领导小组答案:A解析:[单选题]26.用户输入整数的时候不合规导致程序出错,为了不让程序异常中断,需要用到的语句是:A)if语句B)eval语句C)try-except语句D)循环语句答案:C解析:[单选题]27.Spark核心层主要关注()问题。A)存储B)计算C)传输D)连接答案:B解析:[单选题]28.中值滤波器可以A)消除孤立噪声B)检测出边缘C)进行模糊图像恢复D)模糊图像细节答案:A解析:[单选题]29.下列关于Pandas中groupby方法的说法正确的是()。A)groupby能够实现分组聚合B)groupby方法的结果能够直接查看C)groupby是Pandas提供的一个用来分组的方法D)groupby方法是Pandas提供的一个用来聚合的方法答案:C解析:groupby是分组函数,分组的结果是一个group对象,结果需要进行聚合或迭代操作才能查看。[单选题]30.聚类分析的常见应用场景不包括:()A)发现关联购买行为B)目标用户的群体分类C)不同产品的价值组合D)探测发现离群点和异常值答案:A解析:[单选题]31.Hive查询语言和SQL的一个不同之处在于()操作A)GroupB)JoinC)PartitionD)Union答案:C解析:[单选题]32.下列选项中,属于Python关键字的是()。A)nameB)isC)ifD)and答案:A解析:[单选题]33.Hadoop最初是由谁创建的?A)LuceneB)DougCuttingC)ApacheD)MapReduce答案:B解析:[单选题]34.关于SVM泛化误差描述正确的是()A)超平面与支持向量之间距离B)SVM对未知数据的预测能力C)SVM的误差阈值D)SVM波动范围答案:B解析:[单选题]35.Spark自带的资源管理框架是:()。A)StandaloneB)MesosC)YARND)Docker答案:B解析:[单选题]36.对于一个图像识别问题(在一张照片里找出一只猫),()可以更好地解决这个问题A)循环神经网络B)感知机C)多层感知机D)卷积神经网络答案:D解析:[单选题]37.下列关于使用MapReduce编程模型实现SQL中的join操作错误的是?A)ReduceJoin可以实现内链接,也能实现各种外连接B)ReduceJoin的join操作是在MapReduce程序中的reducer阶段完成的C)MapJoin也适合各种join场景,也能实现内连接和各种外链接D)MapJoin不会产生数据倾斜答案:C解析:[单选题]38.创建数据同步任务后,对于增量同步中的任务,可以通过:()来增加或者移除同步数据库和表,并提交同步任务。A)删除同步对象B)编辑同步对象C)创建同步对象D)返回同步对象答案:B解析:[单选题]39.关于?importmodulename?导入形式,以下错误的选项是()。A)被导入模块的命名空间是模块导入的一部分B)这种导入形式可以防止名称冲突C)被导入模块的命名空间可用于导入模块D)模块中的标识符可通过以下方式访问:modulename.identifier答案:A解析:[单选题]40.Python语言定义的class的初始化函数的函数名是()。A)initB)initC)initD)init答案:B解析:Python语言定义的class的初始化函数的函数名是init。[单选题]41.以查准率为纵轴、查全率为横轴作图,就得到了查准率-查全率曲线,简称(__)。A)双曲线B)P-R曲线C)科克曲线D)共轭曲线答案:B解析:[单选题]42.深度学习的本质是什么?A)喂食大量数据项B)浏览大量知识C)模型训练D)让机器变得更像人答案:C解析:[单选题]43.事件A在另外一个事件B已经发生条件下的发生概率,称为(__)。A)先验概率B)后验概率C)条件概率D)统计概率答案:C解析:[单选题]44.以下选项中,运算优先级别最低的是()。--A)算术运算符B)逻辑运算符C)赋值运算符D)位运算符答案:C解析:[单选题]45.Hive创建表的语句是()A)createtableB)createdatabaseC)createdataD)createsheet答案:A解析:[单选题]46.下面关于ZooKeeper特性的描述错误的是?A)消息更新只能成功或者失败,没有中间状态B)ZooKeeper节点数必须为奇数个C)一条消息要被超过半数的Server接收,它将可以成功写入磁盘D)客户端所发送的更新会按照它们被发送的顺序进行应用答案:B解析:[单选题]47.()是交叉验证法的一种特例。A)自助法B)留一法C)交叉验证法D)错误率分析答案:B解析:[单选题]48.下列字符串表示plot线条颜色、点的形状和类型为红色五角星点短虚线的是()。A)'bs-'B)'go-.'C)'r+-.'D)'r*-.'答案:D解析:[单选题]49.HBase为什么适用于海量数据存储?A)集群规模小B)支持列存表C)多列簇特性D)HDFS做底层存储答案:D解析:[单选题]50.关系云的一个重要功能是提供()。A)数据库即服务B)虚拟服务C)弹性计算D)按需服务答案:A解析:[单选题]51.在MapReduce中,通常将Map拆分成M个片段、Reduce拆分成R个片段,下面描述中错误的是()。A)MapReduce中单台机器上执行大量不同的任务可以提高集群的负载均衡能力B)Master必须执行O(M+R)次调度C)Master在内存中保存oO(M+R)个状态D)M和R要比集群中Worker数量多答案:C解析:[单选题]52.以下代码的结果是foriinrange(5,10,2):print(i)A)输出5678910(换行)B)输出57910(换行)C)输出579(换行)D)输出6810(换行)答案:C解析:[单选题]53.对ElasticSearch描述正确的是()。A)客户端必须把索引请求发给shardB)客户端必须把索引请求发给EsNodeC)客户端必须把素引请求发给EsMasteD)客户端必须把索引请求发给指定的EsNode答案:C解析:[单选题]54.以下描述不正确的是()。A)文本是半结构化数据B)非结构化数据是数据科学与传统数据管理的主要区别C)视频是非结构化数据D)目前,非结构化数据占比最大答案:A解析:第2部分:多项选择题,共26题,每题至少两个正确答案,多选或少选均不得分。[多选题]55.HDFS可以使用()的方法来实现容错机制。A)机架位感知B)预测性分析法C)集群计算D)erasurecode答案:AD解析:[多选题]56.HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件:()A)日志B)命名空间镜像C)存储块复制信息D)集群配置信息答案:AB解析:[多选题]57.数据库信息的运行安全采取的主措施有()。A)备份与恢复B)应急C)风险分析D)审计跟踪答案:ABCD解析:[多选题]58.数据再利用的意义在于()A)挖掘数据的潜在价值B)实现数据重组的创新价值C)利用数据可扩展性拓宽业务领域D)优化存储设备,降低设备成本答案:ABC解析:[多选题]59.常见的图像分割算法有()。A)基于区域的分割方法B)基于人工勾画的分割方法C)基于边缘的分割方法D)基于阈值的分割方法答案:ACD解析:[多选题]60.列关于MapJoin说法有误的是()A)两份数据data1和data2会被map分别读入,解析成以连接字段为key,以查询字段为value的key-value对,并标明数据来源是data1还是data2。B)reducetask会接收来自data1和data2的相同key的数据,在reduce端进行乘积连接。C)需要有一份数据比较小,在map端能够把它加载到内存,并进行join操作。D)大份数据作为MapTask的输入答案:AB解析:[多选题]61.下面关于CNNMaxPooling功能描述正确的是:()A)SubsamplingthepixelswillnotchangetheobjectB)对Convolutionallayer提取的特征进一步降维C)AlphaGoCNN中没有包含MaxPoolingD)同一特征的强度信息丢失答案:ABCD解析:[多选题]62.对于Pandas索引操作,下列说法错误的是()。A)可通过指定索引名的方式进行选取B)swaplevel()方法可以将层次索引的位置进行交换C)sort_index()方法会对层次索引进行排序D)在使用sort_index()方法排序时,会优先选择按内层索引进行排序答案:ABC解析:[多选题]63.下列属于Spark集群搭建前的需要完成的工作是(__)。A)搭建hadoop集群B)配置集群hostC)安装jdkD)启动Spark集群答案:ABC解析:[多选题]64.Goolge于2003-2008年发表的3篇论文在云计算和大数据技术领域产生了深远影响,通常被称为Google三大技术包括()A)SparkB)BigTableC)GFSD)MapReduce答案:BCD解析:[多选题]65.对数据表进行连接操作,有哪些连接方法?()A)内部连接B)外部连接C)合并连接D)交叉连接答案:ABD解析:[多选题]66.OTSAPI中提供了()Action可以进行多行数据操作。A)BachtGetRowB)GetRangeC)GetMultiRowD)BatchWriteRow答案:ABD解析:[多选题]67.Python中数组切片操作非常方便,若l=np.arange(100),以下返回的哪些不是空数组()A)l[0:-3]B)l[-2:13]C)l[::3]D)l[2-3:]答案:ACD解析:[多选题]68.数据节点主要负责()。A)存储文件B)将文件分成block存储在磁盘上C)将文件拷贝多个副本D)搜索文件答案:ABCD解析:[多选题]69.Spark的运行需要(__)和(__)的支持。A)JavaB)C++C)ScalaD)C答案:AC解析:[多选题]70.下列关于嵌入式选择描述错误的是(__)。A)嵌入式选择是将特征选择过程与学习器训练过程融为一体,两者在同一个优化过程中完成B)从最终学习器性能来看,嵌入式特征选择比过滤式特征选择更好C)嵌入式特征选择的计算开销通常比过滤式特征选择大得多D)嵌入式特征选择方法直接针对给定学习器进行优化答案:BCD解析:[多选题]71.下面关于HDFS的体系结构描述正确的是:()A)HDFS采用了主从(Master/Slave)结构模型,一个HDFS集群包括一个名称节点和若干个数据节点B)名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问C)集群中的数据节点一般是一个节点运行一个数据节点进程,负责处理文件系统客户端的读/写请求D)名称节点会周期性地向数据节点发送?心跳?信息,报告自己的状态答案:ABC解析:[多选题]72.下列有关HDFS的容错机制描述正确的是()。A)HDFS可以使用机架位感知的方法实现容错机制B)HDFS可以使用基于erasurecode的方法实现容错机制C)HDFS使用机架位感知的方法先把一份拷贝放入同机架上的机器,然后在拷贝一份到其他服务器D)HDFS使用机架位感知的方法先把一份拷贝放入同机架上的机器,然后在拷贝一份到同机架机器的不同位置上答案:ABC解析:[多选题]73.下面关于MapReduce工作流程的描述,正确的是:()A)一个大的MapReduce作业,会被拆分成许多个Map任务在多台机器上并行执行B)每个Map任务通常运行在数据存储的节点上C)当Map任务结束后,会生成以<key,value-list>形式表示的许多中间结果D)Reduce任务会对中间结果进行汇总计算得到最后结果答案:ABD解析:[多选题]74.随机森林在做数据处理方面的优势是()A)不需要做缺失佳处理B)不需要处理噪音C)不需要做特征选择D)不需要平衡数据集答案:ACD解析:[多选题]75.下列选项中哪个属于NoSQL数据库A)BigTableB)HbaseC)MongoDBD)Oracle答案:ABC解析:[多选题]76.下面关于智能物流的描述,正确的是:A)又称智慧物流,是利用智能化技术,使物流系统能模仿人的智能,具有思维、感知、学习、推理判断和自行解决物流中某些问题的能力B)可以帮助实现物流资源优化调度和有效配置.并且提升物流系统效率C)智能物流概念源n2010年IBM发布的研究报告《智慧的未来供应链》D)智能物流概念经历了自动化、信息化、网络化3个发展阶段答案:ABCD解析:[多选题]77.《大数据应用推动考核办法》日常工作月度考核奖考核内容为A)日常工作B)数据应用需求对接情况C)大数据应用情况D)特殊贡献答案:ABC解析:第3部分:判断题,共16题,请判断题目是否正确。[判断题]78.Hive基于Hadoop,安装Hive之前先安装好Hadoop。()A)正确B)错误答案:对解析:[判断题]79.read_csv()和read_table()函数没有任何区别。()A)正确B)错误答案:错解析:[判断题]80.当我们完成Hadoop集群的安装和配置后,就可以直接启动集群。A)正确B)错误答案:错解析:当我们完成Hadoop集群的安装和配置后,还不能直接启动集群,因为在初次启动HDFS集群时,必须要对主节点进行格式化处理。[判断题]81.数据质量监控DQC(DataQualityControl)模块是对数据库里的数据质量进行质量管理的工具。A)正确B)错误答案:对解析:[判断题]82.数据建模是从大量、不完整、有噪声、随机的实际数据中,提取隐含在其中的人们不知道的、但是潜在有用知识的过程。A)正确B)错误答案:对解析:[判断题]83.如果一个模型使用数据集的全部特征并且能够达到100%的准确率,但在测试集上仅能达到70%左右,这说明模型欠拟合。()A)正确B)错误答案:错解析:[判断题]84.如果自变量X和因变量Y之间存在高度的非线性和复杂关系,那么树模型很可能优于经典回归方法A)正确B)错误答案:对解析:[判断题]85.一个数字5也是合法的Python表达式。A)正确B)错误答案:对解析:[判断题]86.为了让代码更加紧凑,减少占用空间,不应该在代码中任何位置增加空格和空行。()A)正确B)错误答案:错解析:[判断题]87.相同内容的字符串使用不同的编码格式进行编码得到的结果并不完全相同。A)正确B)错误答案:对解析:[判断题]88.Key和Va1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年石家庄市桥东区街道办人员招聘考试模拟试题及答案解析
- 2026年平顶山市卫东区网格员招聘考试模拟试题及答案解析
- 2025年吉林市昌邑区幼儿园教师招聘考试试题及答案解析
- 2026年北京市怀柔区街道办人员招聘笔试模拟试题及答案解析
- 2026年昆明市东川区幼儿园教师招聘笔试备考试题及答案解析
- 2026年佛山市高明区幼儿园教师招聘笔试备考试题及答案解析
- 2026年山东省聊城市幼儿园教师招聘笔试参考题库及答案解析
- 2026年佳木斯市郊区网格员招聘考试参考题库及答案解析
- 2026年辽源市龙山区街道办人员招聘笔试参考试题及答案解析
- 2026年河南省郑州市街道办人员招聘笔试备考题库及答案解析
- 化工工艺管道施工焊接方案
- 出口退税管理培训课件
- 2024中国电信集团限公司采购事业部专业岗位员工招聘高频考题难、易错点模拟试题(共500题)附带答案详解
- 高新技术产品进出口统计目录
- 仿生蝴蝶设计说明书
- 《台湾省的地理环境与经济发展》示范课教学设计【湘教版八年级地理下册】
- 2024年安徽交控集团招聘笔试参考题库含答案解析
- (协议书)建房安全责任协议书
- 公务员考试常识考试题库1000题(含参考答案)
- 衢州市根宫佛国5A级旅游景区暗访报告
- 基本公共卫生专项资金的核算与管理
评论
0/150
提交评论