版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
山东外国语职业技术大学高等学历继续教育大数据技术导论2025学年第二学期期末考试普通用卷学习方式:业余/函授时间:120分钟考试科目:《大数据技术导论》(总分)100分集中闭卷考试特别提醒:1、所有答案均须填写在答题卷上,否则无效。2、每份答卷上均须准确填写专业、身份证号码、所属学习中心名称、学号、姓名等。一单选题(共20题,总分值60分)1.K-Means算法不适合处理(
)属性。(3分)A.稳定型B.离散型C.连续型D.随机型2.不是大数据核心技术()。(3分)A.大数据类型B.大数据采集C.大数据分析D.大数据可视化3.在HBase表中,要定位某一单元格并获取其中的值,则需要提供以下信息()。(3分)A.行键B.行键、列C.行键、列族、列D.行键、列族、列、时间戳4.下述关于hadoop的阐述,正确的是()(3分)A.是一个分布式数据库与并行计算系统B.是一个分布式存储系统与分布式数据库C.是一个集中式存储与分布式并行运算系统D.是一个分布式存储与分布式并行运算系统5.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是?(3分)A.一次写入,少次读写B.多次写入,少次读写C.一次写入,多次读写D.多次写入,多次读写6.在设计词频统计的MapReduce程序时,对于文本行“hellobigdatahellohadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作):(3分)A.<"hello",1,1>、<"bigdata",1>和<"hadoop",1>B.<"hello",2>、<"bigdata",1>和<"hadoop",1>C.<"hello",<1,1>>、<"bigdata",1>和<"hadoop",1>D.<"hello",1>、<"hello",1>、<"bigdata",1>和<"hadoop",1>7.以下关于云计算、大数据和物联网之间的关系,论述错误的是:(3分)A.云计算侧重于数据分析B.云计算、大数据和物联网三者紧密相关,相辅相成C.物联网可以借助于云计算实现海量数据的存储D.物联网可以借助于大数据实现海量数据的分析8.数据挖掘在大型数据库中寻找预测信息是(
)。(3分)A.随机的B.单一的C.自动的D.被动的9.关于数据创新;下列说法正确的是(
)。
(3分)A.由于数据的再利用B.数据应该永久保存下去C.多个数据集的总和价值等于单个数据集价值相加D.相同数据多次用于相同或类似用途E.其有效性会降低F.数据只有开放价值才能得到真正释放10.就数据的量级而言,1PB数据是多少TB?(3分)A.512B.1024C.1000D.204811.谷歌在后Hadoop时代的新“三驾马车”不包括:(3分)A.CaffeineB.DremelC.HamaD.Pregel12.数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:(3分)A.运营式系统阶段B.用户原创内容阶段C.感知式系统阶段D.数据流阶段13.对HDFS通信协议的理解错误的是:(3分)A.HDFS通信协议都是构建在IoT协议基础之上的B.名称节点和数据节点之间则使用数据节点协议进行交互C.客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的D.客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互14.下列关于舍恩伯格对大数据特点的说法中,错误的是()(3分)A.数据规模大B.数据类型多样C.数据处理速度快D.数据价值密度高15.当前;(
)成为登录互联网的主要手段。(3分)A.电视B.固定电话C.手机D.电脑16.Hadoop的两大核心是和(3分)A.HDFS;MapReduceB.HDFS;HBaseC.MapReduce;HBaseD.GFS;MapReduce17.(
)将在大数据价值链中获益最大。(3分)A.拥有大数据的人B.拥有技术的人C.拥有大数据库的人D.拥有大数据思维的人18.不属于Spark独有的特点是()。(3分)A.支持SQL查询B.支持流式计算C.高可用D.文件格式丰富19.以下对各类数据库的理解错误的是:(3分)A.HBase数据库是列族数据库,可扩展性强,支持事务一致性B.文档数据库的数据是松散的,XML和JSON文档等都可以作为数据存储在文档数据库中C.键值数据库的键是一个字符串对象,值可以是任意类型的数据,比如整型和字符型等D.图数据库灵活性高,支持复杂的图算法,可用于构建复杂的关系图谱20.面向用户提供大数据一站式部署方案,包括数据中心和服务器等硬件、数据分析应用软件及技术运维支持等多方面内容的大数据商业模式是()(3分)A.大数据解决方案模式B.大数据信息分类模式C.大数据处理服务模式D.大数据资源提供模式二多选题(共5题,总分值20分)21.当前,大数据产业发展的特点是()。(4分)A.规模较大B.规模较小C.增速很快D.增速缓慢E.多产业交叉融合22.大数据的特点包括:(4分)A.数据量大B.数据种类繁多C.处理速度快D.价值密度低23.按照涉及自变量的多少,可以将回归分析分为()。(4分)A.线性回归分析B.非线性回归分析C.一元回归分析D.多元回归分析E.综合回归分析24.下列选项中;属于大数据商业价值的是(
)。(4分)A.模拟实境B.管理客户关系C.提高投入回报率D.对顾客群体细分25.对新一代资源管理调度框架YARN的理解正确的是:(4分)A.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架B.YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMasterC.YARN既是资源管理调度框架,也是一个计算框架D.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务三判断题(共10题,总分值20分)26.对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。(2分)(
)27.数据挖掘发现的是用户感兴趣的知识。(
)(2分)(
)28.Spark不仅拥有了HadoopMapReduce的优点,主要是将Job中间输出结果保存在内存中。(2分)(
)29.对于企业来说,给用户进行各种促销或者实施运营策略的时机也比较重要,而且对不同兴趣偏好的用户最好集中处理。(2分)(
)30.数据挖掘可以让分析员更好地理解数据。(
)(2分)(
)31.在进行关联分析时,在分析之前就已经知道了数据库中数据的关联函数。(
)(2分)(
)32.HDFS采用了主从(Master/Slave)架构模型,一个HDFS集群包括一个名称节点和若干个数据节点。(2分)(
)33.分布式文件系统在物理结构上是由计算机集群中的单个节点构成的。(2分)(
)34.协同过滤是最早、最知名的推荐算法,可分为基于用户的协同过滤和基于物品的协同过滤。(2分)(
)35.数据资产型企业产品线的盈利,主要通过提供收费服务来获取(2分)(
)
一单选题(共20题,总分值60分)1.答案:B解析过程:2.答案:B解析过程:3.答案:D解析过程:4.答案:D解析过程:5.答案:C解析过程:6.答案:D解析过程:7.答案:A解析过程:8.答案:C解析过程:9.答案:D解析过程:10.答案:B解析过程:11.答案:C解析过程:12.答案:D解析过程:13.答案:A解析过程:14.答案:D解析过程:15.答案:C解析过程:16.答案:A解析过程:17.答案:D解析过程:18.答案:A解析过程:19.答案:A解析过程:二多选题(共5题,总分值20分)2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年南京银行南通分行国际业务阶段性社会招聘备考题库及参考答案详解
- 2025年绍兴银行社会招聘12人备考题库及完整答案详解1套
- 2026年交通银行交银金融科技秋季校园招聘备考题库完整答案详解
- 杭州市卫健委所属十四家事业单位公开招聘220人备考题库及答案详解参考
- 中国人民银行清算总中心直属企业银清科技有限公司2026年度公开招聘备考题库有答案详解
- 2025年国家广播电视总局六九四台校园招聘备考题库及一套答案详解
- 五个带头方面问题清单(二)
- 高一历史(近代史基础)2025-2026年上学期期末试题及答案
- 2026年及未来5年市场数据中国单胺行业市场前景预测及投资方向研究报告
- 2025至2030生命器官支持系统与医学仿生学行业发展趋势分析与未来投资战略咨询研究报告
- 西藏酥油茶的课件
- 安装预制检查井施工方案
- DB11T 2491-2025 文物保护工程勘察规范 长城
- 急性心肌梗死治疗课件
- 树木砍伐安全培训课件
- 风电场冬季防火知识培训课件
- 中国邮政2025南通市秋招综合管理职能类岗位面试模拟题及答案
- 源网荷储一体化项目并网调试实施方案
- 《〈京津冀建设工程计价依据-预算消耗量定额〉城市地下综合管廊工程》第一册土建工程
- 儿科护理课件模板
- UPS不间断电源课件教学
评论
0/150
提交评论