2023年探索大数据与人工智能习题库_第1页
2023年探索大数据与人工智能习题库_第2页
2023年探索大数据与人工智能习题库_第3页
2023年探索大数据与人工智能习题库_第4页
2023年探索大数据与人工智能习题库_第5页
已阅读5页,还剩17页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《探索大数据与人工智能》习题库

单项选择

1、SparkStreaming是什么软件栈中日勺流计算?

A.SparkB.StormC.HiveD.Flume

2、下列选项中,不是大数据发展趋势的是?

A.大数据分析的革命性措施出现B.大数据与与云计算将深度融合

C.大数据一体机将陆续公布D.大数据未来也许会被淘汰

3、2023年5月是哪家全球著名征询企业在《Bigdata:Thenextfrontierforinnovation,

competitionandproductivity》研究汇报中指出,数据已经渗透到每一种行业和业务职能

之中,逐渐成为重要的生产原因的?

A.比尔•恩门B.麦肯锡C・扎克伯格D.乔图斯

4、如下哪个属于大数据在电信行业的数据商业化方面的应用?

A.精确广告B.网络管理C.网络优化D.客服中心优化

5、如下哪个不属于大数据在电信行业的应用?

A.数据商业化B.物流网络C企业运行D.客户关系管理

6、2023年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设置()一职,负责全面推进

“数据分享平台”战略,并推出大型的数据分享平台。

A.首席数据官B.首席科学家C.首席执行官D.首席架构师

7、下列选项中,不是kafka适合的应用场景是?

A.日志搜集B.消息系统C.业务系统D.流式处理

8、下列选项中,哪个不是HBASE的特点?

A.面向行B.多版本C.扩展性D.稀疏性

9、在数据量一定的状况下,MapReduce是一种线性可扩展模型,请问服务器数量与处理时间

是什么关系?

A,数量越多处理时间越长B,数量越多处理时间越短

B.数量越小处理时间越短D.没什么关系

10、在SparkH勺软件栈中,用于机器学习的是

A.SparkStreamingB.MlIibC.GraphX

11、Spark是在哪一年开源的]?

A.1980B.2023C.1990D.2023

12、大数据的多样性使得数据被分为三种数据构造,那么如下不是三种数据构造之一的是?

A构造化数据B.非构造化数据C.半构造化数据D.全构造化数据

13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?

A.机器性能B.语言歧义性C.知识依赖D.语境

14、语音识别常用的应用有四个,下列不是常用应用的是?

A.聊天B.拨号C.导航D.设备控制

15、如下哪种学习措施不属于人工智能算法?

A.迁移学习B.对抗学习C.强化学习D.自由学习

16、机器学习斫究怎样通过计算的手段,运用经验来改善系统自身的性能,请问机器学习运

用数据训练出什么?

A.模型B.表构造C.成果D.报表

17、总体来说,人工智能发展的未来趋势是?

A.上升B.下降C.不动D.大幅度下降

18、中国移动自主研发、公布的首个人工智能平台叫做()

A.九天B.OneNETC.移娃D.大云

19、如下数据单位从小到大排列的次序是?

A.GB、B、KBB.B、KB、MBC.KB、ZB、PB、MB、KB

20、如下数据单位换算错误的是?

A.1KB=1024BB.1GB=1024MBC.1TB=1000GBD.1MB=1024KB

21、如下不是非构造化数据的项是?

A.图片B.音频C.数据库二维表数据D.视频

22、整个MapReduce日勺过程大体分为Map、Shuffle、Combine、()?

A.ReduceB.HashC.CleanD.Loading

23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、措施、技术及应用系统

的一门新的技术科学.询问它的英文缩写是?

A.AlB.BlC.ALD.AF

24、下列选项中,哪项是由google开发的人工智能算法框架?

A.KafkaB.TensorflowC.Caffe

25、BP神经网络的学习规则是?

A.梯度上升法B.梯度下降法C.梯度提高法D.梯度曲线法

26、语音识别产品体系有四部分,下列哪项不是休系之一?

A.语音合成B.语音播放C.语音识别D.语义理解

27、数据生态中,算法模型分为两代,那么第一代算法模型是?

A.TezB.SparkC.Pig

28、Spark是基于什么的迭代计算框架?它合用于需要多次操作特定数据集的应用场所。需

要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小不过计算密集度较大的

场所.受益就相对较小;

A.内存B.硬盘C.磁带D.显卡

29、下列选项中,哪项是分布式文献存储系统?

A.HDFSB.FlumeC.KafkaD.Zookeeper

30、工信部官网正式公布大数据产业”十三五“发展规划是在哪一年?

A.1987B.1997D.2023

31、学习没有标签的数据集的机器学习措施是?

A.监督学习B.无监督学习C.半监督学习D.强化学习

32、目前世界产生的数据总量的单位是?

A.KBB.ZBC.GBD.TB

33、下列选项中对的阐明价值密度低的是?

数据中有50TB有效数据B.1TB数据中有1KB有效数据

数据中有100PB有效数据D.10EB数据中有10EB有效数据

34、中国移动研发了智能客服问答机器人(),使业务流程自动化愈加智能的回答顾客处理

业务征询、业务办理、流量查询等问题。

A.精灵B.阿尔法蛋C.小度D.移娃

35、IBM的()是第一种在国际象棋上战胜人类棋手的人工智能计算机。

A.AlphaGoB.深蓝C.图灵机模型D.深度学习机器人

36、在HDFS中存在NameNode、DataNode、Client,而NameNode是管理者,DataNode是文献

存储者,那么Client是什么呢?

A.连接器B.客户端C.接口提供者D.数据采集

37、mapreduce计算模型合用于哪种任务?

A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理

38、大数据特性有几种(不包括IBM提出的新特性)?

39、Hadoop是()年诞生的I?

40、如下哪个不属于大数据在电信行业的数据商业化方面的应用?

A.精确广告B.网络管理C.营销洞察D.大数据检测和决策

41、老式的机器学习措施包括监督学习、无监督学习和半监督学习,其中监督学习是学习给

定标签的数据集。请问标签为离散的类型,称为分类,标签为持续的类型,称为何?

A.给定标签B.离散C.分类D.回归

42、下列选项中,对的描述Flume对数据源的支持的是?

A,只能使用HDFS数据源B.可以配置数据源C.不能使用文献系统D.不能使用目录方式

43、IBM提出的大数据5V特色包括()、更快(Velocity)、更多(Variety)、更值钱(Value)

和更真实(Veracity)

A.更有效B.更大(Volume)C.更充足D.更直观

44、下列选项中,不是大数据的一部分的是?

A.海量计算B.大量数据管理C.数据分析D.单机计算

45、Flume采用了三层架构,分别为agent,collector和()

A.Map

46、HBASE的特点不包括?

A.面向列B.稀疏性C.多版本D.低可靠性

47、mapreduce计算模型合用于哪种任务?

A.多线程处理B.有关联的行处理C.批处理D.实时数据变化处理

48、最初的大数据概念还比较模糊,只是隐约的懂得像个性化推荐、搜索引擎之类日勺处理需

理需要大量数据,那么在搜索引擎方面,谁是世界上最大的厂商。

A.googIeB.百度C.3600.bing

49、今年,大数据分析将出现革命性的新措施,从前的诸多算法和基础理论也许会产生理论

级别的突破。而哪项技术将继续成为大数据智能分析日勺关键技术?

A.机器学习B.智能物流C.脑科学D.智能终端

50、下列选项中,对的描述Flume对数据源的支持的是?

A,只能使用HDFS数据源B.可以配置数据源C.不能使用文献系统D.不能使用目录方

51、HBASE的特点不包括哪些?

A.面向行B.稀疏性C.多版本D.高可靠性

52、下列选项中,不是用于数据存储的技术是哪一种?

A.MongoDBB.MySQLC.HDFSD.Java

53、属于“人造智能”,具故意识,到达或超越人类智慧水平的人工智能称为0

A.高人工智能B.低人工智能C.强人工智能D.弱人工智能

54、下列选项中,不是人工智能的基础设施的是?

A.CPU服务器B.GPU服务器C.专用芯片D.游戏显卡

54、如下不是大数据特性的是?

A.数据体量大B,数据种类多C.价值密度高D.处理速度快

55、如下应用没有使用你的地理位置信息的是?

A.美团B.滴滴C.高德地图D.word

56、下列选项中,不是Flume的特点的是?

A.可靠性B.集中式架构C.可扩展性D,可管理性

57、在SparkH勺软件栈中,用于交互式查询的是

A.SparkSQLB.MlIibC.GraphXD.SparkStreaming

58、下列选项中,不是大数据的一部分的是?

A.海量计算B.大量数据管理C.数据分析D单机计算

59、人工智能、机器学习、深度学习的包括关系是0

A.机器学习〉深度学习〉人工智能B.人工智能〉深度学习》机器学习

C.人工智能〉机器学习〉深度学习D.深度学习〉人工智能》机器学习

60、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?

A.机器性能B.语言歧义性C.知识依赖D.语境

61、BP神经网络模型拓扑构造不包括

A.输入层B.隐层C.输出层D,显层

62、如下哪个不是语音识别的范围?

A.语音听写B.语音合成C.语音转写D.语音唤醒

63、AlphaGo是第一种击败人类职业()选手的人工智能程序。

A.国际象棋B.围棋C.中国象棋D.五子棋

64、伴随闭源软件在数据分析领域的地盘不停缩小,老牌IT厂商正在变化商业模式,向着什

么靠拢?

A.闭源B.开源C.独立D.封闭

65、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适

应Q、高增长率和多样化的信息资产。

A.海量B.少数C.小量D.构造化

66、SparkStreaming是什么软件核中的|流计算?

A.SparkB.StormC.HiveD.FIume

67、客服中心是运行商和客户接触较为频繁的通道,我们可以运用()在后端给客服中心建立

庞大的知识库,供接线员们使用帮忙他们迅速精确的找到答案。

A.大数据技术B.客户画像C.客户状态D.客户心情

67、下列选项中对的阐明价值密度低日勺是?

数据中有50TB有效数据B.1TB数据中有1KB有效数据

数据中有100PB有效数据D.10EB数据中有10EB有效数据

68、学习没有标签的数据集的机器学习措施是?

A.监督学习B.无监督学习C.半监督学习D.强化学习

69、目前世界产生的数据总量的单位是?

A.KBB.ZBC.GBD.TB

70、对抗学习中两个网络互相竞争,一种负责生成样本,那么另一种负责做什么?

A.鉴别样本B,计算样本C记录样本D.生成样本

71、hdfs中namenode的metadata日勺作用是?

A.描述数据的存储位置等属性B.存储数据C.调度数据

72、rdd是由多种什么构成?

a.partition

73、IBM提出日勺大数据5V特性包括更大(Volume)、更快(Velocity)、更多(Variety)、更值

钱(Value)和()

A.更有效B,更充足C.更真实(Veracity)D.更直观

74、在Spark的软件栈中,用干流计算的是?

A.GraphXB.MIIibC.SparkStreamingD.SparkSQL

75、如下数据量可以称为大数据的是?

A.100MBB.100KBC.100PBD.WOMB

76、学习没有标签的数据集的机器学习措施是?

A.监督学习B.九监督学习C.半监督学习D.强化学习

77、大数据的数据来源于方方面面,下列不可以作为数据源的是?

A.APP应用B.地理信息C.一块石头D.商店订单

78、数据采集的基木环节(ETL)中不包括哪项?

A.抽取转换B,加载C.计算

79、整个MapReduce的过程大体分为Map、Shuffle、Combine、()?

A.ReduceB.HashC.CleanD.Loading

80、人工智能通过输入的图片解析出图片的内容,这种技术叫叶么?

A.图片识别B.语音识别C.自动驾驶D.消费金融

81、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适

应0、高增长率和多样化的信息资产。

A.海量B.少数C.小量D.构造化

82、Hadoop2系列版本中默认日勺HDFS日勺block是多大?

A.32MBB.64MBC.128MBD.16MB

83、如下哪个场景可以称为大数据场景?

A.故宫游客人数B.故喜门票收入C.美团APP的定位信息D.文章内容

84、下列选项中,不是人工智能的算法中的学习措施的是?

A.反复学习B.深度学习C.迁移学习D.对抗学习

85、如下哪个不属于大数据在电信行业的数据商业化方面的应用?

A.精确广告B.网络管理C.营销洞察D.大数据检测和决策

86、在Spark的软件栈中,用于图计算的是。

A.SparkStreamingC.GraphX

多选

1、自然语言处埋需要处埋的难点后哪些?

A.语言歧义性8.语言鲁棒性C.知识依赖D.语境

2、人工智能目前在如下哪三个领域有了长足日勺发展?

A.健康B.教育C.探索太空D.理财

3、下列选项属于人工智能的基本概念有:

A.机器学习B.深度学习C.BP神经网络D.卷积神经网络

4、大数据的业务应用处理需要通过哪些流程?

A.数据采集B.数据清洗C.数据建模D.数据加工

5、在数据清洗的过程中,总共可以归为三个阶段,它们分别是?

A.数据加工B.数据质量C.数据校对D.数据原则化

6、麦肯锡全球研究所对大数据的J定义是一种规模大到在获取、存储、管理、分析方面大大

超过了老式数据库软件工具能力范围的数据集合,具有如下哪些特性?

A.海量的数据规模B.迅速的数据流转C.多样的数据类型D.价值密度低

7、人工智能关键技术框架重要包括哪两层?

A.基础设施B.算法C.技术D.人员

8、大数据应用领域成就有哪些?

A.金融B.互联网电子商务C.工业生产D.没有明显成就

9、如下哪些属于大数据在电信行业的应用?

A.网络管理和优化B.数据商业化C.客户关系管理D.企业运行管理

10、如卜哪两个属于大数据特性?

A.数据体量大B.价值密度高C.数据种类多D.处理速度慢

11、在非电信领域,大数据可被应用到的如下哪些方面?

A.公共安全B.尢明显应用0.智能运送D.智能建筑

12、HBASE的特点不包括哪两项?

A.面向行B,稠密性C.多版本D.高可靠性

13、那么下列哪些技术适合流处理?

A.SparkStreamingB.StormC.HbaseD.MapReduce

14、如下哪两项是人工智能发展的标志性产品?

A.深蓝B.alphagoC.智能,1禁D.智能

15、使用有监督学习日勺问题可以被分为哪两类?

A.回归问题B.抽样问题C.聚类问题D.分类问题

16、HDFS在哪些场景中体现很差?

A.大量小文献B.随机读取C.修改文献D.存储和管理PB级别数据

17、世界经济论坛以“大数据的回报与风险”主题公布了《全球信息技术汇报(第13版)》,

通过该汇报,各国政府逐渐认识到大数据在哪些方面有重大意义?

A.推进经济发展B.改善公共服务C.增进人民福祉D.保障国家安全

18、电信行业的网络管理和优化包括了两部分的优化,下列选项中不在这两项优化之内的

是?

A.基础设施建设的优化B,网络速度的优化C.并发性的优化D.网络运行管理及优化

19、通过地理位置信息可以分析出哪些信息?

A.颜值B.家庭住址C.工作地址D.体重

20、人工智能按照发展层级划分可以分为哪三层?

A.计算智能B.感知智能C.认知智能D.人工智能

21、使用有监督学习日勺问题可以被分为哪两类?

A.回归问题B.抽样问题C.聚类问题D.分类问题

22、Flume采用了三层架构,每一层均可以水平扩展,它们分别是?

A.agentB.collectorC.storageD.source

23、人工智能的技术方向一共有三种,他们分别是?

A.语音识别B.计算机视觉C.自然语言D.复杂编程

24、Spark合用于那些场景?

A.计算量大B.数据量大C,效率规定高系统业务受理

25、有关RDD,说法对的的两项是?

A.RDD不能由多种分区(partition)构成B.弹性、集中式内存集

C"。。能生成而〃”6瓶。口C.是一种容错的、并行的数据构造

26、业务运行监控,可以基于大数据分析从下列哪三个维度为运行商监控管道和客户运行状

况?

A.网络B.业务C.气候D.顾客

27、Yarn架构在Hadoop生态圈中有哪些作用?

A.资源分派B.调度C.保证协同D.计算数据

28、如下数据量不能说成大数据的是?

29、自动驾驶中的人工智能技术包括下面哪三项?

A.环境感知B.行为决策C.运动控制D.温度控制

30、如下用到语音识别技术的应用包括:

A.苹果SiriB..百度地图

31、监督学习的回归措施包括:

A.线性回归B.逻辑回归C.多项式回归D.单一回归

32、人工智能技术的基础设施不包括哪两部分?

A.系统应用B.机器学习算法C.基础硬件D.算法框架

33、HDFS合用于哪些场景?

A.大量小文献B.存储和管理PB级别数据C.一次写入,多次读取D.低延迟读取

34、自然语言处理的重要难点不包括如下哪两项:

A.语言独立性B.语言歧义性C.多国语言D.语境

35、如下哪两个属于大数据特性?

A.数据体量大B,价值密度高C,数据种类多D,处理速度慢

36、如下应用使用了你的地理位置信息的是?

A.滴滴B,百度地图C.wo,dD.excel

37、BP神经网络模型拓扑构造包括()、()和输出层(outputlayer)。

A.输入层(input)B.隐层(hiddenlayer)C.卷积层(0020»由0成1匕丫6「)D.池化层

(poolinglayer)

38、自动驾驶中的人工智能技术包括下面哪三项?

A.环境感知B.行为决策0.运动控制D.温度控制

39、数据建模目前有两种比较通用的方式,分别是?

A.通用建模B.专属建模C.范式建模D.维度建模

40、下列选项中,是大数据发展趋势的是?

A.开源大数据商业化深入深化B.打包日勺大数据行业分析应用开拓新市场

B.大数据细分市场规模深入增大D.大数据推进企业并购的规模和数量深入提高

432023年12月,工信部公布的物联网十二五规划上,把信息处理技术作为4项关键技术创

新工程之一被提出来,其中包括了哪些大数据的重要构成技术?

A.海量数据存储B.数据挖掘C.图像视频智能分析D.pytnon

42、在人工智能发展历程中有过多次低谷期,这些低谷期最重要的两项原因是什么?

A.运算力局限性B.人员局限性C.技术瓶颈D.费用太高

43、电信行业的网络管理和优化包括了两部分的优化,这两项优化是?

A.基础设施建设的优化B.网络速度日勺优化C.并发性的优化D.网络运行管理及优化

44、人工智能技术的基础设施不包括哪两部分?

A.系统应用B.机器学习算法C.基础硬件D.算法框架

45、计算机视觉包括了诸多不一样的研究方向,比较热门的方向重要包括如下哪两项?

A.物体识别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论