版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年人工智能工程师高级理论知识题库及答
案(共100题)
1.SparkStreaming是什么软件栈中的流计算?()
A.Spark
B.Storm
C.Hive
D.Flume
答案:A
2.下列选项中,不是大数据发展趋势的是?()
A.大数据分析的革命性方法出现
B.大数据与与云计算将深度融合
C.大数据一体机将陆续发布
D.大数据未来可能会被淘汰
答案:D
3.2011年5月是哪家全球知名咨询公司在《Bigdata:Thenext
frontierforinnovation,competitionandproductivity》
研究报告中指出,数据已经渗透到每一个行业和业务职能之中,
逐渐成为重要的生产因素的?()
A.比尔•恩门
B.麦肯锡
C.扎克伯格
D.乔图斯
答案:B
4.以下哪个属于大数据在电信行业的数据商业化方面的应用?
()
A.精准广告
B.网络管理
C.网络优化
D.客服中心优化
答案:A
5.以下哪个不属于大数据在电信行业的应用?()
A.数据商业化
B.物流网络
C.企业运营
D.客户关系管理
答案:B
6.2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设
立()一职,负责全面推进“数据分享平台”战略,并推出大型的数
据分享平台。()
A.首席数据官
B.首席科学家
C.首席执行官
D.首席架构师
答案:A
7.下列选项中,不是kafka适合的应用场景是?()
A.日志收集
B.消息系统
10.在Spark的软件栈中,用于机器学习的是()
A.SparkStreaming
B.MlIib
C.GraphX
D.SparkSQL
答案:B
11.Spark是在哪一年开源的?()
A.1980
B.2010
C.1990
D.2000
答案:B
12.大数据的多样性使得数据被分为三种数据结构,那么以下不
是三种数据结构之一的是?()
A.结构化数据
B..非结构化数据
c..半结构化数据
D..全结构化数据
答案:D
13.自然语言处理难点目前有四大类,下列选项中不是其中之一
的是?()
A.机器性能
B.语言歧义性
C.知识依赖
D.语境
答案:A
14.语音识别常用的应用有四个,下列不是常用应用的是?()
A.聊天
B.拨号
C.导航
D.设备控制
答案:B
15.以下哪种学习方法不属于人工智能算法?()
A.迁移学习
B.对抗学习
C.强化学习
D.自由学习
答案:D
16.机器学习研究如何通过计算的手段,利用经验来改善系统自
身的性能,请问机器学习利用数据训练出什么?()
A.模型
B.表结构
C.结果
D.报表
答案:A
17.总体来说,人工智能发展的未来趋势是?()
A.上升
B.下降
C.不动
D.大幅度下降
答案:A
18.中国移动自主研发、发布的首个人工智能平台叫做()
A.九天
B.OneNET
C.移娃
D.大云
答案:A
19.以下数据单位从小到大排列的顺序是?()
A.GB、B、KB
B.B、KB、MB
C.KB、ZB、PB
D.B、MB、KB
答案:B
20.以下数据单位换算错误的是?()
A.1KB=1024B
B.1GB=1024MB
C.1TB=1000GB
D.1MB=1024KB
答案:C
21.以下不是非结构化数据的项是?()
A.图片
B.音频
C.数据库二维表数据
D.视频
答案:0
22.整个MapReduce的过程大致分为MapShuffIe>Combine>()?
A.Reduce
B.Hash
C.Clean
D.Loading
答案:A
23.人工智能是研究、开发用于模拟、延伸和扩展人的智能的理
论、方法、技术及应用系统的一门新的技术科学,请问它的英文
缩写是?()
A.AI
B.BI
C.AL
D.AF
答案:A
24.下列选项中,哪项是由谷歌开发的人工智能算法框架?()
A.Kafka
B.Tensorflow
C.Caffe
D.Torch
答案:B
25.BP神经网络的学习规则是?()
A.梯度上升法
B.梯度下降法
C.梯度提升法
D.梯度曲线法
答案:B
26.语音识别产品体系有四部分,下列哪项不是体系之一?()
A.语音合成
B.语音播放
C.语音识别
D.语义理解
答案:B
27.数据生态中,算法模型分为两代,那么第一代算法模型是?()
A.Tez
B.Spark
C.Pig
D.MapReduce
答案:D
28.Spark是基于什么的迭代计算框架?它适用于需要多次操作
特定数据集的应用场合。需要反复操作的次数越多,所需读取的
数据量越大,受益越大,数据量小但是计算密集度较大的场合,受
益就相对较小;()
A.内存
B.硬盘
C.磁带
D.显卡
答案:A
29.下列选项中,哪项是分布式文件存储系统?()
A.HDFS
B.FIume
C.Kafka
D.Zookeeper
答案:A
30.工信部官网正式发布大数据产业”十三五“发展规划是在哪
一年?()
A.1987
B.1997
C.2007
D.2017
答案:D
31.学习没有标签的数据集的机器学习方法是?()
A.监督学习
B.无监督学习
C.半监督学习
D.强化学习
答案:C
32.当前世界产生的数据总量的单位是?()
A.KB
B.ZB
C.GB
D.TB
答案:B
33.下列选项中正确说明价值密度低的是?()
A.100TB数据中有50TB有效数据
B.1TB数据中有1KB有效数据
C.100PB数据中有100PB有效数据
D.10EB数据中有10EB有效数据
答案:B
34.中国移动研发了智能客服问答机器人(),使业务流程自动化,
更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。
A.精灵
B.阿尔法蛋
C.小度
D.移娃
答案:D
35.IBM的()是第一个在国际象棋上战胜人类棋手的人工智能计
算机。()
A.AlphaGo
B.深蓝
C.图灵机模型
D.深度学习机器人
答案:B
36.在HDFS中存在NameNode>DataNode、Client,而NameNode
是管理者,DataNode是文件存储者,那么Client是什么呢?()
A.连接器
B.客户端
C.接口提供者
D.数据采集
答案:B
37.mapreduce计算模型适用于哪种任务?()
A.多线程处理
B.有关联的行处理
C.批处理
D.实时数据变化处理
答案:C
38.大数据特征有几种(不包括IBM提出的新特征)?()
A.1
B.2
C.3
D.4
答案:D
39.Hadoop是()年诞生的?
A.1985-1985
B.1995-1996
C.2005-2006
D.2015-2016
答案:C
40.以下哪个不属于大数据在电信行业的数据商业化方面的应
用?()
A.精准广告
B.网络管理
C.营销洞察
D.大数据检测和决策
答案:B
41.传统的机器学习方法包括监督学习、无监督学习和半监督学
习,其中监督学习是学习给定标签的数据集。请问标签为离散的
类型,称为分类,标签为连续的类型,称为什么?()
A.给定标签
B.离散
C.分类
D.回归
答案:D
42.下列选项中,正确描述Flume对数据源的支持的是?()
A.只能使用HDFS数据源
B.可以配置数据源
C.不能使用文件系统
D.不能使用目录方式
答案:B
43.IBM提出的大数据5V特征包括()、更快(Velocity)、更多
(Variety)、更值钱(Value)和更真实(Veracity)()
A.更有效
B.更大(VoIume)
C.更充分
D.更直观
答案:B
44.下列选项中,不是大数据的一部分的是?()
A.海量计算
B.大量数据管理
C.数据分析
D.单机计算
答案:D
45.Flume采用了三层架构,分别为agent,collector和()
A.Map
B.storage
C.Shuffle
D.Hash
答案:B
46.HBASE的特点不包括?()
A.面向列
B.稀疏性
C.多版本
D.低可靠性
答案:A
47.mapreduce计算模型适用于哪种任务?()
A.多线程处理
B.有关联的行处理
C.批处理
D.实时数据变化处理
答案:D
48.最初的大数据概念还比较模糊,只是隐约的知道像个性化推
荐、搜索引擎之类的处理需理需要大量数据,那么在搜索引擎方
面,谁是世界上最大的厂商?()
A.谷歌
B.百度
C.360
D.bing
答案:A
49.今年,大数据分析将出现革命性的新方法,从前的很多算法和
基础理论可能会产生理论级别的突破。而哪项技术将继续成为大
数据智能分析的核心技术?()
A.机器学习
B.智能物流
C.脑科学
D.智能终端
答案:A
50.下列选项中,正确描述Flume对数据源的支持的是?()
A.只能使用HDFS数据源
B.可以配置数据源
C.不能使用文件系统
D.不能使用目录方式
答案:B
51.HBASE的特点不包括哪些?()
A.面向行
B.稀疏性
C.多版本
D.高可靠性
答案:A
52.下列选项中,不是用于数据存储的技术是哪一个?()
A.MongoDB
B.MySQL
C.HDFS
D.Java
答案:D
53.属于“人造智能”,具有意识,达到或超越人类智慧水平的人
工智能称为(〕
A.高人工智能
B.低人工智能
C.强人工智能
D.弱人工智能
答案:C
54.下列选项中,不是人工智能的基础设施的是?()
A.CPU服务器
B.GPU服务器
C.专用芯片
D.游戏显卡
答案:C
55.以下不是大数据特征的是?()
A.数据体量大
B.数据种类多
C.价值密度高
D.处理速度快
答案:C
56.以下应用没有使用你的地理位置信息的是?()
A.美团
B.滴滴
C.高德地图
D.word
答案:D
57.下列选项中,不是Flume的特点的是?()
A.可靠性
B.集中式架构
C.可扩展性
D.可管理性
答案:B
58.在Spark的软件栈中,用于交互式查询的是()
A.SparkSQL
B.MlIib
C.GraphX
D.SparkStreaming
答案:A
59.下列选项中,不是大数据的一部分的是?()
A.海量计算
B.大量数据管理
C.数据分析
D.单机计算
答案:D
60.人工智能、机器学习、深度学习的包含关系是()
A.机器学习〉深度学习〉人工智能
B.人工智能〉深度学习〉机器学习
C.人工智能〉机器学习〉深度学习
D.深度学习〉人工智能〉机器学习
答案:C
61.自然语言处理难点目前有四大类,下列选项中不是其中之一
的是?()
A.机器性能
B.语言歧义性
C.知识依赖
D.语境
答案:A
62.BP神经网络模型拓扑结构不包括()
A.输入层
B.隐层
C.输出层
D.显层
答案:D
63.以下哪个不是语音识别的范畴?()
A.语音听写
B.语音合成
C.语音转写
D.语音唤醒
答案:B
64.AlphaGo是第一个击败人类职业0选手的人工智能程序。()
A.国际象棋
B.围棋
C.中国象棋
D.五子棋
答案:B
65.随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商
正在改变商业模式,向着什么靠拢?()
A.闭源
B.开源
C.独立
D.封闭
答案:B
66.“大数据”是需要新处理模式才能具有更强的决策力、洞察
发现力和流程优化能力来适应()、高增长率和多样化的信息资
产。
A.海量
B.少数
C.小量
D.结构化
答案:A
67.SparkStreaming是什么软件栈中的流计算?()
A.Spark
B.Storm
C.Hive
D.FIume
答案:A
68.客服中心是运营商和客户接触较为频繁的通道,我们可以利
用()在后端给客服中心建立庞大的知识库,供接线员们使用帮忙
他们快速精准的找到答案。()
A.大数据技术
B.客户画像
C.客户状态
D.客户心情
答案:A
69.下列选项中正确说明价值密度低的是?()
A.100TB数据中有50TB有效数据
B.1TB数据中有1KB有效数据
C.100PB数据中有100PB有效数据
D.10EB数据中有10EB有效数据
答案:B
70.学习没有标签的数据集的机器学习方法是?()
A.监督学习
B.无监督学习
C.半监督学习
D.强化学习
答案:C
71.当前世界产生的数据总量的单位是?()
A.KB
B.ZB
C.GB
D.TB
答案:B
72.对抗学习中两个网络互相竞争,一个负责生成样本,那么另一
个负责做什么?()
A.判别样本
B.计算样本
C.统计样本
D.生成样本
答案:A
73.hdfs中namenode的metadata的作用是?()
A.描述数据的存储位置等属性
B.存储数据
C.调度数据
答案:A
74.rdd是由多个什么组成?()
A.partition
B.computer
C.action
D.transformation
答案:B
75.IBM提出的大数据5V特征包括更大(Volume)、更快
(Velocity)>更多(Variety)、更值钱(VaIue)和()
A.更有效
B.更充分
C.更真实(Veracity)
D.更直观
答案:c
76.在Spark的软件栈中,用于流计算的是?()
A.GraphX
B.MlIib
C.SparkStreaming
D.SparkSQL
答案:C
77.以下数据量可以称为大数据的是?()
A.100MB
B.100KB
C.100PB
D.WOMB
答案:C
78.学习没有标签的数据集的机器学习方法是?()
A.监督学习
B.无监督学习
C.半监督学习
D.强化学习
答案:C
79.大数据的数据来源于方方面面,下列不可以作为数据源的是?
()
A.APP应用
B.地理信息
C.一块石头
D.商店订单
答案:C
80.数据采集的基本步骤(ETL)中不包括哪项?()
A.抽取转换
B.加载
C.计算
答案:C
81.整个MapReduce的过程大致分为Map^Shuffle^Combine>()?
A.Reduce
B.Hash
C.Clean
D.Loading
答案:A
82.人工智能通过输入的图片,解析出图片的内容,这种技术叫什
么?()
A.图片识别
B.语音识别
C.自动驾驶
D.消费金融
答案:A
83.“大数据”是需要新处理模式才能具有更强的决策力、洞察
发现力和流程优化能力来适应()、高增长率和多样化的信息资
产。
A.海量
B.少数
C.小量
D.结构化
答案:A
84.Hadoop2系列版本中默认的HDFS的block是多大?()
A.32MB
B.64MB
C.128MB
D.16MB
答案:C
85.以下哪个场景可以称为大数据场景?()
A.故宫游客人数
B.故宫门票收入
C.美团APP的定位信息
D.文章内容
答案:C
86.下列选项中,不是人工智能的算法中的学习方法的是?()
A.重复学习
B.深度学习
C.迂移学习
D.对抗学习
答案:A
87.以下哪个不属于大数据在电信行业的数据商业化方面的应
用?()
A.精准广告
B.网络管理
C.营销洞察
D.大数据检测和决策
答案:B
88.在Spark的软件栈中,用于图计算的是()
A.SparkStreaming
B.MlIib
C.GraphX
D.SparkSQL
答案:C
89.人类智能的特性表现在4个方面()。
A.聪明、灵活、学习、运用。
B.能感知客观世界的信息、能对通过思维对获得的知识进行加
工处理、能通过学习积累知识增长才干和适应环境变化、能对外
界的刺激作出反应传递信息。
C.感觉、适应、学习、创新。
D.能捕捉外界环境信息、能够利用利用外界的有利因素、能够
传递外界信息、能够综合外界信息进行创新思维。
答案:B
90.人工智能的目的是让机器能够(),以实现某些脑力劳动的机
械化。
A.具有智能
B.和人一样工作
C.完全代替人的大脑
D.模拟、延伸和扩展人的智能
答案:D
91.下列关于人工智能的叙述不正确的有()。
A.人工智能技术它与其他科学技术相结合极大地提高了应用技
术的智能化水平。
B.人工智能是科学技术发展的趋势。
C.因为人工智能的系统研究是从上世纪五十年代才开始的,非
常新,所以十分重要。
D.人工智能有力地促进了社会的发展。
答案:C
92.人工智能研究的一项基本内容是机器感知。以下列举中的()
不属于机器感知的领域。
A.使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。
B.让机器具有理解文字的能力。
C.使机器具有能够获取新知识、学习新技巧的能力。
D.使机器具有听懂人类语言的能力
答案:C
93.自然语言理解是人工智能的重要应用领域,下面列举中的()
不是它要实现的目标。
A.理解别人讲的话。
B.对自然语言表示的信息进行分析概括或编辑。
C.欣赏音乐。
D.机器翻译。
答案:C
94.为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、
悟性等,研究者找到一个重要的信息处理的机制是()。
A.专家系统
B.人工神经网络
C.模式识别
D.智能代理
答案:B
95.如果把知识按照作用来分类,下述()不在分类的范围内。
A.用控制策略表示的知识,即控制性知识。
B.可以通过文字、语言、图形、声音等形式编码记录和传播的
知识,即显性知识。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年科室院感度工作计划(2篇)
- 2026年保险改造能源托管合同
- 2026年金融合作产品设计协议
- 2026年安防建设猎头招聘协议
- 村委民事调解工作制度
- 村庄绿化养护工作制度
- 预防免疫规划工作制度
- 领导包保社区工作制度
- 风电运维工作制度汇编
- 高速卡口值守工作制度
- 2026年行政后勤岗位考试试题及答案
- 矿井防突培训工作制度
- 2021泛海三江CRT-9200消防控制室图形显示装置使用手册
- HGT 20584-2011 钢制化工容器制造技术要求
- MSDS中文版(锂电池电解液)
- 乳腺癌科普知识宣传
- 人教版五年级数学下册课后作业设计 4.8通分(解析版)
- 中国特色社会主义思想概论复习思维导图
- 工会经审实务课件
- 下班后兼职免责协议书
- 2023年解读机构编制工作条例全面落实改革任务
评论
0/150
提交评论