




免费预览已结束,剩余6页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
探索大数据与人工智能练习题库单一选择1、什么是Spark Streaming软件堆栈的流计算?A. Spark B. Storm C. Hive D. Flume2、在以下选项中,不是大数据的发展趋势的是a .出现了大数据分析革命性方法的b .大数据和云计算深入融合c .大数据复合机陆续发布d .大数据,将来有被淘汰的可能性3、2011年5月哪家世界着名咨询公司在Big data: The next frontier for innovation, competition and productivity的研究报告中指出,数据已渗透到所有行业和业务功能中,逐渐成为重要的生产要素。a .比尔蒙蒙b .麦肯锡c .扎克伯格d .乔兹斯4、以下哪一项属于大数据在电信行业数据商业化中的应用?a .准确的广告b .网络管理c .网络优化d .呼叫中心优化5、以下哪一项不属于大数据在电信行业的应用?a .数据商业化b .物流网络c .企业运营d .客户关系管理6、2012年7月,为了发掘大数据的价值,阿里巴巴集团在管理层设立了()职位,全面推进“数据共享平台”战略,推出了大规模的数据共享平台。a .首席数据官b .首席科学家c .首席执行官d .首席设计师7、在以下选项中,kafka不是合适的应用场景a .日志收集b .消息系统c .业务系统d .流处理8、以下选项中,哪个不是HBASE的特征?a .行b .多版本c .扩展性面向d .稀疏性9、数据量一定时,MapReduce是线性可扩展的模型,服务器数量和处理时间有什么关系?a .数量越多处理时间越长b .数量越多处理时间越短b .数量越少处理时间越短d .没问题10、Spark的软件堆栈中用于机器学习的是a.sparkstreamingb.ml libc.graph xd.spark SQLSpark是哪一年开源的?A. 1980 B. 2010 C. 1990 D. 200012、大数据的多样性把数据分成了三种数据结构,以下不就是三种数据结构之一吗a结构化数据b .非结构化数据c .半结构化数据d .全结构化数据13、自然语言处理的难点现在有四种,难道不是以下选择之一吗?a .机械性能b .语言模糊性c .知识依赖于d .语境14、语音识别中经常使用的应用程序有4个,以下不是经常使用的应用程序吗?a .聊天b .拨号c .导航d .设备控制15、以下哪种学习方法不属于人工智能算法?a .过渡学习b .对抗学习c .强化学习d .自由学习16、机器学习研究是如何通过计算的手段,利用经验来改善系统自身的性能,机器学习是如何利用数据来训练的a .模型b .表格结构c .结果d .报告17、总体来说,人工智能发展的未来趋势是?a .上升b .下降c .不动d .大幅下降十八、中国移动自主研发发布的第一个人工智能平台是()a.9日B. OneNET C .移娃d .大云以下的数据单位是按从小到大的顺序排列的吗?A. GB,b,KB B. B,KB,MB C. KB,ZB,PB D.B,MB,KB20、以下数据单位的换算错误是什么?a.1kb=1024 bb.1gb=1024 MBC.1tb=1000 gbd.1mb=1024kb21、不是非结构化数据的项目是:a .图像b .声音c .数据库二维显示数据d .视频22、整个MapReduce的过程大致分为Map、Shuffle、Combine、()吗?A. Reduce B. Hash C. Clean D. Loading23、人工智能是一门研究、开发智能理论、方法、技术和应用系统的新技术科学,英语缩写是什么A. AI B. BI C. AL D. AF24、下列选项中,谷歌开发的人工智能算法框架是哪个?a.kafkab.tensorflowc.caffed.torch25、BP神经网络的学习规则是什么?a .坡度上升法b .坡度下降法c .坡度上升法d .坡度曲线法26、语音识别产品体系有四个部分,以下哪些不是体系之一a .语音合成b .语音播放c .语音识别d .语义理解27、在数据生态中,算法模型分为两代,第一代算法模型是什么?A. Tez B. Spark C. Pig D.MapReduce28、Spark基于什么样的迭代计算框架? 对于需要多次处理特定数据集的应用程序,此选项非常适合。 需要重复操作的次数越多,需要的数据量越大,优点越大,在数据量越小但计算密度越大的情况下,优点相对较小a .内存b .硬盘c .磁带d .显卡29 .以下选项之一是分布式文件存储系统a.HD FSB.flu mec.kafkad.zookeeper30、工信部官方网站正式发布大数据产业十三五“发展计划是几年?A. 1987 B. 1997 C.2007 D. 201731、学习没有标签的数据集的机器学习方法是什么?a .监督学习b .无监督学习c .半监督学习d .强化学习32、当今世界发生的数据总量单位是多少?A. KB B. ZB C. GB D. TB33、以下选项是否正确说明价值密度低?A.100TB的数据中50TB的有效数据B. 1TB的数据中有1KB的有效数据C.100PB数据中100PB有效数据D. 10EB数据中有10EB有效数据34、中国移动开发智能呼叫q&a机器人(),使业务流程自动化,更智能的回答用户解决了业务咨询、业务处理、流量查询等问题。a .精灵b .阿尔法鸡蛋c .小度d .移娃35、IBM的()是在国际象棋中战胜人类棋手的第一台人工智能计算机。A. AlphaGo B .绀青c .图灵模型d .深度学习机器人36、HDFS中有NameNode、DataNode、Client,NameNode是管理员,DataNode是文件的存储者,客户端是什么?a .连接器b .客户端c .接口提供程序d .数据收集37、mapreduce计算模型适用于哪个任务?a .多线程处理b .相关行处理c .批处理d .实时数据变化处理大数据有多少特点(不包括IBM提出的新特点)A.1 B.2 C.3 D.439、Hadoop是()年出生的吗?a.1985-1985 b.1995-1996 c.2005-2006 d.2015-201640、以下哪一项不属于大数据在电信行业数据商业化中的应用?a .准确的广告b .网络管理c .营销洞察d .大数据的检测和决策41 .传统的机器学习方法包括监督学习、无监督学习和半监督学习。 其中监督学习是学习规定标签的数据集。 标签是离散类型,称为分类,标签是连续类型,称为什么?a .给定的标签b .离散c .分类d .回归42 .以下选项是否正确说明Flume支持数据源?HDFS数据源b .数据源c .文件系统d .目录方法不可用43、IBM提出的大数据5V的特点是()、更快、更多、价值更高、更真实。a .更有效的b .更大的c .更充分的d .更直观44、以下选项中,不是大数据的一部分的a .批量计算b .批量数据管理c .数据分析d .批量计算45、Flume采用了三层体系结构:代理、收集器和()A. Map B.storage C.Shuffle D.Hash46、不包括HBASE的特点吗?a .列b .稀疏性c .多版本d .低可靠性47、mapreduce计算模型适用于哪个任务?a .多线程处理b .相关行处理c .批处理d .实时数据变化处理48、第一个大数据的概念还很模糊,只知道个性化推荐和搜索引擎这样的处理需要大量的数据,在搜索引擎方面世界上最大的制造商是谁?a.Googleb .百度C. 360 D. bing49、今年,大数据分析出现了革命性的新方法,许多传统算法和基础理论可能产生理论层面的突破。 哪些技术将继续成为大规模数据智能分析的核心技术?a .机器学习b .智能物流c .脑科学d .智能终端50、以下选项是否正确说明Flume支持数据源?HDFS数据源b .数据源c .文件系统d .目录方法不可用51、HBASE的特点不包括什么?a .行b .疏松性c .多版本d .高可靠性52、以下哪些选项未用于数据存储?A. MongoDB B. MySQL C. HDFS D. Java属于“人工智能”,有意识达到或超越人类智能水平的人工智能被称为“人工智能”。a .高人工智能b .低人工智能c .强人工智能d .弱人工智能54、以下选项中,人工智能的基础设施不是A. CPU服务器B. GPU服务器c .专用芯片d .游戏图形54、以下不是大数据的特征吗?a .数据卷大b .数据类型多c .价值密度高d .处理速度快下面的应用程序没有使用你的地理位置信息吗?美团b.DDT .黄金地图D. word56、以下选项中,Flume的特征不在于a .可靠性b .集中体系结构c .可扩展性d .可管理性57、在Spark的软件堆栈中,用于交互式查询的是a.sparksqlb.ml libc.graph xd.spark streaming58、下列选项中,不是大数据的一部分的a .批量计算b .批量数据管理c .数据分析d单独计算59 .人工智能、机器学习、深度学习的包含关系为()a .机器学习深度学习人工智能b .人工智能深度学习机器学习c .人工智能机器学习深度学习d .深度学习人工智能机器学习60、自然语言处理的难点现在有四种,难道不是以下选择之一吗?a .机械性能b .语言模糊性c .知识依赖于d .语境61、不包括BP神经网络模型的拓扑结构a .输入层b .隐藏层c .输出层d .显示层62、以下哪个不是语音识别的范畴a .声音听写b .声音合成c .声音转录d .声音觉醒阿尔法go是打败人类职业()选手的第一项人工智能计划。a .国际象棋b .围棋c .中国象棋d .五子象棋64、随着封闭源软件在数据分析领域的地盘逐渐缩小,老IT制造商改变了业务模式,如何接近?a .闭源b .开源c .独立d .封闭65、“大数据”是一项需要新的流程模型来具有更强的决策能力、洞察力和流程优化能力、()、高增长率和多种信息资产。a .卷b .少数c .少量d .结构化66、什么是Spark Streaming软件堆栈的流计算?A. Spark B. Storm C. Hive D. Flume67、呼叫中心是运营商和顾客频繁接触的通道,在后端在呼叫中心建立了庞大的知识库,操作员们可以帮助他们快速准确地找到答案。a .大数据技术b .客户图像c .客户状态d .客户心情67、以下选项中是否正确说明价值密度低?A.100TB的数据中50TB的有效数据B. 1TB的数据中有1KB的有效数据C.100PB数据中100PB有效数据D. 10EB数据中有10EB有效数据学习没有标签的数据集的机器学习方法是?a .监督学习b .无监督学习c .半监督学习d .强化学习69、当今世界发生的数据总量单位是多少?A. KB B. ZB C. GB D. TB70 .对抗学习中两个网络竞争,一个负责样本的生成,另一个负责什么?a .判别样本b .计算样本c .统计样本d .生成样本71、namenode元数据在hdfs中的作用是什么?a .描述数据的存储位置等属性b .存储数据c .时间表数据72、rdd由什么组成?a.partition puter c.actiond.transformation73、IBM所提交的大数据5V的特征是更大(Volume )、更快(Velocity )、更大(Va
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年供应链行业智能供应链管理案例解析报告
- 2025年绿色食品市场需求与供应链管理研究报告
- 2025年汽车零部件行业智能网联汽车发展研究报告
- 2025年临床心理学病人心理评估模拟测试答案及解析
- 屏山县事业单位2025年下半年面向教育部直属师范大学2026届公费师范生和“国家优师计划”2026届毕业生公开考核招聘教师笔试备考题库及答案解析
- 2025河南周口鹿邑检察机关招聘54人笔试参考题库附答案解析
- 2025北京大学肿瘤医院云南医院云南省肿瘤医院昆明医科大学第三附属医院非事业编制工勤人员招聘9人笔试备考题库及答案解析
- 2025广东深圳市龙岗区第三人民医院第四批招聘聘员及劳务派遣人员15人笔试模拟试题及答案解析
- 2025年骨科创伤急救措施考核模拟考试试卷答案及解析
- 2025年安徽理工学校招聘医护人员2人笔试参考题库附答案解析
- 二十四节气农事活动
- 食物中毒的心理援助与危机干预
- 2022星闪无线短距通信技术(SparkLink 1.0)安全白皮书网络安全
- 卫生公共基础知识考试大纲
- 小学数学六年级上册第五单元课件
- 《电子凭证会计数据标准-全面数字化的电子发票(试行版)》指南
- 湖南土建中级职称考试复习总结
- 混合痔痔的护理查房
- 大学物理实验长测量
- 材料科学基础复习题及答案
- 药监系统官方培训06细菌内毒素方法介绍-蔡彤
评论
0/150
提交评论