探索大数据和人工智能_第1页
探索大数据和人工智能_第2页
探索大数据和人工智能_第3页
探索大数据和人工智能_第4页
免费预览已结束,剩余26页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、探索大数据和人工智能1、2012 年 7 月,为挖掘大数据的价值 ,阿里巴巴集团在管理层设立 ()一职 ,负责全面推进“数据分享平台”战略 ,并推出大型的数据分享平台。A 首席数据官B.首席科学家C.首席执行官D. 首席架构师2、整个 MapReduce的过程大致分为Map 、 Shuffle 、 Combine 、()?A. Reduce B.Hash C. Clean D. Loading3、在 Spak 的软件栈中 ,用于交互式查询的是A. SparkSQL B.Mllib C.GraphXD. Spark Streaming4、在数据量一定的情况下, MapReduce是一个线性可扩展

2、模型 ,请问服务器数量与处 ( ) 理时间是什么关系 ?A 数量越多处理时间越长精选文库B.数量越多处理时间越短C.数量越小处理时间越短D. 没什么关系5、下列选项中 ,不是 kafka 适合的应用场景是 ?A.日志收集B.消息系统C.业务系统D. 流式处理6、大数据的多样性使得数据被分为三种数据结构 ,那么以下不是三种数据结构之一的是A.结构化数据B.非结构化数据C.半结构化数据D. 全结构化数据7、下列选项中 ,不是人工智能的算法中的学习方法的是?A.重复学习B.深度学习C.迁移学习D. 对抗学习-2精选文库8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是A.机器性能B.语言歧

3、义性C.知识依赖D. 语境9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类 ,标签为连续的类型 ,称为什么 ? A.给定标签B.离散C.分类D. 回归10 、中国移动自主研发、发布的首个人工智能平台叫做()A.九天B. OneNET C.移娃D. 大云11 、HDFS 中 Namenodef的 Metadata的作用是 ?A.描述数据的存储位置等属性B.存储数据-3精选文库C.调度数据D.12 、电信行业的客户关系管理中 ,客服中心优化可以实现严重问题及时预警 ,请问是用的什么技术实现的 ?A 大数据技术B.互联网技

4、术C.游戏技术D. 影像技术13 、随着闭源软件在数据分析领域的地盘不断缩小 ,老牌 IT 厂商正在改变商业模式 ,向着什么靠拢 ?A.闭源B.开源C.独立D. 封闭14 、以下不是非结构化数据的项是?A.图片B.音频C.数据库二维表数据D. 视频-4精选文库15 、以下数据单位换算错误的是?A.1KB=1024BB. 1GB=1024MBC.1TB=1000GB D. 1MB=1024KB16 、下列选项中 ,不是 Flume 的特点的是 ?A.可靠性B.集中式架构C.可扩展性D. 可管理性17 、BP 神经网络模型拓扑结构不包括A.输入层B.隐层C.翰出层D. 显层18 、以下哪个不是语音

5、识别的范畴?A.语音听写B.语音台成C.语音转写D. 语音唤醒-5精选文库19 、以下哪个场景可以称为大数据场景?A.故宫游客人B.故宫门票收入C.美团 APP 的定位信息D. 文章内容20 、2011 年 5 月是哪家全球知名咨询公司在Big data: The next frontierfor innovation, competition and productivity研究报告中指出 ,数据已经渗透到每一个行业和业务职能之中,逐渐成为重要的生产因素的?A.比尔恩门B.麦肯锡C.扎克伯格D. 乔图斯21 、下列选项中 ,哪项是分布式文件存储系统?A.HDFSB. FlumeC. Kafk

6、aD. Zookeeper22 、下列选项中 ,正确描述 Flume 对数据源的支持的是-6精选文库A.只能使用 HDFS 数据源B.可以配置数据源C.不能使用文件系统D. 不能使用目录方式23 、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机器学习利用数据训练出什么?A.模型B.表结构C.结果D. 报表24 、下列选项中 ,不是人工智能的算法中的学习方法的是A.重复学习B.深度学习C.迁移学习D. 对抗学习25 、语音识别产品体系有四部分,下列哪项不是体系之一 ?A.语音合成B.语音播放C.语音识别D. 语义理解-7精选文库26 、今年 ,大数据分析将出现革命性的新方法

7、 ,从前的很多算法和基础理论可能会产生理论級别的突破。而哪项技术将继续成为大数据智能分析的核心技术A 机器学习B.智能物流C.脑科学D. 智能终端27 、以下哪个不属于大数据在电信行业的数据商业化方面的应用A.精准广告B.网络管理C.营销洞察D. 大数据检测和决策28 、RDD 是由多个什么组成 ?A.partitionB. computerC. ActionD. Transformation29 、下列选项中,不是大数据的一部分的是?A.海量计算B.大量数据管理C.数据分析-8精选文库D. 单机计算30 、属于“人造智能” ,具有意识 ,达到或超越人类智慧水平的人工看能称为()A.高人工智能

8、B.低人工智能C.强人工智能D. 弱人工智能31 、 mapreduce计算模型适用于哪种任务?A.多线程处理B.有关联的行处理C.批处理D. 实时数据变化处理32 、当前世界产生的数据总量的单位是?A.KBB. ZB C.GB D.TB33 、IBM 提出的大数据 5V 特征包括更大 ( Volume) 、更快 ( Velocity) 、更多Variety) 、更值钱 (Value) 和()A.更有效-9精选文库B.更充分C.更真实 ( Veracity)D. 更直观34 、 Spark. 是基于什么的迭代计算框架 ?它适用于需要多次操作特定数据集的应用场合。需要反复操作的次数越多 ,所需读

9、取的数据量越大 ,受益越大 ,数据量小但是计算密集度较大的场合 ,受益就相对较小A.内存B.硬盘C.磁带D. 显卡35 、下列选项中 ,不是 kafka 适合的应用场景是 ?A.日志收集B.消息系统C.业务系統D. 流式处理36 、数据采集的基本步骤 (ETL)中不包括哪项 ?A.抽取转换B.加载C.计算D.-10精选文库37 、以下哪种学习方法不属于人工智能算法?A.迁移学习B.对抗学习C.强化学习D. 自由学习38 、语音识别常用的应用有四个,下列不是常用应用的是 ?A 聊天B.拨号C.导航D. 设备控制39 、下列选项中 ,哪项是由谷歌开发的人工能箅法框架?A. KafkaB. Tens

10、orflowC. CaffeD. Torch40 、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应 ()、高増长率和多样化的信息资产。A.海量B.少数-11精选文库C.小量D. 结构化41 、MPP 是指A.大规模并行处理系统B.受限的分布式计算模型C.集群计算资源管理框架D. 分布式计算编程框架42 、 Hadoop是()年诞生的 ?A.1985-1985B.1995-1996C.2005-2006D.2015-201643 、在 Spark 的软件栈中 ,用于流计算的是 ?A. GraphXB. MllibC. Spark StreamingD. Spark

11、SQL44 、以下数据量可以称为大数据的是-12精选文库A. 100MBB.100KB C. 100PB D.100MB45 、人工智能通过输入的图片,解析出图片的内容 ,这种技术叫什么 ?A.图片识别B.语音识别C.自动驾驶D. 消费金融46 、IBM 的()是第一个在国际象棋上战胜人类人工智能计算机。A. AlphagoB. 深蓝C.图灵机模型D. 深度学习机器人47 、下列选项中 ,不是人工智能的基础设施的是?A.CPU 服务器B.GPU 服务器C.专用芯片D. 游戏显卡-13精选文库48 、以下哪个不属于大数据在电信行业的应用?A 数据商业化B.物流网络C.企业运营管理D. 客户关系管

12、理49 、客服中心是运营商和客户接触较为频繁的通道 ,我们可以利用 ()在后端给客服中心建立庞大的知识库 ,供接线员们使用帮忙他们快速精准的找到答案。A.大数据技术B.客户画像C.客户状态D. 客户心情50 、IBM 提出的大数据 5V 特征包括 ()、更快 ( velocity) 、更多 ( Variety) 、更值钱 (Value) 和更真实 ( Veracity)A.更有效B.更大 (Volume)C.更充分D. 更直观51 、Fume 采用了三层架构 ,分别为 agent, collector和()A.Map-14精选文库B. storageC. ShuffleD.Hash52 、 H

13、adoop2系列版本中默认的HDFS 的 block 是多大 ?A32MBB.64MBC.128MBD. 16MB53 、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年A.1987B.1997C.2007D.201754 、BP 神经网络的学习规则是 ?A.梯度上升法B.梯度下降法C.梯度提升法D. 梯度曲线法-15精选文库55 、中国移动研发了智能客服问答机器人 (),使业务流程自动化 ,更加智能的回答用户解决业务咨询、业务办理、流量查询等问题。A.精灵B.阿尔法蛋C.小度D. 移娃56 、对抗学习中两个网络互相竟争,一个负责生成样本 ,那么另一个负责做什么 ?A.判别样本B.计算

14、样本C.统计样本D. 生成样本57 、以下应用没有使用你的地理位置信息的是?A.美团B.滴滴C.高德地图D.word58 、下列选项中 ,不是大数据发展趋势的是A.大数据分析的革命性方法出现B.大数据与云计算将深度融合C.大数据一体机将陆续发布-16精选文库D. 大数据未来可能会被淘汰59 、在 Spark 的软件栈中 ,用于图计算的是A. Spark StreamingB.MllibC. GraphXD. SparkSQL60 、 HBASE 的特点不包括哪些 ?A.面向行B.稀疏性C.多版本D. 高可靠性61 、总体来说 ,人工智能发展的未来趋势是?A.上升B.下降C.不动D. 大幅度下降

15、62 、以下数据单位从小到大排列的顺序是?A.GB、 B、 KBB.B、 KB、 MB-17精选文库C.KB、ZB、PBD. B、 MB 、KB63 、最初的大数据概念还比较模湖 ,只是隐约的知道像个性化推荐、搜索引擎之类的处理需要大量数据 ,那么在搜索引擎方面 ,谁是世界上最大的厂商 ?A.谷歌B.百度C.360D.bing64 、下列选项中 ,哪个不是 HBASE 的特点 ?A 面向行B.多版本C.扩展性D. 稀疏性65 、下列选项中 ,不是用于数据存储的技术是哪一个?A.MongoDBB.MySQLC.HDFSD.Java-18精选文库二、多选题1、在数据清洗的过程中 ,总共可以归为三个

16、阶段 ,它们分别是 ?A.数据加 工B.数据质量检查C.数据校对D. 数据标准化2、 HBASE 的特点不包括哪些 ?A.面向行B.稠密性C.多版本D. 高可靠性3、麦肯锡全球研究所对大数据的定义是种规模大到在获取、存储、管理、分析方面大大超出了传統数据库软件工具能力范围的数据集合,具有以下哪些特征 ?A.海量的数据规模B.快速的数据流转C.多样的数据类型D. 价值密度低4、以下哪两项是人工智能发展的标志性产品?A.深蓝-19精选文库alphagoC.智能门禁D. 智能手机5、在非电信领域 ,大数据可被应用到的以下哪些方面A.公共安全B.无明显应用C.智能运输D. 智能建筑6、大数据应用领域成

17、就有哪些?A.金融B.互联网电子商务C.工业生产D. 没有明显成就7、以下属于计算机视觉的研究方向的有?A.物体识别和检测B.语音导航C.视觉问答(看图说话 )D. 机器翻译8、传统的机器学习算法可以分为哪三类?-20精选文库A.监督学习B.无监督学习C.半监督学习D. 强化学习9、在人工智能发展历程中有过多次低谷期,这些低谷期最主要的两项原因是什么 ?A.运算力不足B.人员不足C.技术瓶颈D. 费用太高10 、 HBASE 的应用场景有哪些 ?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D. 超大数据量11 、使用有监督学习的问题可以被分为哪两类?A.回归问题B.抽样问题C.聚类

18、问题D. 分类问题-21精选文库12 、下列选项属于人工智能的基本概念有A.机器学习B.深度学习C.BP 神经网络D. 卷积神经网络13 、 HBASE 的应用场景有哪些 ?A.半结构化或非结构化数据B.记录非常稀疏C.结构化数据D. 超大数据量14 、下列选项中 ,是大数据发展趋势的是A.开源大数据商业化进一步深化B.打包的大数据行业分析应用开拓新市场C.大数据细分市场规模进一步增大D. 大数据推动公司并购的规模和数量进一步提升15 、人工智能关键技术框架主要包括哪两层?A.基础设施B.算法C.技术-22精选文库D. 人员16 、2010 年 12 月,工信部发布的物联网十二五规划上 ,把信

19、息处理技术作为 4 项关键技术创新工程之一被提出来 ,其中包括了哪些大数据的重要组成技术 ?A.海量数据存储B.数据挖掘C.图像视频智能分析D. python17 、世界经济论坛以“大数据的回报与风险”主题发布了全球信息技术报告(第 13 版 ),通过该报告 ,各国政府逐渐认识到大数据在哪些方面有重大意义?A.推动经济发展B.改善公共服务C.增进人民福祉D. 保障国家安全18 、下列选项中,哪两项是可以用于数据采集的技术?A. FlumeB. HiveC. Kafka D.Mahout-23精选文库19 、关于 RDD, 说法正确的两项是?A.RDD 不能由多个分区 ( partition)组

20、成B.弹性、集中式内存集C.RDD 能生成 ChildrenRDDD. 是一个容错的、并行的数据结构20 、以下用到语音识别技术的应用包括:A.苹果手机 siriB.微信C.百度地图D.word21 、人工智能目前在以下哪三个领域有了长足的发展?A.健康B.教育C.探索太空D. 理财22 、HDFS 适用于什么样的应用场景?A.存储和管理 PB 级别的数据B.处理非结构化数据C.注重数据处理的吞吐量D. 大量小文件-24精选文库23 、Flume 采用了三层架构 ,每一层均可以水平扩展 ,它们分别是 ?A. agentB. collector C.storageD. source24 、 KA

21、fak 的总体数据流有三个关键角色,它们分别是A. Producer B.Message C. Cluster D. Consumer25 、业务运营监控 ,可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营情况 ?A.网络B.业务C.气候D. 用户26 、自然语言处理的主要难点不包括以下哪两项A.语言独立性B.语言歧义性-25精选文库C.多国语言D. 语境27. 以下数据量不能说成大数据的是 ? A.100MBB.1000KBC.100PB D. 1EB28 、以下哪些属于大数据在电信行业的应用?A.网络管理和优化B.数据商业化C.客户关系管理D. 企业运营管理29 、通过地理位置

22、信息可以分析出哪些信息?A.颜值B.家庭住址C.工作地址D. 体重30 、人工智能技术的基础设施不包括哪两部分?A.系统应用-26精选文库B.机器学习算法C.基础硬件D. 算法框架31 、自然语言处理需要解决的难点有哪些?A.语言歧义性B.语言鲁棒性C.知识依赖D. 语境32 、HDFS 在哪些场景中表现很差 ?A.大量小文件B.随机读取C.修改文件D. 存储和管理 PB 级别数据33 、大数据的业务应用处理需要经过哪些流程?A.数据采集B.数据清洗C.数据建模D. 数据加工34 、HDFS 适用于哪些场景 ?-27精选文库A.大量小文件B.存储和管理 PB 级别数据C.一次写入 ,多次读取D. 低延迟读取35 、人工智能在哪些领域应用广泛?A.健康医疗B.智能投顾C.智能教育D. 智能法务36 、以下哪两个属于大数据特征?A.数据体量大B.价值密度高C.数据种类多D. 处理速度慢37 、数据建模目前有两种比较通用的方式,分别是 ?A.通用建模B.专属建模C.范式建模D. 维度建模-28精选文库38 、以下应用使用了你的地理位置信息的是?A. 滴滴B. 百度地图C. wordD. excel39 、BP 神经网络模型拓扑结构包括?A.输入层B.隐层

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论