




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
探索大数据与人工智能 习题库 单选 1 Spark Streaming 是什么软件栈中的流计算 A Spark B Storm C Hive D Flume 2 下列选项中 不是大数据发展趋势的是 A 大数据分析的革命性方法出现 B 大数据与与云计算将深度融合 C 大数据一体机将陆续发布 D 大数据未来可能会被淘汰 3 2011 年 5 月是哪家全球知名咨询公司在 Big data The next frontier for innovation competition and productivity 研究报告中指出 数据已经渗透到每一个行业和业务职能之中 逐 渐成为重要的生产因素的 A 比尔 恩门 B 麦肯锡 C 扎克伯格 D 乔图斯 4 以下哪个属于大数据在电信行业的数据商业化方面的应用 A 精准广告 B 网络管理 C 网络优化 D 客服中心优化 5 以下哪个不属于大数据在电信行业的应用 A 数据商业化 B 物流网络 C 企业运营 D 客户关系管理 6 2012 年 7 月 为挖掘大数据的价值 阿里巴巴集团在管理层设立 一职 负责全面推进 数 据分享平台 战略 并推出大型的数据分享平台 A 首席数据官 B 首席科学家 C 首席执行官 D 首席架构师 7 下列选项中 不是 kafka 适合的应用场景是 A 日志收集 B 消息系统 C 业务系统 D 流式处理 8 下列选项中 哪个不是 HBASE 的特点 A 面向行 B 多版本 C 扩展性 D 稀疏性 9 在数据量一定的情况下 MapReduce 是一个线性可扩展模型 请问服务器数量与处理时间 是什么关系 A 数量越多处理时间越长 B 数量越多处理时间越短 B 数量越小处理时间越短 D 没什么关系 10 在 Spark 的软件栈中 用于机器学习的是 A Spark Streaming B Mllib C GraphX D SparkSQL 11 Spark 是在哪一年开源的 A 1980 B 2010 C 1990 D 2000 12 大数据的多样性使得数据被分为三种数据结构 那么以下不是三种数据结构之一的是 2 A 结构化数据 B 非结构化数据 C 半结构化数据 D 全结构化数据 13 自然语言处理难点目前有四大类 下列选项中不是其中之一的是 A 机器性能 B 语言歧义性 C 知识依赖 D 语境 14 语音识别常用的应用有四个 下列不是常用应用的是 A 聊天 B 拨号 C 导航 D 设备控制 15 以下哪种学习方法不属于人工智能算法 A 迁移学习 B 对抗学习 C 强化学习 D 自由学习 16 机器学习研究如何通过计算的手段 利用经验来改善系统自身的性能 请问机器学习利用 数据训练出什么 A 模型 B 表结构 C 结果 D 报表 17 总体来说 人工智能发展的未来趋势是 A 上升 B 下降 C 不动 D 大幅度下降 18 中国移动自主研发 发布的首个人工智能平台叫做 A 九天 B OneNET C 移娃 D 大云 19 以下数据单位从小到大排列的顺序是 A GB B KB B B KB MB C KB ZB PB D B MB KB 20 以下数据单位换算错误的是 A 1KB 1024B B 1GB 1024MB C 1TB 1000GB D 1MB 1024KB 21 以下不是非结构化数据的项是 A 图片 B 音频 C 数据库二维表数据 D 视频 22 整个 MapReduce 的过程大致分为 Map Shuffle Combine A Reduce B Hash C Clean D Loading 23 人工智能是研究 开发用于模拟 延伸和扩展人的智能的理论 方法 技术及应用系 统的一门新的技术科学 请问它的英文缩写是 A AI B BI C AL D AF 24 下列选项中 哪项是由谷歌开发的人工智能算法框架 A Kafka B Tensorflow C Caffe D Torch 25 BP 神经网络的学习规则是 A 梯度上升法 B 梯度下降法 C 梯度提升法 D 梯度曲线法 26 语音识别产品体系有四部分 下列哪项不是体系之一 3 A 语音合成 B 语音播放 C 语音识别 D 语义理解 27 数据生态中 算法模型分为两代 那么第一代算法模型是 A Tez B Spark C Pig D MapReduce 28 Spark 是基于什么的迭代计算框架 它适用于需要多次操作特定数据集的应用场合 需 要反复操作的次数越多 所需读取的数据量越大 受益越大 数据量小但是计算密集度较大的 场合 受益就相对较小 A 内存 B 硬盘 C 磁带 D 显卡 29 下列选项中 哪项是分布式文件存储系统 A HDFS B Flume C Kafka D Zookeeper 30 工信部官网正式发布大数据产业 十三五 发展规划是在哪一年 A 1987 B 1997 C 2007 D 2017 31 学习没有标签的数据集的机器学习方法是 A 监督学习 B 无监督学习 C 半监督学习 D 强化学习 32 当前世界产生的数据总量的单位是 A KB B ZB C GB D TB 33 下列选项中正确说明价值密度低的是 A 100TB 数据中有 50TB 有效数据 B 1TB 数据中有 1KB 有效数据 C 100PB 数据中有 100PB 有效数据 D 10EB 数据中有 10EB 有效数据 34 中国移动研发了智能客服问答机器人 使业务流程自动化 更加智能的回答用户解决业 务咨询 业务办理 流量查询等问题 A 精灵 B 阿尔法蛋 C 小度 D 移娃 35 IBM 的 是第一个在国际象棋上战胜人类棋手的人工智能计算机 A AlphaGo B 深蓝 C 图灵机模型 D 深度学习机器人 36 在 HDFS 中存在 NameNode DataNode Client 而 NameNode 是管理者 DataNode 是文 件存储者 那么 Client 是什么呢 A 连接器 B 客户端 C 接口提供者 D 数据采集 37 mapreduce 计算模型适用于哪种任务 A 多线程处理 B 有关联的行处理 C 批处理 D 实时数据变化处理 38 大数据特征有几种 不包括 IBM 提出的新特征 A 1 B 2 C 3 D 4 39 Hadoop 是 年诞生的 4 A 1985 1985 B 1995 1996 C 2005 2006 D 2015 2016 40 以下哪个不属于大数据在电信行业的数据商业化方面的应用 A 精准广告 B 网络管理 C 营销洞察 D 大数据检测和决策 41 传统的机器学习方法包括监督学习 无监督学习和半监督学习 其中监督学习是学习 给定标签的数据集 请问标签为离散的类型 称为分类 标签为连续的类型 称为什么 A 给定标签 B 离散 C 分类 D 回归 42 下列选项中 正确描述 Flume 对数据源的支持的是 A 只能使用 HDFS 数据源 B 可以配置数据源 C 不能使用文件系统 D 不能使用目录方式 43 IBM 提出的大数据 5V 特征包括 更快 Velocity 更多 Variety 更值钱 Value 和更 真实 Veracity A 更有效 B 更大 Volume C 更充分 D 更直观 44 下列选项中 不是大数据的一部分的是 A 海量计算 B 大量数据管理 C 数据分析 D 单机计算 45 Flume 采用了三层架构 分别为 agent collector 和 A Map B storage C Shuffle D Hash 46 HBASE 的特点不包括 A 面向列 B 稀疏性 C 多版本 D 低可靠性 47 mapreduce 计算模型适用于哪种任务 A 多线程处理 B 有关联的行处理 C 批处理 D 实时数据变化处理 48 最初的大数据概念还比较模糊 只是隐约的知道像个性化推荐 搜索引擎之类的处理需 理需要大量数据 那么在搜索引擎方面 谁是世界上最大的厂商 A 谷歌 B 百度 C 360 D bing 49 今年 大数据分析将出现革命性的新方法 从前的很多算法和基础理论可能会产生理论级 别的突破 而哪项技术将继续成为大数据智能分析的核心技术 A 机器学习 B 智能物流 C 脑科学 D 智能终端 50 下列选项中 正确描述 Flume 对数据源的支持的是 A 只能使用 HDFS 数据源 B 可以配置数据源 C 不能使用文件系统 D 不能使用目录方 式 51 HBASE 的特点不包括哪些 A 面向行 B 稀疏性 C 多版本 D 高可靠性 52 下列选项中 不是用于数据存储的技术是哪一个 5 A MongoDB B MySQL C HDFS D Java 53 属于 人造智能 具有意识 达到或超越人类智慧水平的人工智能称为 A 高人工智能 B 低人工智能 C 强人工智能 D 弱人工智能 54 下列选项中 不是人工智能的基础设施的是 A CPU 服务器 B GPU 服务器 C 专用芯片 D 游戏显卡 54 以下不是大数据特征的是 A 数据体量大 B 数据种类多 C 价值密度高 D 处理速度快 55 以下应用没有使用你的地理位置信息的是 A 美团 B 滴滴 C 高德地图 D word 56 下列选项中 不是 Flume 的特点的是 A 可靠性 B 集中式架构 C 可扩展性 D 可管理性 57 在 Spark 的软件栈中 用于交互式查询的是 A SparkSQL B Mllib C GraphX D Spark Streaming 58 下列选项中 不是大数据的一部分的是 A 海量计算 B 大量数据管理 C 数据分析 D 单机计算 59 人工智能 机器学习 深度学习的包含关系是 A 机器学习 深度学习 人工智能 B 人工智能 深度学习 机器学习 C 人工智能 机器学习 深度学习 D 深度学习 人工智能 机器学习 60 自然语言处理难点目前有四大类 下列选项中不是其中之一的是 A 机器性能 B 语言歧义性 C 知识依赖 D 语境 61 BP 神经网络模型拓扑结构不包括 A 输入层 B 隐层 C 输出层 D 显层 62 以下哪个不是语音识别的范畴 A 语音听写 B 语音合成 C 语音转写 D 语音唤醒 63 Alpha Go 是第一个击败人类职业 选手的人工智能程序 A 国际象棋 B 围棋 C 中国象棋 D 五子棋 64 随着闭源软件在数据分析领域的地盘不断缩小 老牌 IT 厂商正在改变商业模式 向着什 么靠拢 A 闭源 B 开源 C 独立 D 封闭 65 大数据 是需要新处理模式才能具有更强的决策力 洞察发现力和流程优化能力来适 应 高增长率和多样化的信息资产 6 A 海量 B 少数 C 小量 D 结构化 66 Spark Streaming 是什么软件栈中的流计算 A Spark B Storm C Hive D Flume 67 客服中心是运营商和客户接触较为频繁的通道 我们可以利用 在后端给客服中心建立 庞大的知识库 供接线员们使用帮忙他们快速精准的找到答案 A 大数据技术 B 客户画像 C 客户状态 D 客户心情 67 下列选项中正确说明价值密度低的是 A 100TB 数据中有 50TB 有效数据 B 1TB 数据中有 1KB 有效数据 C 100PB 数据中有 100PB 有效数据 D 10EB 数据中有 10EB 有效数据 68 学习没有标签的数据集的机器学习方法是 A 监督学习 B 无监督学习 C 半监督学习 D 强化学习 69 当前世界产生的数据总量的单位是 A KB B ZB C GB D TB 70 对抗学习中两个网络互相竞争 一个负责生成样本 那么另一个负责做什么 A 判别样本 B 计算样本 C 统计样本 D 生成样本 71 hdfs 中 namenode 的 metadata 的作用是 A 描述数据的存储位置等属性 B 存储数据 C 调度数据 72 rdd 是由多个什么组成 a partition puter c action d transformation 73 IBM 提出的大数据 5V 特征包括更大 Volume 更快 Velocity 更多 Variety 更值钱 Value 和 A 更有效 B 更充分 C 更真实 Veracity D 更直观 74 在 Spark 的软件栈中 用于流计算的是 A GraphX B Mllib C Spark Streaming D SparkSQL 75 以下数据量可以称为大数据的是 A 100MB B 100KB C 100PB D 100MB 76 学习没有标签的数据集的机器学习方法是 A 监督学习 B 无监督学习 C 半监督学习 D 强化学习 77 大数据的数据来源于方方面面 下列不可以作为数据源的是 A APP 应用 B 地理信息 C 一块石头 D 商店订单 78 数据采集的基本步骤 ETL 中不包括哪项 7 A 抽取转换 B 加载 C 计算 79 整个 MapReduce 的过程大致分为 Map Shuffle Combine A Reduce B Hash C Clean D Loading 80 人工智能通过输入的图片 解析出图片的内容 这种技术叫什么 A 图片识别 B 语音识别 C 自动驾驶 D 消费金融 81 大数据 是需要新处理模式才能具有更强的决策力 洞察发现力和流程优化能力来适应 高增长率和多样化的信息资产 A 海量 B 少数 C 小量 D 结构化 82 Hadoop2 系列版本中默认的 HDFS 的 block 是多大 A 32MB B 64MB C 128MB D 16MB 83 以下哪个场景可以称为大数据场景 A 故宫游客人数 B 故宫门票收入 C 美团 APP 的定位信息 D 文章内容 84 下列选项中 不是人工智能的算法中的学习方法的是 A 重复学习 B 深度学习 C 迁移学习 D 对抗学习 85 以下哪个不属于大数据在电信行业的数据商业化方面的应用 A 精准广告 B 网络管理 C 营销洞察 D 大数据检测和决策 86 在Spark的软件栈中 用于图计算的是 A Spark Streaming B Mllib C GraphX D SparkSQL 多选 1 自然语言处理需要解决的难点有哪些 A 语言歧义性 B 语言鲁棒性 C 知识依赖 D 语境 2 人工智能目前在以下哪三个领域有了长足的发展 A 健康 B 教育 C 探索太空 D 理财 3 下列选项属于人工智能的基本概念有 A 机器学习 B 深度学习 C BP 神经网络 D 卷积神经网络 4 大数据的业务应用处理需要经过哪些流程 A 数据采集 B 数据清洗 C 数据建模 D 数据加工 5 在数据清洗的过程中 总共可以归为三个阶段 它们分别是 A 数据加工 B 数据质量 C 数据校对 D 数据标准化 8 6 麦肯锡全球研究所对大数据的定义是一种规模大到在获取 存储 管理 分析方面大大 超出了传统数据库软件工具能力范围的数据集合 具有以下哪些特征 A 海量的数据规模 B 快速的数据流转 C 多样的数据类型 D 价值密度低 7 人工智能关键技术框架主要包括哪两层 A 基础设施 B 算法 C 技术 D 人员 8 大数据应用领域成就有哪些 A 金融 B 互联网电子商务 C 工业生产 D 没有明显成就 9 以下哪些属于大数据在电信行业的应用 A 网络管理和优化 B 数据商业化 C 客户关系管理 D 企业运营管理 10 以下哪两个属于大数据特征 A 数据体量大 B 价值密度高 C 数据种类多 D 处理速度慢 11 在非电信领域 大数据可被应用到的以下哪些方面 A 公共安全 B 无明显应用 C 智能运输 D 智能建筑 12 HBASE 的特点不包括哪两项 A 面向行 B 稠密性 C 多版本 D 高可靠性 13 那么下列哪些技术适合流处理 A Spark Streaming B Storm C Hbase D MapReduce 14 以下哪两项是人工智能发展的标志性产品 A 深蓝 B alphago C 智能门禁 D 智能手机 15 使用有监督学习的问题可以被分为哪两类 A 回归问题 B 抽样问题 C 聚类问题 D 分类问题 16 HDFS 在哪些场景中表现很差 A 大量小文件 B 随机读取 C 修改文件 D 存储和管理 PB 级别数据 17 世界经济论坛以 大数据的回报与风险 主题发布了 全球信息技术报告 第 13 版 通 过该报告 各国政府逐渐认识到大数据在哪些方面有重大意义 A 推动经济发展 B 改善公共服务 C 增进人民福祉 D 保障国家安全 18 电信行业的网络管理和优化包含了两部分的优化 下列选项中不在这两项优化之内的是 A 基础设施建设的优化 B 网络速度的优化 C 并发性的优化 D 网络运营管理及优化 19 通过地理位置信息可以分析出哪些信息 A 颜值 B 家庭住址 C 工作地址 D 体重 9 20 人工智能按照发展层级划分可以分为哪三层 A 计算智能 B 感知智能 C 认知智能 D 人工智能 21 使用有监督学习的问题可以被分为哪两类 A 回归问题 B 抽样问题 C 聚类问题 D 分类问题 22 Flume 采用了三层架构 每一层均可以水平扩展 它们分别是 A agent B collector C storage D source 23 人工智能的技术方向一共有三种 他们分别是 A 语音识别 B 计算机视觉 C 自然语言 D 复杂编程 24 Spark 适用于那些场景 A 计算量大 B 数据量大 C 效率要求高 D CRM 系统业务受理 25 关于 RDD 说法正确的两项是 A RDD 不能由多个分区 partition 组成 B 弹性 集中式内存集 C RDD 能生成 childrenRDD D 是一个容错的 并行的数据结构 26 业务运营监控 可以基于大数据分析从下列哪三个维度为运营商监控管道和客户运营 情况 A 网络 B 业务 C 气候 D 用户 27 Yarn 架构在 Hadoop 生态圈中有哪些作用 A 资源分配 B 调度 C 保证协同 D 计算数据 28 以下数据量不能说成大数据的是 A 100MB B 1000KB C 100PB D 1EB 29 自动驾驶中的人工智能技术包括下面哪三项 A 环境感知 B 行为决策 C 运动控制 D 温度控制 30 以下用到语音识别技术的应用包括 A 苹果手机 Siri B 微信 C 百度地图 D word 31 监督学习的回归方法包括 A 线性回归 B 逻辑回归 C 多项式回归 D 单一回归 32 人工智能技术的基础设施不包括哪两部分 A 系统应用 B 机器学习算法 C 基础硬件 D 算法框架 33 HDFS 适用于哪些场景 A 大量小文件 B 存储和管理 PB 级别数据 C 一次写入 多次读取 D 低延迟读取 10 34 自然语言处理的主要难点不包括以下哪两项 A 语言独立性 B 语言歧义性 C 多国语言 D 语境 35 以下哪两个属于大数据特征 A 数据体量大 B 价值密度高 C 数据种类多 D 处理速度慢 36 以下应用使用了你的地理位置信息的是 A 滴滴 B 百度地图 C word D excel 37 BP 神经网络模型拓扑结构包括 和输出层 output layer A 输入层 input B 隐层 hidden layer C 卷积层 convolutional layer D 池化层 pooling layer 38 自动驾驶中的人工智能技术包括下面哪三项 A 环境感知 B 行为决策 C 运动控制 D 温度控制 39 数据建模目前有两种比较通用的方式 分别是 A 通用建模 B 专属建模 C 范式建模 D 维度建模 40 下列选项中 是大数据发展趋势的是 A 开源大数据商业化进一步深化 B 打包的大数据行业分析应用开拓新市场 B 大数据细分市场规模进一步增大 D 大数据推动公司并购的规模和数量进一步提升 41 2010 年 12 月 工信部发布的物联网十二五规划上 把信息处理技术作为 4 项关键技术 创新工程之一被提出来 其中包括了哪些大数据的重要组成技术 A 海量数据存储 B 数据挖掘 C 图像视频智能分析 D python 42 在人工智能发展历程中有过多次低谷期 这些低谷期最主要的两项原因是什么 A 运算力不足 B 人员不足 C 技术瓶颈 D 费用太高 43 电信行业的网络管理和优化包含了两部分的优化 这两项优化是 A 基础设施建设的优化 B 网络速度的优化 C 并发性的优化 D 网络运营管理及优化 44 人工智能技术的基础设施不包括哪两部分 A 系统应用 B 机器学习算法 C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮安市中储粮2025秋招战略研究博士岗高频笔试题库含答案
- 太原市中储粮2025秋招质检化验岗高频笔试题库含答案
- 中国联通河池市2025秋招笔试行测题库及答案计算机类
- 阿克苏市中石化2025秋招笔试模拟题含答案数智化与信息工程岗
- 海南地区中储粮2025秋招机电维修岗高频笔试题库含答案
- 兰州市中石油2025秋招笔试综合知识专练题库及答案
- 中国移动云浮市2025秋招综合管理类专业追问清单及参考回答
- 朔州市中石化2025秋招笔试模拟题含答案油品分析质检岗
- 包头市中石油2025秋招笔试模拟题含答案炼油设备技术岗
- 红河自治州中石化2025秋招笔试模拟题含答案行测综合英语
- HDPE塑钢缠绕排水管施工方案
- 二十案例示轮回
- 医疗器械经营质量管理制度和工作程序目录
- 基于知识图谱的应急事件解析与研判
- 化学与垃圾分类
- 车床上下料方案一对二
- 公墓建设申请审批表
- 2025年高考语文一轮复习策略讲座
- 初级邮政投递员职业技能鉴定考试题及答案
- 农业综合行政执法大比武试题库(试题及答案)
- 临建标准化(2023版)
评论
0/150
提交评论