南开大学20春学期大数据导论在线作业-1答案100分_第1页
南开大学20春学期大数据导论在线作业-1答案100分_第2页
南开大学20春学期大数据导论在线作业-1答案100分_第3页
南开大学20春学期大数据导论在线作业-1答案100分_第4页
南开大学20春学期大数据导论在线作业-1答案100分_第5页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【奥鹏】-南开大学20春学期(1709、1803、1809、1903、1909、2003)大数据导论在线作业试卷总分:100得分:100第1题,大数据的特点不包含A、数据体量大B、价值密度高C、处理速度快D、数据不统一正确答案:D第2题,基础设施即服务的英文简称是A、IaaSB、PaaSC、SaaS正确答案:A第3题,下面哪一项不是中国发展大数据产业的基础()。A、信息化积累了丰富的数据资源B、大数据技术创新取得明显突破C、大数据应用推动势头良好D、大数据产业支撑薄弱正确答案:D第4题,数据清洗的方法不包括A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理正确答案:D第5题,以下

2、不是数据仓库基本特征的是()A、数据仓库是面向主题的B、数据仓库是面向事务的C、数据仓库的数据是相对稳定的D、数据仓库的数据是反映历史变化的正确答案:B第6题,数据产生方式变革中数据产生方式是被动的主要是来自哪个阶段()A、运营式系统阶段B、用户原创内容阶段C、感知式系统阶段正确答案:A第7题,数据产生方式变革中数据产生方式是自动的主要是来自哪个阶段()A、运营式系统阶段B、用户原创内容阶段C、感知式系统阶段正确答案:C第8题,数据仓库是随着时间变化的,下列不正确的是()A、数据仓库随时间变化不断增加新内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随事件变化不断删去旧的数据内容D、数据仓库

3、中包含大量的综合数据,这些综合数据会随时间的变化不断进行重新综合正确答案:C第9题,购物篮问题是#的典型案例A、数据变换B、关联规则挖掘C、数据分类正确答案:B第10题,PaaS是()的简称A、软件即服务B、平台即服务C、基础设施即服务D、硬件即服务正确答案:B()第11题,下列哪个R语言扩展包可以制作一系列的图像并将它们串联起来做成动画A、ggplot2B、networkC、ggmapsD、animation正确答案:D第12题,数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段()A、运营式系统阶段B、用户原创内容阶段C、感知式系统阶段正确答案:B第13题,哪个选项不属于大数据4V特

4、点?A、VolumeB、ValidC、VarietyD、Value正确答案:B第14题,以下哪项不是数据可视化工具的特性()A、实时性B、简单操作C、更丰富的展现D、仅需一种数据支持方式即可正确答案:D第15题,()是MicrosoftOffice的核心组件A、SQLB、WORDC、PPTD、EXCEL正确答案:D第16题,云计算的特点是()A、大规模B、高扩展性C、虚拟化D、按需分配正确答案:A,B,C,D第17题,大数据时代预测人类移动行为的数据来源有A、志愿者定位数据B、装有导航设备的出租车轨迹数据C、手机终端定位于通讯记录D、社会网络签到数据正确答案:A,B,C,D第18题,百度大数据

5、引擎主要包含三大组件()A、开放云B、数据工厂C、百度大脑。正确答案:A,B,C第19题,KNIME(KonstanzInformationMiner)是一个对用户友好的、智能、开源的平台。该平台包括了#、#、#、#。A、数据集成B、数据处理C、数据分析D、数据挖掘正确答案:A,B,C,D第20题,大数据时代预测人类移动行为的数据特点是A、多样化B、数据量大C、维数高D、变化快正确答案:B,C,D第21题,大数据采集主要包括()四种。A、系统日志采集B、网络数据采集C、数据库采集D、其他数据采集正确答案:A,B,C,D第22题,数据工厂包括A、低能耗数据中心B、超大规模讲分布式架构C、新一代智

6、能自动化运维D、超强云安全正确答案:A,B,C,D第23题,数据分析的类型根据数据分析深度可以分为()A、描述性分析B、预测性分析sC、规则性分析正确答案:A,B,C第24题,主流分布式计算平台有()A、googleB、IBMC、baiduD、Amazon正确答案:A,B,D第25题,交通数据分析可用于A、交通流量实时分析B、合理进行道路规划C、信号灯智能调度D、实时路况查询播报正确答案:A,B,C,D第26题,互连网上出现的海量信息可以划分为三种,分别为()A、结构化信息B、非结构化信息C、半结构化信息D、特殊化信息正确答案:A,B,C第27题,一个HDFS1群由一个#和#构成。此外,还有与

7、这两个角色之间作为沟通桥梁的客户端(Client)。A、一个名字节点B、若干个名字节点C、一个数据节点D、若干个数据节点正确答案:A,D第28题,大数据在社交网络中的应用A、用户偏好、情感、社交网络结构B、用户画像、精准推荐C、舆情监控、突发事件预警D、预测外部趋势正确答案:A,B,C,D第29题,开放云()A、价值呈现:大数据应用价值呈现和创新不足B、应用建设:周期长、门槛高、多冗余、体验差C、组织流程:应用跨部门,缺乏流程贯串和使能业务生产D、生态建设:无法有效构建和融入新的数字生态圈正确答案:A,B,C,D第30题,大数据在电信中的应用有A、基于用户、业务及流量分级的多维管控机制B、精准

8、的客户分析及营销C、利用位置和轨迹信息服务社会正确答案:A,B,C第31题,数据存在形式包括结构化数据和结构化数据T、对F、错正确答案:F第32题,数据可视化。将大型数据集中的数据通过图形图像方式表示,并利用数据分析和开发工具发现其中未知信息。T、对F、错正确答案:T第33题,Spark是基于二内存的大数据并行计算框架T、对F、错正确答案:T第34题,非结构化数据是指非纯文本类数据,没有标准格式,无法直接解析出相应的值T、对F、错正确答案:T第35题,箱式图用于描述数据的分散情况,主要数据节点包括:均值、中值、等中心值的度量,标准偏差、方差等可变性度量。T、对F、错正确答案:T第36题,Pen

9、taho是最流行的开源商业智能软件之一T、对F、错正确答案:T第37题,网络数据采集是利用互联网搜索引擎技术对数据进行针对性、行业性、精准性的抓取,并按照一定规则和筛选标准将数据进行归类,形成数据库文件的一个过程。T、对F、错正确答案:T第38题,云存储不仅是存储设备或技术,更是一种服务的创新。T、对F、错正确答案:T第39题,当数据量表完全超过BI和传统关系数据库的能力时,我们将用到海量数据分析。T、对F、错正确答案:T第40题,IDC给出的大数据定义是大数据(BigData)是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。T、对F、错正确

10、答案:F第41题,Paas:软件即服务。它是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。T、对F、错正确答案:F第42题,关联分析是在数据集D中找出大于用户所给定的最大支持度阈值和最大置信度阈值的关联规则。T、对F、错正确答案:F第43题,数据的大量聚集,使得黑客一次成功的攻击能够获得更多的数据,无形中降低了黑客的进攻成本,增加了“收益率T、对F、错正确答案:T第44题,数据采集,又称数据获取,是大数据生命周期的第一个环节,通过RFID射频识别技术传感器,交互型社交网络,移动互联网等方式获得的各种类型的结构化、半结构化及非结构化的海量数据。T、对F、错正确答案:T第45题,社交网络一一通常由通过一些特定类型的相互依赖关系(例如,亲属关系、友谊、共同兴趣、信念或金融交换)链接的社会实体(例如,个人、公司、集体社会单位或组织)组成。T、对F、错正确答案:T第46题,数据表达是通过计算机图形图像技术来更加友好地展示数据信息,方便人们阅读、理解和运用数据T、对F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论