大数据分析师认证-样题--0814-v0.2.doc_第1页
大数据分析师认证-样题--0814-v0.2.doc_第2页
大数据分析师认证-样题--0814-v0.2.doc_第3页
大数据分析师认证-样题--0814-v0.2.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

阿里云大学认证 阿里云大数据行业认证(ACP)考试样题大数据分析师认证(ACP级)考试样题一、 单选题1、 MySQL数据库中有“product”的数据表。“product”数据表存储的是产品的基本信息,它包含如下字段:产品编号“id”,价格“price”以及产品描述“description”,其中产品编号“id”是主键。如果分析师希望通过SQL语句从“product”表中选取三件价格最贵的产品的编号以及产品描述,可以通过_命令实现。a) select id,description from product order by price asc limit 3;b) select id,description from product where max(price)3;c) select id,description from product order by price desc limit 3;d) select id,description,max(price) from product order by price;2、 某高校的教授在第一天上课时发现,他授课的班级中女性学生的出勤比例明显大于男性学生,但是点名册却显示该班级的男女比例实际上为1比1。该教授推测,可能是因为男性学生比女性学生更容易翘课。为了检验他的假设,该教授记录了这个班级在一个学期的16次课程中的男女学生出勤情况,并使用双样本T-test的假设检验方法来检查男女学生的出勤率有无明显差异。男性学生与女性学生的平均出勤率分别用P(M)与P(F)表示。以下假设条件中,_符合该教授的分析要求。a) 原假设应该设为,H0:P(M)= P(F),并使用双侧检验b) 原假设应该设为,H0:P(M)= P(F),并使用左侧检验c) 原假设应该设为,H0:P(M) P(F),并使用左侧检验d) 原假设应该设为,H0:P(M) P(F),并使用双侧检验3、 与RDBMS相比,Apache Hadoop的一个不同之处在于_。a) RDBMS只能将数据存储在同一磁盘上统一管理,而Hadoop可以在不同磁盘上存储数据块,因此Hadoop可实现分布读写数据b) RDBMS只能将数据存储在同一磁盘上统一管理,而Hadoop可以在不同磁盘上存储数据块,因此Hadoop的可扩展性较强c) RDBMS和Hadoop都可以在多个磁盘上存储数据,但Hadoop不需要遵循ACID特性,因此Hadoop可存储非结构化数据d) RDBMS和Hadoop都可以在多个磁盘上存储数据,但Hadoop可以利用低端硬件设备横向扩展,因此Hadoop的扩展成本较低4、 2017年,“新一线城市研究所”发布了最新的中国城市等级划分。在进行划分时,使用了城市的经济实力、城市枢纽性与城市生活多样性等5项指标作为评判标准,利用算法对全国各主要城市进行了重新划分。划分结果完全由各个城市在几个指标上的差异决定,这打破了传统的一、二、三线城市的划分规则,出现了一类“新一线”城市。这种划分算法属于_。a) 聚类,可根据各城市之间的差异自动确定城市类别b) 聚类,使用部分已划分好的城市作为训练集有监督学习c) 分类,需要过往的城市等级划分作为标签无监督学习d) 分类,可以使用K-means法进行划分5、 ABC电商公司非常关心用户从浏览到下单到支付的转化率,他们想分析不同性别的人在该流程中的转化率的差异,以下图表中_更适合该场景。a) 旋风漏斗图b) 漏斗图c) 矩阵树图d) 瀑布图二、 多选题1、 数据管理技术在其发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。与文件系统阶段相比,数据库系统阶段对数据的管理方式有了许多方面的改进。这种改进体现在_。(正确答案个数:2个)a) 数据库系统提供了结构化查询语言,降低了数据管理、查询等操作的难度b) 数据库系统在某种程度上保证了数据的一致性c) 文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量d) 数据库系统比较复杂,而文件系统比较简单e) 文件系统可以更好的保存非格式化的数据,比如音频、视频等2、 业务部门需要关闭一些销售情况不佳的门店,数据分析师小张按KPI设计要求计算了各个门店上一季度的相关KPI,建议将KPI指标最差的门店关闭。但业务部门认为无法凭借一个季度的KPI决定哪家店需要关,而是需要前两年每个季度KPI的同比结果来判断各个门店的业绩是上升的还是下降,才能决定关店。该分析方案设计有缺陷,小张很可能在实施项目前没有理解项目的_。(正确答案个数:2个)a) 目的b) 范围c) 风险d) 绩效3、 设计师小王参与了多个使用可视化工具制作可视化大屏的项目,他根据自己的经验总结了一些可视化大屏的基本设计原则,其中正确的有_。(正确答案的数量:3个)a) 将大屏合理的拆解成多个板块,层次结构分明b) 重点KPI放在突出位置,最好能辅以细节解释数据c) 优先级越高的信息,越要放在中间和上方d) 大屏中心是视觉核心区,必须放一个地图(平面或者3D均可)提升视觉效果e) 制作大屏时要遵循从上到下,从左到右的顺序f) 尽可能在同一个大屏上增加更多的信息点,为受众提供更多的信息三、 判断题1、 MapReduce是一种编程模型,用于大规模数据的并行运算。它提供了一种简便的并行程序设计方法,用Map(映射)和Reduce(归约)两个函数编程实现基本的并行计算任务。2、 在决策树算法中,如果由于设置的决策树的分枝较少,或者训练集的样本量较小而导致模型的预测精度不足,可能是因为模型出现了过拟合的现象。3、 MySQL数据库中有“customer”和“orders”两张表,两张表中有共同的字段“customer_id”。分析师小张在执行:select a. customer_id, a.gender, b.amount from customer as a full join orders as b on a. customer_id = b. cust

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论