数据分析师考试试卷及答案_第1页
数据分析师考试试卷及答案_第2页
数据分析师考试试卷及答案_第3页
数据分析师考试试卷及答案_第4页
数据分析师考试试卷及答案_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析师考试试卷及答案一、填空题(共10题,每题1分)1.SQL中计算平均值的聚合函数是______。2.存储整数的SQL数据类型是______。3.常用BI工具除Tableau外还有______。4.反映数据离散程度的指标是______(示例)。5.ETL流程中“L”代表______。6.二分类常用算法是______(示例)。7.A/B测试中点击行为指标是______。8.数据仓库围绕事实表的是______表。9.类别特征转数值的方法是______(示例)。10.pandas合并DataFrame的函数是______。二、单项选择题(共10题,每题2分)1.SQL取前5行的关键字是()A.LIMIT5B.TOP5C.FETCH5D.GET52.数据清洗第一步是()A.缺失值处理B.数据导入C.异常值检测D.重复值删除3.Pearson相关系数范围是()A.[-1,1]B.[0,1]C.(-∞,+∞)D.[0,+∞)4.展示时间趋势的图表是()A.柱状图B.折线图C.饼图D.散点图5.pandas读CSV的函数是()A.read_csvB.read_excelC.load_csvD.import_csv6.属于监督学习的算法是()A.K-MeansB.PCAC.决策树D.关联规则7.A/B测试样本量依据不包括()A.置信水平B.统计功效C.最小可检测差异D.用户数量8.星型模型核心是()A.多事实表B.多维度表关联1事实表C.维度嵌套D.无事实表9.特征选择方法是()A.卡方检验B.独热编码C.归一化D.填充缺失值10.异常值检测方法是()A.3σ原则B.均值填充C.可视化D.数据转换三、多项选择题(共10题,每题2分)1.SQL聚合函数包括()A.SUMB.COUNTC.MAXD.WHERE2.数据清洗步骤有()A.重复值处理B.缺失值处理C.异常值处理D.标准化3.可视化工具包括()A.TableauB.PowerBIC.MatplotlibD.Seaborn4.描述性统计指标有()A.均值B.中位数C.标准差D.回归系数5.ETL环节包括()A.抽取B.转换C.加载D.分析6.监督学习算法有()A.SVMB.随机森林C.K-MeansD.朴素贝叶斯7.A/B测试核心指标有()A.CTRB.转化率C.留存率D.样本量8.数据仓库维度类型有()A.时间B.产品C.用户D.事实9.特征工程步骤有()A.选择B.转换C.提取D.训练10.异常值处理方法有()A.删除B.填充C.转换D.保留四、判断题(共10题,每题2分)1.中位数不受极端值影响()2.GROUPBY后只能接聚合函数()3.pandasgroupby默认升序()4.线性回归适用于分类()5.A/B测试需随机分组()6.星型模型维度表关联事实表外键()7.特征工程对模型无影响()8.相关系数1表示完全正相关()9.异常值必须删除()10.可视化只需美观()五、简答题(共4题,每题5分)1.简述数据清洗主要步骤2.简述GROUPBY与HAVING的区别3.简述A/B测试核心流程4.简述pandas缺失值处理方法六、讨论题(共2题,每题5分)1.电商平台提升转化率,如何设计A/B测试?2.如何判断线性回归模型效果好坏?---答案部分一、填空题1.AVG2.INT3.PowerBI4.标准差5.加载(Load)6.逻辑回归7.点击率(CTR)8.维度9.独热编码10.merge二、单项选择题1.A2.B3.A4.B5.A6.C7.D8.B9.A10.A三、多项选择题1.ABC2.ABCD3.ABCD4.ABC5.ABC6.ABD7.ABC8.ABC9.ABC10.ABCD四、判断题1.√2.×3.√4.×5.√6.√7.×8.√9.×10.×五、简答题1.数据清洗步骤:①导入检查(确认结构/缺失);②重复值处理(删除/标记);③缺失值处理(填充/删除/插值);④异常值处理(3σ/箱线图检测,删除/填充);⑤格式转换(日期/数值统一);⑥一致性检查(逻辑验证)。2.GROUPBY按字段分组,HAVING筛选分组后聚合结果;HAVING需配合GROUPBY,仅用聚合条件,WHERE不能用聚合;例:SELECTdept,COUNT()FROMempGROUPBYdeptHAVINGCOUNT()>5。3.A/B测试流程:①明确目标(如转化率提升);②设计变量(如按钮颜色);③随机分组(保证无偏差);④执行测试(收集数据);⑤统计分析(t检验判断差异);⑥决策(上线/迭代)。4.pandas缺失值处理:①删除(dropna());②填充(fillna(),均值/中位数/ffill);③插值(interpolate());④标记(isna()/notna())。六、讨论题1.电商转化率A/B测试:①目标:详情页→下单转化率提升;②变量:“立即购买”按钮颜色(A红/B橙);③样本:随机分两组(各1000人);④控制:其他元素一致;⑤收集:7天点击/下单数据;⑥分析:t检验判断差异(p<0.05);⑦决策:显著则上线,否则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论