2021年阿里校招数据分析师笔试题_第1页
2021年阿里校招数据分析师笔试题_第2页
2021年阿里校招数据分析师笔试题_第3页
2021年阿里校招数据分析师笔试题_第4页
2021年阿里校招数据分析师笔试题_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、阿里校招数据分析师笔试题 xx年阿里校招数据分析师笔试题 xx年8月19日,阿里校招数据分析师题。共计21题(单选漏了一题,选择题每个人的都不一样,问答题是一样的。暂时没有答案,希望对大家有用。 单选题: 1、观测宇宙中单位体积内星球的个数,属于什么分布: A学生分布B泊松分布C正态分布D二项分布 2、一些关于数据挖掘说法是正确的 A数据挖掘是万能的 B如果你建立了一个database,那就意味着你已经有足够的.数据可以做数据挖掘了 C数据挖掘=数据+算法,数据挖掘人员大部分的时间用来处理复杂的挖掘算法 DABC均有错 3、已知随机变量X,Y分别服从泊松分布P(S),卡方分布X2(t),E(X

2、)=4,D(Y)=9,则参数s,t分别: A2,9;B4,9C4,4.5;D2,4.5 4 、下面算法中哪一种不属于广义线性回归算法 A生存模型算法 Bbeta回归算法 Clogit回归算法 D判别分析算法 5、有一列1000万淘宝买家的淘宝运费险保费数据,要计算该列数据的P1-P100分位数,可使用哪个SAS语句? Aproc sort Bproc rank Cproc univariate Dproc freq 6、X服从区间(2,6)上的均匀分布,求对X进行3次 _观测中,至少有2次的观测值大于3的概率。 A0.84375 B0.75275 C0.65275 D0.80370 7、下面对

3、于“预测变量间可能存在较严重的多重共线性”的论述中错误的是? A回归系数的符号与专家知识不符 B方差膨胀因子(VIF)=0.85 D变量重要性与专家经验严重违背 8、由于淘宝买家消费数据是亿级别,假设为了快速计算买家每月的平均消费额,采用抽样1W个买家来计算 A采用分层抽样方法把全量淘宝买家按照星级,每层抽取相同的数量,计算平均值 B采用系统抽样方法,把全量买家随机排序,每隔一定数量抽一个,计算平均值 C采用无放回随机方法,从全量买家中随机挑选一个买家,不放回,如此循环 D采用有放回随机方法,从全量买家中随机挑选一个买家,然后再放回,如此循环 9、请找出数列4,9,23,60,157的下一项(

4、) A 411 B _ C 425 D ABC均错 10(应该是没统计上) 多选题 11、以下哪个语法不是R的基础语言 Aproc glot Bselect *from table Ckc-kmeans(data,3) Dprint”hello world” Esd-sum _ry(data) Fimport 12、分析师在工作中的良好习惯是 A将工作空间的 _共享给别人 B将数据下载到私人电脑进行分析处理 C在处理资源高峰期提交大任务运算 D不定期地将分析报告 _给团队 E定期清理存储空间 F固话日常需要分析的数据表方便计算 13 14 15 16 、 请分析淘宝消费者的流失情况 17 、 淘宝和天猫上每天都有大量的用户在线上 _,作为分析师可以从哪些角度对用户进行分析,说明理由 18 19 20已知A商家近五年每月的成交数据,请列出两种不同的时间序列预测模型可以用来预测商家接下来三个月的成交,并详细阐述在使用每一种方法前需要对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论