




免费预览已结束,剩余12页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
网易数据分析专员笔试题目 一 基础题 1 中国现在有多少亿网民 2 百度花多少亿美元收购了 91 无线 3 app store 排名的规则和影响因素 4 豆瓣 fm 推荐算法 5 列举 5 个数据分析的博客或网站 二 计算题 1 关于简单移动平均和加权移动平均计算 2 两行数计算相关系数 2 位小数 还不让用计算器 反正我没算 3 计算三个距离 欧几里德 曼哈顿 闵可夫斯基距离 三 简答题 1 离散的指标 优缺点 2 插补缺失值方法 优缺点及适用环境 3 数据仓库解决方案 优缺点 4 分类算法 优缺点 5 协同推荐系统和基于聚类系统的区别 四 分析题 关于网易邮箱用户流失的定义 挑选指标 然后要构建一个预警模型 五 算法题 记不得了 没做 反正是决策树和神经网络相关 1 你处理过的最大的数据量 你是如何处理他们的 处理的结果 2 告诉我二个分析或者计算机科学相关项目 你是如何对其结果进行衡量的 3 什么是 提升值 关键绩效指标 强壮性 模型按合度 实验设计 2 8 原则 4 什么是 协同过滤 n grams map reduce 余弦距离 5 如何让一个网络爬虫速度更快 抽取更好的信息以及更好总结数据从而得到一干净的数 据库 6 如何设计一个解决抄袭的方案 7 如何检验一个个人支付账户都多个人使用 8 点击流数据应该是实时处理 为什么 哪部分应该实时处理 9 你认为哪个更好 是好的数据还是好模型 同时你是如何定义 好 存在所有情况下通用 的模型吗 有你没有知道一些模型的定义并不是那么好 10 什么是概率合并 AKA 模糊融合 使用 SQL 处理还是其它语言方便 对于处理半结构 化的数据你会选择使用哪种语言 11 你是如何处理缺少数据的 你推荐使用什么样的处理技术 12 你最喜欢的编程语言是什么 为什么 13 对于你喜欢的统计软件告诉你喜欢的与不喜欢的 3 个理由 14 SAS R Python Perl 语言的区别是 15 什么是大数据的诅咒 16 你参与过数据库与数据模型的设计吗 17 你是否参与过仪表盘的设计及指标选择 你对于商业智能和报表工具有什么想法 18 你喜欢 TD 数据库的什么特征 19 如何你打算发 100 万的营销活动邮件 你怎么去优化发送 你怎么优化反应率 能把这 二个优化份开吗 20 如果有几个客户查询 ORACLE 数据库的效率很低 为什么 你做什么可以提高速度 10 倍以上 同时可以更好处理大数量输出 21 如何把非结构化的数据转换成结构化的数据 这是否真的有必要做这样的转换 把数 据存成平面文本文件是否比存成关系数据库更好 22 什么是哈希表碰撞攻击 怎么避免 发生的频率是多少 23 如何判别 mapreduce 过程有好的负载均衡 什么是负载均衡 24 请举例说明 mapreduce 是如何工作的 在什么应用场景下工作的很好 云的安全问题有 哪些 25 在内存满足的情况下 你认为是 100 个小的哈希表好还是一个大的哈希表 对于内在或 者运行速度来说 对于数据库分析的评价 26 为什么朴素贝叶斯差 你如何使用朴素贝叶斯来改进爬虫检验算法 27 你处理过白名单吗 主要的规则 在欺诈或者爬行检验的情况下 28 什么是星型模型 什么是查询表 29 你可以使用 excel 建立逻辑回归模型吗 如何可以 说明一下建立过程 30 在 SQL Perl C Python 等编程过程上 待为了提升速度优化过相关代码或者算法吗 如何及提升多少 31 使用 5 天完成 90 的精度的解决方案还是花 10 天完成 100 的精度的解决方案 取决 于什么内容 32 定义 QA 质量保障 六西格玛 实验设计 好的与坏的实验设计能否举个案例 33 普通线性回归模型的缺陷是什么 你知道的其它回归模型吗 34 你认为叶数小于 50 的决策树是否比大的好 为什么 35 保险精算是否是统计学的一个分支 如果不是 为何如何 36 给出一个不符合高斯分布与不符合对数正态分布的数据案例 给出一个分布非常混乱的 数案例 37 为什么说均方误差不是一个衡量模型的好指标 你建议用哪个指标替代 38 你如何证明你带来的算法改进是真的有效的与不做任何改变相比 你对 A B 测试熟吗 39 什么是敏感性分析 拥有更低的敏感性 也就是说更好的强壮性 和低的预测能力还是 正好相反好 你如何使用交叉验证 你对于在数据集中插入噪声数据从而来检验模型的敏 感性的想法如何看 40 对于一下逻辑回归 决策树 神经网络 在过去 15 年中这些技术做了哪些大的改进 41 除了主成分分析外你还使用其它数据降维技术吗 你怎么想逐步回归 你熟悉的逐步 回归技术有哪些 什么时候完整的数据要比降维的数据或者样本好 42 你如何建议一个非参数置信区间 43 你熟悉极值理论 蒙特卡罗逻辑或者其它数理统计方法以正确的评估一个稀疏事件的发 生概率 44 什么是归因分析 如何识别归因与相关系数 举例 45 如何定义与衡量一个指标的预测能力 46 如何为欺诈检验得分技术发现最好的规则集 你如何处理规则冗余 规则发现和二者的 本质问题 一个规则集的近似解决方案是否可行 如何寻找一个可行的近似方案 你如何 决定这个解决方案足够好从而可以停止寻找另一个更好的 47 如何创建一个关键字分类 48 什么是僵尸网络 如何进行检测 49 你有使用过 API 接口的经验吗 什么样的 API 是谷歌还是亚马逊还是软件即时服务 50 什么时候自己编号代码比使用数据科学者开发好的软件包更好 51 可视化使用什么工具 在作图方面 你如何评价 Tableau R SAS 在一个图中有效展现 五个维度 52 什么是概念验证 53 你主要与什么样的客户共事 内部 外部 销售部门 财务部门 市场部门 IT 部门的人 有 咨询经验吗 与供应商打过交道 包括供应商选择与测试 54 你熟悉软件生命周期吗 及 IT 项目的生命周期 从收入需求到项目维护 55 什么是 cron 任务 56 你是一个独身的编码人员 还是一个开发人员 或者是一个设计人员 57 是假阳性好还是假阴性好 58 你熟悉价格优化 价格弹性 存货管理 竞争智能吗 分别给案例 59 Zillow s 算法是如何工作的 60 如何检验为了不好的目的还进行的虚假评论或者虚假的 FB 帐户 61 你如何创建一个新的匿名数字帐户 62 你有没有想过自己创业 是什么样的想法 63 你认为帐号与密码输入的登录框会消失吗 它将会被什么替代 64 你用过时间序列模型吗 时滞的相关性 相关图 光谱分析 信号处理与过滤技术 在什么样的场景下 65 哪位数据科学有你最佩服 从哪开始 66 你是怎么开始对数据科学感兴趣的 67 什么是效率曲线 他们的缺陷是什么 你如何克服这些缺陷 68 什么是推荐引擎 它是如何工作的 69 什么是精密测试 如何及什么时候模拟可以帮忙我们不使用精密测试 70 你认为怎么才能成为一个好的数据科学家 71 你认为数据科学家是一个艺术家还是科学家 72 什么是一个好的 快速的聚类算法的的计算复杂度 什么好的聚类算法 你怎么决定一 个聚类的聚数 73 给出一些在数据科学中 最佳实践的案例 74 什么让一个图形使人产生误解 很难去读懂或者解释 一个有用的图形的特征 75 你知道使用在统计或者计算科学中的 经验法则 吗 或者在商业分析中 76 你觉得下一个 20 年最好的 5 个预测方法是 77 你怎么马上就知道在一篇文章中 比如报纸 发表的统计数字是错误 或者是用作支撑作 者的论点 而不是仅仅在罗列某个事物的信息 例如 对于每月官方定期在媒体公开发布的 失业统计数据 你有什么感想 怎样可以让这些数据更加准确 从阿里数据分析师笔试看职业要求 以下试题是来自阿里巴巴招募实习生的一次笔试题 从笔试题的几个要求我们一起来看看 数据分析的职业要求 一 异常值是指什么 请列举 1 种识别连续型变量异常值的方法 异常值 Outlier 是指样本中的个别值 其数值明显偏离所属样本的其余观测值 在数理统计 里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值 Grubbs test 是以 Frank E Grubbs 命名的 又叫 maximum normed residual test 是一种用于 单变量数据集异常值识别的统计检测 它假定数据集来自正态分布的总体 未知总体标准差 在五种检验法中 优劣次序为 t 检验法 格拉布斯检验法 峰度检验法 狄克逊检验法 偏度检验法 点评 考察的内容是统计学基础功底 二 什么是聚类分析 聚类算法有哪几种 请选择一种详细描述其计算原理和步骤 聚类分析 cluster analysis 是一组将研究对象分为相对同质的群组 clusters 的统计分析技术 聚类分析也叫分类分析 classification analysis 或数值分类 numerical taxonomy 聚类与分类 的不同在于 聚类所要求划分的类是未知的 聚类分析计算方法主要有 层次的方法 hierarchical method 划分方法 partitioning method 基于密度的方法 density based method 基于网格的方法 grid based method 基于模型的方 法 model based method 等 其中 前两种算法是利用统计学定义的距离进行度量 k means 算法的工作过程说明如下 首先从 n 个数据对象任意选择 k 个对象作为初始聚类 中心 而对于所剩下其它对象 则根据它们与这些聚类中心的相似度 距离 分别将它们分 配给与其最相似的 聚类中心所代表的 聚类 然 后再计算每个所获新聚类的聚类中心 该聚 类中所有对象的均值 不断重复这一过程直到标准测度函数开始收敛为止 一般都采用均 方差作为标准测度函数 k 个聚类具有以下特点 各聚类本身尽可能的紧凑 而各聚类之间尽 可能的分开 其流程如下 1 从 n 个数据对象任意选择 k 个对象作为初始聚类中心 2 根据每个聚类对象的均值 中心对象 计算每个对象与这些中心对象的距离 并根据最 小距离重新对相应对象进行划分 3 重新计算每个 有变化 聚类的均值 中心对象 4 循环 2 3 直到每个聚类不再发生变化为止 标准测量函数收敛 优点 本算法确定的 K 个划分到达平方误差最小 当聚类是密集的 且类与类之间区别明显 时 效果较好 对于处理大数据集 这个算法是相对可伸缩和高效的 计算的复杂度为 O NKt 其中 N 是数据对象的数目 t 是迭代的次数 一般来说 K N t N 缺点 1 K 是事先给定的 但非常难以选定 2 初始聚类中心的选择对聚类结果有较大的影 响 点评 考察的内容是常用数据分析方法 做数据分析一定要理解数据分析算法 应用场景 使 用过程 以及优缺点 三 根据要求写出 SQL 表 A 结构如下 Member ID 用户的 ID 字符型 Log time 用户访问页面时间 日期型 只有一天的数据 URL 访问的页面地址 字符型 要求 提取出每个用户访问的第一个 URL 按时间最早 形成一个新表 新表名为 B 表结构 和表 A 一致 createtable B asselectMember ID min Log time URL from Agroup byMember ID 点评 SQL 语句 简单的数据获取能力 包括表查询 关联 汇总 函数等 四 销售数据分析 以下是一家 B2C 电子商务网站的一周销售数据 该网站主要用户群是办公室女性 销售额 主要集中在 5 种产品上 如果你是这家公司的分析师 a 从数据中 你看到了什么问题 你觉得背后的原因是什么 b 如果你的老板要求你提出一个运营改进计划 你会怎么做 表如下 一组每天某网站的销售数据 a 从这一周的数据可以看出 周末的销售额明显偏低 这其中的原因 可以从两个角度来看 站在消费者的角度 周末可能不用上班 因而也没有购买该产品的欲望 站在产品的角度来 看 该产品不能在周末的时候引起消费者足够的注意力 b 针对该问题背后的两方面原因 我的运营改进计划也分两方面 一是 针对消费者周末没 有购买欲望的心理 进行引导提醒消费者周末就应该准备好该产品 二是 通过该产品的一 些类似于打折促销等活动来提升该产品在周末的人气和购买力 点评 数据解读能力 获取数据是基本功 仅仅有数据获取能力是不够的 其次是对数据的解 读能力 五 用户调研 某公司针对 A B C 三类客户 提出了一种统一的改进计划 用于提升客户的周消费次数 需要你来制定一个事前试验方案 来支持决策 请你思考下列问题 a 试验需要为决策提供什么样的信息 c 按照上述目的 请写出你的数据抽样方法 需要采集的数据指标项 以及你选择的统计方 法 a 试验要能证明该改进计划能显著提升 A B C 三类客户的周消费次数 b 根据三类客户的数量 采用分层比例抽样 需要采集的数据指标项有 客户类别 改进计划前周消费次数 改进计划后周消费次数 选用统计方法为 分别针对 A B C 三类客户 进行改进前和后的周消费次数的 两独立样 本 T 检验 two sample t test 点评 业务理解能力和数据分析思路 这是数据分析的核心竞争力 综上所述 一个合格的数据分析应该具备统计学基础知识 数据分析方法 数据获取 数据解 读和业务理解 数据分析思想几个方面能力 即将成为数据分析师的亲们 你们准备好了吗 2 从腾讯 数据挖掘方向 笔试题目看技术储备 笔试内容 1 二叉树遍历 已知中序遍历顺序以及前序遍历顺序 求后序遍历顺序 2 SQL 语句 找出 QQset 中最小的 QQ 号码 3 encodeURI Node next 接口为 Node merge sort Node 2 设计 S 型层次遍历树的算法 比如根节点是第一层 第二层从左至右遍历 第三层从右至 左遍历 第四层再从左至右遍历 以此类推 举例 应依次输出 1 2 3 6 5 4 7 8 9 3 一个 url 文件 每行是一个 url 地址 可能有重复 1 统计每个 url 的频次 设计函数实现实现 2 设有 10 亿 url 平均长度是 20 现在机器有 8G 内存 怎么处理 写出思路 三 系统设计题 自然语言处理中的中文分词问题 前向最大匹配算法 FMM 注 题目举例说明了 FMM 的基本思想 1 设计字典的数据结构 struct dictnote 2 用 C C 实现 FMM 可选接口为 int FMM vectoriLetters dictnode iRoot vector oResults 其中 iLetters 为待分词的句子 比如 小 明 今 天 买 了 i p o n e 6 iRoot 是字典 oResults 保存输出结果 即分词的位置 也可以自己设计接口 3 收集了一些手机品牌的字典 如 iphone 诺基亚 现在要求查找包含这些手机品牌的网页 比如包含 iphone6 诺基亚 9973 等 怎么修改 FMM 实现这个功能 可以写伪代码 4 从搜狐 数据挖掘算法工程师 笔试题目看技术储备 笔试 1 类的继承 2 资源互斥下的死锁 3 一维数组 元素为指针 指针指向一个参数为 Int 返回值为 int 的函数 4 进程间的通信方式 5 Const 标志符常量一定要 6 String 的普通构造函数 拷贝构造函数 赋值函数 析构函数 7 Strcpy 函数 8 N 个不同数的全排列 打印所有全排列 9 Sizeof char name hello 10 继承的转换 子类可以转换成基类 基类不能转换成子类 多继承下同一子类的基类间 不能相互转换 5 从网易 数据挖掘研究员 笔试题目看技术储备 笔试 1 字符串匹配的算法复杂度 主串 N 字串 M N M 2 排序算法的稳定性 快速排序为非稳定 3 平衡二叉树的插入 4 20 个亿整数的两个集合 a 与 b 求 a 与 b 的交集 内存为 4Gb 5 在 N 个无序数中找 K 个最小值 6 页面文件的逻辑地址位 8 个 1024 字放内 32 帧内存里 7 计算机网络各层应用连接 8 哪一种模式不关心算法 Abstract Factory 提供一个创建一系列相关或相互依赖对象的接口 而无需指定它们具体的 类 使用得非常频繁 Adapter 将一个类的接口转换成客户希望的另外一个接口 A d a p t e r 模式使得原本由于接 口不兼容而不能一起工作的那些类可以一起工作 Bridge 将抽象部分与它的实现部分分离 使它们都可以独立地变化 Builder 将一个复杂对象的构建与它的表示分离 使得同样的构建过程可以创建不同的表示 Chain of Responsibility 为解除请求的发送者和接收者之间耦合 而使多个对象都有机会处理 这个请求 将这些对象连成一条链 并沿着这条链传递该请求 直到有一个对象处理它 Command 将一个请求封装为一个对象 从而使你可用不同的请求对客户进行参数化 对请 求排队或记录请求日志 以及支持可取消的操作 Composite 将对象组合成树形结构以表示 部分 整体 的层次结构 它使得客户对单个对象 和复合对象的使用具有一致性 Decorator 动态地给一个对象添加一些额外的职责 就扩展功能而言 它比生成子类方式更 为灵活 Facade 为子系统中的一组接口提供一个一致的界面 F a c a d e 模式定义了一个高层接口 这个接口使得这一子系统更加容易使用 Factory Method 定义一个用于创建对象的接口 让子类决定将哪一个类实例化 Factory Method 使一个类的实例化延迟到其子类 Flyweight 运用共享技术有效地支持大量细粒度的对象 Interpreter 给定一个语言 定义它的文法的一种表示 并定义一个解释器 该解释器使用该 表示来解释语言中的句子 Iterator 提供一种方法顺序访问一个聚合对象中各个元素 而又不需暴露该对象的内部表示 Mediator 用一个中介对象来封装一系列的对象交互 中介者使各对象不需要显式地相互引 用 从而使其耦合松散 而且可以独立地改变它们之间的交互 Memento 在不破坏封装性的前提下 捕获一个对象的内部状态 并在该对象之外保存这个 状态 这样以后就可将该对象恢复到保存的状态 Observer 定义对象间的一种一对多的依赖关系 以便当一个对象的状态发生改变时 所有依 赖于它的对象都得到通知并自动刷新 Prototype 用原型实例指定创建对象的种类 并且通过拷贝这个原型来创建新的对象 Proxy 为其他对象提供一个代理以控制对这个对象的访问 Singleton 保证一个类仅有一个实例 并提供一个访问它的全局访问点 State 允许一个对象在其内部状态改变时改变它的行为 对象看起来似乎修改了它所属的类 Strategy 定义一系列的算法 把它们一个个封装起来 并且使它们可相互替换 本模式使得算 法的变化可独立于使用它的客户 Template Method 定义一个操作中的算法的骨架 而将一些步骤延迟到子类中 Template Method 使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤 Visitor 表示一个作用于某对象结构中的各元素的操作 它使你可以在不改变各元素的类的 前提下定义作用于这些元素的新操作 9 数据库系统的两种语言 一种用于定义数据库模式 另一种用于表达数据的查询和更新 10 数据库的连接运算 11 建立索引的原则 在经常需要搜索的列上 可以加快搜索的速度 在作为 主键的列上 强制该列的唯一性和组 织表中数据的排列结构 在经常用在连接的列上 这些列主要是一些外键 可以加快连接的 速度 在经常需要根据范围进行搜索 的列上创建索引 因为索引已经排序 其指定的范围是 连续的 在经常需要排序的列上创建索引 因为索引已经排序 这样查询可以利用索引的排 序 加快排序查询 时间 在经常使用在 WHERE 子句中的列上面创建索引 加快条件的判断 速度 不应该创建索引的的 这些列具有下列特点 第一 对于那些在查询中很少使用或者参考的列 不应该创建索引 这是因为 既然这些列很少使用到 因此有索引或者无索引 并不能提高 查 询速度 相反 由于增加了索引 反而降低了系统的维护速度和增大了空间需求 第二 对于那些只有很少数据值的列也不应该增加索引 这是因为 由于这些列的 取值很少 例如 人事表的性别列 在查询的结果中 结果集的数据行占了表中数据行的很大比例 即需要在 表中搜索的数据行的比例很大 增加索引 并不能明显加 快检索速度 第三 对于那些定义 为 text image 和 bit 数据类型的列不应该增加索引 这是因为 这些列的数据量要么相当大 要么取值很少 第四 当修改性能远远大于检索性能时 不应该创建索 引 这是因为 修改 性能和检索性能是互相矛盾的 当增加索引时 会提高检索性能 但是会降低修改性能 当 减少索引时 会提高修改性能 降低检索性能 因 此 当修改性能远远大于检索性能时 不 应该创建索引 12 事务的定义与特点 事务隔离的级别 事务 Transaction 是并发控制的单位 是用户定义的一个操作序列 这些操作要么都做 要 么都不做 是一个不可分割的工作单位 通过事务 SQL Server 能将逻辑相关的一组操作绑 定在一起 以便服务器保持数据的完整性 事务的特性 ACID 特性 A 原子性 Atomicity 事务是数据库的逻辑工作单位 事务中包括的诸操作要么全做 要么 全不做 B 一致性 Consistency 事务执行的结果必须是使数据库从一个一致性状态变到另一个一致 性状态 一致性与原子性是密切相关的 C 隔离性 Isolation 一个事务的执行不能被其他事务干扰 D 持续性 永久性 Durability 一个事务一旦提交 它对数据库中数据的改变就应该是永久性 的 未授权读取 允许脏读取 但不允许更新丢失 授权读取 允许不可重复读取 但不允许脏读 取 可重复读取 禁止不可重复读取和脏读取 但是有时可能出现幻影数据 和序列化 事务 序列化执行 不能并发执行 13 专业题一数据挖掘的步骤 14 Pca 的概念和处理过程 主成分分析 15 K 中心点聚类算法简介 首先为每个簇随意选择一下代表对象 将剩余的对象根据其与代表对象的距离分配给最近 的一个簇 然后反复地用非代表对象来替代代表对象 以改进聚类的质量 判定一个非代表 对象 O 是否是当前一个代表对象的 O1 的好的替代 对于每一个非代表对象 p 下面的四种 情况考虑 1 p 当前属于代表 Oj 如果 Oj 被 O 代替 p 离 Oi 最近 那么 p 被重新分配给 Oi 2 p 当前属于代表 Oj 如果 Oj 被 O 代替 p 离 O 最近 那么 p 被重新分配给 O 3 p 当前属于代表 Oi 如果 Oj 被 O 代替 p 离 Oi 最近 那么 p 不变 4 p 当前属于代表 Oi 如果 Oj 被 O 代替 p 离 Oi 最近 那么 p 被重新分配给 O 16 中文分词技术简介 常用数据结构和算法 17 分类器的主流评测指标 准确率 速率 鲁棒性 可规模性和可解释性 18 如何建立一个智能问答系统 思路 19 如何建立一个智能商品推荐系统 思路 网易面试归来 还不知道结果 对于数据分析师这个职位 网上的面经很少 之前自己在网 上找面经时深感无经可取 不知道技术面什么流程 面试官主要问什么 所以这里特地留个 爪 供后生参考 作为抛砖引玉 欢迎童鞋多发帖多交流 最最最重要的是攒 rp 求祝福 攒 rp 求祝福 攒 rp 求祝福 一面 一面 女面试官 人和蔼可亲 经常笑着肯定你的说法 让人也不会太紧张 先自我介绍 然后她就 针对我的实习经历问了一些问题 问的比较详细 所以简历上做过的实习 项目一定要把流 程理顺 细节想清楚 简历问了大概二十分钟 就开始问她准备的问题 有 1 如果一个 APP 某一天的日活量异常 你怎么分析 2 如何建立预测一个 APP 的用户流失模型 可以创建哪些特征 跟面试官聊得很开心 没什么压力 感觉时间过的很快 二面 二面 等到下午才有二面 一个不苟言笑的男面试官 照例先自我介绍 然后问了简历 也比较详 细 跟一面差不多 技术问题有 1 叙述逻辑回归原理 2 有哪些分类 聚类算法 分类我说到 SVM 他就让我叙述 SVM 原理 如果数据有异常 值怎么办 其实我不太懂 SVM 只讲了一点 异常值那里也不清楚 他提示了可以用正则 化 这个我刚好熟悉他就又问了为什么要有正则化 3 数据分析有哪些步骤 你想做所有这些流程但不深入 还是专攻某一流程成为专家 我 最擅长的是哪一个步骤 4 选择网易的一款产品 说说你怎么运用数据分析提高产品的热度 我回答的有道词典 可以通过分析客户流失挽回流失客户 他说有道词典不需要登陆 问我 怎么得到用户信息 这一点我没答上来 5 如果要选择一个产品部门做分析 你会选择哪一个产品 为什么 三面 三面 等了很久才等到三面 是总监技术面 应该是一个做了很久的老员工 除了简历 主要问我 数据库的建立 维护问题 他应该对数据库很了解 他问了 你觉得数据分析师最重要的特质是什么 四面 四面 三面到四面的时间就很短了 是 HR 面 然而并不像 HR 面试 像上一轮技术面的延续 问 了我简历上的实习经历以及一些职场情景的对策 1 如果产品团队要你完成某项分析工作 又不采取你的建议怎么办 2 产品团队的人也懂数据分析 你觉得数据分析团队存在的价值是什么 会不会被取代 总结总结 1 面试整体不难 对自己要有信心 2 做好充分的准备 包括简历上的项目 实习以及里面可能会问到的一些业务细节 技术点 如 APP 分析 机器学习算法 面试公司的一些产品 不打无准备之仗 3 保持清晰的思路和敏捷的反应 在面试官解释问题时快速思考 有条理的回答 并且有意 识地突出自己的优势 4 在结束时一定要向面试官提一些有针对性的问题以表示感兴趣 如果怕想不出来可以事 先准备一些常规的问题 网易的员工都很 nice 很愿意了解你 不会刻意刁难 以真诚 实事求是的态度对待每一个 问题 呈现最真实 最优秀的自己 2015 年 8 月 19 日 阿里校招数据分析师笔试题 共计 21 题 貌似统计漏了一题 应该是单 选少了一题 凑合看吧 选择题每个人的都不一样 问答题是一样的 暂时没有答案 希望 对大家有用 单选题 1 观测宇宙中单位体积内星球的个数 属于什么分布 A 学生分布 B 泊松分布 C 正态分布 D 二项分布 2 一些关于数据挖掘说法是正确的 A 数据挖掘是万能的 B 如果你建立了一个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿产资源空间分析-洞察与解读
- 2025年蚌埠爱尔眼科医院招聘若干人模拟试卷(含答案详解)
- 2025年河北沧州南皮县中医医院公开招聘工作人员16名考前自测高频考点模拟试题附答案详解(完整版)
- 2025年金华磐安县卫健事业单位公开招聘工作人员29人考前自测高频考点模拟试题含答案详解
- 2025北京顺义区教委所属事业单位招聘131人模拟试卷及答案详解(网校专用)
- 2025年合肥市引江济淮投资有限公司招聘10人考前自测高频考点模拟试题附答案详解(完整版)
- 2025安顺市参加“第十三届贵州人才博览会”引才1453人模拟试卷及参考答案详解一套
- 班组安全培训讲话材料课件
- 2025广西能源集团有限公司社会招聘15人模拟试卷完整答案详解
- 2025年合肥滨投文化创意发展有限公司招聘3人考前自测高频考点模拟试题及答案详解(全优)
- 核对考勤工作总结
- 供应商质量管理工程师SQE培训材料课件
- 业务回款冲刺方案
- 铁路信号继电器 信号继电器电路
- 居民死亡医学证明(推断)书+空白表
- 物业工程部库房管理规定
- 奶茶店消防应急预案
- 散文集《皮囊》读书分享PPT模板下载
- GB/T 17554.1-2006识别卡测试方法第1部分:一般特性测试
- GB 17790-2008家用和类似用途空调器安装规范
- 喷砂检验报告
评论
0/150
提交评论