




已阅读5页,还剩17页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
本周导读(第1页/共1页)我的作业目录模式笔记模式这一周,我们正式进入统计基础的学习。统计知识是数据分析师的核心功底,只有学好了统计才谈得上是数据分析,因此这一部分的知识是无疑非常重要的。课程示例数据:共享单车调研数据 - 统计示例数据.zip学完本章,你将会收获 理解统计知识/统计思维在数据分析师的工作及在更广阔的日常生活中的重要作用; 理解概率的基本概念,并且了解常见的概率分布; 掌握常用基本统计量的计算方式,并且能够用基本统计量解决业务问题; 了解中心极限定理的原理; 掌握假设检验的思路及数学计算,并且能利用单样品假设检验的方法解决真实业务问题; 掌握 A/B测试 的原理及数学计算,并且能利用A/B测试的方法解决真实的业务问题;1.1 统计知识的力量(第1页/共1页)我的作业目录模式笔记模式统计是数据分析师的核心能力项,无疑非常重要。但不得不说,统计的重要性不限于此。统计学渗透到生活的各个方面,学好统计可以帮助我们正确识别因果关系、避免推理中的常见错误、做出更加正确的决策等,对个体来说,统计思维是认识世界一个有力的工具。1.2 课程内容总览(第1页/共1页)我的作业目录模式笔记模式也许你会有这样的困惑:数据分析师都需要哪些统计知识?不同阶段的数据分析师需要哪些不同的统计知识?描述性统计和推断统计之间的关系是什么?统计和机器学习之间的关系又是什么?在学习具体的知识点之前,让我们花一点时间先来澄清这些重要的问题,打消同学们心中可能有的困惑为后续的学习打下比较坚实的基础。2.1 案例介绍(第1页/共1页)我的作业目录模式笔记模式这一节,我们将为大家介绍一个 共享单车 的案例。这个案例将会作为线索贯穿统计这一章的始终,我们会不断利用案例辅助讲解,帮助大家更好理解学习到的知识点。学完本节后,重点需要大家理解:1. 数据信息:每一列数据代表什么2. 推荐者:什么情况下,一个用户被认为是推荐者3.1 什么是概率(第1页/共1页)我的作业目录模式笔记模式学习统计知识,从概率分布开始。而学习概率分布,我们则从概率这个概念开始。本节,我们将重点介绍三个内容:1. 概率的定义与大数定律2. 条件概率3. 独立事件学完之后,相信你对 概率 能有个更清晰的认识。视频问题反馈测试一下【单选题】已知某用户进入到三节课官网后,购买产品类课程的概率是60%,购买运营类课程的概率是70%,用户同时购买这两门课程的概率是15%。现在某个用户已经购买了产品类课程,那么他还会购买运营类课程的概率是A18%B25%C42%D70%提交答案测试一下【单选题】数据分析师大卫在一天之内连续面试了四家规模和所在行业都不同的公司,假设这四次面试的结果互为独立事件,互不影响。如果他面试每一家企业通过的概率都相等,为60%,那么他至少被一家企业录用的概率是A97.44%B2.56%C12.96%D87.04%提交答案3.2 概率分布(第1页/共1页)我的作业目录模式笔记模式在这一节内,我们会分别介绍离散随机变量和连续随机变量的概率分布以及分别用什么样的数学形式来表示这两类变量的概率分布。学完本节后,重点需要大家理解1. 什么是概率分布2. 离散型随机变量的概率分布如何表示3. 连续型随机变量的概率分布如何表示3.3 概率分布举例(第1页/共1页)我的作业目录模式笔记模式本节是概率分布的最后一节,我们给大家列举了一些常见的概率分布形式,包括了: 正态分布 二项式分布 连续型均匀分布 泊松分布 f分布值得大家注意的一点是,观察数据分布是数据分析师经常做的工作,而概率分布只是各种分布中的一种,换言之,概率分布只是数据分布的一个子集,大家也不要将两者相混淆。4.1 方差与标准方差(第1页/共1页)我的作业目录模式笔记模式恭喜大家完成了概率分布的学习,下面我们正式进入基本统计量这一部分的学习。相信大家还记得在导论一章中,我们学习过平均数、中位数、众数这样几个统计量,这一章我们来学习方差与标准方差。视频问题反馈测试一下【单选题】现有样本容量为10的共享单车满意度调查的抽样样本数据,请计算该样本的用户满意度分数的方差及标准方差A3.82,1.95B4.2,2.05C4.67,2.16D5.25,2.29提交答案4.2 四分位数与百分位数(第1页/共1页)我的作业目录模式笔记模式四分位数与百分位数无论是在工作中还是在日常生活中都有非常广泛的应用。数据分析师经常通过观看重要的百分位数,例如第20、40、60、80百分位数来了解数据的分布情况。同时利用百分位数来预测异常值也是非常常见的手段。4.3 提升度和杠杆量(第1页/共1页)我的作业目录模式笔记模式假设你的老板突然问你这样一个问题:一个人的年龄和他购买线上课程的关联性有多大?你是否会一时有些困惑,这种关联性也能测量吗?如果能,要如何测量呢?本节,我们就将讲授这样两个测量事件关联性的统计量 提升度 和 杠杆量。视频问题反馈测试一下【单选题】某线下活动上,数据分析师大卫做了一个样本量为500的抽样调查,并且得到一份数据。根据数据推算得出,受访对象的年龄在25岁以下的概率是30%,我们定义为事件A,受访对象是短视频产品的重度用户的概率是14%,我们定义为事件B,这两个事件同时发生的概率2%。请问事件A对B的提升度是多少?A85%B158%C47.6%D13%提交答案5.1 中心极限定理和正态分布(第1页/共1页)我的作业目录模式笔记模式中心极限定理是统计学中非常重要的一个定理。在数据分析中,我们往往不能得到全部数据,我们的分析要依靠抽样的样本数据来实现。而中心极限定理在理论上保证了我们可以用只抽样一部分的方法,达到推测研究对象统计参数的目的。视频问题反馈课间思考作业理解中心极限定理:某学校体育部的60名同学分别独立随机抽取了本校200名学生,并询问他们的运动时间。请同学叙述一下,这60名同学所得到的数据是怎么遵循中心极限定理的。已知:全校所有同学运动时长成一个双峰的分布,其中第一个高峰在0.5h,第二个高峰在2h,总体分布的平均值为1.3h,标准方差为0.8。我的回答6.1 假设检验的思路(第1页/共1页)我的作业目录模式笔记模式假设检验是数据分析工作中非常常用的统计知识,我们可以将假设检验分为单样品假设检验和双样品假设检验(A/B测试)。在本节中,同学需要重点理解假设检验的思路和计算步骤。在本门课程中不涉及更多的理论讲解。视频问题反馈在案例中我们的实际观测结果是一个真实发生的情况,就类似于抽样结果是一个真实发生的情况。在假设 原假设成立 的情况下,如果我们推算出 出现实际观测结果的可能是如此之小(小于或等于5%),或者说实际观测结果是一个如此极端的事件,那么我们就不再相信原假设本身; 出现实际观测结果的可能性较大(大于5%),那么就无法推翻原假设;6.2 假设检验的步骤(第1页/共1页)我的作业目录模式笔记模式这一节我们正式进入到假设检验计算步骤的学习。本节会用到一些公式,下面我们把公式中的符号和它代表的统计量陈列如下,方便大家随时查看:P值线上计算器链接:P值线上计算器视频问题反馈测试一下【单选题】下列哪些情况适合使用单样本假设检验的方式来解决问题?A本周的日访问用户的数据相较于上周提升了3%,这个数据是否是自然增长B北京和上海数据分析师的薪资平均值是否有明显差异C小红书上男性用户和女性用户在消费频次上是否有显著差异D公司的新功能上线平均能提升2%的点击,本次活动提升5%,本次活动效果是否真的高于以往提交答案7.1 A/B测试的思路(第1页/共1页)我的作业目录模式笔记模式在数据分析师的日常工作中,双样品将设检验经常被应用于做 A/B 测试。A/B 测试 有着非常广泛的应用,能够科学有效的检验某一特征变化产生的效果。在这一节中,我们将学习:1. 什么样的场景下适合用 A/B 测试来解决问题2. A/B测试 的思路7.2 A/B测试的步骤(第1页/共1页)我的作业目录模式笔记模式理解了 A/B测试 的思路之后,这一节我们来学习 A/B 测试 的计算过程。仍然是利用共享单车满意分的案例,让我们看看如何通过一步一步的计算,得出最终的结论。视频问题反馈课间思考作业理解P值的含义:某互联网网站做了一个 A/B测试,检验一个新功能的上线会不会增加用户对某个按钮的点击量。该网站今天共收集了4000组用户数据,其中实验组和对照组各2000组数据。得到数据后,我们选用右侧检验的方式对问题进行分析。原假设H0:新功能的上线对点击量没有影响;备择假设H1:新功能的上线会增加点击量;根据数据显示新功能上线后点击率在原有水平上提升了2%。经计算此次 A/B测试 的P-value=0.03。请用一句话描述P-value=0.03所代表的含义。我的回答7.3 A/B测试的工作流程(第1页/共1页)我的作业目录模式笔记模式也许大家已经注意到,之前课程中所讲到的 A/B测试,主要围绕着拿到测试数据之后的计算展开。事实上,这是 A/B测试 流程中的一个环节。本节将向大家介绍一个完整的 A/B测试 工作流程是怎么样的,希望帮助大家在更为宏观的角度上理解 A/B测试。视频问题反馈对 A/B 测试 感兴趣的同学可以看一下限免课推荐:硅谷科技公司都是这样做A/B测试的,(点击即可报名)。课程介绍很多同学都了解过A/B测试,在实操中你是否也会以下疑问呢:1. 在公司里A/B测试究竟是如何实现的呢?2. 硅谷科技公司非常重视A/B测试原因是什么呢?3. 如何设计一场成功的A/B测试?4. A/B测试的成功指标怎么定义呢?5. 实验出现问题时如何改进呢?6. 如何跑通整个实验并推动业务发展呢?7. .在这门课中,高晟老师将通过Airbnb的A/B测试实例解答同学们的疑问。高晟老师根据在硅谷多年实操经验总结出A/B测试流程,并且带着同学们逐步分析每一流程。课程部分PPT本周总结(第1页/共1页)我的作业目录模式笔记模式恭喜你学完了统计基础这一章的内容,下面我们简单回顾一下这一周的内容吧!视频问题反馈我们将本周学习内容梳理成这样一种结构来帮助大家理解本周课程。统计学中名词和概念繁多且复杂,这里给同学准备了课程中老师所有讲过的名词的汇总及举例,希望能够帮助同学了概念,掌握这些概念:统计基础名词汇总本周书籍推荐赤裸裸的统计学女士品茶写给所有人的极简统计学白话统计深入浅出统计学限免课推荐:硅谷科技公司都是这样做A/B测试的,(点击即可报名)。作业四假设检验(第1页/共1页)我的作业目录模式笔记模式A/B测试 是统计学中双样品假设检验常见的应用之一,本周大作业是希望同学们利用双样品假设检验的方法完成 A/B测试 的设计和计算。课间思考作业作业一:Z检验某共享单车公司想通过给用户发红包来提升用户满意分数。数据部门打算做一次A/B测试 随机抽取部分用户发放红包,来看发红包是否能提升用户满意分数。请数据分析师设计一场 A/B测试来看 发红包这项措施对提升满意分数是否有显著影响。某共享单车公司服务满意分数据:假设检验-Z检验.zip由于本次受访用户(样本量)30,数据分析师认为可以选择Z检验来完成本次分析。请同学在下载作业数据,利用Z检验来判断发红包对提升用户满意分是否有显著影响。请写出本次 A/B测试 的计算步骤。计算步骤提示:步骤1:选择原假设H0和备择假设H1步骤2:计算Z值步骤3:计算P值(P value)步骤4:比较P值和显著性水平(选择0.05)得出结论Z值计算公式:Z检验P值计算网站:P值线上计算器我的回答写作业在课程中,我们所学习的假设检验方法是Z检验,适用于样本量大于30的情况。在作业中需要同学们利用T检验来解决问题。首先为大家介绍T检验以及Z检验的区别和联系、T检验重要参数的计算公式:统计基础-T-检验.pdf请同学通过文档学习T检验和Z检验的区别和计算方法完成下方本周作业二。课间思考作业作业二:T检验某共享单车公司近期做了一次 A/B测试 ,随机抽取部分新用户收取押金。公司高层想了解 收押金这项措施对西城区用户满意分数是否有显著影响,请数据分析师以西城区用户为测试对象设计一场 A/B测试来看 收押金这项措施对西城区用户满意分数是否有显著影响。某共享单车公司服务满意分数据:假设检验-T检验.z
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 培训房屋销售代表
- 装修管理流程图
- 固定资产会计年终总结
- 江苏省镇江市部分学校2026届九上化学期中经典模拟试题含解析
- 湖北省襄阳市枣阳实验中学2026届化学九上期中质量检测试题含解析
- 2026届山东省滕州市业水平考试数(基础卷)九年级化学第一学期期中达标测试试题含解析
- 商场内员工培训
- 河南省商丘市虞城县2026届九年级英语第一学期期末综合测试模拟试题含解析
- 幼儿园教师年底工作总结
- 年会展部工作总结
- 排水管道工程施工组织设计
- 客服岗位职责培训
- 高一下学期《学生宿舍卫生和内务》主题班会课件
- 露营基地管理制度调查
- 食品防护知识培训
- 格拉斯哥(GCS)昏迷评估量表(详xi操作)
- 2025年北京中考英语阅读考纲外高频词汇(复习必背)
- 电网工程设备材料信息参考价(2024年第四季度)
- 数据中心运维服务投标方案(技术标)
- 公安情报干部培训授课
- GB/T 44988-2024过程工业安全仪表系统在线监视要求
评论
0/150
提交评论