商业大数据分析与应用基础-课件 第4章 数据基本统计分析_第1页
商业大数据分析与应用基础-课件 第4章 数据基本统计分析_第2页
商业大数据分析与应用基础-课件 第4章 数据基本统计分析_第3页
商业大数据分析与应用基础-课件 第4章 数据基本统计分析_第4页
商业大数据分析与应用基础-课件 第4章 数据基本统计分析_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲:第4章数据基本统计分析数据分析指标数据分析方法目

录数据分析的实践操作

数据分析指标

1数据指标:说明总体数量特征的概念及其数值的综合。常见的数据操作包括统计、查询、分析等,其针对的数据字段,本质上都是数据指标。数据分析指标“如果你不能衡量,那么你就不能有效增长”----现代管理学之父彼得·德鲁克对企业或组织来讲,衡量即按统一标准来定义、评价业务情况,这个标准即指标(Indicator)。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的价值,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析指标数据分析离不开数据指标,数据指标贯穿数据分析过程。数据分析指标数据指标:数据分析的载体,通过数据指标实现数据分析的目标;各种维度的数据指标:数据分析的结果展现形式;数据指标结合分析方法得出新的指标,通过数据指标获得分析结论。指标维度方法数据统计分析确定分析目标→

确定数据指标→

获取数据→

生成数据指标→

分析数据指标→

得出结论数据分析指标完整的数据统计指标指标的名称,说明所反映现象数量特征的性质和内容统计的时间界限和空间范围计量单位计算方法(修饰词)指标的数值例如:截止2023年1月1日A学校在岗教职工人数;618这一天B店铺通过直播带来的利润数据分析指标数据指标的分类——按指标反映的总体现象内容及其数值表现形式总量指标:反映现象的总体规模和范围,如人口总数。相对指标:反映各部分构成及其相互之间的关系,如人口增长速度。平均指标:反映同一个总体中各个部分的一般水平和集中趋势,如平均工资、月均收入等。变异指标:反映总体各单位标志值的差异程度,如工人日产量标准差。数据分析指标数据指标的分类——按指标的作用和功能描述指标:反映总体及其组成部分的规模、水平和数量关系。评价指标:表示总体运行结果的质量好坏。监测指标:跟踪和监测总体的运行是否偏离计划目标、平衡或协调情况。预警指标:显示总体运行规律或去向,从而发出警报。数据分析指标数据指标的分类——按指标的性质和特点定性指标:非结构化的、经验性的、揭示性的、难以归类的指标,不能被计数和衡量的指标,例如:产品质量定量指标:可以被计数和衡量的指标,例如:日均浏览量、客户新增数数据分析指标相关性指标:指标之间有相关性影响但非因果关系。

例:喝酒对人的胖瘦有影响,但人的胖瘦不一定是喝酒带来的。因果性指标:指标之间为自变量与因变量的关系。例:销售额与客单价,销售额提高可导致客单价提升。数据指标的分类——按指标间的相互关系数据分析指标按通用性分:宏观指标(如PV、UV),特定指标(如某业务销售)按重要性:KPI指标(核心关键指标),普通指标,一般指标按指标组成:原子指标(不可拆分指标,如交易额),派生指标(增加了修饰词部分,如“双11通过搜索带来的交易额”)数据指标的其他分类方式不是所有的数据指标都叫指标,只有对当前业务有参考价值的指标才可称作指标。对于互联网电商而言,常见指标如下:PV(页面浏览量)用户每1次对网站中的每个网页访问(成功访问/进入)均被记录1次。用户对同一页面的多次浏览,浏览量累计。在一定统计周期内用户每次刷新网页1次也被计算1次;UV(独立访客人数)访问网站的一台电脑客户端为一个访客。统计周期内相同的客户端只被计算一次;VV(用户访问次数)当用户完成浏览并退出所有页面就算完成了一次访问,再次打开浏览时,VV数+1;跳出率表示用户来到该页面后,没有进行任何操作就直接离开的比例,代表了对客户的吸引力;数据分析指标网页基础指标退出率用户从某个页面进入网站,最终从该页面退出的比例;平均访问时长指在特定统计时间段内,浏览网站的一个页面或整个网站时,用户所停留的总时间除以该页面或整个网站的访问次数的比例;转化率在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率;回购率指用户对商品或者服务的重复购买次数(回头客)。数据分析指标网页基础指标ARPU每个用户平均收入,ARPU=总收入/用户数;新增用户新注册使用电商系统的用户,又通常分为:日新增(DNU)、周新增(WAU)、月新增(MAU),这是衡量营销推广渠道效果的最基础指标;活跃用户在特定的统计周期内,成功启动过、使用过产品的用户;活跃用户数根据不同统计周期可以分为日活跃数(DAU)、周活跃数(WAU)、月活跃数(MAU);注意同周期内用户个数不累计;留存率在某一统计时段内的新增用户数中再经过一段时间后仍启动该应用的用户比例(留存率=留存用户/新增用户*100%)。通常重点关注次日、3日、7日、30日即可,并观察留存率的衰减程度;留存率又分为:次日留存率、7日(周)留存率、30日(月)留存率等等;数据分析指标用户基础指标流失率:指那些曾经使用过产品或服务,由于各种原因不再使用产品或服务的用户,用户流失率=某段时间内不再启动/使用应用的用户/某段时间内总计的用户量,流失率和留存率有紧密关联,流失率高即留存率低,但活跃度不一定高,因此需要综合分析,也可以按周期统计流失率;一次性用户:即新增日后再也没有启动过/使用过应用的用户;在实际应用中一般认为至少超过7天时间才能够定义是否是一次性用户,即一周以上时间未使用/未登录应用。使用时长:统计时间段内,某个设备从启动应用到结束使用的总计时长;启动/登录次数:统计时间段内,用户打开/使用应用的次数;使用间隔:用户上次使用应用的时间与再次使用时间的时间差。数据分析指标用户基础指标数据指标的价值:改变行为促成目标:优化产品、优化定价、优化市场定位等数据分析指标【例】指标显示将“立刻注册”改成“免费注册”可以提升20%的转化率,那么就应该将文案优化【反例】销售员的季度奖金应该与手头上的订单数这一指标挂钩吗?可理解是比率可比较不同的时间段不同用户群体不同竞争产品简单易懂避免误导业务解释性可操作性强可以比较反映关联性本周转化率比上周高2%本周转化率为5%Sales销量?销售额?里程vs速度当前速度vs区间平均速度数据分析指标优秀的数据指标的特征

数据分析方法

2数据统计分析方法1.总量指标分析概念:反映社会经济现象在一定时间、空间条件下的总规模或总水平的综合指标,用绝对数表示。种类:总体单位总量指标和总体标志总量指标,时期总量指标和时点总量指标计量单位:实物单位,价值单位,劳动单位方法:直接计算法,间接推算法数据分析方法2.相对指标分析相对数,应用对比的方法,将两个相互联系的指标数值加以对比计算的一种比值,说明现象之间的数量对比关系。其数值表现为相对数,如比重、比例、速度、密度等。数据分析方法2.相对指标分析的作用:反映现象之间的相互联系程度,说明总体现象的质量、经济效益和经济实力情况。使原来不能直接相比的数量关系变为可比,有利于对所研究事物进行分析比较。表明事物的发展程度、内部结构以及比例关系,为人们深刻认识事物提供依据。数据分析方法3.平均指标分析概念:反映总体的一般水平的综合指标,又称平均数。特点:代表总体各单位标志值的一般水平抵消总体各个单位某一标志数值的差异分类:数值平均指标:算术平均数,调和平均数,几何平均数。位置平均指标:众数,中位数。数据分析方法4.变异指标分析概念:反映总体各单位标志值的差异程度,说明总体标志值的变异、离散程度。作用:反映变量分布的离散趋势;反映平均数的代表性,总体单位变量值的离中趋势;量度事物发展均衡性。种类:极差、平均差、标准差、方差。数据分析方法5.回归分析在分析自变量和因变量之间相关关系的基础上,建立变量之间的方程。数据分析方法5.回归分析回归的种类包括:(1)按照自变量的个数,分为一元回归分析和多元回归分析。(2)按照自变量和因变量之间的关系类型,分为线性回归分析和非线性回归分析。数据分析方法6.预测分析概念:利用科学的统计方法对事物的未来发展进行定量推测,并计算概率置信区间。方法:线性回归预测,移动平均法。数据分析方法6.预测步骤:确定变量:明确预测的具体目标。建立模型:依据自变量和因变量的统计数据进行计算,建立回归分析预测模型。计算分析:根据预测模型计算因变量结果并进行分析。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。

数据分析的实践操作

3数据分析的实践操作——Excel分析——字段列表WPS/Office——插入数据透视图和数据透视表数据分析的实践操作——Excel例:现有某公司人力资源数据,包括“各个行业职位缺口指数占比”表和“互联网行业学历占比”表,应用Excel软件完成下列分析:总量指标分析:2021和2022年各个行业职位缺口占比指数分析相对指标分析:各职位学历结构分析,各职位本科与专科月薪对比分析平均指标分析:各职位员工月薪的平均值分析,各行业职位缺口指数平均值年度变化分析变异指标分析:各职位月薪标准偏差分析数据分析的实践操作——Excel1.总量指标分析:2021和2022年各个行业职位缺口占比指数分析数据分析的实践操作——Excel2.相对指标分析——(1)各职位学历结构分析数据分析的实践操作——Excel2.相对指标分析——(2)各职位本专科学历月薪对比分析数据分析的实践操作——Excel3.平均指标分析:(1)各职位月薪均值及占比分析数据分析的实践操作——Excel3.平均指标分析:(2)各行业职位缺口指数平均值年度变化分析数据分析的实践操作——Excel4.各职位月薪标准偏差分析数据分析的实践操作——蓝鲸

销售数据统计分析工作流销售数据数据分析的实践操作——蓝鲸1.特征统计结果数据分析的实践操作——蓝鲸2.相关性分析数据分析的实践操作——蓝鲸3.特征选择

数据分析的实践操作——蓝鲸4.回归分析

数据分析的实践操作——SPSS1.描述性统计分析(分析-描述统计-描述)数据分析的实践操作——SPSS2.描述性统计分析(图形-图表构建器)数据分析的实践操作——SPSS3.对数变换(转换-计算变量)数据分析的实践操作——SPSS4.自变量与因变量箱线图(图形-图表构建器)数据分析的实践操作——SPSS4.自变量与因变量箱线图(箱线图调整)数据分析的实践操作——SPSS4.自变量与因变量箱线图(箱线图)数据分析的实践操作——SPSS5.对数线性回归分析(分析-回归-线性)注意:如果某一个变量有n个虚变量,则在“自变量”框内放入n-1个虚变量,剩下的一个虚变量做基准,如“工作经验”有7类虚变量,则只放入6类虚变量。数据分析的实践操作——SPSS创建虚变量(转换-创建虚变量)数据分析的实践操作——SPSS5.对数线性回归分析(分析-回归-线性)本例以工作经验以3-4年经验为基准,学历以本科为基准,招聘人数以招1-2人为基准,公司类型以民营公司为基准,公司规模以50-150人为基准。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果大数据专业人才的平均薪资为16711.71122元,薪资最高为104166.667元,薪资最低为2500元。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,博士学历的对数平均薪资最高,高中及以下学历的对数平均薪资最低,说明大数据专业人才薪资是受学历影响的,学历越高竞争能力越强,薪资也就越高。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,从工作经验来看,10年以上工作经验的对数平均薪资最高,1年经验的对数平均薪资最低。从公司类型来看,外资企业和创业公司的对数平均薪资较高,非营利组织的对数平均薪资最低。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,从招聘人数来看,招10-15人的对数平均薪资最高。从公司规模来看,10000人以上的对数平均薪资最高。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果由左图可以看出,调整后R2为0.422,表示自变量可以解释因变量42.2%的变化。由右图可以看出,F检验对应的P值(显著性)为0.000<0.05,表示模型显著,即在5%的显著性水平下该回归方程是有效的。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果对于对数线性模型的解读需要注意,这与普通的线性回归是不同的。它解读为“变化率”。从工作经验来看,对比有3-4年经验的员工,10年以上工作经验对数平均薪资高64.1%,有1年工作经验对数平均薪资低40.6%,有2年工作经验对数平均薪资低23.4%,有5-7年工作经验对数平均薪资高26.6%,有8-9年工作经验对数平均薪资高43.8%,无工作经验对数平均薪资低30.5%。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果在5%的显著性水平下,在控制其他因素不变的情况下:从学历来看,对比本科学历的员工,博士学历对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论