商业大数据分析与应用基础-课件 第4-7章 数据基本统计分析- 数据分析综合案例_第1页
商业大数据分析与应用基础-课件 第4-7章 数据基本统计分析- 数据分析综合案例_第2页
商业大数据分析与应用基础-课件 第4-7章 数据基本统计分析- 数据分析综合案例_第3页
商业大数据分析与应用基础-课件 第4-7章 数据基本统计分析- 数据分析综合案例_第4页
商业大数据分析与应用基础-课件 第4-7章 数据基本统计分析- 数据分析综合案例_第5页
已阅读5页,还剩229页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲:第4章数据基本统计分析数据分析指标数据分析方法目

录数据分析的实践操作

数据分析指标

1数据指标:说明总体数量特征的概念及其数值的综合。常见的数据操作包括统计、查询、分析等,其针对的数据字段,本质上都是数据指标。数据分析指标“如果你不能衡量,那么你就不能有效增长”----现代管理学之父彼得·德鲁克对企业或组织来讲,衡量即按统一标准来定义、评价业务情况,这个标准即指标(Indicator)。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的价值,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析指标数据分析离不开数据指标,数据指标贯穿数据分析过程。数据分析指标数据指标:数据分析的载体,通过数据指标实现数据分析的目标;各种维度的数据指标:数据分析的结果展现形式;数据指标结合分析方法得出新的指标,通过数据指标获得分析结论。指标维度方法数据统计分析确定分析目标→

确定数据指标→

获取数据→

生成数据指标→

分析数据指标→

得出结论数据分析指标完整的数据统计指标指标的名称,说明所反映现象数量特征的性质和内容统计的时间界限和空间范围计量单位计算方法(修饰词)指标的数值例如:截止2023年1月1日A学校在岗教职工人数;618这一天B店铺通过直播带来的利润数据分析指标数据指标的分类——按指标反映的总体现象内容及其数值表现形式总量指标:反映现象的总体规模和范围,如人口总数。相对指标:反映各部分构成及其相互之间的关系,如人口增长速度。平均指标:反映同一个总体中各个部分的一般水平和集中趋势,如平均工资、月均收入等。变异指标:反映总体各单位标志值的差异程度,如工人日产量标准差。数据分析指标数据指标的分类——按指标的作用和功能描述指标:反映总体及其组成部分的规模、水平和数量关系。评价指标:表示总体运行结果的质量好坏。监测指标:跟踪和监测总体的运行是否偏离计划目标、平衡或协调情况。预警指标:显示总体运行规律或去向,从而发出警报。数据分析指标数据指标的分类——按指标的性质和特点定性指标:非结构化的、经验性的、揭示性的、难以归类的指标,不能被计数和衡量的指标,例如:产品质量定量指标:可以被计数和衡量的指标,例如:日均浏览量、客户新增数数据分析指标相关性指标:指标之间有相关性影响但非因果关系。

例:喝酒对人的胖瘦有影响,但人的胖瘦不一定是喝酒带来的。因果性指标:指标之间为自变量与因变量的关系。例:销售额与客单价,销售额提高可导致客单价提升。数据指标的分类——按指标间的相互关系数据分析指标按通用性分:宏观指标(如PV、UV),特定指标(如某业务销售)按重要性:KPI指标(核心关键指标),普通指标,一般指标按指标组成:原子指标(不可拆分指标,如交易额),派生指标(增加了修饰词部分,如“双11通过搜索带来的交易额”)数据指标的其他分类方式不是所有的数据指标都叫指标,只有对当前业务有参考价值的指标才可称作指标。对于互联网电商而言,常见指标如下:PV(页面浏览量)用户每1次对网站中的每个网页访问(成功访问/进入)均被记录1次。用户对同一页面的多次浏览,浏览量累计。在一定统计周期内用户每次刷新网页1次也被计算1次;UV(独立访客人数)访问网站的一台电脑客户端为一个访客。统计周期内相同的客户端只被计算一次;VV(用户访问次数)当用户完成浏览并退出所有页面就算完成了一次访问,再次打开浏览时,VV数+1;跳出率表示用户来到该页面后,没有进行任何操作就直接离开的比例,代表了对客户的吸引力;数据分析指标网页基础指标退出率用户从某个页面进入网站,最终从该页面退出的比例;平均访问时长指在特定统计时间段内,浏览网站的一个页面或整个网站时,用户所停留的总时间除以该页面或整个网站的访问次数的比例;转化率在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率;回购率指用户对商品或者服务的重复购买次数(回头客)。数据分析指标网页基础指标ARPU每个用户平均收入,ARPU=总收入/用户数;新增用户新注册使用电商系统的用户,又通常分为:日新增(DNU)、周新增(WAU)、月新增(MAU),这是衡量营销推广渠道效果的最基础指标;活跃用户在特定的统计周期内,成功启动过、使用过产品的用户;活跃用户数根据不同统计周期可以分为日活跃数(DAU)、周活跃数(WAU)、月活跃数(MAU);注意同周期内用户个数不累计;留存率在某一统计时段内的新增用户数中再经过一段时间后仍启动该应用的用户比例(留存率=留存用户/新增用户*100%)。通常重点关注次日、3日、7日、30日即可,并观察留存率的衰减程度;留存率又分为:次日留存率、7日(周)留存率、30日(月)留存率等等;数据分析指标用户基础指标流失率:指那些曾经使用过产品或服务,由于各种原因不再使用产品或服务的用户,用户流失率=某段时间内不再启动/使用应用的用户/某段时间内总计的用户量,流失率和留存率有紧密关联,流失率高即留存率低,但活跃度不一定高,因此需要综合分析,也可以按周期统计流失率;一次性用户:即新增日后再也没有启动过/使用过应用的用户;在实际应用中一般认为至少超过7天时间才能够定义是否是一次性用户,即一周以上时间未使用/未登录应用。使用时长:统计时间段内,某个设备从启动应用到结束使用的总计时长;启动/登录次数:统计时间段内,用户打开/使用应用的次数;使用间隔:用户上次使用应用的时间与再次使用时间的时间差。数据分析指标用户基础指标数据指标的价值:改变行为促成目标:优化产品、优化定价、优化市场定位等数据分析指标【例】指标显示将“立刻注册”改成“免费注册”可以提升20%的转化率,那么就应该将文案优化【反例】销售员的季度奖金应该与手头上的订单数这一指标挂钩吗?可理解是比率可比较不同的时间段不同用户群体不同竞争产品简单易懂避免误导业务解释性可操作性强可以比较反映关联性本周转化率比上周高2%本周转化率为5%Sales销量?销售额?里程vs速度当前速度vs区间平均速度数据分析指标优秀的数据指标的特征

数据分析方法

2数据统计分析方法1.总量指标分析概念:反映社会经济现象在一定时间、空间条件下的总规模或总水平的综合指标,用绝对数表示。种类:总体单位总量指标和总体标志总量指标,时期总量指标和时点总量指标计量单位:实物单位,价值单位,劳动单位方法:直接计算法,间接推算法数据分析方法2.相对指标分析相对数,应用对比的方法,将两个相互联系的指标数值加以对比计算的一种比值,说明现象之间的数量对比关系。其数值表现为相对数,如比重、比例、速度、密度等。数据分析方法2.相对指标分析的作用:反映现象之间的相互联系程度,说明总体现象的质量、经济效益和经济实力情况。使原来不能直接相比的数量关系变为可比,有利于对所研究事物进行分析比较。表明事物的发展程度、内部结构以及比例关系,为人们深刻认识事物提供依据。数据分析方法3.平均指标分析概念:反映总体的一般水平的综合指标,又称平均数。特点:代表总体各单位标志值的一般水平抵消总体各个单位某一标志数值的差异分类:数值平均指标:算术平均数,调和平均数,几何平均数。位置平均指标:众数,中位数。数据分析方法4.变异指标分析概念:反映总体各单位标志值的差异程度,说明总体标志值的变异、离散程度。作用:反映变量分布的离散趋势;反映平均数的代表性,总体单位变量值的离中趋势;量度事物发展均衡性。种类:极差、平均差、标准差、方差。数据分析方法5.回归分析在分析自变量和因变量之间相关关系的基础上,建立变量之间的方程。数据分析方法5.回归分析回归的种类包括:(1)按照自变量的个数,分为一元回归分析和多元回归分析。(2)按照自变量和因变量之间的关系类型,分为线性回归分析和非线性回归分析。数据分析方法6.预测分析概念:利用科学的统计方法对事物的未来发展进行定量推测,并计算概率置信区间。方法:线性回归预测,移动平均法。数据分析方法6.预测步骤:确定变量:明确预测的具体目标。建立模型:依据自变量和因变量的统计数据进行计算,建立回归分析预测模型。计算分析:根据预测模型计算因变量结果并进行分析。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。

数据分析的实践操作

3数据分析的实践操作——Excel分析——字段列表WPS/Office——插入数据透视图和数据透视表数据分析的实践操作——Excel例:现有某公司人力资源数据,包括“各个行业职位缺口指数占比”表和“互联网行业学历占比”表,应用Excel软件完成下列分析:总量指标分析:2021和2022年各个行业职位缺口占比指数分析相对指标分析:各职位学历结构分析,各职位本科与专科月薪对比分析平均指标分析:各职位员工月薪的平均值分析,各行业职位缺口指数平均值年度变化分析变异指标分析:各职位月薪标准偏差分析数据分析的实践操作——Excel1.总量指标分析:2021和2022年各个行业职位缺口占比指数分析数据分析的实践操作——Excel2.相对指标分析——(1)各职位学历结构分析数据分析的实践操作——Excel2.相对指标分析——(2)各职位本专科学历月薪对比分析数据分析的实践操作——Excel3.平均指标分析:(1)各职位月薪均值及占比分析数据分析的实践操作——Excel3.平均指标分析:(2)各行业职位缺口指数平均值年度变化分析数据分析的实践操作——Excel4.各职位月薪标准偏差分析数据分析的实践操作——蓝鲸

销售数据统计分析工作流销售数据数据分析的实践操作——蓝鲸1.特征统计结果数据分析的实践操作——蓝鲸2.相关性分析数据分析的实践操作——蓝鲸3.特征选择

数据分析的实践操作——蓝鲸4.回归分析

数据分析的实践操作——SPSS1.描述性统计分析(分析-描述统计-描述)数据分析的实践操作——SPSS2.描述性统计分析(图形-图表构建器)数据分析的实践操作——SPSS3.对数变换(转换-计算变量)数据分析的实践操作——SPSS4.自变量与因变量箱线图(图形-图表构建器)数据分析的实践操作——SPSS4.自变量与因变量箱线图(箱线图调整)数据分析的实践操作——SPSS4.自变量与因变量箱线图(箱线图)数据分析的实践操作——SPSS5.对数线性回归分析(分析-回归-线性)注意:如果某一个变量有n个虚变量,则在“自变量”框内放入n-1个虚变量,剩下的一个虚变量做基准,如“工作经验”有7类虚变量,则只放入6类虚变量。数据分析的实践操作——SPSS创建虚变量(转换-创建虚变量)数据分析的实践操作——SPSS5.对数线性回归分析(分析-回归-线性)本例以工作经验以3-4年经验为基准,学历以本科为基准,招聘人数以招1-2人为基准,公司类型以民营公司为基准,公司规模以50-150人为基准。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果大数据专业人才的平均薪资为16711.71122元,薪资最高为104166.667元,薪资最低为2500元。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,博士学历的对数平均薪资最高,高中及以下学历的对数平均薪资最低,说明大数据专业人才薪资是受学历影响的,学历越高竞争能力越强,薪资也就越高。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,从工作经验来看,10年以上工作经验的对数平均薪资最高,1年经验的对数平均薪资最低。从公司类型来看,外资企业和创业公司的对数平均薪资较高,非营利组织的对数平均薪资最低。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果从图中可以看出,从招聘人数来看,招10-15人的对数平均薪资最高。从公司规模来看,10000人以上的对数平均薪资最高。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果由左图可以看出,调整后R2为0.422,表示自变量可以解释因变量42.2%的变化。由右图可以看出,F检验对应的P值(显著性)为0.000<0.05,表示模型显著,即在5%的显著性水平下该回归方程是有效的。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果对于对数线性模型的解读需要注意,这与普通的线性回归是不同的。它解读为“变化率”。从工作经验来看,对比有3-4年经验的员工,10年以上工作经验对数平均薪资高64.1%,有1年工作经验对数平均薪资低40.6%,有2年工作经验对数平均薪资低23.4%,有5-7年工作经验对数平均薪资高26.6%,有8-9年工作经验对数平均薪资高43.8%,无工作经验对数平均薪资低30.5%。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果在5%的显著性水平下,在控制其他因素不变的情况下:从学历来看,对比本科学历的员工,博士学历对数平均薪资高70.8%,硕士学历对数平均薪资高22.3%,大专学历对数平均薪资低23.4%,高中及以下学历对数平均薪资低65.3%。从招聘人数来看,对比招1-2人,招10-15人的对数平均薪资高11.4%,招3-5人的对数平均薪资低9.3%,招6-10人的对数平均薪资低10.4%,招若干人的对数平均薪资高1.4%。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果在5%的显著性水平下,在控制其他因素不变的情况下:从公司类型来看,对比民营公司,上市公司对数平均薪资低3.1%,事业单位对数平均薪资低26.2%,创业公司对数平均薪资高6.9%,合资公司对数平均薪资高2.6%,国企对数平均薪资低8.2%,外资公司对数平均薪资高5.7%,非营利组织对数平均薪资低28.2%。数据分析的实践操作——SPSS6.大数据专业人才薪资影响因素分析结果在5%的显著性水平下,在控制其他因素不变的情况下:从公司规模来看,对比50-100人的公司,公司规模在1000-5000人的对数平均薪资高6%,公司规模在10000人以上的对数平均薪资高14.3%,公司规模在150-500人的对数平均薪资高3.4%,公司规模在500-1000人的对数平均薪资高4.9%,公司规模在5000-10000人的对数平均薪资高8.8%,公司规模少于50人的对数平均薪资高0.7%。谢谢观看!主讲:第5章数据可视化分析数据可视化概述目

录数据可视化的实践操作

数据可视化概述

1数据可视化是将集中的数据以图形图像形式表示,并利用数据分析工具发现其中未知信息的处理过程。目的:借助于图形化手段,清晰有效地传达与沟通信息,挖掘人对可视化信息的认知能力优势,洞悉大数据背后的信息、知识与智慧。数据可视化的定义数据可视化主要从数据中寻找三个方面的信息:模式,指数据中的规律;关系:指数据之间的相关性;异常:指有问题的数据。数据可视化的定义数据可视化的作用信息传播与协同记录信息分析推理记录信息用图形的方式描述各种具体或抽象的事物是最早的可视化,这种可视化的目的就是将抽象的事物和信息记录下来。例如,古代将观察到的星象信息记录下来,用以推算历法。分析推理数据可视化极大地降低了数据理解的复杂度,有效地提升了信息认知的效率,从而有助于人们更快地分析和推理出有效信息。1854年,伦敦爆发了一场霍乱,英国医生JohnSnow绘制了一张街区地图,如右图所示,这就是著名的“伦敦鬼图”。该图分析了霍乱患者的分布与水井分布之间的关系,发现在一口井的供水范围内患者明显偏多,据此找到了霍乱爆发的根源个被污染的水泵。信息传播与协同俗话说“百闻不如一见”“一图胜千言”。一张好的可视化图可以让人留下深刻印象,更好的理解数据中的信息,进而带来更多传播流量,这对互联网时代的媒体尤为重要。唐诗宋词词云图信息传播与协同美国众议院议员当选前的职业生涯信息传播与协同数据可视化的分类A科学可视化面向自然科学如物理、化学、气象气候、航空航医学、生物学等学科。B信息可视化关注抽象、非结构化的数据集合(如文本、图表、层次结构、地图、软件、复杂系统等)。C可视分析学将可视化、人的因素和数据分析集成在一起的一种新的可视化分类。数据可视化的分类科学可视化空间标量场可视化-二维标量场-等值线数据可视化的分类信息可视化时变数据可视化-数据库CPU使用率监控-出入网bps监控-数据可视化的分类信息可视化层次与网络数据可视化数据可视化的分类可视分析学综合了图形学、数据挖掘、人机交互等技术。以可视化交互为通道,将人的感知和认知能力融入到数据处理过程,形成人脑智能和机器智能优势互补,完成有效的推理和决策。可视分析的范畴地理分析信息分析科学分析数据管理和知识表达感知与认知科学表达、作业和传播统计分析知识发现交互数据可视化的原则可视化的首要任务是准确地展示和传达数据所包含的信息。针对特定的用户对象,设计者可以根据用户的预期和需求,参考可视化设计原则进行展示设计,完成有效的可视化。颜色与透明度选择原则视图选择与交互设计原则数据到可视化的直观映射原则适当运用隐喻原则美学原则数据筛选恰当性原则数据可视化的原则数据筛选误区:信息展示越多越好,信息展示越少越好。

数据筛选恰当性原则信息展示过多,无法让用户集中关注某点,甚至无法理解哪些信息是重要信息。优先级自上而下数值型,适合用能够量化的视觉通道表示,如坐标、长度等。序列型,适合用区分度明显的视觉通道表示,比如密度、饱和度。类别型,适合用易于分组的视觉通道。数据可视化的原则

数据到可视化的直观映射原则数值型数据与可视化间的映射数据可视化的原则各月份售房量及售房金额组合图通过折线图、柱状图等方式(用位置、长度等反映数值间关系)呈现。序列型数据与可视化间的映射数据可视化的原则类别型数据与可视化间的映射数据可视化的原则数据可视化的原则

视图选择与交互设计原则视图选择针对不同的需求,确定展示不同的视图。对于简单的数据,可使用一个基本的可视化视图;对于复杂的数据,可考虑使用较为复杂的可视化视图。交互设计数据可视化系统除了视觉呈现部分,另一个核心要素是用户交互。交互的目的是让用户来操作视图和数据,从而从系统中捕获更多的信息量。选择适合体现每个月的金额占全年总金额的比重的图视觉选择交互设计导航跳转提取联动上卷下钻筛选滚动缩放拖动选择感兴趣的数据对象、区域或特征当视图显示不完整时,滚动鼠标,展示出未展示的部分改变已展示图像的分辨率,选择重点查看内容主要针对地图或其它有层级关系的维度,进行粗细粒度转换展示改变数据表中展示数据的前后顺序,或将感兴趣的信息拖至明显的位置操作一组图形的变动,可导致另外一组图形进行关联变动对选择的数据或者图形进行下载或导出、打印等操作页面信息过长,可点击对应导航按钮,跳转至对应的数据部分本页面内部弹出跳转,或者直接跳至新的页面常见的交互设计方式数据可视化的基本图表类型线图柱图饼图散点图指标看板雷达图漏斗图旋风漏斗树图来源去向矩阵树图仪表盘地图极坐标图词云堆积图双Y轴图面积图多指标折线图曲线图线图数据可视化的基本图表类型——线图样例特点:反映事物随时间或有序类别而变化的趋势,可以清晰展现数据的增减趋势、增减的速率、增减的规律、峰值等特征。柱图分组柱图堆积图百分比堆积图双Y轴柱图条形图数据可视化的基本图表类型——柱图样例特点:易于比较各组数据之间的差别,适合用于展示二维数据集,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值。饼图环图3D饼图数据可视化的基本图表类型——饼图样例特点:显示一个数据系列中各项的大小与各项总和的比例(组成成分的占比),适合用于二维数据。缺点:不适合较大的数据集展现;数据项中不能有负值;当比例接近时,人眼很难准确判别。分布聚合数据可视化的基本图表类型——散点图样例特点:显示变量间的相互关系或者影响程度,或者发现数据的分布或者聚合情况。数据可视化的基本图表类型——雷达图样例特点:将多个维度(一般四到八个)的数据量映射到起始于同一个圆心的坐标轴上,结束于圆周边缘,然后将同一组的点使用线连接起来。适合展现某个数据集的多个关键特征、关键特征和标准值的比对、比较多条数据在多个维度上的取值。适用于多维数据集。数据可视化的基本图表类型——漏斗图样例特点:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。说明:漏斗图总是开始于一个100%的数量,结束于一个较小的数量。在开始和结束之间由N个流程环节组成,每个环节用一个梯形来表示。梯形的上底宽度表示当前环节的输入情况,下底表示当前环节的输出,上底与下底之间的差表现了在当前环节业务量的减小量,当前梯形边的斜率表现了当前环节的减小率。漏斗图的所有环节的流量都应该使用同一个度量。数据可视化的基本图表类型——漏斗图样例数据可视化的基本图表类型——树图样例特点:适用于与组织结构有关的分析,即有明确的层次关系的数据。数据可视化的基本图表类型——矩阵树图样例特点:从根节点开始,空间根据相应的子节点数目被分为多个矩形,矩形的面积大小对应节点的属性。每个矩形又按照相应节点的子节点递归的进行分割,直到叶子节点为止。适合展现具有层级关系的数据,能够直观体现同级之间的比较。数据可视化的基本图表类型——来源去向图样例特点:适用于电商或与营销有关系的分析,比如分析购物网站中,哪些商品最畅销或者哪一个时间段是访问高峰。数据可视化的基本图表类型——指标看板样例特点:通过文字、数字和符号的合理排版,对数据进行一目了然的展示。由看板标签和看板指标组成,标签由维度决定,指标由数据的度量决定。适合用来展示一个维度下的一个或者多个度量,特别是对某些指标需要精确读数的场景。数据可视化的基本图表类型——仪表盘样例特点:刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。用于管理报表或报告,直观的表现出某个指标的进度或实际情况。颜色地图气泡地图数据可视化的基本图表类型——地图样例特点:使用地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分布通过颜色或者气泡映射在地图上。适合带有地理位置信息的数据集展现,展现的通常是以某个地区为单位的汇总的连续值信息。数据可视化的基本图表类型——极坐标图样例特点:由多个扇区构成的。每个扇区的标签由数据的维度决定,每个扇区长度由数据的度量决定。每个扇形的角度一样,通过半径展示变化。适用于枚举数据之间的比较,比如显示一段时间内的数据变化,或显示各项之间的比较情况。数据可视化的基本图表类型——词云图样例特点:是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。适合用于描述网站上的关键字(即标签),可以对比文字的重要程度。其本质是点图,是在相应坐标点绘制具有特定样式的文字的结果。数据可视化的基本图表类型–使用场景数据可视化的工具

入门级工具:Excel

商业智能工具:Tableau,PowerBI,QuickBI,Echarts,魔镜,蓝鲸等

编程语言工具:R语言,Python语言AI工具:酷表ChatExcel数据可视化的工具R语言可视化-直方图数据可视化的工具R语言可视化-3D饼图数据可视化的工具R语言可视化-折线图数据可视化的工具R语言可视化-箱线图数据可视化的工具Python语言可视化-折线图数据可视化的工具Python语言可视化-柱状图数据可视化的工具Python语言可视化-饼状图

数据可视化的实践操作

2数据可视化的实践操作——Excel例:某店铺双十一流量数据参见图所示。应用Excel图表对付费流量和免费流量结构进行数据可视化分析。数据可视化的实践操作——Excel计算成交转化率(成交订单数/点击量)计算投入产出比(成交额/投入成本)数据可视化的实践操作——Excel付费流量数据组合图数据可视化的实践操作——Excel免费流量数据组合图数据可视化的实践操作——Tableau例:某公司销售数据参见数据文件(供货发货表数据.xlsx),新建以下图表:(1)客户年龄段分析视图,包括产品类别和订单数量;(2)购买时间分析视图,包括各个月份汇总的利润和订单数量;(3)购买地区(省级)分析视图,包括销售额和运输成本。(4)建立仪表板数据可视化的实践操作——Tableau客户年龄段分析视图步骤1:将度量值“订单数量”拖到视图区的“列”中。步骤2:将维度“产品类别”拖到视图区的“行”中。步骤3:将维度“客户年龄段”拖到“标记”的“颜色”中。数据可视化的实践操作——Tableau购买时间分析视图步骤1:将维度的“订单日期”拖到“列”,将度量值“利润”和“订单数量”拖到“行”。步骤2:右键单击“订单数量”纵轴,选择“双轴”。数据可视化的实践操作——Tableau购买时间分析视图步骤3:将“利润”编辑区域的图形改为“条形图”,“订单数量”编辑区域的图形改为“线”。更改图表标题。数据可视化的实践操作——Tableau购买地区分析视图步骤1:把“省级”的“地理角色”设置为“省/市/自治区”。然后双击“目标省份”,并将“销售额”拖放至“颜色”。数据可视化的实践操作——Tableau购买地区分析视图步骤2:点击“地图”--“地图层”,把“背景”下的“冲蚀”设置为“100%”。然后将行上的“纬度(生成)”复制一份,并点击第二个“纬度(生成)”的下拉箭头选择“双轴”。数据可视化的实践操作——Tableau购买地区分析视图步骤3:打开“标记”卡下的“纬度(生成)(2)”,去掉“销售额”颜色标签,将“运输成本”拖到“大小”,把“省级”拖到“标签”。数据可视化的实践操作——Tableau购买地区分析视图步骤4:在“纬度(生成)(2)”中设置符号颜色。也可在“纬度(生成)”中调整地图颜色。步骤5:修改地图标题。数据可视化的实践操作——Tableau建立仪表板点击“新建仪表板”,将左侧的工作表逐个拖入仪表板中,勾选“显示仪表板标题”。右键单击仪表板标题,选择“设置标题格式”,调整标题位置。谢谢观看!主讲:第6章数据分析报告撰写什么是数据分析报告怎样撰写数据分析报告目

什么是数据分析报告

1数据分析报告是根据数据分析原理与方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决办法的一种常用分析应用文体。什么是数据分析报告数据分析报告的作用展示分析结果验证分析质量提供决策参考什么是数据分析报告数据分析报告的撰写基本原则04创新性01规范性02重要性03谨慎性什么是数据分析报告数据分析报告的种类定期分析报告综合分析报告专题分析报告

专题分析报告含义:它是指对企业的某一方面或某一个问题进行专门研究的一种数据分析报告。此报告内容单一,但分析更加深入。适用场景:为决策者制定某项政策、解决某个问题提供决策参考和依据。特点:单一性,深入性例:A公司用户流失分析;A公司提升用户消费分析什么是数据分析报告

综合分析报告含义:全面评价一个地区、单位、部门业务和其他方面发展情况的一种数据分析报告。适用场景:既可用于宏观分析,也可用作微观分析。特点:全面性,关联性例:A公司运营分析报告什么是数据分析报告

定期分析报告含义:以定期数据分析报表为依据,反映计划执行情况,并分析其影响和形成原因的一种数据分析报告。也称为日常数据通报。日常数据通报可以是专题性的,也可以是综合性的。适用场景:对绩效结果的展示,具有导向性,对决策修订或管理改进具有指导意义。特点:进度性,规范性,时效性例:A公司一季度销售情况通报什么是数据分析报告

怎样撰写数据分析报告

2数据分析报告的结构:怎样撰写数据分析报告标题:要求:标题需要高度概括该分析的主旨,一般要求精简干练,点明该分析报告的基本主题或者观点。例:A公司2021年零售数据分析A公司客户流失分析2022年度手游市场年度数据分析报告怎样撰写数据分析报告目录:代表报告整体思路,管理者通过目录就可以了解整体报告的大致内容,这样管理者在后面阅读的过程中就会有侧重地来看。怎样撰写数据分析报告标题编号形式1一级标题:1×××二级标题:1.1×××三级标题:1.1.1×××四级标题:(1)×××五级标题:

①×××。×××……标题编号形式2一级标题:一、×××二级标题:(一)×××三级标题:1、×××四级标题:1)×××五级标题:(1)×××。×××……前言:基本要求:提供数据可视化分析报告的背景以及目的。分析报告的背景:一般阐述在什么环境、条件下进行的,即分析的基础;分析报告的目的:阐述为什么要做这个分析报告,也就是分析的意义所在。例:A公司2016年零售数据分析,阐述的背景应包含当前公司的业绩,当前公司面临的竞争环境以及挑战等;分析的目的是为明年的运营工作提供参考和指导。怎样撰写数据分析报告正文:

说明具体分析过程与结果。

基本要求:说明分析是如何进行的。客观准确。数据真实有效,不能为了达到某一目的而编造数据;在用词上不能有主观意见,不能使用“大概”、“可能”等模糊词汇。篇幅适宜。不能误认为分析报告是写的越多越好。专业化分析。需要结合企业业务或者专业理论进行分析。怎样撰写数据分析报告结论:

对整个报告得出结论,是解决问题的关键,一般以综述性文字来阐述,找到分析结果里面的本质或者规律,并且结论要与可视化展现部分的内容统一,与分析的目的意义相互呼应。

结论必须实事求是,客观实际,不能脱离数据,泛泛而谈。怎样撰写数据分析报告建议:

给出相关建议,说明解决问题的关键。

应该结合企业的实际提出切实可行的建议。怎样撰写数据分析报告附录:两种情况的材料放在附录中:

报告用到的重要的原始数据。一般原始数据篇幅较大,为了保证客观以及可供查阅,宜放在附录里面。

报告用到的相关重要理论。当报告用到的相关理论较复杂时,为了保证正文的简洁,又要保证报告的完整性,可在附录提供更为详细的信息,对于了解正文有重要的补充意义。※

如有需要,可在附录之前加参考文献。怎样撰写数据分析报告数据分析报告撰写流程:怎样撰写数据分析报告数据分析报告撰写的注意事项:怎样撰写数据分析报告

结构合理,逻辑凊晰

实事求是,反映真相

用词准确,避免含糊

篇幅适宜,简洁有效

结合业务,分析合理注意格式规范尤其是图表的格式:插图的标注在图下方,插表的标注在表格的上方。数据分析报告汇报模板怎样撰写数据分析报告摘自“接地气的陈老师:7种数据分析报告写作模板”数据分析报告汇报模板——介绍型报告怎样撰写数据分析报告介绍型报告适用于向不了解情况的人做第一次汇报时使用,一般采用总分式结构,分若干个角度进行介绍。会员运营情况报告框架数据分析报告汇报模板——监控型报告怎样撰写数据分析报告监控型报告适用于向有一定了解程度的人提示业务发展态势,关键在于结合业务行动讲指标走势,内容长短视领导需求而定。业绩走势分析说明示例数据分析报告汇报模板——探索型报告怎样撰写数据分析报告探索型报告适用于向有一定了解程度的人提示下一步行动方向。一般应该包括三个部分:数据证据、结论、待讨论环节。社群活动总结论证示例数据分析报告汇报模板——诊断型报告怎样撰写数据分析报告诊断型报告适用于向已经很了解问题的人解释问题原因。最简单的诊断方法是结构分析法+指标拆解/漏斗分析法,指出哪些业务的什么环节出了问题。简单诊断示例数据分析报告汇报模板——测试型报告怎样撰写数据分析报告测试型报告适用于向已经很了解问题的人解释测试结果,常使用AB测试进行分析。真假AB测试示例数据分析报告汇报模板——预测型报告怎样撰写数据分析报告预测型报告适用于向已经很了解问题的人给出对问题的预测结果。需要提前了解听众的认知状态,包括听众是否想参与到预测过程、对未来有何担心点、有没有自己的预判等。预测型报告分析示例数据分析报告汇报模板——评估型报告怎样撰写数据分析报告评估型报告适用于向已经很了解问题的人给出对问题的综合评价结果,评估型报告涉及指标、权重和参照三大核心要素。评估各分公司绩效示例谢谢观看!主讲:第7章数据分析综合案例网店商品分析服装零售分析目

录会员RFM分析网站流量分析

服装零售分析

1一、背景与需求分析UQ为某公司服装销售的核心品牌,始创于1984年。公司作为一家服装零售业的企业,也是一家国际服装零售公司。曾首次引进大卖场式的服装销售方式,通过独特的商品策划、开发和销售体系来实现店铺运作的低成本化,由此引发了UQ的热卖潮。经过多年的经营,UQ现已成为家喻户晓的品牌。对于UQ来说,如何更好地提供顾客所喜欢的商品、如何提升商品的利润以及如何高效利用仓储空间,则是一个非常重要的企业课题。服装零售分析一、背景与需求分析主要分析问题包括:(1)整体销售情况的时间规律特点?如何优化销售时间?(2)不同产品的销售情况是怎样的?如何优化产品类型和店铺陈列?(3)用户购物具有怎样的购买偏好?如何更好地运营客户?(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析服装零售分析(1)整体销售情况的时间规律特点?如何优化销售时间?服装零售分析(1)整体销售情况的时间规律特点?如何优化销售时间?服装零售分析(1)整体销售情况的时间规律特点?如何优化销售时间?服装零售分析(2)不同产品的销售情况是怎样的?如何优化产品类型和店铺陈列?服装零售分析(2)不同产品的销售情况是怎样的?如何优化产品类型和店铺陈列?服装零售分析(2)不同产品的销售情况是怎样的?如何优化产品类型和店铺陈列?服装零售分析(3)用户购物具有怎样的购买偏好?如何更好地运营客户?服装零售分析(3)用户购物具有怎样的购买偏好?如何更好地运营客户?服装零售分析(3)用户购物具有怎样的购买偏好?如何更好地运营客户?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?服装零售分析(4)不同城市的销售情况有何特点?需要如何改进?

网店商品分析

2一、背景与需求分析ABC网店主要销售办公、家具和数码产品,经过前几年的经营和管理,积累了一些数据,店主拟对这些数据进行分析,做一个销售规划,优化资源,缩小亏本商品的投入,使店铺的销售利润实现最优化,同时也想知道哪些商品卖得好,以便加大投入,了解销售预期,同时部署货品量,不至于出现某款商品销售火爆而出现断货的情况。该网店的销售数据参见文件(网店商品数据.xlsx),店主想优化资源、做销售规划和预测,优化利润。网店商品分析一、背景与需求分析分析需求:(1)利润达到1万元的商品类别有哪些?哪些商品库存可能存在供货问题?(2)哪些商品是亏本(亏本≥4000元)销售的?相应的商品库存如何?网店商品分析1.(1)分析爆款商品网店商品分析1.(1)分析爆款商品网店商品分析1.(2)分析爆款商品及库存网店商品分析2.(1)分析亏本商品网店商品分析2.(2)分析亏本商品及库存

网店商品分析网店商品分析该网店的爆款商品主要是办公用品类的粘合剂及配件、电器等,家具产品类的椅子、办公家具等,数码电子类的办公器械、电话与通讯设备、复印传真和电脑周边等。从爆款商品与库存对比分析可知,办公器械、复印传真等爆款商品库存不足,需要做好备货,以免脱销。分析总结网店商品分析由亏本商品情况分析可知,亏本商品主要集中在家具产品类的4个商品和数码电子类的21个商品,数码电子类的S5212、S7193、S6076、S3197和家具产品类的S3283、S8337等商品是亏损额较大的商品。从亏本商品与库存对比分析结果可以看出,数码电子类的S5212、S2176、S1617、S7268等库存量较大,存在滞销的商品较多,建议采用降价、捆绑销售等手段加大促销力度。分析总结会员RFM分析

3R_S:基于最近一次交易日期计算得分,距离当前日期越近,得分越高,最近的为5分。

F_S:基于交易频率计算得分,交易频率越高,得分越高,最高的为5分。

M_S:基于交易金额计算得分,交易金额越高,得分越高,最高的为5分。

RFM分值=100×R_S+10×F_S+M_S

RFM分值最大值为555,最小值为111RFM分析过程会员RFM分析(1)数据处理在Excel中先使用TEXT函数将日期转换再导入,然后在SPSS中将其改为日期型“yyyy/mm/dd"。转换公式:TEXT(原日期,"yyyy/mm/dd")会员RFM分析(2)分析操作在SPSS中导入处理后的数据,设置销售额小数位数为2,将“销售日期”变量改为日期型“yyyy/mm/dd”,将其保存为“会员RFM分析.sav”。会员RFM分析单击“分析”菜单→“直销”→“选择技术”,在弹出的对话框中选择RFM分析,点击“继续”。会员RFM分析选择“交易数据”格式后点击“继续”。①交易数据:每次交易占用一行,关键变量为客户ID、交易日期和交易金额。②客户数据:每个客户占用一行,关键变量为客户ID、交易总金额、交易总次数和最近交易日期。会员RFM分析在对话框的变量选项卡中,分别将变量下的销售日期、销售金额和客户编号移到右边对应的框中。会员RFM分析切换至“输出”选项卡,勾选全部选项,单击“确定”按钮。会员RFM分析完成RFM分析,生成一个新的数据文件,将其保存为“分析结果.sav”会员RFM分析切换至变量视图,可看到每个变量所代表的含义。会员RFM分析3.分析结果解读RFM分箱计数:用来查看每个RFM汇总得分的客户数量分布是否均匀。会员RFM分析个案处理摘要:用来显示客户总数以及缺失值信息。会员RFM分析RFM交叉表:

将RFM分箱计数图用交叉表的形式展现出来。会员RFM分析RFM热图:

交易金额均值在R_S和F_S绘制的矩阵图上的图形化表示。颜色深浅表示交易金额均值的大小,颜色越深,说明在相应矩阵块内的客户交易金额均值越高。会员RFM分析RFM直方图:

显示最近一次交易时间、交易总次数和交易金额的频率分布,可判断各自的客户人群分布情况。横轴的排列顺序为较小的值在左边,较大的值在右边。会员RFM分析RFM散点图:查看三个指标两两之间的关系,便于指标相关性评估。会员RFM分析4.RFM分析结果应用打开“分析结果.sav”数据文件,点击“分析”菜单→描述统计→描述,在弹出的描述对话框中将左边的三项得分变量移至变量框中,单击“确定”按钮。会员RFM分析输出描述统计结果,每个客户的R_S、F_S、M_S各个数值与均值比较,小于均值,则定义为低;大于等于均值,则定义为高。会员RFM分析单击“转换”菜单→重新编码为不同变量,在弹出的对话框中,将“崭新_得分”移至“数字变量→输出变量”对话框中,在右侧输出变量名称框输入“R_S分类”,单击“变化量”按钮。会员RFM分析单击“旧值和新值”按钮,在“旧值”一侧选择“范围,从值到最高”项,在下面的框中输入前面描述统计结果中的“上次消费时间得分”的平均值3.00。在“新值”的“值”框中输入2,表示“高”。单击下方的“添加”按钮,即设置定义如果R_S≥3.00,新变量R_S分类为2。会员RFM分析在“旧值”一侧选择“所有其他值”项,在“新值”的“值”框中输入1,表示低,单击下方的添加按钮,即设置定义如果R_S<3.00,新变量“R_S分类”为1。会员RFM分析确认无误后单击“继续”按钮,返回主对话框,并单击“确定”按钮,执行重新编码操作。可看到输出结果中增加R_S分类列。会员RFM分析重复前面三步的操作,分别重新编码频率_得分F_S、消费金额_得分M_S为“F_S分类”、“M_S分类”,其平均值分别为3.04、3.01。可看到输出结果中增加F_S分类、M_S分类列。会员RFM分析R_S分类、F_S分类、M_S分类各变量均有高和低两个组别,组合在一起,可将客户分成8类,可根据下图的客户分类表(1=低;2=高)生成新变量。R_S分类F_S分类M_S分类客户类型编码客户类型2221高价值会员1222重点保持会员2123重点发展会员1124重点挽留会员2215潜力会员1216一般保持会员2117一般发展会员1118低价值会员客户分类表会员RFM分析单击“转换”菜单→“计算变量”,在“目标变量”下的方框中输入“客户分类”,在右侧的“数字表达式”下的方框中输入1,即生成客户分类=1的数据。会员RFM分析单击左下方的“如果”按钮,在弹出的对话框中选择“在个案满足条件时包括”项,在右侧的表达式框中输入“R_S分类=2&F_S分类=2&M_S分类=2”,即高价值客户的三个指标分类定义,如下图所示。会员RFM分析确认无误后,点击“继续”按钮,返回主对话框,单击“确定”按钮,即满足条件的个案,其“客户分类”的变量值为1。会员RFM分析重复前面三步的操作,修改“计算变量”对话框中“数字表达式”的输入值为“客户分类表”中的“客户类型编码值”,并在“计算变量:if个案”对话框中修改输入的表达式,直至完成8个分类的定义。会员RFM分析单击“数据”菜单→定义变量属性,在弹出的对话框中,从“变量”框中找到生成的“客户分类”变量,将其移至“要扫描的变量”框中,单击继续按钮。在中间的标签列下方,根据客户分类表中的客户类型编码数值,依次输入对应的客户类型文字标签,确认无误后单击“确定”按钮。会员RFM分析完成后,数据中每个客户都新增了一个分类标签(查看菜单→值标签)。会员RFM分析会员RFM分析最后综合考虑客户分类结果和实际情况,找到重点营销对象,两种方法:根据RFM得分≥500来判断根据“高价值客户”分类来判断会员RFM分析针对表中八种类型的会员,公司应该采取不同的营销策略,以最大程度地满足他们的需求,提高客户满意度和忠诚度,从而实现企业的营销目标。(1)高价值会员。这些会员具有高价值,是公司最重要的客户群体。公司应该为他们提供VIP服务、个性化服务、专属优惠等,以保持他们的满意度和忠诚度,同时积极寻求机会扩大他们的消费。(2)重点保持会员。这些会员虽然曾经是公司的重要客户,但最近一段时间内没有购买或者购买频率下降。公司应该尽快联系他们,了解他们的需求和问题,并提供相应的解决方案,以重新激发他们的购买热情。(3)重点发展会员。这些会员购买金额较高,但购买频率较低。公司应该关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论