数据分析常用方法ppt课件ppt课件_第1页
数据分析常用方法ppt课件ppt课件_第2页
数据分析常用方法ppt课件ppt课件_第3页
数据分析常用方法ppt课件ppt课件_第4页
数据分析常用方法ppt课件ppt课件_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

常用的数据分析方法。2、1。了解数据、人口、样本的含义和随机抽样的一般方法;2.掌握帕累托图和因果分析图的映射方法和应用;3.掌握分层法和统计图法的应用;4.了解直方图的原理、功能、绘制方法和应用。在盲人的王国里,只有一只眼睛的人是国王。统计分析工具、报表(清单);流程图;散点图;直方图;帕累托图;控制图;因果分析图;有一些统计分析工具可供图书公司解决业务问题,它们有助于收集和分析数据,为决策提供依据。5,数据分析的第一个总结,6,1,什么是数据?数据是可以通过记录图书销售的整个过程来识别的符号。数据是整个销售过程的属性、数量、位置和联系的抽象表示。数据表达式表单,7,表达式表单1,数据列表,8、数据表达形式2、描述性分析:数据趋势按时间段、缺口变化及相应的时间背景、销售代码海洋趋势图、9,数据表达式表3,销售代码海洋结构比率,图表可以帮助我们将数据转换成信息,10、2、数据分析目的,让数据说话;行动指南;杜绝浪费;为决策提供基础。根据数据的性质,数据的分类可以概括为:定性数据。通常用于频率或频率分析。定量数据。可以量化的数值。根据数据来源,可以分为:人力资源数据;财务数据;营销数据。采购数据;仓库数据;生产数据;编辑数据。应用统计方法应遵循的原则和用数据说话的基本观点。有目的地收集数据。掌握数据来源。仔细组织数据。统计分析过程、问题的确定和分析目标的确定、科学方法的数据收集、数据及时性的调查、统计分析、分析报告的发布和解决建议、数据分析的误解、显示元素的误差1 :不应超过3、误差15.5、数据分析的误差、误差2 :时间序列数据最好使用折线图。然而,使用直方图等是不合适的。16,错误:最好不要将三维立体图用于研究数据。5.数据分析中的错误区域。17岁。错误区域4:为了避免图表的欺骗性,最好占据2/3到3/4的高度(调整Y轴刻度)。5.数据分析中的错误区域。18、第二种常用的数据分析方法,19、总计:总计,个体,个体:以及总计,也称为矩阵,都是研究对象。出版商可以把整批交付的商品称为一个整体。构成人口的基本单位,称为个体。每本书都是独立的。进货检验通常采用抽样的方法进行,即从货物中抽取总件数的一部分,检验每件的特征数据的份数是否足够,并经过统计分析后做出总体的估计和判断。样本:也称为子样本,是从群体中抽取的一些个体的集合。样本中的每个个体称为样本,样本中包含的样本数称为样本大小,也称为样本大小,通常用n表示。测量样本的特征,获得的数据称为样本值。当样本数量较大时,分析结果越接近总体值,样本对总体的代表性越好。主要有以下三种抽样方法:随机抽样、分层抽样、系统抽样、图书公司抽样、随机抽样,这意味着人口中的每个个体都有同样的机会被抽取。这种取样方法不能考虑预先取哪个样品。这完全是随机的。样本通常以抽签或随机数表的方式抽取,以确保样本的代表性。当书籍种类不多时,随机抽样是一种有效的抽样方法。抽样方法,分层抽样,分层抽样是先根据与研究内容密切相关的主要因素对人群进行分类或分层,然后按照随机原则在每一层抽取样本当更多的产品到达时,分层抽样是一种有效的抽样方法。抽样方法,系统抽样,从群体中每k个个体中选择一个个体的抽样方法,比率k是总容量n与样本容量n的比率;当出版商交付大量商品和产品时,系统抽样优于分层抽样,并且易于按一定顺序排列。1,2,KK1,k2,2K2K1,2K2,例如,3K高达N,50个个体是从1000个个体的人口中提取的。抽样的目的是通过样本反映总体。在图书公司的经营管理中,经常对测试样本数据进行整理和处理,找出它们的特点,从而推断出整体的变化规律、趋势和性质。一批数据的分布可以用数据的中心趋势和分散程度来表示。中心趋势的平均值和中值表示数据离散程度的方差、标准差和极端差异。描述人口数据离散度的参数是方差2,描述人口数据中心趋势的数是均值。如果样本参数用于近似描述总体情况,样本方差S2可用于近似替换总体方差2,样本均值X可用于近似替换总体均值p。样本的平均值,样本的中值,x=愚人节43354335433543354,x1x2x3.xn,n,中间值是按照数据大小顺序排列的中间值,中间值是X,如果n是偶数,中间两个值的平均值就是中间值;统计分析和统计表明,样本范围、样本方差和标准差、样本方差和样本标准差是衡量数据波动幅度的重要特征值。样本方差是一组数据中每个数值与平均值之差的平方和的平均值,通常记为S2;样本方差的平方根被称为样本标准差。与样本方差一样,特征值:反映了数据分散的程度。样本范围表示数据分布的范围。它指的是:R=Xmax-Xmin、29,介于数据中的最大值和最小值之间。清单在图书公司的日常管理中最强调事实管理,就是掌握事实。为了掌握事实,必须设计一个清单来收集数据。业务记录清单、分层方法和分层方法是所有方法中最基本的概念,即为了便于将来的分析,将各种数据分为不同的“类别”。在检查表、排列图、帕累托图、关键少数和次要多数中使用层次法。所谓的80/20规则。为问题收集的数据按重要性顺序记录在帕累托分析表中。公司80%的销售额来自20%的教学和辅助书籍。关于帕累托图的作用,公司有许多问题需要解决,但是我们应该从哪里开始呢?事实上,大多数问题可以通过找出几个影响因素,并加以处理和控制来解决。柏拉图根据收集到的数据,按照原因和现象对物品进行系统分类,计算出数据(如操作准确率和损失量)和每件物品的比例,然后按照大小顺序排列,加上累计值图34、产品销售帕累托图35和帕累托图的映射方法步骤,对记录在帕累托图中的数据进行分类。(2)确定数据记录的时间。(3)按项目分类进行统计。(4)计算累计频率。准备绘图纸,画出垂直和水平坐标。直方图应按频率顺序制作。根据累计比率排列曲线。记录帕累托图的标题和数据简历。例如,如果一家公司的物流中心人员出现问题,导致账面损失。记录两季教学和辅助销售期间产生的不良库存损失数据,并将不良项目汇总到下表中,37,排列图:例2,物流中心的账面损失,明细,印刷质量,污染,38,排列图:例2,明细,污染,印刷质量,39,排列图:练习,物流库存损失项目在上面的例子中,这个损失是全年损失代码的总和,然后用柏拉图的方法分析产品类别如下:帕累托图:练习,帕累托图:练习,损失,50,100,150,200,比率,66.7%,17.9%,5.1%,4.1%,6.1%,20,40,60,80,100,ABCD其他,帕累托图应用,1,使用帕累托图找出账面损失的改善(2)使用帕累托图验证改善账面损失的效果;前,100%,后,100%,实现了改进,43,应用帕累托图,3,利用帕累托图对账面损失进行分级研究;美国广播公司。44、因果图,因果图,一定有一定结果形成的原因。我们应该试着用图解法找出原因。因果图、库存损失、采购订单、出版社交货、运输、搬运、仓库储存、配送、和、和、和、和、和、和、和、和、和库存损失、技术差、粗心大意、缺乏培训、没有责任感、对策表、对策表,在使用鱼骨图确定企业问题的主要原因后,有必要采取措施消除这些原因,以达到改进的目的。这时,可以采用对策表的方法。针对业务问题的原因制定对策或措施,作为实施的依据。游戏表的目的、游戏表的格式、频率分布表、频率分布表是一种统计方法,其将分散的和不规则的数据组织成一个尺度,该尺度能够清楚地显示数据沿其测量尺度的集中趋势和分散程度。频率分布表,测量教材完全解读 100个客户订单,教材充分解释订单频率分布表,编制步骤1,1,从数据中找出最小值s和最大值l。S=11.45L升=12.35,53,频率分布表编译步骤2,2,确定组数。当n=100时,m=1 3.3lgn=16.6=7.6 8,54,在步骤3,3中编译频率分布表,并计算组距离。组距离h=3354=3354,全距离,组数,L-S,m,组距离尽可能取为10,5,1,0.5,0.1,0.05,组距离h=3354=33543354=0.11250.1,12.35-11.45,8,0.9,8,55、频率分布表编译步骤4、4,并求出极限值。在划分边界时,必须明确端点的属性,因此在确定组的边界值时,可以在每个边界值上加上或减去1/2测量单位。编制频率分布表和计算组的中值的步骤5和5。每个组的下限和上限值的平均值称为该组的组中值。编译频率分布表和计算频率的步骤6和6。属于每个组的数据数量称为频率。编译频率分布表的步骤7和7。水平坐标轴代表组距离,垂直坐标轴代表频率。绘制的矩形图称为频率直方图,简称直方图。订单编码,11 . 40511 . 50511 . 70511 . 80511 . 90512 . 00512 . 10512 . 20512 . 30512 . 405,频率,60,直方图在销售中的应用,1,判断分布类型,客户订单特征值分布,一般服从正态分布或近似正态分布。当顾客订购特征值的分布不正常时,通常是公司的营销政策不理想或教学和辅助供应能力不足。因此,由顾客订单特征值形成的直方图形状可以推断出营销策略是否稳定或供应是否充足,从而对顾客订单做出初步判断。根据频率分布正态直方图具有“中高、两边低、左右对称”的特点,其形状像一个“山”字。因此,当根据客户订单特征值的频率分布绘制的直方图正常时,可以初步判断操作过程稳定或供应能力充足。异常直方图、孤立岛直方图、双峰直方图、之字形直方图、悬崖直方图、孤立岛直方图,孤立小块出现在主直方图的左侧或右侧,像一个孤立岛。出现一个孤立的岛直方图,指示特殊事件的发生。原因可能是供应的暂时变化,或者出版商在一段时间内出现故障,或者从第三方购买商品的时间较短,等等。因此,只要找出原因,直方图就可以恢复到正常类型。双峰直方图意味着直方图中有左右两个峰,并且出现双峰直方图。这是因为观测值来自两个总体和两个分布,并且数据是混合在一起的。这通常是由列出两个季节的教具销售额引起的。锯齿形直方图的形状是凹凸的,并且像梳齿一样分开。大多数断齿直方图是由于处理数据时不合理的备料或分组不当造成的。墙式直方图从左到右不对称,并且墙式直方图的一侧类似于山墙的形状。当客户返回的特征值数据被排除在直方图之外时,墙式直方图会经常出现。此外,这也可能是操作者的工作习惯,习惯于偏离标准的下限,所以出现左侧悬崖的直方图。由于某种原因,当下限(上限)有限时,“左倾”(右倾)直方图很容易出现。平顶直方图类似于双峰直方图,因为多个总体和多个分布混合在一起。将直方图与标准进行比较,对于正态直方图,将其分布范围B=S,L(S是一批数据中的最小值,L是一批数据中的最大值)与标准范围T=S1,Su,SL是标准的下限,Su是标准的上限)进行比较,可以看出订单特征值的分布是否在标准范围内,从而知道销售过程是否处于预期状态。为了方便起见,可以在直方图上标记标准下限值和标准上限值。当直方图在标准范围内时,当补充电源特征值满足规定标准时,相应的直方图必须在标准范围内。大致有以下四种符合规定的直方图类型:当直方图在标准范围内时,直方图的分布范围b在标准范围t内,但是有余量;直方图的分布中心与标准中心大致一致,这是一个理想的直方图。此时,销售

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论