六西格玛管理项目三:描述性统计及图形PPT演示课件_第1页
六西格玛管理项目三:描述性统计及图形PPT演示课件_第2页
六西格玛管理项目三:描述性统计及图形PPT演示课件_第3页
六西格玛管理项目三:描述性统计及图形PPT演示课件_第4页
六西格玛管理项目三:描述性统计及图形PPT演示课件_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,质量是企业的生命线,创新让企业永葆活力,四川机电职业技术学院,六西格玛(6)管理,2,项目一:内容回顾,什么是6,为什么要导入6,6对铁运,6项目工作流程,3,3,实验目的基本达到:1.安装mintable软件,进一步熟悉软件的界面。2.学会制定数据收集计划(以从滴定管中放出25ml液体为载体)。3.学会对连续型数据进行分析处理。4.比较离散型数据和连续型数据的特点。5.学会西格玛水平的计算。(找学生现场演示),上次实验总结,4,4,数据分布的特征,5,5,数据分布的特征和测度,数据的特征和测度,分布的形状,集中趋势,离散程度,众 数,中位数,均 值,标准差,峰 度,方差,全距,偏 度,6,6,一、集中趋势,一组数据向其中心值靠拢的倾向和程度测度集中趋势就是寻找数据一般水平的代表值或中心值,7,一组计量型数据能显示以下3个特性:中心趋势 (均值,中值,众数)变异 (极差,标准差,方差)形状,描述计量型数据集,8,Mean 均值Median 中值Mode 众数Quartiles 四分值,位置测量 中心趋势,9,均值,样本均值若样本(样本量为n)的观测值为x1, x2, . . . , xn,则样本均值 为:总体均值类似地,一个有着大量但有限个(N个)观测值的总体,其总体均值 为:,10,均值的计算使用了每个观测值;每个观测值对均值都有影响。所有观测值对均值的偏差的总和为零。均值对极端的观测值很敏感, 极端值会导致均值向他偏移。,均值的特性,11,将一组观测值按大小顺序排列,位于中心的数值即为中值若观测值的个数为偶数,则中值为中间2个数值的平均若观测值的个数为奇数,则位于中心的数值即中值,中值,12,中值,样本中值假如x(1) ,x(2),. . . ,x(n)是按大小排序的样本值,则样本中值 为:中值的优点是不受极端大或极端小的观测值的影响。,n为奇数,n为偶数,13,中值与均值因为中值不象均值对极端值敏感,因此,当有极端大或极端小值时,中值比均值更能代表数据的位置。典型的例子是一个城市居民的收入中位值。,中值,14,众数是样本中出现次数最多的观测值。众数可以是唯一的,也可以有不止一个,有时并不存在众数。,众数,15,例四如果样本观测值为:6 9 13 5 8 13 4 6 13 1 10 136 9 13 5 8 13 4 6 13 1 10 6 2 5 6 134 3 7 2 6 8 1众数是什么?具有一个众数,两个众数或多于两个众数的数据分布叫什么? (单峰分布),众数,16,众数,为何使用众数?当观测值为分类式(如名义数据,序列数据)时,众数是描述数据位置的最好指标。典型的例子是,一个公司内员工收入的众数。众数的重要信息当众数不止1个时,从中抽取样本的总体通常是多个总体的混合。,17,散布的测量(变异),Range 极差Variance 方差Standard Deviation 标准差Inter-Quartile Range 四分值极差,18,样本极差为样本中最大和最小观测值之间的差别, 即r = xmax xmin极差是测量数据散布或变异的最简单的方法但它忽略了最大和最小值之间的所有信息,极差,19,试考虑以下的2个样本:10 20 50 60 70 90 和 10, 40, 40, 40, 90具有相同的极差(r = 80)。但是,第二个样本的变异只是2个极端数值的变异,而在第一个样本,中间的数值也有相当大的变异。当样本量较小(n 10)时,极差丢失信息的问题不是很严重。,极差,20,方差与标准差,若x1, x2, . . . , xn是一个具有n个观测值的样本,则样本方差为:样本标准差是样本方差的算术平方根, 即:,也认作是标准差,21,方差计算,计算下列观测值的方差。30 50 70 90 110 130,22,ixi 1 30- 502500250- 30900370-10100490101005110309006130502500= 480 6= 80= 7,000 (6 - 1)= 1,400,方差计算,480,7000,23,再考虑以下2个样本。 Sample A :10 20 50 60 70 90 Sample B :10 40 40 40 40 90,Sample A,Sample B,极差,8,0,80,方差,?,?,标准差,?,?,方差与标准差,24,方差与标准差,总体方差类似于样本方差s,用总体的所有数据计算出总体变异总体方差()。总体的标准差()是总体方差的算术平方根。对于包含N个数值的有限总体,其方差为:,25,方差计算使用了所有观测值,每个观测值对方差都有影响。方差对极端值很敏感。因平方的缘故,极端大的观测值会严重地放大方差。,方差特性,26,统计 基本统计量 显示描述性统计产生一列数据的统计量,并在会话窗或图表中显示这些统计量。使用者可以控制计算/显示哪些统计量。,Minitab中的描述性统计,27,Minitab中的描述性统计,统计 基本统计量 存储描述性统计计算一列数据的统计量,并在工作表中的相邻列显示这些统计量。使用者可以选择计算/显示哪些统计量,但不能控制其显示的顺序。,28,Minitab中的描述性统计,例:打开文件billiard.mtw。第一列有30个产品品质特性的测量值,确定其统计量。,29,统计 基本统计量 存储描述性统计,例:,Minitab中的描述性统计,30,输出结果,Minitab中的描述性统计,31,Minitab中的描述性统计,例:,统计 基本统计量 图形化汇总,32,Minitab中的描述性统计,例:,我们作何假设,数据反应什么,33,正态分布是一种具有特定的、非常有用的特性的数据分布。这些特性对我们理解所研究之流程的特性十分有用。大部分自然现象和人造流程是正态分布或可用正态分布描述。,正态分布,34,特性1:只需知道下述两项参数就可完整描述正态分布均值标准差,分布1,分布2,分布3,此三项正态分布有何区别?,正态分布,35,Number of standard deviations from the mean离均值的标准差数目,特性2 :曲线下面的面积可用来估算某一特定事件发生的累积概率,4,3,2,1,0,-,1,-,2,-,3,-,4,40%,30%,20%,10%,0%,样本值的概率,99.73%,得到在两个值之间的某个值的累积概率,95%,68%,正态曲线和概率,36,标准差的经验规则,当一组数据不是最理想正态分布时,前述累积概率规则仍可应用。比较理论(理想)正态分布和经验(现实)分布。,37,95%,99.73%,68%,-3,-2,-1,3,2,1,正态分布特点,38,鉴于许多流程输出都是呈正态分布,所以可以用正态曲线的特点预测流程对象总体。即使非正态数据也能转化为正态数据,所以正态曲线的特点仍然可以用来做预测。,正态分布,39,Minitab软件利用Anderson-Darling 检验以确定某个数据集是否可以当作正态数据处理。P数值的理解如果数据为正态的,P数值是得到特定抽样的概率。如果数据确实来自正态对象总体,P数值0.05代表得到特定抽样的机率(小于5%)。因此,如果P数值 BoxplotStat - Basic Statistics - Display Descriptive Statistics - GraphStat - ANOVA - One-way - Graph,箱图,76,在点图中,一个圆点代表一个数据点.很容易看到数据分布的位置和散布情况能判定数据是均匀分布或簇拥在一起.,6. 点图分布,77,对于小样本量(特别是 DotplotStat - Basic Statistics - Display Descriptive Statistics - GraphStat - ANOVA - One-way - Graph,6. 点图分布,79,7. 分布图,通过对一个变量的多个数据绘制图表,可描述任何过程或系统的表现 在一时间段内产品之间不同的机器、生产线等这些数据点的累计可视为数值的分布,80,7. 分布图,分布可用下列图形表示:Histograms 直方图Normal curve or other “smoothed” distributions正态曲线或其它平滑分布,81,7a. 直方图分布,将同样的数据按区间分组并注明其出现的次数,每个区间的高度是由一段时间内数据掉进区间的次数所决定的,82,7a. 直方图,Process center, distribution and shape 过程中心,分布和形状,Why Use It? 为何使用?总结在一段时间内收集的来自过程的数据,并以条图形式表达其频率分布。,83,7a. 直方图,WHAT DOES IT DO? 它能做什么?展示不同的数据值出现的相对频率。展示数据的中心、变异和形状快速了解数据的根本分布,84,7a. Histogram 直方图,WHAT DOES IT DO? 它能做什么?为过程未来的的表现提供有用的预测指出过程是否有变化协助回答问题:“过程能否满足客户的要求?”将数据以容易理解的方式表达,85,7a. Histogram (cont)直方图(续),Examples of Histogram Interpretation直方图例子,客户要求,Centering(集中趋势) 过程分布是否集中,太高或太低,Variation变异 变异是否太大,客户要求,过程在客户要求之内,过程变异过大,Process centering,Too high,Too low,86,直方图,直方图是频率分布的图形展示,可帮助我们评估数据的形状,中心和散布情况.当数据个数不少于30时,用直方图比较合适.,87,直方图,数据的总跨度被分成若干个相等的区间(区间、组、柱等)累计落入每个区间的观测值的个数,画出直方图.,88,术语纵坐标,表示观测值的频率频率,指落入每个区间的观测指的个数,用柱的高度表示 .区间/组/柱,把观测值的总跨度等分而成.众数组, 频率最高的区间.横坐标, 代表变量值,Histogram 直方图,89,对于同一组数据,使用不同的区间数会影响分布的形状.一般的情况下,优先考虑整齐的区间,分成5到15组.,Histogram 直方图,90,用Minitab制作直方图有多种方法:Graph - HistogramStat - Basic Statistics - Display Descriptive Statistics - Graph,直方图,.,91,职位安排时间,举例: 记录50个职位中的每个职位安排所需要的时间,直方图,直方图中,利用竖条将数据分类。每个竖条的高度代表每组有多少个数据。,93,点状图和直方图,哪个图最能描述出数据集的形状?形状是什么样的?,94,Basic Graphs 基础图形总结,X / Y Plots X/Y图 Pareto Charts柏拉图 Time Series时间序列 Control Charts控制图 Box Plots 方箱图Dotplots 点图 Distribution Plots 分布图 Histograms 直方图 Smoothed Distribution平滑分布图,95,上次实验总结,数据驱动决策和行动,Data,六西格玛特点之一数据驱动,语言数据,大量的数字组合成的数据,96,语言数据的收集与整理,更注重对语言资料的整理,有助于团队合作,有助于充实计划内容,有利于整理文字语言,典型案例学生作品,97,大量的数据资料的图形化,X / Y 散点图3D散点图 Time Series时间序列 Control Charts控制图 Box Plots 箱线图分布图Smoothed Distribution平滑分布图,98,资讯,学生了解任务,采集信息,教师介绍任务做什么?,决策,计划,实施,检查,评估,规划工作步骤,准备材料工具清单,学生与教师交流,步骤、工具、材料等,学生具体实施,处于幕前,完整正确准时,教师评价学生自评,项目任务:基本图形的绘制,99,要求:作图读图一、正态概率图1.请同学演示正态概率图的做法(用教师给的数据)2.现场读图3.总结图形的用途4.总结数据的类型(描述性统计),大量的数据资料的图形化,100,要求:作图读图作图基本上都没有问题,但是读图(总结数据规律)问题就比较大了二、散点图1.请同学演示散点图的做法(用教师给的数据)2.现场读图3.总结图形的用途4.拓展:其他类型散点图(教师演示),大量的数据资料的图形化,101,要求:作图读图作图基本上都没有问题,但是读图问题就比较大了三、直方图1.请同学演示直方图的做法(用教师给的数据)2.现场读图3.总结图形的用途,大量的数据资料的图形化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论