《常用统计技术》PPT课件.ppt_第1页
《常用统计技术》PPT课件.ppt_第2页
《常用统计技术》PPT课件.ppt_第3页
《常用统计技术》PPT课件.ppt_第4页
《常用统计技术》PPT课件.ppt_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章 常用统计技术,第一节 统计方法基础知识 第二节 方差分析 第三节 正交实验设计 第四节 相关和回归分析,Quality Control- QC Quality Improvement-QI Quality Management-QM Quality Engineering -QE 质量数据的特点: 不确定性、随机性、波动性、变异性; 确定统计规律、分布特征,统计学(Statistics) 统计学是通过研究数据(资料),包括数据的产生、收集、整理、描述、分析和推断,发现新知识和有用的信息,从而对所研究的问题给出解答和说明的一门学科。统计学任务: 统计方法(statistical methods ) 统计方法是指统计学中关于数据的产生、收集、整理、描述、分析和推断等方面所采用的方法。 (1)思考性方法(thinking methods,情理型方法或非定量统计方法) (2)描述性统计(descriptive statistics ),数理统计方法或定量统计方法):描述统计这一术语是概括并表示定量数据,以显示数据分布特性的方法。,统计技术(Statistical Technology for Quality) 统计技术是指运用统计学的方法原理,通过获取和提炼信息,高效益地解决实际问题的一门通用技术。 因此,统计方法的应用就是统计技术,它是统计方法成功实践的经验积累,是一门技术。 to collect informationto arrangement & to process data to reduce & refine information statistically to analysis & to operate statistically to infer & to predict, to control 采集信息 整理、加工数据提炼和精练信息统计分析和运算统计推断和预测 统计控制,统计技术按用途分为:,(1)统计推断:依据样本提供的信息,通过统计计算和分析,对事物进行预测和推断。例如参数估计、假设检验、方差分析等。,(2)统计控制:依据样本提供的信息,通过统计计算和分析,认识事物发展的现状、预测事物发展的趋势,并采取措施对过程实施有效的控制。例如过程能力分析,控制图等。,统计技术应用的场合可以是:,(1)获取信息:通过科学地进行观测、调查或试验,从而经济有效地获取数据资料;,(2)提炼信息:运用所获得的数据资料,用统计分析方法对实际问题的规律性及其因果关系进行科学地分析和推断。,第一节 统计方法基础知识,一、 统计方法及其用途 二、 产品质量的波动 三、 质量特性数据及其分类 四、 质量特性数据的采集 (一)总体和个体 (二)数据的采集随机抽样方法 五、 统计特征数 六、质量特性数据的分布特点和分布规律,一、 统计方法及其用途,1、什么是统计方法 2、统计方法的性质 3、统计方法的用途,1、什么是统计方法,统计方法:是指有关收集、整理、分析和解释统计数据,并对其所反映的问题作出一定结论的方法。包括: 统计调查,信息采集数据整理统计分析统计推断,描述性统计方法: 是对统计数据进行整理和描述的方法; 常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等。,推断性统计方法: 是在对统计数据描述的基础上,进一步对其所反映的问题进行分析、解释和作出推断性结论的方法; 思考性统计方法(thinking methods,情理型方法或非定量统计方法),2、统计方法的性质,1. 描述性 利用统计方法对统计数据进行整理和描述,以便展示统计数据的的规律; 统计数据可用数量值加以度量,如平均数、中位数、级差和标准差等,亦可用统计图表予以显示,如条形图、折线图、圆形图、频数直方图、频数曲线等。 2、规律性 定量分析、从不确定中发现统计规律,找出趋势和倾向。特别注意异常波动的发生。,3、推断性 统计方法都要通过详细研究样本来达到了解、推测总体状况的目的,因此它具有由局部推断整体的性质。,4 、 风险性 统计方法既然要推断用部分整体,那么这种由推断而得出的结论就不会是百分之百正确,即可能有错误。犯错误就要担风险。,两类错误和风险,第一类错误(弃真错误):把质量好的一批成品当作质量坏的一批成品去看待、处理的错误;,:第一类错误的概率值,也叫第一类错误的风险率。,第二类错误(取伪错误):把质量坏的一批成品当作质量好的一批成品去看待、处理的错误;,:第二类错误的概率值,也叫第二类错误的风险率。,返回目录,3、统计方法的用途,1. 提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差) 2. 比较两事物的差异;(假设检验、显著性检验、方差分析、水平对比法) 3. 分析影响事物变化的因素; (因果图、调查表、散布图、分层法、树图、方差分析) 4. 分析事物之间的相互关系; (散布图、试验设计法) 5. 研究取样和试验方法,确定合理的试验方案;(抽样方法、抽样检验、试验设计、可靠性试验) 6. 发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图) 7. 描述质量形成过程。(流程图、控制图),1、正常波动 2、异常波动,chance causes of variation, assignable causes of variation,1、正常波动,正常波动是由随机原因引起的产品质量波动; 仅有正常波动的生产过程称为处于统计控制状态,简称为控制状态或稳定状态。,2、异常波动 异常波动是由系统原因引起的产品质量波动; 有异常波动的生产过程称为处于非统计控制状态,简称为失控状态或不稳定状态。,引起产品波动的原因主要来自六个方面(5 M1E ): 人(Man) :操作者的质量意识、技术水平、文化素养、熟练程度、身体素质等 ; 机器(Machine):机器设备、工夹具的精度、维护保养状况等; 材料(Material):材料的化学成分、物理性能和外观质量等; 方法(Method):加工工艺、操作规程和作业指导书的正确程度等; 测量(Measure):测量设备、试验手段和测试方法等; 环境(Environment):工作场地的温度、湿度、含尘度、照明、噪声、震动等;,3、波动的原因,三、 质量特性数据及其分类,质量特性数据: 定量分析是现代质量管理中的基本特征之一。为了进行定量 分析,就必须有数据描述产品质量特性的数值和信息。 检测产品质量特性的结果,用数值记录下来。 质量特性数据分为: 1、计量数据Variables Data 2、计数数据Attributes Data .又分为计点和计件,1、计量数据Variables Data,凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据。如:长度 L=1.55m、噪声 n=52.3 电流 I=3.2A 还有容积 、直径质量、化学成分、温度、产量、职工工资总额等。,计量数据一般服从正态分布。,continuous measurements,2、计数数据- Attributes Data discrete data, often in the form of counts.,凡是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3等自然数的这类数据。,计数数据还可细分为计件数据和计点数据。 计件数据是指按件计数的数据,如不合格品数、彩色电视机台数、质量检测项目数等; 计点数据是指按缺陷点(项)计数的数据,如疵点数 2个/cm2、砂眼数4个/cm2、气泡数、单位(产品)缺陷数等。,计件数据一般服从二项式分布,计点数据一般服从泊松分布。,当数据以百分率表示时,要判断它是计量数据还是计数数据,应取决于给出数据的计算公式的分子。,四、质量特性数据的采集 (一)总体与样本 统计学任务: 1、研究总体的分布是什么? 2、这个总体的均值、方差是多少?,总体(母体):是指在某一次统计分析中研究对象的全体。,个体:组成总体的每个单元(产品)叫做个体。,有限总体:被研究对象是有限的,如一批产品的总数;,无限总体:被研究对象是无限的,如某个企业、某个生产 过程从 前、现在、将来生产的全部产品。,总体含量(总体大小):总体中所含的个体数,常用N表示。,(一) 总体与样本,样本(子样):是指从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(产品);样本是由1个或若干个样品组成的。,样本容量(样本大小):样本中所含的样品数目,常用n表示。,抽样:是指从总体中随机抽取样品组成样本的活动过程。,随机抽样:是指要使总体中的每一个个体(产品)都有同等机会被抽取出来组成样本的活动过程。,(一) 总体与样本,数据、样本和总体的关系,无限总体,有限总体,工序,一批 产品,一批 半成品,样本,样本,数据,数据,判断,判断,(二) 随机抽样方法,1、简单随机抽样法 2、系统抽样法 3、分层抽样法 4、整群抽样法,1、简单随机抽样法,又叫随机抽样法,是指总体中的每个个体被抽到的机会是相同的。,优点:抽样误差小,缺点:抽样手续比较繁杂。,2、系统抽样法,又叫等距抽样法或机械抽样法。,优点:操作简便,实施不易出差错。,缺点:容易出较大偏差。,适用场合:总体发生周期性变化的场合,不宜使用这种方法。,3、分层抽样法,也叫类型抽样法。它是从一个可以分成不同于总体的总体(或称为层)中,按规定的比例从不同层中随机抽取样品(个体)的方法。,优点:样本的代表性比较好,抽样误差比较小。,缺点:抽样手续较简单随机抽样还要繁杂。,适用场合:常用于产品质量验收。,4、整群抽样法,又叫集团抽样法。是将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽取若干群,并由这些群中的所有个体组成样本。,优点:抽样实施方便。,缺点:代表性差,抽样误差大。,适用场合:常用在工序控制中。,案例,某种成品零件分装在20个零件箱装,每箱各装50个,总共是1000个。如果想从中取100个零件作为样本进行测试研究。,简单随机抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法从中抽出编号毫无规律的100个零件组成样本。,系统抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法先决定起始编号,按相同的尾数抽取100个零件组成样本。,分层抽样:20箱零件,每箱都随机抽取5个零件,共100个组成样本。,整群抽样:先从20箱零件随机抽出2箱,该2箱零件组成样本。,五、 统计特征数,(一)样本平均值 (二)样本中位数 (三)样本方差 (四)样本标准偏差 (五)样本极差,表示数据的集中位置,表示数据的离散程度,Numerical Summary of Data,Important summary statistics for a distribution of data can include: Sample mean, (平均值) Sample variance, s2 (样本 方差 ) Sample standard deviation, s ,(标准差) Sample median, ( 中位值) Mode (众数),(一)样本平均值,如果从总体中抽取一个样本,得到一批数据X 1,X 2,X 3.X n,则样本的平均值 :,:样本的算术平均值;,n :样本大小。,(二)样本中位数和样本众数,把收集到的统计数据X 1,X 2,X 3.X n,按大小顺序重新排列,排在正中间的那个数就叫作中位数,用符号 来表示。,当 n 为奇数时,正中间的数只有一个;,当 n 为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。,众数是指收集到的统计数据X 1,X 2,X 3.X n,按大小顺序重新排列,其中 出现频数最高的那个数用符号 表示。,(三)样本方差,样本方差是衡量统计数据分散程度的一种特征数,其计算公式:,S 2 :样本方差;,:某一数据与样本平均值之间的偏差。,(四)样本标准偏差,国际标准化组织规定,把样本方差的正平方根作为样本标准偏差, 用符号 S 来表示。其计算公式:,(五)样本极差,极差是一组数据中最大值与最小值之差。常用符号 R 表示,其计算公式:,R = X max - X min,(六)变异系数 用于不同数据集的分散程度的比较,六、质量特性数据的分布特点和分布规律,(一)质量特性数据的分布特点 1、分散性(波动性、变异性)即随机性 由于异常原因、随机因素和系统因素的存在,使我们收集到的质量特性数据具不确定性和波动性。一般即使人、机、料、法、环、测各种条件相同,生产的同一批产品的质量也不完全相同。 2、规律性 当生产过程处于统计控制状态,数据的波动服从一定的分布规律,即统计规律。一般来说,离散型随机变量遵循二项式分布、泊松分布、超几何分布等。连续型随机变量遵循正态分布、指数分布、t分布等。,(二)常见的几个数据分布,1,计量值服从正态分布,密度函数:,分布函数:,其中,m,为均值,,为方差,,.,标准正态分布:,N,(0,1),密度函数,,,分布函数,2、二项式分布(b(n,p),条件:当产品批量N为无限大或N虽为有限量但N很大,并进行返回检查。 样本容量n ,Nn,重复n次试验但相互独立。 每次试验只有两种可能性。 几个量:总体的不合格率p,合格率q=1-p, 样本容量n ,其中不合格品数d,合格品数n-d 则 p(d)样本中出现d个不合格品的概率服从二项式分布: P(d)=,二项式分布的数学期望和方差为: E(d) = np V(d) = =n p q = n p(1-q),二项分布由n和p两个参数决定: (1)、当p值较小且n不大时,分布是偏倚的。但随着n的增大 ,分布逐渐趋于对称,如图28 所示; (2)、当p值趋于0.5时,分布趋于对称,如图29所示; (3)、对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降. (4) 、在n较大,二项分布近似于正态分布;当n时,二项分布的极限分布是正态分布。 在产品质量检验中,当采取有放回的抽样时,这时样本中取到的次品数的概率服从二项分布。不放回的抽样在样本量相对总体很小时,也可以近似看作为放回抽样,这时,超几何分布可利用二项分布来近似计算概率。,例:某种产品的不合格品率为0.005。试问在360件此产品中, (a)有不多于3件的不合格品的概率;(b)恰有3件不合格品的概率。,3、计点值服从泊松分布(The Poisson Distribution),泊松分布常常用在单位产品上所发生不合格数的数学期望。计点值服从泊松分布。 如:一定时间内电话总站接错电话的次数;每一页书中印刷错误;在一个铸件上的气泡或砂眼数;每一米布上的疵点数等。 条件: 样本容量n1, 总体不合格率p1 令 = np,d 表示 不合格数,可取任意一组自然数1、2、3、4,.,那末发生 d个不合格数的概率服从泊松分布。,即,泊松分布的数学期望和方差为: E(d)= V(d)=,图211 不同的泊松分布,是泊松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称(如图4-11所示)。当=20时分布接近于正态分布;当=50时,可以认为泊松分布呈正态分布。所以在实际工作中,当20时就可以用正态分布来近似地处理泊松分布的问题。,As an example, suppose that the number of wire-bonding defects per unit that occur in a semiconductor device is Poisson distributed with parameter = 4. Then the probability that a randomly selected semiconductor device will contain two or fewer wire-bonding defects is np= ,=0.0183+0.0733+0.1464,=0.2380,4、超几何分布 The Hypergeometric Distributio

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论