已阅读5页,还剩58页未读, 继续免费阅读
(管理科学与工程专业论文)多元质量特性过程能力分析与控制.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 多元系统的研究已经进行了比较长的时间,而且也产生了多种方法,如主成 分分析、逐步回归、多重回归、附加信息检验、多元过程控制图等等。但是多元 质量特性过程能力分析和控制过程的研究的时间还不长,相比较一元过程能力分 析过程来说还不系统,还没有形成一个系统的分析和评价方法。我们有必要对其 进行深入地研究,以便多元质量特性过程能力分析和控制的方法能更好的应用于 生产过程中。 本文首先对多元统计方法丁2 进行介绍,为本文的研究打下理论基础,这其 中包括三方面的内容:统计距离的概念,r 2 统计假设,r 2 统计的特点。接下来 对历史数据的收集进行研究,数据收集是进行过程能力分析的基础和前提。这其 中主要对实际生产过程中经常出现的问题进行系统地总结和分析。在此基础上, 对如何通过历史数据建立稳态进行研究,其中的主要内容分为己知参数的情况下 的异常值判异,未知参数情况下的异常值判异。建立短期稳态后,我们需要对过 程能力进行评价,这时就需要使用多元质量特性过程能力指数,通过多元过程能 力指数,我们可以判断该过程是否达到了进行控制的标准,进而确定是否将该过 程转入控制阶段。在最后部分。本文使用这个多元质量特性过程能力评价体系对 某一实际的生产系统进行分析研究,取得了良好的效果。 关键词:多元质量控制多元过程能力分析主成分分析多元过程能力指数 a b s t r a c t t h er e s e a r c ho ft h em u l t i v a r i a t os t a f i s t i e a lp r o c e s sc o n t r o lh a sb e e nc a r r i e do u t f o ral o n gt i m ea n dt h e r ea r eal o to fm e t h o d ss u c ha sp r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,s t e p w i s er e g r e s s i o n , m u l t i p l er e g r e s s i o n , t e s to fa d d i t i o n a li n f o r m a t i o na n d m u l t i v a r i a t ep r o c e s sc o n t r o lc h a r t sa n ds oo n b u tt h er e s e a r c ho ft h em u l t i v a r i a t e p r o c e s sc a p a b i l i t ya n a l y s i s ( m p c a ) h a sn o tb e e nc a r r i e do u tf o ral o n gt i m e i n c o n t r a s tt ot h es y s t e mo fu n i v a r i a t op r o c e s sc a p a b i l i t ya n a l y s i s ( u p c a ) ,t h es y s t e mo f t h em p c at h e o r i e sh a sn o tb e e ns e tu p s ow es h o u l ds t u d ym p c af r r t h e rt om a k ei t a p p l yw e l li np r a c t i c e f i r s t l y , t h et 2s t a t i s t i cm e t h o di si n t r o d u c e dt 0p r o v i d et h ef o u n d a t i o nf o rt h e w h o l et h e s i s i nt h i sp a r t , t h e r ea r et h r e ea s p e c t s :t h ec o n c e p to f t h es t a t i s t i c a ld i s t a n c e , t h eh y p o t h e s i so ft h et 2s t a t i s t i ca n dd i s t r i b u t i o n a lp r o p e r t i e so ft h et 2s t a t i s t i c t h e ni st h er e s e a r c ho f t h ec o l l e c t i o na n dc o n s t r u c t i o no f t h eh i s t o r yd a ms e t d a t ai s t h ef o u n d a t i o no ft h em p c a t h ec h a p t e ri sf o c u s e do nh o wt os o l v et h ep r o b l e m s t h a te x i s t i n gi nt h ep r a c t i c e t h i r d l y , w ed i s c u s s e dh o wt od e c i d ew h e t h e rt h ep r o c e s s i si nc o n t r o la n di fn o t , w h a ts h a l lw ed ot or e m o v et h es i g n a l s i nt h i sp a r t , t h e r ea r e t w oa s p e c t s :t 2s t a t i s t i cw i t hu n k n o w np a r a m e t e r sa n dt 2s t a t i s t i cw i t hk n o w n p a r a m e t e r s a f t e rt h ep r o c e s si su n d e rc o n t r o l ,w ec a ne v a l u a t et h ec a p a b i l i t yo ft h e p r o c e s sw i t ht h em u l t i v a r i a t ep r o c e s sc a p a b i l i t yi n d e x i ft h em u l t i v a r i a t ep r o c e s s c a p a b i l i t yi n d e xh a sr e a c h e dt h ec r i t e r i o n , t h e nw ec a ng ot ot h en e x tc o n t r o ls t a g e f i n a l l y , w em a k eu s eo ft h es y s t e mo fm p c a t oe v a l u a t et h ep r o c e s sc a p a b i l i t yo fa p r a c t i c a ls y s t e ma n dg e t av e r yg o o dr e s u l t k e yw o r d s :m u l t i v a r i a t es t a t i s t i c a lp r o c e s sc o n t r o l ,m u l t i v a r i a t ep r o c e s sc a p a b i l i t y a n a l y s i s ( m p c a ) ,p r i n c i p a lc o m p o n e n ta n a l y s i s ( p c a ) ,m u l t i v a r i a t e p r o c e s sc a p a b i l i t yi n d e x 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的 研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得鑫壅盘堂或其他教育机构的学位或证 书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中 作了明确的说明并表示了谢意。 学位论文作者签名歹爹鸸侈签字日期:印年月1 护日 学位论文版权使用授权书 本学位论文作者完全了解叁注盘茎有关保留、使用学位论文的规定。 特授权鑫鲞盘茎可以将学位论文的全部或部分内容编入有关数据库进行检 索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校 向国家有关部门或机构送交论文的复印件和磁盘。 ( 保密的学位论文在解密后适用本授权说明) 学位论文作者签名爹彤岛秒 导师签名: 签字日期:五丸彩年z 月认日签字日期:汤“年2 月f ,5 日 第一章绪论 1 1 研究背景与意义 第一章绪论 伴随着全球经济一体化的发展和科学技术的进步,市场竞争日趋激烈,而 在这场竞争中的一个重要的决定因素是质量。现在,人们越来越清醒地认识到: 采用价廉质次的倾销政策已难以取胜,能够制胜的最重要的法宝是产品与服务 的优良质量。质量是企业的生命,没有高质量的产品,企业是不可能获得长期、 持续、稳定的发展。任何企业要想在激烈的竞争中生存和发展,必须提高质量。 而企业要想提高质量,就需要质量管理的思想、方法和手段。 企业生产产品和提供服务均需要一个过程。在质量管理中,过程的概念非 常重要。2 0 0 0 版i s 0 9 0 0 0 族标准对过程的定义是指:一组将输入转化为输出的 相互关联或相互作用的活动【1 】。过程的三个基本要素是:输入、输出和活动组 成。在现实的生活中,我们需要对各种不同的生产或服务过程进行分析和控制 来达到企业的预期目的。而为了达到这个目的,我们就需要对过程进行过程能 力分析和控制。 在质量管理中,过程能力( p r o c e s sc a p a b i l i t ) ,) 以往称为工序能力,现在根 据i s 0 8 4 0 2 一律将其译为“过程能力”【2 】。过程能力是指加工过程的加工质量 满足技术标准的能力,它是衡量加工过程内在一致性的。产品的制造过程能力 是指过程处于受控状态或稳定状态下在加工精度方面的实际能力,过程能力体 现了过程稳定地实现加工质量的范围。过程能力决定于质量因素:人、机、料、 法、环、测。过程能力未必能够始终保持稳定,根据对过程控制的好坏,可以 有某种程度的稳定性,但不是绝对的。例如,设备各个部分的自然磨损、化学 作用的劣化、刀具的磨耗等因素都会引起过程能力的变化。因此,过程能力又 分为短期过程能力( s h o a - t e r mp r o c e s sc a p a b i l i n ) 和长期过程能力( l o n g t e r m p r o c e s sc a p a b i l i t y ) 。所谓短期过程能力是指在任一时刻,过程处于稳态的过程 能力;而长期过程能力则考虑了工具磨耗的影响、各批之间材料的变化以及其 他类似的可预期微小波动。换言之,短期过程能力表示了组内变异,而长期过 程能力则表示了组内变异与组间变异之和。 第一章绪论 在质量管理活动中,对于过程能力一般用过程能力指数进行评价。过程能 力分析和过程能力指数对于决策者很有参考价值,其作用主要有: ( 1 ) 由于过程能力指数是无量纲的,所以通过过程能力指数可以了解各个供 应商的质量水平,也可以通过其对本企业的各个生产单位的质量进行评价比较。 ( 2 ) 若销售人员了解了本企业的过程能力指数,当发现某客户所要求的规范 较为宽松时,则产品的合格品率一定会大幅的提高,这时即使降价销售也仍然 会有可观的利润。这就使得销售人员可以考虑制定最优的销售策略。 ( 3 ) 对生产人员来说,如果他们了解了本企业的过程能力指数,就可以预计 产品的合格品率,从而调整发料与交货期,以便用最经济的成本去满足客户的 需求。 ( 4 ) 对于企业来说,在一种产品将要进行大批量生产之前,需要得到生产过 程的过程能力指数,以检验生产过程的过程能力是否达到了要求。以避免生产 出大批的废品,给企业带来损失。 ( 5 ) 对于质量工程师来说,在确定一个生产过程是否需要进行控制之前,需 要先计算过程能力指数,来判断该过程是否值得进行控制并避免损失。 ( 6 ) 帮助产品开发和过程开发者选择和设计产品过程,为工艺规划制定提供 依据并对掰设备的采购提出要求。 ( 7 ) 找出影响过程质量的瓶颈因素,减少制造过程的变异,从而进一步明确 质量改进的方向。 质量管理中的过程能力分析和控制是一个系统的活动。在实际的生产过程 中,过程能力分析与控制分为一元和多元的情况。一元情况下的过程能力分析 和控制主要是对生产过程中的某一个关键的质量变量进行分析和控制,由于其 相对多元情况来说比较简单,国内外对一元情况下的过程能力分析与控制的研 究起步比较早,到目前为止,一元过程能力分析的问题已经得到了很好地解决, 已经形成了一个比较系统和全面的体系。具体来说,一元过程能力分析和评价 主要涉及过程能力评价的流程,确定关键质量特征,样本容量的选择,测量系 统分析,过程是否稳定,数据正态性的判断和检验,非正态数据的转换,不同 的过程能力指数的计算等 1 。但是实际上,只有少数产品仅仅包含单一质量特 性。对于绝大多数产品来说,需要用多个质量特性来描述,而且,大多数产品 的多个质量特性之间并不是相互独立的,它们之间存在相互影响,相互作用, 2 第一章绪论 一个产品的质量是这些特性综合作用的结果。所以,对于多元质量的情况,我 们就需要应用多元质量过程能力分析和控制方法。 多元系统的研究已经进行了比较长的时间,而且也产生了多种方法,如主 成分分析嘲( p r i n c i p a lc o m p o n e n ta n a l y s i s ,p c a ) 、逐步回归 刀( s t e p w i s e r e g r e s s i o n ) 、多重回归啊( m u l t i p l er e g r e s s i o n ) 、附加信息检验【8 l ( t e s to f a d d i t i o n a li n f 0 肋a t i o n ) 、多元过程控制图1 9 】( m u l t i v a r i a t ep r o c e s sc o n l t o lc h a r t s ) 等等。但是多元质量特性过程能力分析和控制过程相比较一元过程能力分析过 程来说还不系统,还没有形成一个系统的分析和评价方法。虽然在某一个领域 的研究已经比较深入,但是某些方法对于生产过程中的工程师来说过于理论化、 复杂化,而这些恰恰是造成多元质量特性过程能力分析不能在实际中广泛应用 的原因。因此,我们有必要对其进行深入地研究,以便多元质量特性过程能力 分析和控制的方法能更好的应用于生产过程中。 1 2 国内外研究现状综述 国内外对一元过程能力分析与控制研究的比较早。早在1 9 5 6 年,西方电气 公司就提出了过程能力指数的概念。而真正具有实际意义的一元过程能力指数 是在1 9 7 4 年,由著名的质量专家朱兰提出的【1 0 1 ,也就是现在普遍得到应用的过 程能力指数c 。,也叫第一代过程能力指数。1 9 8 6 年和1 9 8 8 年,k a n e 和c h e n 等人分别针对c 。指数不能反映过程输出均值p 与设计目标值t 之间的偏移情 况的缺陷,提出了第二代过程能力指数c 。指划1 1 1 和c 。指数1 2 1 。进一步,为了 更加灵敏的反映过程输出均值与设计目标值之间的偏离,p e a r n , k o t z 和 j o h n s o n 等人提出了一种新的过程能力指数c 。指数【1 3 1 。据保守估计,目前已 经有2 0 种单变量的过程能力指数。这些过程能力评价方法都是在上述三代过程 能力指数的基础上发展起来,并且适用于不同的应用背景。经过几十年的发展, 一元过程能力评价已经发展得比较成熟,形成了比较系统、全面的理论框架。 与一元过程能力指数相比,多元过程能力指数开始研究的时间比较晚。国 内外学术界从八十年代末,九十年代初才开始研究多元过程能力指数。目前, 对于如何定义多元过程能力,如何定义多元过程能力指数还存在很大争议。由 于多元质量特性之间具有相关性,他们的控制域( 或称分布域) 是一个( 超) 第一章绪论 椭球体,而且每一个质量特性都有自己的规格限,将会形成一个( 超) 长方体 的规格域,二者的差别比较大。同时,还希望采用一个统一的指标来衡量过程 的综合过程能力,因此多元过程能力指数评价是一个非常复杂、困难的问题。 l k c h a r t , s w c h e n g ,ea s p i r i n g 在1 9 9 1 年假设过程的规格域是一个椭 球体,并且与过程控制域的形状和方向一致,他们以此为基础定义了多元过程 能力指数,并从理论上作了探讨【1 4 1 。但从实际情况来看,他们的定义没有得到 普遍的认同。1 9 9 2 年,h u b e l e n e ,s h a h r i a r ih 和c h e n gc s 等人从实际出发, 考虑了长方体的规格域并以此为基础定义了多元过程能力指数【1 5 1 ,但是该指数 与一元的过程能力指数相差较多,没有得到进一步的认同和应用。t a a mw : s u b b a i a hp 和l i d d y ,w 等人在1 9 9 3 年提出控制域的近似修正理论【l6 】,将控制 域和分布域均进行一定修正之后再求相应的比值,但是该理论由于计算的相对 复杂以及实际意义不大并没有得到广泛的认可。为了使多元过程能力指数的实 际意义更加明显和简单,1 9 9 8 年f k w a n g 和j c c h e n 等人则提出了把单个 质量特性过程能力指数的几何平均作为多元质量特性过程能力的度型”。此外, 还有一些度量方法,如h o l m e s 等人在单变量过程能力指数c 。的基础上,提出 了度量多元过程能力的c 二指数及其改进形式1 8 棚】。k s c h e n , w l p e a m 和 p c l i n 在2 0 0 3 年把b o y l e s 在1 9 9 4 年旺1 1 定义的过程能力指数扩展到了多元 过程能力指数。 国内对于多元质量特性过程能力评价的研究比较少。国内学者对多元过程 能力评价理论的研究更偏向于实际应用。西北工业大学的马义中教授在2 0 0 1 年 提出利用主成分分析来确定过程能力指数的方法 2 2 1 。2 0 0 2 年,马义中教授又提 出了应用概率密度以及二项分布的方法来对多元质量特性进行过程能力评价 1 2 3 1 。另外,南京理工大学的韩玉启教授在2 0 0 3 年提出了利用质量特征的差异系 数来计算多元过程能力指数的方法刚。 多元质量特性过程能力分析与一元过程能力分析相比要复杂得多。综观国 内外目前的研究现状,多元质量特性过程能力分析的研究大多是集中在这个评 价体系中的某一方面,还没有形成系统的理论框架体系。对评价过程能力的过 程能力指数的研究大多还停留在理论研究方面。因此,对多元过程能力评价的 研究要从上述两方面提出可行的解决方案。一方面要建立类似于一元过程能力 指数评价的过程体系,另一方面,要找到切实有效、可行的过程能力指数评价 4 第一章绪论 模型。 1 3 技术路线和研究内容 1 3 1 技术路线 图1 - 1 论文的技术路线图 本文首先对多元统计方法丁2 进行介绍,为本文的研究打下理论基础,这 其中包括三方面的内容:统计距离的概念,丁2 统计假设,r 2 统计的特点。接 下来对历史数据的收集进行研究,这其中主要对实际生产过程中经常出现的问 题进行系统地总结和分析,而且,数据收集也是进行过程能力分析的基础和前 提。在此基础上,对如何通过历史数据建立稳态进行研究,其中的主要内容分 为己知参数的情况下的异常值判异,未知参数情况下的异常值判异。建立短期 稳态后,我们需要对过程能力进行评价,这时就需要使用多元质量特性过程能 5 第一章绪论 力指数,通过多元过程能力指数,我们可以判断该过程是否达到了进行控制的 标准,进而确定是否将该过程转入控制阶段。在本文的最后部分,将使用这个 流程进行案例分析研究。以上步骤可以通过技术路线图直观的表示,如图1 1 。 1 3 2 研究内容 从研究内容上来看,本文共分七章来对多元质量特性过程能力分析和控制 进行介绍和深入研究,其中: 第一章,绪论。首先对多元质量特性过程能力分析和控制的研究背景和意 义,国内外研究现状,技术路线和本文内容安排上进行简单介绍。 第二章,丁2 统计方法介绍。这一部分主要介绍在多元质量控制中广泛应 用的统计工具r 2 统计方法,为本文的研究提供一种统计工具并奠定理论基础。 这部分内容主要包括:统计距离的介绍,r 2 统计方法与多元正态分布的关系, r 分布的特点( 其中包括:丁2 分布与t 分布的对应关系,丁2 分布的特点) ,数 据正态性的判定( 其中包括:一元边缘分布的正态性的判定,二元正态性的判 定,多元正态性的判定) ,非正态数据向正态数据的转化( 其中包括:多元正态 分布的性质,非正态数据的转化) 。 第三章,历史数据的收集、收集过程模型及问题处理。过程能力评价的依 据是数据,过程能力评价过程中的参数、变量控制等等都需要大量的数据。数 据收集、处理的准确与否将直接决定过程能力评价的精度和有效性。一个建立 在存在许多问题的数据基础上的过程能力评价是没有任何意义的。本章内容主 要包括:数据收集计划、模型,数据的一致,数据的缺失,变量线性相关( 其 中包括:线性相关对结果的影响,线性相关的处理方法) ,自相关,主成分分析 的数据处理。 第四章,历史数据的判异及稳态的建立。数据收集后,我们需要对大量的 数据进行处理,初步建立起过程的稳态。而过程达到稳态是过程能力评价的前 提。本章内容主要包括:异常值的危害,一元情况下的异常值判异,一元控制 图与r 2 控制图的置信区间比较。多元情况下的异常值判异,建立历史数据过程 中的r 2 控制( 其中包括:未知参数的丁2 控制,己知参数的丁2 控制) ,控制过程 的建立( 其中包括:确定虚发警报率a ,未知参数情况下的r 2 控制,已知参数 第一章绪论 情况下的r 2 控制,子组均值条件下的r 2 控制,平均运行长度与a 和口的关系) 。 第五章,过程能力指数的计算。过程能力评价的一个非常重要的指标就是 过程能力指数。本章首先介绍一元过程能力指数的发展和基本内容,然后通过 与一元过程能力指数比较来介绍多元过程能力指数的发展。本章的最后介绍一 种比较接近于实用的多元过程能力指数并对该过程能力指数进行分析、改进, 建立一种新的过程能力指数模型。本章内容主要包括:一元过程能力指数,过 程能力指数与不合格品率的关系( 其中包括:无偏移情况下,c 。与不合格品率 p 的关系,c 。与不合格品率p 之间的关系) ,多元过程能力指数( 其中包括: 多元过程能力指数的一些定义,多元过程能力指数的一种算法) 第六章,实证研究。这一章的主要内容是如何将本文提出的多元质量特性 过程能力评价体系用于评价实际生产系统的过程能力。 第二章r 2 统计方法 2 1 统计距离 第二章r :统计方法 假设p 维变量工= ( x 1 ,x 2 ,工。) ,我们现在关心的是如何获得p 个变 量中的信息。其中一种方法是作图法,但是,作图法仅仅适用于p 3 的倩况, 如果在维数大于3 的情况下,我们是不能做出图像的。因此,由于这方面的限 制,作图法在维数大于3 的情况下是不适用的。那么,对于维数大于3 的情况, 我们如何处理呢? 对于这种情况,一种非常常用的方法就是降低变量的维数, 用某一个低维的变量来体现p 维变量中所包含的信息。统计距离就是一种这样 的方法。 直线或欧几里得距离是我们所熟悉的。坐标为p 气而,x :,x 。) 和q = ( “,a 2 ,p 。) 的任意两个点的直线距离为 a ( p ,q ) = ( 五一“) 2 + ( 而一心) 2 + + ( 一p p ) 2 ( 2 1 ) 这是一个超球面的方程( 当p = 2 时是个圆) ,与q 点等距的点都在超球面上。 虽然欧几里得距离比较熟悉和直观。但是,他对大多数的统计目的是不适 用的。原因在于,这里每个坐标对于计算欧几里得距离都起着相等的作用。当 坐标被用来表示不同随机波动幅度的测量值时,经常需要对那些可变性大的坐 标加权大大少于对可变性小的坐标的加权,这就需要一个距离的不同的度量。 考虑到各个坐标的可变性,将欧几里得坐标系中每一个坐标都进行标准化。 我们得到统计距离s d : ( 阳) :掣+ 删+ + 删( 2 - 2 ) 盯i仃2 仃, 如果s d 一定,所有满足( 2 2 ) 式的点p 与q 点都具有相同的统计距离。在 p = 2 的情况下,所有满足( 2 - 2 ) 的点构成一个椭圆。在p 3 的情况下,所有定 常数距离的点构成的轮廓线是一个超椭球面。 统计距离是多元分析的基础,与欧几里得距离相比,统计距离具有以下特 点: 1 使用标准化的变量。 第二章r 2 统计方法 2 超椭球面上任意一点都具有相同的统计距离。但是这些点可能具有不同的欧 几里得距离。只有在变量之间具有相同的变差,并且变量之间互不相关时,统 计距离与欧几里得距离只相差一个系数。否则,统计距离与欧几里得距离是不 同的。 公式( 2 2 ) 式是在假设变量之间没有相互作用的情况下得出的。在现实中, 大部分变量之间都是存在某种相互作用的。在这种存在相互作用的情况下,统 计距离将变为: s d _ 【柏一h ) 2 + a 2 2 ( x 2 一心) 2 + + ( b 一旷 。( 2 - 3 ) + 2 a 1 2 ( 五一“) ( 屯一心) + + 2 4 t ,( 】:州一j p - 1 ) ( b p ,) 】”2 其中,a 为使得距离总为非负的数。式( 2 3 ) 可以通过坐标轴旋转得到( 2 2 ) 。 为方便讨论,除了将公式向一般情况推广的情况下,本章以下部分的讨论 将主要集中在二维、三维空间内。 2 2r 2 统计方法与多元正态分布的关系 假设x = ( x ix :) 服从二元正态分布,在这个假设条件下,点x 与均值向 量p = ( 盹,p 2 ) 之间的统计距离s d 就是二元正态分布密度函数的指数部分。 f ( x , x 2 ) = w 。口:1 v 7 j 一- - p i p 册7 ( 2 - 4 ) 其中,一o o x f o 。统计距离 删2 南百【哔2 p 呼肾) + 警) 2 】沼s , 其中,p 为两个变量之间的相关系数,- l p 3 0 - 9 5 4 n 0 0 4 6 = 百0 6 2 8 ( 2 1 8 ) 时,那就表明x 对正态分布的假设发生了偏离。 2 q q 图 q q 图是用来评估正态性假设的一种非常有效的方法。该图展示的是样本 分位数与观测值确实是正态分布时所会观察到的分位数之间的关系。当观测点 离一条直线很近时,数据的正态性假设是成立的。若点偏离直线,则正态性的 假设就值得怀疑。 q q 图的基本原理为,令五,而,表示任何单一特征五的n 个观测 值。这些观测值按大小排序后表示为确) t 2 ) ) 。当五,) 互不相同时, 恰好有j 个观测值小于或等于五,) ,五力是样本分位数。为了分析方便,样本在 位于五,) 的左边的比例,加通常用( ,一, o 。 对于标准正态分布,分位数) 有下述关系定义 第二章丁2 统计方法 1 职驴去= 等2 ( 2 - 1 9 ) 在有关的累积概率( ,一1 2 ) n 相同的情况下,考察分位数对( g ( 胪) ) 若 数据由正态总体产生,数对( 吼胪) ) 会近似线性相关。在q q 图上所有点的分 布会近似为一条直线。 2 4 2 = 元正态性的判定 如果观测值服从多元正态分布,那么每个二元分布应该是正态的并且其所 对应的密度轮廓线应该是椭圆。所以,对任意二元联合分布作散点图。如果散 点图近似表现出一个椭圆的形状,那么可以认为该二元联合分布服从正态分布。 如果所有的二元分布为正态分布,那么我们就没有理由怀疑总体服从正态分布。 注意,即使所有的二元分布为正态分布,我们也不能通过这个方法来判定总体 服从二元正态分布。 2 4 3 多元正态性的判定 在判断一个数据集的联合正态性时,我们可以基于广义平方距离 = ( 一j ) 一s1 ( 一一两,= 1 ,2 ,即 来进行判定。当总体是多元正态分布时,且n 和n - p 都比2 5 或3 0 更大时,平 方距离砰,刃中的每一个期望都表现为一个卡方( b e r n 分布等) 随机变量。 与q q 图检验类似,我们可以构造卡方图或伽马图来检验数据的正态分布假设。 构造卡方图的步骤如下: 1 把计算得到的平方距离从最小到最大进行排序露) 罐) s ) 。 2 画出点对 g 。,( c ,一三,万) ,吒, 的图形,羹中,( u 一争,玎) 是自由度为p 的卡方分布的1 0 0 ( ,一勺挖分位数。 分位数吼,( ( ,一三) ” 与卡方分布钓上百分位数有关。具体的, 吼,( ( _ ,一圭) n ) = z ;( 一_ ,+ 吉) 咒) 。我们所得到的图形应当类似于一条通过原 第二章r 2 统计方法 点且斜率为1 的直线。一个弯曲图形表明数据缺乏正态性,需要进行正态性转 换。 2 5 非正态数据向正态数据的转化 2 5 1 多元正态分布的性质 对于具有多元正态分布的随机向量x : 1 其所有分量的线性组合仍服从一元正态分布。 2 x 的分量的所有子集仍服从多元正态分布。 3 其所有分量服从一元正态分布。 4 分量的条件分布是服从正态分布的。 但是,上述这些性质是不可逆的。例如,我们可以得到一组数据,这些变 量的边缘分布均服从正态分布,但是,这些变量的联合分布可能是非正态的。 然而,尽管单个变量服从正态分布并不能保证总体也服从正态分布,但是,如 果每一个变量都服从正态分布,那就可以大大提高总体分布的对称性。 2 5 2 非正态数据的转化 目前,在实际中应用的比较多的转换方法是对每一个变量进行转换,使得 每一个变量尽量近似的服从正态分布,从而提高总体分布的对称性。对于多元 非正态向量向多元正态向量进行转化的方法,一些学者已经提出了一些转换方 法1 3 2 - 3 3 】。但是,这些方法过于复杂,同时这些方法本身又有许多的应用条件的 限制和不完善的地方。所以,目前对于多元的正态性转换上还没有公认的好方 法。幸运的是,在实际应用中,如果能保证多元向量中的每一个变量服从或近 似的服从正态分布,那么总体的分布就能取得非常好的对称性。所以本文的讨 论将主要集中在对边缘非正态分布的转换上。 变换无非是用不同的单位对数据进行重新表述。例如,正观测值的直方图 显示出长的右尾时,通过取对数或平方根来变换观测值,经常会显著地改进其 关于均值的对称性,并且会提高对正态分布的近似程度。新单位往往会对所研 究的特性提供更自然的表达式。现在理论上已经证明,对于计数的数据取平方 根通常可以使之更接近正态,对数变换适用于比例,f i s h e r 的z 变换应用于相 第二章r 2 统计方法 关系数,通过这些变换,我们可以得到近似的正态分布的量。 表2 1 三种变换形式 在许多情况中,选择何种变换来改进对正态性的近似并不是很明显。对于 这种情况,我们经常对变量进行幂变换。 对于多元观测值,必须对每个变量选择一个幂变换。设 ,如,砷是对于 p 个测量特征的幂变换。每个k 通过使 m ) _ 兰b 陈( 弘) 2 j + ( ) 言h 协z 1 ) 最大化来选择,其中,是第k 个变量的n 个观测值,七= 1 ,2 ,p 这里 = 去矽= 篙( 等 :2 , 是变换后的观测值的算术平均值。第j 个变换后的多元观测值是 巧= 牟,等,争 其中,五,元,互,是分别使式( 2 - 2 1 ) 达到最大的值。 1 6 第三章历史数据的收集及数据处理 第三章历史数据的收集及数据处理 数据是质量控制过程的基础。质量控制过程中的参数、变量控制、过程能 力评价等等都需要大量的数据,数据收集、处理的准确与否将直接决定质量过 程能力分析和控制的精度和有效性。一个建立在存在许多问题的数据基础上的 质量过程能力分析和控制是没有任何意义的。一元质量过程能力分析和控制计 算过程中出现的数据的问题主要是样本容量选择、数据正态性和数据独立性等 【3 】。与一元质量控制过程的数据收集和处理相比,多元质量特性过程能力分析 和控制过程在数据收集、处理上更加复杂和难以把握。 在实际的多元质量特性过程能力分析和控制中,质量工程师大多将收集到 的数据不加任何处理和判断的直接输入到质量控制软件或者统计工具软件中, 进而得到结论。这样的做法在多元的情况下会出现很大的问题并往往会导致得 出错误的结论。本文将按照数据收集的过程来探讨多元数据的采集和处理的过 程中经常出现的问题和解决的方法叫,使得质量工程师对于多元数据的使用更 加趋于科学和合理。 3 1 数据收集计划、模型 生产过程包括三个阶段:过程输入,过程本身以及过程输出。这三个阶段 都包含了许多变量。这些变量可能是可控的,也可能是不可控的。而且这三个 阶段的变量之间可能是相关的。 建立多元控制过程的目的与一元情况是相同的。主要目的是帮助监控生产 过程、发现和寻找变异的原因。我们要在可能存在问题的地方或者是在一旦出 现问题就带来严重后果的地方建立控制过程。而这个可能存在问题的“地方”, 即可能是输入过程、控制过程本身或者是输出过程。 所有的控制过程都需要数据,只有通过对确定的变量进行分析,获得数据 中所包含的信息,我们才能对生产过程的过程能力进行分析和控制。数据的质 量好坏将直接影响到整个的过程。因此,在获得数据后,我们必须对可能存在 的问题进行了解,而且对数据的处理也要遵循一定的程序和步骤。针对数据收 集和处理过程中经常出现的问题,本文提出了一种数据收集和处理流程图。在 第三章历史数据的收集及数据处理 了解生产过程的基础上,通过结合数据收集和处理流程图,质量工程师可以合 理的选择要控制的变量,确定一些可能会发生问题的环节,提高数据收集的质 量和效率。 收集原始数据 ( 确定目标,了解生产过程) 收集过程变量之间关系数据缺失 i ( 人为因素,仪器)( 理论上相互关系,函数关系)( 估计,删除) 上 数据问题的发现和处理 线性相关 自相关 ( 对结果的影响,措施) ( 影响,发现,处理) 多元质量特性控制和分析 , ( 控制图、主成分分析、过程能力分析等) 3 2 数据的一致 图3 - l 数据收集和处理流程 数据的一致性,就是指数据采集时要保证在同一时刻不同变量所对应的数 据应该来自同一个样本。尤其在生产过程中存在输入和输出,输入转为输出需 要一个产品生产的过程即输出与输入不同步的情况下收集数据,此时更要注意 不同变量所代表的样本要一致。例如,对于内燃机,当输入变量燃油x 发生变 化时,内燃机的输出变量功率y 并不会马上发生改变,相对于x 来说,y 会有 一个非常明显的延迟。如果将某一时刻x 和y 的观测值作为一个样本,显然是 第三章历史数据的收集及数据处理 不符合实际的。在实际的生产过程中特别是化工生产过程中,这个问题就显得 比较重要和容易让人忽视。如果数据的对应关系不准确,那么往往会导致质量 工程师得到错误的结论,不能及时调整生产过程,甚至会导致生产过程发生危 险。对于发现和处理这种一致性的问题,可以用两种方法进行处理: 1 作图法。将输入和输出变量按时间顺序在同一个坐标系中体现出来,观察两 个变量的波峰波谷变化趋势,就可以发现两个变量的对应关系。此方法比较 直观,对于发现数据延迟比较方便可行,但是对于确定变量之间的具体的相 互关系来说,该方法还不够精确。 2 相关系数法。通过计算两个变量之间的相关系数,确定两个变量之间的对应 关系。例如,对于输入变量x 和输出变量y 进行了m 次观测如表1 。分别计 算x 与y - o ,y - 1 ,。y - k 的相关系数。在这些相关系数中,取最大的相关 系数所对应的x 和y 的顺序关系,这个关系确保了两个变量的数据来自同一 个样本。 表3 1 变量之间的对应关系表 其中,计算两个变量之间的相关系数的公式为: ,;1 彗一,三鱼三娶丝三至! ( 3 - 1 ) 忙赢2 再翥茕蒜 3 3 数据的缺失 在实际中,由于设备故障,操作失误或实验的方法不正确,经常会导致数 据的缺失。对于缺失的数据,最简单的方法就是重新测量或者将该组数据删除。 但是在实际中,有的数据收集过程是非常复杂和高成本的,重新测量或者将该 1 9 第三章历史数据的收集及数据处理 组数据删除意味着企业成本的增加和之前的人力和物力的浪费,而且,从数学 角度来说,这种做法仅适用于删除数据后,剩余的数据对整个过程来说仍然有 代表性或者导致数据缺失的原因与数据值本身无关。 除此之外,我们可以利用现有的数据来对缺失的数据进行估计。目前,国 内外许多学者对于数据缺失的处理提出了许多方法【3 5 1 。本文这里探讨的是利用 回归分析这种比较简单的、容易被一线工程师接受的方法来解决数据缺失的问 题。 在实际中应用回归分析,用其他的变量来估计所缺失的变量是有前提的。 1 这个估计值对数据向量的其它元素没有多大影响; 2 这个估计值对所估计的参数没有特别大的影响。 该方法的数学模型为: y = _ x 8 + ( 3 2 ) 其中,y n 1 观测向量,) 卜- n ( p + 1 ) 质量观测数据矩阵,口一( p + 1 ) x1 系数向量,- n 1 误差项。对于,满足e ( ) = o ,c o “) = e ( ) = 盯2 , 对于这种回归方程的解法比较复杂,目前常用的统计软件都包含了该方程 的计算功能,在实际应用中,我们可以很方便的进行计算。但是,应用这种方 法要注意数据变量值之间的线性相关性,异方差性和自相关性【3 6 】。 3 4 变量之间线性相关 3 4 1 线性相关对结果的影响 前面章节我们介绍过,多元质量控制的一个重要统计工具是h o t e l l i n g 的丁2 统计分布。该分布在控制过程中的应用主要是r 2 控制图。在数据服从多元正态 分布的前提下: t 2 = ( r p ) p 1 ( r p ) z 0 ) 多元质量控制图就可以通过上面的公式,将计算得到的值( 点) 按时间( 观察) 顺序作图,再通过z 之、( p ) 确定上控制限,从而得到多元质量的丁2 控制图。在实 际应用中,一般用样本方差矩阵s 。来作为。1 的估计值。 r 2 公式中存在,这就要求方差矩阵为非奇异,可逆矩阵。在一个矩阵 第三章历史数据的收集及数据处理 中,如果两个变量之间存在完全线性相关,那么,这个矩阵则是不可逆的,奇 异的。因此,丁2 控制图的前提要求是控制变量之间不能存在完全线性相关的关 系。在实际使用的软件中,有一些软件会在变量之间存在线性相关的情况下发 生报警。但有一些软件会继续计算,并且最终得到的结果将会发生很大变异。 那么,如果变量之间不存在完全线性相关的关系,而是变量之间的相关程度较 高,是否就没有问题了呢? 假设质量总体x 服从p 维正态分布,即x 坼( 儿) 。其中,1 为总体均 值向量,为总体方差一协方差矩阵。由定义,可知为一正定对称矩阵。 对于实对称矩阵,必存在单位正交矩阵c ,使得 c 1z c = c z c = d i a g ( & ,如,a 。)( 3 3 ) 其中, ,恐,a 。为的特征值。这里假设 如 砷。对于正定矩阵,其 特征值 ,如,九均大于0 。但是,对于近似奇异矩阵,总会存在一个或多个 特征值非常小或接近于零。 r 2 的计算公式也可以表示为: r 2 = 去u t u :+ 石1 u z u :+ - + 万1u p u :2 善知+ ,妻。u 川! s 钔 其中,u ,为a 。对应的特征向量。根据主成分分析原理,前a 个主成分已经包含 了产品质量波动主要的、大部分信息。而其他的主成分( a + 1 ,口) 所反映 和解释的质量波动信息相比前a 个主成分来说是很小的,一般情况下为随机波 动。在公式( 3 - 4 ) 中,如果后部分的九值很小,那么, 的倒数将会非常大, 结果随机出现的扰动将会干扰和影响主要质量波动的信息,导致控制点超出控 制界,r 2 控制图将不再适用。因此,将后面的部分忽略掉,不仅不会不会引起 数据中有用信息的明显损失,而且往往会起到清除噪声的效果。 3 4 2 线性相关的处理方法 ( 1 ) 直接删除线性相关的变量,使用剩余的变量计算t 2 统计值。对于方差矩阵, 可直接删除与该变量相对应的方差矩阵的行和列。 ( 2 ) 重新构建方差矩阵,去除极小特征值所对应的特征向量。这样,就可以排 除小的特征值对方差矩阵的影响。例如, 2 l 第三章历史数据的收集及数据处理 r 2 “a 产1 i - 1 ;u : r 2 “二u ;u : 7 但是,使用这种方法要谨慎,减少主成分的数量,有可能会降低在某个主 成分方向上发现过程变化的可能性鲫。 3 5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高强安全培训课件
- 针灸结合蜡疗治疗寒湿型腰痛的临床疗效观察
- 三边施工安全培训课件
- 农村初中消防安全课件
- 安全教育环保小卫士课件
- 企业管理-五小车辆考场申请报告模板
- 开车礼仪与文明驾驶小测试题集及答案解析
- 科学探索之旅成人科学知识问答及答案解析
- 建筑工程师考试题库及备考策略解析
- 机械设计基础形位公差测试及答案解析
- 特种设备安全总监、安全员任命
- 动液面的计算与识别
- 会计师事务所的审计底稿
- 弱电智能化系统施工合同
- 七年级上册填图练习册(人教版)
- YS/T 514.4-2009高钛渣、金红石化学分析方法第4部分:二氧化硅量的测定称量法、钼蓝分光光度法
- 肾癌NCCN指南中文版2023.v1
- GB/T 18380.2-2001电缆在火焰条件下的燃烧试验第2部分:单根铜心绝缘细电线或电缆的垂直燃烧试验方法
- 相关控规-申花单元
- 最新人教版八年级数学上册《第2课时-多项式与多项式相乘》优质教学课件
- 英语关联词汇总大全
评论
0/150
提交评论