版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
产品合格率达到99.99%产品不合格率降低10%果汁含量≥30%一台用了50年的热水器安全行使达50万公里左面反映质量的情况有什么共同点?一切用数据说话1第五章质量数据的
统计处理
2第一节质量数据的收集
一、质量数据收集的目的1.用于控制现场的数据2.用于分析数据3.用于调节的数据4.用于检查的数据31.用于控制现场的数据例如,产品尺寸的波动有多大,在装配过程中出现了多少不合格品,以及机器出现多少次故障,打字员出现多少差错等等。42.用于分析数据例如,为了调查纱线的不均匀度与纺织机器的测量仪表有什么关系,需要制定试验设计进行实验,对取得的数据加以分析,然后,将分析的结果写入操作规范和管理规章制度中。53.用于调节的数据例如,对干燥室的温度进行观测,“温度高调低一些,过低则调高一些”。这些就是进行温度调节的数据。规定的数据有测定时间、调节界限、调节量等,通常都订在操作规范和管理规章制度中。64.用于检查的数据例如,逐个测量产品的特征值,把测量结果与规格对比,判定产品中的合格品和不合格品,这就是用于检查的数据。此外,为了判定批量产品合格与不合格,可从批量产品中随机抽取样本,再对样本进行测定,这就是抽样检查的数据。这类检查数据可以反馈给有关部门进行分析和管理。7二、质量数据的分类在日常所进行的质量管理活动中,经常会遇到两类形式的质量信息:一类表现形式是数据的,即质量数据:对于质量数据,可以运用一些处理工具和技术,如直方图、排列图、控制图、散布图等做出判断;另一类是非数据的,即非数据形式的质量信息:而对于非数据形式的质量信息的加工、分析和判断,可以运用分层法、因果图、调查表等做出分析和判断。81、计量值数据:
适用于长度、重量、时间、强度、温度等质量特性值的分析和控制。计量数据可以通过某种量具、仪器等测定到,它们可以在某一区间内连续取值。注意:这类数据具有连续型随机变量的分布特征,符合正态分布。
质量数据92、计数值数据:
是对批产品中的不合格品数或单位产品上的缺陷数进行检查时得到的正整数数据。计数值数据又可分为:
计件值数据计点值数据质量数据10计件值数据:对产品按件检查时得到的数据。如:批产品中的不合格品数、事故件数等123412指1,2,3……,质量数据—计数值数据11计点值数据:检查单件产品上质量缺陷时得到的数据。如:单位棉织品上的瑕疵点数、铸件上的砂眼数,收音机底版焊点数等。
注意:表示百分率的数据(如出勤率、不合格品率、退修率等)。其类型取决于其分子数据的类型。质量数据—计数值数据12
另外,对于一些特殊的场合,还可以把质量数据分为顺序数据、点数数据和优劣数据等。1、顺序数据:例如把10类产品按评审标准顺序排成1,2,3,…,10,这样的数据就是顺序数据。在对产品进行综合评审而又无适当仪表进行测量的场合常用这类数据。比如我们经常见到在竞赛中的排名(第一名、第二名……)。如:按外观美观程度对10种手机的排序得到的一组排序值。2、点数数据:这是以100点或10点计为满分点进行评分的数据。在评比的场合常用这类数据。比如体育比赛的时候就经常用点数数据进行评分。3、优劣数据:例如有甲、乙两种纺织品,比较哪种手感好而得出的结果就是优劣数据。如0-1强制打分法中数据。1表示好,0表示差。13三、质量统计数据的取样我们在平常时候收集数据的时候能够发现,通常我们不太可能为了掌握一批产品的质量信息而对整批产品全部进行检验的,尤其是我们需要进行破坏性检验的时候或产品数量巨大的时候。一般的做法是采用在全部产品中采取随机抽样的方式,选取一定的样品来进行测试,将样品测试的结果组成样本数据,然后通过对样品数据的分析来推断整批(全部)产品的质量,这就是统计推断。14统计推断---
总体、样本、数据间的关系总体样本结论数据抽样分析管理测试15在统计推断中,涉及一些名词(1)总体:(2)个体:(3)总体容量:亦称为“母体”,他是研究对象的全体;一批零件、一个工序或某段时间内生产的同类产品的全部都可以称为总体。构成总体的基本单位,称为个体。每个零件、每件产品都是一个个体。总体中所包含的个体数量称为总体容量,通常用N来表示。一批零件、一个工序或某段时间内生产的同类产品的总数量16(4)样本:
样本又叫子样,是从总体中抽出来一部分个体的集合。
一般我们用X1.X2…Xn来表示总体的一个样本
样本中每个个体叫样品,样本中所包含样品数目称为样本大小,又叫样本量,常用n表示。
对样本的质量特性进行测定,所得的数据称为样本值。
样本数据的取值记为x1、x2…xn,称为样本观测值
当样本个数越多时,分析结果越接近总体的值,样本对总体的代表性就越好。171、随机抽样是指从总体中随机抽取一定数目的个体单位作为样本进行观察,使每个个体单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。
随机抽样能有效地避免主观性导致的倾向性误差(系统误差),使得样本资料能够用来有效地估计和推断总体的数量特征,并通过计算抽样误差,说明估计结果地可靠程度。18简单随机抽样分层抽样系统抽样整群抽样随机抽样2、随机抽样的方法19简单随机抽样指总体中每一个个体都有同等可能的机会被抽到。这种抽样方法事先不能考虑抽取哪一个样品,完全用偶然方法抽样,常用抽签或利用随机数表来抽取样品以保证样品代表性。抽样当总体容量不大时,随机抽样是一种有效的抽样方法;20*优点:方法简单直观,由于总体中每个个体抽取的概率相等,计算抽样误差及对总体参数加以推断比较方便。*
缺点:抽样顺序比较复杂,在实际工作中,真正做到总体中每个个体被抽到机会完全一样是不容易的。简单随机抽样的优缺点是什么?21系统抽样又称机械随机抽样或等距随机抽,即将总体单位按某一标志(如时间)排序,然后按一定间隔来随机抽取样本。如果被抽总体足够大,并且易作某种次序的整理时,适用于大批量生产的流水线上产品的抽查。1,2,…….10:511,12,……..20:15……91,92,……..100:95例,从具有100个个体的总体中抽取10个个体。22*优点:实施方便,同时能够保证样本对总体的代表性。*缺点:总体单位排序后呈现一定的规律性甚至周期性,而抽样间隔的周期正好与之吻合,依赖于这样排列的系统抽样就因而会产生系统性的偏差。系统抽样的优缺点是什么?23分层抽样分层抽样是先将总体按照研究内容密切有关的主要因素分类或分层,然后在各层中按照随机原则抽取样本。分层抽样可以减少层内差异,增加样本的代表性。抽样样本当获得的资料不均匀,或呈偏态分布时,分层抽样是一种有效的抽样方法;适用于产品质量的验收。24*优点:样本代表性好,抽样误差小。*缺点:抽样手续比较繁琐。分层抽样的优缺点是什么?25整群抽样也称集团抽样,即在总体中,不是抽取个别样品,而是随机抽取整群的产品。这种方法是先将总体按某个标志(企业、车间、班组、工序或一段时间内生产的一批零件)分成若干群,然后随机抽取若干群,并由抽中的所有个体组成样本。适用范围:常用于工序控制中。26*优点:抽样实施比较方便。*缺点:由于抽样来自个别几个群,而不能均匀分布在总体中,因而代表性差,抽样误差大。整群抽样的优缺点是什么?27抽样的目的是通过样本来反映总体。在质量管理中,常常将测试的样本数据,通过整理加工,找出它们的特性,从而推断总体的变化规律、趋势和性质。一批数据的分布情况,可以用中心倾向及数据的分散程度来表示,表示中心倾向的有平均值、中位值等,表示数据分散程度的有方差、标准偏差、极差等。描述总体数据离散程度的参数为方差σ2,描述总体数据中心倾向的数为均值μ。若利用样本参数近似描述总体状况时,可以利用样本方差S2近似代替总体方差σ2,利用样本均值X近似代替总体均值μ
。28四、质量数据统计特征的描述
常用的统计量有两大类,一是反映样本数据集中程度的特征量
样本平均值,样本中位数、众数等;二是反映样本离散程度的特征量
样本极差、样本标准差、样本方差等。291、表示样本集中程度的特征量
表示n个样本测定值为x1,x2,…xn,则样本平均值为样本中的多数数据分布在样本均值附近,因此样本均值表示了样本数据的“质量中心”,是数据高低相抵、误差正负相抵后客观事物必然性数量特征的一种反映。(1)样本平均值30注意:在数学上,均值有两个非常重要的数学性质
各个样本数据与均值的离差之和为零。=0各个样本数据与均值的离差平方和最小。=最小值31适用情况:当样本数据中存在极端数据时(个别数据特别大或者特别小),样本均值组为数据集中趋势的代表不合适,从而引入另一个特征量――样本中位数,它是将样本数据从小到大排列后处在中间位置上的数据,当样本容量为奇数时,它恰为中间的一个数,当n为偶数时它是中间两个数据的平均值。
n为奇数n为偶数(2)样本中位数若记排序后的样本测定值为x1x2……xn,则32
注意:在实际应用中,要根据不同的研究目的和不同的数据分布特征来选择均值或中位数作为集中趋势的代表值。一般的,当数据呈现对称分布或近似对称钟形分布时,均值与中位数时一致的,应当选择均值作为数据集中趋势的代表值。但当数据分布的偏斜度较大(出现极端值情况)时,均值容易受到极端数据的影响,不能很好地反映样本数据地集中趋势,应该选择中位数作为集中趋势地代表值。1、3、4、5、7、8、10、50如何选择使用样本均值和样本中位数?33在一批数据中,出现次数最多的那个数称为众数,记做M0如,某厂先后对本厂的某型号的一批产品的不合格数进行统计,得到如下表所示的数据。对照定义可以看出,出现3个不合格品的次数最多,共有48次。故众数M0=3不合格(个)0123456出现次数8203248202111(3)众数342、表示样本数据离散程度的特征数R=xn-x1
极差能正确反映数据的范围若记排序后的样本测定值为x1x2……xn,则(1)极差35当样本容量增大的时候,数据中出现最大或最小异常值的可能性也将随之增大,这时用样本极差表示数据的波动程度的可靠性随之下降。为了充分利用样本数据,常用样本方差来表示数据的波动。它是样本数据集中所有观测值的离差平方和的“平均值”。记为
S2=S2(2)方差36样本方差的纲量与原始数据的纲量不同,它是原始纲量的平方,所以在实际的应用中我们常用其算术平方根,称为样本标准差,记为S。S=(3)标准差37五、收集质量数据注意事项1.明确收集数据目的与方法;2.注意数据的修正,剔除异常数据;3.数据记录要真实、可靠、准确;4.测定和记录工作应标准规范;
如年月日的书写:07/04/10;04/10/2007;10/04/20075.注意记录与数据有关的数据背景。如测试时间、地点、数量、测试者、零件号、批号、名称规格及必要的环境条件等。有利于分析问题,且可以避免不同条件的数据混淆。38数据的修整过多的四舍五入会造成误差过大,可采取进位和舍弃机会均等的修整方法:(1)位数>5,则:进位并舍去后面的数,如:1.126→1.13(2)位数<5,则:舍去,及后面的数,如:1.124→1.12(3)位数=5,则:后面的数为0或无数字,5前面的数为奇数进一、偶数舍去。如:1.125→1.12;1.135→1.14后面的数不全为零,5前面的数进一、舍去5和以后的数。1.1256→1.13(4)不得连续进行修整。
1.13346→1.1335→1.134→1.1339序号平均数四舍五入后的平均数数值修整后的平均数1234567891012.42512.55012.47512.50012.40012.37512.62512.65012.47512.45012.4312.5512.4812.5012.4012.3812.6312.6512.4812.4512.4212.5512.4812.5012.4012.3812.6212.6512.4812.45合计124.925124.95124.93总平均12.492512.49512.49340第二节质量数据的整理一、计量数据与直方图
对于计量数据,其整理方法是进行统计分组,列出频数分布表,画出频数分布图,即直方图。
1.含义:
直方图是用一系列宽度相等、高度不等的矩形来表示数据分布的图。在统计学上,也可以称为“矩形图”和“区间频数图”。4174.03074.00274.01973.99274.00873.99573.99274.00174.01174.00473.98874.02474.02174.00574.00274.00273.99673.99374.01574.00973.99274.00774.01573.98974.01474.00973.99473.99473.99773.98573.99574.00673.99474.00074.00573.98574.00373.99374.01573.98874.00873.99574.00974.00574.00473.99874.00073.99074.00773.99573.99473.99873.99473.99573.99074.00474.00074.00774.00073.99673.98374.00273.99873.99774.01274.00673.96773.99474.00073.98474.01274.01473.99873.99974.00774.00073.98474.00573.99873.99673.99474.01273.98674.00574.00774.00674.01074.01874.00374.00073.98474.00274.00374.00573.99774.00074.01074.01374.02074.00373.98874.00174.00974.00573.99674.00473.99973.99074.00674.00974.01073.98973.99074.00974.01474.01574.00873.99374.00074.01073.98273.98473.99574.01774.013汽车活塞环直径观测数据(125个)422、绘制直方图的步骤:(1)收集数据,需要注意的是数据一般要≥50个(2)找出数据中的最大值与最小值,确定数据的极差R(3)决定组数k(4)计算组距h(5)决定各组的组限(边界值)或组中值。(6)制作频数分布表(7)制作直方图43(1)收集数据,需要注意的是数据一般要≥50个(2)找出数据中的最大值与最小值,确定数据的极差RR=Xmax–Xmin(本例中,R=74.030-73.967=0.063)73.967R=0.06374.03044(3)决定组数k,一般可以用两种方法:一是查表法:
二是公式计算法:
k=1+3.322lg(n)
数据总个数(n)适当分组个数(k)50-1005-10100-2507-12250+10-20R73.96774.03045(4)计算组距h(组距可以相等也可以不等,我们一般取等距分组)h=R/k
注意:一般我们取最小测量单位的整数倍本例中,n=125,取k=9,组距h=0.063/9=0.007R0.00774.03073.96746(5)决定各组的组限(边界值)或组中值。
[a0,a1],(a1,a2],…(ak-1,ak]要求a0≤Xmin,ak≥Xmaxa1=a0+ha2=a1+h……ak=ak-1+h
组中值=(下组限+上组限)/2,
yi=(ai-1+ai)/2注意:若数据中,最大值与最小值与其它数据相差悬殊,为避免出现空白组,第一组和最后一个组可以采用“××以下”以及“××以上”这样的开口组。开口组通常以相邻的组距作为其组距计算组中值。4773.98874.030R73.99574.00274.01674.00974.02373.98173.97473.967高度?73.97073.97873.98573.99273.99974.00674.01374.02074.02748(6)制作频数分布表。采用统计的方法统计数据落在各个组限区间的个数(频数),记为ni,并计算每个区间对应的频率fi=ni/n,列出频数(频率)分布表和累计频数(频率)分布表。组号组限区间组中值频数累计频数频率累计频率12345678合计73.981以下[73.981,73.988)[73.988,73.995)[73.995,74.002)[74.002,74.009)[74.009,74.016)[74.016,74.023)[74.023
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 甘肃省天水市清水县多校联考2025-2026学年高一上学期1月期末考试地理试卷(含答案)
- 2026届高三生物二轮复习课件:选择题强化练 4.遗传的基本规律与伴性遗传
- 化工企业冬季培训课件
- 钢结构绿色制造技术应用
- 飞机结构专业知识课件
- 2026安徽合肥工业大学管理学院管理学院医疗机器人与智慧医疗健康管理团队科研助理招聘3人备考考试试题及答案解析
- 2026新疆前海集团有限责任公司招聘1人备考考试试题及答案解析
- 2026年上半年黑龙江事业单位联考哈尔滨市招聘592人参考考试题库及答案解析
- 2026江苏苏州人才发展有限公司招聘2人(一)备考考试题库及答案解析
- 2026四川通发广进人力资源管理咨询有限公司AI数据标注员(第三批)招聘备考考试题库及答案解析
- 中学生冬季防溺水主题安全教育宣传活动
- 2026年药厂安全生产知识培训试题(达标题)
- 2026年陕西省森林资源管理局局属企业公开招聘工作人员备考题库及参考答案详解1套
- 承包团建烧烤合同范本
- 口腔种植牙科普
- 2025秋人教版七年级全一册信息科技期末测试卷(三套)
- 抢工补偿协议书
- 2026年广东省佛山市高三语文联合诊断性考试作文题及3篇范文:可以“重读”甚至“重构”这些过往
- 山东省青岛市城阳区2024-2025学年九年级上学期语文期末试卷(含答案)
- 安全生产考试点管理制度(3篇)
- 孕妇尿液捐献协议书
评论
0/150
提交评论