版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据分析培训提纲1概论1.1数据分析的重要性(1)贯彻质量治理8项原则的需要QM的8项原则之一为:基于事实的决策方法。要幸免决策失误必须提供足够的信息,以及进行科学决策。信息:有意义的数据。数据:能客观反映事实的资料和数字。要使数据提升为信息,才能将其增值。为此,必须从数据收集和分析上运用科学的方法,使之便于利用。(2)通过数据的收集和分析可证实QMS是否适宜和有效。(3)关心识不和评价QMS持续改进的机会。(4)增强对各种意见和决策的分析、推断、评审、质疑能力 因此,数据分析是保障QMS有效运行的重要手段。1.2数据分析的一般过程1.2.1数据收集(1)收集范围产品、体系和过程的数据,如:产
2、品检测中的不合格,QMS质量目标完成情况、持续改进情况、过程监视和测量情况等。事实上在QMS的各个过程中,都会产生一些数据,在治理中必须依照当前及长远目标的需要,确定应收集那些数据,重点如何。(2)收集方法 1)各种报表和原始记录(注意分类) 2)区域网中的数据库 3)注意明确收集人、收集时刻、收集方式、传递方式。(3)收集的要求 1)及时 2)准确 数据的质量,“进来的是垃圾,出去的依旧垃圾” 3)完整 数据项目齐全,数量符合要求。1.2.2数据分析、处理(1)数据的审查和筛选 剔除奇异点,确定数据是否充分(2)数据排序 按其重要度进行排序,以确定分析处理的对象和顺序(3)确定分析内容,进行
3、统计分析(4)分析推断 在统计分析的基础上,以目标值或标准为依据,对统计分析结果(绘图或计算)作进一步分析,以获得指导过程改进的明确信息,找出要紧问题和薄弱环节,并提出相应的改进建议。(5)编写报告 对分析推断得出的规律、趋势整理成报告(附有直观的图表)-1-1.2.3数据的利用不能为分析而分析,要有“的”放矢,数据分析应指导治理。数据分析是为了科学决策,决策的结果,可通过前后对比来分析推断其有效性。数据分析应对其全过程做到闭环治理。为此,应将数据分析信息有效地传递,做到信息共享。在风险评估的基础上,采取适当措施。2统计分析技术2.1概述2.1.1什么是统计分析技术(1)统计技术 运用数理统计
4、的方法对数据进行分析,找出其规律和趋势。如:常用的操纵图、回归分析、试验设计等。(2)分析技术运用逻辑分析的方法对数据进行分析,找出阻碍事物的因素及其阻碍程度。如常用的排列图、因果图、饼图、QFD和 FMEA等方法。2.1.2统计技术应用的基础条件(1)日常治理秩序健全,产品质量有可追溯性。(2)生产过程相对稳定。 阻碍质量的因素已规范化,过程质量处于受控状态。(3)具备必要的物质、技术基础 测试手段适用,必要的图表及计算处理用具或软件。(4)大量的数据计算和处理运用计算机2.2统计技术的基础知识2.2.1随机变量及其分布(1)什么是随机变量: 变量数值有变化的量,相对常量而言。 随机因素随机
5、(不是人为偏向)因素(多种因素),如:年降雨量,抛硬币。 加工尺寸由模具磨损、机器磨损、材料、人的操作重复性、环境等决定。 随机变量受随机因素阻碍的在一定范围内取值的量抽样必须随机,不能有倾向性,。(2)分布间距X 直方图: fini n数据总数n参数 频率:fi= ni第i组的频数 连续型随机变量: X O 为一光滑曲线,此曲线为分布函数。 分布的特征:形状(对称、偏斜)、位置、分布宽度(最大值最小值)。2.2.2总体与样本 总体研究对象的全体,如一批电缆,可视为总体,研究其总长,每一根(或段)电缆则为总体中的一个个体(成员),一批所有电缆的总长为总体。 总体用变量X表示-2- 样本从总体中
6、抽出的部份个体组成的集合称为样本。 抽样 因为不可能研究每一个个体。 从样本推断总体,必须正确反映总体的信息,正确抽样。 随机抽样简单随机样本、随机数表 Xi 099 能够构成2500个随机数。2.2.3正态分布 钟形曲线,曲线下的面积表示概率 对称,中间高,两边低 X(, 2) X 总体的均值;总体标准差 正态分布检验: 直方图 概率纸 横坐标X的等距取值 ;纵坐标不等距0.01%99.99% 在概率纸上描出的点呈一直线,则为正态分布。 正态分布的分布函数值 近似正态分布总趋势符合正态分布,但有个不的奇异点。2.2.4常用统计特征量(样本) 统计量不含未知数的样本函数称为统计量。 统计量是由
7、样本得出,但其对可能总体状况(产品的某些特性值)具有重要意义。(1)反映样本位置的统计量 1)均值样本的算术平均值 X 样本中的数据多数分布在样本均值附近,因此它是表示样本位置的最好的统计量。 局限性:容易受数据中的特大、特小值(异常值)的阻碍。 若有5个样本,观测值为 3,5,7,9,11 X=7 假如误将11记为21 X=9 当数据异常时,把X作为数据的代表不太合适,需要引入新的统计量。 2)中位数样本中的数据从大到小排列后处在中间位置上的数。 样本容量 n为奇数时,它为中间的一个数 n为偶数时,它为中间的两个数的平均值,记为M 如样本为 10,15,23,30 则M=(15+23)/2=
8、19 10,15,23,30,35 则M=23 中位数受异常值的阻碍较小,如:其M均为7 3,5,7,9,11 3,5,7,9,21(2)反映数据波动的统计量 1)极差 R=Xmax Xmin 极差计算简便,但对样本信息利用不够,且它受异常值的阻碍较大。两者极差差异相当大,但中位数相同 如:前例中 3,5,7,9,21 则极差为18 3,5,7,9,11 极差为8 2)方差和标准差 样本方差:较充分利用数据,反映数据的波动 S22= (XiX)2/(n1)-3- 即单个样本数据与样本均值之差的平方和除以(样本容量1) 若样本为 3,5,7,9,11 n=5 S2=(37)2+(57)2+(77
9、)2+(97)2+(117)2/4=10 5,6,7,8,9 则S2=2.5 S2小讲明数据波动小,即数据较为集中。 标准差方差的平方根 S2 =S, 如S2=16, 则S=4 因为方差虽可反映数据的波动,但其量纲为原始数据的量纲的平方,在量纲上不明确,故引入标准差。2.2.5正态分布总体参数可能当一个特征量(总体函数)服从正态分布时,其分布可由,2唯一确定,若样本的观看数据服从正态分布时,则可用样本的均值和方差去可能总体。可能值 =X 2=S2 这时需注意三个层次对应的三种符号、总体; X、S样本; 、2可能值2.3常用统计分析方法2.3.1记实统计(描述性统计)(1)记实统计的概念记实统计
10、是揭示数据分布特性的概述和显示定量数据的程序。重要的数据特性: 1)趋中性(多数常常分布在中间)能够通过模型或中位数来描述。 2)数据范围 如最大、最小值的区间,标准区域 3)数据分布 如对称度,分布规律(可用数学模型描述)(2)记实统计的表达方法 常用简单的图形来有效地传递信息,如:饼图、条形图表、直方图等,其优点在于能显示定量分析中不易发觉的数据的异常特性,能够显示复杂数据,适于非专业人员分析相关数据,它易于理解并能够在所有层次用于分析和推断。(3)记实统计的应用用于数据的概述并描述特征, 通常是定量数据分析的第一步,它可提供抽样数据特性(如均值和标准偏差)的定量量值,然而其量值取决于抽样
11、大小和所采纳的抽样方法。记实统计对收集定量数据的所有领域均适用,如:描述产品特性的关键量值(如中值或范围)描述过程参数(如温度)对顾客调查中收集数据的统计。2.3.2抽样检查抽样是为得到关于一个总体的一些特性的信息,而去研究总体的代表性部份(即样本),通过样本的特性来推断总体的特性的方法。可利用抽样技术,如简单随机的、系统的、连续的、跳批等,来猎取样本。抽样方法的选择取决于抽样的目的和具体条件。针对不同的对象和目的,有许多抽样标准,如GB/T2828是针对连续批产品验收,GB/T15239针对孤立批产品验收。2.3.3统计过程操纵(SPC)2.3.3.1概述(1)历史:休哈特1924年发明操纵
12、图,3060年代世界质量治理以此为基础来操纵质量特性。(2)统计过程操纵的作用:-4- 1)完成QC的重要任务,即“监测”阻碍质量的全部生产过程的变量和过程参数。 2)确定过程参数和产品特性是在期望的范围内,依旧偏离了上述范围。 3)当过程中的问题暴露无遗时,将危及产品特性,因此需要统计过程操纵来预见问题立即出现,从而降低生产费用。 4)了解过程变差,并关心达到统计操纵状态,处于统计操纵状态,其性能可预测。 5)改进受控状态。(3)SPC的应用条件 1)测量系统误差必须能被识不或给予补偿、消除,测量系统误差可按(MSA)去操纵。 2)测量过程参数的偏差,都应是随机误差,同时服务正态分布。 3)
13、过程在统计操纵之下,均值和标准差近于恒定,分布范围在3之内。2.3.3.2操纵图基础知识(1)操纵图的优点 1)简便,便于现场操作者使用 2)有助于稳定过程和成本 3)促进过程信息交流(二、三班制工人间,工艺、质管人员) 4)易识不造成变差的缘故,幸免混淆、减少时刻和资源的白费(2)应注意区不以下概念: 公差(容差):同意的参数变动范围 偏差:与公称值之差 变差:一批样本中参数的变动范围(3)变差的两类缘故 1)一般缘故 造成随时刻推移,稳定且可重复的分布过程的变差缘故,关于稳定系统的偶然缘故(如周期振动),需要采取系统措施: 消除普遍缘故 大都由治理人员纠正 85%问题属此类 一个稳定系统受
14、到偶然因素干扰,排除干扰则受控。 2)专门缘故(可查明的缘故) 不是始终作用于过程的形成变差缘故,其阻碍过程分布改变(如热处理夜班工人睡觉),若存在专门缘故,过程将不稳定。 关于专门缘故需要采取局部措施: 消除专门缘故 由与过程直接相关人员实施 15%问题属此类2.3.3.3操纵图的构造观测值 USL上偏差线(统计量) UCL上操纵限 A 警示线(2)X (中心线) LCL下操纵限 LSL下偏差线 -5- 序号(观测值的顺序号) 警示线:虽不能表明的问题已发生,但可提供重要信息。短期内有较多的值在警示线外,应予重视,调查其缘故,加以消除。在发生问题之前予以现场警示(2对应于概率95.4%),4
15、.6%将在线外。 A= k 我国 A=3 合格概率99.93%,不合格概率0.23% 汽车、电子(如焊点PPM) A=6 不合格概率2.72.3.3.6绘制操纵图的一般步骤(随机抽样)(1)收集数据描点按一定时刻间隔,采集样本,测定每一样品特性值 计数 样本容量n 可相同或不同 计量 分组(子组) 相同 子组内ni一般为5 一个样本的样品应当是在差不多相同的生产条件下生产的(不能分层)(2)计算操纵限 一般无专门缘故不应超出操纵线,否则已失控,暴露出问题,应加以消除。(3)分析 推断是否异常或受控,有经验可遵循(4)改进 针对一般缘故,采取系统措施2.3.3.5操纵图的两类作用(1)监控 中线
16、CL、UCL、LCL都用以往数据可由试生产、往常生产统计、初次统计得到。(2)分析 可先测出数据,在计算UCL、LCL、CPK。2.3.4均值图X、极值图R2.3.4.1概述 XR 图 X 过程突变其反应最快 R 较长周期较小波动2.3.4.2绘图步骤(1)选择子组: 子组内样本数ni=25 子组的作用:子组的均值,比单次测量值更能表征总体。 注意事项: 1)测量误差带来阻碍,所产生不合格品的概率,要比过程本身大得多(应测量准确足够周密) 2)nI Xi超过的概率 ni=2 概率为0.21% ni=3 概率为0.01% 意味着ni Xi向中心线靠拢 因此ni 有次序的数组的均值,专门有作用。
17、3)周期性抽样(抽样频率) 应该操纵抽样条件一致:机台、模具不变,否则难以分清两类(一般、专门)缘故。 持续连续过程:几秒钟抽取一个样本,这对研究过程能力专门方便而可信。 慢速过程:一般不频繁抽样。 一般的周期可取15、30、60min,这可反映一段时刻后过程的变化。潜在的缘故:-6- 如换班、操作人员更换等。 初期过程不稳定,抽样频率高,间隔短,生产过程稳定后可放慢。(2)总样本容量:子组数n一般取n=25(样本数),20为小样本,100属大样本。 通常总样本数N=100即n=25,ni=4如此可保证变差的要紧缘故有机会出现。(3)绘制X-R图 1)计算Xi 各子组的Xi 的均值 Ri 子组
18、内RI =RimaxRimin 2)确定操纵表的刻度(纵坐标) X2(XimaxXimin) R:一般可取X图的2倍 3)计算操纵限X图: UCLX= X+A2R LCLX= XA2R R图: UCLR=D4R LC LR=D3R (n7无下限) 表ni234567D43.272.572.282.112.001.92D3-0.08A21.881.020.730.580.480.42 4)将操纵限画到图上 一个受控的过程应是只有百分率专门低的点失控,同意在失控点采取措施。 2.3.4.3异常情况分析(1)异常情况 1)任何点超过操纵线。 全在中心线上或下 2)“链”(连续形成的7个点) 连续上升
19、或下降 3)明显的非随机性图形,如周期波动,子组内第一个数总为最大值。 4)过程分布宽度增大,过程失控,过程分布宽度增大。2 5)数据点的分布规律。68.2% 6)图形趋势。 正态分布决定数据密集性,2/3点应落中1/3区域内95.4% 连续3点有2点超警示线(2) 连续5点有4点在1/3以外。(2)异常缘故 1)描点、计算有误 3 99.73% 2)测量系统变化(如检验员、量具变化有零飘) 3)测量量具分辨力不够,准确度、周密度不够,过度磨损(7个点偏一侧) 4)过程输入有变化(原材料不均匀,设备故障,刀具松动) 5)环境变化(温度)、变速、调速(自动)过程、取样方法分层(如材料批次混淆,几
20、根芯轴每轴测一个数) -7- 6)每个样本中有不同过程的测量值。 7)数据通过编辑(X、R波动大的数据已被剔除,更改数据) 若超出操纵限的点多,则有专门缘故存在。2.3.4.4过程能力分析若处于统计状态,才能评价过程能力CPK注意:CPK与CP之区不 CP:X=时,即中值与容差中心重合。 CPK:X时,即中值有偏移时。(1)过程的标准差: =R/d2=R/d2 d2为常数,查表可得(2)单边容差:USLXXLSL Z= 或 Z= CPK=Z/3R/d2R/d2(3)双边容差:USLX ZUSL= ZLSL= CPK=Zmin/3 R/d2 R/d2 Zmin=ZUSL和ZLSL中的较小者X L
21、SL(4)提高过程能力的途径:采取系统措施,减少形成变差的一般缘故,即通过治理措施来改变过程操纵,可采取: 1)将X调整到与目标值一致或接近。 2)保持设备性能、输入材料的一致性。 3)改进过程操作方法 4)改进培训方法,提高培训有效性 5)改善工作环境为了清晰地识不阻碍过程能力的缘故,运用因果图、排列图是极为有益的。(5)示例(见扫描图)-8-2.3.5 中位数X图2.3.5.1 概述(1)中位数如何确定 奇数:1,5,7,11,22共5个数字,按其数值大小顺序排列,位于中间的数值7即为中位数,记为X=7 偶数:2,6,10,13,17,21共6个数字,按其数值大小顺序排列,位于中间的两个数
22、字为10,13,则X=1/2(10+13)=11.5(2)采纳中位数的优点 1)简便易学易用,特不适用车间工人监控过程情况。 2)可显示过程输出的分布及变差趋势。 3)便于比较几个过程的输出情况及同一过程不同时期的输出情况(可在同一张纸上描出几个X图)。2.3.5.2 中位数图绘图特点由于X(中位数)图与X-R相类似,故仅注意其不同之处即可。(1)收集数据 1)子组内样本数 ni10时,样本数宜为奇数,以便于找出中位数。 2)只绘一张X图 刻度设置 图上刻度与量具一致,并考虑: * 产品容差+超出规范的读数(即可能的最大读数); * (1.52)(测量最大值-测量最小值); 3)将每个子组的单
23、值描在图中一条垂直线上并圈出每个子组的中位数,将各中位数连成一条折线,从其中可看出趋势。 4)将每个中位数(X)和极差(R) 值填入数值表,以了解其趋势。(2)操纵限 X:UCLX=X+A2R LCLX=X - A2Rn2345678910A21.881.190.800.690.550.510.430.410.36d21.131.692.062.232.532.702.852.973.08R:UCLR=D4R LCLR=D3R R 的操纵限用来推断是否有超出操纵限的点,其中:D4,D3及R与(X-R)图的数据相同。-9-(3)过程能力 =R/d2,d2可由上表查出。若过程服从正态分布,中位数的
24、极差处于统计状态,则可用直接来评价过程能力。过程能力计算方法与X-R图相同。(4)中位数图的替代方法若操纵限由往常数据得到,则可简化,用于监控。 1)只描Xi的点不必记录数据。 2)标出Rmax和Rmin(5)示例-10-2.3.6 不合格率P2.3.6.1概述(1)计数型数据 X-R和X图均只适用于可通过测量得到数据的量值统计分析。 对生产中有许多项目只需要推断合格与否,如击穿、外观等。在治理活动中,如量具合格与否,以及其他QM治理项目,行政治理项目都可利用计数型数据进行分析。(2)不合格率pnp 1)p的概念 n 被检项目数量n,发觉不合格数量为np,则p= 2)注意:* 区不不合格的百分数为p100 * 一个零件上多个被检项目不合格,只能记为一个不合格数。 3)将检测结果分为子组时,应以能找出不合格数为原则,。 将不合格数与子组大小相比
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 酸奶微信营销方案(3篇)
- 长治联谊活动策划方案(3篇)
- 面条作坊营销方案策划(3篇)
- 高空写大字施工方案(3篇)
- 老年人脊椎护理与康复
- 肝病患者的健康教育内容与方法
- 温水擦浴的水质监测标准
- 景区突发事件方案
- 护士职业长期规划
- 列车值班员安全操作知识考核试卷含答案
- CJJ101-2016 埋地塑料给水管道工程技术规程
- 小学人人讲安全个个会应急
- 2024年天津市初中地理学业考查试卷
- 安徽天康压力变送器说明书
- 第七章丝网印刷模版
- 《游泳运动常识》课件
- 医疗设备维保服务投标方案
- 广东省伴生矿绿色循环经济项目环境影响报告书
- 消痔灵注射防治混合痔术后肛缘水肿临床观察
- 5.7 三角函数的应用 课件(共22张PPT)
- YB 4091-1992炭素材料真密度测定方法(蒸馏水煮沸法)
评论
0/150
提交评论