《数据分析》PPT课件_第1页
《数据分析》PPT课件_第2页
《数据分析》PPT课件_第3页
《数据分析》PPT课件_第4页
《数据分析》PPT课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6sigma单因子数据分析,数据包括两类:计量型数据、计数型数据 计量型数据:又称为连续型数据,需要使用仪器测量的数值,如长度、宽度、高度、电压、内阻等; 计数型数据:又称为离散型数据,如分类、不良率、班次、设备等。 我们所做的任何数据研究都是通过样本来推论总体!,6sigma单因子数据分析方法,6sigma单因子数据分析,分析路径图,注: 离散数据(Discrete data)是计数型数据( Attribute Data)的另一种叫法. 连续数据(Continuous data)是 计量型数据( Variable Data)的另一种叫法.,数据 X,单一 X,多个 Xs,数据 Y,单一 Y,

2、多个 Ys,数据 X,离散数据,连续数据,数据 Y,离散数据,连续数据,T检验/ 方差分析 均值/ 中位数 检验,数据 X,离散数据,连续数据,数据 Y,离散数据,连续数据,卡方分析,回归,多元回归,中位数检验,多元,ANOVA,逻辑回归,多变量分析 (注: 不同于多变量图表),中心极限定理,中心极限定理:不论总体的分布如何,样本的均值会趋中分布(但不一定是正态分布) x x/ n 中央极限定理就是 通过样本 总体,总体推论性统计,假设检验,方差分析,t-检验,置信区间,F-检验,中心极限定理,中心检验,离散检验,置信区间,由于采用样本来推论总体,被推论的参数总是与其真实值有一定的偏差,因此从

3、样本中是无法准确的确定被推论参数的真实值,但是我们可以知道被推论值所在的一个范围T1,T2,此范围我们称之为置信区间,T1为置信区间的下限,T2为置信区间的上限。 如:在某村抽查10个人的身高:1.65m,1.73m,1.70m,.1.78m,其平均值为1.70m,现在我们想通过此10个数据来推论(估计)整个村子的平均身高。 只有这10个数据我们是不能精确的将整个村子的平均身高H平确定出来的。但我们可以有如下的假设:1.65m H平1.75m;1.60m H平1.80m; 1.00m H平2.00m.,置信区间,对于推论,置信下限为1.65,上限为1.75,但此推论正确的可能性是多大呢?我们暂

4、时定为80,对于推论呢?此推论的正确性肯定大于推论,我们暂定为95,推论 呢?其正确性肯定大于推论 ,此推论基本上可以说是100正确。 因此我们在做推论的时候要给一个系数,以1- 来确定此 推论成立的概论,即置信水平。 通常情况下我们一般取5。,假设检验,统计是精算风险的科学;统计不给绝对的结论,仅提供以概率为基础的判别;任何统计推论都含有一定的错误风险。 假设检验:先假设总体的分布形式或者总体的参数具有某些特征,然后利用样本提供的信息来判断原先的假设是否合理,若合理,则承认假设的正确性;否则便否定原先的假设。因此从某种意义上说,假设检验就是某种带有概率性质的反证法。 我们定义H0为原假设,H

5、a为H0的反面,称之为备择假设,P值H0为真的概率。通常情况下H0为非显著性假设,如无变化、相等、相同、无关等;Ha为显著性假设,如有变化、不相等、不相同、有关。,假设检验,分析路径,将实际问题转化为统计问题H0,定义,收集数据,使用minitab计算P值,判定是否接受H0,若拒绝H0采取的行动?,假设检验,例1 领班想知道新进员工的操作时间是否等于标准时间 X是什么 数据类型 Y是什么 数据类型 H0是什么 Ha是什么 例2 人事部门想了解年龄(old和young)与人员受聘的关联性 X是什么 数据类型 Y是什么 数据类型 H0是什么 Ha是什么,假设检验,连续型Y和离散型X 此种情况使用t

6、检验和方差分析。我们可以将其分为1水平x的比较、2水平x的比较与多水平的x比较。 1水平的x比较:基本上就是与标准值的比较; 2水平的x比较:a水平b水平; 多水平的x比较:a水平b水平.n水平,不论水平多少,都是单因子捡定,1 水平 X 的比较,Minitab,焦点或问题是?,分布是否趋中,研究中心趋势,正态分布,非正态分布,Test for Mean 1 Sample T-Test 1 Sample Z-Test 范例: (Ho: Mean =26.0),Z- or T-Test (if n25) 转换成正态数据并使用 Z Test Non-Parametric Tests 非参数捡定 1

7、-Sample Wilcoxon Signed-RankExample: (Ho: Median =26),P值 .05 真实品均值 (或中位數) 不等于特定值,SPC Chart I-MR,是否有任何明显的变化趋势或模式,足以证明资料並非來自单一的总体/流程?,描述统计与正态检验,资料是否正态分布? P-Value (.05)值, 数据为非正态分布 注意样本大小的问题,假设检验,分析路径:1水平,数据是否有代表性,no,重收数据,no,yes,均值捡定,中位数捡定,假设检验,例:组长想知道小成的操作时间是否与标准要求一致(26s) H0: T小成=26s; Ha: T小成26s 取5 收集数

8、据 minitab工具分析 数据是否有代表性,路径图,假设检验,是否趋中,路径图,假设检验, 如趋中,则进行均值捡定(1 sample T-test),路径图,假设检验,如不趋中,则进行中位数捡定(1-sample Wilcoxon),路径图,假设检验,接受/或者拒绝H0所采取的行动.,2 水平 X 的比較,SPC Chart I-MR,Minitab,分布是否趋中,研究 离散度,假设检验,焦点或问题是?,分析路径:2水平,是否有任何明显的变化趋势或模式,足以证明资料並非來自单一的总体/流程?,no,yes,假设检验,例:小成与小王的操作时间是否一致 H0: T小成= T小王; Ha: T小成

9、 T小王 取5 收集数据 minitab工具分析 数据是否有代表性(本别对小王、小陈的数据进行检验),假设检验,是否趋中(分别对小成与小王的数据进行检验),路径图,假设检验,如不趋中,则进行进行第非参数检验,路径图,假设检验,3.如全部趋中,则进行离散度研究,即等方差检验,路径图,假设检验, 如方差相等,则进行”2 SAMPLE T-Test 方差相等检验“,路径图,假设检验,如方差不等,则进行”2 SAMPLE T-Test 方差不相等检验“,路径图,假设检验,接受/或者拒绝H0所采取的行动.,等方差,方差不等,1 Way ANOVA Ho: ?A= ?B =?c,Small P-Value

10、 (.05) 兩個總體的中心趨勢不相同,(1 Way ANOVA ) (If N 25 or transformed) Kruskal-Wallis / Moods Median (Med A = Med B = Med C),(1 Way ANOVA) Kruskal-Wallis / Moods Medians (Med A = Med B = Med C),Kruskal-Wallis / Moods Median (Med A = Med B = Med C),Normal,Non-Normal,堆栈数据与等方差检验,3+ 水平 X 的比較,SPC Chart I-MR,描述统计与正态

11、检验,数据是否为正态分布 ? P-Value (.05),数据为非正态分布 注意樣本大小的問題,Minitab,焦点或问题是?,是否趋中,研究 離散度,研究 中心趨勢,假设检验,分析路径:大于2水平,是否有任何明显的变化趋势或模式,足以证明资料並非來自单一的总体/流程?,no,yes,假设检验,例:Bob、Jane、Walt图布的厚度是否一致。 H0: TBob= TJane = TWalt; Ha: ? 取5 收集数据 minitab工具分析 数据是否有代表性(本别对Bob、Jane、Walt的数据进行检验)I-MR 2.是否趋中(分别对Bob、Jane、Walt的数据进行检验)正态性检验

12、3.如只要有一个不趋中,则进行第步的“非正态检验”,,假设检验,路径图,假设检验,3.如果数据全部趋中,则进行离散度研究,即等方差检验 .如果方差不是全部相等,则进行“非参数检验”,如果所有的方差都相等,则进行“单因子方差”检验。,路径图,假设检验,接受/或者拒绝H0所采取的行动. 还有一种情况就是成对的数据,即变化之前有一组数据A,变化之后有一组对应的数据B,此中种情形我们不能采用2 sample T 检验,只能对AB0进行 1 sample T检验。,假设检验,连续型Y 与连续型X 此种情况我们一般采用回归分析,在统计学中通常被称为“计算最佳拟合曲线”。,此处也还是单因子回归分析,假设检验

13、,相关 当我们有一大堆的x(尤其是历史数据),想很快速的找出哪些x会对我们的输出y有影响,这时我们会用到相关性分析。,其中我们关心的是“相关系数”,在一般情况下“相关系数要大于0.8,我们才认为两者的相关性够强,假设检验,分析路径:回归,统计假设,收集资料,Fitted line plot/Regression,残差评估,no,评估R2与P值的显著性,制定决策,R2代表强度,P代表显著性,收集资料前要先研究x的范围,回归函式的有效性只存在于研究区间内;取样时要随即 /均匀的取样。,假设检验,Fitted line plot 路径,假设检验,进行如上操作后,会出现两个图:拟和线图与残差图 看拟和线图,当中有拟和方程,拟

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论