工程资料分析-EDA.ppt_第1页
工程资料分析-EDA.ppt_第2页
工程资料分析-EDA.ppt_第3页
工程资料分析-EDA.ppt_第4页
工程资料分析-EDA.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

工程数据分析EngineerDataAnalysis,2,成语教学,【管窥蠡测】,2,东汉班固汉书东方朔传“以管窥天,以蠡测海,以莛撞钟,岂能通其条贯,考其文理,发其音声哉。”(莛:ting草茎),管:竹管。蠡:贝壳做的瓢。原意是竹管里看天,用瓢测量海水。引申意思是比喻对事情的观察了解很狭隘很片面。,3,你是否经常听到这样的话,有没有什么办法可以让你的推论更加准确呢?,给定一组片面的信息或数据,统计学可以摘要并描述这份数据,观察者并以此份数据推论母体。,【统计学的定义】,课程大纲,4,基础统计学假设检定变异数分析(ANOVA)简单回归分析,基础统计学的模型,母体:具有共同特征之个体所组成的群体。样本:由母体中抽取之部分个体所组成的小群体。参数:用来描述母体的特征值。统计量:由样本计算得出的特征值。,5,南京广播中心报道:近日,南京市抽样调查了5000位市民的体重状况,得知目前南京市民中有60%的体重高于标准水平。且超重主要发生在50岁以上人群。,基础统计学,6,误差,减少误差第一要务:抽样要够随机!,基础统计学(统计量符号),7,抽样方法,三种估计的方法,三种估计的方法,数据收集(练习),8,常用统计量EXCEL操作,9,1.工具数据分析描述统计,2.EXCEL中,Var.的操作为VAR()S的操作为STDEV()的操作为AVERAGE()的操作为QUARTILE(,2)Mo的操作为MODE(),10,通过统计学的计算,我们可能得到1.第一组人均身高是2.第三组身高的标准差是3.某机种12月白班的平均良率是4.新人的XX周XX周每小时平均产出是,这时,我们需要了解数据母体的分布状态,需要进行对比才能了解真实的状况,课程大纲,11,基础统计学假设检定变异数分析(ANOVA)简单回归分析,改善的漏斗,12,八大步骤+品管工具SPC统计制程管制发现问题,运用品管工具加以分析找出要因。,EDA工程数据分析将要因以客观的统计手法加以验证其真实性。,DOE田口实验设计以实验手法设定要因的水平,找出最佳化组合。,假设检定(目的),13,假设检定,提供一个以统计理论做为基础的证据!,1.请5位帅哥、5位美女上台,2.大声地报出自己的身高,3.以直觉或经验看看男女之间的身高是否有差异?,4.如何证明两者之间的差距?,假设检定(流程),14,1.建立虚无假设及对立假设。(单尾检定或双尾检定),2.设定显著水准,亦即决定型一误差。,3.选择合适的检定统计量。,4.计算检定统计量。,5.以P-value或显著值判定拒绝或接受。,假设,检定,建立假设,15,统计假设是将可能的状况划分为二个互斥的集合,而构成二个互斥的假设。H0:虚无假设H1:对立假设检定的种类单尾检定:右尾检定:假设群体母数可能变大的检定。左尾检定:假设群体母数可能变小的检定。双尾检定:假设群体母数可能变大或变小的检定。,双尾检定右尾检定左尾检定H0:5H0:5H0:5H1:5H1:5H1:5,设定显著水准,16,显著水准,表示的是发生型一误差的机率即:虚无假设是正确的,但判为拒绝。相对应的,表示的是发生型二误差的机率即:虚无假设是错误的,但判为接受。,显著水准,17,临界值,临界值,决定了此分配的临界值,是“接受”或“拒绝”H0假设之判断基准值的大小无一定的标准,一般采用=5%值越小,表示错杀的机率越小重要的判断值应设越小(=1%),P-value检定法,18,临界值(CriticalValue),接受域,拒绝域,P-Value不拒绝H0(亦即接受),检定的结果,19,反之则表示拒绝H0,表即示判定H0可能错误。,如右图所示,当计算出结果P-value时,接受H0,即表示无充分证据显示H0错误。,P-value,检定的应用-T检定,20,例1:某圈组的改善主题为提高生产力,怀疑新人作业时间长可能是真因,于是测量数据如右表。(已知:标准人均产能为12),结论:计算得出平均值为10.8,与标准人均产能相差不大,故新人效率低不是生产力低的影响因素。,检定的应用-T检定,21,Ho:A=12v.sH1:A12=0.05,P-value不拒绝H0无充分证据说明AB机台有差异,24,接下来,给大家5秒时间仔细看看刚刚的画面,25,假设,检定,H0:A=Bv.sH1:AB=0.05,由于计算公式有很大的差别,所以在选用时需要借助其它的工具!,P-value不拒绝H0无充分证据说明AB机台有差异,找出不同的地方,检定的应用-F检定,26,例3:某设备厂商声称新款机台的稳定性要远远优于老款机台,分别对各自生产的10个产品某一特性(规格中心1.35)进行测量,结果如右表。,从数据上判断,如果是你,会选择买新款的机台么?,检定的应用-F检定,27,假设,检定,H0:新=老v.sH1:新老=0.05,P-value不拒绝H0无充分证据说明新老机台有差异,两母体平均数检定,28,1.双样本等方差假设,2.双样本异方差假设,T检定,F检定,双样本方差检定,不相等,相等,学员实作(15%),29,Ho:ABv.sH1:A=B=0.05,结论:由于1.430.05,所以新老人没有差异,找出左边案例的错误,学员实作(15%),30,Ho:v.sH1:=P-Value=,结论:会打球的果然比较高其实没差别,请5位有打篮球、5位没打篮球的男生上台大声地报出自己的身高刻板的印象告诉我们,篮球员身高应该比较高请使用假设检定提供有力的证据!,T检定-成对双样本,31,T检定中较为特殊的一种。使用条件:检定单一母体成对样本平均数的变化(例:同一母体改善前后的差异),T检定-成对双样本,32,例4:某一药剂研究所进了一项降压药的实验,先记录12位大专性学生的初始血压,然后在服用此药个月后,再测其血压。根据观察结果,得出右表的资:,你觉得这种降压药有效吗?,T检定-成对双样本,33,假设,检定,H0:前=后v.sH1:前后=0.05,由样本计算而得,P-value不拒绝H0无交互作用产生,B因子之假设H0:1=2=3=4=5H1:Bj不全等(j=1r)=0.05,A因子之假设H0:A=B=CH1:Ai不全等(i=1k)=0.05,交互作用之假设H0:()ij=0(i=1k)H1:()ij不全为0(j=1r)=0.05,二因子变异数分析重复试验,47,A因子之假设H0:A1=A2=Ak=H1:Ai不全等(i=1k)=0.05,B因子之假设H0:B1=B2=Br=H1:Bj不全等(j=1r)=0.05,交互作用之假设H0:()ij=0(i=1k)H1:()ij不全为0(j=1r)=0.05,公式,变异数分析注意事项,48,误差项变异过大,P-Value无任何因子显著,1.规划实验时,需考虑交互作用之影响。2.无任何因子显著时,误差项变异会过大,表示影响实验结果之主要原因未被考虑到,需重新检讨。,变异数分析注意事项(续),49,异常值需挑出,3.变异数分析前需分析组内之数据是否存有异常值。,4.变异数分析后可探讨何种水平具有较佳结果。5.信心水平之选择,建议采5%或1%,统计上的含意代表显著与非常显著。,课程大纲,50,基础统计学假设检定变异数分析(ANOVA)简单回归分析,QC7图,51,可看出温度与落尘量的相关性,举手抢答加5分,QC7散布图(相关系数),52,可得上述案例之相关系数为r=0.88,QC7散布图(相关性),53,r=0.88其呈现之关系为正相关,负相关,请列举出身边你认为相关的例子。如:地势越高,气压越低。,54,散布图与回归分析,55,散布图可观察其相关性。回归分析可藉由计算两变量之线性关系求出回归方程式,并据此方程式推估未进行实验之值。,回归方程式,56,由Excel报表可得回归方程式:y=x+=0.15x-78.82依据此方程式可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论