已阅读5页,还剩127页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Minitab的启动:启动Minitab的方法有两种,Minitab的启动:启动Minitab的方法有两种。,在Windows开始程序中找出Minitab程序。:开始-程序-MINITAB13forWindows-MINITAB,Minitab的关闭:关闭Minitab的方法有两种。,单击Minitab画面右侧上端的X,在Minitab菜单中单击File-Exit,1。Minitab的启动与结束,序章,Minitab运行时的最初画面,1。Minitab的启动与结束,序章,ProjectManager窗口,ProjectManager窗口使Minitab各窗口之间的移动更加顺畅,可以根据分析结果轻松编辑成报告书的形式。,关于ProjectManager上面各个窗口的说明,序章,2。Minitab的结构,3。关于主菜单的说明,基础知识,这一章将说明:在Worksheet上输入数据的方法,文件的保存与打开,Worksheet的修改等基本菜单。,1。数据的输入,基本上和在ExcelSheet上输入数据的方法一样,但Minitab以列为单位组织数据,另外,有专门用于变量名称的行。Worksheet的基本结构如下:,数据的输入与删除,在工作底稿C1列上输入变量名称金应石和数据1、2、3、4、5;在C2列上输入变量名称金宗哲和数据6、7、8、9、10。,在输入变量名称的行里不要输入数据。变量名称可以分为两种:数字变量与文字变量。文字变量,列的旁边有T。例如C3列是文字列的时候用C3-T表示。,注意,删除C2列上的数据,点击C2列后单击右键,(这时,C2列变成黑色)。在画面上出现的菜单中选择DeleteCells。,1。数据的输入,基础知识,1。数据的输入,添加列或行,在Worksheet的C1列和C2列之间添加新的列。,点击C2列后单击右键,(这时,C2列变成黑色)。,在画面上出现的菜单中选择InsertColumns。,要添加行,先点击要添加的列的号码,在鼠标右键的菜单中选择InsertRows。,要把Worksheet的特定部分复制、删除、移动的时候,就把必要的部分用鼠标拖动后,利用鼠标右键菜单,完成需要的操作。,自动填充功能,在Minitab13中,输入连续增加的数据时可以像在Excel上利用鼠标的拖动来完成。,基础知识,1。数据的输入,想调整小数点后位数的时候,把活塞的内径尺寸输入到小数点后四位,现在只保留小数点后两位(注意:这时,可以自动四舍五入)。,复制正在使用的变量的时候,Minitab以前的版本当中,复制正在使用的变量的时候,会出现ErrorMessage,但在版本13中,在已存变量的名称前面,会自动出现、2等序号。,基础知识,1。数据的输入,想分开正在使用着的Worksheet的时候.,把下面的Worksheet按所属公司分部分开。,Manip-splitWorksheet.,基础知识,1。数据的输入,Data的Stack/Unstack,StackData:所有数据都在一个列,按区分数据的列整理UnstackData:把数据按各自所属的集合,整理在不同的列里,按所属公司分部,分别整理下面的Worksheet。,基础知识,1。数据的输入,Manip-UnstackColumns.,基础知识,1。数据的输入,把按所属公司分部区分开来的数据整理到一个列里。,Manip-Stack-StackColumns.,基础知识,1。数据的输入,想把数据的列和行互换的时候.,Manip-TransposeColumns.,基础知识,1。数据的输入,要打开新的Worksheet的时候.,File-New.,基础知识,1。数据的输入,Manip-Sort.,想把数据按顺序整理的时候.,要把混合在一起的数据按男、女整理的时候(1:男,2:女),基础知识,1。数据的输入,Manip-Code-NumerictoText.,想变更数据的代码的时候.,把区分男女的数据改变成(1:男,2:女),基础知识,1。数据的输入,要做简单计算的时候,在C1列的数据上乘以100,再输入到C2列.,Calc-Calculator.,基础知识,1。数据的输入,要输入有规律的数据的时候,在C1列里输入111222333444555.,Calc-MakePatternedData-SimpleSetofNumbers.,练习:把下列数字输入到C2列,22244466668882224446668882224446668882)999888777666555999888777666555,基础知识,2。文件的保存,保存文件的方法有四种:仅保存Worksheet的数据的方法,保存包括Worksheet在内的所有结果的方法,保存Session结果的方法,以及保存Graph的方法。,仅输入Worksheet的数据的方法,File-SaveWorksheetAs.,包括Worksheet在内的所有结果同时保存的方法,File-SaveProjectAs.,基础知识,2。文件的保存,保存Session的结果的方法,File-SaveSessionWindowAs.,保存Graph的方法,File-SaveGraphAs.,基础知识,2。文件的保存,打开Project文件,File-OpenProject,打开Worksheet文件,File-OpenWorksheet,注意,快捷图标上的保存和打开按钮是在打开和保存Project文件的时候使用,数据的有效整理,1。制表,确认一个变量的频率,Stat-Tables-Tally.,按Activity的程度确认频率.,亲自操作一下,比较结果,数据的有效整理,1。制表,要制作有两个变量的表的时候.,Stat-Tables-CrossTabulation.,利用Gender和Activity制表.,亲自操作一下,比较结果,数据的有效整理,2。画图像,确认数据的分布时.,确认身高的分布.,Dotplot,Graph-Dotplot.,亲自操作一下,比较结果,这种情况下,可以确认全体人员的身高是怎样分布的。图像中的每一个点都意味着一个人。所以,身高达到75的有3个人。,在这种情况下,还可以比较男女之间的差异。,数据的有效整理,Histogram,Graph-Histogram.,亲自操作一下,比较结果,2。画图像,数据的有效整理,想知道变量之间的关系的时候(这时,数据的类型都是连续型),来确认一下身高和体重的关系.,Plot(散点图),Graph-Plot.,亲自操作一下,比较结果,2。画图像,数据的有效整理,想在Plot上面确认异常点的位置的时候.,在得出的图像上面点击右键后,选择Brush.,选择Brush后,鼠标的箭头将变成手的模样.,利用鼠标拖动要确认的一些点或个别点。,被选中的点变成绿色,Worksheet的位置被表示在Brushing窗口上面。这次选择的点是第25个点和第71个点。,2。画图像,数据的有效整理,MatrixPlot:想同时确认几个变量之间的相关关系的时候.,2。画图像,来确认一下身高、体重和心跳数之间的关系.,Graph-Plot.,亲自操作一下,比较结果,数据的有效整理,想比较的时候(这时,Y是连续型数据,X是离散型数据。),比较一下按Activity划分的心跳数的平均值.,Chart,Graph-Chart.,关于方程式(Function)点击方程式旁边的箭头,出现各种Option其中使用较多的是Mean(平均)Sum(合计)Stdev(标准偏差)Median(中间值)等。,亲自操作一下,比较结果,2。画图像,数据的有效整理,2。画图像,Boxplot,Graph-Boxplot.,关于Boxplot它是把收集的数据按大小顺序排列之后分为四等份,再把相应的各个位置的点表示出来的图像。,亲自操作一下,比较结果,数据的有效整理,2。画图像,亲自操作一下,比较结果,想同时显示两个变量的关系和分布的时候.,确认身高和体重之间的相关关系以及各个变量的分布。,Graph-MarginalPlot.,数据的有效整理,2。画图像,想在图像上调整X、Y轴的大小的时候.,在图像对话窗单击Frame后,选择MinandMax。,输入X和Yzzzzz最大值和最小值。,调整大小之后.,整X、Y的最大、最小值画出图像之后,再回到MinandMax,把已经输入的最大最小值删除。否则,以后画的所有图像都以使用者输入的最大、最小值为基准画图。,数据的有效整理,3。用一个数字归纳,求出身高的平均值和标准偏差。,用数字归纳的方法,Stat-BasicStatistics-DisplayDescriptiveStatistics,亲自操作一下,比较结果。,DescriptiveStatistics:HeightbyGenderVariableGenderNMeanMedianTrMeanStDevHeightFemale3565.40065.50065.3952.563Male5670.80471.00070.8402.579VariableGenderSEMeanMinimumMaximumQ1Q3HeightFemale0.43361.00070.00063.00068.000Male0.34566.00075.00069.00073.000,1)的结果:把身高按Gender分开整理的时候,Height9168.72569.00068.7933.6790.386VariableMinimumMaximumQ1Q3Height61.00075.00066.00072.000,数据的有效整理,3。用一个数字归纳,Stat-BasicStatistics-DisplayDescriptiveStatistics,亲自操作一下,比较结果。,利用图像整理的方法,数据的有效整理,3。用一个数字归纳,数据的有效整理,3。用一个数字归纳,求相关系数的方法,Stat-BasicStatistics-Correlation.,Correlations:Height,Weight,PulseHeightWeightWeight0.786(相关系数)0.000(p-Value)Pulse-0.223-0.2030.0330.054CellContents:PearsoncorrelationP-Value,亲自操作一下,比较结果。,数据分析(假设检验),1。对假设检验的理解,以收集到的数据为根据,对要确认的事实进行判断的方法以及找出作为判断基准的p-Value的方法。,000营业部的IQC小组每天都要检查合作公司的产品质量。IQC小组根据产品有没有达到规定的质量要求,判断它是合格品还是不合格品。,即IQC小组必须对以下两个事实中的一个做出判断。-产品的质量符合要求(是合格品)-产品质量不符合要求(是不合格品)还没有确认的两个事实称为假设,分别用0假设和对立假设表示,(肯定的假设是0假设,否定0假设的是对立假设)这种情况下,如果按照常理,应在合作公司交上来的部件中抽样本,并将其与预定的规格进行比较。规格和样本的差异大,则为对立假设;差异小,则为0假设。对这些数据进行整理,换句话说,以样本为根据对0假设的概率进行计算,如果概率大则设定为0假设,概率小则设定为对立假设,这样的一系列判断方法称为假设检验。0假设的概率称为p-Value。,求出p-Value之后需要一个基准来判断它的大小。这个基准称为显著性水平,一般会选择1%、5%、10%中的一个。(通常使用5%)。显著性水平的选择跟分析者对0假设的确信程度有关。如果对0假设很确信,为了尽量使0假设正确,应选择较低的显著性水平。对0假设不是很确信的时候,为提高对立假设的正确率,应该选择较高的显著性水平。,数据分析(假设检验),2。对连续型数据的假设检验,对一个平均值的假设检验(已知某样本集合的标准误差率的时候),确认一下身高的平均值是否为70。(已知:某样本集合的标准偏差是12)-0假设:平均身高是70-对立假设:平均身高不是70,Stat-BasicStatistics-1-SampleZ.,亲自操作一下,比较结果,One-SampleZ:HeightTestofmu=70vsmunot=70(0假设和对立假设)Theassumedsigma=12VariableNMeanStDevSEMeanHeight9168.733.681.26Variable95.0%CIZPHeight(66.26,71.19)-1.010.311,*平均值:68.73*标准偏差:3.68*平均值的标准偏差:1.26*某平均值的95%置信区间:66.2671.19*p-Value:0.311(31.1%)-p-Value比5%大,所以确认是0假设,即可以判断平均身高是70。,数据分析(假设检验),2。对连续型数据的假设检验,对一个平均值的假设检验(未知某样本集合的标准偏差的时候),确认一下身高的平均值是不是70-0假设:平均身高是70;-对立假设:平均身高不是70.,Stat-BasicStatistics-1-Samplet.,亲自操作一下,比较结果,Testofmu=70vsmunot=70(0假设和对立假设)VariableNMeanStDevSEMeanHeight9168.7253.6790.386Variable95.0%CITPHeight(67.959,69.491)-3.310.001,*平均值:68.725*标准偏差:3.679*平均值标准偏差:0.386*某平均值的95%置信区间:67.95969.491*p-Value:0.1%(0.001)=p-Value相当小,所以应该接受对立假设,而不是0假设。即,平均身高不是70。从某平均值的可信区间来看,小于70。,数据分析(假设检验),2。对连续型数据的假设检验,对一个平均值的假设检验(未知某样本集合的标准偏差的时候),关于OptionMenu(想更改可信度的时候),亲自操作一下,比较结果,关于GraphsMenu(要在分析同时画图像的时候),数据分析(假设检验),2。对连续型数据的假设检验,对两个平均值的假设检验(已知某样本集合的标准偏差的时候),亲自操作一下,比较结果,确认一下男、女的平均身高有没有差异。-0假设:男平均身高=女平均身高-对立假设:男平均身高女平均身高,Stat-BasicStatistics-2-Samplet.,图像和可信度的调整参考前一页。,Two-SampleT-TestandCI:Height,GenderTwo-sampleTforHeightGenderNMeanStDevSEMeanFemale3565.402.560.43Male5670.802.580.34Difference=mu(Female)-mu(Male)Estimatefordifference:-5.404-男女身高的差异95%CIfordifference:(-6.507,-4.300)-差异的置信区间T-Testofdifference=0(vsnot=):T-Value=-9.76P-Value=0.000DF=72,*p-Value:0.000(0%)-p-Value小,所以确认对立假设是正确的。即男的平均身高和女的平均身高是不一样的。从差异的置信区间来看,男身高的平均值比女身高的平均值大。,数据分析(假设检验),2。对连续型数据的假设检验,关于散布差异的假设检验.,亲自操作一下,比较结果,确认一下男女的平均身高有没有差异-0假设:男身高的分散程度=女身高的分散程度-对立假设:男身高的分散程度女身高的分散程度,ANOVA-TestforEqualVariances.,关于男女身高的Boxplot,只能在比较对象是两个的时候得出,有三个以上对象的时候则不能得出结论。,数据分析(假设检验),2。对连续型数据的假设检验,确认是不是正态分布,亲自操作一下,比较结果,确认一下收集的Pulse是否属于正态分布。.,Stat-BasicStatistics-NormalityTest.,确认数据的正态分布,数据分析(假设检验),2。对连续型数据的假设检验,亲自操作一下,比较结果,通过确认可以知道练习3的数据不服从正态分布。这时,适当改变变量可以转换成正态分布。,Stat-ControlCharts-Box-CoxTransformation.,非正态分布的正态化,Box-Cox变换的时候首先找出适当的Lambda值。即找出对变量变换最适当的变换式。然后,根据变换式变换数据。Lambda的变换式如下。Lambda(l)valueTransformationl=2Y=Yl=0.5Y=Sqrt(y)l=0Y=logeYl=-0.5Y=1/Sqrt(Y)l=-1Y=1/Y,数据分析(假设检验),3。对离散型数据的假设检验,对一个比率差异的假设检验,000营业部为了确认A合作企业的6西格马计划的成果,检查了300个样品。结果发现了15个不合格品。以前A合作公司生产的部件不合格率是15%。-0假设:不合格率=15%-对立假设:不合格率15%,Stat-BasicStatistics-1-Proportion.,亲自操作一下,比较结果,TestandCIforOneProportionTestofp=0.15vspnot=0.15(0假设和对立假设)ExactSampleXNSamplep95.0%CIP-Value1153000.050000(0.028251,0.081127)0.000,数据分析(假设检验),3。对离散型数据的假设检验,对两个比率差异的假设检验,000营业部为了比较A、B两个生产线的不合格率,收集了相关数据。结果,A生产线是1000个当中有75个不合格品,B生产线是1500个当中有120个不合格品。-0假设:A的不合格率=B的不合格率-对立假设:A的不合格率B的不合格率,Stat-BasicStatistics-2-Proportion.,亲自操作一下,比较结果,TestandCIforTwoProportionsSampleXNSamplep17510000.075000212015000.080000Estimateforp(1)-p(2):-0.005(A、B两个生产线的差异)95%CIforp(1)-p(2):(-0.0263305,0.0163305)(差异的置信区间)Testforp(1)-p(2)=0(vsnot=0):Z=-0.46P-Value=0.646,*p-Value大,所以接受0假设。=即A、B两个生产线的不合格率不存在差异。,数据分析(假设检验),3。对离散型数据的假设检验,对表(Table)的假设检验,这次说明一下以表的形式整理数据的时使用的分析方法。,Stat-Tables-Chi-SquareTest.,亲自操作一下,比较结果,检验三个以上比率之间的差异.000营业部对A、B、C、D四种材料进行了作业性评价,结果如下:0假设:不同材料的不合格率一样-对立假设:不同材料的不合格率不一样,数据的输入:把表里的数据如实输入到Worksheet.,ExpectedcountsareprintedbelowobservedcountsABCDTotal14543484418045.0045.0045.0045.0025726205.005.005.005.00Total50505050200Chi-Sq=0.000+0.089+0.200+0.022+0.000+0.800+1.800+0.200=3.111DF=3,P-Value=0.375,p-Value:0.375(37.5%)=p-Value大,所以接受0假设。即不同材料之间不存在不合格率上的差异。,数据分析(假设检验),3。对离散型数据的假设检验,Stat-Tables-Chi-SquareTest.,亲自操作一下,比较结果,000营业部调查了不同性别所喜欢的产品色彩,结果如下:-0假设:性别与色彩是相互独立的(有关联)-对立假设:不同材料的不合格率不是相互独立的(有关联),数据的输入:把表里的数据如实输入到Worksheet,Chi-SquareTest:白色,紫色,蓝色Expectedcountsareprintedbelowobservedcounts白色,紫色,蓝色Total137414412229.2845.9546.77235727117842.7267.0568.23Total72113115300Chi-Sq=2.035+0.534+0.164+1.395+0.366+0.112=4.606DF=2,P-Value=0.100,*p-Value:0.100(10.0%)=p-Value大,所以接受0假设。即色彩与性别是独立的。,想确认两个变量的独立关系的时候.,数据分析(假设检验),3。对离散型数据的假设检验,Chi-SquareTest结果的解释方法,假设有一个工厂生产娱乐场使用的骰子。对完成品进行质量检查的时候,应该怎样检查出合格品和不合格品呢?(除了外观检查)我们知道在抛掷合格的骰子时,各个数字有1/6的出现概率。利用这一点判断出合格品和不合格品。为此,我们掷6000个骰子,把结果记录了下来。把实际值和预测值相减,如果得出的值大,是不合格品;,骰子的概率因我们事先已经了解了,因而能通过简单的计算算出来。,在不知概率的情况下,如果当想要确认两个变数的独立关系时,我们将怎么做?,首先考虑一下出现白色的概率。全部人员数是300名,选择白色的人数72名,选择白色的概率是72/300。接下来计算一下男士(1)的预计值。参与的男士总人数为122名,则计算出来的预计值(72/300)122为29.28既男士选择白色的预计值是29.28,实际值是37,它们之间的差异是(37-29.28)(37-29.28)/29.28即2.035。分析结果chi-sq的个别值越大,预计值与实际值之间的差异越大。,如果得出的值小,则可以判定为合格品。和标准偏差一样,得出的值可能是0,为了避免这一情况,进行平方。这时,有可能导致得出的值太大,因此可再除以期望值,然后对较实际值和预测值的大小进行比较。即:根据(实际值-预测值)/预测值的大小做出判断。,Chi-SquareTest:白色,紫色,兰色Expectedcountsareprintedbelowobservedcounts白色紫色兰色Total137414412229.2845.9546.77235727117842.7267.0568.23Total72113115300Chi-Sq=2.035+0.534+0.164+1.395+0.366+0.112=4.606DF=2,P-Value=0.100,分散分析,1。对分散分析的理解,根据各数据的变化程度(散布)和总平均值的差异,分为各集合本身的平均值与数据之间的差异、集合平均值与总平均值之间的差异两种,如果不同集合之间有差异,集合本身平均值与总平均值的差异所占的比率比各集合本身的平均值与数据之间的差异大。,集合本身平均值与总平均值的差的和(前一页的a+b+c)集合本身平均值与数据之间的差的和(前一页的123),ANOVA通过比较发生在集合内部的变化的和与集合本身平均值与总平均值变化的和根据各数据的变化程度(散布)和总平均值的差异,分为各集合本身的平均值与分散分析来判断各集合是否有差异。换而言之,是求出关于集合内部变化的分散、集合本身平均值和总平均值的变化的分散,再进行比较的方法。,分散分析,2。对一个自变量的分散分析,数据被Stack的情况(练习2.mtw),为了确认耐久性的差异,收到了四个公司的样品,测试了耐久性。确认一下不同公司之间有没有耐久性的差异。-0假设:不同公司的产品耐久性一样-对立假设:不同公司的产品耐久性不一样,Stat-ANOVA-One-Way(Unstacked).,亲自操作一下,比较结果,p-Value:10.1%(0.101)结论是?,分散分析,2。Minitab的结构,数据Unstack的情况,把预计会对因变量Y有影响的温度,分为3个水准进行试验.确认不同温度下,Y值有没有差异。-0假设:不同温度下Y值一样.,Stat-ANOVA-One-Way(Unstacked).,亲自操作一下,比较结果,结论是?,3。对两个自变量的分散分析,亲自操作一下,比较结果,分散分析,为了确认不同营业部、换班小组之间的生产量的差异,收集了数据。-0假设:不同营业部的生产量一样-对立假设:不同营业部的生产量不一样.-0假设:不同换班小组的生产量一样-对立假设:不同换班小组的生产量不一样.-0假设:营业部和换班小组之间没有交互作用-对立假设:营业部和换班小组之间有交互作用.,Stat-ANOVA-Two-Way.,结论是?,4。Balenced和GeneralLinerModel,亲自操作一下,比较结果,分散分析,Minitab不管有多少变量,都可以用Balanced和GLM(GeneralLinearModel)分析。Balanced是指在各因素的水准组合下反复数一样的情况,反复数不一样的情况就使用GLM。可以得出结论:分散分析可以用GLM一个菜单进行所有分析。,BalancedANOVA分析,用BalancedANOVA菜单分析47页的例子(Stat-ANOVA-BalancedANOVA.),结论是?,4。Balenced和GeneralLinerModel,亲自操作一下,比较结果,分散分析,利用GeneralLinearModelMenu分析,用BalancedANOVA菜单分析47页的例子(Stat-ANOVA-GeneralLinearModel.),结论是?,4。Balenced和GeneralLinerModel,亲自操作一下,比较结果,分散分析,利用GeneralLinearModelMenu分析,用BalancedANOVA菜单分析47页的例子(Stat-ANOVA-GeneralLinearModel.),确认一下各个组合的结果(在对话窗里点击Results),LeastSquaresMeansfor生产量换班小组营业部MeanSEMean1A38.507.2001B48.507.2002A76.507.2002B60.007.2003A32.507.2003B47.007.200,4。Balenced和GeneralLinerModel,亲自操作一下,比较结果,分散分析,对效果的图像分析(在对话窗里点击FactorPlots),4。Balenced和GeneralLinerModel,分散分析,对效果的图像分析(在对话窗里点击FactorPlots),1。分析的概念,回归分析,现在说明一下通过求出有相关关系的X和Y的函数式,判断函数式恰当性的回归分析。,使用年度维修费用使用年度维修费用(单位:年)(单位:1000元)(单位:年)(单位:1000元)xyxy339690124914051153112810557015071864862432676126,右边的表是关于切割机器的使用年度和维修费用的资料。,现在说明一下通过求出有相关关系的X和Y的函数式,判断函数式恰当性的回归分析。,求两个变量之间关系式的时候,实际值与函数式之间总存在如左图所示的Error。这个Error的累积和最小的时候,我们就能够做出可以信赖的函数式。,3。一个自变量的回归分析,回归分析,根据前一页的函数式选定方法上的资料进行回归分析.,Stat-Regression-Regression.,3。一个自变量的回归分析,回归分析,1)我们找出的函数式,即存在维修费用=29.113.6(使用年度)的函数关系,2)判断函数式的可信度,判断各系数的可信度,常数项的p-Value是9.3,这时0假设是系数为0,所以常数项没有多大意义。相比之下X的系数的p-Value相当小,所以不可能是0。可以得出结论,X确实对Y有影响,解释决定系数(RSquare),把我们找出来的回归式作为基准,可以看出X、Y的关系分为两个区域,如下图(1)号区域是可以用函数式解释的部分,(2)号区域是不能用函数式解释的部分,即Error。像这样,所有的点可以分为可以解释的区域和不能解释的Error。这时,可以解释的部分在整体中所占的比率就是决定系数,这个值越大,函数式的可信度越高。一般64以上,就可以说有可信性。但决定系数的缺点是随着自变量的个数越多,它的值也跟着变大,为了避免这一点,采用调整决定系数(AdjustedRSquare)它的判断基准和决定系数是一样的,但它在自变量是两个以上的时候才有意义。,3。一个自变量的回归分析,回归分析,对ANOVATable的解释,如上面的分散分析图,表示了可以解释的分散和不能解释的分散的比。这时0假设是回归式为0,所以p-Value越小,可信度越高。,UnusualObservations,把给定的函数式当基准,在函数式预测的值和实际值之间的差异太大的时候,应告诉那些点的情报。,3。一个自变量的回归分析,回归分析,A集合与回归线之间的差异可以分为两种,LackofFitTest,从统计学的角度看来,我们使用的决定系数是一个相当不稳定的统计量。能更加确实地判断函数式可信度的方法就是LackofFitTest。它是在自变量的同一点上经过反复查找,找出一个集合之后,再找出集合的平均值和回归式之间的距离的方法。距离的长短可以像我们经常使用的假设检验求出p-Value。距离短的时候,即p-Value大的时候可以确认我们找出的函数式有可信性。,A集合内部的和A集合的平均值与回归线的差异,这个值越大,目前模型的可信度越差。,Stat-Regression-Regression(见P63),3。一个自变量的回归分析,回归分析,LackofFitTest,3。一个自变量的回归分析,回归分析,函数方程式在散点图中的体现,为了与实际数据做比较,我们在分散图中进行表示时,再使用我们拟合出的回归函数方程式。,Stat-Regression-FittedLinePlot.,3。一个自变量的回归分析,回归分析,函数方程式在散点图中的体现,黑色线:我们所找到的回归方程式红色线:X平均值的95%置信区间蓝色线:X的个别数据95%置信区间,3。一个自变量的回归分析,回归分析,由新自变量求估计区间时,利用两个变量间的函数方程式,可以求出有关新自变量的因变量估计区间。让我们估测一下使用时间为10年时的维修费用。,Stat-Regression-Regression.,3。一个自变量的回归分析,回归分析,由新自变量求估计区间时,使用时间为10年时,维修费用为165.48k元平均维修费用的95%置信区间为123.66207.29k个别维修费用的95%置信区间为89.52241.44k元,3。一个自变量的回归分析,回归分析,拟合二次或三次回归方程时,两变量的散点图结果极有可能是曲线时,拟合曲线回归方程要好于拟合直线回归方程。,Stat-Regression-FittedLinePlot.,3。一个自变量的回归分析,回归分析,求算结果(拟合2次方程时),拟合二次或三次回归方程时,4。两个以上自变量的回归分析,回归分析,即使有很多的自变量,但我们拟合(回归)函数方程式的基本原理是不变的。即拟合函数方程式,以使回归方程式与实际值不同;在Minitab中拟合函数方程式的时候,如果按自变量的个数进行选择,回归方程式和有关的分析结果就会出现。下面是有关总销售额的数据。(随广告费用、商店的大小而不等)让我们求出总销售额、广告费用、商店大小和回归方程式,并确认函数方程式的置信程度,然后支出广告费用90万元,如果商店的大小为11坪(土地面积,6平方朝鲜尺,一朝鲜尺=0.303米)的话,让我们来求一下有关总销售额的估计区间。,Stat-Regression-Regression(见P71),我们拟合的回归方程式为?有关各系数的假定检验结果为?ANOVA分析后,现有回归方程式的假设检验结果为?,4。两个以上自变量的回归分析,回归分析,4。两个以上自变量的回归分析,回归分析,4。两个以上自变量的回归分析,回归分析,练习问题参看如下数据,求出水消费量、平均温度、作业天数和作业量之间的回归方程式,然后请确认其置信度。,5。从几个自变量中拟合出最佳函数方程式,回归分析,当存在几个自变量时,有的自变量与因变量有关,有的则与因变量无关。而且,根据我们所选择的自变量,我们可拟合出非常多的回归方程式。在此当中,如果我们能拟合出最为简便而置信度又很高的回归方程式,就可以很容易地在业务中进行应用了。让我们利用下面给出的数据,来拟合最佳的回归方程式式。(只是要假设为是直线),5。从几个自变量中拟合出最佳函数方程式,回归分析,分阶段拟合置信度高的回归方程式时.(练习6.mtw),让我们在几个函数方程式中以阶段的不同来确定置信度高的回归方程式。,Stat-Regression-Stepwise.,5。从几个自变量中拟合出最佳函数方程式,回归分析,求算结果,拟合好的方程式的分析方法我们用S、R-Sq、R-Sq(adj)、C-P值从上面的分析结果中选择好的回归方程式。S是回归方程式所具有的标准差,所以其值越小,方程式越好。R-Sq和R-Sq(adj)作为决定系数,其值越大,方程式越好。C-P接近于选择的自变量+1的值,就是好的回归方程式。,好回归方程式的选择-在只想选择一个自变量时,看一下分析结果就会发现只能选择X4。但因S价、决定系数存在问题,所以这并不是什么太好的回归方程式。-当想选择两个自变量时,有两种选择方法即或选择X4、X1或选择X1、X2。比较二者可发现,决定系数、S并没有太大的差别,但C-P值则有很大的不同。因自变量是2个,而且C-P价又要达到3近似值,所以选择X1、X2应该不会错。-当选择三个自变量时,可以选择X4、X1、X2。-从总体上来看,选择3个自变量与选择2个自变量并没有太大的差别,所以选择X1、X2作为自变量应该是最佳的回归方程式。-因此,选择的函数方程式为:Y=52.58+1.47x1+0.662x2,5。从几个自变量中拟合出最佳函数方程式,回归分析,拟合出几个置信度高的回归方程式组合并进行比较时.,让我们拟合出几个回归方程式的组合,并选择最佳的回归方程式。,Stat-Regression-BestSubset.,5。从几个自变量中拟合出最佳函数方程式,回归分析,求算结果,依据前面的分析方法,可发现:自变量从一个增为两个时,决定系数俱增,但从三个自变量开始就看不到什么差别了。所以,选择X1、X2的好像是最佳的。关于因变量Y和自变量X1、X2的回归方程式可以拟合如下:y=52.6+1.47x1+0.662x2,1。RunChart,质量工具,这次介绍一下QualityControl中常用的菜单(练习7.mtm),Stat-QualityTools-RunChart.,Runchart就是为发现长期积累的数据是否存在异常原因而制作的坐标图。(让我们用练习7.mtw中的C1C2来做出Runchart)。,利用Clustering的P-Value来判断异常处的原因有无状况。出现了希冀的结果,也就意味着出现了有规律的集合;在这种情况下,工序中出现异常原因的可能性很大。,1。ParetoChart,质量工具,Stat-QualityTools-ParetoChart.,出现了希冀的结果,也就意味着出现了群集;在这种情况下,工序中出现异常原因的可能性很大。paretochart是为明确占全体80%的因素而做的图解。1)在练习7.mtw的C3、C4中,存在着以不合格品数汇集的数据。在此当中,大部分的不合格品数是什么?2)另外,在C5中也存在记录不合格品数的数据。在此当中,大部分的不合格品数又是什么?,2。ParetoChart,质量工具,占不合格的64%的是MissingScrew。,占不合格的70%的是Pee和Scratch。,3。工序能力指数的求出,质量工具,工序能力分析(与直方图一起),让我们用练习8.mtw的数据来分析工序能力指数。,Stat-QualityTools-CapabilityAnalysis(Normal).,标准差的区分(withinVsOverall),看一下求算结果可发现:计算了2个标准差。一个是求出Subgroup内标准差,并进行平均处理的Group内标准差;另一个则是在无关于Subgroup的情况下从全部数据中算出的标准差。第一个标准差称作within,是求Cp、Cpk的标准。第两个标准差称作Overall,是求pp,Pak的标准。,3。工序能力指数的求出,质量工具,工序能力分析(试看工序现象时),让我们用练习8.mtw中的数据来分析工序能力指数。,Stat-QualityTools-CapabilityAnalysis(Sixpack).,3。工序能力指数的求出,质量工具,工序能力分析(在数据不是正态分布时求出),数据是连续型的,在异常数据的确认过程中虽然通过了检验,但在正态性的Test中仍未体现正态分布时,可以用BoxcoxTranformation来求出r价,然而再进行分析。,3。工序能力指数的求出,质量工具,工序能力分析(在数据不是正态分布时求出),4。GageR&R分析,质量工具,一般方法,为把握计测器的可靠性,我们选择了三名分析人员、10个部件进行了测定(练习8.mtw)。,Stat-QualityTools-GageR&R(Crossed),质量工具,4。GageR&R分析,Gage的可靠性分析,%Contribution分析-从分散标准来看,部件间的分散占89.33%,GageR&R的分散占10.67%。其中,重复性占3.10%,再现性占7.56%。%Study分析-在全部当中,Gage的变动占32.66%,其中重复性占17.62%,再现性占27.50%。%Tolerance分析-对比现有公差(直译)并进行比较可以看出,现在的总变动(totulvoriation)与公差(直译)对比占35.10%,而Gage与公差(直译)对比则占11.44%。NumberofDistinceGagegories分析-以各相同区组来区分各自测定值的置信区间时,所分的个数。一般在4个以上时认为是合适的。,质量工具,4。GageR&R分析,图解的结果分析,ComponetsofVariation的分析-这是从分散和标准差出发,对构成了散布原因的总体GageR&R、再现性、重复性、部件变化所占比率进行整理的结果图解。RChartByOperator的分析-这是表示分析人员所测定各部件结果值范围的图解。通过此图,可以明确各分析人员的重复性程度。Xbarchartbyoperator的分析-这是表示分析人员所测定各部件结果平均值的图解。比较整体的倾向性,可以明确再现性程度。ByChart的分析-表示各部件测定结果的图解。可以说,测定值的结果值越多,再现性和重复性越有问题。ByOperator的分析-这是表示各分析人员测定结果的图解。中间的点意味着各分析人员的均值,可以做有关重复性的判断。Operation*PartInteraction的分析-这是表示分析人员和部件间交互作用的图解。在这里,我们可以得知:各分析人员所做出的4号部件与10号部件的结果值是不同的。,质量工具,4。GageR&R分析,缺落样品的GageR&R,在一次测定之后,进行有关的缺落样品GageR&R时,分析人员要每次测定不同的样品。为了尽可能的使样品同质化,要使用Nested的Concept。即把一个样品分为几个样品来测定。让我们用练习8中的资料来分析Gage的可靠性。,Stat-QualityTools-GageR&R(Nested).,质量工具,4。GageR&R分析,质量工具,4。GageR&R分析,以各部件分析人员的不同比较测定值时.,Stat-QualityTools-GageRunChart.,通过图解,可以明确每位分析人员的重复性、分析人员间的再现性以及分析人员与部件间的交互作用。,1。Introduction,试验的设计与分析,试验的概述,积极收集数据的方法是试验。做试验时,不仅要节约时间和费用,而且出于去除噪音、保护试验的考虑,需要考虑试验设计。我们不是计划(planning)试验,而是设计(Design)试验。因此,虽有适用于各种情况的多种试验设计法,但在做试验时一般都是经过下面3步来达到最佳。决定因素的选择-要因配置法(2水平计)、交落法、部分实施法向最佳点移动-Centerpoint设计和最大倾斜法最佳点的确认-反应表面试验(一般也称中心合成法)在这里我们将介绍设计和分析上述试验设计的方法。,这次介绍一下6活动中重点部分的试验设计和分析方法。(以各种设计法中最常用的设计法为重点),试验中使用的基本用语,000事业部对影响冷却力的A、B两个因子进行了试验。这时,A、B分别被分为3个,并在各自的试验条件下进行了二次试验。试验的关注对象?冷却力-称作因变量或被解释变量调整的变量?A,B-称作自量变或解释变量自变量的试验条件?3-水平(Level)在各自试验条件下的试验次数?2-重复数,2。因素配置法(2水平计完全配置法),试验的设计与分析,什么是2水平要因配置法?,2水平计因素配置法是指把自变量的水平设成2水平来进行试验的方法。(在所有的试验条件下进行),Design方法,试对影响冷却力的A、B二因子进行试验。(水平:2水平;重复次数:2次),Stat-DOE-Factorial-CreateFactorialDesign.,2。因素配置法(2水平计完全配置法),试验的设计与分析,Design完成后的状态,试验结果的分析(练习3.mtw),Stat-DOE-Factorial-AnalyzeFactorialDesign.,ANOVA分析,2。因素配置法(2水平计完全配置法),试验的设计与分析,2。因素配置法(2水平计完全配置法),试验的设计与分析,因A、B的P-Value值小,所以我们可以知道:在A、B的影响下,因变量值是变化的。但我们也知道:A、B的交互作用对因变量并没有太大的影响。可将此用图表示如下:,2。因素配置法(2水平计完全配置法),试验的设计与分析,图解分析,Stat-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CJT 549-2023 城市管理执法制式服装帽
- 租赁从业人员考试题及答案
- 公务员面试模拟及解答题面试题及答案
- 公务员面试美丽乡村题库面试题及答案
- 华东医药校招真题及答案
- 公务员面试廉洁面试题及答案
- 公务员面试禁止面试题及答案
- 公务员面试惠州面试题及答案
- 2025年武汉编辑记者岗位招聘1人参考题库及答案详解(夺冠)
- 2025广东韶关市始兴县青年就业见习基地招募见习人员3人参考题库及答案详解1套
- 2025年下半年南通市通州区兴仁镇招聘城管协管员2人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年房屋中介居间合同协议
- 驾驶证理论考试科目一试题及答案
- 电工考证专栏2025年低压电工复审考试题库精细讲解(1)附答案
- 物流搬运劳务合同范本
- 内蒙古农村信用社招聘考试(真题)
- 厂内物流规划介绍
- 2025年任职理论考试题库及答案
- 认识农具的课件
- 电力营销安全培训教学课件
- 设备安装安全生产培训课件
评论
0/150
提交评论