《工厂应用统计学》PPT课件_第1页
《工厂应用统计学》PPT课件_第2页
《工厂应用统计学》PPT课件_第3页
《工厂应用统计学》PPT课件_第4页
《工厂应用统计学》PPT课件_第5页
已阅读5页,还剩180页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

進階品質技能訓練之,工廠應用統計學,统计是,什么是有意义的情报,小学生:拉力强度很好,初中生:拉力强度平均为5Kg/cm2,高中生:大多数产品的拉力强度在50.6Kg/cm2之內,大学生:99.73%的产品其拉力强度在50.6Kg/cm2之內,构成有意义情报的三要素,離中趋势(如:),回顾:集中趋势(Accuracy)与离中趋势(Precise),若抽样50名员工的身高后,以纵轴(Y)为人数,横轴(X)为身高绘制成次数的分配图,最有可能的分配图形为:,何为常态分配?如何判定资料呈常态分配?,标准常态分配机率图,什么是有意义的情报,99.73%的产品其拉力強度在50.6Kg/cm2之內,99.73%,4.4,5.6,制程能力指标-双边规格,Cp(稳度),Ca(准度),Cpk(综合指标),Cpk=(1-Ca)xCp,制程能力指标-单边规格,Cp(稳度),Ca(准度)不探讨,Cpk(综合指标),Cpk=Cp,为何一定要常态分配呢?,因为Ca,Cp,Cpk的计算是必须要建构在常态分配的基础下!,代表仅存在共同因过程下的制程能力,范例一,下列30笔数据为工程师量测某产品品质特性的纪录:,进行基本统计量分析.,利用StatBasicStatisticsGraphicalSummary.進行基本統計量分析,偏态(Skewness)与峰度(Kurtosis),范例二,下列30笔数据为工程师量测某产品品质特性的纪录:,步骤一:基本统计量分析,箱形图(Boxplot),Median,MaximumDataValue,75thPercentile,25thPercentile,Outermostdatavalueswithin1.5xIQRofthe75thand25thPercentiles.,Outlier,NOOUTLIERS,IQR,OUTLIERS,MinimumDataValue,Outlier,1.5xIQR,步骤二:利用StatBasicStatisticsNormalityTest.进行常态检定,步骤三:利用GraphHistogram.进行常态适合度检定,步骤四:剔除特殊原因所造成的三笔数据,进行基本统计量分析,步骤五:进行常态适合度检定,范例三,一工程师想了解利用田口工程进行制程参数再设计后的效果,估试产(PilotRun)产品1000个,随机抽样30个产品量测其S/M环直径,数据如下:,范例三问题:,1.从这些样本数据中,我们希望得到哪些制程的情报?,2.这些样本数据是否为常态分配?平均值?标准差?,4.若S/M直径规格为633,则S/M环直径的制程能力指标如何?,5.样本产品良率?试产产品良率?预测未来量产产品良率?,6.依据抽样的结果,请问在95%信赖水准下S/M环直径平均值范围?,7.从过往的数据中得知原制程的平均值为62.3mm,请问新旧制程在品质特性S/M环直径上是否有差异?,3.请问68.26%、95.44%、99.73%试产的产品其直径分布范围如何?,范例三Minitab练习步骤:,1.依据范例三的30笔数据建立资料档案储存档名:范例3;栏位名称:SM,2.数据基本统计量分析StatBasicStatisticsGraphicalSummary,3.常态分配适合度检定StatBasicStatisticsNormalityTest,5.95%信赖水准平均值范围(大样本与已知标准差情况下作计算)StatBasicStatistics1SampleZ,4.计算其制程能力指標(Ca/Cp/Cpk),并预测产品良率StatQualityToolsCapabilityAnalysisNormal,6.旧制程的平均值为62.3mm,新旧制程是否有差异?StatBasicStatistics1SampleZ,1.依据范例三的30笔数据建立资料档案储存档名:范例3;栏位名称:SM,2.数据基本统计量分析StatBasicStatisticsGraphicalSummary,3.常态分配适合度检定StatBasicStatisticsNormalityTest,利用常态分配下涵盖百分比与分布范围的关系,63.1001.729(61.37164.829),63.1003.458(59.64266.558),63.1005.187(57.91368.287),4.计算其制程能力指标(Ca/Cp/Cpk)StatQualityToolsCapabilityAnalysisNormal,未知母体(现在将来),X1.X5,X1.X5,X1.X5,R1R2考虑样本组内的差异,两者对标准差估计的方式不同,稳定过程的制程能力指标,Cpk,(Within),性能指标,(Overall),Ppk,X1,X2X30,Xn,样本产品良率?试产产品良率?预测未来量产产品良率?,96.67%,89.22%,91.68%,良率?Cpk?,良率?Cpk?,预估,推测,产品良率制程能力指标,量产(MassProduction),试产(PilotRun),抽测(SamplingTest),缩影,抽样,Note:此Cpk意味着不含未来可能产生特殊因变异下制程能力指标.,母体,X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22X23.Xn-1Xn,集中趋势统计量(平均值),离中趋势统计量(标准差),母体,集中趋势统计量(平均值),离中趋势统计量(标准差),Normal(,2),Z=标准随机变数,表一:累積標準常態機率Z分佈表,说明:=0.05,(1-)的机率范围内涵盖几倍的?a.1-0.05/2=0.975b.右侧被涵盖的机率为0.975.c.Z=1.9+0.06=1.96,即95%机率下涵盖1.96,练习:计算不良率,P1=1-0.97225=0.02275,P2=0.00043,总不良率P=0.02275+0.00043=0.02318=2.318%,常态分配(NormalDistribution),设X为一连续随机变数,若其机率密度函数为:,其中,为参数,-0,则称X为常态随机变数,称f(x)为常态分配,或常态机率密度函数,记作XN(,2).,标准常态分配(StandardNormalDistribution),常态分配标准化,将随机变数X减去其平均数,再除以标准差,即令,则随机变数Z称为标准化计分,此时Z的期望值为0,标准差为1.若X为常态分配,则标准化计分为标准常态分配.,范例四,公司向一厂商订购一批特殊规格的电阻,其规格为160.5,价格比其它产品高10%,厂商送100个试产样本,经IQC测得这100个电阻的阻值如下表:,范例四问题:,1.公司是否要接受此批产品?必须考虑哪些因素?,2.根据这100笔资料是否可精确预估未来量产后的不良率?,3.预估不良率与分析样本实际不良率的比较中,您可看出哪些玄机?,4.这些玄机的可能原因是什么?如何确认?,5.确认上述的玄机后是否会改变您原始的决定?,6.如果要降低不良率,该从哪些方向从事改善?,7.若使用材料A必须将电阻值的标准差改善到多少才可以达到目标Cp=1.667?,范例四Minitab练习步骤:,1.依据范例四100笔数据建立资料档案储存档名:范例四,2.数据基本统计量分析,3.先观察此些数据的制程能力指标(层别前后),思考:1.由于此100笔数据所呈分配不是呈常态分配,如何分析与解读?2.改善方向:管理问题(特殊因变异)是否有生产纪录进行层别?技术问题(共同因变异)?,步驟一:开启已建立档案范例四.MTW,進行基本統計量分析,步骤二:对100个样本欧姆值进行制程能力分析,预估量产不良率?,步骤三:剔除可能是特殊因引起的2笔数据后进行统计量分析,步骤四:剔除可能是特殊因引起的2笔数据后进行制程能力分析,步骤五:材料A的50笔数据进行基本统计量分析,步骤六:材料A的50笔数据进行制程能力分析,步骤七:材料A50笔剔除特殊因后的48笔数据基本统计量分析,步骤八:材料A50笔剔除特殊因后的48笔数据制程能力分析,步骤九:材料B的50笔资料进行基本统计量分析,步骤十:材料B的50笔数据进行制程能力分析,利用Graph/Histogram将材料AB的数据显示在同一直方图上,层别前后分析比较表:,问题7:若使用材料A必须将电阻值的标准差改善到多少才可以达到目标Cp=1.667?,层别法的意义目的,试着区分出问题点是否由不同因素(表项因素)所造成.找出数据差异之因素,进而对症下药.针对不同层别对象,来分析其差异性.利用层别法可分析出改善前后的差异.,*层别法=纪录的单因子两水准的分析比较法,层别法的要领,范例三,一工程师想了解利用田口工程进行制程参数再设计后的效果,试产(PilotRun)产品1000个,随机抽样30个产品量测其S/M环直径,数据如下:,范例三问题:,1.从这些样本数据中,我们希望得到哪些制程的情报?,2.这些样本数据是否为常态分配?平均值?标准差?,4.若S/M直径规格为633,则S/M环直径的制程能力指标如何?,5.样本产品良率?试产产品良率?预测未来量产产品良率?,6.依据抽样的结果,请问在95%信赖水准下S/M环直径平均值范围?,7.从过往的数据中得知原制程的平均值为62.3mm,请问新旧制程在品质特性S/M环直径上是否有差异?,3.请问68.26%、95.44%、99.73%试产的产品其直径分布范围如何?,未知大量的母体(如某批产品),?,平均值的推定区间:,中央极限定理,母体,母体是常态母体(未知的、过去的、未来的),也可能不是常态的.,母体,中央极限定理,一次抽1个(n=1),然后抽无限次,母体,中央极限定理,一次抽5个(n=5),然后抽无限次,母体,中央极限定理,一次抽10个(n=10),然后抽无限次,母体,中央极限定理,一次抽30个(n=30),然后抽无限次,母体,中央极限定理,一次抽10000个(n=10000),然后抽无限次,中央极限定理,母体标准差以抽样后的样本标准差为预估,=s.,范例三Minitab练习步骤:,1.依据范例三的30笔数据建立资料档案储存档名:范例3;栏位名称:SM,2.数据基本统计量分析StatBasicStatisticsGraphicalSummary,3.常态分配适合度检定StatBasicStatisticsNormalityTest,5.95%信赖水准平均值范围(大样本与已知标准差情况下作计算)StatBasicStatistics1SampleZ,4.计算其Ca/Cp/Cpk(望目、望大)StatQualityToolsCapabilityAnalysisNormal,6.旧制程的平均值为64.5mm,新旧制程是否有差异?StatBasicStatistics1SampleZ,5.95%信赖水准平均值范围(大样本与已知标准差情况下作计算)StatBasicStatistics1SampleZ,One-SampleZ:SMTheassumedstandarddeviation=1.729VariableNMeanStDevSEMean99%CISM3063.1001.7290.316(62.481,63.719),6.旧制程的平均值为62.3mm,新旧制程是否有差异?StatBasicStatistics1SampleZ,One-SampleZ:SMTestofmu=62.3vsnot=62.3Theassumedstandarddeviation=1.729VariableNMeanStDevSEMean95%CIZPSM3063.1001.7290.316(62.481,63.719)2.530.011,旧制程U0=62.3mm0=?母体=N0(一个已知的母体),范例三:因新母体(新制程)未知,所以只能靠抽样的样本所得的统计量去检定与旧制程所呈的母体参数(平均值)是否有差异,新制程U1=?mm1=?(=0)母体=N1(一个未知的母体),工程师希望能预测EC后铁框喷漆厚度的范围,于是工程师试作了10个产品,量得厚度数据如表1;后来经理请工程师再追加试作15个产品,与先前的10个产品共计25个产品,量测后的数据如表2.,范例五,范例五问题:,如果您是经理,您认为两组数据(10笔与25笔)所预测出来的平均厚度哪一组会比较准确?为什么?,2.仅量测10个样本与量测25个样本在预测喷漆平均厚度时有何差别?,3.喷漆平均厚度的推定区间与信赖水准、冒险率有何关系?,4.若我们希望改善后的厚度平均值目标为16.5,依据10个数据与25个数据进行检定,结论是否一样?若不一样为什么?,提示:上述铁框喷漆厚度之母体参数(平均值、标准差)是否已知?样本数10与25个是属于小样本还是大样本?,步骤一:利用StatBasicStatistics1Samplet.推测10个样本与25个样本下的喷漆厚度的置信区间.(=0.05),One-SampleT:厚度10,厚度25VariableNMeanStDevSEMean95%CI厚度101016.44000.27970.0884(16.2399,16.6401)厚度252516.33200.36250.0725(16.1824,16.4816),以此区间作为:在某种信赖水准(1-)下的信心程度以构成统计陈述之有意义的情报!,当常态母体为小样本,且标准差(/变异数)未知,则母体平均数的(1-)信赖水准下的推定区间为:,t分配(tDistribution),1.连续型机率分配2.自常态母体随机抽取样本,则统计量3.则t分配是一个以平均数=0为中心的钟形分配,近似于常态分配的曲线(曲线下总面积等于1),不同的是其分配曲线形状会受自由度v所影响.4.当t分配的自由度越大就越近似常态分配(一般自由度大于30以常态分配取代).,自由度(DegreeofFreedom),自由度:预得知所需之结果,所需提供资讯量的最少个数,同时这些资讯量必须是相互独立的.,使用t分配进行推定与检定时,当抽样数为n,则此时的抽样数为n-1.,表二:t分佈表,说明:抽样数n=10自由度=10-1=995%机率范围内涵盖几个标准差?抽样数n=25自由度=25-1=1495%机率范围内涵盖几个标准差?自由度无限大95%机率范围内涵盖几个标准差?,利用Minitab計算t分配的機率,CumulativeDistributionFunctionStudentstdistributionwith9DFxP(X30,小样本N,找到明显证据否定H0(拒绝)证据讯息:1.样本平均值不在势力范围内2.经统计后的pvalue,假设检定(HypothesisTest),决策误差(Error),统计检定力(Power),以固定显著水准作检定时,在H1为真时,拒绝H0的机率称为该对立假设之检定力(Power)-检定力即为1-(为型错误的机率)-型错误发生的机率越高,表示该检定对检测该对立假设之敏感度低,因此该检定对检测该对立假设之检定力较低降低即可提高检定力(1-),方式有:1.设大一点2.对立假设参数与虚无假设参数设远使型机率变小3.增加样本数(n),H0:=25H1:25(24)当H1为真(H0为假)此时=24=0.05n=9拒绝H0的机率1-=?,检定力(Power)计算,参数值与检定力关系,1-=0.516如何解释?若实际的材料平均用量24这是必要的前提与原先的25是有所差异的,但在上述的条件下进行检定,仅有51.6%的机率认为是有差异的.,PowerandSampleSize1-SampleZTestTestingmean=null(versusnot=null)Calculatingpowerformean=null+differenceAlpha=0.05Assumedstandarddeviation=1.5DifferenceSampleSizePower190.516005,利用MINITAB计算检定力,参数值与检定力关系,某合板厂研发工程师正试验新的A,B两种接著剂之价格与接著强度均不相同,经试验获得两者的接著强度如下:,范例七,1.A与B能否做比较?2.A与B如何进行比较?产品平均厚度范围(推定区间)与信赖水准,冒险率有何关系?3.请问在5%的冒险率下(=0.05),两种接著剂的接著强度是否有显著差异?单就接著强度而言是采用A接著剂或者B接著剂?4.采用新材料另外还必须考虑哪些条件?,范例七问题:,提示:上述所统计出的两组数据为小样本,同时母体标准差皆未知.,两群体的基本统计量分析,利用Stat/BasicStatistics/2t2-Samplet.进行Test,H0:A-B=0H1:A-B0,检定方式有二:(接受H0的条件)A-B的势力范围(估计区间)是否包含0A-B对0的p-value值是否大于0.05,Two-SampleT-TestandCI:A,BTwo-sampleTforAvsBNMeanStDevSEMeanA102.2530.1010.032B102.31000.04740.015Difference=mu(A)-mu(B)Estimatefordifference:-0.05700095%CIfordifference:(-0.134139,0.020139)T-Testofdifference=0(vsnot=):T-Value=-1.61P-Value=0.133DF=12,Two-SampleT-TestandCI:A,BTwo-sampleTforAvsBNMeanStDevSEMeanA102.2530.1010.032B102.31000.04740.015Difference=mu(A)-mu(B)Estimatefordifference:-0.057095%CIfordifference:(-0.1314,0.0174)T-Testofdifference=0(vsnot=):T-Value=-1.61P-Value=0.125DF=18BothusePooledStDev=0.0792,A母体平均值=?母体标准差=?(一个未知的母体),B母体平均值=?母体标准差=?(一个未知的母体),tTest,标准差合并计算,范例七:因两母体未知,所以只能靠抽样的样本所得的统计量去检定两母体平均值是否有差异.使用t分配,范例八,某工程师针对电子组件进行制程的试验改善,其目的在探讨经过表面处理完后的组件,对组件电气特性是否有差异,工程师进行的步骤为:1.选取25个组件处理前标示No.125同时量测各特性并加以记录2.将该25个组件进行表面处理完后,量测各特性并加以记录3.处理前所得的数据如下表:,提示:上述所统计出的两组数据为小样本,同时,母体标准差皆未知?,1.组件表面处理前后如何做比较?2.请问在5%之冒险率下(=0.05),组件表面处理前后其电气特性值的变化是否有差异?3.为何该工程师必须将组件标号进行比较?4.若不标号是否可以比较?如何比较?与编号比较的差异?5.假设工程师希望处理后的特性值偏移增加0.3,请问处理后的结果是否如预期?,范例八问题:,步骤一:利用Stat/BasicStatistics/pairedt.进行tTest,PairedT-TestandCI:处理前,处理后PairedTfor处理前-处理后NMeanStDevSEMean处理前2531.6000.6150.123处理后2531.8400.6140.123Difference25-0.24000.35240.070595%CIformeandifference:(-0.3855,-0.0945)T-Testofmeandifference=0(vsnot=0):T-Value=-3.41P-Value=0.002,步骤二:利用Stat/BasicStatistics/2Samplet.进行tTest,Two-SampleT-TestandCI:处理后,处理前Two-sampleTfor处理后vs处理前NMeanStDevSEMean处理后2531.8400.6140.12处理前2531.6000.6150.12Difference=mu(处理后)-mu(处理前)Estimatefordifference:0.24000095%CIfordifference:(-0.109796,0.589796)T-Testofdifference=0(vsnot=):T-Value=1.38P-Value=0.174DF=47,PairedT-TestandCI:处理后,处理前PairedTfor处理后处理前NMeanStDevSEMean处理后2531.84000.61440.1229处理前2531.60000.61510.1230Difference250.2400000.3523730.07047595%CIformeandifference:(0.094548,0.385452)T-Testofmeandifference=0.3(vsnot=0.3):T-Value=-0.85P-Value=0.403,步骤一:利用Stat/BasicStatistics/pairedt.进行tTest,No.1,No.2,No.3,No.4,No.5,No.k,No.1,No.2,No.3,No.4,No.5,No.n,统计量(前),统计量(后),利用两母体(前)(后)统计量进行差异检定,PROCESS,检定,举一反三,验明正身,推定,检定与推定,工程师团队已对某产品的制程进行一连串的改善措施,目前希望了解到经此一系列的改善,产品的不良率是否与改善前有所差异,同时也希望知道是否达到当初所设定的目标.,范例九,范例九问题:,1.若改善前的不良率为3.5%?请问在95%信心水准下此改善是否有效?,2.若上述的改善是有效的,依据所收集到的检验数据,请推估95%信心水准下的不良率推估区间?,3.当初改善团队所设定的改善目标为小于2.5%,依据所收集到的检验数据,请问在95%信心水准下此改善案是否成功?,4.某批的批量为20000个,随机抽取500个进行检验,请问不良品数少于等于5个与10个的机率?,5.可否举一反三地说明何种案例也可以适用此样本比率的检定与推定?,步骤一:利用Stat/BasicStatistics/1Proportions.檢定改善前后差异显著性,TestandCIforOneProportionTestofp=0.035vsp0.035SampleXNSamplep95%UpperBoundZ-ValueP-Value14520000.0225000.027955-3.040.001Usingthenormalapproximation.,TestandCIforOneProportionTestofp=0.035vspnot=0.035SampleXNSamplep95%CIZ-ValueP-Value14520000.022500(0.016000,0.029000)-3.040.002Usingthenormalapproximation,步骤二:利用Stat/BasicStatistics/1Proportions.推定改善后不良率置信区间,TestandCIforOneProportionTestofp=0.025vsp0.025SampleXNSamplep95%UpperBoundZ-ValueP-Value14520000.0225000.027955-0.720.273Usingthenormalapproximation.,步骤一:利用Stat/BasicStatistics/1Proportions.檢定改善前后差异显著性,步骤四:利用Calc/ProbabilityDistributions/Binomial.计算累积机率,CumulativeDistributionFunctionBinomialwithn=500andp=0.025xP(X=x)50.0139441,CumulativeDistributionFunctionBinomialwithn=500andp=0.025xP(X=x)100.294044,工程师团队导入两家材料供货商(工程样本导入前皆已被核准认可),品保制程工程师团队依据生产线的记录,层别出使用两家供货商之产品批,试着想比较两家供货商间对产品的良率是否有差异?,请问:1.该两家供货商的材料对产品不良率的影响是否有差异?2.可否举一反三地举例说明有何案例与此检定模式是相同的?,范例十,TestandCIforTwoProportionsSampleXNSamplep13220000.01600025625000.022400Difference=p(1)-p(2)Estimatefordifference:-0.006495%CIfordifference:(-0.0143930,0.00159302)Testfordifference=0(vsnot=0):Z=-1.57P-Value=0.117,利用Stat/BasicStatistics/2Proportions.进行检定,相关回归分析观念,1.在日常生活中,我们尝试找出某两种变数Y(因变量),X(自变量)是否存在某种相依的关系,如y=a+bx.,2.同样的,在制程上我们会尝试着找出特性(Q)与参数(P)之间的关系以作为预测、操作、管制的目的.,3.在应用的角度出发,我们关心的重点是Y可被X预测的准确度,也就是我们看重的是彼此之间的相关性.,范例十一,汽车研发工程师收集汽车重量(Weight)与汽车里程数(Mpg)之关系,共收集150组数据(见附件):,请问:1.您认为该工程师收集此些数据的目的为何?2.汽车重量与汽车里程数是否有关系?如何以量化数据来描述?3.如何运用上述关系来设计与管理?,步骤一:利用Graph/Scatterplot.绘制散布图,简单线性回归(SimpleLinearRegression),为解释自变量(车重)与因变量(里程数)之间的关系,可利用回归分析的方法来建立不同型式的函數來解释其间的关系,其中最简单的即是简单线性回归,它的模型如下:,这个模型代表我们用一個直线型的方程式來描述x与y之间的关系:,步骤二:利用Stat/Regression/FittedLinePlot.进行回归分析,里程数与车重关系程度为69%;里程数上的变异69%可由车重来解释.,相关分析,回归方程只有在变量之间存在较强的相关关系时才具有意义.,相关系数R:指用来描述两个变量间线性关系密切程度的一个数量指标.,线性回归模型式拟和度R2(R-square):表示使用x去预测y时的解释力,即y被x所解释的比率.,SST、SSR与SSE间的关系,SST=总平方和SSR=回归平方和SSE=误差平方和,以样本统计量推导出来的R2来评估整体模式的解释力,并进而推论到母群体时,会有高估的倾向,样本数越小,越容易高估,解释力膨胀效果越明显,样本数越大,膨胀情形越轻微.,校正后R2(adjustedR2),可以减轻因为样本估计带来的R2膨胀效果,样本数较小,则应采用校正后R2.,校正后R2R-Sq(adj),RegressionAnalysis:里程數versus车重Theregressionequationis:里程數=55.6-0.0100车重PredictorCoefSECoefTPConstant55.5911.52036.570.000车重-0.01004830.0005535-18.150.000S=4.11197R-Sq=69.0%R-Sq(adj)=68.8%AnalysisofVarianceSourceDFSSMSFPRegression15572.65572.6329.580.000ResidualError1482502.416.9Total1498075.0,UnusualObservationsObs车重里程數FitSEFitResidualStResid22408017.50014.5940.8452.9060.72X27251521.10030.3200.348-9.220-2.25R46436016.90011.7810.9895.1191.28X47405415.50014.8550.8320.6450.16X79211046.60034.3890.46012.2112.99R82208544.30034.6410.4709.6592.36R83233543.40032.1280.38611.2722.75R84295036.40025.9490.36810.4512.55R122372526.60018.1610.6708.4392.08R145301538.00025.2960.38412.7043.10RRdenotesanobservationwithalargestandardizedresidual.XdenotesanobservationwhoseXvaluegivesitlargeinfluence.,RegressionAnalysis:里程數versus车重Theregressionequationis:里程數=55.6-0.0100车重PredictorCoefSECoefTPConstant55.5911.52036.570.000车重-0.01004830.0005535-18.150.000S=4.11197R-Sq=69.0%R-Sq(adj)=68.8%AnalysisofVarianceSourceDFSSMSFPRegression15572.65572.6329.580.000ResidualError1482502.416.9Total1498075.0,H0:Y与X无关H1:Y与X相关,回归分析之ANOVA,相关与回归的区别,3.相关系数R与回归系数b:R与b的绝对值反映的意义不同.R的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高;b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大,反之也是一样.,1.意义:相关反映两变量的相互关系,即在两个变量中任何一个的变化都会引起另一个的变化,是一种双向变化的关系;回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系.,2.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关;回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果.,相关回归分析之基本原则,1.必须采用成对数据单因子(Oneway)多水准实验2.成对数据宜在正常操作之极限范围内取样3.组数不少于25组4.回归关系不宜在原范围外冒然外插,回归方程式,相关并不等于因果!,线性回归分析应用,1.在应用科学上,我们想了解父亲的身高(X)与儿子的身高(Y)之间是否存在某种相依的关系,若我们能从收集后统计的数据,经由简单线性回归分析找出其关系式,我们便能从父亲的身高(X)推算出儿子的身高(Y).,2.在某地区,我们想了解当日温度(X)与用电量(Y)之间是否存在某种相依的关系,若我们能从收集后统计的数据,经由简单线性回归分析找出其关系式,我们便能从当日温度(X)推算出用电量(Y)以作为调度之参考.,线性回归分析工程应用(一),类型一:制造参数控制型问题举例来说温度在某一制程系统经由实验设计得知对于品质特性-硬性(黏度)是显著因子.而不同的厂商对于硬度(黏度)的要求规格会有所不同,因此我们希望建立温度与硬度之间的回归模式以利于我们在制造不同硬度时可以利用我们所建立的模式进行推算制程温度设定的范围.因此此一类型的运用我们可以称为主从因果应用型.,思考:当然您也可以试着思考若温度对于硬度并不是显著因子时,我们需要再利用回归分析?,线性回归分析工程应用(二),类型二:原料成份变动因应型问题举例来说在某些行业中来料品质(比如土方成份比例)常常会有各批之间有显著差异的状况,而此种差异的情况是无法控制的,原因是此种原因是天然的,当我们无法主动地改变原料品质,唯一的办法是建立一套因应不同来料品质成份的制程参数对照表,也就是说随着成份不同的原料其后续加工的制程条件也必须有所调整.举例来说:在一定时间之烧土制程下,土方中矿成份的多寡会影响烧土后的硬度,因此必须寻找为了达到最终硬度的要求下在不同砂成份的土方所必须使用的温度此时工程师必须根据过往的生产记录找出砂成份与温度的相对数据,然后找出Y(温度)=aX(成份)+b的关系,我们可以称此种应用型为因应配合型.,线性回归分析工程应用(三),类型三:相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论