估计与检定实务_第1页
估计与检定实务_第2页
估计与检定实务_第3页
估计与检定实务_第4页
估计与检定实务_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

估計檢定實務QA/QS,FileUpdated:2009/2/16ver.01.1,課程大綱,檢定概念與應用說明,估計檢定在統計學的定位,1,估計概念與應用說明,2,3,FileUpdated:2009/2/16ver.01.1,估計檢定在統計學的定位,FileUpdated:2009/2/16ver.01.1,估計檢定在統計學的定位,定位,母體,抽樣,推論,抽樣分配,機率分配,敘述性統計,機率及統計抽樣實務,估計檢定ANOVA回歸分析無母數統計,誤差,FileUpdated:2009/2/16ver.01.1,推論示意圖,ex.一批液晶面板平均壽命,ex.從這批貨中抽取一些做測試,ex.用樣本平均數來推論母體平均數,ex.計算所抽取液晶面板的平均壽命,定位,FileUpdated:2009/2/16ver.01.1,估計檢定說明,具未知參數值之母體(Populationswithunknownparametricvalues),定位,區間估計(IntervalEstimation),點估計(PointEstimation),單母體之假設檢定(Hypothesistestingwithonepopulation),兩母體之假設檢定(Hypothesistestingwithtwopopulations),母體變異數之推論(Inferencesaboutpopulationvariances),FileUpdated:2009/2/16ver.01.1,估計基本概念說明,FileUpdated:2009/2/16ver.01.1,估計的定義,參數:敘述母體現象的表徵數,統計量:用來估計未知母數的統計量稱之估計量,估計值:將特定的樣本觀測值代入估計量所得之值。,用來估計,用來估計2,估計的基本觀念,FileUpdated:2009/2/16ver.01.1,估計的表示方法,點估計(PointEstimation):直接以樣本資料所求得之估計值來推論未知母體的方法。,區間估計(IntervalEstimation):以樣本資料求得某一區間,以涵蓋未知母體的方法。此區間稱為信賴區間,構成信賴區間的兩端點稱為區間估計值。,估計的基本觀念,FileUpdated:2009/2/16ver.01.1,點估計,由一組樣本所計算出來的統計量,稱為其母體相對參數的點估計值(Pointestimate),而其所使用的符號稱為點估計子(Pointestimator)假設一組樣本為x1,x2,xn,常用來估算母體參數的點估計子,FileUpdated:2009/2/16ver.01.1,點估計,例1:一標示容量為100ml的保養品,抽查6瓶所得到的容量為102,104,99,102,100,99,則由這組樣本所得到平均值與變異數為?例2:用這組樣本推估這種保養品的整體平均容量為101ml,而標準差為2ml,若只考慮該容量是否有達到標示的內容,則可將樣本記錄為1,1,0,1,1,0,所以達到標示的比率值之點估計值為?,FileUpdated:2009/2/16ver.01.1,點估計量的性質,FileUpdated:2009/2/16ver.01.1,點估計,當每次抽樣的樣本不同時,所得到的點估計值即有可能會不同無法得知一組樣本相對於母體的代表性無法得知一組樣本所得到的點估計值與母體參數的差距一組樣本應該含有多少個體才能夠得到較值得信賴的點估計值,點估計值的不足之處,FileUpdated:2009/2/16ver.01.1,區間估計的圖示,估計的基本觀念,FileUpdated:2009/2/16ver.01.1,影響信賴區間估計的因素,點估計量樣本大小信賴水準雙尾或單尾信賴區間,估計的基本觀念,FileUpdated:2009/2/16ver.01.1,假設母體平均數為固定不變,令為樣本均數,由於每次抽樣結果都不相同,所以也會不同,以致於每次的區間都不相同,故稱隨機區間。,點估計量影響信賴區間估計,估計的基本觀念,母體平均()有95%的機率會落在樣本平均1.96/n範圍中,樣本平均值在此區間中的某處,FileUpdated:2009/2/16ver.01.1,樣本大小影響信賴區間,在其它條件相同的情況下,估計的基本觀念,樣本數越小,信賴區間長度越大,樣本數越大,信賴區間長度越小,FileUpdated:2009/2/16ver.01.1,信賴水準影響信賴區間,在其它條件相同的情況下,估計的基本觀念,信賴水準小,信賴區間長度越小,信賴水準大,信賴區間長度越大,95%,99%,FileUpdated:2009/2/16ver.01.1,估計的基本觀念,雙尾或單尾影響信賴區間,雙尾信賴區間,右尾信賴區間,左尾信賴區間,單尾的信賴區間長度比雙尾信賴區間大,一般都以雙尾為主,FileUpdated:2009/2/16ver.01.1,常用區間估計的種類,估計的基本觀念,變異數估計,平均數估計,單一母體,兩母體,單一母體,兩母體,單一母體,兩母體,Back,FileUpdated:2009/2/16ver.01.1,均值區間估計大樣本已知,當樣本平均數服從N(,2/n),可包含1-機率的區間為:其中1-稱為信心水準,z/2為標準常態分配中,超過這個值的機率恰好為/2的z值,一般常用的值為0.01,0.05,0.1,其相對的z值為z0.005=2.576,z0.025=1.96,z0.05=1.645;,FileUpdated:2009/2/16ver.01.1,均值區間估計大樣本已知,例:假設每小時某一工作站可處理重工(rework)產品數量的標準差為20個,在收集了100個小時的資料後,得到樣本平均數為每小時82個,在95%的信心水準下,所得到的信賴區間為:,Excel做法,FileUpdated:2009/2/16ver.01.1,单样本Z假定标准差=20平均值N平均值标准误95%置信区间10082.002.00(78.08,85.92),Minitab做法,均值區間估計大樣本已知,統計,基本統計,1Z單樣本,FileUpdated:2009/2/16ver.01.1,例:假設在收集了100個小時的資料後,得到每小時可處理重工產品數的平均數為82位個,標準差為20個,由於沒有歷史資料可用來估算母體標準差,因此在95%的信心水準下,所得到的信賴區間為:,均值區間估計大樣本未知,Excel做法,FileUpdated:2009/2/16ver.01.1,单样本T平均值N平均值标准差标准误95%置信区间10082.0020.002.00(78.03,85.97),Minitab做法,均值區間估計大樣本未知,統計,基本統計,1t單樣本,FileUpdated:2009/2/16ver.01.1,當樣本數n夠大時(np5且n(1-p)5),樣本比率值會服從N(p,p(1-p)/n),因此當信心水準為1-時,所得到的信賴區間為:由於母體比率值是要推估的對象,不可能已知,所以用樣本比率值代替母體比率值來計算樣本比率值的變異數;但當樣本數不夠大時,不適合做這樣的取代,因此樣本數不夠大時,不宜做母體比率值的區間估計;,不良率區間估計,FileUpdated:2009/2/16ver.01.1,例:為了衡量某一公司的售後服務滿意度,共抽查了900位顧客,其中有720位表示滿意,在95%的信心水準下,售後服務滿意度的信賴區間為:,不良率區間估計,Excel做法,FileUpdated:2009/2/16ver.01.1,单比率检验和置信区间样本XN样本p95%置信区间17209000.800000(0.772348,0.825672),Minitab做法,不良數區間估計,統計,基本統計,1P單比率,FileUpdated:2009/2/16ver.01.1,當信心水準為1-時,變異數的信賴區間為:例:已知某一藥品每顆的重量服從常態分配,今抽驗此藥品21顆而得到其樣本變異數0.36,在90%的信心水準下,該藥品變異數的信賴區間為:,變異數區間估計,FileUpdated:2009/2/16ver.01.1,单标准差检验和置信区间统计量N标准差方差210.6000.36090%置信区间标准差置信区方法间方差置信区间标准(0.479,0.815)(0.229,0.664),Minitab做法,方差區間估計,統計,基本統計,單方差,FileUpdated:2009/2/16ver.01.1,做做看1,已知Coater機台所使用之Wiper,原廠提供之平均使用次數為16000次,標準差為1000次(2已知);最近抽樣16次的記錄如下,請問在95%的信心水準下目前wiper使用平均壽命可能的範圍為何?,FileUpdated:2009/2/16ver.01.1,做做看1,One-SampleZ:WiperLifeTheassumedstandarddeviation=1000VariableNMeanStDevSEMean95%CIWiperLife16172261123250(16736,17716),StatBasicStatistic1-SampleZ,FileUpdated:2009/2/16ver.01.1,做做看2,已知Coater機台所使用之Wiper,原廠只提供之平均使用次數為16000次,標準差未提供(2未知);最近抽樣16次的記錄如下,請問在95%的信心水準下目前wiper使用平均壽命可能的範圍為何?,FileUpdated:2009/2/16ver.01.1,做做看2,One-SampleT:WiperLifeVariableNMeanStDevSEMean95%CIWiperLife16172261123281(16628,17824),StatBasicStatistic1-Samplet,FileUpdated:2009/2/16ver.01.1,做做看3,20080710三個月J011產品在75XX的平均良率98.5%.亦即有1.5%的不良率。為了提昇良率,特別針對製程參數進行實驗,找出最佳參數後放量測試10000個Panel,在75XX站點發現有115Panel被判NG,請問放量後的不良率在95%的信心水準的情況下可能的範圍為何?,FileUpdated:2009/2/16ver.01.1,做做看3,TestandCIforOneProportionSampleXNSamplep95%CI1115100000.011500(0.009410,0.013590)Usingthenormalapproximation.,StatBasicStatistic1-Proportion,FileUpdated:2009/2/16ver.01.1,做做看4,CFBMLINE依原來製造方法,已知BMCD單點的變異數2=1.2,改變HP溫度後,隨機抽取10個為樣本,其數據如下。試問方法改變後,母体變異數95%的信賴區間為?,FileUpdated:2009/2/16ver.01.1,做做看4,95%ConfidenceIntervalsVariableMethodCIforStDevCIforVarianceBMCDStandard(0.576,1.530)(0.332,2.341),StatBasicStatistic1-Variance,FileUpdated:2009/2/16ver.01.1,檢定,FileUpdated:2009/2/16ver.01.1,檢定基本概念說明,FileUpdated:2009/2/16ver.01.1,檢定的意義假設檢定(hypothesistesting)是指先對母體特性作一適當的描述,然後利用抽出來的隨機樣本推論(檢定)此描述是否正確,此一過程或統計方法便稱為假設檢定。,統計檢定,檢定的基本觀念,FileUpdated:2009/2/16ver.01.1,假設檢定之步驟:,(1)建立假說H0&H1,(2)決定檢定統計量及拒絕域,(3)自母體抽樣並計算檢定統計量,(4)做決策,(5)下結論,假設檢定的步驟,假設檢定之步驟,FileUpdated:2009/2/16ver.01.1,(1)建立假說在假設檢定的程序中,首先必須建立統計假設,亦即有關母體特性的敘述句(描述)。但是統計假設一般有兩種形式(彼此為互補),其一為我們所欲否定者,稱為虛無假設(nullhypothesis),以符號H0表示;另一則為其反面,稱為對立假設(alternativehypothesis),以符號H1表示。,假設檢定的步驟(1),FileUpdated:2009/2/16ver.01.1,有等號的部分一定置於虛無假設中。對於母體平均數的假設檢定有下列三種形式(0為母體平均數的假設值):H0:0H0:0H1:0,虛無假設與對立假設的各種形式,假設檢定的步驟(1),FileUpdated:2009/2/16ver.01.1,假設檢定的兩種错误,一般而言,進行假設檢定而作結論時,可能會犯下列兩種錯誤之任何一種:(1)H0為真,但檢定結果卻拒絕H0;(2)H0為偽,但檢定結果卻接受H1。此兩種錯誤分別稱為型I誤差(TypeIerror)與型II誤差(TypeIIerror)。,假設檢定的步驟(2),FileUpdated:2009/2/16ver.01.1,假設檢定:一般業界將稱為”生產者風險”,稱為”消費者風險”。當變大時會減小,反之,當減小時會增大,但兩者間並無呈線性之反比。我們習慣將定為0.05,最小定為0.01,其它數值則不常使用。,群體,抽樣結果之判定,假設檢定的步驟(2),FileUpdated:2009/2/16ver.01.1,計量值(Variables):資料特性屬於“連續型”資料群體平均數之檢定群體變異數2之檢定二群體平均數差之檢定二群體變異數比之檢定計數值(Attributes):資料特性屬於“離散型”資料不合格率的檢定缺點數的檢定二不合格率差的檢定二缺點數差的檢定,資料的種類,假設檢定的步驟(3),FileUpdated:2009/2/16ver.01.1,常用檢定統計量的種類,變異數估計,平均數估計,單一母體,兩母體,單一母體,兩母體,單一母體,兩母體,Back,假設檢定的步驟(3),FileUpdated:2009/2/16ver.01.1,拒絕域的型式,右尾檢定,0,z,拒絕區(拒絕H0),接受區(接受H0),(臨界值),z,p-value,0,Z,1-,假設檢定的步驟(5),FileUpdated:2009/2/16ver.01.1,0,z,接受區(接受H0),(臨界值),z,p-value,0,Z,拒絕區(拒絕H0),1-,假設檢定的步驟(5),左尾檢定,拒絕域的型式,FileUpdated:2009/2/16ver.01.1,假設檢定的步驟(5),雙尾檢定,拒絕域的型式,FileUpdated:2009/2/16ver.01.1,母體平均數假設檢定,假設檢定的步驟(3),FileUpdated:2009/2/16ver.01.1,右尾左尾雙尾假設:檢定統計量:拒絕法則:若,若,若或拒絕H0拒絕H0拒絕H0(或若p-valueF,df1,df2,若FF/2,df1,df2,拒絕H0拒絕H0,兩母體變異數的假設檢定,令樣本變異數較大者為母體一,假設檢定的步驟(3),FileUpdated:2009/2/16ver.01.1,比例值(P)假設檢定之檢定統計量,假設檢定的步驟(3),比例值之假設檢定,FileUpdated:2009/2/16ver.01.1,P-value大小的意涵不到0.01:H1為真是無庸置疑的。介於0.01和0.05之間:有充分的證據來推論H1為真。介於0.05和0.10之間:證據雖薄弱,但仍足以推論H1為真。大於0.10:沒有足夠的證據可推論H1為真。,若P值小於您願意冒的風險,則拒絕H0,假設檢定的步驟(5),P-value意涵,FileUpdated:2009/2/16ver.01.1,Example:欲測知LineA、LineB兩條生產線的HP設定溫度是否有差異,分別自各Line抽取11個樣本及9個樣本,其結果如下試檢定之。(1,2未知),動動腦,FileUpdated:2009/2/16ver.01.1,(1)建立假說H0&H1,(2)決定型I錯誤,(3)決定檢定統計量及拒絕域,(4)自母體抽樣並計算檢定統計量,故拒絕H0,機臺均值有差異;,(5)做決策,(6)下結論,FileUpdated:2009/2/16ver.01.1,双样本T检验和置信区间:A,BA与B的双样本T平均值N平均值标准差标准误A1190.5730.2530.076B990.2330.2870.096差值=mu(A)-mu(B)差值估计:0.339差值的95%置信区间:(0.080,0.599)差值=0(与)的T检验:T值=2.77P值=0.014,Minitab做法,均值檢定,統計,基本統計,2t雙樣本,P02(G)-04(B)三台機台b)資料蒐集:於LCDLOI蒐集Lossrate1.加裝前,Lossrate=9.64%2.加裝後,統計1/13生產的4800pcs.玻璃中,亮點來自實驗機台的Lossrate=4.56%(n=4800),動動腦,FileUpdated:2009/2/16ver.01.1,(1)建立假說H0&H1,(2)決定型I錯誤,(3)決定檢定統計量及拒絕域,(4)自母體抽樣並計算檢定統計量,(5)做決策,(6)下結論,有足夠的證據證明Lossrater常態分配,常態分配,信賴區間,FileUpdated:2009/2/16ver.01.1,1P(OneProportion)檢定實例一(2),1P檢定後的數據:TestandCIforOneProportionTestofp=0.01vsp0.0195%UpperS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论