多变量管制图之比较与探讨_第1页
多变量管制图之比较与探讨_第2页
多变量管制图之比较与探讨_第3页
多变量管制图之比较与探讨_第4页
多变量管制图之比较与探讨_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多變量管制圖之比較與探討,作者:游明新指導教授:童超塵教授報告學生:吳志權,目錄,第一章序論研究背景研究的目的與方向研究架構第二章文獻探討多變量管制圖Hotelling2多變量管制圖HotellingT2衍生出的診斷方法主成分分析法(PCA)MYT分解法殘差管制圖第三章診斷方法的應用與比較比較診斷方法在實際案例之使用比較診斷方法在模擬資料之使用改建流程之主成分分析法(MPCA)診斷方法的模擬結果與比較(模擬一)診斷方法的模擬結果與比較(模擬二)第四章結論與建議,第一章序論,研究背景良好的產品品質是許多企業永續經營的關鍵,達到此目標的方法之應用統計製程管制方法.統計製程管制方法主要的有蕭華特(Shewhart)管制圖、累積和(CUSUM)以及指數加權移動平均(EWMA)以上這些單變量管制圖卻也只能對製程中的單一個品質特性作個別監控,所以無法完全解決現今高複雜度產品的品質偵測問題所以學者利用單變量管制圖的觀念,進而發展出不同的多變量管制圖,其中又以HotellingsT2、MCUSUM及MEWMA三種方法最為廣受討論HotellingsT2綜合Shewhart單變量管制圖的觀念而得MCUSUM及MEWMA則是由單變量的CUSUM、EWMA演變而成,研究的目的與方向目的:探討當資料相關性不同時各診斷方法的特性以及比較其優缺點其可以改善的地方,以期在使用多變量管制圖來監控品質時能有更佳的表現。方向:探討比較資料在相關程度不同下之多變量管制圖診斷方法的差異點。建構一個多變量相關性資料的管制流程。,研究架構,第二章文獻探討,多變量管制圖傳統的管制圖如Shewhart、CUSUM和EWMA最大缺點便是將這些品質特性視為彼此獨立的變數如圖,兩個變數(Y1,Y2)彼此具有相關性,以二元變數來看信賴區間應為橢圓分佈之圖形,如只用單變量管制圖來測,其結果判斷為製程正常.這就是使用單變量管制圖很容易會有誤判的情形發生相關係數Y1,Y2=0.8信賴區間為橢圓分布多變量品質管制法就是為了因應這樣的想法所衍生出來的,其做法為同時監控多個品質特性,並將多個變數之間的相關性納入考慮,此種品質管制方法即稱為多變量統計製程管制(MultivariateStatisticalProcessControl),Hotelling2多變量管制圖,從事多變量分析研究的首推Hotelling(1931)其管制圖主要的想法是利用新觀察值與歷史資料平均值之間距離的概念當點到中心點很遠時,d2會很大,當d2大到一定程度時,我們即認為點顯著,中心點(x1,x2)為其資料平均值從點(x1,x2)到平均值的直線距離為,因為忽略了變數X1、X2的變異數及相關性,所以我們就利用變數X1、X2自身的變異數11和22及共變異數12來做矯正,可以得到一個卡方統計量此統計量是自由度為2的卡方分配,上式可說是多元管制圖的基礎,稱之橢圓管制圖用卡方2統計量來判定是否超出管制界限,如製程平均值改變,則2統計量便會大於臨界值如果,落在橢圓管制外,反之,2統計量小於臨界值,則表示在橢圓管制內,如果要管制p個品質特性時,假設此p個特性服從p元常態分配,樣本大小為n,則以p1的向量可表示這些品質特性的平均值每個樣本的統計檢定值為=1,2,p為製程在管制情況下每個品質特性平均值的向量,則為共變異數矩陣。管制圖上限,HotellingT2衍生出的診斷方法,主成分分析法(PCA)(principalcomponentanalysis)MYT分解法殘差管制圖,主成分分析法(PCA),由KarlPerson於1901年首先提出,目的將資料中原有的P個變數予以縮減,使其為K(P)個互相無關連的互相獨立的線性組合變項(主成分),以達到簡化資料的目的主成分分析有三個重要目標:要保有原來變數的資訊(即有代表性)主成分之間不能重疊(即有獨立性)能以少數幾個主成分代替原來多個變數(即有精簡性),主成分分析的作法,由歷史資料(X)所估計的共變異數矩陣S可求得該矩陣的p個特徵值為1、2、p(其中12p),及特徵值i所對應的特徵向量為ei轉軸方程式yik=ekxi=ek1xi1+ek2xi2+ekpxipk=1,2,p主成分的重要性質有第i個主成分變異數等於第i個特徵值,且各主成分之間的共變數為零表示如下:原始變數的變異數和會等於新變數的變異數和,即:tr(S)=1+2+p可找前k個主成分的新變數來代替原有的p個變數,當變數之間相關性高時,所需要的k就愈小,而其能解釋的變異佔總變異的比例也會相對的較高,如此便可以達到降低變數個數的目的。,主成分變數可將HotellingsT2分解成下式我們選出較大的幾項;其中再藉此找出哪些原始變數x對ti有較大之貢獻,找出影響異常值最大的要素使用多變量主成分分析的好處為:1.當變數個數很多且相關性頗高時,共變數矩陣()的逆矩陣(-1)不一定存在,因此無法用HotellingsT2計算,使用主成分分析可解決這樣的問題。2.當觀測的變數個數很多時,主成分利用轉軸的方法,可經由原始變數線性組合後的新變數,來降低所要觀測的原始變數個數。,MYT分解法,Mason,YoungandTracy(1995)利用T2的分解法提出一個診斷方法,簡稱MYTMYT就是利用其它變數給定條件下的方式來進行診斷。其方法主要是利用迴歸分析的方法將T2統計量分解成各個不同的獨立的部分,而每一獨立的部分均有其各自的T2值。利用歷史資料X,我們再利用最後一個變數Xp對前p-1個變數X1、X2、Xp-1做迴歸,得預測方程式及殘差平方和(SSE),其中為參數的估計值可將HotellingsT2分解成:利用前p-1個變數針對第p個變數矯正後所得的T2值,為上述迴歸式標準差估計值,節省計算的法則,其步驟如下:步驟一:用計算,如果超出管制界限,第i個變數出了問題,因此將這些變數移除,而後再計算剩餘k1個變數的T2值,不顯著則表示出問題的觀察值已經全部找到,但如果顯著則表示尚有變數依然可能有問題,則到下一步驟步驟二:用計算任兩個剩餘k1個變數的也就是一個變數為條件的情況下,共有k1x(k1-1)個,如果T2i.j超出其界線,表示i、j這兩個變數可能有問題,有問題的變數挑出,再計算剩餘變數k2的T2值,不顯著則表示出問題的觀察值的變數已經全部找到,如果顯著,則表示其餘的變數依然可能有問題,則須到步驟三步驟三:再計算所有可能的組合,如果超出其界線,表示這三個變數之間的關係可能有問題,把這些變數挑出,再計算剩餘變數的T2值,不顯著則表示出問題的觀察值的變數已經全部找到,如果顯著,則表示其餘的變數依然可能有問題,如此一直往高階的找下去,直到剩餘變數的T2值不顯著為止,殘差管制圖,單變數管制圖會因為忽略變數間的相關性而造成誤判,所以當變數互有相關時,我們希望在討論某一變數是否有問題時,能將其它變數對該變數之影響全部拿掉.所以我們利用每一變數對其它所有變數的複迴歸模式所求得的殘差值作為管制對象.複迴歸模式為:計算殘差和,記為SSEk。針對新觀察值中的每一個單元,利用迴歸的方式排除其它變數的影響,所得之標準殘差為:,通常我們在特定的型誤差下,可求得殘差管制上下界,當標準殘差超出管制界限時,我們則認為此觀察值在第k個變數出現異常。,第三章診斷方法的應用與比較,問題描述MYT計算法則雖然可以減少所要計算的分解量,計算法則在變數低於5個時,或許還能解決部分計算繁瑣的問題,但當變數個數更多時,這個法則就嫌不夠了.逐步排除的方式同時冒著診斷錯誤的風險,且MYT和殘差管制圖皆是由迴歸分析的觀念而來,然而卻沒有考慮到自變數具有多重共線性而造成的影響,這很可能在判斷製程出現異常之後,在診斷哪個變數出問題上會有誤判的情形.主成分分析診斷的最大問題是原始變數的偏移不一定會反映在主成分轉軸後的變數,因此利用這些經主成分轉軸後的變數不一定能找出所有出問題的變數.,比較診斷方法在實際案例之使用,用熱傳輸的實際案例來比較PCA、MYT法在此實例中,已知三變數均發生問題,超出T2的管制界限在型一誤差0.05下,管制界限約2,MYT法(實例),現在有一組觀察值可得T2=12.03可以知道這三個變數至少有一出現問題由上可知第一個變數X1有問題第二個變數X2在變數X1已知的條件下沒有問題同理第三個變數X在變數X1、X已知的條件下有問題,共可求得12項分解項目第一個變數X1不論是本身或是在其它變數的條件下,均可察覺出現了問題,第二個變數X2與第三個變數X3在其它變數的條件下,亦可察覺出現了問題,由此可發現此觀察值的這三個變數均有問題,這與實際案例可全符合。因此,藉由這樣的方式我們即可把有問題的變數診斷出來。,PCA法(實例),利用歷史資料的共變異數矩陣可求得特徵值與特徵值向量t1=-9.23724,t2=-2.46819,t3=2.12059並將標準化的值畫分數圖無法經此分量找出所有有問題的原始變數,這也驗證原始變數的偏移並不一定會反映在主成分轉軸後的變數,因此有可能會造成誤判,比較診斷方法在模擬資料之使用,討論多變量管制圖模擬一組五個變數,並滿足多維常態分配,的數據,此數據的前35筆數據視為歷史資料,在後15筆數據中,第一個變數X1標準差的部分增加50%,第五個變數X5向上偏移25%個標準差,採用此組數據,比較PCA、MYT計算法則等方法之判斷結果。現在第13個樣本有一組觀察值計算可得整體的T2=22.878,此值超過管制界限,因此可以知道這五個變數至少有一出現問題,在算樣本五個單元個別標準化之值,法(模擬),一個節省計算的法則,先計算第48個樣本所有個別的將變數X1移除後再計算剩餘變數的T2值(16.37)依然顯著,表示其餘的變數依然可能出現問題。接著計算其餘四個變數所有可能的分解量利用MYT計算法則我們發現1、4、5這三個變數可能有問題,我們無法立即判定X4、X5到底哪一個變數有問題,因此利用這樣的計算法則有可能會增加有問題變數的個數。,PCA法(模擬),首先利用歷史資料的相關係數矩陣可求得特徵值與特徵向量,分別如下:主成分的分量,表示如下t1=2.607056,t2=-4.419612,t3=-3.983952,t4=-1.138842,t5=0.5749將標準化後的值畫分數圖,當標準分數絕對值大於2.5時,則有必要繼續討論原始變數對此分量的貢獻量原始變數在第二主成分分量之貢獻值原始變數在第三主成分分量之貢獻值,MYT與PCA法在案例上之結果比較,由實際資料及模擬資料診斷問題變數的例子中可發現MYT在三個變數的案例中可以將問題變數找出來,但在五個變數的模擬資料中,透過簡化的方法雖然可以減少須計算的分解量,但卻會有誤判的情形產生.且可看出MYT的計算過程中,除了殘差的差距很大時會造成顯著之外,當變數之間具有高度相關時,會造成判定係數過高,亦會造成顯著PCA在三個變數的案例中只能找出第一個變數,而在五個變數的例子中卻可以把問題變數找出來,在這兩個例子當中,第一個變數與其他變數的相關係數都較低,而其他變數之間的相關性較高.且主成分分析在變數具有較高程度相關時,其轉軸的效果愈好,相反的,若是變數之間的相關程度不高,主成分分析就不具有太大意義。,改建流程之主成分分析法(MPCA),在製程或品質變數獨立的情況下,我們可以利用Shewhart、CUSUM及EWMA等管制圖對個別變數進行監控,但在製程或品質變數不獨立時,利用這些單變數管制圖會因為忽略變數間的相關性而造成誤判.MYT的計算過程中,當變數之間具有高度相關時,會造成判定係數過高,亦會造成顯著.主成分分析在變數之間具有較高相關程度時,其使用的結果愈好,相反的,若是變數之間的相關程度不高,主成分分析就不具有太大意義.所以用MPCA法,利用變數之間的相關矩陣將變數分類,將變數之間將相關性較低的變數提出,再把剩下來具有較高程度相關的變數再進行主成分分析,結合單變量管制圖的方法去診斷問題變數。,改建診斷流程之流程圖,MPCA法(實例),1.首先以單變量管制圖找出發生問題之變數,把有問題的變數挑出2.先由歷史資料求得變數間的Pearson相關係數矩陣及p-value以找出相關程度較低的變數3.將相關程度較低的變數予以個別管制,其他相關程度較高的變數進行主成分分析,以進一步找出有問題的變數。4.X1以單變量管制圖來管制,可計算出其標準誤,5.對X2與X3進行主成分分析,首先找出其特徵值和特徵向量。主成分的分量,表示如下:t2=-9.191,t3=2.6159將標準化後的值畫分數圖原始變數在第一主成分分量之貢獻值原始變數在第二主成分分量之貢獻值,MPCA法(模擬),首先以單變量管制圖找出發生問題之變數,把有問題的變數挑出.先由歷史資料求得變數間的Pearson相關係數矩陣及p-value以找出相關程度較低的變數。將相關程度較低的變數予以個別管制,其他相關程度較高的變數進行主成分分析,以進一步找出有問題的變數。,X1以單變量管制圖來管制,可計算出其標準誤對X2、X3、X4及X5作主成分分析,首先找出其特徵值和特徵向量。主成分的分量,表示如下t1=4.064596,t2=3.276788,t3=-1.559345,t4=1.0445169並將標準化後的值畫分數圖,原始變數在第一主成分分量之貢獻值,原始變數在第二主成分分量之貢獻值,原始變數在第三主成分分量之貢獻值,原始變數在第四主成分分量之貢獻值,MPCA在實際資料及模擬資料上的結果,由實際資料及模擬資料這兩例子中,MPCA與PCA不同的地方是在進行診斷前,先以單變量方式將問題變數挑出,再以相關係數矩陣將剩下的變數分類,保留較高程度相關的變數進行主成分分析。由結果可看出,MPCA是可以將問題變數找出,當變數間有相關程度較小的變數存在時,它有可能會影響到診斷的結果,也就是當變數間相關性愈高時,主成分分析的轉軸才有意義。,診斷方法的模擬結果與比較(模擬一),用SAS6.11統計軟體分別模擬三、四及五個獨立的變數,以X1、X2、X3、X4及X表示,然後以變數做一些不同的線性組合求出Y1、Y2及Y3的樣本平均數、標準差及共變異數矩陣及相關係數矩陣,再計算出T2管制界限,在模擬中,我們考慮幾種不同的變異組合:1.為了解在相關程度較低的變數出問題時,是否會影響其它相關程度較高的變數診斷結果:A組,設定第一個變數和其他變數相關係數較低不相關,其p-vale小於0.05,另一組則為B,其p-vale大於0.05。我們模擬平均數的偏移和變異數的偏移共有三種情況,第一種為標準差增加25%,以V表示,第二種為標準差增加50%,以H表示,第三種為平均數向上偏移0.5倍的標準差,以M表示。(OXO)表示第二個變數作變動。,三個變數模擬結果,四個變數模擬結果,五個變數模擬結果,(模擬二),用SAS6.11統計軟體模擬四個獨立的變數,以X1、X2、X3及X4表示,然後以這四個變數做一些不同的線性組合求出Y1、Y2、Y3及Y4的樣本平均數、標準差及共變異數矩陣及相關係數矩陣,再計算出T2管制界限,在模擬中,我們考慮幾種不同的變異組合:為了知道變數的平均數偏移和變異數偏移在診斷上的不同,我們模擬結合平均數的偏移和變異數的偏移,S表示變數向上偏移50%個標準差並且標準差增加25%。另外模擬第一個變數有兩種偏移,分別是平均數上及變異數上的偏移了。M表示向上偏移50%個標準差,V表示標準差增加25%.模擬了第一個變數和第四個變數出問題,在此第一個變數和其它三個變數相關程度較低,而後三個變數相關程度較高除了變異組合的不同之外,我們尚且模擬了三種不同相關係數組合來探討相關係數在診斷上的結果,在此我們設定第一個變數和其他變數相關程度較低,相關係分別為小於0.32、小於0.26及小於0.17三種。,相關係數為0.32之模擬結果,”(1)”則表示找到一個出問題的變數,相關係數為0.26之模擬結果,相關係數為0.17之模擬結果,結論,1.可以看出在PCA法中,找到問題變數的個數隨著相關性減低而有增加的趨勢MPCA中則大致相同,這是因為在MPCA已把相關性較低的變數分類

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论