




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
多變量管制圖之比較與探討 指導教授 童超塵教授報告學生 吳志權 目錄 第一章序論研究背景研究的目的與方向研究架構第二章文獻探討多變量管制圖Hotelling 2多變量管制圖Hotelling T2衍生出的診斷方法主成分分析法 PCA MYT分解法殘差管制圖第三章診斷方法的應用與比較比較診斷方法在實際案例之使用比較診斷方法在模擬資料之使用改建流程之主成分分析法 MPCA 診斷方法的模擬結果與比較 模擬一 診斷方法的模擬結果與比較 模擬二 第四章結論與建議 第一章序論 研究背景良好的產品品質是許多企業永續經營的關鍵 達到此目標的方法之 應用統計製程管制方法 統計製程管制方法主要的有蕭華特 Shewhart 管制圖 累積和 CUSUM 以及指數加權移動平均 EWMA 以上這些單變量管制圖卻也只能對製程中的單一個品質特性作個別監控 所以無法完全解決現今高複雜度產品的品質偵測問題所以學者利用單變量管制圖的觀念 進而發展出不同的多變量管制圖 其中又以Hotelling sT2 MCUSUM及MEWMA三種方法最為廣受討論Hotelling sT2綜合Shewhart單變量管制圖的觀念而得MCUSUM及MEWMA則是由單變量的CUSUM EWMA演變而成 研究的目的與方向目的 探討當資料相關性不同時各診斷方法的特性以及比較其優缺點其可以改善的地方 以期在使用多變量管制圖來監控品質時能有更佳的表現 方向 探討比較資料在相關程度不同下之多變量管制圖診斷方法的差異點 建構一個多變量相關性資料的管制流程 研究架構 第二章文獻探討 多變量管制圖傳統的管制圖如Shewhart CUSUM和EWMA最大缺點便是將這些品質特性視為彼此獨立的變數如圖 兩個變數 Y1 Y2 彼此具有相關性 以二元變數來看信賴區間應為橢圓分佈之圖形 如只用單變量管制圖來測 其結果判斷為製程正常 這就是使用單變量管制圖很容易會有誤判的情形發生相關係數 Y1 Y2 0 8信賴區間為橢圓分布多變量品質管制法就是為了因應這樣的想法所衍生出來的 其做法為同時監控多個品質特性 並將多個變數之間的相關性納入考慮 此種品質管制方法即稱為多變量統計製程管制 MultivariateStatisticalProcessControl Hotelling 2多變量管制圖 從事多變量分析研究的首推Hotelling 1931 其管制圖主要的想法是利用新觀察值與歷史資料平均值之間距離的概念當 點到中心點很遠時 d2會很大 當d2大到一定程度時 我們即認為 點顯著 中心點 x1 x2 為其資料平均值從點 x1 x2 到平均值的直線距離為 因為忽略了變數X1 X2的變異數及相關性 所以我們就利用變數X1 X2自身的變異數 11和 22及共變異數 12來做矯正 可以得到一個卡方統計量此統計量是自由度為2的卡方分配 上式可說是多元管制圖的基礎 稱之橢圓管制圖用卡方 2統計量來判定是否超出管制界限 如製程平均值改變 則 2統計量便會大於臨界值如果 落在橢圓管制外 反之 2統計量小於臨界值 則表示在橢圓管制內 如果要管制p個品質特性時 假設此p個特性服從p元常態分配 樣本大小為n 則以p 1的向量可表示這些品質特性的平均值每個樣本的統計檢定值為 1 2 p 為製程在管制情況下每個品質特性平均值的向量 則為共變異數矩陣 管制圖上限 Hotelling T2衍生出的診斷方法 主成分分析法 PCA principalcomponentanalysis MYT分解法殘差管制圖 主成分分析法 PCA 由KarlPerson於1901年首先提出 目的將資料中原有的P個變數予以縮減 使其為K P 個互相無關連的互相獨立的線性組合變項 主成分 以達到簡化資料的目的主成分分析有三個重要目標 要保有原來變數的資訊 即有代表性 主成分之間不能重疊 即有獨立性 能以少數幾個主成分代替原來多個變數 即有精簡性 主成分分析的作法 由歷史資料 X 所估計的共變異數矩陣S可求得該矩陣的p個特徵值為 1 2 p 其中 1 2 p 及特徵值 i所對應的特徵向量為ei轉軸方程式yik e kxi ek1xi1 ek2xi2 ekpxipk 1 2 p主成分的重要性質有 第i個主成分變異數等於第i個特徵值 且各主成分之間的共變數為零表示如下 原始變數的變異數和會等於新變數的變異數和 即 tr S 1 2 p可找前k個主成分的新變數來代替原有的p個變數 當變數之間相關性高時 所需要的k就愈小 而其能解釋的變異佔總變異的比例也會相對的較高 如此便可以達到降低變數個數的目的 主成分變數可將Hotelling sT2分解成下式我們選出較大的幾項 其中再藉此找出哪些原始變數x對ti有較大之貢獻 找出影響異常值最大的要素使用多變量主成分分析的好處為 1 當變數個數很多且相關性頗高時 共變數矩陣 的逆矩陣 1 不一定存在 因此無法用Hotelling sT2計算 使用主成分分析可解決這樣的問題 2 當觀測的變數個數很多時 主成分利用轉軸的方法 可經由原始變數線性組合後的新變數 來降低所要觀測的原始變數個數 MYT分解法 Mason YoungandTracy 1995 利用T2的分解法提出一個診斷方法 簡稱MYTMYT就是利用其它變數給定條件下的方式來進行診斷 其方法主要是利用迴歸分析的方法將T2統計量分解成各個不同的獨立的部分 而每一獨立的部分均有其各自的T2值 利用歷史資料X 我們再利用最後一個變數Xp對前p 1個變數X1 X2 Xp 1做迴歸 得預測方程式及殘差平方和 SSE 其中為參數的估計值可將Hotelling sT2分解成 利用前p 1個變數針對第p個變數矯正後所得的T2值 為上述迴歸式標準差估計值 節省計算的法則 其步驟如下 步驟一 用計算 如果超出管制界限 第i個變數出了問題 因此將這些變數移除 而後再計算剩餘k1個變數的T2值 不顯著則表示出問題的觀察值已經全部找到 但如果顯著則表示尚有變數依然可能有問題 則到下一步驟步驟二 用計算任兩個剩餘k1個變數的也就是一個變數為條件的情況下 共有k1x k1 1 個 如果T2i j超出其界線 表示i j這兩個變數可能有問題 有問題的變數挑出 再計算剩餘變數k2的T2值 不顯著則表示出問題的觀察值的變數已經全部找到 如果顯著 則表示其餘的變數依然可能有問題 則須到步驟三步驟三 再計算所有可能的組合 如果超出其界線 表示這三個變數之間的關係可能有問題 把這些變數挑出 再計算剩餘變數的T2值 不顯著則表示出問題的觀察值的變數已經全部找到 如果顯著 則表示其餘的變數依然可能有問題 如此一直往高階的找下去 直到剩餘變數的T2值不顯著為止 殘差管制圖 單變數管制圖會因為忽略變數間的相關性而造成誤判 所以當變數互有相關時 我們希望在討論某一變數是否有問題時 能將其它變數對該變數之影響全部拿掉 所以我們利用每一變數對其它所有變數的複迴歸模式所求得的殘差值作為管制對象 複迴歸模式為 計算殘差和 記為SSEk 針對新觀察值中的每一個單元 利用迴歸的方式排除其它變數的影響 所得之標準殘差為 通常我們在特定的型 誤差 下 可求得殘差管制上下界 當標準殘差超出管制界限時 我們則認為此觀察值在第k個變數出現異常 第三章診斷方法的應用與比較 問題描述MYT計算法則雖然可以減少所要計算的分解量 計算法則在變數低於5個時 或許還能解決部分計算繁瑣的問題 但當變數個數更多時 這個法則就嫌不夠了 逐步排除的方式同時冒著診斷錯誤的風險 且MYT和殘差管制圖皆是由迴歸分析的觀念而來 然而卻沒有考慮到自變數具有多重共線性而造成的影響 這很可能在判斷製程出現異常之後 在診斷哪個變數出問題上會有誤判的情形 主成分分析診斷的最大問題是 原始變數的偏移不一定會反映在主成分轉軸後的變數 因此利用這些經主成分轉軸後的變數不一定能找出所有出問題的變數 比較診斷方法在實際案例之使用 用熱傳輸的實際案例來比較PCA MYT法在此實例中 已知三變數均發生問題 超出T2的管制界限在型一誤差 0 05下 管制界限約 2 MYT法 實例 現在有一組觀察值可得T2 12 03 可以知道這三個變數至少有一出現問題由上可知第一個變數X1有問題第二個變數X2在變數X1已知的條件下沒有問題同理第三個變數X 在變數X1 X 已知的條件下有問題 共可求得12項分解項目第一個變數X1不論是本身或是在其它變數的條件下 均可察覺出現了問題 第二個變數X2與第三個變數X3在其它變數的條件下 亦可察覺出現了問題 由此可發現此觀察值的這三個變數均有問題 這與實際案例可全符合 因此 藉由這樣的方式我們即可把有問題的變數診斷出來 PCA法 實例 利用歷史資料的共變異數矩陣可求得特徵值與特徵值向量t1 9 23724 t2 2 46819 t3 2 12059並將標準化的值畫分數圖無法經此分量找出所有有問題的原始變數 這也驗證原始變數的偏移並不一定會反映在主成分轉軸後的變數 因此有可能會造成誤判 比較診斷方法在模擬資料之使用 討論多變量管制圖模擬一組五個變數 並滿足多維常態分配 的數據 此數據的前35筆數據視為歷史資料 在後15筆數據中 第一個變數X1標準差的部分增加50 第五個變數X5向上偏移25 個標準差 採用此組數據 比較PCA MYT計算法則等方法之判斷結果 現在第13個樣本有一組觀察值計算可得整體的T2 22 878 此值超過管制界限 因此可以知道這五個變數至少有一出現問題 在算樣本五個單元個別標準化之值 法 模擬 一個節省計算的法則 先計算第48個樣本所有個別的將變數X1移除後再計算剩餘變數的T2值 16 37 依然顯著 表示其餘的變數依然可能出現問題 接著計算其餘四個變數所有可能的分解量利用MYT計算法則我們發現1 4 5這三個變數可能有問題 我們無法立即判定X4 X5到底哪一個變數有問題 因此利用這樣的計算法則有可能會增加有問題變數的個數 PCA法 模擬 首先利用歷史資料的相關係數矩陣可求得特徵值與特徵向量 分別如下 主成分的分量 表示如下t1 2 607056 t2 4 419612 t3 3 983952 t4 1 138842 t5 0 5749將標準化後的值畫分數圖 當標準分數絕對值大於2 5時 則有必要繼續討論原始變數對此分量的貢獻量原始變數在第二主成分分量之貢獻值原始變數在第三主成分分量之貢獻值 MYT與PCA法在案例上之結果比較 由實際資料及模擬資料診斷問題變數的例子中可發現MYT在三個變數的案例中可以將問題變數找出來 但在五個變數的模擬資料中 透過簡化的方法雖然可以減少須計算的分解量 但卻會有誤判的情形產生 且可看出MYT的計算過程中 除了殘差的差距很大時會造成顯著之外 當變數之間具有高度相關時 會造成判定係數過高 亦會造成顯著PCA在三個變數的案例中只能找出第一個變數 而在五個變數的例子中卻可以把問題變數找出來 在這兩個例子當中 第一個變數與其他變數的相關係數都較低 而其他變數之間的相關性較高 且主成分分析在變數具有較高程度相關時 其轉軸的效果愈好 相反的 若是變數之間的相關程度不高 主成分分析就不具有太大意義 改建流程之主成分分析法 MPCA 在製程或品質變數獨立的情況下 我們可以利用Shewhart CUSUM及EWMA等管制圖對個別變數進行監控 但在製程或品質變數不獨立時 利用這些單變數管制圖會因為忽略變數間的相關性而造成誤判 MYT的計算過程中 當變數之間具有高度相關時 會造成判定係數過高 亦會造成顯著 主成分分析在變數之間具有較高相關程度時 其使用的結果愈好 相反的 若是變數之間的相關程度不高 主成分分析就不具有太大意義 所以用MPCA法 利用變數之間的相關矩陣將變數分類 將變數之間將相關性較低的變數提出 再把剩下來具有較高程度相關的變數再進行主成分分析 結合單變量管制圖的方法去診斷問題變數 改建診斷流程之流程圖 MPCA法 實例 1 首先以單變量管制圖找出發生問題之變數 把有問題的變數挑出2 先由歷史資料求得變數間的Pearson相關係數矩陣及p value以找出相關程度較低的變數3 將相關程度較低的變數予以個別管制 其他相關程度較高的變數進行主成分分析 以進一步找出有問題的變數 4 X1以單變量管制圖來管制 可計算出其標準誤 5 對X2與X3進行主成分分析 首先找出其特徵值和特徵向量 主成分的分量 表示如下 t2 9 191 t3 2 6159將標準化後的值畫分數圖原始變數在第一主成分分量之貢獻值原始變數在第二主成分分量之貢獻值 MPCA法 模擬 首先以單變量管制圖找出發生問題之變數 把有問題的變數挑出 先由歷史資料求得變數間的Pearson相關係數矩陣及p value以找出相關程度較低的變數 將相關程度較低的變數予以個別管制 其他相關程度較高的變數進行主成分分析 以進一步找出有問題的變數 X1以單變量管制圖來管制 可計算出其標準誤 對X2 X3 X4及X5作主成分分析 首先找出其特徵值和特徵向量 主成分的分量 表示如下t1 4 064596 t2 3 276788 t3 1 559345 t4 1 0445169並將標準化後的值畫分數圖 原始變數在第一主成分分量之貢獻值 原始變數在第二主成分分量之貢獻值 原始變數在第三主成分分量之貢獻值 原始變數在第四主成分分量之貢獻值 MPCA在實際資料及模擬資料上的結果 由實際資料及模擬資料這兩例子中 MPCA與PCA不同的地方是在進行診斷前 先以單變量方式將問題變數挑出 再以相關係數矩陣將剩下的變數分類 保留較高程度相關的變數進行主成分分析 由結果可看出 MPCA是可以將問題變數找出 當變數間有相關程度較小的變數存在時 它有可能會影響到診斷的結果 也就是當變數間相關性愈高時 主成分分析的轉軸才有意義 診斷方法的模擬結果與比較 模擬一 用SAS6 11統計軟體分別模擬三 四及五個獨立的變數 以X1 X2 X3 X4及X 表示 然後以變數做一些不同的線性組合求出Y1 Y2及Y3的樣本平均數 標準差及共變異數矩陣及相關係數矩陣 再計算出T2管制界限 在模擬中 我們考慮幾種不同的變異組合 1 為了解在相關程度較低的變數出問題時 是否會影響其它相關程度較高的變數診斷結果 A組 設定第一個變數和其他變數相關係數較低不相關 其p vale小於0 05 另一組則為B 其p vale大於0 05 我們模擬平均數的偏移和變異數的偏移共有三種情況 第一種為標準差增加25 以V表示 第二種為標準差增加50 以H表示 第三種為平均數向上偏移0 5倍的標準差 以M表示 OXO 表示第二個變數作變動 三個變數模擬結果 四個變數模擬結果 五個變數模擬結果 模擬二 用SAS6 11統計軟體模擬四個獨立的變數 以X1 X2 X3及X4表示 然後以這四個變數做一些不同的線性組合求出Y1 Y2 Y3及Y4的樣本平均數 標準差及共變異數矩陣及相關係數矩陣 再計算出T2管制界限 在模擬中 我們考慮幾種不同的變異組合 為了知道變數的平均數偏移和變異數偏移在診斷上的不同 我們模擬結合平均數的偏移和變異數的偏移 S表示變數向上偏移50 個標準差並且標準差增加25 另外模擬第一個變數有兩種偏移 分別是平均數上及變異數上的偏移了 M表示向上偏移50 個標準差 V表示標準差增加25 模擬了第一個變數和第四個變數出問題 在此第一個變數和其它三個變數相關程度較低 而後三個變數相關程度較高 除了變異組合的不同之外 我們尚且模擬了三種不同相關係數組合來探討相關係數在診斷上的結果 在此我們設定第一個變數和其他變數相關程度較低 相關係分別為小於0 32 小於0 26及小於0 17三種 相關係數為0 32之模擬結果 1 則表示找到一個出問題的變數 相關係數為0 26之模擬結果 相關係數為0 17之模擬結果 結論 1 可以看出在PCA法中 找到問題變數的個數隨著相關性減低而有增加的趨勢MPCA中則大致相同 這是因為在MPCA已把相關性較低的變數分類出來個別管制的關係提出 但依然不易發覺此問題變數到底是平均值或
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公关考试题型及答案详解
- 2025签订独家FCPY经销合同范本
- 优化医院管理体制与运行机制
- 2025劳动合同终止证明模板
- 体育场馆空间优化与绿色建筑设计的融合
- 分类语文考试题及答案大全
- 城市防洪体系建设中的社会公众参与和合作机制
- 高校会计专业师资队伍建设与能力提升
- 2025购物中心品牌加盟协议
- 基础考试重点试题及答案
- 产品品质及售后无忧服务承诺书3篇
- 2025年第11个全国近视防控宣传教育月活动课件
- 2025年养老产业市场营销策略调整分析报告
- 部编版二年级道德与法治上册第4课《欢欢喜喜庆国庆》精美课件
- 潍坊市2026届高三开学调研监测考试生物试题及答案
- 三维波动方程双变网格有限差分并行模拟方法:理论、实践与优化
- 好风起二部合唱简谱致远音乐
- 异姓兄妹结拜协议书范本
- 膝关节炎科普知识课件
- 2025广西公需科目考试答案(3套涵盖95-试题)一区两地一园一通道建设人工智能时代的机遇与挑战
- 医院三合理一规范培训
评论
0/150
提交评论