




已阅读5页,还剩29页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
授 課 目 錄 第1章 導 論第2章 統計資料的整理與描述第3章 機率導論第4章 常用的機率分配與統計分佈第5章 描樣方法與描樣分佈第6章 統計估計第7章 統計檢定第8章 變異數分析第9章 相關分析與迴歸模式第10章 無母數統計檢定第11章 類別資料分析-列聯表與卡方檢定第八章 變異數分析一般統計檢定係討論兩個常態母體下檢定平均值的方法。倘對k個常態母體,欲檢定其平均值是否一致時,採逐一比對程序檢定則效率差且會增型 I 誤差的機率。變異數分析ANOVA(Analysis of Variance)的主要觀念即利用各組資料平均值的差異與各組資料整體之間差異做比較,來檢定平均值是否相同的方法。ANOVA可對k個母體檢定其平均值是否一致。ANOVA即將一組資料的總變異,依其變異來源分割成數區,然後針對其各區內變異與各區間變異加以探討分析。ANOVA依據因子的數目-One-way ANOVA,Two-way ANOVA。8.1 實驗設計與ANOVA 十九世紀初,英國為了改良農作物的品質與產量,由Ronald A. Fisher爵士首先提出應用ANOVA於實驗設計(DOE, Design of Experiment)中。實驗的目的是將不同的處理(Treatment),指定給不同的實驗單位(Unit),以便觀察其結果好壞。過程輸入x輸出y可控因子x不可控因子z 實驗的目的是將不同的處理,指予不同的實驗單位,以便觀察其結果好壞。其包括下列幾點:1、決定何者變數x對反應y最具影響力。2、決定這些最具影響力變數x的值,使反應y幾乎永遠都是在所想要的目標值(Nominal Value) 的附近。3、決定這些最具影響力變數x的值使反應y變異較小。4、決定這些最具影響力變數x的值使得不可控變數z的影響極小。 以一般實驗設計方法分為二大類:完全隨機設計(Completely Randomized Design)與集區隨機設計(Randomized Block Design),以增處理效果的可信度。1、 完全隨機設計係在考慮一個因子的情況下,有n1 , n2 , ,nk個實驗單位分別指定到k個處理上。這些實驗單位的實驗順序是隨機決定的。完全隨機設計因為只考慮一個因子,故亦稱一因變異數分析(One-way ANOVA)。可中和其他因子對實驗的影響。2、 集區隨機設計係事先將實驗對象劃分成若干同質性的集區,即在每個集區內涵具同質性環境下,進行不同實驗處理。實驗設計亦可以一函數表示之:y = f(x1 , x2 , ,xk)(8.1)式中:輸入x-可控因子(變數)(Control Factors (Variables),輸出y-依變量(Dependent Variable),過程輸入x輸出y可控因子x不可控因子z8.2 一因子變異數分析(The One-way ANOVA)倘工管系欲採三種工廠實習課程:(1)電視教學 (2)講師講習 (3)實地觀摩,研究其對學生學習效果是否有不同的影響。此3種實習課程稱之處理(Treatment)。於是將實習生隨機分成3組,分別施以不同實習課程。茲隨機抽樣21位實習生進行分組,第1組有7位,第2組有8位,第3組有6位。此n1 = 7 , n2 = 8 , n3 = 6稱之實驗單位(Unit)。本研究僅以工廠實習課程此一因子(Factor)來對母體作分類探討,故此稱之一因子變異數分析。典型資料如下:處理(水準)Treatment(Level)觀測值(Observations)總和(Totals)平均值(Average)1 y11 y12 y1ny12y21 y22 y2ny2.aya1 ya2 y1nyayN = anyij : 第i個處理、第j個觀測值一因子變異數分析是根據變異來源:組內、組間、與總變異等統計量,建立變異數分析表(ANOVA Table),以進行檢定工作。變異來源平方和SS自由度df均方和MSF因子(組間)SSTa-1MST=SST/(a-1)MST/MSE隨機(組內)SSEN-aMSE=SSE/(N-a)總和SSN-1MS=SS/(N-1)其中:總變異(Total Sum of Squared Deviation)SS = = SST+SSE(8.2)組間變異(Treatment Sum of Squares) (Between Treatment)SST = (8.3)組內變異(Error Sum of Squares) (Within Treatment)SSE = (8.4)簡化之:SS = ; SST = SSE = SS SST(8.5)一因子變異數分析的統計假設為 H0: m1= m2 =. = mk ;即因子對依變數無影響。H1: mi 不全等;即因子對依變數有影響。上述的假設中, m1 , m2 ,. , mk分別為k個因子水準所造成的效果。若H0為真,即表示k個效果不存在,因子對依變數無影響。檢定統計式:F = MST/MSE(8.6)若各組樣本均來自常態分佈,則檢定統計量為一F分佈。在顯著水準a下,倘F Fa, a-1, N-a Accept H0F Fa, a-1, N-a Reject H0各組樣本數相等範例、隨機抽取IDF、F16、與幻象2000等三種戰機各10架,測其速度,這三種戰機的平均速度有差異?SOL:(1)建立統計假設H0: m1= m2 = m3 ; H1: mi 不全等(2) 顯著水準a = 0.05IDFF162000單因子變異數分析2.251.992.782.122.482.64摘要1.892.512.98組個數總和平均變異數1.932.082.84IDF1020.952.0950.03572.432.313.01F161022.062.2060.05931.872.272.7220001028.322.8320.01532.041.842.852.111.992.692.322.082.89ANOVA1.992.512.92變源SSdfMSFP-值組間3.15788721.57894342.9384.1E-09組內0.99285270.036772臨界值3.354131總和4.15073729F(=42.94)值遠大於臨界值(=3.35),且P-值為4.1E-09遠小於顯著水準0.05Reject H0 即至少有二種戰機(母體)的平均速度是有差異的。各組樣本數不等範例、工管系欲採三種工廠實習課程:(1)電視教學 (2)講師講習 (3)實地觀摩,其對學習效果是否有不同的影響? SOL:(1)建立統計假設H0: m1= m2 = m3 ; H1: mi 不全等(2) 顯著水準a = 0.05電視教學講師講習實地觀摩單因子變異數分析707682838580摘要888075組個數總和平均變異數929089電視教學75888455858570講師講習86888634808872實地觀摩64687850909094ANOVA變源SS自由度MSFP-值組間228.95242114.47622.5190360.108502組內8181845.44444臨界值3.554561總和1046.95220F(=2.52)值小於臨界值(=3.55),且P-值為0.1085大於顯著水準0.05Accept H0 三種工廠實習課程對學生學習效果無差異的。8.3 集區隨機設計(The Randomized Block Design)在任何實驗中,擾動因子(Nuisance Factor)引起的變異對其結果會有影響。擾動因子之定義: 一設計因子,其對反應有效果而實驗者卻對此效果無興趣。未知且無法控制(Unknown and Uncontrolled)的擾動因子:不知其存在及實驗進行時可能改變水準。隨機化是一種設計技巧用來防範此潛伏的擾動因子。然而,已知但不可控制(Known but Uncontrollable)的擾動因子,倘於每次實驗時會觀測到此的擾動因子之值,則於ANOVA時其會被補償。如擾動變異來源是已知且可控制(Known and Controllable)時,集區劃分(Blocking)之設計將可系統化地消除其對處理間統計比較的影響。上節敘述一因子變異數分析,且完全隨機設計,藉此中和或消弭一些非特定因子(不是我們想知道的重點)對依變量(輸出y)所造成的影響。但某些情況下,非特定因子對依變量的干擾過大,甚至完全隨機設計亦無法消弭這些干擾。此時依變量不只受到特定因子的影響,亦受到非特定因子的影響。倘致遠管理學院欲對6個學系有開統計學課程,採4種不同教學方式,以研究統計學對各系學生學習效果是否有不同的影響。此時,學生學習效果為依變量(輸出y),教學方式為特定因子,但學生學習效果卻不只受到教學方式的影響,而受到各學系的影響,因為各學系各具不同的特性。若用上節的檢定方式,會將各系所導致的影響計入SSE中,而使得SSE膨脹起來,因而影響結論的正確性。如欲評鑑各系學生學習統計學的效果,則各系學生學習成績形成一個集區(Block)。因此總變異的分解為:SS(總變異) = SST(組間變異) + SSB(集區變異)+ SSE(隨機誤差)Block 1Block 2.Block by11y12y1by21y22y2by31y32.y3b.ya1ya2yab變異來源平方和SS自由度df均方和MSF因子(組間)SSTa-1MST=SST/(a-1)MST/MSE集區SSBb-1MSB=SSB/(b-1)MSB/MSE隨機(組內)SSE(a-1)(b-1)MSE=SSE/(a-1)(b-1)總和SSN-1MS=SS/(N-1)其中:SS = = = SST + SSB+ SSE(8.7) SST = (8.8)SSB = (8.9)SSE = (8.10)簡化之:SS = ; SST = SSB = ;SSE = SS SST- SSB (8.11)集區隨機設計的統計假設為H0: m1= m2 =. = mk ;即因子對依變數無影響。H1: mi 不全等;即因子對依變數有影響。上述的假設中,m1 , m2 ,. , mk分別為k個因子水準所造成的效果。若H0為真,即表示k個效果不存在,因子對依變數無影響。檢定統計式:F = MST/MSE(8.12)若各組樣本均來自常態分佈,則檢定統計量為一F分佈。在顯著水準a下,倘F Fa, a-1, (a-1)(b-1) Accept H0F Fa, a-1, (a-1)(b-1) Reject H0範例、欲研究硬度實驗。共有4種尖銳物和4塊可供測試的金屬物品。每1種尖銳物在每塊金屬物品上測試一次,成為一個集區隨機設計。尖銳物種類金屬物品(集區)123419.39.49.610.029.49.39.89.939.29.49.59.749.79.610.010.2SOL:變異來源平方和SS自由度df均方和MSF處理(尖銳物種類)38.50312.8314.44集區(金屬物品)82.50327.50P-Value誤差8.0090.890.0009總和129.0015 F(=14.44)值大於臨界值(=3.86),且P-值為0.0009小於顯著水準0.05Reject H0 尖銳物種類的確會影響平均硬度讀值(即尖銳物對平均硬度有效)。SOL:(考慮集區)變異來源平方和SS自由度df均方和MSF處理(尖銳物種類)38.50312.8314.44集區(金屬物品)82.50327.50P-Value誤差8.0090.890.0009總和129.0015 SOL:(倘無考慮集區)變異來源平方和SS自由度df均方和MSF處理(尖銳物種類)38.50312.831.70誤差90.50127.54總和129.0015 F(=1.70)值小於臨界值(=3.49)。Accept H0 尖銳物種類的平均硬度讀值相等,即尖銳物種類不會影響平均硬度讀值(即尖銳物對平均硬度無效)。8.4 二因子變異數分析(Two-way ANOVA)在上述一因子變異數分析和集區隨機設計中,均研究一個因子對依變量所造成的影響,將此觀念擴展至二因子時,此研究架構即為二因子變異數分析。在進行二因子變異數分析時,須考因子間是否對依變數有交互作用(Interaction),此作用不存在,則變異數分析的結構較簡單,則二個因子對依變量的影響可分開研究;倘此作用存在,則變異數分析的結構較複雜,則二個因子對依變量的影響須置於一起討論。考慮一般情況,令yijk為A因子在第i個水準( i = 1, 2,a)、B因子在第j個水準( j = 1, 2,b)、在第k次重複( k = 1, 2,n)時所觀測到的反應值。如下:y2b1 , y2b2 , , y2bn B 因 子 12bA因子1y111 , y112 , , y11ny121 , y122 , , y12n.y1b1 , y1b2 , , y1bn2y211 , y212 , , y21ny221 , y222 , , y22n.y2b1 , y2b2 , , y2bn:.aya11 , ya12 , , ya1nya21 , ya22 , , ya2n.yab1 , yab2 , , yabn總變異 = A因子變異+ B因子變異 + AB因子交互變異 + 隨機誤差變異來源平方和SS自由度df均方和MSF因子ASSAa-1MSA=SSA/(a-1)MSA/MSE因子BSSBb-1MSB=SSB/(b-1)MSB/MSE交互作用SSAB(a-1)(b-1)MSAB=SSAB/(a-1)(b-1)MSAB/MSE隨機誤差SSEab(n-1)MSE=SSE/ab(n-1)總和SSabn-1MS=SS/(abn-1)其中:SS= = + = SST + SSB+ SSAB+ SSE(8.13)簡化之:SS = ; SSA = SSB = ;Subtotal =SSAB = Subtotal SSA - SSB SSE = SS Subtotal(8.14)在進行二因子變異分析時,一般是先檢定交互作用存在與否,倘接受H0:交互作用不存在,則二因子變異分析的架構可簡化之,此時再繼續進行A、B因子效果檢定假設才有意義。若拒絕H0,則無論A、B因子效果檢定的結果為何,交互作用都會保留在模式中,此已認定A、B因子會對依變量造成影響。二因子變異分析三階段檢定過程:(1) 檢定交互作用是否存在:統計假設為H0:交互作用不存在。H1 :交互作用存在。若H0為真,即表示A、B因子未對依變數產生交叉影響。檢定統計式:F = MSAB/MSE(8.15)倘F Fa, (a-1)(b-1), ab(n-1) Accept H0F Fa, (a-1)(b-1), ab(n-1) Reject H0(2) 檢定A因子是否影響依變量:假設已作出交互作用不存在,則分別檢定二因子對依變量的影響。統計假設為H0: m1j= m2j = maj , j = 1, 2,b;H1: m1j , m2j , maj 不全相等。若H0為真,即表示A因子未對依變數產生影響。檢定統計式:F = MSA/MSE(8.16)倘F Fa, (a-1), ab(n-1) Accept H0F Fa, (a-1), ab(n-1) Reject H0(3) 檢定B因子是否影響依變量:檢定B因子對依變量的影響。統計假設為H0: mi1= mi2 = mib , i = 1, 2,a;H1: mi1 , mi2 , mib 不全相等。若H0為真,即表示B因子未對依變數產生影響。檢定統計式:F = MSB/MSE(8.17)倘F Fa, (b-1), ab(n-1) Accept H0F Fa, (b-1), ab(n-1) Reject H0電池設計實驗材料種類溫 度(F)1570125113015534402070741808075825821501883612225701591261061155845313811074120961041681601501398260ANOVA for Battery Life Data變源SSDOFMSFP-值臨界值樣本10683.7222225341.861117.9113722690.001976083.35413119欄39118.72222219559.361128.967691951.9086E-073.35413119交互作用9613.77777842403.444443.55953540.018611162.72776645組內18230.7527675.212963總和77646.9722235由ANOVA表示,F0.05, 4, 27 = 2.72,則材料種類與溫度之間有顯著性,再者,F0.05, 2, 27 = 3.35,則材料種類與溫度之主效果亦有顯著性。為解釋實驗的結果,構建各處理組合下平均反應圖,由圖5-9所示,結論如下材料種類-溫度之反應圖由直線缺乏平行性質視出顯著的交互作用,不論材料種類,低溫會得到較長的壽命,如要求溫度變化時,其電池有效壽命折損較小,則材料種類3的表現似最佳。高中低貨品陳架(二因子-位置與高度)與銷售量前面359560雙因子變異數分析:重複試驗4510055258070摘要高中低總和409050前面3011070個數55515後面659030總和1754753059556510525平均35956163.75510035變異數62.512580723.1609040759540後面個數55515總和320480170970平均64963464.7變異數5542.542.5726.7總和個數101010總和495955475平均49.595.547.5變異數285.83374.7256.9ANOVA變源SSdfMSFP-值臨界值樣本(前後)7.517.50.110.744.25968欄(高度)14746.727373.331099E-133.40283交互作用392021960294E-073.40283組內16302467.92總和20304.229高中低前面359561後面649634習題1. 以下有數個一因子變異數分析的例子,針對各個例子找出其因子,因子水準以及因變量:(a) 某家汽車零件公司主要是製造三種汽車零件:輪胎、煞車、排氣管;每一種零件各設置一個銷售來負責銷售。公司高層人員想要研究這三種零件的銷售網每月的營業額是否相同。(因子: 汽車零件;因子水準: 輪胎、煞車、排氣管;因變量:每月的營業額)(b) 稅捐稽徵處想要研究在台北市三種職業(大學教授、電腦工程師、房地產仲介業者)年收入的狀況。研究人員從臺北市抽出一千人,以這些樣本來推斷這三種職業的年收入是否相同。(因子: 職業種類;因子水準: 大學教授、電腦工程師、房地產仲介業者;因變量:年收入)(c) 某研究是研究不同溫度下木材的抗壓能力,研究人員設定了三種溫度:0、25、50,他們想要知道在這三種溫度之下,木材的抗壓能力是否會不同。(因子: 溫度;因子水準: 0、25、50;因變量:木材的抗壓能力)2. 致遠管理學院工管系想要研究不同的教學方式對學習成果所造成的影響。研究人員隨機選出15位大一新生同學,並將之分為三組。第一組用教學錄影帶來教授學生,第二組採用傳統的課堂教學方式,第三組僅授予講義,由學生自行研讀。一學期後,對這三組學生進行測驗,以下是測驗的成績:樣本教學方式12345錄影教學8682947786課堂教學9079888796講義教學7870657463(a) 寫出ANOVA表。(b) 在顯著水準a=0.05下,不同的教學方式是否對學習成果會造成影 響?請寫出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準930246512.13誤差4601238.3臨界值總和1390143.89Reject H0 不同的教學方式是對學習成果會造成影響。3. 某電器公司將研發的新產品(收音機)委託四家工廠製造,為了測試這四家工廠製造收音機品質,研究人員分別由四家工廠的生產線上各抽出台收音機,將收音機的音量開到最大,並記錄它們的使用期限,以下便是測試的結果:(單位為月)樣本工廠123456一廠5.55.05.25.34.84.8二廠4.73.94.34.54.14.3三廠6.15.75.05.35.26.3四廠4.55.14.34.14.55.1(a) 寫出ANOVA表。(b) 在顯著水準a=0.05下,這四家工廠所製造的收音機品質是否一樣?請寫出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準5.8831.9612.98誤差3.02200.15臨界值總和8.90233.10Reject H0 這四家工廠所製造的收音機品質不一樣。4. 一位食品研究人員想要研究蛋糕中乳酪的含量是否會影響蛋糕的體積;他調配了10公克、20公克、30公克三種乳酪含量,將它們置入原料中再烘烤成蛋糕,並測量蛋糕的體積。研究人員烘烤了21個蛋糕,每種乳酪含量各烘烤7個蛋糕,以下是所得的資料:樣本重量123456710公克38739640140539839139320公克39039438139040240339130公克398401405380391394395(a) 寫出ANOVA表。(b) 在顯著水準a=0.05下,乳酪含量是否會影響到蛋糕體積?請寫出你 的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準29.4214.70.28誤差959.71853.3臨界值總和989.1206.01Accept H0 乳酪含量不會影響到蛋糕體積。5. 一家廚具公司代理了三家廠牌的電子鍋,這三種電子鍋的品質、價格其實相差並不大,不過為了解顧客對廠牌的喜好狀況,該公司想要比較這三種電子鍋的銷售狀況。研究人員選了六家廚具販賣店,並調查在這六家商店中三種電子鍋的銷售量,以下變是調查的結果:(單位為百元)。商店廠牌商店一商店二商店三商店四商店五商店六廠牌一216117692748178228303183廠牌二237919131119120819621689廠牌三14791024159896319132251這是一個隨機集區化的變異數分析,請回答以下問題:(a)在這個分析中,何者為因子(電子鍋的廠牌)?何者集區(販賣電子鍋的商家)?請加以解釋。(b)寫出ANOVA表。(c)在顯著水準a=0.05下,這三種電子鍋的銷售量是否一樣?請寫出你的檢定程序。變異來源平方和SS自由度df均方和MSF因子水準25700562128502874.47集區24077485誤差175254210175254臨界值總和6730345177.56Reject H0 這三種廠牌電子鍋的銷售量是不一樣。6. 以下是水果茶銷售的實際觀測資料:賣場j顏色i12345粉紅 126.528.725.129.127.2橙色 231.228.330.827.929.6淡紫 327.925.128.524.226.5墨綠 430.829.632.431.732.8這是一項集區隨機化的實驗設計,依顏色的不同,所有賣場(集區)的水果茶銷售量被分類為四組,由於每一種顏色的水果茶皆設置了五個賣場在販售。因此,在每種顏色之下皆有五個實際銷售量。銷售量是以萬元作為單元。 (a)請列出變異數分析表。 (b)在顯著水準a=0.05下,檢測顏色是否會影響銷售量。變異來源平方和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六篇2025年全国国家版图知识竞赛题库及答案题(中小学组)
- 会计概述说课课件
- 卫生健康城市建设框架
- 三级电子病历评审医院汇报
- 物业开放日汇报
- 生物医学课程核心框架
- 乳香种植与养护技术
- 仁济医院花荣
- 会计基础知识培训内容课件
- 卫生安全教案
- 带状疱疹护理查房
- SX-22163-QR345工装维护保养记录
- 中国重症加强治疗病房建设与管理指南
- 2023年航空职业技能鉴定考试-候机楼服务技能考试题库(含答案)
- MBA培训进修协议
- p型半导体和n型半导体课件
- LY/T 2501-2015野生动物及其产品的物种鉴定规范
- GB/T 748-2005抗硫酸盐硅酸盐水泥
- GB 15763.1-2001建筑用安全玻璃防火玻璃
- 民间文学(全套课件)
- 既有重载铁路无缝线路改造及运维技术探索
评论
0/150
提交评论