統計推論與顯著性檢驗_第1页
統計推論與顯著性檢驗_第2页
統計推論與顯著性檢驗_第3页
統計推論與顯著性檢驗_第4页
統計推論與顯著性檢驗_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

/sundae_meng社會統計第六講統計推論與顯著性檢驗

©Ming-chiChen/sundae_mengPage.2Hypothesistesting假設檢定對於母體參數(parameter)的推估可以透過以下兩種方式:先估計參數的估計值,然後建構出信賴區間。假設檢定:先給予母體未知數一個假設值,再利用樣本或實驗結果來推斷此假設的可信度。©Ming-chiChen/sundae_mengPage.3Hypothesistesting假設檢定假設檢定假設:從於一小撮觀察到的樣本中,提出的對於更一個大族群(母體)的某些性質的陳述、臆測、推論。檢定:這種從觀察到的樣本所得出的推論是否合理。©Ming-chiChen/sundae_mengPage.4Hypothesistesting假設檢定檢定的假設:“台灣人民的平均教育年數為12年”“人社系男生的統計成績優於女生”“贊成一國兩制的人不會超過百分之五”觀念©Ming-chiChen/sundae_mengPage.5Hypothesistesting假設檢定的原理假設檢定的基本原理:將”實際”觀察到的(observed)與”期望觀察到的”(expected)做比較。所謂”期望”是指在我們對於母體的陳述為真的條件下,我們期望觀察到….觀念©Ming-chiChen/sundae_mengPage.6Hypothesistesting假設檢定的步驟(1)將我們對於母體的臆測寫成假設陳述。(2)如果假設為真,則我們期望觀察到世界為…(3)檢查我們實際觀察到的世界,與在假設為真的情況下,我們期望觀察到的世界是否吻合。觀念©Ming-chiChen/sundae_mengPage.7Hypothesistesting假設檢定母體參數(parameter)為一個描述母體性質的數量值。假設為關於母體參數有可能的數值的陳述(astatementaboutthevalueorsetofvaluesthataparameterorgroupofparameterscantake.)觀念©Ming-chiChen/sundae_mengPage.8ThenullhypothesisH0andthealternativehypothesisH1Thenullhypothesis(虛無假設)H0是一組直接被檢定,關於對於母體參數值的假定。通常我們設定這個參數值為「無效果」。Thealternativehypothesis(對立假設)H1或Haspecifiesanalternativesetofpossiblevaluesofthepopulationparameterthatarenotspecifiedinthenullhypothesis.不包含在虛無假設中的母體參數的可能值。Thetwohypothesesaremutuallyexclusive.這兩種假設為互斥。觀念©Ming-chiChen/sundae_mengPage.9假設檢定的基本原理如果H0為真,那我們看到特定樣本統計量的機率有多少?Exp.如果台灣人平均月收入是3萬塊,那我們有多大機會在社會變遷調查中得到2.6萬的平均月所得?這個偏差很大嗎?利用前面提過的標準化常態分配的特質,或是這一講會說明的t分配特質,我們可以知道得到某個樣本統計量的機會為何。抽樣分配的特質©Ming-chiChen/sundae_mengPage.10ThenullhypothesisH0andthealternativehypothesisH1Simplehypothesis簡單假設:在統計假設之中只為一個數值之假設,如:觀念Compositehypothesis複合假設:在統計假設之中,其假設不只包含一個數值,而是一些數值的集合體,如:©Ming-chiChen/sundae_mengPage.11Nullhypothesisaboutapopulationproportion環保局宣稱20%的汽車的排氣設備被動過手腳。欲檢定這個假設,請寫出虛無假設:例題虛無假設為對母體比率的一個描述,除非我們有充分的證據顯示虛無假設為偽,我們暫且假設它所描述的母體性質為真。請寫出前例的相對假設:One-sidedalternativehypothesis©Ming-chiChen/sundae_mengPage.12Onesidedalternativehypothesis消基會想要知道某廠牌的洗衣粉是否如同其包裝盒上所標示的至少5公斤重,寫出虛無假設及相對假設:例題One-sidedalternativehypothesis©Ming-chiChen/sundae_mengPage.13Two-sidedalternativehypothesis某公司購買新型的抽水機,想知道與標準型有沒有差異。舊型抽水機每小時可抽5000加侖的水。虛無假設為:例題對立假設為:Two-sidedalternativehypothesis©Ming-chiChen/sundae_mengPage.14常用的假設例題©Ming-chiChen/sundae_mengPage.15Whichhypothesisisthenullhypothesis?(1)Inmanystatisticalapplications,thenullhypothesisshouldcorrespondtotheassumptionthatnochangeoccurswhensomenewprocessortechniqueistried.新的過程或技術沒有造成任何改變的假設。(如之前的抽水機例子)©Ming-chiChen/sundae_mengPage.16Whichhypothesisisthenullhypothesis?(2)Somestatisticiansarguethatthenullhypothesisshouldbethehypothesisthatthedecisionmakerwantstodisprove.希望被決策者否定的假設稱為虛無假設。Thatis,thenullhypothesisshouldspecifythevaluesofthepopulationparameterthattheresearcherthinksdoesnotrepresentthetruevalue(s)oftheparameter;thealternativehypothesisthenspecifiesthevaluesoftheparameterthattheresearcherbelievesdohold.虛無假設中所假設的母體參數值為研究者認為不對的母體參數值。©Ming-chiChen/sundae_mengPage.17Whichhypothesisisthenullhypothesis?(3)anothercommonpracticeistoassignnospecialmeaningtoeitherthenullorthealternativehypothesis,buttoletthesehypothesesmerelyrepresenttwodifferentassumptionsaboutthepopulationparameter.不特別去區分虛無假設及對立假設的意義,讓兩者各自代表母體參數的一個可能值。©Ming-chiChen/sundae_mengPage.18Whichhypothesisisthenullhypothesis?消基會接獲很多消費者的抱怨,想調查超市中五磅的碎牛肉是否不夠重量。虛無及對立假設為:例題©Ming-chiChen/sundae_mengPage.19Whichhypothesisisthenullhypothesis?市政府所用的紅綠燈平均壽命為2000小時,一家新的製造商宣稱他們的產品比原來的壽命要長,且價格相同。市府想要測試新燈泡的壽命是否超過2000小時,虛無假設為:例題©Ming-chiChen/sundae_mengPage.20Whichhypothesisisthenullhypothesis?一家公司的產品為30%的消費者所採用(p=.30),公司在某些區域測試新推出的廣告是否增加銷售,其虛無假設為:例題©Ming-chiChen/sundae_mengPage.21Whichhypothesisisthenullhypothesis?汽車車門的油漆平均五年會開始脫落,某科學家宣稱新的油漆壽命比較長,汽車公司想測試新油漆的壽命:例題©Ming-chiChen/sundae_mengPage.22ConsequencesofchoosingH0andH1Thenullhypothesishasthestatusofamaintainedhypothesisthatwillnotberejectedbecauseitisassumedtobetrueunlessthesampledataprovidestrongcontraryevidence.由於我們只有在證據很充分的情況下才能推翻虛無假設,因此虛無假設比對立假設佔據更有利的地位,假設的寫法對於結果有很大影響。觀念©Ming-chiChen/sundae_mengPage.23ConsequencesofchoosingH0andH1衛生署在核准新藥上市中,面臨以下兩個可能的結果:一、新藥對於病患有益。二、新藥對於病患無益處。兩者都可以被選為nullhypothesis觀念©Ming-chiChen/sundae_mengPage.24ConsequencesofchoosingH0andH1衛生署選擇以下的方式:H0:新藥對於大眾A沒有益處不應該上市。H1:新藥對於大眾有益處。此時藥廠必須舉證推翻H0,否則衛生署不會核准新藥上市。由於這種假設方式,新藥上市過程十分冗長,但好處為有害藥物要上市十分困難。觀念©Ming-chiChen/sundae_mengPage.25ConsequencesofchoosingH0andH1如果衛生署選擇以下列的方式來核准新藥:H0:新藥對於病患有益處且應上市。H1:新藥對於病患沒有益處不應該上市。此時除非有強而有力的證據顯示藥物無效或有害,否則暫且假定此藥為有益處的。這種方式可以使新藥快速上市,但風險也很高。觀念©Ming-chiChen/sundae_mengPage.26ConsequencesofchoosingH0andH1在假設檢定中,我們能夠計算下列機率:P(theoryistrue|observeddata)即給定目前觀察到的樣本資料,理論為真的條件機率為何?但實際上,我們計算的條件機率為:P(observeddata|theoryistrue)即在假設理論為真的前提下,觀察到目前樣本資料的機率為何?觀念©Ming-chiChen/sundae_mengPage.27ConsequencesofchoosingH0andH1如果理論為真,則樣本資料應比較有可能呈現…比較不可能為…。若觀察到與理論一致的樣本(較有可能發生的樣本),則暫且假定理論為真。若觀察到樣本在理論為真的假設下不太可能發生,則推翻理論。觀念©Ming-chiChen/sundae_mengPage.28Decisionrules根據樣本所提供的資訊,我們面臨兩種可能的決定:一、拒絕接受nullhypothesis(rejectingH0)二、無法推翻nullhypothesis(notrejectingH0)有時候統計學者會說接受acceptednullhypothesis,不過較為正確的說法應該是無法拒絕或無法推翻H0。觀念©Ming-chiChen/sundae_mengPage.29Decisionrules推翻nullhypothesis的決策法則:我們根據檢定統計量(teststatistics)來決定是否推翻虛無假設,如樣本平均數、樣本比率、Z或t值等。Teststatistic:ateststatisticisarandomvariablewhosevalueisusedtodeterminewhetherwerejectthenullhypothesis.觀念©Ming-chiChen/sundae_mengPage.30DecisionrulesDecisionrule:ThedecisionrulespecifiesthesetofvaluesoftheteststatisticforwhichthenullhypothesisH0isrejectedinfavorofH1andthesetofvaluesforwhichH0isaccepted(i.e.,notrejected).假設檢定中的決策法則為決定推翻或無法推翻假設的檢定統計量的範圍值。觀念©Ming-chiChen/sundae_mengPage.31RejectionRegionandAcceptanceRegion根據決策法則我們可以將檢定統計量分成窮盡及互斥的兩組數值區域:Therejectionregion

(危險域或拒絕域)ofatest,alsocalledthecriticalregion(棄卻域),consistsofallvaluesoftheteststatisticforwhichH0isrejected.Theacceptanceregion

(接受域)consistsofallvaluesoftheteststatisticforwhichH0

isnotrejected.觀念©Ming-chiChen/sundae_mengPage.32CriticalValue臨界值Thecriticalvalueoftheteststatisticisthevaluethatseparatesthecriticalregionfromtheacceptanceregion.區分拒絕域及接受域的界線。單邊對立假設(one-sidedalternativehypothesis)有一個臨界值;雙邊對立假設有兩個臨界值。觀念©Ming-chiChen/sundae_mengPage.33Decisionrules統計檢定有點像法院中的陪審團在審理案件(虛無假設受到審判),在樣本資料還沒有充分證據顯示「有罪」之前,我們暫且假定虛無假設為真。在法院的審判中有兩種可能的錯誤:無罪的人被誤判為有罪,有罪的人被無罪釋放。正如同法院的審判,檢定有兩種犯錯的可能:nullhypothesis在正確的情況下被推翻(typeIerror錯殺無辜)及nullhypothesis不正確但沒有被拒絕(typeIIerror縱放壞人)。觀念©Ming-chiChen/sundae_mengPage.34TypeIandTypeIIErrors用樣本資料去推論母體未知參數時,由於抽樣的偏差,可能產生推論的誤謬。觀念©Ming-chiChen/sundae_mengPage.35TypeIandTypeIIErrors型I誤差:當H0為真,但檢定結果拒絕H0。型II誤差:當H0不真,但檢定結果不拒絕H0。觀念©Ming-chiChen/sundae_mengPage.36LevelofSignificance(αrisk)顯著水準:typeIerror發生的最大機率值。ThelevelofsignificanceofatestistheprobabilitythattheteststatisticfallsinthecriticalregiongiventhatH0istrue.Thelevelofsignificanceisdenotedbythesymbolα觀念©Ming-chiChen/sundae_mengPage.37ProbabilityofaTypeIIError(βrisk)β風險:typeIIerror發生的最大機率值。TheprobabilityofmakingaTypeIIerroristheprobabilitythattheteststatisticfallsintheacceptanceregionwhenthenullhypothesisisfalse,

denotedbyβ觀念©Ming-chiChen/sundae_mengPage.38ExampleofaTypeIErrorUSAToday報導在美國非法賭博的金額至少平均每人每年$200,妳覺得這個數字太過於誇張,因此找了n個人的樣本來估計每年非法賭博的平均金額。妳想要檢定的虛無假設為:H0:μ≧$200對立假設為H1:μ<$200假設真正的母體平均數為$200,如果妳估計的樣本平均遠低於$200,則妳會推翻正確的假設,而犯下型I誤謬。例題©Ming-chiChen/sundae_mengPage.39ExampleofaTypeIIError如果實際非法賭博的金額遠低於$200,即H0並不正確,但妳運氣欠佳,找到的樣本中估計的平均值十分接近200,則妳應該推翻H0但資料卻不足以推翻錯誤的假設,此時妳犯了型II的誤謬。這兩種錯誤都與抽樣時運氣不佳有關係。例題©Ming-chiChen/sundae_mengPage.40Implicationsofrejectingoracceptingthenullhypothesis當檢定統計量落在拒絕域(rejectionregion)內,不代表我們證明(prove)虛無假設為錯誤的。只能說我們對於虛無假設所陳述的內容真實性有很大的懷疑--虛無假設不是不正確,就是極不可能發生。同理,當檢定統計量落在接受域中,並不是證明(prove)虛無假設為真,僅是表示證據不足以推翻我們的假設。觀念©Ming-chiChen/sundae_mengPage.41Implicationsofrejectingoracceptingthenullhypothesis虛無假設在檢定前被視為是正確的,除非有充分的證據,不然我們不輕易推翻假設。通常我們選擇極小的顯著水準如.01或.05來確保我們不會推翻一個正確的虛無假設。觀念©Ming-chiChen/sundae_mengPage.42TestingHypothesisaboutaPopulationMeanWhenVarianceisKnownH0:u=u0,H1:u<u0我們以樣本的平均數X來推論母體的平均數。假設母體為常態分配,如果H0為真,則樣本平均數X~N(u0,σ2/n)。只有當我們觀察到一個樣本平均數與u0差異很大時才會推翻H0,觀念u0σ2/nAreaαRejectH0ifandonlyiftheobservedsamplemeanx-barislessthanthecriticalvalue©Ming-chiChen/sundae_mengPage.43TestingHypothesisaboutaPopulationMeanWhenVarianceisKnown如果H0為真,則樣本平均數落在criticalvalue之下的機率為:觀念u0σ2/nAreaα©Ming-chiChen/sundae_mengPage.44我們刻意選擇x*這一點使顯著水準為α,也就是說,我們將檢定犯下型I誤謬的機率,這個機率是我們事先決定好的α。也可以直接以p值來表示。p值就是犯型I錯誤的機率,也就是錯誤地拒斥正確的虛無假設的機率。我們往往希望這個機率越小越好,也就是給虛無假設thebenefitofdoubt:無罪推定、科學或醫藥衛生單位的謹慎。©Ming-chiChen/sundae_mengPage.45Thecriticalvalue觀念u0σ2/nAreaα將criticalvalue轉成z-score01Areaα©Ming-chiChen/sundae_mengPage.46Thecriticalvalue觀念如果H0為真,01Areaα©Ming-chiChen/sundae_mengPage.47Thecriticalvalue觀念欲檢證H0:u=u0vs.H1:u<u0則criticalvalue:01Areaα©Ming-chiChen/sundae_mengPage.48檢定常態分配母體的平均值,且母體變異數已知觀念(1)寫出H0

和H1(2)決定顯著水準α(3)查表找出在顯著水準為α下的criticalvalue-zα(4)取得n樣本並計算樣本平均數x(5)計算observedz-score或找出-zα所對應的臨界點如果z<-zαRejectH0

‧(6)決定是否拒絕需無假設©Ming-chiChen/sundae_mengPage.49檢定常態分配母體的平均值,且母體變異數已知觀念(1)寫出H0

和Ha(2)決定顯著水準α(一般為5%,1%,10%)(3)查表找出在顯著水準為α下的criticalvalue單尾–zα雙尾–zα/2(4)取得n樣本並計算樣本平均數x©Ming-chiChen/sundae_mengPage.50Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數為16呎。有客戶認為該公司誇大,抽取25支樣本來做檢證,得樣本平均數為29.5(方法一)(1)H0:u=32vs.H1:u<32(2)α=.05(3)-zα=-z.05=-1.64501reject©Ming-chiChen/sundae_mengPage.51Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數為16呎。有客戶認為該公司誇大,抽取25支樣本來做檢證,得樣本平均數為29.5(方法二)(1)H0:u=32vs.H1:u<32(2)α=.05324©Ming-chiChen/sundae_mengPage.52Testingthemeanofanormalpopulationwithpopulationvarianceknown例題前例中我們拒絕H0:u=32並不是證明真正的母體平均數一定小於32;而是說如果H0為真,則我們抽取25個樣本計算樣本平均數得到29.5這個平均值的機率小於0.05。換句話說,如果u=32,則在所有可能的樣本平均數中,僅有不到5%的樣本會得到小於-1.645的z-score。©Ming-chiChen/sundae_mengPage.53TestingaCompositeNullHypothesis觀念教師工會罷工,宣稱老師的平均薪資$25000,但議會認為高於$25000。議員不想在證據不夠充分之下駁斥工會的看法,因此將顯著水準設於1%:H0:u$25,000vs.H1:u>$25,000假設薪資為常態分配,且母體標準差為=$4,000。取得100個老師薪資的隨機樣本,得樣本平均數為$27,000。檢定上述的假設。©Ming-chiChen/sundae_mengPage.54TestingaCompositeNullHypothesis觀念在顯著水準為

=.01,criticalvalueZ

=Z.01=2.33.02.33Rejectthenullhypothesis©Ming-chiChen/sundae_mengPage.55小結:設立假設的原則將想要利用樣本統計量去驗證的假設設為對立假設,想要否定的假設設為虛無假設。錯誤地拒絕某一假設(typeIerror)的後果較錯誤地接受或不拒絕該假設的後果為嚴重者(typeIIerror),將該假設設為虛無假設。例如無罪假設、新藥無益患者。將他人的主張作為虛無假設,亦即假定他人的主張是真實的。以反面主張作為虛無假設。例如我們想知道新制度是否優於舊制度。©Ming-chiChen/sundae_mengPage.56小結:虛無假設與社會理論在進行社會學研究時,研究者通常會想對理論做出貢獻,也就是說研究者希望其理論優於對於同一社會現象的既有理論解釋。所以,研究者通常把既有理論當成是虛無假設來做假設檢定。©Ming-chiChen/sundae_mengPage.57小結:假設檢定的步驟步驟一:建立虛無假設與對立假設步驟二:選擇檢定統計量(樣本平均數)步驟三:選擇顯著水準α並決定決策法則(臨界值與拒絕及接受域)步驟四:比較檢定統計量與臨界值步驟五:下結論©Ming-chiChen/sundae_mengPage.58雙尾檢定Atwo-tailedtestofthepopulationmean觀念H0:u=u0vs.H1:uu0如果觀察到的樣本平均數遠高於或遠低於u0則皆可拒絕H00/2/2Acceptanceregion1-

RejectH0ifz<-z/2orifz>z/2RejectH0if©Ming-chiChen/sundae_mengPage.59Atwo-tailedtestofthepopulationmean觀念雙尾檢定最常用的顯著水準為10%,5%,1%,其相對應的criticalz-score為:0/2/2Acceptanceregion1-

©Ming-chiChen/sundae_mengPage.60Atwo-tailedtestofameanofanormalpopulationwithknownvariance例題國會議員經常出國考察,某報紙媒體宣稱這類的考察平均每日花費$300,標準差

=$50。抽取25名國會議員得到樣本平均數為$260,在5%的顯著水準,報紙媒體的宣稱合不合理?H0:u=300H1:u3000/2/2=.25Acceptanceregion1-

-1.961.96©Ming-chiChen/sundae_mengPage.61Atwo-tailedtestofameanofanormalpopulationwithknownvariance例題求上例中的樣本平均數的criticalvalue?300/2/2=.025Acceptanceregion1-

280.4319.6©Ming-chiChen/sundae_mengPage.62Statisticalsignificancevs.practicalsignificance觀念某都會新貴認為鄉下婦女較無知。欲檢證城鄉婦女的語言能力是否真的有差異?某語言能力測驗共測驗200個單字,答對一題2分,部分答對給1分,假設從過去的資料得知城市婦女的平均分數為u=148,

=10,今取6400個鄉村婦女做為樣本,得平均分數為147,請問城鄉婦女的語言能力是否有別?H0:u=148,H1:u<148©Ming-chiChen/sundae_mengPage.63Statisticalsignificancevs.practicalsignificance觀念雖然證據顯示城鄉婦女的語言能力的確有的差異,但假設其差異僅有1分,在實際上這個差距並不大。假設檢定的z值公式中,樣本數愈大,z值會愈大,即愈有可能拒絕H0。即使樣本平均數與母體平均數的差異很小,也有可能因為n過大而拒絕H0©Ming-chiChen/sundae_mengPage.64例題在母體為常態分配N(u,

2)的假設下,回答下列問題:單邊檢定H0:u25H1:u>25樣本數n=81,標準差=18,顯著水準為0.1時,決策規則為:若u=24,根據上述的決策規則,犯下typeIerror的機率為何?若u=25,根據上述的決策規則,犯下typeIerror的機率為何?若u=29,根據上述的決策規則,犯下typeIIerror的機率為何?©Ming-chiChen/sundae_mengPage.6527.56拒絕接受242529©Ming-chiChen/sundae_mengPage.66例題若u=24,根據上述的決策規則,犯下typeIerror的機率為何?若u=25,根據上述的決策規則,犯下typeIerror的機率為何?若u=29,根據上述的決策規則,犯下typeIIerror的機率為何?不真©Ming-chiChen/sundae_mengPage.67例題從一個變異數為2250的母體裡抽取一個大小為100的樣本來檢測下列假設:H0:u=1000,H1:u1000ItisdecidedtorejectH0ifFindtheprobabilityoftypeIerrorFindtheprobabilityofatypeIIerrorifu=1005©Ming-chiChen/sundae_mengPage.68例題FindtheprobabilityofatypeIIerrorifu=1005©Ming-chiChen/sundae_mengPage.69P-Value:InterpretationandUse在假設檢定中,我們通常會事先決定顯著水準α,然後根據決定之後的α值找出拒絕域及接受域。但在很多的情況下,我們無法預估typeI誤謬及typeII誤謬的成本,因此可以選擇任意的α值。所以有時候我們直接指出得到觀察統計量的機率。複習:顯著水準α=型I誤差發生最大的機率值。©Ming-chiChen/sundae_mengPage.70P-Value:InterpretationandUseTheP-valueofatestistheprobabilityofobtainingavalueoftheteststatisticsasextremeasormoreextremethantheobservedsamplevaluewhenthenullhypothesisistrue.P-value告訴我們:「如果虛擬假設為真,我們觀察到目前資料顯示的檢定統計量的機率有多高?」如果這個機率很小,則我們可以拒絕虛擬假設,因為如果假設為真,則僅有很小的機率抽取任意的隨機樣本會得到目前的觀察值。©Ming-chiChen/sundae_mengPage.71Testingthemeanofanormalpopulationwithpopulationvarianceknown例題某公司生產鑽油井用的鑽頭,宣稱其平均壽命為32呎,變異數為16呎。有客戶認為該公司誇大,抽取25支樣本來做檢證,得樣本平均數為29.5H0:u=32vs.H1:u<32α=.05-zα=-z.05=-1.64501reject©Ming-chiChen/sundae_mengPage.72Testingthemeanofanormalpopulationwithpopulationvarianceknown例題求p-value=?P-value=P(z<-3.125)=0.000901Z=-3.125如果H0為真,則觀察到平均值=29.5的機率僅有.0009,表示H0不太可能為真

rejectedH0©Ming-chiChen/sundae_mengPage.73Testingthemeanofanormalpopulationwithpopulationvarianceknown例題將α訂在5%,則criticalvalue=-1.645如果將α定在1%的水準,則criticalvalue=-2.33,我們依舊rejectH0只要是顯著水準高於.0009,我們都可以拒絕H0,也就是說,P-value是H0會被拒絕的最小值。01Z=-3.125©Ming-chiChen/sundae_mengPage.74Testingthemeanofanormalpopulationwithpopulationvarianceknown例題因此P-value是不僅止於告訴我們在某一顯著水準下是否拒絕H0,如果我們知道P-value=.002則我們知道H0不但在.05的顯著水準下會被拒絕,在.005的水準下也會被拒絕。如果僅知道P-value=.04,則是否拒絕H0可以由讀者來決定,如果某一研究人員覺得.01才算顯著,則H0不會被拒絕,如果將顯著水準置於.05,則拒絕。©Ming-chiChen/sundae_mengPage.75Testingthemeanofanormalpopulationwithpopulationvarianceknown當我們沒有什麼特別的理由來支持我們選擇一個特別的顯著水準,或是當我們無法確知犯了型I錯誤或型II錯誤的成本或結果時,p值法特別適用©Ming-chiChen/sundae_mengPage.76Testingthemeanofanormalpopulationwithpopulationvarianceknown一般在研究報告中,研究者經常直接寫出p-value而讓讀者自己去決定是否要拒絕H0。p-value經常被稱為是觀察到的顯著水準(theobservedsignificantlevel)。可以將它看成是「在假設H0為真的情況下,觀察到目前樣本,或比此樣本更極端樣本的機率」。Astatisticallysignificantp-valuemeansthattheobservedresultisdifficulttoexplainbyrandomchance.

©Ming-chiChen/sundae_mengPage.77樣本數n愈大,p-value值愈…?P-value與樣本數的大小有很大的關係。當樣本數很大時,些微的差距也會讓Z變的很大,也就是說,p-value會變得很小。©Ming-chiChen/sundae_mengPage.7811.4TestingHypothesesAboutaPopulationMeanwithLargeSampleSizes在前面的假設檢定討論中,我們學到如何判定有關於一常態分配(normal),且變異數

已知的母體平均數之虛擬假設。這是因為我們知道如果母體為常態分配,且母體變異數為u,則樣本平均數的分佈為~N(u0,

2/n)如果我們無法確切知道母體是否為常態分配,也不知道母體的變異數,則我們的假設檢定還能成立嗎?©Ming-chiChen/sundae_mengPage.7911.4TestingHypothesesAboutaPopulationMeanwithLargeSampleSizes根據中央極限定律CentralLimitTheorem,如果樣本數夠大(n>30),即使母體不是常態分配,樣本平均數X的抽樣分配也會趨近於常態分佈。而且如果樣本數夠大,我們可以用樣本的變異數s來取代母體變異數

。©Ming-chiChen/sundae_mengPage.80Two-tailedtestofapopulationmeanusingalargesample某公司生產冷暖氣用的導管,導管上必須鑽許多小孔以便鎖入螺絲釘,如果鑽孔機正常運作,則鑽出的小孔平均直徑為10公釐,但變異數不知道。但如果鑽孔機運作不正常,則小孔不是過大就是太小。這家冷氣公司的老闆想要驗證某台鑽孔機是否正常運作,即H0:u=10v.s.H1:u10這個老闆檢視了由這台鑽孔機鑽出的100個小孔,得到平均直徑為9.6公釐,樣本變異數為s=1公釐。以5%的顯著水準來檢驗此機器是否正常?©Ming-chiChen/sundae_mengPage.81Two-tailedtestofapopulationmeanusingalargesampleSolution:由於樣本數夠大(n=100)我們可以用一般檢定母體平均值假設的方法來進行檢證:

=5%,twotailedtest,thetwocriticalvaluez1=-1.96,z2=1.960/2/2=.25Acceptanceregion-1.961.96RejectH0©Ming-chiChen/sundae_mengPage.82FindingthecriticalvaluesofX-barwhenvarianceisunknown找出前例中x的criticalvalue/2/2=.25Acceptanceregion9.80410.196©Ming-chiChen/sundae_mengPage.83TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance如果母體為常態分配,但母體的變異數為未知,且樣本數少於30?改用studentt分配而非用常態分配來做假設檢證。©Ming-chiChen/sundae_mengPage.84複習:母體平均數的假設檢定方法臨界值法(檢定統計量檢定法)標準統計量檢定法(Z值法)信賴區間法p值法©Ming-chiChen/sundae_mengPage.85Student’stdistribution若母體~N(,2),則若母體

2未知,則以S來取代,我們得到t-score:隨著樣本數愈大,S愈接近,t分配愈接近標準常態分配Z:©Ming-chiChen/sundae_mengPage.86CharacteristicsoftdistributionThetdistributionisactuallyafamilyofdistributionwithadifferentdensityfunctioncorrespondingtoeachdifferentvalueoftheparameter.Standardnormal(d.f.=)d.f.=4d.f.=2d.f.=1©Ming-chiChen/sundae_mengPage.87Valueoft,Thesymbolt,denotesthevalueoftsuchthattheareatoitsrightis

andthasdegreeoffreedom.Thevaluet,satisfiestheequation:P(t>t,)=Wheretherandomvariablethasthetdistributionwithdegreesoffreedom.©Ming-chiChen/sundae_mengPage.88TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設:H0:u=u0orH0:uu0H1:u>u0在顯著水準之下,找出criticalvaluet,P(t>

t,

)=計算t-score:決策法則:rejectH0infavorofH1ift>t,n-1

©Ming-chiChen/sundae_mengPage.89TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設:H0:u=u0orH0:u

u0H1:u<u0在顯著水準之下,找出criticalvaluet,P(t>

t,

)=計算t-score:決策法則:rejectH0infavorofH1ift<-t,n-1

©Ming-chiChen/sundae_mengPage.90TestingHypothesisaboutthemeanofanormalpopulationwithunknownvariance欲檢證下列假設:H0:u=u0

H1:uu0在顯著水準之下,找出criticalvaluet,P(t>

t,

)=計算t-score:決策法則:rejectH0infavorofH1ift<-t/2,n-1ort>t/2,n-1

©Ming-chiChen/sundae_mengPage.91例:small-sampletestofthemeanofanormalpopulationwithunknownvariance某汽車製造商宣稱該公司一款低價車肇事平均修車費低於等於$200。消費者基金會認為修車費高於此數值,欲檢證下列假設:H0:u

u0

H1:u>u0消費者基金會不願在證據不充分的條件下,隨意駁斥製造商的宣稱,因此將假設檢定的顯著水準嚴格地定在1%。因為檢證肇事修車的成本甚高,因此消基會僅找了9個樣本,發現:x1=245,x2=305,x3=175,x4=250,x5=280,x6=160,x7=250,x8=195,x9=210©Ming-chiChen/sundae_mengPage.92例:small-sampletestofthemeanofanormalpopulationwithunknownvariance解)x1=245,x2=305,x3=175,x4=250,x5=280,x6=160,x7=250,x8=195,x9=210計算樣本平均值:d.f.=9-1=8,Criticalvalue=t.01,8=2.896©Ming-chiChen/sundae_mengPage.93例:small-sampletestofthemeanofanormalpopulationwithunknownvariance或者我們可以用t=1.86找出其相對應的p-value查表B可知,d.f.=8P(t>1.86)=.05若d.f.=8,t=1.49,P(t>1.49)=?若d.f.=8,t=1.16,P(t>1.16)=?©Ming-chiChen/sundae_mengPage.94Testsofthepopulationproportion.在前一講中,我們指出如果母體的比率為p(清華同學贊成清交合併的比例),且np5andnq5,則樣本比率p^為一常態分配~N(p,pq/n),q=1-p,©Ming-chiChen/sundae_mengPage.95SamplingDistributionoftheSampleProportionTheNormalApproximationRuleforProportion:母體(全體清華同學)中具有某種特質(贊成清交合併)的個體比例為p,從中選取大小為n的樣本,我們知道我們有很多大小為n的可能樣本,我們以X來代表個別樣本中贊成清交合併的比例,比如說我們取得的第一個樣本(n=200)中,贊成清交合併的有90人(p1=0.45);第二個大小一樣的樣本(n=200)贊成合併的比例p2=0.44;如此一直下去,直到窮盡所有的樣本為止。我們知道每一個可能樣本的比例p^=X/n,這些樣本的p^本身也有一個分配,我們稱之為比例的抽樣分配,如果np5,而且nq5(記得q=1-p),那麼:©Ming-chiChen/sundae_mengPage.96SamplingDistributionoftheSampleProportionIfthedistributionofp^isapproximatelynormal,thenrandomvariable©Ming-chiChen/sundae_mengPage.9711.6Testsofthepopulationproportion設np5andnq5檢證下列假說:H0:p=p0orH0:pp0H1:p<p0如果H0為真,則樣本比率~N(p0,p0q0/n)RejectH0ifZ<-z

orp^<p^*©Ming-chiChen/sundae_mengPage.98例:TestingapopulationProportion立法委員宣稱民調顯示60%的民眾支持核四復建,環保團體宣稱支持復建的民眾不會超過60%,妳用100的樣本來驗證:H0:p=.6v.s.H1:p<.6假設55個樣本支持核四復建,以5%的顯著水準,我們可以推翻立法院的說法嗎?©Ming-chiChen/sundae_mengPage.99例:TestingapopulationProportion解答如果H0為真,那麼隨機變數p^的分配為一個均數p=.6而變異數pq/n=(.6)(.4)/100=.0024的常態分配。如果我們用單

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论