版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章抽樣及抽樣分配授課教師:楊富龍資料來源:智勝書局學習目標學習為何樣本經常是唯一用來認識母體的途徑。學習如何抽取樣本。學習樣本平均數之抽樣分配。學習中央極限定理。學習樣本比例之抽樣分配。學習t分配。本章架構8.1抽樣8.2抽樣方法8.3統計量與抽樣分配8.4樣本平均之抽樣分配8.5樣本比例之抽樣分配8.6t分配8.1抽樣母數(parameter)由母體測量出用來描述母體特徵的數值,如母體平均或母體變異數。誤差(error)母數真值與由樣本所得到之估計值的差。抽樣調查實例—電視收視率調查以國內的收視率調查公司來看,共分幾種不同的類型,AC尼爾森公司以裝設people-meter來進行家戶收視調查。潤利收視率調查公司所做的收視率調查則採用分層隨機抽樣電話訪問的方式,與潤利相同的還有天和水行銷顧問公司(僅作廣播收聽率調查)。此外,從民國八十九年起,財團法人廣播電視事業發展基金也加入收視率調查的準備工作,與日本的收視率調查公司合作,先期以進行電視收視行為調查和廣播收聽行為調查研究為主。以現有的收視率調查技術而言,其調查僅以量化的衡量為原則,無法進行質的調查。若僅作為節目品質評定的單一標準,在說服力上略顯不足,因為收視率調查為一「點人頭式」的調查方式,可算出「有多少人正在看」,但卻無法調查收視者對該節目的優劣評價,因此,收視率高低與節目品質並無直接關係。8.1抽樣(續)誤差的來源抽樣誤差(samplingerror)由隨機抽樣代替普查所發生之不確定性。非抽樣誤差(nonsamplingerror)其他種種非因隨機抽樣之不確定性所造成的誤差,包括樣本選擇偏差(sampleselectionbias)、測量偏差(responsebias)以及自我選擇偏差(self-selectionbias)。8.1抽樣(續1)非抽樣誤差的來源樣本選擇偏差(sampleselectionbias)由於抽樣方法的不正確所造成的。測量偏差(responsebias)包含了資料記錄錯誤、受訪者故意提供不實資訊等。自我選擇偏差(self-selectionbias)包含了受訪者拒絕回答、或在call-in投票中,投票者通常是有主動傾向且有強烈意見者。8.2抽樣方法8.2.1簡單隨機抽樣(simplerandomsampling)8.2.2分層隨機抽樣(stratifiedrandomsampling)8.2.3部落抽樣(clustersampling)8.2.4系統抽樣(systematicsampling)8.2.5非隨機抽樣(nonrandomsampling)抽樣方法實例—電腦輔助電話訪問系統
近年來,國內的民意調查幾乎都採電話訪問方式來進行。主要原因是電話在國內普及率已近99%,幾乎家家都有電話,無法接受電話訪問的民眾極少。電腦輔助電話訪問系統(ComputerAssistedTelephoneInterviewingSystem,簡稱CATIS),利用電腦儲存電話號碼的母體清冊,利用電腦程式執行統計的隨機取樣,架設問卷在電腦中,然後由電腦直接自動撥號,訪員在線上直接鍵入訪問結果,再經由電腦的監聽、看、錄系統,更有效的管理電訪的執行,使民意調查在統計抽樣調查執行技術上的可能缺失減到最低程度。8.2.1簡簡單隨機抽抽樣定義使得母體內所所有可能抽出出的樣本被抽抽出的機率均均相等,而由由這種方法所所抽出的樣本本就稱為簡單單隨機樣本(simplerandomsample),或簡稱稱為隨機樣本本(randomsample)。重要的統計特特質不偏(unbiased)母體內每一個個體被抽到的的機會均等。。獨立(independence)母體內某一個個體被抽到與與否不會影響響其他個體被被抽到之機會會。8.2.1簡簡單隨機抽抽樣(續)優點:母體名冊完整整時,樣本抽抽取方便,方方法簡單。。估計式簡單((樣本機率為為定值,甚至至相等)。缺點:完整母體名冊冊不易取得,,或取得成本本很大時實行行困難。當母體樣本單單位過多時,,抽樣作業相相對上不便((如母體名冊冊幾萬戶)。。樣本分配分散散,增加調查查行政作業困困難(如台灣灣地區住戶580萬戶要要抽18000戶)。當樣本單位差差異大時,樣樣本代表性恐恐有不足(如如估計所得,,抽到高所得得或偏低所得得)。簡單隨機抽樣樣實例某公司舉辦尾尾牙餐會,會會中並有抽獎獎活動,為了了獎勵員工這這一年來的辛辛勞,公司提提供一部汽車車及若干家電電作為抽獎用用,與會的員員工每人發給給一張兩頭印印有號碼的摸摸彩券(兩頭頭的號碼相同同,且一半為為存根聯,一一半為抽獎聯聯),撕下其其中的抽獎聯聯後投入摸彩彩箱中,然後後由董事長將將之攪拌均勻勻,依序請公公司各級主管管抽出摸彩券券,以決定家家電與汽車的的得獎人。這這就是簡單隨隨機抽樣。8.2.2分分層隨機抽抽樣定義將母體依母體體內個體的某某些特性分為為若干沒有交交集的層(strata),務必使使層內的差異異小(又稱為為同質(homogeneity)),而層間間的差異大((又稱為異質質(heterogeneity))。母體內的每一一個體均只屬屬於其中一層層,再自每層層中抽取簡單單隨機樣本,,這些來自各各層之簡單隨隨機樣本即構構成一分層隨隨機樣本(stratifiedrandomsample)。。8.2.2分分層隨機抽抽樣(續)比例分層隨機機抽樣(proportionatestratifiedrandomsampling)在每一層中所所抽取之隨機機樣本數若按按照每一層中中個體數在總總母體中所佔佔比例決定。。非比例分層隨隨機抽樣(disproportionatestratifiedrandomsampling)若各層所抽出出之隨機樣本本數不能反映映出各層在母母體中所佔比比例。樣本母體8.2.2分分層隨機抽抽樣(續1)圖8.4分分層隨機抽樣樣第一層第二層第三層…………第K層8.2.2分分層隨機抽抽樣(續2)優點:樣本分配較均均勻,可提高高估計確度。。可以分別得各各層訊息,並並做比較分析析。各層可視情形形採取不同之之抽樣方法。。便於尋找樣本本跳動之來源源(如連續性性調查每季每每月就業、失失業、人力資資源調查)。。可在各層設立立行政單位,,以利調查方方便。限制:分層變數之選選取(分層特特性)需多加加注意。分層不能有重重疊現象。分層後樣本資資料之整理與與估計較簡單單隨機抽樣複複雜。分層抽樣實例例交通部觀光局局為瞭解週休休二日制度實實施後,對國國人國內旅遊遊的影響及改改變,於87年首次辦理理『週休二日日實施對國內內旅遊的影響響調查』,以以提供政府府及旅遊相關關業者參考之之依據。以以各縣市之住住宅電話號碼碼簿做為抽樣樣清冊,即即抽樣母體之之來源。抽樣樣方式採分層層抽樣法:臺臺灣地區依北北、中、南、、東分為四層層,各層依照照層內戶數占占台灣省總戶戶數的比例分分配樣本數;;層內各縣市市再依照其戶戶數比例分配配其樣本。預預計樣本數1,500人人。以電話訪訪問調查,居居住在臺灣地地區之家庭住住戶內十二歲歲以上之國民民,且就讀學學校或服務單單位已實施週週休二日或隔隔週休二日者者。<資料來來源:行政院院主計處>8.2.3部部落抽抽樣定義將母體體分為為若干干沒有有交集集的部部落,,母體體內的的每一一個體體均只只屬於於其中中一部部落,,再自自所有有部落落中簡簡單隨隨機抽抽取若若干部部落樣樣本,,並對對這些些簡單單隨機機部落落樣本本作完完整的的普查查。不同於分層層隨機抽樣樣,其要求求部落內要要異質。理理論上,每每一個部落落均可視為為母體的縮縮小,最常常見的部落落區分便是是按照地域域來區分。。8.2.3部部落抽樣樣(續)部落抽樣樣之優點部落抽樣樣因調查查範圍僅僅限於較較小範圍圍的部落落內,因因此也較較節省人人力時間間與經費費。二階段部部落抽樣樣(two-stageclustersampling)有時若部部落太大大,則可可在抽到到的部落落內再細細分更多多部落。。8.2.3部部落抽樣樣(續1)圖8.5部落落抽樣部落抽樣樣實例假設某公公司想調調查高雄雄市市民民每月消消費在甲甲產品的的支出,,計畫在在所有11個行行政區中中隨機抽抽出4個個行政區區,然後後再從被被抽出的的行政區區中隨機機抽出一一條路(街)(如遇街街道跨區區時,則則僅調查查屬於該該區的住住戶),,然後普普查該條條路(街街)的所所有住戶戶。這就就是部落落抽樣。。8.2.4系系統抽樣系統抽樣之定定義將大小為N的母體內之個個體隨機排序序,再自前k個個體中隨隨機抽取一個個體作為第一一個樣本,然然後自該個體體起,每隔k個個體選取取一個樣本,,直到選滿n個樣本為止止。k值的決決定其中,n=樣樣本大小N=母體大小k=樣本選取取間隔8.2.4系系統抽樣(續)當母體大小為為無限時,k值大小則可依依方便決定之之。系統抽樣的目目的並不在降降低抽樣誤差差,而是純粹粹為了方便及及管理考量。。當母體內個體體排序出現某某一週期性或或規則時,系系統抽樣的使使用就必須非非常小心,不不然,則很容容易增加抽樣樣誤差。系統抽樣實例例某製造燈泡的的工廠,計畫畫生產5000個燈泡,,想從中抽取取50個樣本本,以了解不不良品的比例例,若採取系系統抽樣,則則依5000個燈泡生產產的順序,做做為假想的編編號,其次決決定抽樣區間間k,k=5000/50=100,然後從從1至100中以簡單隨隨機抽樣抽出出一數,做為為起始點,如如抽出35,,最後只要每每生產第100個燈泡,,便將該燈泡泡抽出,即生生產順序為35,135,235,335,……,4935的燈泡,就就被抽出做為為樣本。8.2.5非非隨機機抽樣樣非隨機機抽樣樣(nonrandomsampling)任何一一種抽抽樣方方法在在自母母體選選取樣樣本的的過程程中並並不包包括隨隨機選選取者者,均均屬於於非隨隨機抽抽樣。。非隨機機抽樣樣方法法因非非機率率抽樣樣,所所以也也不適適合做做統計計分析析與推推論,,抽樣樣誤差差也無無法客客觀的的計算算出來來。一一般在在廣播播電視視常出出現的的叩應應(call-in)民民調即即屬非非隨機機抽樣樣的一一種。。隨機抽抽樣與與非隨隨機抽抽樣的的比較較估計值值的信信賴度度:機機率抽抽樣可可依統統計理理論求求得樣樣本的的估計計值、、抽樣樣誤差差和信信賴區區間。。非機機率抽抽樣的的估計計值則則包含含難以以衡量量的偏偏差,,無法法客觀觀評估估樣本本估計計值的的正確確性。。統計效效率評評估::機率率抽樣樣可比比較不不同樣樣本設設計的的相對對效率率,非非機率率抽樣樣則沒沒有客客觀的的統計計方法法比較較。母群體體的情情報::機率率抽樣樣所需需有關關母群群體的的情報報較少少。非非機率率抽樣樣,所所需的的情報報較多多。經驗和和技巧巧:機機率抽抽樣的的設計計和執執行比比非機機率抽抽樣需需要專專業化化的技技巧和和經驗驗。時間::機率率抽樣樣的設設計和和執行行較繁繁雜,,花費費時間間較長長。成本::機率率抽樣樣的設設計和和執行行為達達到某某些目目的,,費用用較多多。8.3統統計量量與抽抽樣分分配母數(parameter)由母體體中計計算出出用來來描述述母體體的數數值測測量結結果。。統計量(statistic)由樣本中中計算出出用來描描述樣本本的數值值測量結結果。抽樣分配配(samplingdistribution)在一母體體中重複複抽取固固定大小小的隨機機樣本,,由該隨隨機樣本本所計算算出之統統計量的的所有可可能結果果之機率率分配,,稱為為該統計計量的抽抽樣分配配。例8.1考考試平均均成績假設某次次統計學學考試前前五名高高分的成成績分別別為91、92、93、94及95分分,若若將這五五名同學學當成一一母體,,則母體體之平均均成績為為=(91+92+93+94+95)/6=93(分))今若自該該母體中中隨機抽抽取兩名名同學為為樣本(n=2)計算算平均成成績,則則該平均均成績之之抽樣分分配為何何?解答:若若自該母母體中隨隨機抽取取兩名同同學為樣樣本(n=2)計算平平均成績績,則所所有可能能抽出之之成對樣樣本及其其平均成成績見表表8.2。例8.1考考試平均均成績((續)表8.2所所有可能能樣本及及樣本平平均(n=2)例8.1考考試平均均成績(續1)表8.3樣樣本平均均的抽樣樣分配表表(n=2)例8.1考考試平均均成績(續2)圖8.6樣樣本平平均的抽抽樣分配配圖(n=1和和2))例8.1考考試平均均成績(續3)今若自該該母體中中隨機抽抽取三名名同學為為樣本(n=3)計算算平均成成績,則則該平均均成績之之抽樣分分配又為為何?解:表8.4所所有可能能樣本及及樣本平平均(n=3)例8.1考考試平均均成績(續4)表8.5樣樣本平均均的抽樣樣分配表表(n=3)例8.1考考試平均均成績(續5)表8.7樣樣本平均均的抽樣樣分配圖圖(n=3)8.4樣樣本平平均之之抽樣樣分配配取出放放回或或無限限母體體自一平平均數數為與標準準差為為的母母體中中抽取取一大大小為為n之之隨機機樣本本(X1,X2,…,Xn),樣樣本平平均之之期望望值與與變異異數如如下8.4樣樣本本平平均均之之抽抽樣樣分分配配(續續)8.4樣樣本本平平均均之之抽抽樣樣分分配配(續續1)在有有限限母母體體中中採採抽抽出出後後不不放放回回樣本本平平均均之之期期望望值值與與變變異異數數如如下下其中中,,為為有有限限母母體體修修正正因因子子,,一一般般認認為為,,當當n0.05N時時,,上上式式中中的的修修正正因因子子即即可可省省略略不不用用。。例8.2平平均均月月薪薪之之期期望望值值與與標標準準差差假設設高高科科公公司司有有1000名名員員工工,,已已知知其其平平均均月月薪薪為為40,000元元,,月月薪薪標標準準差差為為5,000元元,,今今若若自自該該公公司司中中隨隨機機抽抽取取25名名員員工工調調查查其其月月薪薪,,該該25名名員員工工之之平平均均月月薪薪之之期期望望值值與與標標準準差差為為若若干干??今今若若改改自自該該公公司司隨隨機機抽抽取取100名名員員工工調調查查其其月月薪薪,,則則該該100名名員員工工之之平平均均月月薪薪之之期期望望值值與與標標準準差差為為若若干干??例8.2平均均月薪之期望望值與標準差差(續)解:25名員工工之平均月薪薪期望值為40,000元。因因n0.05N(250.051,000),平均月薪薪之標準差為為(元)100名員工工之平均月薪薪期望值仍為為40,000元。。但因n>0.05N,須用用有限母體修修正因子計算算標準差(元)8.4樣本本平均之抽樣樣分配(續2)在常態母體X~N(,2)的假設下樣本平均的抽抽樣分配例8.3銀銀行等待時時間假設泛太銀行行每位顧客等等待服務的時時間呈常態分分配,平均等等待時間為10分鐘鐘,標準差為為2分鐘鐘。為作服務務品質調查,,隨機抽選16名顧顧客瞭解其等等待服務時間間,問該16名顧客客平均等待時時間超過11分鐘的的機率為何??解:令X為每位顧顧客等待服務務時間,由題題意知為常態態分配且=10、、=2例8.3銀銀行等待時時間(續)故,,即因此該16名名顧客平均等等待時間超過過11分鐘的的機率為2.28%。例8.3銀銀行等待時時間(續1)圖8.8顧顧客平均等等待時間超過過11分分鐘的機率((例8.3)8.4樣本本平均之抽樣樣分配(續3)在常態母體X~N(,2)的假設下樣本和的抽樣樣分配例8.4飲飲料會被退退貨嗎?「喝好茶」盒盒裝飲料平均均每盒重量為為500克克,標準差差為10克克。今「每每日」便利商商店進了一批批「喝好茶」」盒裝飲料並並隨機抽取一一箱(內含20盒)飲飲料進行重量量檢驗,若該該箱飲料重量量不足9900克,,則整批飲料料通通退貨。。若該盒裝飲飲料之重量呈呈常態分配,,請問該批飲飲料會被退貨貨的機率為何何?解:令X為為「喝好茶茶」盒裝飲料料每盒之重量量而得到例8.4飲飲料會被退退貨嗎?(續續)故,因此該批飲料料會被「每日日」便利商店店退貨的可能能性為1.25%。例8.4飲飲料會被退貨貨嗎?(續1)圖8.9整整箱飲料不不足9900克重的的機率(例8.4)8.4樣本本平均之抽樣樣分配(續4)中央極限定理理(centrallimittheorem)無論母體分配配為何,自平平均數為、標準差為的母體中中抽取n個隨機樣樣本,若樣本大小小n夠大(n30),則則樣本平均的的抽樣分配會會趨近於常態態分配。無限母體有限母體抽出出後不放回8.4樣樣本平平均之抽抽樣分配配(續5)中央極限限定理亦亦適用於於樣本和和的抽樣樣分配無限母體體有限母體體抽出後後不放回回8.4樣樣本平平均之抽抽樣分配配(續5)圖8.10不不同母母體分配配下,不不同樣本本大小樣樣本平均均之抽樣樣分配例8.5年年終獎獎金與與減薪薪假設某某產品品推銷銷員平平均每每天賣賣出1000件件產品品,每每天賣賣出產產品數數之標標準差差為100件件。。今公公司於於年終終欲瞭瞭解該該銷售售員之之銷售售業績績,遂遂隨機機選取取了100天天的的銷售售業績績來檢檢驗,,若該該100天天的平平均銷銷售數數量超超過1025件件,則則發給給該銷銷售員員年終終獎金金;若若該100天天的的平均均銷售售數量量不足足985件件,則則要扣扣減其其薪資資。問問該銷銷售員員既得得不到到獎金金亦沒沒有受受到減減薪懲懲罰之之機率率為何何?例8.5年年終獎獎金與與減薪薪(續續)解:令X為為該銷銷售員員之每每天銷銷售產產品數數量,,雖然然X之之分配配未知知,因因為樣樣本夠夠大((n=100>30)),所所以該該銷售售員任任100天天的平平均銷銷售數數量之之抽樣樣分配配近似似常態態分配配,,故今欲求求該銷銷售員員既得得不到到獎金金亦沒沒有受受到減減薪懲懲罰之之機率率,即即為例8.5年年終獎獎金與與減薪薪(續續1))因此該該銷售售員年年終收收入沒沒有任任何新新的變變化之之機率率為0.927。。例8.5年年終獎獎金與與減薪薪(續續2)圖8.11平平均均銷售售數量量介於於985與與1025件件之之機率率(例例8.5)例8.6接接力賽破破紀錄假設某大大專院校校全體學學生參加加100公公尺賽跑跑的平均均時間為為15秒,,標準差差為3秒。。今學校校隨機抽抽選36位位同學參參加大專專運動會會之3600公尺尺接力賽賽跑,若若3600公公尺接接力賽跑跑之大會會紀錄為為8分分鐘整整,試問問該36位位同學破破紀錄之之機率為為何?例8.6接接力賽破破紀錄(續)解:令X1,X2,…,X36為該校隨隨機抽選選之36位位同學各各跑100公公尺所所花時間間,因學學生人數數夠多((n=36>30))該36位同同學跑出出的成績績是低於於8分鐘鐘(或480秒))之機率率為例8.6接接力賽破破紀錄(續1)因此,若若自該校校中隨機機抽取36位位同學學參加3600公尺尺接力力賽跑,,其成績績破大會會紀錄之之機率為為0.04%。例8.6接接力賽破破紀錄((續2))圖8.12接接力賽賽跑破紀紀錄之機機率(例例8.6)8.4樣樣本平平均之抽抽樣分配配(續6)結論母體是常常態分配配,則樣樣本平均均的抽樣樣分配亦亦是常態態分配。。母體不是是常態分分配,則則在樣本本夠大時時,樣本本平均的的抽樣分分配會近近似常態態分配。。樣本平均均的期望望值等於於母體平平均。。樣本平均均的標準準差比母母體標準準差小倍倍。。8.5樣樣本比比例之抽抽樣分配配樣本比例例(SampleProportion)其中X:樣本本中某特特定類別別族群之之發生次次數n:樣本本大小8.5樣樣本比比例之抽抽樣分配配(續)樣本比例例之平均均數與變變異數無限母體體有限母體體且母體體大小((N)與樣本本大小((n)的比例例關係n/N為>0.05情況況下,8.5樣樣本比比例之抽抽樣分配配(續1)自一成功功機率為為p的二二項分配配抽取n之隨機樣樣本,在在大樣本本(np5且n(1-p)5)的情況下下,樣本本比例()的抽抽樣分配配近似為為無限母體體或有限限母體大大小N滿滿足有限母體體大小N滿足例8.7保保單之續續保率某保險公公司宣稱稱其保單單每年之之續保率率為85%,,遠高於於全國所所有保險險公司之之總續保保率。假假設全國國的續保保率為80%,並且且該保險險公司之之宣稱正正確,今今自該公公司去年年之保單單中隨機機抽取100份檢檢查是否否在今年年又續保保,問這這100份份隨機抽抽取之保保單之續續保率高高於全國國之機率率為何??例8.7保保單之續續保率(續)解:令p為該公司司保單之之續保率率,n為樣本大大小,由由題意知知,p=0.85且且n=100。因因np=(100)(0.85)=85>5且且n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初中口语交际与综合性学习综合训练含答案
- 边境安全防护员培训课件
- 2022~2023自考专业(小学教育)考试题库及答案第281期
- 语文教师个人教育教学工作总结
- 八年级爱的教育读后感
- 小学一年级下册数学解决问题50道附答案(a卷)
- 电气信息化技术要领
- 2022~2023石油石化职业技能鉴定考试题库及答案解析第31期
- 双重体系知识考试题及答案
- 生物工程设备考试题库及答案
- 《电子商务师(三级)理论知识鉴定要素细目表》
- 警察警械使用培训课件
- 中职团建活动方案
- 2025压覆矿产资源调查评估规范
- 开放性气胸的临床护理
- 巩膜炎的治疗
- DBJ52T-既有建筑幕墙安全性检测鉴定技术规程
- 运输管理实务(第二版)李佑珍课件第6章 集装箱多式联运学习资料
- 影片备案报告范文
- 心脏骤停应急预案及流程
- 播种施肥机械
评论
0/150
提交评论