常用的机率分布与统计分布讲义_第1页
常用的机率分布与统计分布讲义_第2页
常用的机率分布与统计分布讲义_第3页
常用的机率分布与统计分布讲义_第4页
常用的机率分布与统计分布讲义_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

授 課 目 錄 第1章 導 論第2章 統計資料的整理與描述第3章 機率導論第4章 常用的機率分佈與統計分佈第5章 描樣方法與描樣分佈第6章 統計估計第7章 統計檢定第8章 變異數分析第9章 相關分析與迴歸模式第10章 無母數統計檢定第11章 類別資料分析-列聯表與卡方檢定第四章 常用的機率分佈與統計分佈一組樣本資料常呈現某種特殊型式的機率分配。當獲得母體的樣本資料時,須從各種機率分佈當中,選擇出最接近該母體的機率分佈,使樣本資料與母體參數有最佳的推論與檢定能力。常用的機率分佈有:離散型與連續型二大類。4.1 離散型機率分佈離散型機率分佈(p)-常見有二項分佈、卜氏分佈、離散型均勻分佈、超幾何分佈。若一隨機實驗只有成功和失敗兩種結果,事件成功發生的機率為p,事件失敗發生的機率為1-p。令隨機變數x = 1代表成功的事件,x = 0代表失敗的事件,此稱隨機變數X服從白努利分佈(Bernoulli Distribution)。x10P(x)p1-pEX1p0(1-p)VX=EX2-(EX)2p(1-p)p(x) = P(X=x) = px(1- p)1-x(1) 二項分佈(Binomial)-執行n次白努利隨機試驗,事件成功發生的機率為p,事件失敗發生的機率為1-p。通常以隨機變數XB(n, p)表示。其機率密度函數與累積分佈函數為:p(x) = C(n, x) px (1-p)n-x x =0, 1,n (4.1)F(x) =xk =0C(n, k) pk (1-p)n-k(4.2)其期望值與變異數為:EX = npVX =np(1-p) 二項式分佈當n很大或p接近0.5時呈常態分佈,np接近1 Peak Out,p0.5左偏Excel : pp. 99-100, Bernoulli Distribution pp. 101-110, Binomial Distribution範例、致遠管理學院約有40%的學生喜歡打籃球,茲隨機機訪問1個學生,試問(a) 此學生喜歡打籃球的期望值與變異數? (b) 隨機機訪問5個學生,此5個均喜歡打籃球的期望值與變異數? 有2個均喜歡打籃球的期望值與變異數? 至少有3個喜歡打籃球的期望值與變異數?SOL:公式、查表、Excel(binomdist(x,n,p,true)(a) 令隨機變數X代表喜歡棒與否,則(注意:N/Y)EX = p = 0.4 VX = p(1-p) = 0.24(b) 令隨機變數X代表喜歡棒的人數,則(注意:人數)EX = np = 5* 0.4 = 2 VX = np(1-p) = 1.2P(X=2) = C(5,2)(0.4)2 (0.6)3 = 0.346/binomdist(2,5,0.4,false)/P(X 3) = 1- P(X 2) = 0.317/1-binomdist(2,5,0.4,true)/範例、工管系期末考統計學出20題選擇題(4選1),每題5分。某學生採完全以猜的方式作答,試問(a) 此學生答對數的期望值與變異數? (b) 此學生期末考統計學分數的期望值與變異數? (c) 此學生考及格的機率? (d) 此學生最多考40分的機率? SOL:公式、查表、Excel(a) 令隨機變數X代表此學生答對題數,則(注意:題數)EX = np = 20* 1/4 = 5 VX = np(1-p) = 3.75(b) 分數期望值(注意:分數)E5X = 5EX = 25 V5X = 25*3.75 = 93.75(c) 此學生須答對12題以上才能及格,因此,P(X 12) = 1- P(X 0(4.10)F(x) = 1- e-x/l(4.11)其期望值與變異數為:EX= lVX = l2範例、工管系舉行迎新烤肉活動,地點是曾文水庫。歸來時大家快樂的走到候車亭等往麻豆的台南客運。不巧,同學們剛到候車亭時,車子正好剛開走。康樂股長看看站牌上寫著:往麻豆班車平均每20分鐘開一班。 (a) 同學們最多再等10分鐘之機率? (b) 超過30分鐘之機率?SOL:公式、查表、Excel令隨機變數X代表台南客運到達時間間距,XExp(l) = Exp(20),則(a) F(x) = P(x 10) = 0.39/=expondist(10,1/20,true)/(b) P(x 30) = 0.2231/=1-expondist(30,1/20,true)/(3) 常態分配(Normal )應用最廣的機率分配,其貼切地模式化或描述很多自然現象或社會科學實例。通常以隨機變數XN(m,s2)表示。其機率密度函數與累積分配函數為:-m0(4.12)(4.13)其期望值與變異數為:EX = mVX = s2常態分配具有以下各項特性:(a) 是一以平均值m為中心線,呈左右對稱鐘狀圖形的分配。s愈大,分配偏離中心m愈遠,曲線圖愈平緩。(b) 母體的平均值、眾數、中位數均相同值。(c) 機率分配函數圖形向曲線中心的兩端延伸,該漸趨近橫軸(即機率函數值遞減)。 通常將其XN(m, s2)標準化。標準化過程是令Z=(X-m)/s則ZN(0, 1),又稱Z分配。標準常態機率密度函數,-x(4.14)標準常態分配之期望值與變異數為:EX = 0,VX = 1範例、工管系期末考統計學成績,經整理得知具有N(50,16),試問成績於5060的人數,大概佔所有參加考試人數的比例為多少? 公式、查表、ExcelSOL:令隨機變數X代表考試成績,其具有N(50,16),則P(50 X 60) = P(50-50)/4 (x-50)/4(60-50)/4=0.494/=normdist(60,50,4,true)-normdist(50,50,4,true)/範例、工管系某品管實驗,經整理資料得知具有N(0.3,0.012),老師規定此實驗規格應為0.30.02之間才合格。試問此實驗不合格的比率有多少?SOL:公式、查表、Excel令隨機變數X代表實驗資料,其具有N(0.3,0.012),則P(0.28x0.32)=P(0.28-0.3)/0.01(x-0.3)/0.01(0.32-0.3)/0.01=0.9544/=normdist(0.32,0.3,0.01,true)-normdist(0.28,0.3,0.01,true)/(4) 伽瑪分配Gamma Distribution如隨機變數X,具有以下的機率密度函數,則該分配稱之為伽瑪分配:(4.15)其中a、b是伽瑪分配的參數,其值均大於0。Where the gamma function G is defined as: 伽瑪函數將被運用到數個統計量分配-Chi-Square, t, F Distribution。4.3常用的統計分配母體樣本分配、參數統計量隨機抽取推 論檢定計算描述如何將樣本資料x1, x2,xn推估母體參數(m, s2),此種由抽樣資料推論母體的長像,統計上稱為統計推論。為了推論母體所服從的機率分配,即推論該機率分配的母體(m,s2)。從母體中抽取數個樣本,利用這些樣本組成所謂的樣本統計量,而樣本統計量所服從的機率分配則稱之為統計分配,亦稱抽樣分配(Sampling Distribution)。常用的統計分配有常態分配,t分配,卡方分配,F分配等。統計推論的目的係利用樣本裏的資訊對母體作結論,所採之方法為隨機樣本,即倘母體有N個元素而抽出n個樣本,所有的C(N, n)個可能樣本中的每一個被選中的機率均相等,亦稱隨機抽樣(Random Sampling)。樣本統計量: 集中趨勢統計量-平均數。 離散趨勢統計量-變異數與標準差等。=(x1 + x2 + + xn)/n = (ni =1 xi)/nS2=ni =1 (xi-)2/(n-1),(ni =1 (xi-)2:Sum Square)常用統計分配:(1)常態分配上述已定義過常態分配,主要是用來說明隨機變數的分佈狀況。而在統計應用上,常態分配是用來推論與檢定母體的特徵值。如,以樣本平均值去推論m,其中的統計分配即常態分配。大數法則從同一母體隨機抽取出n個樣本,當n很大時,則由樣本算出的樣本平均值會接近母體平均數,即 (n)m(E= m)中央極限定理19世紀法國學數家Pierre Simon de Laplace(1749-1827)所提出。他是從觀察到量測誤差有常態分配的趨向而得到此定理。樣本平均數大都趨近於常態分配。中央極限定理的精神:從任何以期望值m,變異數s2的母體中,隨機抽出n個樣本x1, x2,xn且x =x1+x2+xn,則樣本平均值將會趨近於標準常態分配。(4.16)其中s/n1/2稱之為標準誤(Standard Error);s2/n變異誤(Error Variance)。範例、致遠管理學院女學生平均身高為160cm,標準差為9cm;茲隨機抽取36位女學生,試問平均身高大於160cm而小於162cm的機率有多少?公式、查表、ExcelSOL:令隨機變數代表隨機抽取36位的平均身高,即 =160,s/ n1/2 = 9/(36)1/2=1.5,則P(160 162) = P(160-160)/1.5 (-160)/1.5(162-160)/1.5=0.4082/=normdist(162,160,1.5,true)-normdist(160,160,1.5,true)/範例、致遠管理學院學生選修科技與人生人數服從二項分配B(n, p= 0.07),為了避免選修該課程的人數過多,影響教學品質,倘選修的人數超過80人則開2班上課。試問本學期有1000人可選此門課,則此門課開2班上課的機率有多少? 公式、查表、ExcelSOL:令隨機變數X代表選修該課程的學生人數,則P(X80)=1-binomdist(79,1000,0.07,true)= 0.1207另應用中央極限定理,因EX=np=70、VX=np(1-p)=65.1,則P(X80)=P(X-70)/(65.1)1/2 (80-70)/(65.1)1/2=0.1075(2)卡方分配(Chi-Square)一個可用常態隨機變數來定義的重要的抽樣分配就是卡方分配(c2)。倘z1, z2,zk為k個獨立且相同分配的常態隨機變數,期望值0且變異數1,簡記為NID(0,1)(Normally and Independently Distribution),隨機變數 x = z12+z22+zk2,即會依循自由度為k的卡方分配,其機率密度函數。通常以隨機變數X c2k表示。卡方機率密度函數,0 x (4.17)The gamma function G is defined as: 其期望值與變異數為:EX = kVX = 2k卡方分配是不對稱的統計分配,其對應的機率分配隨著自由度k而有所不同。假設x1, x2,xn是一個來自N(m, s2)分配的隨機樣本。則其平方和除以s2後就依循卡方分配。SS/s2= ni =1 (xi-)2/s2= c2n-1另S2=ni =1 (xi-)2/(n-1) = SS/(n-1)= s2/(n-1)c2n-1S2的分配為s2/(n-1)c2n-1。故樣本變異數的抽樣分配為一個常數乘以卡方分配。如下圖,卡方分配(k =1, 5, 15)假設隨機變數X c2n-1,定義c2a,n-1為自由度(n-1)之卡方分配其右邊(累積)機率等於a的臨界值,即P(X c2n-1)= a,則P(X c21- a/2,n-1)= 1- a/2,及P(c21- a/2,n-1 X c2a/2,n-1)= 1- aa = 0.1,a/2 = 0.05,c2a/2= c20.05,c21- a/2= c20.95倘P(X c21- a/2,n-1)= 1- a/2,P(c1- a/2,n-12 X c a/2,n-12)= 1- ac20.95c20.05c20.95請查表c20.975,4,c20.95,13,c20.01,4,c20.10,13。/=chiinv(0.975,4)/,/=chiinv(0.95,13)/=chiinv(0.01,4)/,/=chiinv(0.10,13)/c20.1,6= 10.6446c20.05,10= 18.3070(3) t分配(Student)倘z與c2k分別為獨立標準常態NID(0,1)與卡方分配,則隨機變數tk= z/(c2k/k)1/2(4.18)依循k個自由度的t分配,通常以t tk表示。t機率密度函數, - x (4.19)其期望值與變異數為:EX = 0,VX =k/(k-2)t分配與標準常態分配類似,其對應的機率分配皆對稱於原點,尤其當樣本數n愈大時,t分配機率分配情形愈趨近於標準常態分配。假設x1, x2,xn是一個來自N(m, s2)分配的隨機樣本,則 tn-1(4.20)t分配最早由W. S. Gosset所發現,因故用Student的筆名發表,又稱Student的t分配。如下圖,t分配(k = 1, 10, 100)假設隨機變數X tn-1,定義tn-1為自由度(n-1)之t分配其右邊(累積)機率等於 a的臨界值,即P(X tn-1)= a,則P(X ta/2, n-1)= a/2,及P(-ta/2, n-1 X ta/2, n-1)= 1- aa = 0.1,a/2 = 0.05,ta/2 = t0.05= -t0.05, 倘P(X ta/2, n-1)= a/2,P(-ta/2, n-1 X ta/2, n-1)= 1- at0.05- t0.05 t0.05 請查表t0.1, 4,t0.05, 13,t0.01, 4,t0.025, 13。/=tinv(0.1*2,4)/,/=tinv(0.05*2,13)/=tinv(0.01*2,4)/,/=tinv(0.025*2,13)/ t0.1, 5 = 1.476/,/ t0.05, 10 = 1.812/(4) F分配倘c2u與c2v分別為二個獨立卡方分配,則隨機變數Fu, v = (c2u/u)/( c2v/v) (4.21)依循分子u個自由度、分母v個自由度的F分配,通常以F Fu, v表示。F機率密度函數, 0 x2;VX= 2v2(u+v-2)/u(v-2)2(v-4)假設分別來自二個不同母體的隨機樣本,各取樣本n1 , n2,其各別樣本變異為S21與S22則如下圖,F分配(u=4,v=10, 30;u=10,v=10, 30)假設隨機變數X,定義為自由度(n1-1, n2-1)之F分配其右邊(累積)機率等於 a的臨界值,即P(X)= a,則P(X )= a,另請查表F0.1, 4, 10,F0.9, 10, 4,F0.025, 4, 10,F0.975, 10, 4 。 /=finv(0.1,4,10)/,/=finv(0.9,10,4)/=finv(0.025,4,10)/,/finv(0.975,10,4)/F0.1, 4, 10 = 2.61/,/F0.9, 10, 4 = 0.383828/,(2.61=1/0.383828)/ F0.025, 10, 8 = 4.30/習題一1. 假設XB(4,0,2),求(A) P(X=2)=C(4,2)(0.2)2 (0.8)2=0.1536(B) P(x2)= 4x =2 C(4,x)(0.2)x(0.8)4-x=0.1808(C) P(x2) = 2x =0 C(4,x)(0.2)x(0.8)4-x=0.9728(D) EX=np =0.8 (E) VarX=np(1-p)=0.64。2. 若每一個燈炮之壽命大於5小時之機率為0.135,現在隨機抽取3個燈炮。試求(A)至少有一個燈炮壽命大於5小時之機率?P(x1)=1-p(x=0)=1-(1-0.135) 3=0.303;(B)令隨機變數X代表3個燈炮中壽命大於5小時之燈炮個數,求EX=np=3*0.135=0.405及VarX= =np(1-p)=0.35。3. 前往百貨公司某櫃員機結帳的顧客人數呈卜氏分配,平均每小時有8位顧客前去結帳。則在8:009:00 p.m.的時段之間,求(A)剛好有8位顧客結帳的機率P(x=8)=(e -8 8 8/8!)=0.14。(B)結帳的顧客不超過2位的機率P(x2)=P(x=0,1,2)=0.0138。4. 現有10支燈管,其中3支是損壞的,以不放回的方式從中抽取5支燈管來檢查,請問:(A)5支燈管全是好的機率;(B)最多有2支燈管損壞的機率。5. 假設隨機變數X具有期望值為常態分配,則P(X)=1/26. 假設隨機變數具有平均數500,變異數100的常態分配,求P(475X500)=0.4938。7. 某腳踏車製造產量大約服從=200,=40的常態分配,則求(A)產量大於250輛之機率=0.105;(B)產量大於200輛且小於250輛之機率=0.394。8. 有一群台灣學生想要申請國外企管研究所(MBA)入學,這群學生的托福(TOFEL)成績服從=450、=36的常態分配。(A)令隨機變數X代表某學生之成績,試求P(425X525)=0.736 (B)若要進入伊利諾大學企管所,540是最低標準分數,則在這群50名學生中,有多少學生符合此項標準=0。9. 分別求出以下各隨機變數X的期望值與變異數(A)白努利分配,XB(p),EX=p,VarX=p(1-p) (B)卜氏分配,XPoi(),EX=,VarX= (C)指數分配,XExp(),EX=1/,VarX=1/2。10. 試由查表求出下列的臨界值:(A) c20.01(12)=26.21 (B) c20.05(6)=12.59 (C) t0.01(10)=2.76 (D) t0.05(5)=2.01 (E) F0.01(7,15)=4.14 (F) F0.05(15,6)=3.94。11. 隨機變數X代表櫻桃甜點所含的櫻桃數,其機率分配如下: X5 6 7 8P(X=x)0.3 0.4 0.2 0.1 試求隨機變數X的期望值與變異數。EX=6.1,VarX=0.86。12. 投擲一公正銅板100次,令Y表示出現正面的次數,則YB(100,0.5),請利用中央極限定理求取P(50Y75)之值。EY=np=100*1/2=50,VarY=np(1-p)=100*1/2*1/2=25P(50Y75)= P(50-50)/5(Y-50)/5(75-50)/5)=0.5習題二1. 下述樣本(1.75,1.75,1.75,1.75,1.75,1.75)的標準差為何( 0 )。2. 丟二個銅板,若正面為1,反面為0,請完成下表,求變異數值Vx=1.5。隨機變數xp(x)EXVX01/40012/41/21/221/41/21111.53. 隨機變數x=1, 2, 3, 4,機率f(x)=ax,求a=( 1/10 ),EX=( 3 ),VX=( 1 ) 。 HINT:所有機率和=14. 一批製品有4個合格品,1個疵品,自其中抽取1個,X表示取出為不合格品數目,求EX=1/5及VX=4/25。 5. 一項投資可能有3種結果獲利100元、獲利600元、損失400元,其機率各為0.2, 0.3, 0.5求投資者之期望所得EX=100*0.2+600*0.3-400*0.5=0。6. 連續隨機變數X,在x = 0與2之間有一密度函數f(x)=ax,求a=( 1/2 ),P(1X1.6)=( 0.39 ),EX=( 1.33 ) , VX=( 0.22 )。7. E(X)=1,E(X2)=4,求VX=( 3 ),V2X+3=( 12 ),E3X-4=( -1 )。8. E(X)=0.5,V(X)=0.5,E2X=( 1 ),V2X-1=( 2 ),EX2=( 0.75 )。9. 求P(1X3)=3/8+3/8+1/8=7/8XP(X)F(X)0X001/81/80X113/84/81X223/87/82X331/81X310. 連續隨機變數在0X4,f(x)=ax,求a=( 1/8 )及累積分佈函數F(X)= (x2 /16)。11. 隨機變數X之機率分佈如下表,請寫出分佈函數F(X)及繪圖X012f(x)1/41/21/4F(x)1/43/4112. 100件物品中有10%件不合格品,抽5件檢查,1收2退之機率= (C(90,5)C(10,0)/C(100,5) + C(90,4)C(10,1)/C(100,5) =0.9231 )。13. 一批共N= 50個,不合格率P= 0.06,隨機抽取10件加以檢驗,求EX=0.6及EX2=0.82及VX=0.46。14. 50件有3個不合格品,抽取3件有1個不合格品之機率。取後不放回之機率=( 3*3/50*47/49*46/48=0.1655 ),超幾何分佈之機率=( 0.1655 ),取後放回時之機率=( 0.159 )。15. 5個製品中含有2個不合格品求每次取出1個檢驗其為合格品或不合格品後仍投返原處,以此進行3次,問其中1個為不合格品之機率=( C(3,1)(2/5)1(3/5)2 =54/125=0.432 )。16. 同上題,取出不放回時取出3次,1個不合格品之機率=( C(3,2)C(2,1)/C(5,3) =3/5=0.6)。17. 機台故障率為0.2,今有8部機器,其故障期望值=( 1.6 )部,變異數VX=( 1.28 )。18. 同上題,試求故障機台不超過2部的機率(P(0)+P(1)=C(8,0)(0.2)0(0.8)8 + C(8,1)(0.2)1(0.8)7 =0.8 )。19. 擲銅板32次,應用謝比雪夫定理,求出正面次數至少3/4之區間。EX=np=16, VarX=np(1-p)=8, 標準差=2.83,1-1/K=3/4, K=2, 162*2.83, (10.34, 21.66)20. p=2%,抽50個均為合格品之機率=( C(50,0)(0.02)0(0.98)50 =0.364 )。21. AQL=0.15%,樣本大小=80時,為0收1退之機率。(C(80,0)(0.15/100)0(1-0.15/100)80 =0.89)22. 雙方約定消費者最低不合格水準LTPD=5%(=0.1),每批之批量N=250,已知供應商製程平均不合格率為1%,以Dodge-Romig之單次抽樣計劃為n=70,c=1,請計算p=0.05實際允收之機率。(P(0)+P(1)=C(70,0)(0.05)0(0.95)70 + C(70,1)(0.05)1(0.95)69 =0.129 )23. 不合格率= 0.1,抽樣數n=20,0個不合格品之機率(C(20,0)(0.1)0(0.9)20 ) 。24. 設某機

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论