第三章 连续随机变数_第1页
第三章 连续随机变数_第2页
第三章 连续随机变数_第3页
第三章 连续随机变数_第4页
第三章 连续随机变数_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 連續隨機變數3.1 連續隨機變數及其機率密度函數若隨機實驗為一量度實驗,像量血壓,自來水的氯含量,射箭的落點與靶心的距離等,當我們記錄這些實驗的結果時,我們會用整數或只保留一兩位小數,這是因為量度儀器不夠精密或為著方便記錄。若隨機實驗的結果是長度、時間、重量、體積等,一個比較正確的樣本空間為一實數區間,從這實驗所定義的隨機變數的可能值也會是一實數區間,這種隨機變數稱為連續型隨機變數。除非令有說明,我們假設連續型隨機變數之值域為所有實數所成的集合。若隨機變數為連續,我們就不能用離散型隨機變數的機率函數去分配機率。一個湖裡有一群鱒魚,我們從湖中隨機抽取一條量其長度,這是一隨機實驗,而長度為

2、一連續型隨機變數。表3.1 為100條鱒魚之魚身長度(單位為公分cm),其最小值為10.1,最大值為15.8,我們先將這100個數據以等距區間分組成表3.2。 分組表列時,若我們有個數據而,我們可以用大約個區間,同時為避免數據落在區間之邊界點,我們對邊界點要採用多一個小數位。這題我們採用9個區間,每一區間長度約為,本表取0.7。 15.0 15.3 14.4 10.4 10.2 11.5 15.4 11.7 15.0 10.913.610.513.815.013.814.513.713.912.5 15.210.713.110.612.114.914.112.714.010.114.110.3

3、15.215.012.910.710.310.815.314.914.814.911.810.411.011.414.315.111.510.210.114.715.112.814.815.010.413.514.514.913.910.114.813.710.910.612.414.510.515.115.812.015.510.814.415.414.811.415.110.315.415.014.015.015.113.714.710.714.513.911.715.110.911.310.515.314.014.612.615.310.4 表3.1 100條鳟魚身長 區 間 區間中點

4、頻率 相對頻率(class interval) (class mark) (frequency) (relative frequency) 9.75-10.45 10.1 12 0.12 10.45-11.15 10.8 14 0.14 11.15-11.85 11.5 8 0.08 11.85-12.55 12.2 4 0.04 12.55-13.25 12.9 5 0.05 13.25-13.95 13.6 10 0.10 13.95-14.65 14.3 13 0.13 14.65-15.35 15.0 29 0.29 15.35-16.05 15.7 5 0.05 表3.2 我們再用一

5、直方圖(histogram)展示上述數據,此圖之橫軸標示區間之邊界點或區間中點,在每一區間上立一柱,其高度為該區間之頻率,如圖3.1。魚身長度在某一區間之機率應與該區間之柱狀面積成正比。例如:魚身長度大於14公分之機率大概是。假設我們撈的魚增加,直方圖使用的區間也隨之增加,則區間寬度會漸漸縮小而直方圖會“平滑”成一曲線,而魚身長度落在某一區間之機率應該與曲線與區間所包圍之面積成正比。若我們將座標調整使得曲線與軸包圍之面積為1,則隨機變數X在某一區間之機率就是該區間與之下所包圍之面積。 上述之函數稱為隨機變數X之機率密度函數。3025201510 5 9.75 10.45 11.15 11.85

6、 12.55 13.25 13.95 14.65 15.35 16.05 魚身長度 圖3.1 以下我們給機率密度函數正式定義: 定義:若是一實數值函數滿足下列兩條件:(1) (2) 則稱為一機率密度函數(probability density function)若連續隨機變數之機率密度函數為,則對a b於上式中,若取b = a ,則PX= a = 0故連續隨機變數出現任一點的機率均為0, 且Pa < X <b = Pa <X b = Pa X < b = Pa X b例題 令。要使為一機率密度函數,必須>0,同時,所以。例題 令。 是否為一機率密度函數? (1)

7、故(2)故為一機率密度函數。例題 令之機率密度函數為(a) 求。(b) 求。(c) 求。解:(a) (b) (c) 根據連續隨機變數機率的算法,。但在實際上當我們量度東西時,其值會是一實數,像重量X為9.8,但,這是否意味著我們觀察到一個機率為0的事件?我們前面提過,當我們量東西時,因受限於儀器的精密性,我們得到的是一個“近似值”,當我們說重量是9.8時,我們應將之解釋為重量是在這一個小區間裡,重量在一個區間之機率就不是0了。3.2 分佈函數若為一連續隨機變數,則之機率為0,故機率密度函數的函數值已不代表隨機變數在該點的機率。因此我們主要有興趣的不是機率密度函數之函數值,而是機率密度函數與軸上

8、一區間所包圍之面積。 定義:若為一連續隨機變數而其機率密度函數為f, 則之分佈函數(distribution function) F 定義為 圖3.2 因為,故。同時=。 從分佈函數之定義,我們可得知它具備以下性質:(1) 。(2) 。(3) F為一非遞減(nondecreasing)函數。(4) 若X為一連續隨機變數,則F為一連續函數。例題 令之機率密度函數為,則的分佈函數為 = 1 1 1 1 圖3.3例題 令之機率密度函數為 ,則的分佈函數為 = f(x) F(x) 1 1 x x 圖 3.4 定義:若連續隨機變數之分佈函數為F,則之第個百分位數( percentile),為一實數滿足。

9、第25,50與75百分位數也分別稱為第一,第二,及第三四分位數(first , second , third quartile )而第二四分位數又稱為中位數(median)。f(x)x面積k/100 圖 3.5例題 承例題 若之第20個百分位數是,則,故。3.3 期望值與變異數 如同離散型隨機變數一樣,對一個連續型隨機變數,我們亦可定義其期望值與變異數做為中心位置與擴散程度的指標。 定義:若為一連續型隨機變數,f為其機率密度函數,則之期望值為定義為:。我們常用或EX來表示E(X)。若g為一實數函數,則g與X之合成函數Y = g(X) 亦可為一連續型隨機變數。 求Y之期望值時,可先求Y的機率密度

10、函數,再依定義求之。 但通常我們不這麼做。可由下列公式求得:依此公式,我們可發現連續隨機變數期望值亦擁有§2.3所討論的離散型隨機變數期望值的性質,例如:a,b為實數,則E(aX+b)+= a EX +b令a = 0可得E(b) = b其他性質亦然,不再贅述。若之機率密度函數為f,則之變異數則定義為:。而變異數的正二次方根稱為標準差。例題 令之機率密度函數為則3.4常態分佈定義:若一連續隨機變數之機率密度函數為 ,其中為任意實數,為一正數,我們稱之分佈為常態分佈(normal distribution),與為這分佈之參數。我們用符號代表之分佈為常態分佈。 f(x) x 圖 3.6利用

11、變數變換與極座標積分,我們可以證明上述定義中的為一機率密度函數,其證明可參考一般的微積分課本,本書不予證明。常態分佈具備下列性質:(1) 其機率密度函數對稱於,因。(2) 是X之中位數。(3) 為之唯一最大值。(4) 之圖形為鐘形(bell-shaped)。(5) ,(6) 大約99%之機率集中在與之間。定義:若Z而,則Z之分佈稱為標準常態分佈(standard normal distribution),我們用符號表示標準常態分佈。之機率密度函數為 ,附錄B表2給了在0與()之間之機率,利用該表,我們可求得在(a,b)間之機率。例題 若(a) (b) (c) (d) (e) (f) (g) (

12、h) 求之第75個百分位數我們知必須滿足,如圖3.7f(x)00.75圖3.7從表得知,(z -value),記為z(0.25)。在統計分析上我們要常常用到值,我們用表示相對於之值,即之機率為(i) 求對稱於0之兩值,使Z落在其間之機率為0.95 -z z 圖3.8(j) 標準常態分佈之重要性在於其他常態分佈可轉換成標準常態分佈。若,則,若我們要求,可先將標準化(standardize),就是減掉,再除以,然後使用表2查機率。例題 假定人之智商(I.Q)之分佈為常態,期望值為100,標準差為16。(a) 若我們隨機抽取一人,求其智商在100與115之間之機率。令為隨機抽取一人之智商, =(b)

13、 其智商大於90之機率。(c) 求智商之第33百分位數。令第33百分位數為將標準化,我們得從表我們得知故,(d) 求對稱於100之兩智商,在其中之機率為0.95。 0.025 0.475 0.025 100 圖 3.9令這兩智商為與從圖3.9得知我們要將標準化,我們得從表我們得故,.因與對稱於100,故例題 某科的學期成績為常態分佈,期望值為72,標準差為12.5。該科老師將學期成績轉換成A B C D F 五等級,成績最高的8%得A,往下20%得B,往下42%得C,往下18%得D,其餘12%得F(不及格)。(a) 學期成績最低要多少才可得A?設為學期成績,則。設最低得A之成績為,則,轉換成標

14、準常態分佈,得從表得 0.08故, 1.41 圖3.10(b) 最低要多少分才可得一個C或以上之等級?設這最低分數為,則將之標準化,得從表得 0.70故, (c) 及格至少要多少分? 圖3.11設及格最低分為,則0.88-1.17圖3.12從表得故, 3.5 用常態分佈近似二項分佈我們前面討論二項分佈之機率時,表只提供到之機率值,若,理論上我們可以用機率函數來算,但這計算將會非常煩瑣,此時我們常用常態分佈求其近似值。設為,從表我們得之機率函數值。 0 1 2 3 4 5 6 70.0000.0010.0060.0220.0610.1220.1830.209 8 9 10 11 12 13 14

15、0.1830.1220.0610.0220.0060.0010.000這機率分佈之直方圖為如圖3.13圖3.13這分佈對稱於,若我們在上加上一為14(0.5)=7,為14(0.5)(0.5)=3.5之常態分佈機率密度函數曲線,我們發現常態密度函數所包圍之面積與直方圖之面積很接近,像相對於之柱面積為0.061,我們用以上方法可求之機率函數值之近似值: 用常態分佈來近似二項分佈之誤差受與影響,一般來說越大,越接近0.5,其近似效果越好,原則上若與同時大於或等於5,則常態分佈會非常合理的近似二項分佈。若而夠大且並不太靠近0或1,我們取與有相同之期望值與變異數之常態分佈隨機變數為之近似值隨機變數,當然

16、,求之機率時,我們必須將其標準化得標準常態分佈變數方能查表而得所要求的機率,在此過程中,還有一點要注意的是從離散型隨機變數轉換成連續型隨機變數時,同時要將離散型的點k轉換成以該點為中心之單位區間,例如:。例題 設,以常態分佈為近似分佈求(i) (ii) (iii) (iv) 故 , , (i)(ii) =0.5793(iii) =0.7291(iv) 。除常態分佈之隨機變數外,我們往後還可看到其他連續隨機變數,如t-分佈、分佈、分佈等隨機變數,其他連續型隨機變數不在本書討論範圍,有興趣的同學可參考其他機率論或數理統計的書籍。習題(1) 令f (x) =,求c使f為機率密度函數。(2) 令X為一

17、連續隨機變數,其機率密度函數為f(x) = (a) 求P(X >) (b) 求P(X >| X >) (c) 求P() (d) 求X之分佈函數。(3) 令X為一連續隨機變數,其機率密度函數為f (x) = (a) 求P(| X | ) (b) 求Y = 2 X1 之分佈函數 (c) 求W = 之分佈函數。(4) 令x為一連續隨機變數,其機率密度函數為f(x) = (a) 求X之分佈函數 (b) 求X之第25,50,75百分位數 (c) 求E(X) (d)求Var(X)。(5) X之機率密度函數為 f(x) = ,求(a) P(X >) (b) 求P(| X 1| ) (

18、c) X之分佈函數 (d) E(X) (e) Var(X)。(6)令Z N(0,1),求(a) P(Z < 2.3) (b) P(-1.6 < Z < 1.8) (c) P( |Z| < 1.65) (d) P( |Z| > 2.33)(e) 第30百分位數 (f) 第80百分位數 (g) 求k使得P( |Z| > k) = 0.10。(7)假定男生身高x之分佈為N(168, 16)。現在隨機抽取1名男生(a) 他身高大於174之機率。(b) 求他身高介於165與170之機率。(c) 求身高之第37百分位數,90個百分位數。(d) 求對稱於168之兩值,身高在其中之機率為0.8。(8)以下每題先用二項分佈公式算出正確機率,再用常態

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论