第3章+概率与概率分布_第1页
第3章+概率与概率分布_第2页
第3章+概率与概率分布_第3页
第3章+概率与概率分布_第4页
第3章+概率与概率分布_第5页
已阅读5页,还剩81页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 2 学习目标 理解随机事件的概念、了解事件之间的关系 理解概率的三种定义,掌握概率运算的法则 理解随机变量及其概率分布的概念 掌握二项分布、泊松分布和超几何分布的背 景、均值和方差及其应用 掌握正态分布的主要特征和应用,了解均匀 分布的应用 理解大数定律和中心极限定理的重要意义 3 一、随机试验与随机事件 二、随机事件的概率 三、概率的运算法则 3.1 随机事件及其概率随机事件及其概率 4 3.1 随机事件及其概率随机事件及其概率 一、随机试验与随机事件一、随机试验与随机事件 5 必然现象与随机现象 必然现象(确定性现象) 变化结果是事先可以确定的,一定的条件必然导 致某一结果 这种关系通

2、常可以用公式或定律来表示 随机现象(偶然现象、不确定现象) 在一定条件下可能发生也可能不发生的现象 个别观察的结果完全是偶然的、随机会而定 大量观察的结果会呈现出某种规律性 (随机性中寓含着规律性) 统计规律性 十五的夜 晚能看见 月亮? 十五的月 亮比初十 圆! 6 随机试验 严格意义上的随机试验满足三个条件: 试验可以在系统条件下重复进行; 试验的所有可能结果是明确可知的; 每次试验前不能肯定哪一个结果会出现。 广义的随机试验是指对随机现象的观察(或实 验)。 实际应用中多数试验不能同时满足上述条件, 常常从广义角度来理解。 7 随机事件(事件) 随机事件(简称事件) 随机试验的每一个可能

3、结果 常用大写英文字母A、B、 、来表示 基本事件(样本点) 不可能再分成为两个或更多事件的事件 样本空间() 基本事件的全体(全集) 8 随机事件(续) 复合事件 由某些基本事件组合而成的事件 样本空间中的子集 随机事件的两种特例 必然事件 在一定条件下,每次试验都必然发生的事件 只有样本空间 才是必然事件 不可能事件 在一定条件下,每次试验都必然不会发生的事件 不可能事件是一个空集() 9 3.1 随机事件及其概率随机事件及其概率 二、随机事件的概率二、随机事件的概率 10 随机事件的概率 概率 用来度量随机事件发生的可能性大小的数 值 必然事件的概率为1,表示为P ( )=1 不可能事件

4、发生的可能性是零,P( )=0 随机事件A的概率介于0和1之间,0P(A)1 ,显然P(AB) P(A)P(B) 因为A和B存在共同部分AB5,7,9,P(AB) 3/10。在P(A)+P(B) 中P(AB) 被重复计算了。 正确计算是: P(AB)5/106/103/108/100.8 26 2. 乘法公式 用于计算两个事件同时发生的概率。 也即 “A发生且B发生”的概率 P(AB) 先关注事件是否相互独立 27 (1)条件概率 条件概率在某些附加条件下计算的概率 在已知事件B已经发生的条件下A发生的条件概 率P(A|B) 条件概率的一般公式: )( )( )|( BP ABP BAP 其中

5、 P(B) 0 28 【例3-5】 某公司甲乙两厂生产同种产品。甲厂生产400件,其中一 级品为280件;乙厂生产600件,其中一级品有360件。 若要从该厂的全部产品中任意抽取一件,试求:已知抽 出产品为一级品的条件下该产品出自甲厂的概率;已知 抽出产品出自甲厂的条件下该产品为一级品的概率。 解:设A“甲厂产品”,B“一级品”,则: P(A)0.4, P(B) 0.64,P(AB)0.28 所求概率为事件B发生条件下A发生的条件概率 P(A|B)0.28/0.64 所求概率为事件A发生条件下B发生的条件概率 P(B|A)0.28/0. 4 29 P(A|B)在B发生的所有可能结果中AB发生的

6、概率 即在样本空间中考虑的条件概率P(A|B),就变成 在新的样本空间B中计算事件AB的概率问题了 (1)条件概率(续) 一旦事件B 已发生 A B AB B AB 30 乘法公式的一般形式: P(AB) P(A)P(B|A) 或或 P(AB) P(B)P(A|B) 【例例3-6】对例对例3-1中的问题(从这中的问题(从这50件中任取件中任取2件件 产品,可以看成是分两次抽取,每次只抽取一件,产品,可以看成是分两次抽取,每次只抽取一件, 不放回抽样)不放回抽样) 解:解:A1第一次抽到合格品,第一次抽到合格品,A2第二次抽到第二次抽到 合格品,合格品,A1A2抽到两件产品均为合格品抽到两件产品

7、均为合格品 P(A1 A2)P(A1)P(A2| A1) 8082. 0 2450 1980 49 44 50 45 31 事件的独立性 两个事件独立 一个事件的发生与否并不影响另一个事 件发生的概率 P(A|B)P(A),或 P(B|A)P(B) 独立事件的乘法公式:独立事件的乘法公式: P(AB) P(A)P(B) 1 1n n1 12 2n n 32 3. 全概率公式 完备事件组 事件A1、 A2、An互不相容, AA2An 且P(Ai ) 0(i=1、2、.、n) 对任一事件B,它总是与完备事件组A1、 A2、 An之一同时发生,则有求P(B)的全概率公式: n i ii ABPAPB

8、P 1 )|()()( 33 例3-7 假设有一道四选一的选择题,某学生知道正确答 案的可能性为2/3,他不知道正确答案时猜对的 概率是1/4。试问该生作出作答的概率? 解:设 A知道正确答案,B选择正确。 “选 择正确”包括: “知道正确答案而选择正确”(即AB) “不知道正确答案但选择正确”(即 ) P(B)(2/3)1(1/3)(1/4)3/4 BA )|()()|()()()()(ABPAPABPAPBAPABPBP 34 全概率公式贝叶斯公式 35 贝叶斯公式 若A1、 A2、An为完备事件组,则对于任意 随机事件B,有: n i ii iii i ABPAP ABPAP BP BA

9、P BAP 1 )|()( )|()( )( )( )|( 计算事件计算事件Ai在给定在给定B条件下的条件概率公式。条件下的条件概率公式。 公式中,公式中,P(Ai)称为事件称为事件Ai的先验概率的先验概率 P(Ai|B)称为事件称为事件Ai的后验概率的后验概率 36 一、随机变量的概念 二、随机变量的概率分布 三、随机变量的数字特征 四、常见的离散型概率分布 五、常见的连续型概率分布 3.2 随机变量及其概率分布随机变量及其概率分布 37 3.2 随机变量及其概率分布随机变量及其概率分布 一、随机变量的概念一、随机变量的概念 38 一、随机变量的概念 随机变量表示随机试验结果的变量 取值是随

10、机的,事先不能确定取哪一个值 一个取值对应随机试验的一个可能结果 用大写字母如X、Y、Z.来表示,具体取值则 用相应的小写字母如x、y、z来表示 根据取值特点的不同,可分为: 离散型随机变量取值可以一一列举 连续型随机变量取值不能一一列举 39 3.2 随机变量及其概率分布随机变量及其概率分布 1. 离散型随机变量的概率分布 2. 连续型随机变量的概率密度 3. 分布函数 二、随机变量的概率分布二、随机变量的概率分布 40 1. 离散型随机变量的概率分布 X的概率分布X的有限个可能取值为xi与其 概率 pi(i=1,2,3,n)之间的对应关系。 概率分布具有如下两个基本性质: (1) pi0,

11、i=1,2,n; (2) 1 i i p 41 离散型概率分布的表示: 概率函数:P(X= xi)= pi 分布列: 分布图 X = xix1x2xn P(X =xi)=pip1p2pn 0.6 0.3 0 0 1 2 x P( x ) 图图3-5 例例3-9的概率分布的概率分布 42 2. 连续型随机变量的概率密度 连续型随机变量的概率分布只能表示为: 数学函数概率密度函数f (x)和分布函数F (x) 图 形概率密度曲线和分布函数曲线 概率密度函数f (x)的函数值不是概率。 连续型随机变量取某个特定值的概率等于0 只能计算随机变量落在一定区间内的概率 由x轴以上、概率密度曲线下方面积来表

12、示 43 概率密度f (x) 的性质 (1) f (x)0。概率密度是非负函数。 (2) 1d )( xxf 所有区域上取值的概率总和为所有区域上取值的概率总和为1。 随机变量随机变量X在一定区间(在一定区间(a,b)上的概率:)上的概率: dxxfbXaP b a )()( x a b 44 3. 分布函数 适用于两类随机变量概率分布的描述 分布函数的定义: F(x)PXx xx i i p 连续型随机变量的分布函数连续型随机变量的分布函数 dxxfxF x )()( 离散型随机离散型随机 变量的分布变量的分布 函数函数 F(x) xx0 分布函数与概率密度分布函数与概率密度 45 3.2

13、随机变量及其概率分布随机变量及其概率分布 1. 随机变量的数学期望 2. 随机变量的方差和标准差 3. 两个随机变量的协方差和相关系数 三、随机变量的数字特征三、随机变量的数字特征 46 1. 随机变量的数学期望 又称均值 描述一个随机变量的概率分布的中心位置 离散型随机变量 X的数学期望: 相当于所有可能取值以概率为权数的平均值 连续型随机变量X 的数学期望: i ii pxXE )( dxxxfxE )()( 47 数学期望的主要数学性质 若k是一常数,则 E (k X) k E(X) 对于任意两个随机变量X、Y,有 E(X+Y)E(X)E(Y) 若两个随机变量X、Y相互独立,则 E(XY

14、)E(X) E(Y) 48 2. 随机变量的方差 方差是它的各个可能取值偏离其均值的离差平 方的均值,记为D(x)或2 公式: 离散型随机变量的方差: 连续型随机变量的方差: 22 )()( XEXD dxxfxxD )()( 22 i ii pxXD 22 )()( 49 方差和标准差(续) 方差和标准差都反映随机变量取值的分散程度。 它们的值越大,说明离散程度越大,其概率分布 曲线越扁平。 标准差方差的平方根 方差的主要数学性质: 若k是一常数,则 D(k)0;D(kX)k2 D(X) 若两个随机变量X、Y相互独立,则 D(X+Y)D(X)D(Y) 50 【例3-10】 试求优质品件数的数

15、学期望、方差和标准差。 解: 2 . 13 . 026 . 011 . 00)( i ii pxXE 36. 03 . 0) 2 . 12(6 . 0) 2 . 11 (1 . 0) 2 . 10()()( 2222 i ii pxXD 0.6 xi012 pi0.10.60.3 51 3.两个随机变量的协方差和相关系 数 协方差的定义 )()(),(YEYXEXEYXCov )()()(YEXEXYE 如果如果X,Y独立(不相关),则独立(不相关),则 Cov(X,Y)0 即即 E(XY)E(X) E(Y) 协方差在一定程度上反映了协方差在一定程度上反映了X、Y之间的相关性之间的相关性 协方

16、差受两个变量本身量纲的影响。协方差受两个变量本身量纲的影响。 52 相关系数 相关系数具有如下的性质: 相关系数是一个无量纲的值 0| | 1 当=0,两个变量不相关(不存在线性 相关) 当 | |=1,两个变量完全线性相关 YX XY YXCov ),( 53 3.2 随机变量及其概率分布随机变量及其概率分布 1. 二项分布 2. 泊松分布 3. 超几何分布 四、常见离散型随机变量的概率分布四、常见离散型随机变量的概率分布 54 1. 二项分布(背景) (背景)n重贝努里试验: 一次试验只有两种可能结果 用“成功”代表所关心的结果,相 反的结果为“失败” 每次试验中“成功”的概率都是 p n

17、 次试验相互独立。 55 1. 二项分布 在n重贝努里试验中,“成功”的次数X服从参 数为n、p的二项分布,记为 X B(n , p) 二项分布的概率函数: xnxx n ppCxXP )1 ()( 二项分布的数学期望和方差:二项分布的数学期望和方差: )1 ()(,)( 2 pnpXDnpXE n1时,二项分布就成了二点分布(时,二项分布就成了二点分布(0-1分布)分布) 56 二项分布图形 p0.5时,二项分布是以均值为中心对称 p0.5时,二项分布总是非对称的 p0.5时峰值在中心的右侧 随着n无限增大,二项分布趋近于正态分布 p=0.3 p=0.5 p=0.7 二项分布图示二项分布图示

18、 57 【例3-11】 某单位有4辆汽车,假设每辆车在一年中至多只发 生一次损失且损失的概率为0.1。试求在一年内该 单位:(1)没有汽车发生损失的概率;(2)有1 辆汽车发生损失的概率;(3)发生损失的汽车不 超过2辆的概率。 解:每辆汽车是否发生损失相互独立的,且损失的 概率相同,因此,据题意,在4辆汽车中发生损失 的汽车数X B(4,0.1)。 58 利用Excel计算二项分布概率 进入Excel表格界面,点击任一空白单元格(作 为输出单元格) 点击表格界面上的 fx 命令 在 “选择类别”中点击“统计”,在“选择函 数”中点击“BINOMDIST” 在Number_s后填入试验成功次数

19、 x (本例为2); 在Trials后填入总试验次数 n (本例为4) ; 在Probability_s后填入成功概率 p (本例为0.1); 在Cumulative后填入0 (或FALSE),表示计算成功次 数等于指定值的概率 “BINOMDIST(2,4,0.1,0)” 用用EXCEL计算二项计算二项 分布的概率分布的概率 59 2. 泊松分布 X 服从泊松分布,记为XP(): e ! )( x xXP x E(X)=D(X)= 当当 很小时,泊松分布呈偏态,并随着很小时,泊松分布呈偏态,并随着增增 大而趋于对称大而趋于对称 当当为整数时,为整数时, 和(和(-1)是最可能值)是最可能值

20、60 泊松分布(应用背景) 通常是作为稀有事件发生次数X的概率分布模 型。 一段时间内某繁忙十字路口发生交通事故的次数 一定时间段内某电话交换台接到的电话呼叫次数 服从泊松分布的现象的共同特征 在任意两个很小的时间或空间区间内事件发生次数 是相互独立的; 各区间内事件发生次数只与区间长度成比例,与区 间起点无关; 在一段充分小的区间内事件发生两次或两次以上的 概率可以忽略不计 61 【例3-12】 设某种报刊的每版上错别字个数服从 =2的 泊松分布。随机翻看一版,求: (1)没有错别字的概率; (2)至多有5个错别字的概率。 解:设X每版上错别字个数,则所求概率为: 0.1353e ! 0 2

21、 )0( 2 0 XP 0.9834e ! 2 ) 5( 5 0 2 x x x XP 利用利用EXCEL计算泊松分布的概率计算泊松分布的概率 62 二项分布的泊松近似 【前提】当n很大而 p又很小时,二项分布可用 参数np 的泊松分布近似 【例3-13】一工厂有某种设备80台,配备了3 个维修工。假设每台设备的维修只需要一个维 修工,设备发生故障是相互独立的,且每台设 备发生故障的概率都是0.01。求设备发生故障 而不能及时维修的概率是多少? 解:XB(n=80,p=0.01),由于np=0.8很小, 可以用0.8的泊松分布来近似计算其概率: 00908. 099092. 01e ! 08.

22、 0 1)3(1)4( 3 0 08. 0 x x x XPXP 63 3. 超几何分布 N个单位的有限总体中有M个单位具有某特征。用 不重复抽样方法从总体中抽取n个单位,样本中具 有某种特征的单位数X服从超几何分布,记为X H(n,N,M ) n N xn MN x M C CC xXP )( 1 )1()(,)( 2 N nN pnpXDnpXE 数学期望和方差数学期望和方差: N很大而很大而n相对很小时,趋于二项分布相对很小时,趋于二项分布(p=M/N) 64 五、常见的连续型概率分布 1. 均匀分布 X只在一有限区间 a,b 上取值 且概率密度是一个常数 其概率密度为: bxa ab

23、xf , 1 )( X 落在子区间落在子区间 c,d 内的内的 概率与该子区间的长度成正概率与该子区间的长度成正 比,与具体位置无关比,与具体位置无关 f(x) a c d b x P(cXd) 65 2. 正态分布 XN (、 2 ),其概率密度为: 2 2 2 )( 2 1 )( x exf 正态分布的均值和标准差正态分布的均值和标准差 均值均值 E(X) = 方差方差 D(X)= 2 - x 3 的概率很小,因此可认为正态随 机变量的取值几乎全部集中在 - 3,+ 3 区间内 广泛应用: 产品质量控制 判断异常情况 图图3-12 常用的正态概率值常用的正态概率值 (在一般正态分布及标准正

24、态分布中)(在一般正态分布及标准正态分布中) -3 -2 -1 0 +1 +2 +3 z -3 -2 - + +2 +3 x 99.73% 95.45% 68.27% 71 正态分布最常用、最重要 大千世界中许多常见的随机现象服从或近似服从正 态分布 例如,测量误差,同龄人的身高、体重,一批棉纱的抗 拉强度,一种设备的使用寿命,农作物的产量 特点是 “中间多两头少” 由于正态分布特有的数学性质,正态分布在很多统 计理论中都占有十分重要的地位 正态分布是许多概率分布的极限分布 统计推断中许多重要的分布(如2分布、t分布、F分布) 都是在正态分布的基础上推导出来的。 72 用正态分布近似二项分布

25、XB (n,p) ,当n充分大时, XN (n p,np(1-p) 【例3-15】假设有一批种子的发芽率为0.7。现 有这种种子1000颗,试求其中有720颗以上发 芽的概率。 解:设X发芽种子颗数,XB(1000,0.7)。 近似地 XN (700,210)。 P(X720)P(Z1.38)1P(Z1.38) 10.91620.0838 73 用正态分布近似二项分布 用正态分布近似二项分布的前提 n很大, p不能太接近 0 或 1(否则二项分布太偏) 一般要求np和np(1-p)都要大于5 如果np或np(1-p)小于5,二项分布可以用泊松分 布来近似 74 计算正态分布的概率值 方法一:先

26、标准化查标准正态分布函数值表 方法二:利用Excel来计算(不必标准化) 插入函数fx选择“统计”“NORMDIST”, 进入“函数参数”对话框中, 在X后填入正态随机变量的取值区间点; 在Mean后填入正态分布的均值; 在Standard_dev后填入正态分布的标准差; 在Cumulative后填入1(或TRUE),表示计算随机变 量取值小于等于指定值x的累积概率值。 75 也可在选定的输出单元格中,顺次输入函数名 和参数值即可 如输入“=NORMDIST(500,1050,200,1)”,确 定后即可得到所求概率值0.0029798。 根据概率值F(Xx)求随机变量取值的区间点 x, 选择

27、函数“NORMINV”。 如输入 “=NORMINV(0.0029798,1050,200)”,显示 计算结果为500。 计算正态分布的概率值 76 一、大数定律 二、中心极限定理 3.3 大数定律与中心极限定理大数定律与中心极限定理 77 3.3 大数定律与中心极限定理大数定律与中心极限定理 1. 独立同分布大数定律 2. 贝努里大数定律 一、大数定律一、大数定律 78 独立同分布大数定律 大数定律是阐述大量同类随机现象的平均结果 的稳定性的一系列定理的总称。 独立同分布大数定律设X1, X2, 是独立同分 布的随机变量序列,且存在有限的数学期望E(Xi) 和方差D(Xi ) 2(i=1,2

28、,),则对任意小 的正数, 有: 1| 1 |lim 1 n i i n X n P 79 大数定律(续) 该大数定律表明:当n充分大时,相互独立且 服从同一分布的一系列随机变量取值的算术平 均数,与其数学期望的偏差任意小的概率接 近于1。 该定理给出了平均值具有稳定性的科学描述, 从而为使用样本均值去估计总体均值(数学期 望)提供了理论依据。 80 贝努里大数定律 设m是n次独立重复试验中事件A发生的次数,p 是每次试验中事件A发生的概率,则对任意的 0,有: 1|lim p n m P n 它表明,当重复试验次数它表明,当重复试验次数n充分大时,事充分大时,事 件件A发生的频率发生的频率m/n依概率收

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论