高教版 袁卫 统计学 教学ppt(第三章 概率与概率分布)_第1页
高教版 袁卫 统计学 教学ppt(第三章 概率与概率分布)_第2页
高教版 袁卫 统计学 教学ppt(第三章 概率与概率分布)_第3页
高教版 袁卫 统计学 教学ppt(第三章 概率与概率分布)_第4页
高教版 袁卫 统计学 教学ppt(第三章 概率与概率分布)_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习目标,了解随机事件的概念 了解概率运算的法则 理解随机变量及其概率分布的概念 了解二项分布、泊松分布 掌握正态分布的主要特征和应用 理解大数定律和中心极限定理的重要意义,第三章 概率与概率分布,3.1 随机事件及其概率,一、随机试验与随机事件 二、随机事件的概率 三、概率的运算法则,一、随机试验与随机事件,必然现象与随机现象 必然现象(确定性现象) 变化结果是事先可以确定的,一定的条件必然导致某一结果 这种关系通常可以用公式或定律来表示 随机现象(偶然现象、不确定现象) 在一定条件下可能发生也可能不发生的现象 个别观察的结果完全是偶然的、随机会而定 大量观察的结果会呈现出某种规律性 (随机

2、性中寓含着规律性) 统计规律性,十五的夜晚能看见月亮?,十五的月亮比初十圆!,随机试验,严格意义上的随机试验满足三个条件: 试验可以在系统条件下重复进行; 试验的所有可能结果是明确可知的; 每次试验前不能肯定哪一个结果会出现。 广义的随机试验是指对随机现象的观察(或实验)。 实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。,随机事件(事件),随机事件(简称事件) 随机试验的每一个可能结果 常用大写英文字母A、B、 、来表示 基本事件(样本点) 不可能再分成为两个或更多事件的事件 样本空间() 基本事件的全体(全集),随机事件(续),复合事件 由某些基本事件组合而成的事件 样本空间

3、中的子集 随机事件的两种特例 必然事件 在一定条件下,每次试验都必然发生的事件 只有样本空间 才是必然事件 不可能事件 在一定条件下,每次试验都必然不会发生的事件 不可能事件是一个空集(),二、随机事件的概率,概率 用来度量随机事件发生的可能性大小的数值 必然事件的概率为1,表示为P ( )=1 不可能事件发生的可能性是零,P( )=0 随机事件A的概率介于0和1之间,0P(A)1 概率的三种定义,给出了确定随机事件概率的三条途经。,1、概率的古典定义,古典概型(等可能概型) 具有以下两特点 每次试验的可能结果有限(即样本空间中基本事件总数有限) 每个试验结果出现的可能性相同 它是概率论的发展

4、过程中人们最早研究的对象,概率的古典定义,概率的古典定义 前提:古典概型 定义(公式),计算古典概率常用到排列组合知识,例1:设有50件产品,其中有5件次品,现从这50件中任取2件,求抽到的两件产品均为合格品的概率是多少?抽到的两件产品均为次品的概率又是多少? 解:,2、概率的统计定义,当试验次数 n 很大时,事件A发生频率m/n 稳定地在某一常数 p 上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义 p 为事件A发生的概率,当n相当大时,可用事件发生的频率m/n作为其概率的一个近似值计算概率的统计方法(频率方法),3、 主观概率,有些随机事件发生的可能性,既不能通过等可能事件

5、个数来计算,也不能根据大量重复试验的频率来近似 主观概率依据人们的主观判断而估计的随机事件发生的可能性大小 例如某经理认为新产品畅销的可能性是80 人们的经验、专业知识、对事件发生的众多条件或影响因素的分析等等,都是确定主观概率的依据,4. 概率的基本性质,非负性: 规范性: 必然事件的概率为1,即: P()=1 不可能事件的概率为0 ,即:P()=0。 可加性: 若A与B互斥,则P ( AB ) = P ( A ) + P ( B ) 对于多个两两互斥事件A1,A2,An,则有: P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ) 上述三条基本性质,也

6、称为概率的三条公理。,(补充)关于概率的公理化定义,概率的以上三种定义,各有其特定的应用范围,也存在局限性,都缺乏严密性。 古典定义要求试验的基本事件有限且具有等可能性 统计定义要求试验次数充分大,但试验次数究竟应该取多大、频率与概率有多么接近都没有确切说明 主观概率的确定又具有主观随意性 苏联数学家柯尔莫哥洛夫于1933年提出了概率的公理化定义 通过规定应具备的基本性质来定义概率 公理化定义为概率论严谨的逻辑推理打下了坚实的基础。,三、概率的运算法则1. 加法公式,用于求P(AB)“A发生或B发生”的概率 互斥事件(互不相容事件) 不可能同时发生的事件 没有公共样本点,P ( AB ) =

7、P ( A ) + P ( B ),互斥事件的加法公式,P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ),互补事件,互补事件 不可能同时发生而又必然有一个会发生的两个事件 互补事件的概率之和等于1,A,A,例如:掷一个骰子,“出现2点”的概率是1/6,则“不出现2点”的概率就是5/6 。,相容事件的加法公式,相容事件 两个事件有可能同时发生 没有公共样本点 相容事件的加法公式 (广义加法公式 ),P ( AB ) = P ( A ) + P ( B ) - P ( AB ),事件的积(交)AB,事件的和(并),2. 乘法公式,用于计算两个事件同时发生的

8、概率。 也即 “A发生且B发生”的概率 P(AB) 先关注事件是否相互独立,(1)条件概率,条件概率在某些附加条件下计算的概率 在已知事件B已经发生的条件下A发生的条件概率P(A|B) 条件概率的一般公式:,其中 P(B) 0,例2:某公司甲乙两厂生产同种产品。甲厂生产400件,其中一级品为280件;乙厂生产600件,其中一级品有360件。若要从该厂的全部产品中任意抽取一件,试求:抽出产品为一级品的条件下该产品出自甲厂的概率;抽出产品出自甲厂的条件下该产品为一级品的概率。 解:设A“甲厂产品”,B“一级品”,则: P(A)0.4, P(B) 0.64,P(AB)0.28 所求概率为事件B发生条

9、件下A发生的条件概率 P(A|B)0.28/0.64 所求概率为事件A发生条件下B发生的条件概率 P(B|A)0.28/0. 4,(2)事件的独立性,两个事件独立 一个事件的发生与否并不影响另一个事件发生的概率 P(A|B)P(A),或 P(B|A)P(B),独立事件的乘法公式:,P(AB) P(A)P(B),推广到n 个独立事件,有:,P(A1An)P(A1)P(A2) P(An),(3)全概率公式,完备事件组 事件A1、 A2、An互不相容, AA2An 且P(Ai ) 0(i=1、2、.、n) 对任一事件B,它总是与完备事件组A1、 A2、An之一同时发生,则有求P(B)的全概率公式:,

10、例3:假设有一道四选一的选择题,某学生知道正确答案的可能性为2/3,他不知道正确答案时猜对的概率是1/4。试问该生作出作答的概率? 解:设 A知道正确答案,B选择正确。 “选择正确”包括: “知道正确答案而选择正确”(即AB) “不知道正确答案但选择正确”(即 ) P(B)(2/3)1(1/3)(1/4)3/4,全概率公式贝叶斯公式,全概率公式的直观意义: 每一个Ai的发生都可能导致B出现,每一个Ai 导致B发生的概率为,因此作为结果的事件B发生的概率是各个“原因”Ai 引发的概率的总和 相反,在观察到事件B已经发生的条件下,确定导致B发生的各个原因Ai的概率 贝叶斯公式(逆概率公式) (后验

11、概率公式),贝叶斯公式,若A1、 A2、An为完备事件组,则对于任意随机事件B,有:,计算事件Ai在给定B条件下的条件概率公式。 公式中,P(Ai)称为事件Ai的先验概率 P(Ai|B)称为事件Ai的后验概率,3.2 随机变量及其概率分布,一、随机变量的概念 二、随机变量的概率分布 三、随机变量的数字特征 四、常见的离散型概率分布 五、常见的连续型概率分布,一、随机变量的概念,随机变量表示随机试验结果的变量 取值是随机的,事先不能确定取哪一个值 一个取值对应随机试验的一个可能结果 用大写字母如X、Y、Z.来表示,具体取值则用相应的小写字母如x、y、z来表示 根据取值特点的不同,可分为: 离散型

12、随机变量取值可以一一列举 连续型随机变量取值不能一一列举,1. 离散型随机变量的概率分布,X的概率分布X的有限个可能取值为xi与其概率 pi(i=1,2,3,n)之间的对应关系。 概率分布具有如下两个基本性质: (1) pi0,i=1,2,n; (2),二、随机变量的概率分布,离散型概率分布的表示:,概率函数:P(X= xi)= pi 分布列: 分布图,2. 连续型随机变量的概率密度,连续型随机变量的概率分布只能表示为: 数学函数概率密度函数f (x)和分布函数F (x) 图 形概率密度曲线和分布函数曲线 概率密度函数f (x)的函数值不是概率。 连续型随机变量取某个特定值的概率等于0 只能计

13、算随机变量落在一定区间内的概率 由x轴以上、概率密度曲线下方面积来表示,概率密度f (x) 的性质,(1) f (x)0。概率密度是非负函数。 (2),所有区域上取值的概率总和为1。,随机变量X在一定区间(a,b)上的概率:,3. 分布函数,适用于两类随机变量概率分布的描述 分布函数的定义: F(x)PXx,连续型随机变量的分布函数,离散型随机变量的分布函数 F(x),分布函数与概率密度,三、随机变量的数字特征1. 随机变量的数学期望,又称均值 描述一个随机变量所有可能取值的平均值。 离散型随机变量 X的数学期望: 相当于所有可能取值以概率为权数的平均值 连续型随机变量X 的数学期望:,数学期

14、望的主要数学性质,若k是一常数,则 E (k X) k E(X) 对于任意两个随机变量X、Y,有 E(X+Y)E(X)E(Y) 若两个随机变量X、Y相互独立,则 E(XY)E(X) E(Y),2. 随机变量的方差和标准差,方差是它的各个可能取值偏离其均值的离差平方的均值,记为D(x)或2 离散型随机变量的方差: 连续型随机变量的方差:,方差和标准差都反映随机变量取值的分散程度。 它们的值越大,说明离散程度越大,其概率分布曲线越扁平。 方差的主要数学性质: 若k是一常数,则 D(k)0; D(kX)k2 D(X) 若两个随机变量X、Y相互独立,则 D(X+Y)D(X)D(Y),例4:试求优质品件

15、数的数学期望、方差和标准差。 解:, 0.6,3.两个随机变量的协方差和相关系数,协方差的定义,如果X,Y独立(不相关),则 Cov(X,Y)0 即 E(XY)E(X) E(Y) 协方差在一定程度上反映了X、Y之间的相关性 协方差受两个变量本身量纲的影响。,相关系数,相关系数具有如下的性质: 相关系数是一个无量纲的值 0| | 0 当=0,两个变量不相关(不存在线性相关) 当 | |=1,两个变量完全线性相关,四、常见离散型随机变量的概率分布1. 二项分布,n重贝努里试验: 一次试验只有两种可能结果 用“成功”代表所关心的结果,相反的结果为“失败” 每次试验中“成功”的概率都是 p n 次试验

16、相互独立。,在n重贝努里试验中,“成功”的次数X服从参数为n、p的二项分布,记为 X B(n , p) 二项分布的概率函数为:,二项分布的数学期望和方差:,n1时,二项分布就成了二点分布(0-1分布),例5:已知一批产品的次品率为4,从中任意的有放回抽取5个,求5个产品中 (1)没有次品的概率是多少? (2)恰好有一个次品的概率是多少? (3)有3个以下次品的概率是多少?,1837年法国数学家泊松首次提出。 通常用来描述一指定时间范围内,或者一定的长度体积、面积内,某一事件出现次数的分布。 泊松分布的例子: 一段时间内某繁忙十字路口发生交通事故的次数 一定时间段内某电话交换台接到的电话呼叫次数

17、 一匹布上发现瑕点的个数 一段时间内,在车站等候公共汽车的人数,2. 泊松分布,X 服从泊松分布,记为XP():,为给定时间间隔、长度、面积、体积内“成功”的平均数 x表示给定时间间隔、长度、面积、体积内成功的次数 E(X)=D(X)= 当 很小时,泊松分布呈偏态,并随着增大而趋于对称 当n很大而p很小时,二项分布近似服从参数np的泊松分布,例6:假定某航空公司预订票处平均每小时接到42次订票电话,问10分钟内恰好接到6次电话的概率是多少? 解:设X10分钟航空公司接到订票电话的次数,3. 超几何分布,二项分布适合于独立重复试验,如果对总体采用不重复抽样,那么样本中“成功”的次数则服从超几何分

18、布。记为XH(n,N,M ) (N为总体单位数、M为具有某种特征的单位数),数学期望和方差:,五、常见的连续型概率分布,1. 均匀分布 X只在一有限区间 a,b 上取值 且概率密度是一个常数 其概率密度为:,X 落在子区间 c,d 内的概率与该子区间的长度成正比,与具体位置无关,P(cXd),2. 正态分布,XN (、 2 ),其概率密度为:,正态分布随机变量的均值和标准差 均值 E(X) = 方差 D(X)= 2,- x ,正态分布曲线的主要特性,关于x = 对称的钟形曲线 参数决定正态曲线的中心位置 参数 决定正态曲线的陡峭或扁平程度 以X轴为渐近线,即当x 时,f(x) 0,标准正态分布

19、,0、1的正态分布,记为N (0, 1) 其概率密度(x),分布函数 (x) XN (、 2 ), 则 : ZN (0,1 ),若 ZN (0,1 ),则有: P(| Z| a)2(a)1 (-a)=1(a),标准化,【例3-14】,例7:某厂生产的某种节能灯管的使用寿命服从正态分布,对某批产品测试的结果,平均使用寿命为1050小时,标准差为200小时。试求: 使用寿命在500小时以下的灯管占多大比例? 使用寿命在8501450小时的灯管占多大比例? 以均值为中心,95的灯管的使用寿命在什么范围内?,解,X使用寿命,XN (1050,2002 ),(2)(-1)0.977250.158650.

20、8186,95的灯管寿命在均值左右392(即6581442)小时,1(2.75)10.997020.00298,3 原则,|X| 3 的概率很小,因此可认为正态随机变量的取值几乎全部集中在 - 3,+ 3 区间内 广泛应用: 产品质量控制 判断异常情况 ,正态分布最常用、最重要,大千世界中许多常见的随机现象服从或近似服从正态分布 例如,测量误差,同龄人的身高、体重,一批棉纱的抗拉强度,一种设备的使用寿命,农作物的产量 特点是 “中间多两头少” 由于正态分布特有的数学性质,正态分布在很多统计理论中都占有十分重要的地位 正态分布是许多概率分布的极限分布 统计推断中许多重要的分布(如2分布、t分布、F分布)都是在正态分布的基础上推导出来的。,一、大数定律,3.3 大数定律与中心极限定理,大数定律是阐述大量同类随机现象的平均结果的稳定性的一系列定理的总称。,1、独立同分布大数定律,设X1, X2, 是独立同分布的随机变量序列,且存在有限的数学期望E(Xi)和方差D(Xi ) 2(i=1,2,),则对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论