统计学第五章 概率论_第1页
统计学第五章 概率论_第2页
统计学第五章 概率论_第3页
统计学第五章 概率论_第4页
统计学第五章 概率论_第5页
已阅读5页,还剩94页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 概率与概率分布统计学第五章 概率与概率分布第一节第一节 概率基础概率基础第二节第二节 随机变量及其分布随机变量及其分布学习目标1. 了解随机事件的概念、事件的关系和运算了解随机事件的概念、事件的关系和运算2. 理解概率的定义,掌握概率的性质和运算理解概率的定义,掌握概率的性质和运算法则法则理解随机变量及其分布,计算各种分布的理解随机变量及其分布,计算各种分布的概率概率3. 用用Excel计算分布的概率计算分布的概率一一. 随机事件及其概率随机事件及其概率二二. 概率的性质与运算法则概率的性质与运算法则随机事件的几个基本概念试 验在相同条件下,对事物或现象所进行的观察例如:掷一枚骰子,观

2、察其出现的点数试验具有以下特点可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果事件的概念事件:事件:随机试验的每一个可能结果(任何样本点集合)例如:掷一枚骰子出现的点数为3随机事件:随机事件:每次试验可能出现也可能不出现的事件例如:掷一枚骰子可能出现的点数必然事件必然事件:每次试验一定出现的事件,用表示例如:掷一枚骰子出现的点数小于7不可能事件不可能事件:每次试验一定不出现的事件,用表示例如:掷一枚骰子出现的点数大于6事件与样本空间基本事件一个不可能再分的随机事件例如:掷一枚骰子出现的点数样本空间一个

3、试验中所有基本事件的集合,用表示例如:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面事件的关系和运算(事件的包含)A事件的关系和运算(事件的并或和)B事件的关系和运算(事件的交或积)A事件的关系和运算(互斥事件)A事件的关系和运算(事件的逆)A事件的关系和运算(事件的差)A事件的关系和运算(事件的性质) 设A、B、C为三个事件,则有交换律:AB=BA AB=BA结合律:A(BC)=(AB)C A(BC) =(AB) C分配律:A(BC)=(AB)(AC) A(BC)=(AB)(AC)事件的概率事件的概率事件A的概率是对事件A在试验中出现的可能性大小的一种度量表示事件A

4、出现可能性大小的数值事件A的概率表示为P(A)概率的定义有:古典定义、统计定义和主观概率定义事件的概率例如,投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右概率的古典定义 如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为nmAAP事件个数样本空间所包含的基本所包含的基本事件个数事件)(概率的古典定义(实例)【例例】某钢铁公司所属三个工厂的职工人数如下表。从该公司中随机抽取1人,问: (1)该职工为男性的概率 (2)该职工为

5、炼钢厂职工的概率某钢铁公司所属企业职工人数某钢铁公司所属企业职工人数工厂工厂男职工男职工女职工女职工合计合计炼钢厂炼钢厂炼铁厂炼铁厂轧钢厂轧钢厂4000320090018001600600620048001500合计合计8500400012500概率的古典定义(计算结果) 解:解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则68. 0125008500)(全公司职工总人数全公司男性职工人数AP384. 0125004800)(全公司职工总人数炼钢厂职工人数BP概率的统计定义 在相同条件下进行n次随机试验,事件A出现 m 次,则比值 m/n

6、 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,取向于稳定,这个频率的稳定值即为事件A的概率,记为pnmAP)(概率的统计定义 (实例)【例例】:某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。解:解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有4 . 03012)(试验的天数超过用电指标天数AP主观概率定义对一些无法重复的试验,确定其结果的概率只能根据以往的经

7、验人为确定概率是一个决策者对某事件是否发生,根据个人掌握的信息对该事件发生可能性的判断例如,我认为2001年的中国股市是一个盘整年概率的性质与运算法则概率的性质非负性对任意事件A,有 0 P 1规范性必然事件的概率为1;不可能事件的概率为0。即P ( ) = 1; P ( ) = 0可加性若A与B互斥,则P ( AB ) = P ( A ) + P ( B )推广到多个两两互斥事件A1,A2,An,有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )概率的加法法则 法则一法则一两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则 P

8、 ( AB ) = P ( A ) + P ( B )事件A1,A2,An两两互斥,则有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An )概率的加法法则(实例)504. 0125001500125004800)()()(BPAPBAP概率的加法法则 法则二法则二 对任意两个随机事件A和B,它们和的概率为两个事件分别概率的和减去两个事件交的概率,即 P ( AB ) = P ( A ) + P ( B ) - P ( AB ) 概率的加法法则(实例)条件概率与独立事件条件概率 在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件B发生条件下事件

9、A发生的条件概率,记为 条件概率的图示概率的乘法公式用来计算两事件交的概率以条件概率的定义为基础设A、B为两个事件,若P(B)0,则P(AB)=P(B)P(A|B),或P(AB)=P(A)P(B|A)概率的乘法公式(实例)0224. 09991491000150)|()()(12121AAPAPAAP事件的独立性一个事件的发生与否并不影响另一个事件发生的概率,则称两个事件独立若事件A与B独立,则P(B|A)=P(B), P(A|B)=P(A) 此时概率的乘法公式可简化为 P(AB)=P(B)P(B)推广到n个独立事件,有 P(A1 A2 An)=P(A1)P(A2) P(An) 事件的独立性(

10、实例)全概公式 设事件A1,A2,An 两两互斥, A1+A2+ An=(满足这两个条件的事件组称为一个完备事件组),且P(Ai)0(i=1,2, ,n),则对任意事件B,有niiiABPApBP1)|()()(全概公式(实例)0345. 002. 040. 004. 035. 005. 025. 0)|()()(31iiiABPApBP贝叶斯公式(逆概公式)与全概公式解决的问题相反,贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因设 n 个 事 件 A1, A2, , An 两 两 互 斥 , A1+A2+ An= (满足这两个条件的事件组称为一个完备事件组),且P(Ai)0(i=1,2

11、, ,n),则njjjiiiABPApABPAPBAP1)|()()|()()|(贝叶斯公式(实例)232.00345.002.04 .0)|(406.00345.004.035.0)|(3623.00345.005.025.0)|(321BAPBAPBAP一一. 随机变量的概念随机变量的概念离散型随机变量的概率分布离散型随机变量的概率分布2连续型随机变量的概率分布连续型随机变量的概率分布随机变量的概念随机变量的概念一次试验的结果的数值性描述一般用 X、Y、Z 来表示例如: 投掷两枚硬币出现正面的数量根据取值情况的不同分为离散型随机变量和连续型随机变量离散型随机变量随机变量 X 取有限个值或所

12、有取值都可以逐个列举出来 X1 , X2,以确定的概率取这些不同的值离散型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查抽查100个个产品产品一家餐馆营业一天一家餐馆营业一天电脑公司一个月的销售电脑公司一个月的销售销售一辆汽车销售一辆汽车取到次品的个数取到次品的个数顾客数顾客数销售量销售量顾客性别顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为男性为0,女性为女性为1连续型随机变量随机变量 X 取无限个值所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任意点连续型随机变量的一些例子试验试验随机变量随机变量可能的取值可能的取值抽查一批电子元件抽查一批电

13、子元件新建一座住宅楼新建一座住宅楼测量一个产品的测量一个产品的长度长度使用寿命使用寿命(小时小时)半年后工程完成的百分比半年后工程完成的百分比测量误差测量误差(cm)X 00 X 100X 0离散型随机变量的概率分布离散型随机变量的概率分布列出离散型随机变量X的所有可能取值列出随机变量取这些值的概率通常用下面的表格来表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn011niip离散型随机变量的概率分布(实例)X = xi0 1 2 3P(X=xi) pi0.05 0.10 0.55 0.30离散型随机变量的概率分布(01分布)一个离散型随机变量X只取两个可

14、能的值例如,男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示列出随机变量取这两个值的概率离散型随机变量的概率分布(01分布实例)X = xi0 1P(X=xi)=pi0.05 0.95离散型随机变量的概率分布(均匀分布)一个离散型随机变量取各个值的概率相同列出随机变量取值及其取值的概率例如,投掷一枚骰子,出现的点数及其出现各点的概率离散型随机变量的概率分布(均匀分布实例)X = xi1 2 3 4 5 6P(X=xi)=pi1/6 1/6 1/6 1/6 1/6 1/6离散型随机变量的数学期望和方差离散型随机变量的数学期望在离散型随机变量X的一切可能取值的完备组中,各可能取值

15、xi与其取相对应的概率pi乘积之和描述离散型随机变量取值的集中程度计算公式为取无穷个值)取有限个值)XpxXEXpxXEiiiniii()()(11离散型随机变量的方差随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)描述离散型随机变量取值的分散程度计算公式为122)()()()(iiipXExXDXXEXEXD是离散型随机变量,则若离散型随机变量的方差(实例)X = xi1 2 3 4 5 6P(X =xi)=pi1/6 1/6 1/6 1/6 1/6 1/65 . 3616611)(61iiipxXE9167. 261)5 . 36(61)5 . 31 ()()(22612

16、iiipXExXD几种常见的离散型概率分布常见的离散型概率分布超几何分布超几何分布离散型随机变离散型随机变量的概率分布量的概率分布泊松分布泊松分布二项分布二项分布二项试验(贝努里试验)二项分布与贝努里试验有关贝努里试验具有如下属性试验包含了n 个相同的试验每次试验只有两个可能的结果,即“成功”和“失败”出现“成功”的概率 p 对每次试验结果是相同的;“失败”的概率 q 也相同,且 p + q = 1试验是相互独立的试验“成功”或“失败”可以计数二项分布进行 n 次重复试验,出现“成功”的次数的概率分布称为二项分布设X为 n 次重复试验中事件A出现的次数,X 取 x 的概率为)!( !), 2

17、, 1 , 0(xnxnxnCnxqpCxXPxnxxn式中:二项分布显然, 对于PX=x 0, x =1,2,n,有同样有当 n = 1 时,二项分布化简为1)(20qpqpCnxxnxxn1 , 011xqpxXPxxnmxxnxxnmxxnxxnqpCnXmPqpCmXP00二项分布的数学期望和方差二项分布的数学期望为 E ( X ) np方差 D ( X ) npq二项分布(实例)007125. 0)95. 0()05. 0(223223CXP泊松分布用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布泊松分布的例子一个城市在一个月内发生的交通事故次数消费者协

18、会一个星期内收到的消费者投诉次数人寿保险公司每天收到的死亡声明的人数泊松概率分布函数 给定的时间间隔、长度、面积、体积内“成功”的平均数e = 2.71828 x 给定的时间间隔、长度、面积、体积内“成功”的次数), 2 , 1 , 0(!enxxxXP泊松概率分布的期望和方差泊松分布的数学期望为 E ( X ) = 方差为 D ( X ) = 泊松分布(实例)067. 05!e)5 . 2(55 . 25XP泊松分布(作为二项分布的近似)当试验的次数 n 很大,成功的概率 p 很小时,可用泊松分布来近似地计算二项分布的概率,即!exqpCxnxxn连续型随机变量的概率分布连续型随机变量的概率

19、分布指数分布指数分布连续型随机变连续型随机变量的概率分布量的概率分布正态分布正态分布均匀分布均匀分布其他分布其他分布连续型随机变量的概率分布连续型随机变量可以取某一区间或整个实数轴上的任意一个值它取任何一个特定的值的概率都等于0不能列出每一个值及其相应的概率通常研究它取某一区间值的概率用数学函数的形式和分布函数的形式来描述概率密度函数设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件1d)()2(0)() 1 (xxfxf概率密度函数 密度函数 f(x)表示X 的所有取值 x 及其频数f(x)概率密度函数 在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1

20、 x2,P(x1 X x2)是该曲线下从x1 到 x2的面积baxxfbXaPd )()(xab分布函数连续型随机变量的概率也可以用分布函数F(x)来表示分布函数定义为)(d)()()(xxttfxXPxF)()(d)()(aFbFxxfbXaPba分布函数与密度函数的图示密度函数曲线下的面积等于1分布函数是曲线下小于 x0 的面积连续型随机变量的期望和方差连续型随机变量的数学期望为方差为xxxfXEd)()(2d)()()(xxfXExXD均匀分布均匀分布若随机变量X的概率密度函数为称X在区间a ,b上均匀分布数学期望和方差分别为其他01)(bXaabxf12)()(;2)(2abXDbaX

21、Eab1xf(x)ba正态分布正态分布的重要性1.描述连续型随机变量的最重要的分布2.可用于近似离散型随机变量的分布 例如: 二项分布3.经典统计推断的基础概率密度函数xxfx,e21)(2221f(x) = 随机变量 X 的频数 = 总体方差 =3.14159; e = 2.71828x = 随机变量的取值 (- x 0正态曲线的最高点在均值,它也是分布的中位数和众数正态分布是一个分布族,每一特定正态分布通过均值的标准差来区分。 决定曲线的高度,决定曲线的平缓程度,即宽度曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交正态曲线下的总面积等于1随机变量的概率由曲线下的面积给出 和 对正态曲线的影响xCAB正态分布的概率?d)()(baxxfbxaP标准正态分布的重要性一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表标准正态分布函数xxx,e21)(22任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布)1 ,0( NXZxtxttxxde21d)()(2-2标准正态分布XZ标准正态分布表的使用将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表对于负的 x ,可由 (-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论