05 概率统计基础知识(企业).ppt_第1页
05 概率统计基础知识(企业).ppt_第2页
05 概率统计基础知识(企业).ppt_第3页
05 概率统计基础知识(企业).ppt_第4页
05 概率统计基础知识(企业).ppt_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率统计基础知识,2020年8月5日12时36分,1,第一节 概率基础知识,一、事件与概率 (一)随机现象 1、定义:在一定条件下,并不总是出现相同结果的现象称为随机现象。 2、随机现象的特点: (1)随机现象的结果至少有两个; (2)至于哪一个出现,事先人们并不知道。,2020年8月5日12时36分,2,第一节 概率基础知识,3、样本点(抽样单元):随机现象中的每一个可能结果,称为一个样本点,又称为抽样单元。 4、样本空间:随机现象一切可能样本点的全体称为这个随机现象的样本空间,常记为。 认识一个随机现象首要的就是能罗列出它的一切可能发生的基本结果。,2020年8月5日12时36分,3,第一

2、节 概率基础知识,例11-1 一天内进某超市的顾客数: =0,1,2, 一顾客在超市购买的商品数: =0,1,2, 一顾客在超市排队等候付款的时间: =t:t 0 一颗麦穗上长着的麦粒个数: =0,1,2, 新产品在未来市场的占有率: =0,1 一台电视机从开始使用到发生第一次故障的时间: =t:t 0 加工机构轴的直径尺寸: = 一罐午餐肉的重量: = Gg ,2020年8月5日12时36分,4,第一节 概率基础知识,(二)随机事件 定义:随机现象的某些样本点组成的集合称为随机事件,简称事件,常用大写字母A、B、C等表示。,2020年8月5日12时36分,5,第一节 概率基础知识,1、随机事

3、件的特征 任一事件A是相应样本空间中的一个子集; 事件A发生当且仅当A中某一样本点发生; 事件A的表示可用集合,也可用语言,但所用的语言应是明确无误的; 任一样本空间都有一个最大子集,这个最大子集就是,它对应的事件就是必然事件,仍用表示; 任一样本空间都有一个最小子集,这个最小子集就是空集,它对应的事件称为不可能事件,记为。,2020年8月5日12时36分,6,第一节 概率基础知识,2、事件之间的关系 (1)包含:若事件A发生必然导致事件B发生,则事件B包含事件A,记为B A或 AB。,2020年8月5日12时36分,7,B,A 4,2 6,第一节 概率基础知识,2020年8月5日12时36分

4、,8,(3)相等:“若事件A包含事件B,事件B也包含事件A,则称事件A和B相等”。 看一个例子:掷骰子:=1,2,3,4,5,6,设事件A =“等于小于4的数”=1,2,3,4,事件B =“偶数”=2,4,6,显然A与B有相同的样本点2,4,但事件A与B 并不相等。可定义为“若事件A与B有完全相同的样本点,则称事件A与B 相等”。,B 6,A 1 4 3 2,5,第一节 概率基础知识,(2)互不相容 (互斥):若事件A与B不能同时发生,即AB = ,则称事件A与B互不相容。 两个事件间的互不相容性可推广到三个或更多个事件间的互不相容。 基本事件都是互不相容事件。,2020年8月5日12时36分

5、,9,A,B,第一节 概率基础知识,(三)事件的运算 (1)对立事件(又称为互逆事件或逆事件):若事件A+B=,AB=,则称A与B为互逆事件(对立事件)。一般将A的逆事件记为 (读非A)。,2020年8月5日12时36分,10,A,第一节 概率基础知识,(2)事件A与B的并(又称为和事件):事件A与事件B至少有一个发生的事件称为事件A与事件B的和事件,记为AB或A+B。,2020年8月5日12时36分,11,A,B,第一节 概率基础知识,(3)事件A与B的交(又称为积事件):事件A与事件B都发生的事件称为事件A与事件B的积事件,记为AB,简记为AB。,2020年8月5日12时36分,12,A,

6、B,第一节 概率基础知识,(4)事件A对B的差:事件A发生而事件B不发生的事件称为事件A与B的差事件,记为AB。,2020年8月5日12时36分,13,A,B,A,B,第一节 概率基础知识,2020年8月5日12时36分,14,第一节 概率基础知识,(四)概率 事件发生可能性大小的度量 一个随机事件A发生可能性的大小用这个事件的概率P(A)来表示。概率是一个介于0到1之间的数。概率越大,事件发生的可能性就愈大;概率愈小,事件发生的可能性也就愈小。 特别地,不可能事件的概率为0,必然事件的概率为1。即: P() = 0 , P() = 1,2020年8月5日12时36分,15,第一节 概率基础知

7、识,二、概率的古典定义与统计定义 (二)统计方法 用概率的统计定义确定概率方法的要点如下: (1)此随机现象是能大量重复试验的; (2) (3)频率 会随重复试验次数增加而趋于稳定。,2020年8月5日12时36分,16,第一节 概率基础知识,频率定义:如果在相同条件下,对同一试验重复进行n次,若事件A出现了kn次,那么我们称比值kn / n为事件A出现的频率。 (统计)概率定义:当试验的次数n逐渐增加时,频率kn /n的变化幅度也就逐渐减小,而且随着试验次数n愈来愈大, kn /n这一数值就逐渐稳定于某一常数,所稳定到的这一常数叫做理论频率。我们把这个理论频率称为在已知条件下事件A出现的概率

8、,并记为P(A)。亦称之为统计概率,且有,2020年8月5日12时36分,17,第一节 概率基础知识,如果某个随机试验,只有有限个事件A1,A2,A n可能发生,且A1,A2,A n具有下面三条性质: (1)A1,A2,A n发生的可能性相等(等可能性); (2)在任意一次试验中A1,A2,A n至少有一个发生(完备性); (3)在任意一次试验中A1,A2,A n至多有一个发生(互不相容性)。 则称事件组A1,A2,A n为等可能基本事件组。其中任一事件A i(i = 1,2,3,n),称为基本事件。具有上述特性的问题称为古典概型或等可能概型。,2020年8月5日12时36分,18,第一节 概

9、率基础知识,(一)古典定义 用概率的古典定义确定概率方法的要点如下: (1)所涉及的随机现象只有有限个样本点,设共有 n 个样本点; (2)每个样本点出现的可能性是相同的(等可能性); (3)若被考察的事件A含有 k 个样本点,则事件A的概率定义为:,2020年8月5日12时36分,19,第一节 概率基础知识,2、古典概型的计算 试验E的全体基本结果E1,E2,En构成互不相容的完备组。由于等可能性的假定, Ei(i = 1,2,3,n)每一个基本结果的概率为1/n。对于任一事件A,它总是由某些基本结果组成,设A包含k个基本结果,则由概率的性质可以证明:,2020年8月5日12时36分,20,

10、第一节 概率基础知识,排 序 放 回 不排序 “摸球”试验 不放回 排 序 不排序 附:排列、组合计算公式,2020年8月5日12时36分,21,第一节 概率基础知识,排列与组合是两类计数公式,它们的获得都基于如下两条计数原理。 (1)乘法原理: 甲城 乙城 丙城 (2)加法原理: 汽车5个班次 火车3个班次 飞机2个班次 甲城 乙城,2020年8月5日12时36分,22,第一节 概率基础知识,对有放回且排序的排列问题,其计算公式为 n = t r 其中,t 随机事件的可能结果数 r 随机试验的次数 如果我们把“摸球”改成“抛硬币”,有正反两种结果,抛一次有“正面”或“反面”两种结果,抛两次,

11、抛三次,其随机试验的样本空间的样本点数与上题完全一样。,2020年8月5日12时36分,23,第一节 概率基础知识,三、概率的性质及其运算法则 (一)概率的基本性质及加法法则 性质1、概率是非负的,且数值介于0与1之间, 0 P(A) 1,特别,P() = 0, P() = 1 性质2、 或 性质3、若A B,则: 性质4、 性质5、A1, An是互不相容的事件,则,2020年8月5日12时36分,24,第一节 概率基础知识,(二)条件概率、概率的乘法法则及事件的独立性 (1) 条件概率与概率的乘法法则 条件概率要涉及两个事件A与B,在事件B已发生的条件下,事件A再发生的概率称为条件概率,记为

12、P(A | B)。 条件概率的计算公式为:,2020年8月5日12时36分,25,第一节 概率基础知识,性质6:(乘法法则)对任意两个随机事件A与B,有 P(AB)= P(B) P(A|B) P(B) 0 = P(A) P(B|A) P(A) 0 例1.1-10 例1.1-11,2020年8月5日12时36分,26,第一节 概率基础知识,(2)独立性与独立事件的概率 设有两个事件A与B,假如其中一个事件的发生不依赖另一个事件发生与否,则称事件A与B相互独立。 性质7:假如两个事件A与B相互独立,则A与B同时发生的概率为 性质8:假如两个事件A与B相互独立,则在事件B发生的条件下,事件A发生的条

13、件概率P(A|B)等于事件A的(无条件)概率P(A)。,2020年8月5日12时36分,27,第二节 随机变量及其分布,一、随机变量 1、定义:用来表示随机现象结果的变量称为随机变量。常用大写字母X、Y、Z等表示随机变量,而随机变量的值用小写字母 x、y、z表示 。 2、分类:随机变量 离散型随机变量 连续型随机变量,2020年8月5日12时36分,28,第二节 随机变量及其分布,例1 一天内进某超市的顾客数: =0,1,2, 一顾客在超市购买的商品数: =0,1,2, 一顾客在超市排队等候付款的时间: =t:t 0 一颗麦穗上长着的麦粒个数: =0,1,2, 新产品在未来市场的占有率: =0

14、,1 一台电视机从开始使用到发生第一次故障的时间: =t:t 0 加工机构轴的直径尺寸: = 一罐午餐肉的重量: = Gg ,2020年8月5日12时36分,29,第二节 随机变量及其分布,二、随机变量的分布 随机变量的取值是随机的,但其内在还是有规律性的,这个规律可以用分布来描述。认识一个随机变量X的关键就是要知道它的分布。分布包含如下两方面的内容: 1)X可能取哪些值,或在哪个区间上取值。 2)X取这些值的概率各是多少,或X在任一小区间上取值的概率是多少?,2020年8月5日12时36分,30,第二节 随机变量及其分布,(一)离散型随机变量的分布 离散型随机变量的分布可用分布列表示,或用一

15、个简明的数学式子表示出来。 图表法(分布列): 公式法:P(X=xi)=pi i= 1,2,n 要使其成为一个分布,应满足下列条件: 1) pi0 , 非负性 2)p1 + p2 + pn =1 正则性,2020年8月5日12时36分,31,第二节 随机变量及其分布,(二)连续型随机变量 连续型随机变量的分布可用概率密度函数p(x)表示,许多书上也用f (x)表示。 连续型随机变量还可用概率分布函数F(x)表示。 概率密度函数 f (x) 概率分布函数F(x),2020年8月5日12时36分,32,第二节 随机变量及其分布,三、随机变量分布的均值、方差与标准差 随机变量X的分布(概率函数或密度

16、函数)有几个很重要的特征数,用来表示分布的集中位置(中心位置)和散布大小。 两个最重要的特征数: 1)均值:表示分布的中心位置,E(x) 2)方差:表示分布的散布大小,Var(x),2020年8月5日12时36分,33,第二节 随机变量及其分布,1、均值的计算公式 2、方差的计算公式 3、标准差的计算公式,2020年8月5日12时36分,34,第二节 随机变量及其分布,均值与方差的运算性质: (1)设X为随机变量,a与b为任意常数,则有: E(aX+b) = aE(X) + b Var (aX+b) = a2Var(X) (2)对任意两个随机变量X 1与X 2,有: E(X1 + X2) =

17、E( X1 ) + E( X2 ) (3)设随机变量X 1与X 2独立,则有: Var(X1 X2) = Var( X1 ) +Var ( X2 ),2020年8月5日12时36分,35,第二节 随机变量及其分布,四、常用分布 (一)常用离散型分布 常用离散型随机变量的分布有:单点分布(退化分布)、两点分布(0-1分布)、几何分布、二项分布、泊松分布、超几何分布等,书上介绍了后三种。我们将补充介绍两点分布,一共介绍四种分布。,2020年8月5日12时36分,36,第二节 随机变量及其分布,1、二项分布 1)重复进行 n 次试验; 2) n 次试验间相互独立; 3)每次试验仅有两个可能结果; 4

18、)成功的概率为p,失败的概率为1-p 在上述四个条件下,设x表示n次独立重复试验中成功出现的次数,则有 这个分布称为二项分布,记为b(n,p)。 其均值、标准差为:E(x)=np Var(x)= np (1-p),2020年8月5日12时36分,37,第二节 随机变量及其分布,2、泊松分布 泊松分布可用来描述不少随机变量的概率分布。 这个分布就称为泊松分布,记为P()。其均值、方差、标准差为: E(x) = Var(x)= (x) =,2020年8月5日12时36分,38,第二节 随机变量及其分布,3、超几何分布 其中,r = min(n,M),这个分布 称为超几何分布,记为h(n,N,M)。

19、 其均值、方差为:,2020年8月5日12时36分,39,第二节 随机变量及其分布,常用离散型随机变量分布汇总,2020年8月5日12时36分,40,第二节 随机变量及其分布,(二)正态分布 1、正态分布的概率密度函数 它的图形是对称的钟形曲线,常称为正态曲线。正态分布有两个参数和,常记为N( ,2 )。,2020年8月5日12时36分,41,第二节 随机变量及其分布,2、标准正态分布 = 0且= 1的分布称为标准正态分布,记为N(0,1),其随机变量记为U。 1)标准正态分布表 P( Ua ) = P(U a ) = 1-(a) ( - a) = 1-(a) P(a U b) = (b) -

20、(a) P( |U|a ) = P( -a U a) = (a) -(-a) = 2 (a) -1,2020年8月5日12时36分,42,第二节 随机变量及其分布,3、标准正态分布的分位数 分位数是一个基本概念,结合标准正态分布N(0,1)来叙述分位数概念。 一般说来,对任意介于0与1之间的实数,标准正态分布N(0,1)的分位数是这样一个数,它的左侧面积恰好为,它的右侧面积恰好为1-,用概率的语言来说, 分位数是满足下列等式的实数: P( U u ) = ,2020年8月5日12时36分,43,第二节 随机变量及其分布,关于分位数的正负符号问题: 0.5分位数, 即50%分位数,也称为中位数。

21、在标准正态分布场合: u 0.5 = 0 当 0.5时, u 0 ( 正数) 或1 - 永远为正(概率必为正) u 与 - u 对应(下标相同,加负号) u 与 u1 - 对应(下标不同,不加负号),2020年8月5日12时36分,44,第二节 随机变量及其分布,4、有关正态分布的计算 正态分布计算是基于下面的重要性质: 性质1: 性质2:设 X N(,2),则对任意实数 a、b有: ,2020年8月5日12时36分,45,第二节 随机变量及其分布,产品质量特性的不合格品率的计算 1、质量特性 X 的分布,在受控的情况下,常为正态分布; 2、产品的规范限,常包括上规范限TU和下规范限TL 。

22、产品质量特性的不合格品率为: p = pL + pU,2020年8月5日12时36分,46,第二节 随机变量及其分布,(三)其他连续分布 1、均匀分布 其均值、方差为:,2020年8月5日12时36分,47,第二节 随机变量及其分布,2、对数正态分布 1)在正半轴(0,)上取值; 2)“右偏分布” 3)X 服从对数正态分布( “右偏分布”),而经过对数变换 Y = lnX后服从正态分布。,2020年8月5日12时36分,48,第二节 随机变量及其分布,4) 5),2020年8月5日12时36分,49,第二节 随机变量及其分布,3、指数分布 其均值、方差为: E(X)= 1/ Var(X)= 1

23、/2,2020年8月5日12时36分,50,第二节 随机变量及其分布,常用连续型随机变量汇总,2020年8月5日12时36分,51,第二节 随机变量及其分布,五、中心极限定理 中心极限定理:设X1,X2,X n为相互独立同分布的随机变量,均值、2都存在,则在 n 较大时,样本均值 的分布总是近似服从正态分布,2020年8月5日12时36分,52,第三节 统计基础知识,一、总体、个体与样本 总体:研究、考察对象的全体称为总体。 个体:构成总体的每个成员,称为个体。 样本:从总体中抽取的部份个体组成一个样本。 样本量:样本中所包含的个体数目,称为样本量。,2020年8月5日12时36分,53,第三

24、节 统计基础知识,直方图:为研究数据变化规律而对数据进行加工整理的一种基本方法。 1)计算 R = xmax xmin 2)决定分组数 k 及组距 h 3)确定组限:即每个区间的端点及组中值 4)计算落在每组的数据的频数及频率 5)作频数频率直方图 频率(概率)密度图 6)作累积频数和累积频率直方图概率分布函数图,2020年8月5日12时36分,54,第三节 统计基础知识,二、随机样本 随机样本:满足下面两个条件的样本称为简单随机样本,简称随机样本。 (1)随机性:总体中每个个体都有相同的机会入样。 (2)独立性:从总体中抽取的每个个体对其他个体的抽取无任何影响。,2020年8月5日12时36

25、分,55,第三节 统计基础知识,三、统计量与抽样分布 (一)统计量的概念 统计量:不含未知参数的函数称为统计量。 抽样分布:统计量的分布称为抽样分布。 常用统计量:常用统计量分两类:一类用来描述样本的中心位置;另一类用来描述样本的分散程度。 有序样本:将从总体中抽取的一个样本量为n 的样本: 按从小到大的顺序排列而成的,2020年8月5日12时36分,56,第三节 统计基础知识,数据集中位置的度量 1、样本均值 2、样本中位数 3、样本众数不是常用统计量 数据分散程度的度量 1、样本极差 2、样本方差 3、样本标准差 4、样本变异系数,2020年8月5日12时36分,57,第三节 统计基础知识

26、,(二)样本均值的分布,2020年8月5日12时36分,58,第三节 统计基础知识,三、有关正态总体的几个重要的抽样分布 (一)方差未知时,正态均值 的分布 t 分布 (二)正态样本方差的分布 2分布 (三)两个独立的正态样本方差之比的分 布 F 分布,2020年8月5日12时36分,59,第四节 参数估计,参数估计有两种基本形式: 一、点估计 (一)点估计的概念 (二)点估计优良性标准 (三)求点估计的方法矩法估计 (四)对几种分布参数矩法估计的例 (五)正态总体参数的估计,2020年8月5日12时36分,60,第四节 参数估计,二、区间估计 (一)区间估计的概念 点估计仅给出参数一个具体的估计值,而区间估计体现了估计的精度。 (二)正态总体参数的置信区间 (1)总体均值的置信区间的求法: 当总体标准差已知时正态分布 当总体标准差未知时 t 分布 (2)总体方差2与标准差的置信区间的求法:,2020年8月5日12时36分,61,第四节 参数估计,(三)比例 p 的置

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论