《概率与概率分布》PPT课件.pptx_第1页
《概率与概率分布》PPT课件.pptx_第2页
《概率与概率分布》PPT课件.pptx_第3页
《概率与概率分布》PPT课件.pptx_第4页
《概率与概率分布》PPT课件.pptx_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,第三节 抽样分布 第二节 随机变量及其概率分布 第一节 事件与概率,第 三 章 概 率 与 概 率 分 布,2,一、事件 、随机试验 、随机事件 、事件的关系和运算 二、 概率 、概率的古典定义 、概率的统计定义 、概率的性质 、概率的运算法则 三、小概率事件实际不可能性原理,第一节 事件与概率,3,现象: 大体上分为两大类 一类是可预言其结果的,即在保持条件不变的情况下,重复试验,其结果总是确定的,必然发生或不发生。 这类现象称为必然现象或确定性现象。,另一类是事前不可预言其结果的,即在保持条件不变的情况下,重复试验,其结果未必相同。 这类试验结果呈现偶然性、不确定性的现象,称为随机现象或不确定性现象。,一、事件,4,、随机试验,试验(trial):根据某一研究目的,在一定条件下对现象所进行的观察。,试验如果满足下述三个特性,则可称为随机试验(random trial),简称试验: 试验可以在相同条件下多次重复进行 每次试验的可能结果不止一个,并且事先可预测有哪些可能的结果 试验结束之前,不能确定该次试验的确切结果,5,、随机事件,随机试验的每一种结果,在一定条件下可能发生,也可能不发生,称为随机事件(random event),简称事件(event),通常用A、B、C 、等来表示。,6!6!6!6! ,3!3!3!3! ,6,基本事件 我们把不能再分的事件称为基本事件(elementary event) 。用小写字母a、b、x、 表示。 复合事件 由若干个基本事件组合而成的事件称为复合事件(compound event)。,结果1:取得一个编号是1样品; 结果2:取得一个编号是2样品; ;,取得一个编号是2的倍数的样品(构成:编号为2、4、6、8、10、12、14、16共8个基本事件组成),7,必然事件 我们把在一定条件下必然会发生的事件称为必然事件(certain event),用表示。 不可能事件 我们把在一定条件下不可能发生的事件称为不可能事件(impossible event),用表示。,8,5、样本空间 一个试验中所有基本事件的集合,也叫全集,用表示。 在掷枚骰子的试验中, =1,2,3,4,5,6 在投掷硬币的试验中, =正面,反面,9,、事件的关系和运算,1、事件的包含 若事件A发生必然导致事件B发生, 则称事件B包含事件A,或事件A包含于事件B,记作或 A B或 B A。,2、事件的并或和 事件A和事件B中至少有一个发生的事件称为事件A与事件B 的并集。它是由事件A和事件B所有的样本点的集合,记为AB或A+B。,10,3、事件的交集 事件A与事件B同时发生的事件称为事件A与事件B的交集。它是由属于事件A也属于事件B的所有公共样本点所组成的集合,记为BA或AB。,4、互斥事件 事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称两个事件是相容的。,11,频率:样本的实际发生率。 设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A的频率为f / n。,概率: 随机事件发生的可能性大小,用大写的P 表示;取值0,1。 概率的定义有: 古典定义 统计定义,二、 概率,12,如果某一随机试验的结果有限,而且各个结果在每次试验中出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数 m 与样本空间中所包含的基本事件个数 n 的比值,记为,、概率的古典定义,13,【例1】在编号为1、2、3、10的十头猪中随机抽取1头,求下列随机事件的概率。 A=“抽得一个编号4”; B=“抽得一个编号是2的倍数”。 解: 该试验样本空间为 =1,2,3,4,5,6,7,8,9,10,即n = 10,事件A包含抽得编号为1,2,3,4这样4个基本事件,则mA = 4,故,事件B包含抽得编号为2,4,6,8,10这样5个基本事件,则mB = 5,故,14,事件A发生的频率: m/n 。 随着n的增大,该频率围绕某一常数p上下摆动,且趋向于稳定,这个频率的稳定值即为事件A的概率,记为,、概率的统计定义,我是神射手! !百发百中!,比如:求某射手中靶的概率,若他射击n发,中靶m发,当n很大时,可用频率m/n作为他中靶概率的估计。,15,1、样本频率总是围绕概率上下波动 (理论值VS实际值) 2、样本含量n越大,波动幅度越小,频率越接近概率。,频率与概率间的关系,16,对于任何事件A,有0P(A)1 必然事件的概率为1,即P()=1 不可能事件的概率为0,即P()=0,、概率的性质,17,1、概率的加法法则 法则一 两个互斥事件之和的概率,等于两个事件概率之和。设A和B为两个互斥事件,则 P ( AB ) = P ( A ) + P ( B ) 事件A1,A2,An两两互斥,则有 P ( A1A2 An) = P ( A1 ) + P (A2 ) + + P (An ) 法则二 对任意两个随机事件A和B,它们并集的概率为两个事件概率的和减去两个事件交集的概率,即 P ( AB ) = P ( A ) + P ( B ) - P ( AB ),、概率的运算法则,18,2、条件概率 在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件B发生条件下事件A发生的条件概率,记为,19,条件概率的图示,20,【例2】施用两种不同药物杀灭螟虫,结果如下表: 现计算以下各概率: 从200只虫中任取一只,这只是死虫的概率 P(A)160/200=0.80,从200只虫中,任取一只,这只接受了甲药物的概率 P(B)=120/200=0.60 接受甲药物且死亡的概率 P(AB)=96/200=0.48 死亡者中,接受甲药物的条件概率 P(B|A)=P(AB)/P(A) =0.48/0.80 =0.60,21,3、概率的乘法公式 用来计算两事件交集的概率 以条件概率为基础 设A、B为两个事件,若P(B)0,则 P(AB)=P(B)P(A|B) 或 P(AB)=P(A)P(B|A),医生,我的病重吗?,你的病很重,十个人中只有一个能救活。但你是幸运的,因为你找到了我,我已经看过九个死于此病的病人了,,22,4、独立事件 一个事件的发生与否并不影响另一个事件发生的概率,则称两个事件独立 若事件A与B独立,则 P(B|A)=P(B) P(A|B)=P(A),此时概率的乘法公式可简化为 P(AB)=P()P(B) 推广到n个独立事件,有 P(A1 A2 An) =P(A1)P(A2) P(An),23,5、贝叶斯定理(Bayes theorem) 贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因 设n个事件A1,A2,An两两互斥,A1+A2+ An= (满足这两个条件的事件组称为一个完备事件组),且P(Ai)0(i=1,2, ,n),则,24,【例3】假定在中年男性人群中,肥胖者占20,标准体重的占50%,低体重的占30。这3类人群中,出现动脉硬化的概率分别为30%,10%和1%。从这个假设的中年男性群体中,随机抽出一人,他恰恰是动脉硬化的患者。问这个人从肥胖组,标准体重和低体重组中抽取的概率各是多少?,25,解: 用B表示抽到动脉硬化患者的事件。 用A1表示抽到肥胖者的事件。 用A2表示抽到标准体重者的事件。 用A3表示抽到低体重者的事件。 则: P(A1)=0.20 P(A2)=0.50 P(A3)=0.30,P(B|A1)=0.30 P(B|A2)=0.10 P(B|A3)=0.01 代入贝叶斯公式得: P(A1|B)=60/113 P(A2|B)=50/113 P(A3|B)=3/113,26,三、小概率事件实际不可能性原理,概率P 0.05(5)或P 0.01(1)的随机事件称为小概率事件。,在统计学上,把小概率事件看成是在一次试验中实际不可能发生的事件,称为小概率事件实际不可能性原理,简称为小概率原理。 小概率事件实际不可能性原理在统计学上是进行假设检验(显著性检验)的基本依据。,27,第二节 随机变量及其概率分布,28,一次试验结果的数值性描述:常用X、Y、Z 表示 根据取值情况的不同分为: 离散型随机变量 连续型随机变量,例如: 每次抛2个硬币,记录正、反面结果;结果可记录为: 正面数就是一个随机变量,取值为:0,1,2。,一、随机变量,29,、离散型随机变量,随机变量X取有限个值,且可以逐个列举 X1, X2 所有取值是不连续的,30,随机变量X取无限个值 取值可以是某一区间内的任意点,、连续型随机变量,31,描述随机变量xi所对应概率P(X=xi)的表格、公式或图形。 离散型随机变量概率分布 连续型随机变量概率分布,二、概率分布(probability distribution),32,、离散型随机变量的概率分布,列出所有可能的离散型随机变量X的取值 列出所有随机变量的概率 通常用下面的表格来表示,P(X=xi)=p(xi)称为离散型随机变量的概率函数 p(xi) 0,33,数学期望 xi与其取相对应的概率p(xi)乘积之和 描述离散型随机变量取值的集中程度 公式:,方差 随机变量X与期望值的离差平方和的数学期望,记为D ( X ) 描述离散型随机变量取值的分散程度 公式 D( X ) = E X E ( X ) 2 若是离散型随机变量,则,1、离散型随机变量的数学期望和方差,34,【例4】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。计算数学期望和方差。,解: 数学期望为:,方差为:,35,2、几种常见的离散型随机变量的概率分布,36,二项分布与贝努里试验有关,具有如下属性: 试验包含了n 个相同的试验 每次试验只有两个可能结果:“成功”和“失败”,每次试验出现“成功”的概率p是相同的;“失败”的概率 q 也相同,且 p + q = 1 试验是相互独立的 试验“成功”或“失败”可以计数,、二项分布(贝努里试验),37,设随机变量X所有可取的值为零和正整数:0,1,2,,n,那么: 其中p0,q0,p + q = 1,则称随机变量 X 服从参数为 n 和 p 的二项分布 ( binomial distribution ),记为 x B ( n, p ) 。,“成功”次数的概率分布二项分布,38,显然, 对于P X=k 0, k =1, 2, , n,有 数学期望: E ( X ) np 方 差: D ( X ) npq,二项分布的性质,39,二项分布的正态近似,二项分布由n和p两个参数决定: 当p值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称 当p值趋于0.5 时,分布趋于对称 在n较大,p和q较接近时 ,二项分布接近于正态分布; 当n时,二项分布的极限是正态分布。,40,【例5】纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为31。计算产仔10头,有7头白猪的概率。 解: n = 10 p = 34 =0.75 q = 14 =0.25,设10头仔猪中白色的为X头,则X为服从二项分布B(10, 0.75)的随机变量。于是窝产10头仔猪中有7头是白色的概率为:,二项分布的概率计算,41,只具有互相对立的2种结果:阳性-阴性,生存-死亡等,属于二项分类资料; 已知某一结果的概率为p,其对立结果的概率则为 1- p 。p 是从大量观察中获得的比较稳定的理论数值;,观察结果互相独立,即每个观察单位的结果不会影响到其它观察单位的观察结果。,二项分布的应用条件,42,用来描述和分析随机发生在单位空间(时间)里的稀有事件的概率分布,记为x P ( )。 例如: 放射性物质在单位时间内的放射次数; 在单位容积充分摇匀的水中的细菌数; 野外单位空间中的某种昆虫数等。,泊松概率分布函数: 常数 e = 2.71828 k 时间间隔、长度、面积、体积内“成功”的次数,、泊松分布( Poissons distribution ),43,数学期望:E ( X ) = 方 差:D ( X ) = 泊松分布的均数与方差相等,即 =2 = 。,是泊松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称。 当 = 20时分布接近于正态分布; 当 =50时,可以认为泊松分布呈正态分布。 在实际工作中,当 20时就可用正态分布来近似地处理。,泊松分布的性质,二项分布的特殊形式,44,【例7】调查某种猪场闭锁育种群仔猪畸形数,共记录200窝,畸形仔猪数的分布情况如下表所示。试判断畸形仔猪数是否服从泊松分布。,样本平均数: 方差:,45,【例8】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下: (1) 试分析饮用水中细菌数的分布是否服从泊松分布。(2) 若服从,计算每毫升水中细菌数的概率及理论次数,并将频率分布与泊松分布作直观比较。,样本平均数: 方 差:,泊松分布的概率计算,可见细菌数的频率分布与=0.5的泊松分布相当吻合。,46,二项分布的应用条件也是泊松分布的应用条件。 例外: 一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合泊松分布的应用条件。,对于在单位时间、单位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈泊松分布。,泊松分布的应用条件,47,连续型随机变量可以取某一区间或整个实数轴上的任意一个值 它取任何一个特定的值的概率都等于0 通常研究它取某一区间值的概率 用数学函数的形式和分布函数的形式来描述,、连续型随机变量的概率分布,48,一般将连续型随机变量整理成频数表,对频数作直方图,直方图的每个矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。 如果样本量很大,组段很多,矩形顶端组成的阶梯型曲线可变成光滑的分布曲线。 大多数情况下,可采用一个函数拟合这一光滑曲线。这种函数称为概率密度函数。,1、概率密度函数,49,设X为连续型随机变量,x为任意实数,X的概率密度函数记为f(x),它满足条件: f(x)不是概率。,密度函数 f(x)表示X= x 的频数。,50,概率是曲线下的面积,P(x1 X x2)是曲线f(x)下从x1 到 x2的面积。,51,连续型随机变量的概率也可以用分布函数F(x)来表示。 分布函数定义为 P( aX b )可以写为,分布函数与密度函数的区别: 密度函数曲线下的面积等于1 分布函数是曲线下小于 x0 的面积,2、分布函数,52,数学期望为 方差为,3、连续型随机变量的数学期望和方差,53,4、几种常见的连续型随机变量的概率分布,54,、正态分布(normal distribution),记为x N (, 2), 重要性 描述连续型随机变量的最重要的分布 可用于近似的离散型数据分布 例如: 二项分布 经典统计推断的基础,55, 概率密度函数 f(x) = 随机变量 X 的频数 = 总体方差 =3.14159 e = 2.71828 x = 随机变量的取值 (- x ) = 总体均值, 概率分布函数,56, 正态分布函数的性质 f (x)0 正态曲线的最高点在均值,它也是分布的中位数和众数 正态分布是一个分布族,通过均值和标准差来区分。决定曲线的高度,决定曲线的平缓程度,曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交 正态曲线下的总面积等于1 随机变量的概率是曲线下的面积,是变异度参数。 不变,越大,数据越分散,曲线越平坦;越小,数据越集中,曲线越陡峭。,57, 和 对正态曲线的影响,是位置参数。 不变,越大,则曲线沿横轴越向右移动;反之,越小,曲线沿横轴越向左移动。,正态分布由参数和确定,58,标准正态分布的重要性 一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的 若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,、标准正态分布,59,标准正态分布函数 任何一个一般的正态分布,可通过右面的线性变换转化为标准正态分布 标准正态分布的概率密度函数 标准正态分布的分布函数,u称为标准正态变量或标准正态离差(standard normal deviate),60,从几何意义上说,此变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布具有平均数为=0,标准差=1。这种变换称为标准化正态变换。因此将这种具有平均数为=0,标准差=1的正态分布称为标准正态分布,记为N(0,1)。,61,例如: P (5 X 6.2),62,例如: P(2.9 X 7.1),一般正态分布,63,、正态分布的概率计算,概率是曲线下的面积 !,64,正态分布的随机变量所对应的概率,65,将一个一般的转换为标准正态分布 计算概率时 ,查标准正态概率分布表 对于负的 x ,可由 (-x) x得到 对于标准正态分布,即XN(0,1),有 P (a X b) b a P (|X| a) 2 a 1 对于一般正态分布,即XN( , ),有, 标准正态分布表的使用,66,u值列在第1列和第1行: 第1列表示u的整数和第1位小数 第1行为第2位小数 例如 u=1.75(1.75)=0.9599,67,【例9】设XN(0,1),求以下概率: P(X 2) P(-1X 3),解: P(X 2) =1- P(2 X) =1-0.9973 =0.0227 P(-1X 3)=P(X 3)-P(X -1) = (3)- (-1) = (3) 1-(1) =0.9987-(1-0.8413) =0.8354, 标准正态分布的概率计算,68,【例10】设XN(5,32),求以下概率 P(X 10) P(2X 10), 一般正态分布的概率计算,解:,69,第三节 抽样分布 sampling distribution,研究样本的各种统计量的概率分布,即所谓抽样分布 是一种理论概率分布 随机变量是样本统计量:样本平均数,样本方差等 结果来自容量相同的所有可能样本,70,统计推断的过程,71,总体分布,一、样本均值的抽样分布,均值和方差,【例】设一个总体,含有4个元素(个体),即总体单位数N = 4。4个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下:,72,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表:,73,计算出各样本的均值,如下表。并给出样本均值的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论