




已阅读5页,还剩35页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章概率和概率分布,本章主要讨论了概率的种类、基本计算、概率分布的种类、常用离散概率变量概率分布和连续概率变量概率分布,并为下一章的统计推断奠定了基础。同时,本章主要从应用的角度研究概率和概率分布,而不是研究一些不参与概率的法则的数学推导。10.1概率的概念和类型,10.2概率运算法则,10.4离散概率变量概率分布,10.3概率分布的类型,10.5连续概率变量概率分布,湖南商学院信息系共舒明,2,10.1概率的概念和类型,10.1.1概率的概念概率简单地说,任意事件在特定情况下发生的稳定频率随机事件可能是一次观察或实验组中每次出现的结果,也可能是偶然、不确定或不确定事件的那种现象。而且,随机事件的值的名称称为随机变量。概率是衡量任意事件中发生某种结果的可能性的相对指标。将A设置为随机事件的结果,P(A)表示A结果发生的概率,m表示A结果发生的概率,n表示随机,3,事件中所有结果的数量,概率是0和1之间的比率,以可用系数或百分比表示。如果事件不能发生,则概率为零。事件必须发生时的概率为l。10.1.2概率的计算方法概率可以根据计算方法分为经典概率、测试概率和主观概率。1.经典概率是通过演绎法或外推法知道随机事件中可能发生的各种结果和发生次数,无需任何统计实验即可计算各种可能发生的结果的概率。4、经典概率的基本特征是(1)知性,可以通过演绎或外延方法知道随机事件的所有可能结果和发生次数;(2)没有实验,也就是说,不做统计测试,就可以计算各种结果可能发生的概率。(3)准确度,即用经典概率方法计算的概率没有误差。2.考试概率。根据迭代统计测试结果计算随机事件中可能发生的各种结果的计算概率的基本特征是:(1)试验结果,即,为了计算各种结果,必须通过统计测试结果的频率,即,尝试频率。5,(2)很多重复性,即考试次数必须足够大,重复多个实验的条件和程序必须相同;(3)误差,即频率只是概率的估计值,因此存在误差。因此,概率是全局确定的频率值,如果研究对象是整个单位,那么频率就是概率。如果研究对象是总单位(样品),则频率只是概率的估计值。尝试次数或抽样次数持续增加时的频率近似概率。3.主观概率。主观概率是个人对任意事件的认识,主观决定任意事件可能发生的各种结果的概率。主观概率是人们对某一事件a表现出多大信任的主观评价。即:P(A)= a的信贷价值,6,4。概率的公理。20世纪30年代,苏联数学家科尔莫库洛夫提出了概率论的三个公理,为概率论理论的研究奠定了坚实的基础。这三个公理可以推导出概率运算的基本规律,推导出概率论的整个体系。概率的三个公理是公理1:事件A发生的概率P(A)是实数,0P(A)1。如果公理2: s是所有事件的集合,则P(S)=1。公理3: A1,A2,如果存在每个互斥事件,则p (a1 a2.)=p (a1) 10 p (a2) ,7,10.2概率计算定律,概率计算定律主要被称为加法定理和乘法定理。10.2.1加定理1。加法的特殊定理。如果事件(a、b、c)之间相互排斥(即,可能发生的各种结果不能重叠),则各种事件的概率总和等于相应单独概率的总和。P(A B C)=P(A) P(B) P(C)2。补偿整理。事件之间互斥,但在出现事件A时未出现其它事件(历史记录),则A,相互事件,其概率之和为:8,P(A)=P(A)P()=1:P(A)=1-P关于加法有一个一般定理。也称为广义概率加法公式。如果重叠复合事件(产品事件)发生k和心跳(心脏k)事件,例如事件a和事件b不是互斥的,从标准卡集中随机抽取l张,则属于复合事件,这种情况发生的概率称为a和b的组合概率。加法的一般定理是p (a b) p (a) p (b)-p (ab),9,10.2.2乘法定理1。是乘法的特殊定理。如果一个事件的发生不影响另一个事件的发生,则此事件称为独立事件。当两个事件分开时,a出现次数不会影响b出现的概率,b出现次数也不会影响a出现的概率。此时,事件a和事件b同时发生的概率为p (ab)=p (a) p (b) 2。乘法的一般定理。乘法的一般定理的应用是有条件的。也就是说,事件之间不独立,也不重复采样。将A,B设置为两个事件,B在已知发生A的条件下发生的概率称为B在A的条件概率,用P(B/A)表示。此时,a,b两个事件发生的概率为p (ab)=p (a) p (b/a),10,3。全概率定理。整体概率定理的前提条件是事件A1、A2、An是完整的事件组(即,准备任何事件可能产生的各种结果)。另外,A1、A2、An两个互斥事件b: 11,10.2.3贝叶斯定理,也称为贝叶斯定理,是18世纪40年代英国数学家t贝叶斯计算决策中非常有用的定理和条件概率的公式。也就是说,如果事件A1、A2、An是完整的事件组,则事件的:12,10.3概率分布类型、10.3.1概率分布的概念概率分布是由随机变量所有可能值(Xi)及其概率P(xi)组成的分布序列,反映随机变量的分布状态和特性。概率分布有两个特性。(1)0p(Xi)1(2)p(Xi)=1概率分布是表行方法、函数方法和图标方法的三种表示。13,10.3.2概率分布类型取决于概率变量的特性,概率分布类型为:1。质量概率变量概率分布。分布序列,由基于质量的随机变量的所有可能结果(Xi)和相应的概率P(xi)组成。2.定量随机变量的概率分布。分布序列,由基于数量的随机变量的值(Xi)和相应的概率P(xi)组成。例如,10.13的骰子点数是数值随机变量,因此骰子点的概率分布属于数量概率分布。14,(1)离散随机变量概率分布。由离散随机变量的值Xi及其概率P(xi)组成的分布序列。离散概率密度函数为1.0p(Xi)12。p(Xi)=1(2)具有连续随机变量概率分布的两个性质。由连续随机变量(x)的值间距及其概率组成的分布序列,因为连续随机变量的值是区间。因此,x获取特定线段值的概率必须以面积表示。根据概率分布的两个要求,如果x的总值范围在a和b之间,即oxb,则连续概率变量概率密度函数为:15,概率密度曲线在x轴上,即非负:f(x)8805;零概念密度曲线下的面积(积分)为1,即16,10.3.3概率分布的特征值概率分布也称为概率模型或理论分布。概率分布又是完全分布,因为概率分布是由概率变量的所有可能值及其概率组成的分布数列。概率分布的特征值可以使用总体分布的符号。概率分布的重要特征值包括期望值或总体平均、方差、偏移系数、峰值系数等。下面分别介绍了各种常用概率分布的特征值。,17,10.4离散随机变量概率分布,10.4.1离散平衡分布离散概率分布定义为具有以下概率函数的离散随机变量分布:其中n是正整数,是此分布的总体参数。平均分布的两个重要特征值分别为,(x=1,2,N),18,这两个特征决定了相同分布的总体参数N,也决定了该分布的两个特征值。10.4.2分分布也称为两点分布,如果相互独立的重复实验是成功和失败的结果,则称为贝努利测试,这是可取的。投掷硬币、产品质量(合形和缺陷)检查、孕妇未出生婴儿的性别判断等都属于贝努伊实验。贝努利实验的特点如下。1.实验现象只有两个互斥的结果:“成功”和“失败”。2.成功事件发生的概率为p,失败的概率为q,p q=1。贝用独立的实验努力地做了实验。两点分布的概率函数可以表示为:x=1,20,两点分布的重要特征值为1。预估e (x)=p2。方差V(x)=pq其中p是总体参数,当确定两点分布的总体参数p时,也确定了该分布的估计和方差。两点分布图只有两点,所以概率函数为x=0,1,2,n,n=1的特殊情况,两点分布也称为点2分布。21,10 . 4 . 3 hypergeometric distribution hypergeometric distribution基于supergeometric experization,对于独立的非重复测试,整个n的“成功”类为k,失败类为n-k,整体为n1.从包含n个实体的一个群体中随机抽取n,不重复地用作样品2。在整个n中,成功类为k,失败类为n-k。3.从示例中成功的类中提取的人是x,从失败的类中提取的人是n-x。4.由于尝试(采样)不会重复,因此每次尝试成功的概率受以前测试结果的影响,因此成功的概率不能保持不变。23,超几何分布定义如下:如果离散随机变量的分布具有以下概率函数,则称为超几何分布:其中n,k,n都是正整数,是此分布的三个参数,是NKn或n-k n。超几何分布的两个重要特征值为:预期:分布:24。此处称为有限整体正系数,这在使用非迭代随机采样时考虑,因此也称为非迭代采样的正系数。10.4.4二项式分布二项式分布是基于n次贝努利实验(二项式实验)迭代的重要离散概率分布。两个实验的性质如下。1.重复n次简单的伯努利实验。总共n个可能的结果:x=0,1,2,n. 2 .每个实验的结果只有成功或失败的互斥结果。每个测试的兴趣是概率p保持不变。每个实验都担心是否出现成功事件。25,二项式分布被定义为二项式分布,如果离散随机变量分布具有以下概率函数:表达式的q=1-p,0p1;n是正整数。n和p是二项式分布的两个重要参数。二项式分布的重要特征值为:26,偏系数:峰值系数:二项式分布已知为:(1) p=1/2,=0,二项式分布为对称分布。(2) p 0时,两个项目的分布在右侧。(3) p 1/2时, 1/6,3,两个分布的宽度较低。(3) pq 3时,两个分布具有较高的夹峰。,28,10.4.5泊松分布泊松分布也是重要离散随机变量的概率分布,适合描述某些罕见事件的状态或机会极小的一些事件,如洪水、火山爆发、民机坠毁、反应堆逃逸事件等,普亚顺在1837年提出。如果将随机变量x设置为表示特定时间或特定区域内特定事件发生的次数,即实验的“成功”次数,则泊松实验为1。特定时间或特定区域内发生的成功次数x的预期E(x)=已知或E(x)=np已知。2.特定事件在特定时间或特定区域内发生的概率相同,与时间或区域的开始时间无关。29,3。在非常短的时间或非常小的区域内,特定事件发生一次或多次的概率相当小。4.特定事件在一段时间内或在特定区域内相互独立。5.特定事件成功次数的估计与选定时间或区域的大小t成正比,其关系。泊松的分布定义为离散随机变量x的分布,如果具有以下概率函数,则为30,泊松的分布:其中是此分布的参数,e=2.71828。该分布的重要特征值为估计值:E(x)=方差:V(x)=偏移系数:峰值系数:估计值和方差都是浦和松川的大特性。时,福娃松分布在具有高窄峰的右侧部分分布;随着增加而倾斜到0时,超高随着的增加而逐渐减小,对称分布。增加,达到3时,高偏峰状态随着增加而逐渐减慢,最终成为正常峰。31,10.5连续随机变量的概率分布,也称为正态或高斯分布,10.5.1正态分布正态分布是非常重要的连续随机变量的概率分布。如果连续随机变量x的分布是概率密度函数,则称为正态分布。此分布的参数和。(为总体平均值,为总体标准差),e=2.71828,=3.1416。32,正态分布的重要特征值为:(1)估计值:E(x)=和=Me=M0(2)方差:(3)偏移系数:(4)峰值状态系数:正态分布具有以下重要特性:1.正态分布有正常峰。也就是说,中心的左右对称分布相同,均为1/2。2.正态分布曲线跟随左右尾巴和水平轴的渐近线,但不与水平轴相交,即- x 。33,3。当x=值时,正态分布的概率密度函数值最大,当x时,f(x)的值随着x值的增加而减小。4.正态分布曲线在水平轴-和 等价曲线上有两个拐点。5.正态分布曲线下的区域(间隔概率)是固定的。34,图9正态分布x的值间距和概率,35,实际上,由于随机变量的参数和不同,随机变量的度量单位不同,因此存在不同的正态分布形状,给正态分布的应用带来不便。为此,正态分布概率密度为:因此,新的随机变量z遵循正态分布,遵循相应正态分布的参数=0,=1。另外,无论x的度量单位如何,如果新变量是度量单位,则z称为标准正态随机变量,z的分布称为标准正态分布。其重要特征值为:36,期望值:E(z)=0方差:V(z)=l偏移因子:
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 出品部培训课件
- 2025-2030年中国电脑周边组合线项目投资可行性研究分析报告
- 中国杀线虫剂行业调查报告
- 2025年混凝土密封固化剂市场调研报告
- 2025年AC发泡剂项目可行性分析报告
- 中国大蒜及深加工行业发展趋势及投资前景预测报告
- 2025年 江西工商职业技术学院招聘考试笔试试题附答案
- 2025年 杭州市供销社社有企业招聘考试笔试试题附答案
- 中国电声元件行业发展前景预测及投资方向研究报告
- 2025年 甘肃临夏双城高级中学招聘教师考试试题附答案
- 2023-2024学年四川省广安市高二下学期期末教学质量检测数学试题 (解析版)
- 西部科学城重庆高新区引进急需紧缺人才38人模拟检测试卷【共1000题含答案解析】
- 新护士五年规范化培训手册
- 医学免疫学和病原生物学理论知识考核试题及答案
- 胜保养操作手册江铃驭
- 疫苗及其制备技术课件
- 阿里巴巴公司价值观实施细则
- 安全防范系统设计方案
- 《人卫版第九版内科学心力衰竭》课件PPT
- 中国监察制度史
- 竣工验收证书(模板)
评论
0/150
提交评论