概率论中几种常用重要分布_第1页
概率论中几种常用重要分布_第2页
概率论中几种常用重要分布_第3页
概率论中几种常用重要分布_第4页
概率论中几种常用重要分布_第5页
免费预览已结束,剩余5页可下载查看

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率论中几种常用的重要的分布摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。其在实际中的应用。关键词1一维随机变量分布随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常用分布,即(01)分布、二项分布、泊松分布、均匀分布、指数分布和正态分布.下面我们将对这六种分布逐一地进行讨论.随机事件是按试验结果而定出现与否的事件。它是一种“定性”类型的概念为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。称这种变数为随机变数。本章内将讨论取实值的这种变数一一一维随机变数。定义1.1设X为一个随机变数,令

2、F(x)=P(X(-二,x)=P(Xx),(-:xp其中0p1,则称X服从参数为p的(0-1)分布。(0-1)分布是最简单的一种分布,它用于描述只有两个可能结果的试验。例如,对新生婴儿的性别登记,观察机器是否正常工作,考察一件产品是否为合格品等,均可用(0-1)分布来描述。定义1.3若随机变量X的概率分布为X=k=C;pk(1.p)(i),k=0,1,.,n其中n21为正整数,0p0为常数,则称X服从参数为九的泊松分布,记作XP(?J.泊松分布是作为二项分布的极限分布而引入的。事实上,泊松定理表明,当n很大时,p很小,np适中时,B(n,p)分布就近似于P(,J分布,其中九=np。由二项分布描

3、述的内容可知,泊松分布主要用于描述大量独立重复实验中稀有事件发生的次数,所谓稀有事件指概率很小的事件。由此,纺织品上的疵点数,印刷品中的错字数,某时间段内电话交换台接到的呼叫次数,某时间段内公共汽车站等车的乘客人数等均可用泊松分布来描述。定理1.1(泊松定理)在n重贝努力试验中,事件A在一次实验中出现的概率为pn(与实验总数n有关),如果当nT8时,npnT九(K0常数),则limb(k;n,pn)n.,ke-,k=0,1,2,.k!证明记npn=%,则kn_kb(k;n,npnp(-1np)klim11n二=lim1n)对于任一固定的k,显然有还有从而k.ek!limb(k;n,pn)=n-

4、(x制2二一11对任意k(k=0,1,2,.)成立,定理得证。2连续性随机变量分布以上对离散型随机变量做了一些研究,下面将要研究另一类十分重要而且常见的随机变量一一连续型随机变量定义2.1若白(。)是随机变量,F(x)是它的分布函数,如果存在函数p(x),使对任意的,有xF(x)=,.p(y)dy则称“对连续型随机变量,相应的F(x)为连续型分布函数,同时称p(x)是F(x)的概率密度函数或简称为密度。由分布函数的性质即可验证任一连续型分布的密度函数p(x)必具有下述性质:(1)p(x)-0(2)oO一p(x)dx=1定义2.2若随机变量X的概率分布为(x_a)中(x)=-=e-/,(a产*e

5、2-dx=1-oa(0)都是常数)2:二为密度连续型分布,称这种分布为正态分布,记作XN(a,。2)卜面验证中(x)是一个密度函数。因为这时为显然,此外还可以验证有ooc13dxy,一“x-为此,可令-=y,.2二.:e(x22;二2一y2112dx=、2-edy这时有oOe2_y_2dyQO-e22x_y_oO2二-二2dx一e2dy现在作坐标变换x=rcos1;-Ay=rsinr这时,变换的雅可比式J=r,而Q0一二e2r2rdr=-e2二1所以有于是j二P:(x)dx=1cQ这说明给出的的确是一个密度函数,这个密度函数成为正态密度正态分布是德国数学家和天文学家棣莫弗于1733年在求二项分

6、布的渐进公式时得到的.棣莫弗-拉普拉斯中心极限定理表明正态分布是二项分布的极限分布.正态分布N(出仃2)的密度函数曲线是钟型曲线,它的“钟型”特征与实际中很多随机变“中间大,两头小”的分布规律相吻合.人的各种生理指标,一个班的一次考试成绩,测量的误差等均服从或近似服从正态分布.在许多实际问题中,遇到的随机变数是受到许多互不相干扰的随机因素的影响的,而每个个别因素的影响都不起决定性作用,且这些影响是可以叠加的。例如,电灯泡的耐用时数(寿命)受到原料,工艺,保管条件等因素的随机变动的影响,而这些因素的波动在正常情况下是互不干扰的,且,每一个都不起决定性作用,又,可以认为是可以叠加的。在概率论的极限

7、理论中可以证明:具有上述特点的随机变数一般都可以认为服从正态分布。二项分布,泊松分布和正态分布(或称高斯分布)时概率论中最重要的分布,在实际理论中有着广泛的应用。本文从三中分布的区别与联系出发,采用实例计算及比较方法,以达到较准确选择合适的分布解决实际问题为目的,对三种分布进行进一步探讨。一、三种分布的区别1 .定义不同:以每个分布的定义为切入点,阐明定义特征。二项分布B(n,p)、泊松分布P(入)和正态分布N(n,62)的分布规律分别由它们的参数确定,并且三种分布的数字特征均值及方差是用不同的参数来描述。因此,区别参数的意义是深刻理解定义的关键。2 .随机变量的取值范围不同:二项分布的随机变

8、量取值是有限个,泊松分布的随机变量取值是无穷可列,它们属于离散型的。正态分布的随机变量取值无穷不可列,充满某一区间,属于连续型的。3 .适用的条件不同:二项分布用于描述只有“成功”与“失败”两种试验结果的数学模型。例如:某个学生做n道数学题,每道题的结果只有“对”与“错”,若每题做对的概率已知,则可利用二项分布求出做对k道题的概率;泊松分布适用于描绘大量重复试验中稀有事件(飞机意外坠落、高楼突然倒塌等);正态分布用于一个随机变量由大量相互独立的偶然因素之和构成,每个因素所起的作用对总的来说很微小。例如:某校2002级3000名学生的数学考试分数,受每个学生考分的影响,但每个学生的考试分数对总的

9、分数影响不大,所以,考试分数服从正态分布。二、三种分布之间的联系尽管三种分布有许多不同点,但它们之间还有着相互的联系。在n次贝努力试验中,二项分布的极限是泊松分布,我们可以用二项分布逼近泊松分布。反之,也可以用泊松分布近似具有较大n的二项分布,即若已知泊松分布P(入),可用二项分布B(n,入/n)去逼近它;若已知二项分布B(n,p),可用泊松分布P(入)近似二项分布,其理论根据是近似公式:k_ckk(n_k)eCnP(1-P)定(1)!这里要求n较大,p较小,儿=np。正态分布是二项分布的极限分布,当n较大时,可用正态分布近似二项分布,其近似公式为:C:pk(1p)(n”)_用JnP(2).n

10、p(1-p),np(1-p)若,B(n,p),则有,k2-np,k1-np”、Pk1Mk?r=M-(J=)(3)np(1-p).np(1-p)从上面可以看到,泊松分布和正态分布都是二项分布的极限分布,在满足一定条件下都能近似二项分布。在实际中,利用这种关系有时能够带来很多方便,从而简化计算。三、三种分布在实际中的应用三种分布在实际中有广泛的应用。二项分布适用于抽查产品、能量供应、药效试验、保险公司估计利润等;泊松分布用于公共汽车站来到的乘客数、电话总机在一段时间内收到的呼唤次数、运输损耗等;正态分布用于年平均气温和降雨量、测量误差、发电站电能消耗、人的身高和体重等。在日常生活、生产实际和科学研

11、究中,怎样利用三种分布的特点及联系,简单准确计算出所求事件的概率呢?下面通过实际例子说明这一问题。例如:某大城市有一个繁忙的交通岗,若每天有100000人通过,每人出事故的概率为0.0001,求该天出事故的人数X不超过2人的概率。解法一:显然XB(1000000,0.0001),利用二项分布得PX2=0.00276849这里n较大,p较小,直接用二项分布计算比较麻烦。解法二:用泊松分布近似二项分布的方法计算,代入公式(1)得210ke,0PX2=0.002769kok!这里九=np=10,直接查泊松分布表求出,产生的误差为5.1x10-7o由此可见,当n较大时,p较小时,泊松分布近似二项分布,

12、其近似程度非常好,而且计算简单。解法三:用正态分布的分布函数近似二项分布的方法计算,由近似公式(3)得PX2:,(-2.53)-:,(-3.16)=0.00501这里直接查标准正态分布的分布函数表求得,其误差为0.00224151,这比用泊松分布产生的误差要大。在实际中,用二项分布计算量较大时,一般满足0.1EpE0.9,Jnp(1-p)23的条件下,采用正态分布近似二项分布的方法,较为方便准确有效。解法四:用正态分布的密度函数近似二项分布的计算方法,近似公式(2)行1PX2(3.16)(2.85)(2.53)=0.0081907,9.999这里通过查标准正态分布的密度函数表直接求出,产生的误

13、差为0.00542221,其误差比上面的两种近似求值所产生的误差都大。所以,在实际中,当p不太接近0或1,n不太小,随机变量的取值较小时,应该利用近似(2)计算,结果更准确。从以上四种解法中可以得到:对于一个实际问题,首先应该根据三中分布适用的条件,判断是服从什么分布。然后用此分布去解决问题。若随机变量XB(n,p),当n不太大,p不很小(一般n10,p0.1,且随机变量的取值个数较少时,可以用泊松分布直接查表计算;当0.1VpM0.9,Jnp(1p)至3,随机变量的取值比较多,用二项分布计算量太大时,可以用正态分布直接查表求出结果。定义2.2(均匀分布)若随机变量X的密度函数为1ax&bf(

14、x)=b-a,0其他则称服从区间上的均匀分布,记作XUa,b均匀分布描述的是在一个区间上等可能取值的分布规律,也即是说概率在该区间上的分布是均匀的。均匀分布是最简单。最基本的连续型分布,就像直线运动中的匀速运动,物体中的均匀物体一样.设某路公共汽车每10分钟一趟,则乘客的等车时间可认为是在区间0,10上均匀分布的.还可以把这个分布推广到一个在实数轴上某个指定的长度不为0的集合B上的连续型均匀分布。相应的密度函数为1c二B的长度,x9,其余地方按连续型随机变数X的密度函数中(x)的定义,有XI.F(x)=P(XVx)=_(x)dx,(-二x:)这是用密度函数来表达分布函数的公式。下面用一个例子来说明均匀分布的分布函数的推导过程【例2】算出区间la,b)上的均匀分布的分布函数xxF(x)二(x)dx=J-0dx=0当axwb时xax1x-aF(x)二a,b(x)dx=-二0dx,工改二工当bx时xF(x)二;ab1xb-a0dxdx,i0dx=00=1-二ab-abb-a即,0,x0,使得:当QxYb时,四(几十Ax中Ax)Ya,从而,当|AxY6时,筌x中(x0)E名。因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论