概率论中几种常用的重要的分布94347.doc_第1页
概率论中几种常用的重要的分布94347.doc_第2页
概率论中几种常用的重要的分布94347.doc_第3页
概率论中几种常用的重要的分布94347.doc_第4页
概率论中几种常用的重要的分布94347.doc_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内蒙古大学本科毕业论文(设计) 第24页 伯努利试验、泊松过程、独立同分布生成的重要分布 敖登 (内蒙古大学数学科学学院2010级数理基地,01008104)摘要本文是一篇读书报告。主要研究了伯努利试验与二项分布的关系,泊松过程生成泊松分布的过程和在泊松条件下的埃尔朗分布,正态分布的生成用到的独立同分布以及均匀分布生成任意分布的重要性质。关键词:伯努利试验 泊松分布 独立同分布 均匀分布的生成性 Important in theory of probability distribution of exploration Author:Ao DengTutor: Luo Cheng (School of Mathematical sciences ,Huhhot Inner Mongolia 01008104 ) AbstractThis article mainly discusses the theory of several common distribution (0-1) distribution, binomial distribution, poisson distribution and uniform distribution, exponential distribution, normal distribution and normal distribution out three kinds of important distribution, distribution, distribution and the distribution of the source and the relationship among them and their application in actual. Key words: random variable; The discrete distribution ; Continuous distribution 目录第一章 伯努利试验生成二项分布4第二章 泊松过程生成泊松分布6第三章 独立同分布生成正态分布 13第四章 均匀分布的生成性17第五章 几种重要分布的比较及应用19小结22致谢23.参考文献24.第一章 伯努利试验生成二项分布考虑重伯努利实验中成功次数.易见的可能值为.注意当且仅当这次实验中恰有个成功与个失败.先考虑前次试验全成功而后次试验全失败这一特殊情形.可得出现这种结果的概率注意所得结果仅与的个数有关,与出现在哪个位置上无关.再者,在这次试验中选择次成功共有种方式,且各种方式两两不相容,故由可加性立得的密度, 一般地,任给定自然数及正数,令则且 称以为密度的离散型分布为二项分布,记作.当时的特例又称作伯努利分布.这是一个两点分布,其密度称阵为.上述推导表明,重伯努利试验的成功次数服从参数为的二项分布.下面讨论二项分布的性质,对,考虑比值易见,当时,:而当时,.这说明,对任何固定的参数与,的值先随的变大而上升,再随的变大而下降,于是必有最大值.如果是整数,则同为的最大值.如果不是整数,则在处取到最大值(这里表示不超过的整数).我们称使取到最大值的为二项分布随机变量的最可能值,或称为重伯努利试验的最可能成功次数。由二项分布的导出可知,该种分布用于描述重伯努利试验中发生的概率为.在研究某事件发生的概率时,我们对事件所在的试验进行独立重复观察,统计出事件发生的次数。这里是一个随机变量,它就服从二项分布。另外,一批种子能发芽的个数,一定人群中患某种疾病的人数,某时刻一个城市开着的灯的盏数都可以认为是服从二项分布的。第二章 泊松过程生成泊松分布. 泊松分布是作为二项分布的极限分布而引入的。事实上,泊松定理表明,当很大时,很小,适中时,分布就近似于分布,其中。 由二项分布描述的内容可知,泊松分布主要用于描述大量独立重复实验中稀有事件发生的次数,所谓稀有事件指概率很小的事件。由此,纺织品上的疵点数,印刷品中的错字数,某时间段内电话交换台接到的呼叫次数,某时间段内公共汽车站等车的乘客人数等均可用泊松分布来描述。定理 2.1(二项分布的泊松逼近-泊松定理) 在重伯努利试验中,事件在一次实验中出现的概率为(与实验总数有关),如果当时,(常数),则有 证明 记,则 对于任一固定的,显然有 还有 从而 对任意()成立,定理得证。定义2.1 若随机变量的概率分布为其中为常数,则称服从参数为的泊松分布,记作泊松分布的性质:泊松分布的密度值随的变化情况与二项分布类似。考虑比值 , 当时有,而当时有。因此,随着由小变大,的值先上升后下降,在处达到最大值,而当为整数时,在及同时取到它的最大值.这个称作泊松分布的最可能值。上式也是分布的充分条件。引理2.2.1(柯西) 若是连续函数(或单调函数),且对一切(或一切)成立 则 其中,是某一常数.证明: 由知对任意 因此非负.反复使用,对任意正整数及实数有 在上式中取,得 记,则 因此,对任意正整数及,成立 这样,我们已证得对一切有理数成立,再利用连续性或单调性可以证明对无理数也成立,从而证明了定理。 泊松过程: 假定有一个于随即时刻陆续到来的质点流。这里的“质点”可以是意外事故或是上面提到的粒子等。“于随机时间陆续到达”是指质点一个一个地到达,但质点到达的时间间隔都是随机变量。对任何,以代表在时段内到达的质点个数。每个都是非负整值随机变量。下面将证明,添加一组通常的假设,是所谓的过程。定理2.2假定于随机时间陆续到达的质点流满足以下条件:(1)独立增量性 在不相交时段内到达的质点数目相互独立。即对任何,任何,事件与相互独立。(2) 平稳性 在长为的时段内到达个质点的概率,只与计时长度有关而与计时起点无关。于是可记 (3) 普通性 在有限的时间区间内只有有限个质点,即对任意有。并且在充分短的时间内最多只来一个质点,即假设多于一个质点到达的概率。并排除总也不来质点的这种无意义的情形,即假设不恒等于1. 那么,必存在常数,使对一切有, , 证明: 对任何,考察.运用全概率公式及独立增量性可得 , 特别时,上式化为 .由于是时段内无质点到达的概率,它关于单调非增.故作为上式函数方程的有界单调解. 必为指数函数,即存在常数,使 , .但是或1导致恒为0或为1.这与3矛盾.故存在常数,使,从而有 , 这正是时的.以下用归纳法,设式为真,往证时式成立.当很小时,由普通性知 于是的表达式可写为 但由已证明的式有从而再用普通性得 将上述二式代入,便得 令,并据归纳法假设将时的式代入,就得到满足的一阶微分方程 联合明显的初值条件(注意这里),便得上式方程的解为 定理于是得证.满足定理中各项条件的质点流的计数过程称作强度为的过程,由及可知,任随机变量服从参数为的分布 , 对过程的进一步研究,是随机过程论的重要内容。应当指出指数分布与泊松过程有密切联系,若以记参数为的泊松过程,以记它第一个跳跃发生的时刻,则因此 这说明服从指数分布。下面把这个结果推广到更为一般的场合。定义2.2.2(泊松过程下的埃尔朗分布) 若是参数为的泊松过程,以记它的第个跳跃发生的时刻.事件发生表明第个跳跃出现在时刻之前,因此事件发生,即;反之,若事件发生,即在时刻时之值不小于,这时第个跳跃已经出现过,因此事件发生,即有. .综上所述可知 以记的分布函数,则 因此 因对于任意的, 所以,对任意的正整数及实数, 是一个密度函数,称为埃尔朗分布,它是丹麦科学家埃尔朗(Erlang)在研究电话问题时引进的,这些研究开创了排队论这一学科。前面的推导说明,泊松过程中第个跳跃发生的时刻服从埃尔朗分布。当时,埃尔朗分布化作指数分布。另外,若记 , 则表示泊松过程的第个跳跃间隔,用它们可以给出跳跃时刻的如下表达式 可以证明,均服从参数为的指数分布,且相互独立第三章 独立同分布生成正态分布正态分布是德国数学家和天文学家棣莫弗于1733 年在求二项分布的渐进公式时得到的 棣莫弗 拉普拉斯中心极限定理表明正态分布是二项分布的极限分布 正态分布的密度函数曲线是钟型曲线,它的“钟型”特征与实际中很多随机变“中间大,两头小”的分布规律相吻合 人的各种生理指标,一个班的一次考试成绩,测量的误差等均服从或近似服从正态分布在许多实际问题中,遇到的随机变数是受到许多互不相干扰的随机因素的影响的,而每个个别因素的影响都不起决定性作用,且这些影响是可以叠加的。例如,电灯泡的耐用时数(寿命)受到原料,工艺,保管条件等因素的随机变动的影响,而这些因素的波动在正常情况下是互不干扰的,且,每一个都不起决定性作用,又,可以认为是可以叠加的。在概率论的极限理论中可以证明:具有上述特点的随机变数一般都可以认为服从正态分布。下面我们研究一下正态分布的导出在测量中,若为真值,为观察值,而误差的分布密度函数为.经验表明关于对称,而且对一切成立,为推导方便起见,还假设具有连续导函数。如果有独立同分布的观察值,则其似然函数为,它表征了这组观察值落在的附近的可能性的大小。高斯的假定是:观察值的平均值作为未知参数的估值使达到最大。下面利用这个假定导出正态分布。若使似然函数达到最大,则 ()记,则,由假设知道它好定义而且是连续函数,这时()变成当时,上式化为由于,以及的任意性得到对一切实数成立。当时,上式化为 由于,可知对一切实数成立 这是柯西函数方程,很容易证明其解必为事实上,若记,则方程化为 这方程对一切成立,且是连续函数,因此知,从而得知,从而得知 因此 , 为密度函数,因此,记,则 , 由规范化条件知,故 , 这就是著名的误差函数,即正态分布密度函数。定义2.3.1(正态分布) 若随机变量的概率分布为 为密度连续型分布,称这种分布为正态分布,记作.下面验证是一个密度函数. 因为这时为显然,此外还可以验证有 为此,可令,则 这时有 现在作坐标变换 这时,变换的雅可比式,而 所以有 于是 这说明给出的的确是一个密度函数,这个密度函数成为正态密度。第四章 均匀分布的生成性 若随机变量的分布函数为,因为是非降函数,对任意,可定义作为的反函数。下面考虑随机变量的分布,这里是连续函数。对, 即服从0,1均匀分布.这个结论在统计中起重要作用.反之,若服从0,1均匀分布,对任意分布函数,令 则因此是服从分布函数的随机变量.这样,只要我们能产生0,1中均匀分布的随机变量的样本(观察值),那么我们也就能通过产生分布函数为的随机变量样本,这结论在蒙特卡罗方法中具有基本的重要性。通常的做法是利用数学或物理的方法产生0,1中均匀分布随机变量的样本(称为均匀分布随机数),再利用变换得到任意分布的随机数。随机变量的存在性定理 利用上述结果,我们可以给下面定理一个构造性的证明。定理4.1 若是左连续的单调不减函数,且,则存在一个概率空间及其上的随机变数,使的分布函数正好是.证明: 取,再取为0,1中博雷尔点集全体,而取为直线上的勒贝格测度(它是博雷尔点集都有定义).定义,则是上的随机变量,又对一切,因此服从0,1上的均匀分布.再利用定义,当然它也是单调函数,从而是博雷尔函数,令 则是上的随机变量,而且仿上段讨论可知,它的分布函数正好是.第五章 几种重要分布的比较与应用二项分布,泊松分布和正态分布(或称高斯分布)时概率论中最重要的分布,在实际理论中有着广泛的应用。本文从三中分布的区别与联系出发,采用实例计算及比较方法,以达到较准确选择合适的分布解决实际问题为目的,对三种分布进行进一步探讨。一、三种分布的区别1.定义不同:以每个分布的定义为切入点,阐明定义特征。二项分布、泊松分布和正态分布的分布规律分别由它们的参数确定,并且三种分布的数字特征均值及方差是用不同的参数来描述。因此,区别参数的意义是深刻理解定义的关键。2.随机变量的取值范围不同:二项分布的随机变量取值是有限个,泊松分布的随机变量取值是无穷可列,它们属于离散型的。正态分布的随机变量取值无穷不可列,充满某一区间,属于连续型的。3.适用的条件不同:二项分布用于描述只有“成功”与“失败”两种试验结果的数学模型。例如:某个学生做n道数学题,每道题的结果只有“对”与“错”,若每题做对的概率已知,则可利用二项分布求出做对k道题的概率;泊松分布适用于描绘大量重复试验中稀有事件(飞机意外坠落、高楼突然倒塌等);正态分布用于一个随机变量由大量相互独立的偶然因素之和构成,每个因素所起的作用对总的来说很微小。例如:某校2002级3000名学生的数学考试分数,受每个学生考分的影响,但每个学生的考试分数对总的分数影响不大,所以,考试分数服从正态分布。二、三种分布之间的联系尽管三种分布有许多不同点,但它们之间还有着相互的联系。在n次贝努力试验中,二项分布的极限是泊松分布,我们可以用二项分布逼近泊松分布。反之,也可以用泊松分布近似具有较大n的二项分布,即若已知泊松分布,可用二项分布去逼近它;若已知二项分布,可用泊松分布近似二项分布,其理论根据是近似公式: (1)这里要求较大,较小,。正态分布是二项分布的极限分布,当较大时,可用正态分布近似二项分布,其近似公式为: (2) 若,则有 (3) 从上面可以看到,泊松分布和正态分布都是二项分布的极限分布,在满足一定条件下都能近似二项分布。在实际中,利用这种关系有时能够带来很多方便,从而简化计算。三、三种分布在实际中的应用三种分布在实际中有广泛的应用。二项分布适用于抽查产品、能量供应、药效试验、保险公司估计利润等;泊松分布用于公共汽车站来到的乘客数、电话总机在一段时间内收到的呼唤次数、运输损耗等;正态分布用于年平均气温和降雨量、测量误差、发电站电能消耗、人的身高和体重等。在日常生活、生产实际和科学研究中,怎样利用三种分布的特点及联系,简单准确计算出所求事件的概率呢?下面通过实际例子说明这一问题。例如:某大城市有一个繁忙的交通岗,若每天有100000人通过,每人出事故的概率为0.0001,求该天出事故的人数不超过2人的概率。解法一:显然,利用二项分布得=0.00276849这里较大,较小,直接用二项分布计算比较麻烦。解法二:用泊松分布近似二项分布的方法计算,代入公式(1)得这里,直接查泊松分布表求出,产生的误差为。由此可见,当 较大时,较小时,泊松分布近似二项分布,其近似程度非常好,而且计算简单。解法三:用正态分布的分布函数近似二项分布的方法计算,由近似公式(3)得这里直接查标准正态分布的分布函数表求得,其误差为0.00224151,这比用泊松分布产生的误差要大。在实际中,用二项分布计算量较大时,一般满足的条件下,采用正态分布近似二项分布的方法,较为方便准确有效。解法四:用正态分布的密度函数近似二项分布的计算方法,近似公式(2)得这里通过查标准正态分布的密度函数表直接求出,产生的误差为0.00542221,其误差比上面的两种近似求值所产生的误差都大。所以,在实际中,当不太接近0或1,不太小,随机变量的取值较小时,应该利用近似(2)计算,结果更准确。从以上四种解法中可以得到:对于一个实际问题,首先应该根据三中分布适用的条件,判断是服从什么分布。然

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论