求随机变量和的分布的方法 毕业论文.doc_第1页
求随机变量和的分布的方法 毕业论文.doc_第2页
求随机变量和的分布的方法 毕业论文.doc_第3页
求随机变量和的分布的方法 毕业论文.doc_第4页
求随机变量和的分布的方法 毕业论文.doc_第5页
免费预览已结束,剩余29页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

求随机变量和的分布的方法摘 要随着经济的不断发展,随机变量和的分布在金融、保险和精算等领域中的应用也越来越广泛,因此对于随机变量和的理论研究也非常的重要,本文总结了求随机变量和的分布的方法,并给出了常用独立同分布随机变量和的分布。本文首先介绍了随机变量和的分布的研究背景和研究意义。其次,介绍了常用的随机变量及其相关性质。再次,总结了一些特殊类型的独立同分布随机变量和的精确分布。对于某些随机变量和的精确分布不存在的随机变量,本文给出了两种处理方法。当变量的个数很多时,可以利用独立同分布的中心极限定理来给出独立同分布随机变量和的近似分布,即正态分布;当变量的个数不是很多时,可以利用monte carlo方法,并结合科学计算软件matlab和统计软件spss来模拟随机变量和的分布。最后给出了随机变量和的分布的几个简单应用。关键字:二项分布,正态分布,monte carlo方法,随机数iiiabstractwith the constant development of economy, the distribution of the sum of random variables is applied to many fields, such as financial, insurance, actuary and so on. so the study of the theory for the sum of the random variables is also very important. this paper summarizes the methods of solving the distribution of the sum of random variables and gives the distribution of the sum of the independent and identically distributed random variables which is commonly used.this paper firstly introduces the research background and research significance of the distribution of the sum of random variables. secondly, this paper introduces the commonly used random variables and their associated properties. then this paper summarizes accurate distribution of some special types of the distribution of the sum of random variables which is independent and identically distributed. for some random variables which the precise distribution of the sum of random variables does not exist, this paper gives two kinds of processing method. when there are a lot of variables, the approximate distribution of the distribution of the sum of random variables which is independent and identically distributed can be given by using central limit theorem of independent and identically distributed, namely the normal distribution. when there are few variables, monte carlo method can be used, and combined with scientific computing software matlab and statistical software spss to simulate the distribution of the sum of random variables. finally, this paper gives a few simple applications about the distribution of the sum of random variables.key words: binomial distribution, normal distribution, monte carlo method, random number4目 录前言1第一章常用随机变量的分布及性质31.1 两点分布31.2 二项分布31.3 正态分布41.4 分布51.5 分布61.6 分布71.7 几何分布81.8 分布91.9 指数分布101.10 分布101.11 分布11第二章常用随机变量和的精确分布122.1 两点分布随机变量和的分布122.2 二项分布随机变量和的分布122.3 正态分布随机变量和的分布122.4 分布随机变量和的分布132.5 分布随机变量和的分布132.6 几何分布随机变量和的分布142.7 分布随机变量和的分布14第三章 独立同分布随机变量和的近似分布153.1 独立同分布的中心极限定理15第四章 随机变量和的分布的蒙特卡罗模拟184.1 蒙特卡罗方法简介184.2 随机变量和的分布的蒙特卡罗模拟20结论26谢辞27参考文献28前言随机试验是概率论中极其重要的概念,它的各种结果是一些事件。通常把对自然现象进行观察或者进行一次试验,统称为一个试验。如果这个试验满足下述条件,则称为随机试验。 在相同条件下可重复进行; 每次试验结果不止一个,所有可能结果事先不能预测; 每次试验之前不能确定哪一种结果出现。随机试验用研究随机现象的。随机试验的每一个可能结果一般称为随机事件,或者简称事件。在实际问题中,对于某些随机试验的结果有时需要用多个随机变量来描述。例如,为了研究保险公司在一段时期内总理赔额的性质,不仅需要知道每次理赔额的大小,而且要知道这段时期内的理赔次数。一般来说,随机变量的分布不仅与的分布有关,还依赖于之间的相互关系。随机变量的概率分布(分布函数或密度函数)包含了随机变量的全部信息。但是在很多情况下,人们并不需要获得一个随机变量的全部信息,只需要了解他的某些特征值就可以了,如均值、最大值、最小值、波动程度、分布对称情况等。这些信息通常可以由随机变量的数字特征来反映。 在保险和精算中,一个精算模型总是试图描述未来可能发生的随机性损失。损失的随机性有三个含义:损失发生的次数是随机的;损失发生的时间是随机的;损失的大小是随机的。对一份特定的保单而言,这三种随机性至少满足一种。而在概率论里,这三种随机性都能用相应的随机变量来刻画。面对不确定性因素,一张保单发生的损失有多种结果。根据概率论的知识,我们可以寻找一个分布函数来刻画保单发生各种损失的概率。一般情况下,直接寻找这样的分布函数是困难的,但是当保险人拥有大量相似或同类风险的保单时,保险人可以比较准确地估计损失分布,预测理赔额,并制定适合的保险费。在损失模型中,一个重要的问题是如何选择和估计损失额的分布或理赔额的分布。只有选择一个适合的分布类型,并估计了损失额和理赔额的分布,才可以较为精确地预测平均损失额和平均理赔额,进而考虑费率厘定、准备金估计和再保险安排等一系列精算问题。当统计数据十分充足时,大多数问题可以通过分析观察数据的经验分布得到解决。这种方法称为经验法。但是在通常情况下,难以得到足够多的统计数据,尤其是关于高额赔付的数据更为有限。因此,必须根据有限的统计数据建立统计模型去估计和拟合理赔额或理赔次数的理论分布,再由这些理赔分布的性质预测平均损失额和平均理赔额。这种方法称为模型法。模型法对于分析问题也是十分有用的,因为理论分布中有丰富的应用性质。如中心极限定理、独立同分布随机变量的可加性。这些性质有助于对实际问题进行分析。另外,模型法完全可以由少数几个参数概括,如分布、指数分布只有一个参数,正态分布、对数正态分布、分布有两个参数。因而,我们对随机变量分布及其随机变量和的分布研究是对保险、精算、金融等领域具有重大的意义。第一章 常用随机变量的分布及性质1.1 两点分布两点分布是除了常数外最简单的一个分布类型,它虽然很简单但实际中常见,如新生婴儿是男还是女、明天是否下雨、种子是否发芽等。任何一个只有两种可能结果的随机现象,都可以用一个服从两点分布的随机变量来描述。例如:从一大批产品中抽一件进行检查,若合格记;若不合格记,并且,那么,记。任何两点分布,均可通过变换为如下标准型它有如下的性质:性质1原点矩。特别。性质2 矩母函数和特征函数分别为 。 两点分布又称伯努利(bernoulli)分布,是由伯努利试验而得名的。1.2 二项分布若进行次独立试验,每次试验只有两个可能的结果,要么事件发生,要么事件不发生,且,,用表示这次试验中发生的次数,则,这个分布叫做二项分布,这种类型的试验叫做重伯努利试验,并记作.由于是按二项式展开其中含因子的那一项,故我们称随机变量服从参数为的二项分布。当时,二项分布化为,这就是两点分布。 为了便于讨论,记。显然有性质1 性质2 二项分布的均值、方差、标准差和变异系数分布为,1.3 正态分布在实际生活中,许多随机变量都服从同一类分布正态分布。如成年男(女)子的高度、重量,纤维的长度,加工零件的尺寸,每包大米(同一规格)的重量,钢的含碳量,胶片的粒数,测量的误差,射击目标的水平或垂直偏差等。定义 若随机变量的分布密度是,则称服从正态分布,并记作.当时,相应的分布叫做标准正态分布。正态分布又叫高斯(gauss)分布,是因为正态分布最初由德国著名数学家高斯(gauss)在研究偏差理论时发现的。性质1 若,则;反之,,则性质2 若,则性质3 若,为任意实数,则性质4 正态分布的分布函数是.以后用记,上式表明只要研究就够了。有如下的性质:(1),有两条渐进线和。从而的中位数是.(2)(3),性质5 若与独立,则1.4 分布分布是从正态分布派生出来的一个分布。尽管它是由正态分布产生的,但它在数理统计中却一直占有重要的地位。此外,许多分布可以用分布来近似,甚至在多元统计中也常需要用到分布。定义 设独立同分布,且,则随机变量的分布称为具有个自由度的分布,并记为.分布的密度函数为其中:为函数,分布有如下性质 性质1 设,则,性质2 若与独立,则,这个性质称做分布的可加性。1.5 分布若有两个正态分布的总体和,我们欲检验和是否显著性差异,解决这个问题所用统计量的分布就是分布。在方差分析中,经常需要检验某个因素是否对指标有显著地作用,这个问题也要使用分布。在多元统计中有许多复杂的分布,它们可以用分布来近似。不难看出,分布在统计中的地位是相当重要的。定义 设随机变量和独立,且,则的分布称为自由度为和的分布,并记作.根据定义可以导出分布的分布密度为有如下性质 性质1 若,则.性质2 若,则,.1.6 分布某交换机在某一段时间内所接到的呼唤次数服从分布,类似地某公交车站在一固定时间内来到的乘客数也近似地服从分布。在各种服务系统中大量出现分布,因此在运筹学及管理科学中分布占有重要的地位。另外,在物理学中,放射性分裂落到某区域的质点数、热电子的发射、显微镜下落在某区域中的血球或微生物的数目等也都近似于分布。因此,可见分布是应用面十分广泛的一个基本而又重要的分布。定义 设随机变量所有可能取的值为,而取各个值的概率为其中:是常数。则称服从参数为的分布,记作.为了便于叙述,记,.由此,分布有如下性质:性质1 性质2 分布的均值、方差、标准差为,.性质3 分布的矩母函数、特征函数和概率母函数为1.7 几何分布在一个伯努利试验中,事件出现的概率为,试验一个接一个地独立进行,用表示第一次出现的事件时所进行的试验数,则的分布 ,该分布叫做几何分布,并记作.由于几何分布的结构比较简单,因此它的性质是比较容易获得的。令,有如下性质: 性质1 .性质2 是的单调下降函数.性质3 用表示几何分布的分布函数,性质4 几何分布的均值、方差、标准差和变异系数为 ,.1.8 分布定义 若随机变量的密度函数为 (2.1)则称服从参数为和的分布,记作.当时,(2.1)化为称为标准的分布。当时,分布就化为负指数分布.当时,(2.1)化为当时,(2.1)化为通常称它为单参数的分布,或负指数分布。可见负指数分布既属于weibull分布族又属于分布族。性质1 若,则,.性质2 设,则它的矩母函数和特征函数烦分别为,.性质3 设与独立,则与独立.性质 4 设独立同分布,且,则.1.9 指数分布定义 设连续型随机变量的概率密度为其中:为常数,则称服从参数为的指数分布.1.10 分布定义 设,且独立,则随机变量的分布称服从自由度为的分布。记为.若,可以导出的分布密度为性质1 .性质2 如和独立同分布于,则随机变量.1.11 分布定义 进行次独立重复试验中,直到出现次成功为止,试验总次数为称服从以,为参数的分布.第二章 常用随机变量和的精确分布2.1 两点分布随机变量和的分布若独立同分布,且分布为两点分布,且参数为,则服从二项分布.2.2 二项分布随机变量和的分布若独立,且,则.证明:根据特征函数的定义及数学期望的性质,我们可求得随机变量的特征函数在根据分布函数与特征函数的一一对应关系,便可得以上的结论。2.3 正态分布随机变量和的分布若,独立,则证明:的矩母函数分别是由独立知的矩母函数为即。当,时,则.2.4 分布随机变量和的分布若独立,则.证明:假设与独立,存在同分布服从使得,从而.根据分布的定义可得.同理,可以得到到多个随机变量的情形,若独立,则.2.5 分布随机变量和的分布设随机变量相互独立,且,则,其中:.证明:因为,所以它的矩母函数为又因为相互独立,则有其中,这就是的矩母函数。则有.特别地,当随机变量相互独立,且,则.2.6 几何分布随机变量和的分布若随机变量相互独立,则参数为,的分布.2.7 分布随机变量和的分布设相互独立,则.证明:由假设条件及分布的性质2知道的特征函数为, ,从而的特征函数为这个个特征函数的积即第三章 独立同分布随机变量和的近似分布3.1 独立同分布的中心极限定理在客观实际中有许多随机变量,它们是由大量的相互独立的随机因素的综合影响所形成的。而其中每一个别因素在总的影响中所起的作用都是微小的。这种随机变量往往近似地服从正态分布。这种现象就是中心极限定理的客观背景。独立同分布的中心极限定理 设随机变量相互独立,服从同一分布,且有数学期望和方差:,则随机变量之和的标准变量;的分布函数对于任意满足这就是说,均值,方差为的独立同分布的随机变量之和的标准化变量,当充分大时,有 (3.1)在一般情况下,很难求出个随机变量之和的分布函数,(3.1)式表明,当充分大时,可以通过给出其近似的分布.这样,就可以利用正态分布对作理论分析或作实际计算,其好处是明显的.将(3.1)式左端改写成,这样,上述结果可以写成:当充分大时,或.这是独立同分布中心极限定理结果的另一个形式.这就是说,均值为,方差为的独立同分布的随机变量的算术平均,当充分大时近似地服从均值为,方差为的正态分布。这一结果是数理统计中大样本统计推断的基础。例:一加法器同时收到20个噪声电压,设它们是相互独立的随机变量,且都是区间上服从均匀分布,记作,求的近似值。解:易知,.有独立同分布的中心极限定理,随机变量近似服从正态分布,于是即有第四章 随机变量和的分布的蒙特卡罗模拟4.1 蒙特卡罗方法简介蒙特卡罗方法,也称统计模拟方法,计算机模拟方法,是一种基于“随机数”的计算方法。它以概率统计理论为指导,使用随机数(或更常见的伪随机数)来解决很多计算问题。这一方法起源于美国在第二次世界大战期间研制原子弹的“曼哈顿计划”,该计划的主持人之一,数学家冯诺依曼用驰名世界的赌城摩纳哥的蒙特卡罗市来命名这种方法。蒙特卡罗方法正是以概率为基础的方法。与它对应的是确定性算法。蒙特卡罗方法的基本思想很早以前就被人们所发现和利用。早在17世纪,人们就知道用事件发生的“频率”来决定事件的“概率”。19世纪人们用投针试验的方法来决定圆周率。本世纪40年代电子计算机的出现,特别是近年来高速电子计算机的出现,使得用数学方法在计算机上大量、快速地模拟这样的试验成为可能。 在解决实际问题的时候应用蒙特卡罗方法主要有两部分工作:用蒙特卡罗方法模拟某一过程时,需要产生各种概率分布的随机变量;用统计方法把模型的数字特征估计出来,从而得到实际问题的数值解。 蒙特卡罗解题三个主要步骤: (1)构造或描述概率过程:对于本身就具有随机性质的问题,如粒子输运问题,主要是正确描述和模拟这个概率过程,对于本来不是随机性质的确定性问题,比如计算定积分,就必须事先构造一个人为的概率过程,它的某些参量正好是所要求问题的解。即要将不具有随机性质的问题转化为随机性质的问题。 (2)实现从已知概率分布抽样:构造了概率模型以后,由于各种概率模型都可以看作是由各种各样的概率分布构成的,因此产生已知概率分布的随机变量(或随机向量),就成为实现蒙特卡罗方法模拟实验的基本手段,这也是蒙特卡罗方法被称为随机抽样的原因。最简单、最基本、最重要的一个概率分布是上的均匀分布(或称矩形分布)。随机数就是具有这种均匀分布的随机变量。随机数序列就是具有这种分布的总体的一个简单子样,也就是一个具有这种分布的相互独立的随机变数序列。产生随机数的问题,就是从这个分布的抽样问题。在计算机上,可以用物理方法产生随机数,但价格昂贵,不能重复,使用不便。另一种方法是用数学递推公式产生。这样产生的序列,与真正的随机数序列不同,所以称为伪随机数,或伪随机数序列。不过,经过多种统计检验表明,它与真正的随机数,或随机数序列具有相近的性质,因此可把它作为真正的随机数来使用。由已知分布随机抽样有各种方法,与从上均匀分布抽样不同,这些方法都是借助于随机序列来实现的,也就是说,都是以产生随机数为前提的。由此可见,随机数是我们实现蒙特卡罗模拟的基本工具。建立各种估计量:一般说来,构造了概率模型并能从中抽样后,即实现模拟实验后,我们就要确定一个随机变量,作为所要求的问题的解,我们称它为无偏估计。 (3)建立各种估计量,相当于对模拟实验的结果进行考察和登记,从中得到问题的解。 例如:检验产品的正品率问题,我们可以用1表示正品,0表示次品,于是对每个产品检验可以定义如下的随机变数,作为正品率的估计量: 于是,在次实验后,正品个数为:显然,正品率为:不难看出,为无偏估计。当然,还可以引入其它类型的估计,如最大似然估计,渐进有偏估计等。随着计算机技术的发展,使得蒙特卡罗方法在最近10年得到快速的普及。现代的蒙特卡罗方法,已经不必亲自动手做实验,而是借助计算机的高速运转能力,使得原本费时费力的实验过程,变成了快速和轻而易举的事情。它不但用于解决许多复杂的科学方面的问题,也被项目管理人员经常使用。借助计算机技术,蒙特卡罗方法实现了两大优点:一是简单,省却了繁复的数学报导和演算过程,使得一般人也能够理解和掌握;二是快速,简单和快速,是蒙特卡罗方法在现代项目管理中获得应用的技术基础。蒙特卡罗方法有很强的适应性,问题的几何形状的复杂性对它的影响不大。该方法的收敛性是指概率意义下的收敛,因此问题维数的增加不会影响它的收敛速度,而且存贮单元也很省,这些是用该方法处理大型复杂问题时的优势。因此,随着电子计算机的发展和科学技术问题的日趋复杂,蒙特卡罗方法的应用也越来越广泛。它不仅较好地解决了多重积分计算、微分方程求解、积分方程求解、特征值计算和非线性方程组求解等高难度和复杂的数学计算问题,而且在统计物理、核物理、真空技术、 系统科学、信息科学 、公用事业、地质、医学,可靠及计算机科学等广泛的领域都得到成功的应用。4.2 随机变量和的分布的蒙特卡罗模拟有些随机变量和的精确分布存在,但是,有些是随机变量和的精确分布不存在,而且变量的个数由不充分多,无法用近似分布代替,这种情况下可以借助蒙特卡罗方法。例如,分布,分布等。因而,要求这些分布的随机变量和的分布时,需要通过蒙特卡罗方法来模拟这些随机变量和的分布。例1:随机变量相互独立,且,求的分布情况解:(1)用matlab生成20个的随机数,然后将其相加,得到一个的随机数。(2)再重复(1)的过程199次,将依次得到,如表1所示:表1 随机数表31.067634.189235.688828.585234.224926.394338.840125.985452.083125.359319.41927.551733.035635.012645.92536.378634.642.709526.441223.895325.792327.591326.254536.073136.186329.343225.397931.718627.817338.933829.277220.528530.716132.60922.372122.919919.450541.346631.000337.535928.334624.501826.366237.527225.928232.280720.665631.005131.826932.080828.412232.678216.314932.876239.553228.270518.371932.708129.05564.012930.897928.355525.340132.459826.304932.58236.796739.305937.525241.559923.75637.121736.96730.764838.312529.597334.035519.461423.853220.459850.861824.697336.495631.612845.152634.082528.076822.979525.473119.683932.415835.649840.197150.116931.762835.989241.2122.501622.686525.108220.669437.971732.174535.453728.925621.984246.850231.963932.944234.860322.302739.489740.810330.90922.372623.096332.004532.715226.546627.045828.434840.3853131.357330.309518.409531.84446.005730.966720.863920.934535.603936.85536.563520.35528.425131.856433.981622.838328.478219.231820.278736.120823.440632.71832.251640.063542.339325.774422.015925.273233.725725.194746.958539.39632.981436.172530.651931.768564.411126.365241.866821.571833.006318.738627.957748.350736.985635.534833.712733.22125.815335.576947.146324.186539.281720.688428.987236.695440.071531.242551.693623.439534.397347.444631.480126.938824.582741.049235.181725.654842.20429.794226.870342.062751.060438.189619.1135.713530.424425.3948(3)画的频率直方图。用直方图说明的分布情况。把这组生成的随机数的通过spss软件:分析-描述统计-频率的过程来画直方图,如图1所示。图1 随机变量和的频率直方图例2:随机变量相互独立,且,求的分布情况解:(1)用matlab生成50个的随机数,然后将其相加,得到一个的随机数;(2)再重复(1)的过程149次,将依次得到,如表2所示;表2 随机数表9.5149-8.60053.8864.34446.7139-7.73740.228752.5057.3167-20.6951.9517-14.216-1.88888.3049-12.305-17.555-3.209113.6750.491074.136-13.895-7.08856.3498-3.2729-0.2243-0.90352-6.58930.1823-1.7792-15.707-16.1789.71981.9079.12884.8964-6.316114.738-7.11024.2461-7.6885-0.8082-10.9638.5074.1084-3.6923.61897.0909-6.251626.15-1.7485-6.73844.500924.8618.973416.453-2.6337-9.4931-3.210612.165.61516.388610.1691.4733-3.9256-0.9428914.015-1.189-12.6522.416621.6621.15810.2550.19771-13.293-7.3092-2.153810.757-13.635-0.844433.748114.492-6.66531.7743-12.5288.81481.882910.71511.71-3.2811-3.2179-0.40161-6.16051.3919-3.4527-13.596-2.0464-0.54149-14.001-19.2575.53850.90107-4.6124-1.23263.96751.43179.7786-3.98532.26612.0971-1.12856.0897-10.5353.54430.91565-0.92444-16.2-12.3256.3803-2.55753.6339-12.882.82193.618611.242-19.836-3.563212.12.9820.05448210.957-11.3814.8712-9.037616.072-13.86-2.4325-2.5656-2.4779-16.26212.88917.43-7.87683.9583-5.05986.549-18.78726.06813.065.2203-3.7082(3)画的频率直方图,如图2所示。用频率直方图说明的分布情况.图2 随机变量和的频率直方图例3:设某保单组合的总理理赔量服从复合分布,参数。个体理赔分布服从均值为4的指数分布,用monte carlo方法计算. 解: (1)利用matlab生成一个的随机数,记作; (2)利用matlab生成个均值为4的指数分布的随机数,记作; (3); (4)重复上述过程次,记为,记录其中大于60的次数,记为; (5)通过matlab计算得:当时,当时,当时,当时,.结论本文通过对随机变量和的分布研究,总结某些特殊类型的独立同分布随机变量和的精确分布,同时给出了独立同分布的中心极限定理和蒙特卡罗模拟方法来处理随机变量和的精确分布不存在的随机变量。在保

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论