吴赣昌编_概率论与数理统计_第2章_第1页
吴赣昌编_概率论与数理统计_第2章_第2页
吴赣昌编_概率论与数理统计_第2章_第3页
吴赣昌编_概率论与数理统计_第2章_第4页
吴赣昌编_概率论与数理统计_第2章_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章随机变量及其分布,随机变量离散型随机变量随机变量的分布函数连续型随机变量随机变量的函数的分布,在第一章中,我们用样本空间的子集,即样本点的集合来表示随机试验的各种结果,这种表示方式对全面讨论随机试验的统计规律性及数学工具的运用都有较大的局限。在本章中,我们将用实数来表示随机试验的各种结果(数量化),即引入随机变量的概念。这样,不仅可以更全面揭示随机试验的客观存在的统计规律性,而且可使我们用(数学分析)微积分的方法来讨论随机试验。,在随机试验中,如果把试验中观察的对象与实数对应起来,即建立对应关系X,使其对试验的每个结果,都有一个实数X()与之对应,,试验的结果,实数X(),对应关系X,则X的取值随着试验的重复而不同,X是一个变量,且在每次试验中,究竟取什么值事先无法预知,也就是说X是一个随机取值的变量。由此,我们很自然地称X为随机变量。,2.1随机变量,定义1设E是一个随机试验,S是试验E的样本空间,如果对于S中的每一个样本点,有一实数X()与之对应,这个定义在S上的实值函数X()就称为随机变量。,由定义可知,随机变量X()是以样本空间S为定义域的一个单值实值函数。,有关随机变量定义的几点说明:(1)随机变量X不是自变量的函数而是样本点的函数,常用大写字母X、Y、Z或小写希腊字母、等表示。(2)随机变量X随着试验结果而取不同的值,因而在试验结束之前,只知道其可能的取值范围,而事先不能预知它取什么值,对任意实数区间(a,b),“aXb”的概率是确定的;(3)随机变量X()的值域即为其一切可能取值的全体构成的集合;(4)引入随机变量后,就可以用随机变量描述事件,而且事件的讨论,可以纳入随机变量的讨论中。,例2.1一批产品中任意抽取20件作质量检验,作为检验结果的合格品的件数用X表示,则X是随机变量。X的一切可能取值为0,1,2,20X=0表示事件“抽检的20件产品中没有合格品”;X=1表示事件“抽检的20件产品中恰有1件合格品”;X=k表示事件“抽检的20件产品中恰有k件合格品”。,例2.4一个地铁车站,每隔5分钟有一列地铁通过该站。一位乘客不知列车通过该站的时间,他在一个任意时刻到达该站,则他候车的时间X是一个随机变量,而且X的取值范围是0,5,练习引入适当的随机变量描述下列事件:将3个球随机地放入三个格子中,事件A=有1个空格,事件B=有2个空格,事件C=全有球。进行5次试验,事件D=试验成功一次,事件F=试验至少成功一次,事件G=至多成功3次,关于随机变量(及向量)的研究,是概率论的中心内容这是因为,对于一个随机试验,我们所关心的往往是与所研究的特定问题有关的某个或某些量,而这些量就是随机变量也可以说:随机事件是从静态的观点来研究随机现象,而随机变量则是一种动态的观点,一如数学分析中的常量与变量的区分那样变量概念是高等数学有别于初等数学的基础概念同样,概率论能从计算一些孤立事件的概念发展为一个更高的理论体系,其基础概念是随机变量,随机变量的分类:随机变量,2.2离散型随机变量及其概率分布,一、离散型随机变量及其分布律,1、离散型随机变量的概念,若某个随机变量的所有可能取值是有限多个或可数无穷多个,则称这个随机变量为离散型随机变量。讨论随机变量的目的是要研究其统计规律性,要知道离散型随机变量X的统计规律必须且只须知道X的所有可能取值以及X取每一个可能值的概率。,2、分布律,定义1设离散型随机变量X,其所有可能取值为x1,x2,xk,且取这些值的概率依次为p1,p2,pk,即,则称P(X=xk)=pk(k=1,2,)为随机变量X的概率分布律或称分布律,也称概率函数。分布律可用表格形式表示为:,P(X=xk)=pk,(k=1,2,)而且满足(1)P(X=xk)=pk0,(k=1,2,)(2),#概率分布,例2.5设袋中有5只球,其中有2只白球,3只黑球。现从中任取3只球(不放回),求抽得的白球数X为k的概率。,解,X=k的所有可能取值为0,1,2,X是一个随机变量,解设Ai第i次射击时命中目标,i=1,2,3,4,5则A1,A2,A5相互独立,且P(Ai)=p,i=1,2,5。SX=0,1,2,3,4,5,例2.6某射手对目标独立射击5次,每次命中目标的概率为p,以X表示命中目标的次数,求X的分布律。,例:某人骑自行车从学校到火车站,一路上要经过3个独立的交通灯,设各灯工作独立,且设各灯为红灯的概率为p,0p1,以X表示首次停车时所通过的交通灯数,求X的概率分布律。,解:,二、几个常用的离散型随机变量的概率分布律,1、两点分布定义2若一个随机变量X只有两个可能取值,且其分布为:PX=x1=p,PX=x2=1-p,(0p1)则称X服从x1,x2处参数为p的两点分布。,特别地,若X服从x1=1,x2=0处参数为p的两点分布,即,则称X服从参数为p的0-1分布,即随机变量只可能取0,1两个值,且P(X=1)=p,P(X=0)=1-p,(0p0,n是正整数,若npn=,则对任一固定的非负整数k,有,即当随机变量XB(n,p),(n0,1,2,),且n很大,p很小时,记=np,则,泊松定理表明,泊松分布是二项分布的极限分布,当n很大,p很小时,二项分布就可近似地看成是参数=np的泊松分布。,例2.11某商店出售某种商品,具历史记录分析,每月销售量服从参数=5的泊松分布。问在月初进货时,要库存多少件此种商品,才能以0.999的概率充分满足顾客的需要?,解用X表示每月销量,则XP()=P(5)。由题意,要求k,使得PXk0.999,即,这里的计算通过查Poisson分布表(p.292-294)得到,=5,k=12时,k=13时,k=13即月初进货库存要13件。,例2.12设某国每对夫妇的子女数X服从参数为的泊松分布,且知一对夫妇有不超过1个孩子的概率为3e-2。求任选一对夫妇,至少有3个孩子的概率。,解由题意,2.3随机变量的分布函数,前一节介绍的离散型随机变量,我们可用分布律来完整地描述。而对于非离散型随机变量,由于其取值不可能一个一个列举出来。例如:在测试灯泡的寿命时,可以认为寿命X的取值充满了区间0,+)。由于许多随机变量的概率分布情况不能以其取某个值的概率来表示,因此我们往往关心随机变量X取值落在某区间(a,b上的概率(ab)。由于axb=xb-xa,(ab),因此对任意xR,只要知道事件Xx发生的概率,则X落在(a,b的概率就立刻可得。因此我们用P(Xx)来讨论随机变量X的概率分布情况。P(Xx):“随机变量X取值不超过x的概率”。,定义1设X是一随机变量,x是任意实数,则实值函数F(x)PXx,x(-,+)称为随机变量X的分布函数。有了分布函数定义,任意x1,x2R,x1x2,随机变量X落在(x1,x2里的概率可用分布函数来计算:Px1Xx2PXx2PXx1F(x2)F(x1).,在这个意义上可以说,分布函数完整地描述了随机变量的统计规律性,或者说,分布函数完整地表示了随机变量的概率分布情况。,一、分布函数的概念,二、分布函数的性质,1、单调不减性:若x1x2,则F(x1)F(x2);2、归一性:对任意实数x,0F(x)1,且,3、右连续性:,反之,具有上述三个性质的实函数,必是某个随机变量的分布函数。故该三个性质是分布函数的充分必要性质。,例2.16向0,1区间随机抛一质点,以X表示质点坐标。假定质点落在0,1区间任一子区间内的概率与区间长成正比,求X的分布函数。解F(x)=P(Xx),当x1时,F(x)=1,当0x1时,特别,F(1)=P(0x1)=k=1,例2.14设随机变量X具分布律如下表,解,试求出X的分布函数。,一般地,X是离散型随机变量,其概率分布律为P(X=xk)=pk,(k=1,2,)则X的分布函数F(x)为,F(x)的图像:非降,右连续,且在x1,x2,xk,处跳跃。,离散型随机变量X的分布函数的性质(1)分布函数是分段函数,分段区间是由X的取值点划分成的左闭右开区间;(2)函数值从0到1逐段递增,图形上表现为阶梯形跳跃递增;(3)函数值在点x=xi处有跳跃,其跳跃高度恰为xi点对应的概率值;(4)分布函数是右连续的;(5)P(X=xi)=F(xi)-F(xi-0),用分布函数描述随机变量不如分布律直观,对非离散型随机变量,是否有更直观的描述方法?,?,a,b,2.4连续型随机变量,1、定义1设F(x)是随机变量X的分布函数,若存在非负可积函数f(x),(-x+),使对一切实数x,均有,则称X为连续型随机变量,且称f(x)为随机变量X的概率密度函数,简称概率密度或密度函数,一、连续型随机变量及其概率密度函数,X连续型随机变量,则X的分布函数必是连续函数。,(1)非负性f(x)0,(-x+);,2、密度函数的性质,(2),(3)归一性,事实上,(4)若f(x)在x处连续,则有,(5)f(x)在x0处连续,且h充分小时,有,f(x)称为概率密度的原由。,密度函数的几何意义为,密度函数曲线位于Ox轴上方。,即y=f(x),x=a,x=b,x轴所围成的曲边梯形面积。,对任意实数c,若X的密度函数为f(x),(-0),f(x)的图像为,(1)单峰对称密度曲线关于直线x=对称,即f(+x)=f(-x),x(-,+),正态分布密度函数f(x)的图形特征,(2)x=时,f(x)取得最大值f()=;,(3)x=处有拐点;,(4)的大小直接影响概率的分布,越大,曲线越平坦,越小,曲线越陡峭。(如图),正态分布也称为高斯(Gauss)分布,(5)曲线f(x)以x轴为渐近线。,易知,且,正态分布随机变量X的分布函数为,其图像为,Ox,F(x),1,标准正态分布当参数0,21时,称随机变量X服从标准正态分布,记作XN(0,1)。,分布函数表示为,其密度函数表示为,Ox,1,(x),标准正态分布的密度函数与分布函数的图像分别为,可得,对于标准正态分布的分布函数(x)的函数值,书后附有标准正态分布表(P295)。表中给出了x0的函数值。当xup)=p,则称up为标准正态分布的p分位点。,UpOx,p,正态随机变量的3原则(P52):设XN(,2),在工程应用中,通常认为P|X|31,忽略|X|3的值。如在质量控制中,常用标准指标值3作两条线,当生产过程的指标观察值落在两线之外时发出警报,表明生产出现异常。,在一次试验中,正态分布的随机变量X落在以为中心,3为半径的区间(-3,+3)内的概率相当大(0.9973),即X几乎必然落在上述区间内,或者说在一般情形下,X在一次试验中落在(-3,+3)以外的概率可以忽略不计。,一、离散型随机变量的函数的分布律,2.5随机变量的函数的分布,设X一个随机变量,分布律为XP(Xxk)pk,k1,2,则当Yg(X)的所有取值为yj(j1,2,)时,随机变量Y有如下分布律:P(Yyj)qj,j1,2,其中qj是所有满足g(xi)=yj的xi对应的X的概率P(Xxi)pi的和,即,例2.26设离散型随机变量X有如下分布律,试求随机变量Y=(X-3)2+1的分布律,解Y的所有可能取值为1,5,17,故,Y的分布律为,二、连续型随机变量的函数的分布,1、一般方法设连续型随机变量X的概率密度函数为fX(x),(-x+),Y=g(X)为随机变量X的函数,则Y的分布函数为FY(y)P(Yy)P(g(X)y),从而Y的概率密度函数fY(y)为,此法也叫“分布函数法”,例2.27设随机变量,求Y=3X+5的概率密度。,解先求Y=3X+5的分布函数FY(y),Y的概率密度函数为,例2.28设XU(-1,1),求Y=X2的分布函数与概率密度。,当y0时,,当0y0),标准正态分布XN(0,1),密度函

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论