版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
(3)在检查一批棉花的质量时,既要注意纤维的平均长度,又要注意纤维长度与平均长度的偏离程度,平均长度较大、偏离程度较小,质量就较好。从上面的例子看到,与随机变量有关的某些数值,虽然不能完整地描述随机变量,但能描述随机变量在某些方面的重要特征。这些数字特征在理论和实践上都具有重要的意义。现在是1页\一共有101页\编辑于星期四第四章随机变量的数字特征4.1随机变量的数学期望(一)4.2随机变量的数学期望(二)4.3随机变量的方差(一)4.4随机变量的方差(二)4.5协方差与相关系数4.6其它特征数现在是2页\一共有101页\编辑于星期四4.1随机变量的数学期望(一)
(Mathematicalexpectationofrandomvariable)
4.1.1数学期望的概念“期望”在我们日常生活中常指有根据的希望,在概率论中,它源于历史上一个著名的分赌本问题:
例4.1.1(分赌本问题)17世纪中叶,一位赌徒向法国数学家帕斯卡(1623-1662)提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局.他们约定,谁先赢三局则得到全部100法郎的赌本.当甲赢了两局,乙赢了一局时,因故要中止赌博,现问这100法郎如何分才算公平?现在是3页\一共有101页\编辑于星期四分析第一种分法:甲得1001/2=50(法郎)乙得1001/2=50(法郎)第二种分法:甲得1002/367(法郎)乙得1001/333(法郎)这两种方法都没有考虑到如果继续比下去会出现什么样的结果,没有照顾到两人在现有基础下对比赛结果的一种期待,双方均不满意.首席数学家帕斯卡,帕斯卡认为甲的最终所得可能为:0或100再赌两局比赛必定结束,其结果不外乎以下四种:(甲赢甲赢)(甲赢乙赢)(乙赢甲赢)(乙赢乙赢)于是,他们去求助法国的现在是4页\一共有101页\编辑于星期四于是甲赢得法郎数X的分布列为帕斯卡认为甲的“期望”所得应为01/4+1003/4=75(法郎)乙的“期望”所得应为100-75=25法郎.这种方法照顾到了已赌局数,又包括了再赌下去的一种“期望”,它比前两种方法都更为合理.这就是数学期望这个名称的由来,其实这个名称称为“均值”更形象易懂一些,对上例而言,也就是再赌下去的话,甲“平均”可以赢75法郎.X0100P1/43/4现在是5页\一共有101页\编辑于星期四
引例(射击问题)设某射击手在同样的条件下,相继射击90了次,击中情况如下(命中的环数是一个随机变量).试问:该射手每次射击平均命中靶多少环?命中环数k
命中次数nk
012345
21315102030
现在是6页\一共有101页\编辑于星期四解平均击中环数现在是7页\一共有101页\编辑于星期四平均击中环数频率随机波动随机波动随机波动稳定值“平均射中环数”的稳定值“平均击中环数”趋向于“击中环数的可能值与其概率之积的累加”
现在是8页\一共有101页\编辑于星期四设离散随机变量X的分布列为如果那么称为随机变量X的数学期望(mathematicalexpectation)或该分布的数学期望,简称期望或均值.若级数不收敛,则称X的期望不存在.现在是9页\一共有101页\编辑于星期四设连续随机变量X的密度函数为
f(x),如果则称为X的数学期望,或该分布的数学期望,简称期望或均值.若不收敛,则称X的期望不存在.现在是10页\一共有101页\编辑于星期四某车站每天8:009:00,9:0010:00都恰好有一辆客车到站,但到站的时刻是随机的,且两者到站的时间相互独立.其规律是一旅客8:20到车站,求他的平均候车时间.1/6
3/6
2/68:108:308:509:109:309:50概率到站时刻现在是11页\一共有101页\编辑于星期四
解设X=“该旅客的候车时间”(以分钟计)则于是该旅客的平均候车时间为1/6
3/6
2/68:108:308:509:109:309:50概率到站时刻
1030507090XP现在是12页\一共有101页\编辑于星期四若Xb(n,p),则E(X)=np.
证明因为Xb(n,p),所以于是现在是13页\一共有101页\编辑于星期四现在是14页\一共有101页\编辑于星期四
例4.1.4若XP(),则E(X)=.
证明因为XP(),所以于是现在是15页\一共有101页\编辑于星期四在一个人数为N的人群中普查某种疾病,为此要抽验N个人的血。如果将每个人的血分别检验,则共需检验N次,为了能减少工作量,一位统计学家提出一种方法:按k个人一组进行分组,把同组人的血样混合后检验,如果这种混合血样呈现阴性反应,说明这k个人只需要检验一次就够了;如果这种混合血样呈现阳性反应,说明这k个人中至少有一个人的血呈现阳性反应,则再对此k个分别进行检验.假设该疾病的的发病率为p,且每人是否得此疾病相互独立.试问这种方法能否实现减少平均检验次数?现在是16页\一共有101页\编辑于星期四
解令X=“该人群中每个人需要验血的次数”,则所以每人的平均验血次数为X1/k1+1/kP(1-p)k1-(1-p)k现在是17页\一共有101页\编辑于星期四只要适当选择k,就可使验血次数达到最小.譬如,当p=0.1时,有对不同的发病率p,计算出最佳得分组人数k,见下表0.6900.6040.5940.6100.6950.7510.9910.9941.001623458103033340.6970.5940.5340.4660.3840.2740.205344568110.140.100.080.060.040.020.01现在是18页\一共有101页\编辑于星期四有两个相互独立工作的电子装置,它们的寿命X1,X2服从同一指数分布,其密度函数如下
若将这两个电子装置串联组成一个整机,求整机寿命Y的数学期望.现在是19页\一共有101页\编辑于星期四解因为XiExp()(i=1,2),所以Xi的分布函数为于是Y=min{X1,X2}的分布函数为故Y=min{X1,X2}的密度函数为现在是20页\一共有101页\编辑于星期四所以现在是21页\一共有101页\编辑于星期四作业现在是22页\一共有101页\编辑于星期四4.2随机变量的数学期望(二)设XU(a,b),求E(X).
解因为XU(a,b),所以现在是23页\一共有101页\编辑于星期四设XN(,2),则E(X)=.证明因为XN(,2),所以现在是24页\一共有101页\编辑于星期四设X(,),则E(X)=/.证明因为X(,),所以于是现在是25页\一共有101页\编辑于星期四若随机变量X的分布用分布列p(xi)或用密度函数f(x)表示,则X的某一函数g(X)的数学期望为推广:现在是26页\一共有101页\编辑于星期四已知随机变量的分布列如下求Y=X2的数学期望.
解
Y=X2的分布列为X-2-1012P0.20.10.10.30.3X-2-1012Y=X241014P0.20.10.10.30.3现在是27页\一共有101页\编辑于星期四对相同的值合并,并把对应的概率相加,可得所以E(Y)=E(X2)=00.1+10.4+40.5=2.4或
E(Y)=E(X2)
=(-2)20.2+(-1)20.1+020.1+120.3+220.3=2.4Y014P0.10.40.5现在是28页\一共有101页\编辑于星期四数学期望的常用性质(1)若c是常数,则E(c)=c;(2)对任意的常数a,有E(aX)=aE(X);(3)对任意的两个变量X,Y,有
E(XY)=E(X)E(Y)推广:对任意的随机变量X,Y,有E[g1(X)
g2(Y)]=E[g1(X)
]E[g2(Y)](4)若随机变量X,Y相互独立,则E(XY)=E(X)E(Y)现在是29页\一共有101页\编辑于星期四某公司经销某种原料,历史资料表明:该原料的市场需求量X(单位:吨)服从(300,500)上的均匀分布.每出售一顿该原料,公司可获利润1.5(万元);若积压1吨,则公司损失0.5(万元).问公司应该组织多少货源,可使平均收益最大?
一、模型假设:市场需求量XU(300,500).二、模型建立:公司收益Y(万元)与市场需求量X和组织的货源a吨有关,即现在是30页\一共有101页\编辑于星期四公司收益Y=g(X)也是随机变量,其数学期望为则故公司组织450吨货源,可使平均收益最大.令f(a)三、模型求解:现在是31页\一共有101页\编辑于星期四一民航客车载有20位旅客自机场开出旅客有10车站可以下车,如到达一个车站没有旅客下车就不停车.以X表示停车的次数,求该客车的平均停车次数.(假设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立)解令Xi=“第i个车站停车的次数”,i=1,2,…,10.则Xib(1,
1-0.920),(i=1,2,…,10),且X=X1+X2+…+X10.于是E(X)=E(X1+X2+…+X10)=E(X1)
+E(X2)
+…+E(X10)=(1-0.920)
+(1-0.920)
+…+(1-0.920)
=10(1-0.920)8.784现在是32页\一共有101页\编辑于星期四作业现在是33页\一共有101页\编辑于星期四4.3随机变量的方差(一)
随机变量X的数学期望E(X)是一种位置特征数,它反应了X取值的集中位置,但它无法反映出X取值的“波动”程度.譬如,已知X与Y的分布列分别为则E(X)=0=E(Y).但显然Y的取值要比X的取值波动大。为了用数值来反映出随机变量取值的“波动”大小,引入了方差与标准差这两个特征数。X-101P1/31/31/3Y-1000100P1/31/31/3现在是34页\一共有101页\编辑于星期四设X为随机变量,若E[X-E(X)]2存在,则称其随机变量X的方差(Variance)或该分布的方差,记为D(X)或Var(X).即称为X的标准差,记为(X)或X.方差和标准差的取值都是非负数,它们都是用来描述随机变量取值集中(或分散)程度的特征数.由于标准差与所讨论的随机变量、数学期望有相同的量纲,所以在实际中,人们比较乐意选用标准差.现在是35页\一共有101页\编辑于星期四某人有一笔资金,可投入房地产和商业,其收益都与市场状态有关.若把未来市场分为好、中、差三个等级,其发生的概率分别为0.2,0.7,0.1.通过调查该投资者认为投资于房地产的收益X(万元)和投资于商业的收益Y(万元)的分布分别为试问该投资者投资哪个项目为好?X113-3P0.20.70.1Y64-1P0.20.70.1现在是36页\一共有101页\编辑于星期四解
E(X)=110.2+30.7+(-3)0.1=4.0(万元)E(Y)=60.2+40.7+(-1)0.1=3.9(万元)从平均收益看,投资房地产比投资商业更划算.所以因为标准差越大收益的波动就越大,从而风险也越大.若综合权衡收益和风险,选择投资房地产的平均收益相对投资商业多了0.1万元,仅仅多出1/39,但风险却提高了一倍还多,故投资商业比较划算.由于现在是37页\一共有101页\编辑于星期四方差的常用性质(1)D(X)=E(X2)-E2(X);(2)对任意的常数c,有D(c)=0;(3)若a,b为常数,则D(aX+b)=a2D(X);(4)若随机变量X,Y相互独立,则
D(X+Y)=
D(X)+D(Y)(5)D(X)=0P(X=c)=1.现在是38页\一共有101页\编辑于星期四随机变量的标准化设随机变量X具有数学期望E(X)=,方差D(X)=20,令则于是称X*为X的标准化随机变量.现在是39页\一共有101页\编辑于星期四常见分布的方差(1)两点分布设Xb(1,p),则E(X)=p,D(X)=pq=p(1-p).证明因为Xb(1,p),所以P(X=1)=p,P(X=0)=1-p=q.故E(X)=pE(X2)=12p+02q=p所以D(X)=E(X2)-E2(X)=p-p2=p(1-p)=pq.现在是40页\一共有101页\编辑于星期四(2)二项分布若Xb(n,p),则E(X)=np,D(X)=npq.证明令Xib(1,p)
(i=1,2,…
,n),且相互独立.则D(Xi)=pq(i=1,2,…
,n),X=X1+X2+…+Xn.所以现在是41页\一共有101页\编辑于星期四(3)泊松分布若XP(),则E(X)=
,D(X)=.证明因为XP(),所以故D(X)=E(X2)-E2(X)=2+-2=.现在是42页\一共有101页\编辑于星期四(4)几何分布(Geometrydistribution)若XGe(p),则E(X)=1/p
,D(X)=q/p2
.证明
略
(5)超几何分布若Xh(n,N,M),则证明
略
(6)巴斯卡(Pascal)分布若XNb(r,p),则E(X)=r/p
,D(X)=rq/p2.证明
略现在是43页\一共有101页\编辑于星期四
(1)均匀分布若XU(a,b),则
证明因为XU(a,b),所以故D(X)=E(X2)-E2(X)现在是44页\一共有101页\编辑于星期四(2)伽玛分布若X(,),则E(X)=/
,D(X)=/2
.证明因为X(,),所以于是D(X)=E(X2)-E2(X)现在是45页\一共有101页\编辑于星期四(3)正态分布若XN(,2),则E(X)=
,D(X)=2.
证明因为XN(,2),所以现在是46页\一共有101页\编辑于星期四推广若XiN(i,i2),i=1,2,…,n,且相互独立,则存在不全为零的常数k1,k2,…,kn,使得常用分布表现在是47页\一共有101页\编辑于星期四若XN(1,3),YN(2,4),且X,Y相互独立求证Z=2X-3YN(-4,48).证明因为XN(1,3),YN(2,4),且X,Y相互独立所以Z=2X-3Y服从正态分布,且E(X)=1,D(X)=3,E(Y)=2,D(Y)=4于是E(Z)=E(2X-3Y)=2E(X)-3E(Y)=21-32=-4D(Z)=D(2X-3Y)=4D(X)+9D(Y)=43+94=48故Z=2X-3YN(-4,48).现在是48页\一共有101页\编辑于星期四设活塞的直径XN(22.4,0.032),气缸的直径YN(22.5,0.042),且X,Y相互独立,任取一只活塞,一只气缸,求活塞能装入气缸的概率.
解因为XN(22.4,0.032)
,YN(22.5,0.042)且X,Y相互独立.所以X-YN(-0.1,0.0025)
故现在是49页\一共有101页\编辑于星期四
定理4.4.1(Chebyshev不等式)设随机变量X满足E(X)=,方差D(X)=2,则对于任意正数,有证明(1)因为E(X)=,D(X)=2,所以现在是50页\一共有101页\编辑于星期四(2)因为E(X)=,D(X)=2,所以现在是51页\一共有101页\编辑于星期四作业现在是52页\一共有101页\编辑于星期四4.5协方差与相关系数
二维联合分布中除含有各分量的边际分布外,还含有两个分量间相互关联的信息,协方差就是描述这种关联程度的一个特征数,其定义如下:设(X,Y)是二维随机变量,如果数学期望E[X-E(X)][Y-E(Y)]存在,则称此期望为X与Y的协方差(Covariance),记为Cov(X,Y),即
特别地,Cov(X,X)=D(X).现在是53页\一共有101页\编辑于星期四从协方差的定义可以看出,它是X的偏差[X-E(X)]与Y的偏差[Y-E(Y)]乘积的数学期望.由于偏差可正可负也可以为零,故协方差可正可负,也可以为零,其具体表现如下:(1)当Cov(X,Y)0时,称X与Y正相关.此时两个偏差[X-E(X)]与[Y-E(Y)]同时增大或减小,而两个数学期望E(X)与E(Y)都是常数,所以X与Y同时增加或同时减少.现在是54页\一共有101页\编辑于星期四(2)当Cov(X,Y)0时,称X与Y负相关.此时两个偏差[X-E(X)]与[Y-E(Y)]一个增大,另一个减小;而两个数学期望E(X)与E(Y)都是常数,所以X与Y一个增大,另一个减小.(3)当Cov(X,Y)=0时,称X与Y不(线性)相关.现在是55页\一共有101页\编辑于星期四协方差的性质(1)Cov(X,Y)=E(XY)-E(X)E(Y).(2)对任意的常数c,有Cov(X,c)=0.(3)若有X,Y相互独立,则Cov(X,Y)=0;反之不然.(4)Cov(X,Y)=Cov(Y,X).(5)a,bR,有Cov(aX,bY)=abCov(X,Y).(6)Cov(XY,Z)=Cov(X,Z)Cov(Y,Z).(7)a,b,c,dR,有Cov(aX+b,cY+d)=acCov(X,Y).(8)D(XY)=D(X)D(Y)2Cov(X,Y).现在是56页\一共有101页\编辑于星期四相关系数(Correlation)
协方差Cov(X,Y)是有量纲的量,譬如X表示人的身高,单位是米(m),Y表示人的体重,单位是公斤(kg),则协方差Cov(X,Y)带有量纲(mkg).为了消除量纲的影响,现对协方差除以相同量纲的量,就得到一个新的概念——相关系数.设(X,Y)是二维随机变量,且D(X)0
D(Y)0,则称为X与Y的(线性)相关系数(Correlation).现在是57页\一共有101页\编辑于星期四(1)X与Y的相关系数(X,Y)是个无量纲的量.(2)Cov(X,Y)与(X,Y)同符号,故从它的取值也可反应出X与Y的正相关,负相关和不相关.(3)相关系数(X,Y)的另一个解释是:它是X与Y相应标准化变量X*与Y*的协方差Cov(X*,Y*).现在是58页\一共有101页\编辑于星期四定理4.5.1(相关系数的性质)(1)|XY|1;(2)|XY|=1常数a,b,使得
P(Y=aX+b)=1.
X,Y几乎处处线性相关.现在是59页\一共有101页\编辑于星期四说明(1)若XY=0,称X与Y不(线性)相关,但它们之间可能有其他的关系.譬如:平方关系,对数关系等.(2)若XY=1,则称X与Y完全正相关;若XY=-1,则称X与Y完全负相关.(3)若0
<|XY|<1,则称X与Y有“一定程度”的线性关系
|XY|越接近于1,则X与Y的线性相关程度越高;
|XY|越接近于0,X与Y的线性相关程度越低.但协方差看不出这一点.若协方差很小,而其两个标准差X,Y也很小,则其比值就不一定很小.现在是60页\一共有101页\编辑于星期四设(X,Y)的联合密度函数为试求X与Y的相关系数XY.现在是61页\一共有101页\编辑于星期四解现在是62页\一共有101页\编辑于星期四于是现在是63页\一共有101页\编辑于星期四本题的协方差很小,可是相关系数并不小.从相关系数XY
=0.8243看,X与Y有相当程度的正相关;当从相应的协方差Cov(X,Y)=0.0471看,X与Y的相关性很微弱,几乎可以忽略不计.造成这种错觉的原因在于是没有考虑标准差.若两个标准差都很小,即使是协方差小一些,相关系数也能显示一定程度的相关性.由此可见,在协方差的基础上加工形成的相关系数是更为重要的相关性的特征数.现在是64页\一共有101页\编辑于星期四若(X,Y)N(1,2,12,
22,),求证XY=.证明一
现在是65页\一共有101页\编辑于星期四故现在是66页\一共有101页\编辑于星期四证明二令
现在是67页\一共有101页\编辑于星期四则于是故现在是68页\一共有101页\编辑于星期四一般场合,独立必然导致不相关,不相关推不出独立.但也有例外,如下面的例子.若(X,Y)N(1,12,
2,22,),则X与Y相互独立X与Y不相关=0.证明由以前的结论知XY=
,故只需证明X与Y不相关=0(1)必要性因为XN(1,12,
2,22,0),所以现在是69页\一共有101页\编辑于星期四且XN(1,12),XN(2,22),于是故所以X与Y相互独立.现在是70页\一共有101页\编辑于星期四(2)充分性因为X与Y相互独立,所以f(x,y)=fX(x)fY(y)即所以=0.现在是71页\一共有101页\编辑于星期四作业现在是72页\一共有101页\编辑于星期四4.6分布的其它特征数(FigureCharacteristic)数学期望和方差是随机变量最重要的两个特征数,此外,随机变量还有一些其他的特征数。4.6.1K阶矩设X为随机变量,k为正整数.如果以下的数学期望都成存在,则(1)X的k阶原点矩:(2)X的k阶中心矩:现在是73页\一共有101页\编辑于星期四(3)X与Y的k+l阶混合原点矩:(4)X与Y的k+l阶混合中心矩:
由于|X|k-1
|X|k+1,所以若X的k阶矩存在,则X的k-1阶矩也存在,进而低于k阶的各阶矩都存在.现在是74页\一共有101页\编辑于星期四
4.6.3协方差矩阵二维随机变量(X1,X2)有四个二阶中心矩(假设它们都存在),它们分别为于是(X1,X2)的协方差矩阵为现在是75页\一共有101页\编辑于星期四设(X1,X2,…,Xn)的二阶混合中心矩都存在,令则(X1,X2,…,Xn)的协方差矩阵为因而上述矩阵是一个对称矩阵.现在是76页\一共有101页\编辑于星期四
n维正态随机变量具有四条重要性质:(1)n维正态随机变量(X1,X2,…,Xn)的每一个分量都是正态变量;反之,若(X1,X2,…,Xn)的每一个分量都是正态随机变量,且相互独立,则是(X1,X2,…,Xn)
n维正态随机变量。(2)n随机变量(X1,X2,…,Xn)是正态分布的充要条件是它的任意线性组合:a1X1+a2X2+…+anXn+a0(其中,a12+a22+…+an20)都服从一维正态分布.现在是77页\一共有101页\编辑于星期四(3)若(X1,X2,…,Xn)服从n维正态分布,Y1,Y2,…,Ym是X1,X2,…,Xn的线性函数,则(Y1,Y2,…,Ym)也服从正态分布.上述性质称为正态变量的线性变换不变性.(4)设(X1,X2,…,Xn)服从n维正态分布,则“X1,X2,…,Xn相互独立”“X1,X2,…,Xn两两不相关”.现在是78页\一共有101页\编辑于星期四作业没有现在是79页\一共有101页\编辑于星期四证明
返回现在是80页\一共有101页\编辑于星期四证明
返回现在是81页\一共有101页\编辑于星期四证明现在是82页\一共有101页\编辑于星期四(2)D(C)=0,其中c为常数.证明现在是83页\一共有101页\编辑于星期四(3)若a,b为常数,则D(aX+b)=a2D(X)证明现在是84页\一共有101页\编辑于星期四4)若随机变量X,Y相互独立,则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大豆油脂提取技术改进方案
- 2025山东省财金投资集团有限公司招聘6人笔试历年典型考点题库附带答案详解试卷3套
- 2025天津普林校园招聘笔试历年典型考点题库附带答案详解试卷3套
- 煤矿风井项目环境影响报告书
- 2025中国安能集团第二工程局有限公司南昌分公司招聘23人笔试历年备考题库附带答案详解试卷3套
- 地下管网改造及污水处理厂提标扩建项目建设工程方案
- 混凝土搅拌站物流与运输优化方案
- 方城公务员考试试题及答案
- 2025年及未来5年市场数据中国无机酸制造行业市场前景预测及投资战略咨询报告
- 赤壁市公务员考试试题及答案
- (高立牌)SC型施工升降机说明书
- 中医基础理论-初级课件
- 失智失能老年人的睡眠照护(失智失能老人健康照护课件)
- (高清版)DZT 0342-2020 矿坑涌水量预测计算规程
- 中医经络养生拍打
- 人教新版英语五年级上册《UNIT4第二十二课》课件
- 血液透析患者血清白蛋白变化及其临床意义分析
- copd合并心衰护理查房
- 佛教对中国社会的影响和变革
- 平面构成-对比构成的创意设计
- 有限空间作业安全隐患排查清单
评论
0/150
提交评论