概率四章蓝底_第1页
概率四章蓝底_第2页
概率四章蓝底_第3页
概率四章蓝底_第4页
概率四章蓝底_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率四章蓝底第1页,共78页,2023年,2月20日,星期一第一节数学期望第二节方差第三节协方差与相关系数第四节矩、协方差矩阵本章主要内容第2页,共78页,2023年,2月20日,星期一

在前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X的概率分布,那么X的全部概率特征也就知道了.然而,在实际问题中,概率分布一般是较难确定的.而在一些实际应用中,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.第3页,共78页,2023年,2月20日,星期一

因此,在对随机变量的研究中,确定某些数字特征是重要的.我们先介绍随机变量的数学期望.在这些数字特征中,最常用的是期望和方差第4页,共78页,2023年,2月20日,星期一第一节数学期望第5页,共78页,2023年,2月20日,星期一例:某种产品即将投放市场,根据市场调查估计每件产品有60%的把握按定价售出,20%的把握打折售出及20%的可能性低价甩出。上述三种情况下每件产品的利润分别为5元,2元和-4元。厂家对每件产品可获利多少?解:设X表示一件产品的利润(单位:元),X的分布律为X52-4P0.60.20.2X的数学期望:虽然任一件产品投放市场都有亏损的风险,但每件产品的平均利润为2.6元,还是有利可图的。第6页,共78页,2023年,2月20日,星期一一、数学期望的概念

E(X)是一个实数,得到随机变量的“平均数”,形式上是X的可能值的加权平均数,实质上它体现了X取值的真正平均。又称E(X)为X的平均值,简称均值。它完全由X的分布所决定,又称为分布的均值.为随机变量X的数学期望,简称期望,记为E(X),即第7页,共78页,2023年,2月20日,星期一例1:设X服从参数为p的(0-1)分布,求E(X)。解:X的分布律为X01Pqp0<p<1,q=1-p第8页,共78页,2023年,2月20日,星期一例3:设X~b(n,p),求E(X)。解:X的分布律为则:第9页,共78页,2023年,2月20日,星期一第10页,共78页,2023年,2月20日,星期一第11页,共78页,2023年,2月20日,星期一例5:设X

的密度函数如下,求E(X)第12页,共78页,2023年,2月20日,星期一例6设X~U(a,b),求E(X)。第13页,共78页,2023年,2月20日,星期一第14页,共78页,2023年,2月20日,星期一第15页,共78页,2023年,2月20日,星期一

1.问题的提出:设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望.那么应该如何计算呢?如何计算随机变量函数的数学期望?二、随机变量函数的期望第16页,共78页,2023年,2月20日,星期一一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来.一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来.使用这种方法必须先求出随机变量函数g(X)的分布,一般是比较复杂的.那么是否可以不先求g(X)的分布而只根据X的分布求得E[g(X)]呢?第17页,共78页,2023年,2月20日,星期一定理1:

设Y是随机变量X

的函数,即Y=g(X),g(x)是连续函数。第18页,共78页,2023年,2月20日,星期一设X是连续型随机变量,且y=g(x)满足第二章中定理的条件。则由定理的结论知Y的概率密度为证明第19页,共78页,2023年,2月20日,星期一推广:

设Z是随机向量(X,Y)的函数,即Z=g(X,Y)(g(x,y)是连续函数)第20页,共78页,2023年,2月20日,星期一该定理的重要性在于:当我们求E[g(X)]时,不必知道g(X)的分布,而只需知道X的分布就可以了.这给求随机变量函数的期望带来很大方便.即:如求连续型随机变量函数的数学期望并不要求知道其密度函数,只需知道作为自变量的随机变量的密度函数即可。第21页,共78页,2023年,2月20日,星期一例9:设X~N(0,1),求E(X2)第22页,共78页,2023年,2月20日,星期一例10:设圆的直径X~U(a,b),求圆的面积的期望。第23页,共78页,2023年,2月20日,星期一定理2:

设随机变量X,Y的数学期望E(X),E(Y)存在.注:1)性质(3)和(4)可推广到n个随机变量的情形.三、数学期望的性质第24页,共78页,2023年,2月20日,星期一(诸Xi独立时)由E(XY)=E(X)E(Y)不一定能推出X,Y独立第25页,共78页,2023年,2月20日,星期一例11:将n封不同的信的n张信笺与n个信封进行随机匹配,记X表示匹配成对数,求E(X)。则Xi(1≤i≤n)是服从0-1分布的随机变量,第26页,共78页,2023年,2月20日,星期一类似有:把数字1,2,…,n任意地排成一列,如果数字k恰好出现在第k个位置上,则称为一个巧合,求巧合个数的数学期望.由于E(Xk)=P(Xk=1)解:设巧合个数为X,

k=1,2,…,n则故引入第27页,共78页,2023年,2月20日,星期一例12:一民航送客车载有20位旅客自机场开出,旅客可以有10个车站可以下车,如到达一个车站没有旅客下车就不停车,以X表示停车的次数,求E(X)(设每位旅客在各个车站下车是等可能的,并设个旅客是否下车相互独立)第28页,共78页,2023年,2月20日,星期一解:引入随机变量在第i次有人下车在第i次没有人下车i=0,1…10第29页,共78页,2023年,2月20日,星期一第30页,共78页,2023年,2月20日,星期一例13设甲、乙两人玩必分胜负的赌博游戏,假定游戏的规则不公正,以致两人获胜的概率不等,甲为p,乙为q,p>q,p+q=1.为了补偿乙的不利地位,另行规定两人下的赌注不相等,甲为a,乙为b,a>b.现在的问题是:a究竟应比b大多少,才能做到公正?下面我们给出数学期望应用的一个例子.第31页,共78页,2023年,2月20日,星期一解:设甲赢的钱数为X,乙赢的钱数为Y,为对双方公正,应有依题意E(X)=bp+(-a)q,E(Y)=aq+(-b)pbp-aq=aq-bp=0,故第32页,共78页,2023年,2月20日,星期一例如,某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:若让你就上述结果评价一下两台仪器的优劣,你认为哪台仪器好一些呢?乙仪器测量结果

甲仪器测量结果较好测量结果的均值都是a因为乙仪器的测量结果集中在均值附近第二节方差第33页,共78页,2023年,2月20日,星期一为此需要引进另一个数字特征,用它来度量随机变量取值在其中心附近的离散程度.这个数字特征就是我们这一节要介绍的方差第34页,共78页,2023年,2月20日,星期一方差是随机变量X与其“中心”E(X)的偏差平方的平均。方差刻划了随机变量的取值对于其数学期望的离散(偏离)程度.第35页,共78页,2023年,2月20日,星期一第36页,共78页,2023年,2月20日,星期一注:若方差D(X)=0,则随机变量X

以概率1取常数值.计算方差的一个简化公式

D(X)=E(X2)-[E(X)]2

展开证:D(X)=E[X-E(X)]2=E{X2-2XE(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2利用期望性质

即D(X)=0P{X=C}=1,这里C=E(X)第37页,共78页,2023年,2月20日,星期一第38页,共78页,2023年,2月20日,星期一方差的性质设随机变量X与Y的方差存在,则第39页,共78页,2023年,2月20日,星期一第40页,共78页,2023年,2月20日,星期一可推广为:若X1,X2,…,Xn相互独立,则注:(4)可推广到n个相互独立随机变量的情形。第41页,共78页,2023年,2月20日,星期一例:设一次试验中事件A发生的概率为p,则在n次这样的独立重复试验中事件A发生的次数X~B(n,p),求E(X),D(X).解:X的分布律为第i次试验中A发生第i次试验中A不发生则Xi(1≤i≤n)是服从0-1分布的随机变量且有第42页,共78页,2023年,2月20日,星期一又E(Xi)=p,D(Xi

)=p(1-p)

(1≤i≤n)第43页,共78页,2023年,2月20日,星期一几种重要随机变量的方差X01P1-pp第44页,共78页,2023年,2月20日,星期一第45页,共78页,2023年,2月20日,星期一第46页,共78页,2023年,2月20日,星期一第47页,共78页,2023年,2月20日,星期一第48页,共78页,2023年,2月20日,星期一第49页,共78页,2023年,2月20日,星期一注:正态随机变量的概率密度中的两个参数u,σ2分别就是该随机变量的数学期望和方差,故正态随机变量的分布完全由它的数学期望和方差所确定。随机变量的分布完全可由它的数学期望和方差来确定。第50页,共78页,2023年,2月20日,星期一例2设随机变量X和Y相互独立,且X~N(1,2),Y~N(0,1).试求Z=2X-Y+3的概率密度.

故X和Y的联合分布为正态分布,X和Y的任意线性组合是正态分布.解:X~N(1,2),Y~N(0,1),且X与Y独立,D(Z)=4D(X)+D(Y)=8+1=9E(Z)=2E(X)-E(Y)+3=2+3=5即Z~N(E(Z),D(Z))Z~N(5,32)第51页,共78页,2023年,2月20日,星期一故Z的概率密度是Z~N(5,32)第52页,共78页,2023年,2月20日,星期一前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是本节要讨论的协方差和相关系数第三节协方差与相关系数第53页,共78页,2023年,2月20日,星期一第54页,共78页,2023年,2月20日,星期一若(X,Y)为二维离散型随机变量,其联合分布律为P{X=xi,Y=yj}=pij,i,j=1,2,…若(X,Y)为二维连续型随机变量,其概率密度为f(x,y)第55页,共78页,2023年,2月20日,星期一特别地:Cov(X,X)=E{[X-E(X)][X-E(X)]}=D(X)Cov(Y,Y)=E{[Y-E(Y)][Y-E(Y)]}=D(Y)定义:第56页,共78页,2023年,2月20日,星期一

Cov(X,Y)=E(XY)-E(X)E(Y)

可见,若X与Y独立,Cov(X,Y)=0.计算协方差的一个简单公式由协方差的定义及期望的性质,可得Cov(X,Y)=E{[X-E(X)][Y-E(Y)]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y)即第57页,共78页,2023年,2月20日,星期一例1设(X,Y)的分布律如图所示,0<p<1,求Cov(X,Y)和ρXYX

Y01011-p00p第58页,共78页,2023年,2月20日,星期一例2设(X,Y)的概率密度函数为f(x,y),求Cov(X,Y).第59页,共78页,2023年,2月20日,星期一第60页,共78页,2023年,2月20日,星期一注意1:性质(1)的等价说法是若Cov(X,Y)不等于零,则X与Y不独立,即X与Y之间存在某种关系,所以协方差是反映X,Y之间相互联系的数字特征。注意2:由性质(1)和不相关的定义有:随机变量的独立性能推出不相关性,但反过来不成立。第61页,共78页,2023年,2月20日,星期一注意3:相关系数为1或-1时,X与Y必存在上述线性关系,第62页,共78页,2023年,2月20日,星期一考虑以X的线性函数a+bX来近似表示Y,以均方误差e=E{[Y-(a+bX)]2}来衡量以a+bX近似表示Y的好坏程度,e值越小表示a+bX与Y的近似程度越好.

用微积分中求极值的方法,求出使e

达到最小时的a,b.所以说相关系数刻划了X和Y间“线性相关”的程度.第63页,共78页,2023年,2月20日,星期一=E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y)e=E{[Y-(a+bX)]2}解得即最佳逼近为L(X)=a0+b0X第64页,共78页,2023年,2月20日,星期一

这样求出的最佳逼近为L(X)=a0+b0X这一逼近的余项为若=0,Y与X无线性关系;Y与X有严格线性关系;若可见,若0<|

|<1,|

|的值越接近于1,Y与X的线性相关程度越高;|

|的值越接近于0,Y与X的线性相关程度越弱.E[(Y-L(X))2]=D(Y)(1-

)第65页,共78页,2023年,2月20日,星期一第66页,共78页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论