协方差及相关系数_第1页
协方差及相关系数_第2页
协方差及相关系数_第3页
协方差及相关系数_第4页
协方差及相关系数_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、协方差和相关系数的概念和性质,二、相关系数的意义,三、总结,三节协方差和相关系数,、前我们学习随机变量的数学期望和方差,对多维随机变量,除了其数学期望和方差外,还研究反映各分量之间关系的数字特征。 其中最重要的是现在要研究的协方差和相关系数,一.问题的提出,一、协方差和相关系数的概念和性质,在研究此问题之前先看一例。 在研究孩子和父母的相似度时,一是父亲的身高与其成人儿子的身高的关系。 这里有两个变量,一个是父亲的身高,一个是成年儿子的身高。 为了研究这两者的关系,英国统计学家皮尔逊收集了1078名父亲和成年儿子的身高数据,画了散布图。 问:父亲和其成年儿子的身高有什么关系呢,类似的问题是:1,吸烟和肺癌有关系吗? 定义两个随机向量(x,y ),并且如果E(X-EX)(Y-EY )存在,则cov(X,Y)=E(X-EX)(Y-EY )被称为x和y的协方差。 特别地,如果X=Y,则cov(X,X)=E(X-EX)2=D(X ),因此方差是协方差的特性,并且协方差描绘了两个随机变量之间的“某个”关系。 如果(x,y )遵循二维正态分布,即2 .定义,如果x和y独立,则4 .计算协方差的简单的公式,cov(X, Y)=0.cov(X Y)=E(XY)-E(X)E(Y ),D(X Y)=D(X) D(Y) 2Cov(X,y ),3随机变量与方差的关系,(5)Cov(X1 X2,Y)=Cov(X1,y ),(3)Cov(X,Y)=Cov(Y,x ) (对称性),5 .简单的性质,(4=abCov(X,y )其中,a、b为常数,因此请利用上述所学知识,(1)Cov(X,X)=D(X )、(2)Cov(X,c)=0(c为常数),协方差的数值在某种程度上反映了x与y的相互关系,但受x与y自身的数值大小的影响。 如果设X*=kX,Y*=kY,则X*和Y*相互关系与x和y的相互关系应该相同,但Cov(X*,Y*)=k2Cov(X, y )为了克服这个缺点,在计算x和y的协方差之前,先将x和y归一化:然后通过计算X*和Y*的协方差来导入相关系数的概念,假设为随机变量x和y的相关系数;在不引起混淆的情况下,标记为2,相关系数,2,相关系数的性质,并且|XY|的幅度为x, 注意反映了y之间的线性关系的紧密度:XY=0,如果x、y之间没有线性关系|XY|=1,则在x、y之间具有线性关系,XY0,x, y正相关度XY0,完全负相关度Y=aX ba0,方差越小,事件|x-E(X)|的发生概率越小,即x的取值集中在E(X )附近,表示方差确实是描述随机变量及其期望值的方差的程度的变量。 如果D(X )是已知的,切比舍夫不等式表示x和e(x )的偏差很小的概率的估计值。 (二)估计事件的概率; 已知例1正常男性成人血液中,每毫升白细胞数平均为7300,平均方差为700。 利用切比雪夫不等式,推定每毫升白细胞数为52009400的概率。 解:将每ml白细胞数设为x,按问题区分,E(X)=7300,D(X)=7002,求出P(5200X9400 ),p (5200 x 9400 )=p (-2100 x-e (x ) 2100 ),=P|X-E(X)|2100 ),切比雪夫不等式,P|X-E(X)|2100。 白细胞数每毫升52009400之间的概率估计为8/9 .以上,例2电站的供电网设置了10000个电灯,晚上灯点亮的概率全部为0.7,假设灯的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论