相关系数的计算_第1页
相关系数的计算_第2页
相关系数的计算_第3页
相关系数的计算_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

相关系数的计算一些前置知识,期望、方差、协方差概念及其相关公式参见定义皮尔逊相关系数,简称相关系数,严格来说,应该称为“线性相关系数”。这是因为,相关系数只是刻画了X,Y之间的“线性”关系程度。换句话说,假如X与Y有其它的函数关系但非线性关系时,用相关系数来衡量是不合理的。相关系数定义为:ρX,Y=cov⁡(X,Y)σXσY=E[(X−EX)(Y−EY)]σXσY=E(XY)−E(X)E(Y)E(X2)−E2(X)E(Y2)−E2(Y)\rho_{X,Y}=\frac{\operatorname{cov}(X,Y)}{\sigma_{X}\sigma_{Y}}=\frac{E\left[\left(X-EX\right)\left(Y-EY\right)\right]}{\sigma_{X}\sigma_{Y}}=\frac{E(XY)-E(X)E(Y)}{\sqrt{E\left(X^{2}\right)-E^{2}(X)}\sqrt{E\left(Y^{2}\right)-E^{2}(Y)}}ρX,Y​=σX​σY​cov(X,Y)​=σX​σY​E[(X−EX)(Y−EY)]​=E(X2)−E2(X)​E(Y2)−E2(Y)​E(XY)−E(X)E(Y)​covcovcov为协方差,σ\sigmaσ为标准差。相关系数有以下性质:若X,YX,YX,Y相互独立,则ρX,Y=0\rho_{X,Y}=0ρX,Y​=0,但ρX,Y=0\rho_{X,Y}=0ρX,Y​=0不能推出X,YX,YX,Y相互独立,等于0的情况称不相关,即独立则不相关,反过来不一定。第一条的例外:当(X,Y)(X,Y)(X,Y)为二维正态时,由相关系数=0能推出X,YX,YX,Y独立−1≤ρX,Y≤1-1\leq\rho_{X,Y}\leq1−1≤ρX,Y​≤1,小于0时为负相关,大于0时为正相关,为当且仅当X,YX,YX,Y有严格线性关系时取等。应用实际应用中,通常用rrr表示相关系数,假如我们有一组样本点(x,y),怎么计算它们的相关系数?基于样本对期望、方差、协方差进行估计,也就是:E(X)=Xˉ=1n∑i=1nXiE(X)=\bar{X}=\frac{1}{n}\sum_{i=1}^{n}X_iE(X)=Xˉ=n1​i=1∑n​Xi​σX2=1n−1∑i=1n(Xi−Xˉ)2\sigma_{X}^{2}=\frac{1}{n-1}\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}σX2​=n−11​i=1∑n​(Xi​−Xˉ)2cov⁡(X,Y)=1n−1∑ni=1(Xi−Xˉ)(Yi−Yˉ)\operatorname{cov}(X,Y)=\frac{1}{n-1}{\sum_{n}^{i=1}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}cov(X,Y)=n−11​n∑i=1​(Xi​−Xˉ)(Yi​−Yˉ)(之所以除以n-1而不是除以n,是因为我们是用样本去估计总体,除n-1才是统计学上的“无偏估计”,这样能使我们以较小的样本集更好的逼近总体的标准差)。上面的任何一个公式看不懂可以看将上述公式代入定义中得,r=∑i=1n(Xi−Xˉ)(Yi−Yˉ)∑i=1n(Xi−Xˉ)2∑i=1n(Yi−Yˉ)2r=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}{\sqrt{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}\sqrt{\sum_{i=1}^{n}\left(Y_{i}-\bar{Y}\right)^{2}}}r=∑i=1n​(Xi​−Xˉ)2​∑i=1n​(Yi​−Yˉ)2​∑i=1n​(Xi​−Xˉ)(Yi​−Yˉ)​。当计算出相关系数后,可以通过以下取值范围判断变量的相关强度:理解协方差的定义是从方差而来的,XXX的方差是E(X−EX)E(X-EX)E(X−EX)与(X−EX)(X-EX)(X−EX)的乘积的期望,如今把一个(X−EX)(X-EX)(X−EX)换为(Y−EY)(Y-EY)(Y−EY),其形式接近方差,又有X,YX,YX,Y二者的参与,由此得出协方差的名称。从功能上来说,其实协方差(Covariance)就足以刻画两个变量的相关关系。解释参见:但是协方差是带有“单位”的,它和X,YX,YX,Y的数值有关,假如XXX的数值量级整体都远远大于YYY,那么就会使得计算出来的协方差很大,它的值是不可比较的,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论