SAS统计之第十三章 典型相关分析_第1页
SAS统计之第十三章 典型相关分析_第2页
SAS统计之第十三章 典型相关分析_第3页
SAS统计之第十三章 典型相关分析_第4页
SAS统计之第十三章 典型相关分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节典型相关分析的意义

WhyCanonicalCorrelation区别于主成分分析和因子分析,典型相关分析考虑到两组变量,而前两种分析只考虑一组变量。当需要对具有不同意义的两组变量之间错综复杂的相关关系进行分解,以便寻求一种符合实际意义的解释时需要使用典型相关分析。什么时候用典型相关分析

当前1页,总共29页。(分蘖数);第一节典型相关分析的意义

WhyCanonicalCorrelation

例子

考虑小麦的两组性状:第一组是形态性状(X1),由4个变量组成:(株高);(穗长);(抽穗期);第二组是产量性状(X2),由5个变量组成:(小穗数);(每小穗粒数);(千粒重);(每穗粒数);(单株穗数);现欲研究X1与X2之间的相关关系。即形态性状与产量性状之间的相关关系。注意:是形态性状与产量性状之间的相关关系。不是第一组中的某一个性状(例如株高)与第二组中的另一个性状(例如千粒重)的相关关系!仿照主成分分析的思路,可将第一组数据转换成为相互独立的综合性状(比如,称为、、和),又将第二组数据转换成为另一些相互独立的综合性状(、、和),使与之间的相关关系占两组变量间的相关关系的最大部分,与之间的相关关系占前两对综合变量抽取剩余的相关关系的最大部分,…,如此直到所有相关关系被解释完为止。由于这些新的综合变量如主成分一样具有一些实际意义,因而可以利用每对新变量之间的相关关系来对实际情况进行适当的解释。这些新的综合变量称为典型变量,第一对典型变量之间的相关系数称为第一个典型相关系数;第二对典型变量之间的相关系数称为第二个典型相关系数,…,等等。这种分析方法称为典型相关分析。当前2页,总共29页。第二节典型相关分析的原理

PrincipleofCanonicalCorr.Analysis典型相关系数典型相关系数的显著性测验当前3页,总共29页。S11=设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:S22=第一组变量与第二组变量之间的方差协方差矩阵为:S12=典型相关系数

CanonicalCorr.Coef.当前4页,总共29页。S11=S22=典型相关系数

CanonicalCorr.Coef.设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:由第一组变量X1构筑一个典型变量:称为的典型系数。由第二组变量X2构筑一个典型变量:称为的典型系数。使得和之间的相关系数解释了两组变量之间的相关关系的最大部分。为方便起见,令和为标准化变量,于是

于是问题变成,在规定的条件下,求合适的和使得

为最大。当前5页,总共29页。典型相关系数

CanonicalCorr.Coef.设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:S11=第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:S22=由第一组变量X1构筑一个典型变量:X1由第二组变量X2构筑一个典型变量:X2用数学中求条件极值的方法已求得为矩阵(S11S12S22S21)的最大特征根所对应的特征向量。

-1-1也已求得为矩阵(S22S21S11S12)的最大特征根所对应的特征向量。

-1-1数学上还证明了,这两个矩阵的最大特征根是相等的。特征向量则分别为和。并且,第一典型相关系数。

由于和之间有关系:S22S21在实际计算时不用矩阵S22S21S11S12而用上式来计算。这样可以提高计算的精确度。-1-1-1当前6页,总共29页。设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:S11=S22=典型相关系数

CanonicalCorr.Coef.利用和可以求得第一对典型变量和,它们之间的典型相关系数也可以求出为。接着,可用类似的方法求第二对典型变量和以及它们之间的典型相关系数。当前7页,总共29页。S22=典型相关系数

CanonicalCorr.Coef.设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:S11=第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:由第一组变量X1构筑一个典型变量:称为的典型系数。X1由第二组变量X2构筑一个典型变量:称为的典型系数。X2使得和之间的相关系数解释了两组变量间的相关关系中扣除所解释的相关关系后剩余的相关关系的最大部分。为方便起见,令和为标准化变量,于是

于是问题变成,在规定的条件下,求合适的和使得

为最大当前8页,总共29页。典型相关系数

CanonicalCorr.Coef.设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:S11=第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:S22=由第一组变量X1构筑一个典型变量:X1由第二组变量X2构筑一个典型变量:X2也已求得为矩阵(S22S21S11S12)的第二大特征根所对应的特征向量。

-1-1数学上还证明了,这两矩阵的第二大特征根是相等的。特征向量则分别为和。并且,第二典型相关系数。

用数学中求条件极值的方法已求得为矩阵(S11S12S22S21)的第二大特征根所对应的特征向量。

-1-1当前9页,总共29页。设第一组变量X1中全部个变量的平均数都是0。方差协方差矩阵为:S11=第二组变量X2中全部个变量的平均数都是0。方差协方差矩阵为:S22=如此一直求到第(Min())个典型相关系数为止。为方便起见,常记变量数较少的那组变量为X1,(即有),于是矩阵(S11S12S22S21)具有较小的维数,(S22S21S11S12)具有较大的维数,数学上已经证明:前者有个特征根,后者前个特征根与前者的相等,而第个以后的特征根全部为0。

-1-1-1-1典型相关系数

CanonicalCorr.Coef.当前10页,总共29页。典型相关系数

CanonicalCorr.Coef.典型变量的性质:(1)用第一组变量X1构筑成的各典型变量之间互不相关;并且各自的方差为1;用第二组变量X2构筑成的个典型变量之间互不相关;并且各自的方差为1。(2)同一对典型变量和之间的相关系数为,即和之间的相关系数为,和之间的相关系数为,…,等等;不同对典型变量和(其中)之间互不相关。利用这些性质,可以对所研究的问题进行适当的解释。当前11页,总共29页。样本典型分析的计算步骤:典型相关系数

CanonicalCorr.Coef.(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1(3)求方阵S11S12S22S21的特征根和对应的特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化。这里所用的是中心化数据和协方差矩阵进行分析。同样可以使用标准化数据和相关矩阵进行分析。由于将每个变量的所有观察值除以一个常数不影响变量之间的相关关系,所以,尽管中间过程有些不同,但最终算出的典型变量和典型相关系数是一样的。当前12页,总共29页。典型相关系数

CanonicalCorr.Coef.用样本典型相关系数来估计总体典型相关系数,须进行的显著型测验。先测验第一对典型变量之间的相关系数是否为0,即测验H0:vsHA:如果测验不能拒绝H0,则终止测验,判断两组变量之间没有显著的相关关系。如果测验拒绝H0,而接受HA,则判断两组变量之间第一个典型相关系数不为0,可以用作为的估计值。并继续进行下一步测验。对典型相关系数的测验可采用

测验,检验要分步进行:当前13页,总共29页。典型相关系数

CanonicalCorr.Coef.如果测验不能拒绝H0,则终止测验,判断第二对以及以后的典型变量之间没有显著的相关关系。再测验第二对典型变量之间的相关系数是否为0,即测验H0:vsHA:用样本典型相关系数来估计总体典型相关系数,须进行的显著型测验。如果测验拒绝H0,而接受HA,则判断两组变量之间第二个典型相关系数不为0,可以用作为的估计值。并继续进行下一步测验。对典型相关系数的测验可采用

测验,检验要分步进行:当前14页,总共29页。典型相关系数

CanonicalCorr.Coef.如此,接着对第二对,第三对,…,典型相关系数进行测验…,直到没有显著的相关关系为止。用样本典型相关系数来估计总体典型相关系数,须进行的显著型测验。对典型相关系数的测验可采用

测验,检验要分步进行:当前15页,总共29页。在用F测验对第个典型相关系数进行测验时,首先计算Λj

统计量:典型相关系数

CanonicalCorr.Coef.如:测验第一个典型相关系数(j=1)时:测验第二个典型相关系数(j=2)时:当前16页,总共29页。典型相关系数

CanonicalCorr.Coef.其中的自由度在用

测验对第个典型相关系数进行测验时,先计算,再用构成统计量:当时,,否则。在显著水准下,将与比较,便可作出判断。当前17页,总共29页。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis一个典型相关分析的例子。观察20个中年男子的两组变量。第一组变量由三个生理指标构成,包括:体重(英磅);脉搏次数;腰围(英寸);第二组变量由四个运动项目的成绩构成:引体向上次数;仰卧起坐次数;跳跃次数;俯卧撑次数现欲讨论生理指标与运动项目之间的相关关系。(数据见课本p101表5.1)分析前先回顾上节关于计算步骤的叙述:当前18页,总共29页。样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。这里所用的是中心化数据和协方差矩阵进行分析。同样可以使用标准化数据和相关矩阵进行分析。由于将每个变量的所有观察值除以一个常数不影响变量之间的相关关系,所以,尽管中间过程有些不同,但最终算出的典型变量和典型相关系数是一样的。这里我们采用标准化数据和相关矩阵进行计算第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis当前19页,总共29页。样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis一、将7个变量的数据输入,求其相关矩阵(如p103表5.3所示)。当前20页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1一、将7个变量的数据输入,求其相关矩阵(如p103表5.3所示)。二、将这个相关矩阵分为四个小矩阵:

R11、R12、R22、R21当前21页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1一、将7个变量的数据输入,求其相关矩阵(如p103表5.3所示)。三、求R11和R22的逆阵R11和R22;-1-1二、将这个相关矩阵分为四个小矩阵:

R11、R12、R22、R21四、构成非对称方阵R11R12R22R21;-1-1当前22页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1五、求该矩阵的特征根:这些特征根的平方根便是典型相关系数:于是,生理性状的典型变量分别为:六、求该矩阵的特征向量():当前23页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1五、求该矩阵的特征根:这些特征根的平方根便是典型相关系数:七、求另一组典型系数R22R21-1当前24页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。第三节典型相关分析的例子

ExampleofCanonicalCorr.Analysis样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1五、求该矩阵的特征根:这些特征根的平方根便是典型相关系数:七、求另一组典型系数R22R21-1于是,运动项目的典型变量分别为:当前25页,总共29页。(3)求方阵S11S12S22S21的特征根和对应特征向量-1-1-1(4)利用关系S22S21求。(5)用中心化数据和典型系数求

X1和X2。(6)将典型变量

和标准化,计算典型得分。样本典型分析的计算步骤:(1)按研究目的将所有原始变量分为两组,记变量数()较少的那组为X1,变量数()较多的那组为

X2,对所有原始变量进行中心化。(2)求X1和X2的协方差矩阵S11、S12、S22和S21,利用它们构成非对称的方阵S11S12S22S21。-1-1至此,我们

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论