




已阅读5页,还剩21页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,应用多元统计分析,第十章典型相关分析canonicalcorrelationanalysis,.,2,第十章典型相关分析目录,10.1总体典型相关10.2样本典型相关10.3典型冗余分析,.,3,第十章引言什么是典型相关分析,相关分析是研究多个变量与多个变量之间的相关关系.如研究两个随机变量之间的相关关系可用简单相关系数表示;研究一个随机变量与多个随机变量之间的相关关系可用全相关系数表示.1936年Hotelling首先将相关分析推广到研究多个随机变量与多个随机变量之间的相关关系,故而产生了典型相关分析,广义相关系数等一些有用的方法.,.,4,第十章引言什么是典型相关分析,在实际问题中,经常遇到要研究一部分变量和另一部分变量之间的相关关系,例如:在工业中,考察原料的主要质量指标(X1,.,Xp)与产品的主要质量指标(Y1,.,Yq)间的相关性;在经济学中,研究主要肉类的价格与销售量之间的相关性;在地质学中,为研究岩石形成的成因关系,考察岩石的化学成份与其周围围岩化学成份的相关性;在气象学中为分析预报24小时后天气的可靠程度,研究当天和前一天气象因子间的相关关系;,.,5,第十章引言什么是典型相关分析,在教育学中,研究学生在高考的各科成绩与高二年级各主科成绩间的相关关系;在婚姻的研究中,考察小伙子对追求姑娘的主要指标与姑娘想往的小伙子的主要尺度之间的相关关系;在医学中,研究患某种疾病病人的各种症状程度与用科学方法检查的一些结果之间的相关关系;在体育学中,研究运动员的体力测试指标与运动能力指标之间的相关关系等.,.,6,第十章引言什么是典型相关分析,一般地,假设有一组变量X1,.,Xp与另一组变量Y1,.,Yq(也可以记为Xp+1,.,Xp+q),我们要研究这两组变量的相关关系,如何给两组变量之间的相关性以数量的描述,这就是本章研究的典型相关分析.当p=q=1时,就是研究两个变量X与Y之间的相关关系.简单相关系数是最常见的度量.其定义为,.,7,第十章引言什么是典型相关分析,当p1,q=1时(或q1,p=1),设,则称,为Y与(X1,Xp)的全相关系数.,其实Y对X的回归为,且,并称R为全相关系数.,def=,.,8,第十章引言什么是典型相关分析,当p,q1时,利用主成分分析的思想,可以把多个变量与多个变量之间的相关化为两个新变量之间的相关.也就是求=(1,p)和=(1,q),使得新变量:V=1X1+pXp=XW=1Y1+qYq=Y之间有最大可能的相关,基于这个思想就产生了典型相关分析(Canonicalcorrelatinalanalysis).,.,9,第十章10.1总体典型相关典型相关的定义,设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记随机向量,Z=,XY,Z的协差阵为,其中11是X的协差阵,22是Y的协差阵,12=21是X,Y的协差阵.,.,10,第十章10.1总体典型相关典型相关的定义,我们用X和Y的线性组合V=aX和W=bY之间的相关来研究X和Y之间的相关.我们希望找到a和b,使(V,W)最大.由相关系数的定义:,又已知,.,11,第十章10.1总体典型相关典型相关的定义,故有,对任给常数c1,c2,d1,d2,显然有(c1V+d1,c2W+d2)=(V,W)即使得相关系数最大的V=aX和W=bX并不唯一.故加附加约束条件Var(V)=a11a=1,Var(W)=b22b=1.,问题化为在约束条件Var(V)=1,Var(W)=1下,求a和b,使得(V,W)=a12b达最大.,.,12,第十章10.1总体典型相关典型相关的定义,定义10.1.1设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记随机向量,.,13,第十章10.1总体典型相关典型相关的定义,.,14,第十章10.1总体典型相关典型相关变量的求法,定理10.1.1设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记随机向量,.,15,第十章10.1总体典型相关典型相关变量的求法,若定理10.1.1中Z是半正定的,则不一定存在.我们可以用广义逆矩阵求解。定义10.1.2给定一个矩阵A,如果有矩阵D满足ADA=A,DAD=D,(AD)=AD,(DA)=DA,则称D是A的加号逆,记作A+.可以证明A+是存在唯一的.,.,16,第十章10.1总体典型相关典型相关变量的求法,定理10.1.2设X=(X1,.,Xp)及Y=(Y1,.,Yq)为随机向量(不妨设pq),记随机向量,.,17,第十章10.1总体典型相关典型相关变量的性质,性质1,.,18,第十章10.1总体典型相关典型相关变量的性质,性质2原始变量与典型变量之间的相关性(也称为典型结构),.,19,第十章10.1总体典型相关典型相关变量的性质,.,20,.,21,第十章10.2样本典型相关样本典型相关变量和典型相关系数,设总体Z=(X1,.,Xp,Y1,Yq).在实际问题中,总体的均值E(Z)=和协差阵D(Z)=通常是未知的,因而无法求得总体的典型相关变量和典型相关系数.首先需要根据观测到的样本资料阵对其进行估计.已知总体Z的n个样品:,.,22,第十章10.2样本典型相关样本典型相关变量和典型相关系数,样本资料阵为,x11x12x1py11y12y1qx21x22x2py21y22y2q.xn1xn2xnpyn1yn2ynq,若假定ZN(,),则协差阵的最大似然估计为,Z(1)Z(2)=.Z(n),def=,*,.,23,第十章10.2样本典型相关样本典型相关变量和典型相关系数,我们从协差阵的最大似然估计S*(或样本协差阵S)出发,按上节的方法可以导出样本典型相关变量和样本典型相关系数.还可以证明样本典型相关变量和样本典型相关系数是总体典型相关变量和样本典型相关系数的极大似然估计.也可以从样本相关阵R出发来导出样本典型相关变量和样本典型相关系数.,.,24,第十章10.2样本典型相关典型相关系数的显著性检验,总体Z的两组变量X=(X1,.,Xp)和Y=(Y1,Yq)如果不相关,即COV(X,Y)=12=0,以上有关两组变量典型相关的讨论就毫无意义.故在讨论两组变量间相关关系之前,应首先对以下假设H0作统计检验.(1)检验H0:12=0(即1=0)设总体ZNp+q(,).用似然比方法可导出检验H0的似然比统计量为(A,A11,A22为离差阵),.,25,第十章10.2样本典型相关典型相关系数的显著性检验,(2)检验H0(i)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六一游戏集市活动方案
- 六一酒馆活动策划方案
- 六一预售活动方案
- 六味斋营销活动策划方案
- 六年级汉语拼音活动方案
- 业务助理考试试题及答案
- 安全生产电工试题及答案
- 药师考试试题及答案解析
- 安全设施管理试题及答案
- 安全评价知识试题及答案
- 《现场改善案例集》课件
- 医院结核感染培训
- 2025年广东省广州市花都区交通局建管中心招聘14人历年高频重点提升(共500题)附带答案详解
- 临床心内科主任竞聘稿
- 电动工器具安全使用培训
- 垃圾焚烧炉安装及方案
- 防水工程专项施工方案
- 幼儿教师讲故事技巧培训
- 日本建设项目可视化、安全文明、工艺管理总结
- 【MOOC】思想道德与法治-南开大学 中国大学慕课MOOC答案
- 网络管理与维护综合实训课程
评论
0/150
提交评论