数学建模教学 11.典型相关分析_第1页
数学建模教学 11.典型相关分析_第2页
数学建模教学 11.典型相关分析_第3页
数学建模教学 11.典型相关分析_第4页
数学建模教学 11.典型相关分析_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数数 学学 建建 模模华中农业大学数学建模基地系列课件华中农业大学数学建模基地系列课件编辑ppt编辑ppt 现实生活中两组变量间的相关关系的问题很多,现实生活中两组变量间的相关关系的问题很多,例如家庭的特征(如户主的年龄、家庭的年收入、户例如家庭的特征(如户主的年龄、家庭的年收入、户主的受教育程度等)与消费模式(如每年去餐馆就餐主的受教育程度等)与消费模式(如每年去餐馆就餐的频率、每年外出看电影的频率等)等等。为此,的频率、每年外出看电影的频率等)等等。为此,1936年由年由Hulling提出了典型相关分析,揭示了两组提出了典型相关分析,揭示了两组多元随机变量之间的关系。多元随机变量之间的关系

2、。 典型相关分析典型相关分析编辑ppt典型相关分析基本思想典型相关分析基本思想 通常情况下,为了研究两组变量通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有变量之间的全部相关系数,一共有pq个简单相关系个简单相关系数,这样又烦琐又不能抓住问题的本质。如果分别数,这样又烦琐又不能抓住问题的本质。如果分别找出两组变量的各自的某个线性组合,讨论线性组找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。合之间的相关关系,则更简捷。),(21pxxx),(21qyyy编辑ppt 首先分

3、别在每组变量中找出第一对线性组合,首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,使其具有最大相关性,ppxaxaxau12211111 qqybybybv12211111 然后再在每组变量中再找出第二对线性组合,使其分然后再在每组变量中再找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有别与本组内的第一线性组合不相关,第二对本身具有次大的相关性,即次大的相关性,即u2和和v2与与u1和和v1相互独立,但相互独立,但u2和和v2相关,相关,ppxaxaxau22221122 qqybybybv22221122 如此下去,直至两组变量的相关性被提取完为止。如此下

4、去,直至两组变量的相关性被提取完为止。 编辑ppt例:蔬菜产出水平主要体现在蔬菜总产量例:蔬菜产出水平主要体现在蔬菜总产量(Y1)、人均、人均蔬菜占有量蔬菜占有量(Y2)、蔬菜总产增长速度、蔬菜总产增长速度(Y3)三个方面,三个方面,并称作因变量组(简称并称作因变量组(简称“产出组产出组”)。问题:因变量组)。问题:因变量组与自变量与自变量X1(市场经济综合因素市场经济综合因素)、X2(劳动力动力因劳动力动力因素素) 、X3(气候因素气候因素)(简称简称“影响组影响组”)的关系如何?的关系如何? data ex;input y1-y3 x1-x3 ;cards;/*数据省略数据省略*/proc

5、 cancorr data=ex ;var y1-y3; with x1-x3;run;编辑ppt程序运行结果如下:程序运行结果如下: 编辑ppt 结果表明:前两个典型相关系数较高,表明相结果表明:前两个典型相关系数较高,表明相应典型变量之间密切相关。应典型变量之间密切相关。 整理得到蔬菜产出水平与影响因素的三个自变量的整理得到蔬菜产出水平与影响因素的三个自变量的典型相关系数及特征值典型相关系数及特征值 编辑ppt结果表明:只有前两对典型变量通过了统计量检验,结果表明:只有前两对典型变量通过了统计量检验,表明相应典型变量之间相关关系显著,能够用三个自表明相应典型变量之间相关关系显著,能够用三个

6、自影响变量来解释产出变量。影响变量来解释产出变量。编辑ppt冗余度分析的结果冗余度分析的结果 编辑ppt典型变量的解释能力典型变量的解释能力 可以看出:前两对典型变量的解释能力均较强;第一、第二可以看出:前两对典型变量的解释能力均较强;第一、第二对典型变量具有较高的解释百分比,典型相关系数的平方表明,对典型变量具有较高的解释百分比,典型相关系数的平方表明,产出变量中分别有产出变量中分别有96.47%和和65.68%的信息可以由相应的影响变的信息可以由相应的影响变量予以解释;前两对典型变量的重叠系数较大,产出组的方差量予以解释;前两对典型变量的重叠系数较大,产出组的方差被影响组典型变量解释的比例

7、分别为被影响组典型变量解释的比例分别为62.53%、13.49%。由于第。由于第三对典型变量在上述、项指标中的数值均较小,且未能通过三对典型变量在上述、项指标中的数值均较小,且未能通过F检验因此舍弃第三对典型变量,只选定前两对典型变量进行检验因此舍弃第三对典型变量,只选定前两对典型变量进行分析。分析。 编辑ppt典型相关模型结果如下:典型相关模型结果如下: 编辑ppt 结果分析:结果分析:自变量自变量X1即市场经济综合因素对中国蔬菜产出水平起根即市场经济综合因素对中国蔬菜产出水平起根本性作用。市场经济综合因素与蔬菜总产出的关系体现在第一对典型变本性作用。市场经济综合因素与蔬菜总产出的关系体现在

8、第一对典型变量量v1和和w1中,中,v1是中国蔬菜产出水平各指标的线性组合,其中,蔬菜总是中国蔬菜产出水平各指标的线性组合,其中,蔬菜总产出(产出(Y1)的载荷为,是各产出水平指标中最大的。)的载荷为,是各产出水平指标中最大的。w1是影响因素指标是影响因素指标的线性组合,其中市场经济综合因素的线性组合,其中市场经济综合因素(X1)的载荷为,远远超过的载荷为,远远超过w1内其它内其它指标的数值。考虑到第一对典型相关变量的相关系数几乎接近于指标的数值。考虑到第一对典型相关变量的相关系数几乎接近于1,可以,可以认为,市场经济综合因素对蔬菜总产出水平起根本性作用。自变量认为,市场经济综合因素对蔬菜总产

9、出水平起根本性作用。自变量X2即即劳动力动力因素是决定人均蔬菜占有量的关键因素。劳动力动力因素是决定人均蔬菜占有量的关键因素。 第二对典型变量中人均蔬菜占有量第二对典型变量中人均蔬菜占有量(Y2)在典型变量在典型变量v2中的载荷为,中的载荷为,是各产出水平指标中最大的,而自变量是各产出水平指标中最大的,而自变量X2则在典型变量则在典型变量w2中载荷最大,中载荷最大,为。这一对典型相关变量的相关系数非常之高,表明自变量为。这一对典型相关变量的相关系数非常之高,表明自变量X2对劳动力对劳动力动力因素起关键作用动力因素起关键作用. 在第二对典型变量中,在第二对典型变量中,Y1与劳动力动力因素关系也非常密切。因为与劳动力动力因素关系也非常密切。因为在第二

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论