典型相关分析在STATA中的实现和案例_第1页
典型相关分析在STATA中的实现和案例_第2页
典型相关分析在STATA中的实现和案例_第3页
典型相关分析在STATA中的实现和案例_第4页
典型相关分析在STATA中的实现和案例_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第14章典型相关分析主成分分析和因子分析只涉及一组变量的相关关系,而典型相关分析则是研究两组变量之间的相关关系。为了研究两组变量varlistl=(x,x,x)和12rvarlist2=(y,y,—,y)之间的相互关系,采用类似于主成分分析的方法,将两12s组变量合成有代表性的综合指标,通过研究这两组综合指标间的相互关系,来代替这两组变量间的相互关系,这些综合指标就称为典型变量,典型变量之间的相关系数就称为典型相关。在实际问题中,两组变量之间具有相关关系的问题很多,例如几种主要产品如猪肉、牛肉、鸡蛋的价格(作为第一组变量)和相应这些产品的销量(作为第二组变量)具有相关系数;投资性变量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)具有相关关系等。典型相关分析研究变量之间整体的线性关系,它是将每一组变量作为一个整体来进行研究,而不是分析每一组变量内部的各个变量。所研究的两组变量可以是一组变量为自变量,而另一组变量为因变量的情况,两组变量也可以处于同等的地位,但典型相关分析要求两组变量至少是间隔尺度的。典型相关分析是借助于主成分分析的思想,对每一组变量分别寻找线性组合,使生成的新的综合变量能代表原始变量大部分的信息,同时,与由另一组变量生成新的综合变量的相关程度最大,这样一组新的综合变量称为第一对典型相关变量,同样的方法可以找到第二对、第三对……使得各对典型相关变量互不相关,典型相关变量之间的简单相关系数称为典型相关系数。典型相关分析就是用典型相关系数衡量两组变量之间的相关性。设两组变量varlist1和varlist2的相关系数矩阵为:/AB3'C典型相关系数的平方即是对V=B'A-1BC-1或W=BC-1B'A-1进行特征值分解,而对应的左侧向量即是两组变量的典型变量的线性组合。设有m个典型相关系数,对于原假设:两组变量没有相关关系(即检验典型相关系数的显著性),Stata包括了四种统计量。Wilks(1932)AWilks(1932)A统计量为:A=HmPallai(1955)迹统计量为:V=Ym厂2。i=1iLawley-Hotelling(Lawley(1938),Hotelling(1951))迹统计量为:r2U=Smri=11-r2iRoy最大特征根统计量:即r2。

i典型相关估计命令为canon。sysuseauto,clearcanon(lengthweightheadroomtrunk)(displmpggear_ratioturn)canon(lengthweightheadroomtrunk)(displmpggear_ratioturn),coefmatrix/*coefmatrix输出原始系数矩阵,此为默认选项*/canon(lengthweightheadroomtrunk)(displmpggear_ratioturn),stdcoef/*stdcoef输出标准化系数矩阵,stdcoef与coefmatrix二者只能设一个*/预测sysuseauto,clearcanon(lengthweightheadroomtrunk)(displmpggear_ratioturn)predictpu,u/*u计算varlistl的线性组合*/predictpv,v/*v计算varlist2的线性组合*/predictpstdu,stdu/*stdu计算varlistl的线性组合的标准差*/predictpstdv,stdv/*stdv计算varlist2的线性组合的标准差*/Estatsysuseauto,clearcanon(lengthweightheadroomtrunk)(displmpggear_ratioturn)estatcorrelations/*varlistl和varlist2的相关系数矩阵*/estatloadings/*典型载荷,即各个变量与其对应的典型变量的相关系数*/例:中国30个省市自治区农村居民收入和支出的典型相关分析。反映农村居民收入的变量:xl——农村居民家庭人均工资性收入;x2——农村居民家庭人均家庭经营收入;x3——农村居民家庭人均财产性收入;x4——农村居民家庭人均转移性收入。反映农村居民生活费支出的变量:x5——农村居民家庭人均食品支出;x6农村居民家庭人均衣着支出;x7农村居民家庭人均居住支出;x8农村居民家庭人均家庭设备及服务支出;x9――农村居民家庭人均交通和通讯支出;xlO――农村居民家庭人均文教、娱乐用品及服务支出;xll――农村居民家庭人均医疗保健支出;x12――农村居民家庭人均其他商品及服务支出。areaxlx2x3x4x5x6x7x8x9x10x11x12北京市6389.312058.571142.81071.252470.72577.811162.96402.56950.53883.35709.44127.29

河北省1979.522416.22118.63281.091192.93203.74696.14151.94346.73250.07219.3264.68山西省1713.551986.38153.05244.261206.69276.23486.75138.26328.74380.7210.3269.85内蒙古806.483218.01114.9516.791483.61239.96569.6128.8406.74399.35320.6269.43辽宁省2035.532931.26201.29408.41549298.82601.71158.91426.47387.97283.37107.78吉林省810.173344.72183.2594.661362.44254.05530.69124.8355.58341.7380.7193.27黑龙江省916.763163.7243.57531.571267.68308.49871.51130395.02437.57351.0583.41上海市8108.32711.26849.831770.853731.27467.331806.08503.96879.57855.3697.11179.06江苏省3895.52812253.47395.52202.58276.39860.35250.11614.23713.23290.93120.56浙江省4587.443762.93437.52470.042779.1454.791659.88364.05851.06747532.06146.14安徽省1737.842114.24119.04231.371454.18180.04650.51165.53280.63294.84199.4458.94福建省2421.463146.09179.03449.492162.3263.59777.51222.86534.68390.15197.85113.01江西省1842.362552.5966.55235.691633.12157.75559.39155301.68236.01205.6860.58山东省2263.462962.96163.93251.071551.77250.29804.75240.91452.55417.27280.4979河南省1499.932699.353202.021165.81209.75712.61169.61290.79214.3821566.27湖北省1742.332690.8340.82182.41711.34187.07651.5234.92290.44267.13210.3699.8湖南省1990.522196.6157.06268.261947.52169.06629.75171.11286.01278.67244.1778.67广东省3684.472001.5339.47374.352388.91177.67964.53189.01483.66272.87259136.82广西1283.392190.6241.76174.581594.6791.19535.45124.01261.85172.73154.3250.81海南省808.633235.0953.58292.681537.5589.89391.04104.07261.57288.49123.8286.67重庆市1764.642016.6450.9294.031537.59160.34328.97167.74238.43211.83197.1542.87四川省1620.42061.771.37367.741627.58174.59469.73163.99256.08173.26209.2253.49贵州省1002.681512.4763.92217.861119.64112.46427.494.36159.61122.196.3833.75云南省617.472156.8109.83218.51483.16119.63626.12118.97248.25168.55181.9743.97西藏759.721845.04185.46385.61153.37248.68324.07140.06147.2162.2653.8470.09陕西省1243.571475.0186.01331.871115.66175.5598.59155.07270.63351.99251.2360.7甘肃省867.981543.2419.49293.081132.53134.66387.8395.58234.69219.91164.7231.05青海省983.161602.74148.55326.81220.02200.26568.79110.35316.75148.86270.0661.54宁夏1260.042032.0165.73323.641288.47217.17582.47123.91299.29192.57318.7772.2新疆422.822779.71121.15179.231146.69218.61492.7797.58276.31168.99244.5946.24天津市4064.953097.14463.39402.87324.47285.31568.95292.52699.21153.61301.0682.75注:资料来自2009年《中国统计年鉴》程序:clearlabelvararealabelvarx1labelvarx2labelvarx3labelvarx4labelvarx5labelvarx6*定义变量的标签省份"农村居民家庭人均工资性收入""农村居民家庭人均家庭经营收入""农村居民家庭人均财产性收入""农村居民家庭人均转移性收入""农村居民家庭人均食品支出""农村居民家庭人均衣着支出"labelvarx7"农村居民家庭人均居住支出"labelvarx8"农村居民家庭人均家庭设备及服务支出"labelvarx9"农村居民家庭人均交通和通讯支出"labelvarx10"农村居民家庭人均文教、娱乐用品及服务支出"labelvarx11"农村居民家庭人均医疗保健支出"labelvarx12"农村居民家庭人均其他商品及服务支出"describecanon(x1-x4)(x5-x12)*coefmatrix输出原始系数矩阵,此为默认选项canon(x1-x4)(x5-x12),coefmatrix*stdcoef输出标准化系数矩阵,stdcoef与coefmatrix二者只能设一个estatcorrelationsestatloadingspredictpu,u/*u计算varlistl的线性组合*/predictpv,v/*v计算varlist2的线性组合*/predictpstdu,stdu/*stdu计算varlistl的线性组合的标准差*/predictpstdv,stdv/*stdv计算varlist2的线性组合的标准差*/分析:通过运仃命令canon(x1-x4)(x5-x12),coefmatrix进仃典型相关估计,得到如下的运行结果:.canon(xl-x4)(x5-xl2),coefmatrixCanonicalcorrelationanalysisNumberofobs=3lRawcoefficientsforthefirstvariableset|l234+xl|0.00040.00090.00070.000lx2|0.0004-0.00040.0008-0.00l2x3x3|0.0002-0.0083-0.00100.0047x4|0.00130.0011-0.0034-0.0045x3x3|0.0002-0.0083-0.00100.0047x4|0.00130.0011-0.0034-0.0045Rawcoefficientsforthesecondvariableset|+-1234x5|0.00080.0009-0.0017-0.0003x6|0.0026-0.0090-0.00540.0021x7|-0.00040.00140.0014-0.0010x8|0.00070.0107-0.00220.0173x9|-0.0001-0.00700.01460.0112x10|0.00050.0027-0.0008-0.0082x11|0.0015-0.0012-0.0129-0.0043x12|0.00330.00050.0084-0.0400Canonicalcorrelations:0.97280.80030.60150.4944TestsofsignificanceofallcanonicalcorrelationsStatisticdf1df2FProb>FWilks'lambda.009317663271.66375.71840.0000aPillai'strace2.1929832883.33740.0000aLawley-Hotellingtrace20.2776327011.08930.0000aRoy'slargestroot17.605782248.41580.0000ue=exact,a=approximate,u=upperboundonF从运行结果,我们可以得到各个变量对典型变量的影响,即表现为在典型变量式子中观察变量的系数值,以及典型相关系数和典型相关的显著性检验。在该运行中,不没有对数据进行标准转化的,因此从它们的系数的相对大小我们不可以判别出在对应的典型变量中,哪个观察变量影响的大小。接下来我们通过加入选项stdcoef进行运行,对数据进行标准转化,结果如下:.canon(x1-x4)(x5-x12),stdcoefCanonicalcorrelationanalysisNumberofobs=31Standardizedcoefficientsforthefirstvariableset|+|+x1x2x3x4|+|+1234x1|0.62681.63011.17890.2129x2|0.2488-0.30150.5362-0.8347x3|0.0541-2.0198-0.24061.1362x4|0.40720.3299-1.0587-1.3981Standardizedcoefficientsforthesecondvariableset|1234+-x5|0.44770.5054-0.9698-0.1982x6|0.2856-0.9707-0.58400.2249x7|-0.11900.48060.4722-0.3243x8|0.06670.9983-0.20821.6067x9|-0.0213-1.39042.88472.2177x10|0.11180.5533-0.1706-1.6961x11|0.2202-0.1724-1.8828-0.6265x12|0.11490.01640.2906-1.3862Canonicalcorrelations:0.97280.80030.60150.4944TestsofsignificanceofallcanonicalcorrelationsStatisticdf1df2FProb>FWilks'lambda.009317663271.66375.71840.0000aPillai'strace2.1929832883.33740.0000aLawley-Hotellingtrace20.2776327011.08930.0000aRoy'slargestroot17.605782248.41580.0000ue=exact,a=approximate,u=upperboundonF在标准化数据情形下得出来的运行结果,我们可以直接根据在对应的典型相关变量中观察变量的大小来判断对典型相关变量的影响。对比上面两种运行结果,我们可以看到除了典型相关变量中观察变量的大小变化外,其它的结果都是一样的。因此,在实际情况中,当遇到那些观察变量大小差别太大时候,我们就要将这些观察变量的数据标准化,以消除变量量纲的影响。

表:典型相关系数及典型变量序号典型相关系数典型变量1尤1=0.9728U,=0.6268X+0.2488X+0.0541X+0.4072X11234=0.4477X+0.2856X-0.1190X+0.0667+X-0.0213X1567890.1118X+0.2202X+0.1149X1011122尤2=0.8003U2=1.6301X-0.3015X-2.0198X+0.3299X21234V2=0.5054X-0.9707X+0.4806X+0.9983X-1.3904X256789+0.5533X-0.1724X+0.0164X1011123咒3=0.6015U3=1.1789X+0.5362X-0.2406X-1.0587X31234V3=-0.9698X-0.5840X+0.4722X-0.2082X35678+2.8847X-0.1706X-1.8828X+0.2906X91011124咒3=0.4944U4=0.2129X-0.8347X+1.1362X-1.3981X41234V4=-0.1982X+0.2249X-0.3243X+1.6067X45678+2.2177X-1.6961X-0.6265X-1.3862X9101112结果分析:第一对典型变量中,U1主要受工资性收入和转移性收入影响,P1主要受食品支出和衣着支出;第二对典型变量中,U2主要受工资性收入和财产性收入,P2主要受衣着支出、家庭设备及服务支出和交通和通讯支出;第三对典型变量中,U3主要受工资性收入和转移性收入,P3主要受食品支出、交通和通讯支出和医疗保健支出。在检验过程中,我们可以检验各个观察变量的之间的相关系数以及与其对应的典型变量的相关系数。.estatcorrelationsCorrelationsforvariablelist1

x1|1.0000x2|-0.16181.0000x3|0.8746-0.11871.0000x4|0.7701-0.28590.80821.0000Correlationsforvariablelist2|x12x5x6x7x8|x12x5x6x7x8x9x10x111.0000x5|1.0000x6|1.0000x5|1.0000x6|0.62521.0000x7|0.86190.76371.0000x8|0.89470.79840.88821.0000x9|0.84230.88530.89640.89191.0000x10|0.76920.85050.82590.85610.94191.0000x11|0.71590.88270.83150.81280.89580.86181.0000x12|0.86440.73130.83580.81800.85430.79770.7236Correlationsbetweenvariablelists1and2|x1x2x3x4+--x5|0.8897-0.06580.71060.7463x6|0.77160.11060.88140.7358x7|0.85190.02200.74510.7181x8|0.9207-0.10410.80370.7834x9|0.88450.12630.86500.7448x10|0.82800.13040.79950.7355x11|0.79850.00640.86230.8227x12|0.81240.15680.71070.7001.estatloadingsCanonicalloadingsforvariablelist1|1234+x1|0.94750.16650.06640.2649x2|0.0245-0.41990.6767-0.6043x3|0.9019-0.2917-0.12880.2914x4|0.86250.0390-0.4986-0.0773Canonicalloadingsforvariablelist2|1234+--x5|0.90840.35130.08740.0168x6|0.8825-0.3911-0.03670.0904x7|0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论