典型相关分析的实例PPT学习教案_第1页
典型相关分析的实例PPT学习教案_第2页
典型相关分析的实例PPT学习教案_第3页
典型相关分析的实例PPT学习教案_第4页
典型相关分析的实例PPT学习教案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1典型相关分析的实例典型相关分析的实例第1页/共55页1. 两个随机变量Y与X 简单相关系数2. 一个随机变量Y与一组随机变量X1,X2, Xp 多重相关(复相关系数)3. 一组随机变量Y1,Y2,Yq与另一组随机变量X1,X2,Xp (一)何时采用典型相关分析(一)何时采用典型相关分析第2页/共55页 典型相关典型相关是研究是研究两组变两组变量量之间相关性的一种统计分析之间相关性的一种统计分析方法。也是一种降维技术。方法。也是一种降维技术。 由由Hotelling (1935, 1936)Hotelling (1935, 1936)最早最早提出,提出,Cooley and Lohnes

2、 (1971)Cooley and Lohnes (1971)、 Kshirsagar (1972)Kshirsagar (1972)和和 Mardia, Mardia, Kent, and Bibby (1979) Kent, and Bibby (1979) 推动了它推动了它的应用。的应用。 第3页/共55页 X X1 1, , X X2 2, , , , X Xp pY Y1 1, , Y Y2 2, , , , Y Yq q1 1临床症状临床症状所患疾病所患疾病2 2原材料质量原材料质量相应产品质量相应产品质量3 3居民营养居民营养健康状况健康状况4 4生长发育(肺活量)生长发育(肺活

3、量)身体素质(跳高)身体素质(跳高)5 5人体形态人体形态人体功能人体功能第4页/共55页第5页/共55页第6页/共55页第7页/共55页CorrCorr(X X)R R1111CorrCorr(Y Y)R R2222CorrCorr(Y Y,X X)R R2121CorrCorr(X X,Y Y)R R12121221RR第8页/共55页只是孤立考虑单个只是孤立考虑单个X与单个与单个Y间的相关间的相关,没有考虑,没有考虑X、Y变量组内部各变量间的变量组内部各变量间的相关。相关。两组间有许多简单相关系数(实例为两组间有许多简单相关系数(实例为30个),使问题显得复杂,难以从整体描个),使问题显

4、得复杂,难以从整体描述。述。第9页/共55页(,)iiiCorr U V采用主成分思想寻找第i对典型典型( (相关相关) )变变量量(Ui,Vi):*1122,*1 122,1,2,min( , )iiii ppiiii qqUa Xa XaXa XVb Yb Yb Yb Yimp qm ,典型相关系数典型相关系数典型变量系数或典型权重典型变量系数或典型权重ba、第10页/共55页1251250第11页/共55页典型相关变量的性质典型相关变量的性质 1,1,(1)(,)( ,)0,0,2(,)0,i 1CanR301ijijijiiijijCorr U UCorr V VijijijCorr

5、U VijUV典型相关系数( )【除前面()个之外的最大者】、 的均数为 ,方差为。第12页/共55页 1 X1 X2 X3 2 1 2 Y1 Y2 b11 b22 c11 c21 b23 b13 b21 b12 c12 c22 11 22 1221典型变量典型相关系数典型加权系数(三)典型相关分析示意图(三)典型相关分析示意图第13页/共55页第14页/共55页22211211RRRR1. 求X,Y变量组的相关阵 R= ;2. 求矩阵 A、B 可以证明A、B有相同的非零特征根;11111222211122211112()()()()ARRRRBRRRR第15页/共55页i2ii第16页/共5

6、5页1. 求X,Y变量组的相关阵 R=22211211RRRR第17页/共55页CorrCorr(X X)R R1111CorrCorr(Y Y)R R2222CorrCorr(Y Y,X X)R R2121CorrCorr(X X,Y Y)R R1212第18页/共55页11111222211122211112()()()()ARRRRBRRRR第19页/共55页0.5298 0.5298 0.4586 0.4586 0.3053 0.3053 0.3986 0.3986 -0.2919 -0.2919 -0.1778 -0.1778 -0.0912 -0.0912 -0.0701 -0.0

7、701 -0.1669 -0.1669 -0.1939 -0.1939 -0.0007 -0.0007 -0.0168 -0.0168 0.2274 0.2274 0.2739 0.2739 0.5489 0.5489 0.0840 0.0840 0.5238 0.5238 0.4468 0.4468 0.0966 0.0966 0.0376 0.0376 0.0510 0.0510 0.3877 0.3877 -0.2523 -0.2523 -0.1759 -0.1759 -0.0915 -0.0915 -0.0979 -0.0979 -0.0669 -0.0669 -0.0377 -0.0

8、377 0.0061 0.0061 -0.0806 -0.0806 0.0949 0.0949 0.1421 0.1421 0.1757 0.1757 -0.0210 -0.0210 0.2171 0.2171 0.3142 0.3142 第20页/共55页0.2611 -0.0560 -0.0337 -0.0551 -0.0312 -0.0053 0.5572 0.1009 0.0034 -0.0543 -0.0632 -0.0843 0.0859 0.0013 0.1743 -0.1175 -0.0007 0.1183 0.2550 0.1490 -0.1052 0.1390 0.3531

9、 0.2912 0.5573 第21页/共55页0IBIAA A、B B有相同的非零特征值有相同的非零特征值第22页/共55页0.2611-0.2611- -0.0560 -0.0560 -0.0337 -0.0337 -0.0551 -0.0551 -0.0312 -0.0312 -0.0053 -0.0053 0.5572 -0.5572 - 0.1009 0.1009 0.0034 0.0034 -0.0543 -0.0543 -0.0632 -0.0632 -0.0843 -0.0843 0.0859 0.0859 - - 0.0013 0.0013 0.1743 0.1743 -0.

10、1175 -0.1175 -0.0007 -0.0007 0.1183 0.1183 0.2550 0.2550 - - 0.1490 0.1490 -0.1052 -0.1052 0.1390 0.1390 0.3531 0.3531 0.2912 0.2912 0.5573 0.5573 - - 第23页/共55页0.76430.76430.5436 0.5436 0.2611 0.2611 0.1256 0.1256 0.02200.0220 11223344550.87420.73730.51100.35440.1482第24页/共55页 。)的方差为(此外,还应满足的矩阵为:关于第一

11、特征根如矩阵17643. 03142. 02171. 00210. 01757. 01421. 00948. 00806. 00061. 003770. 00669. 00979. 00915. 01759. 02523. 03877. 00510. 00376. 00966. 04468. 05238. 00840. 05489. 02739. 02274. 00168. 00007. 01939. 01669. 00701. 00912. 01778. 02919. 03986. 03053. 04586. 05298. 07643. 0A*616*11111615141312111615

12、14131211XaXaUaaaaaaaaaaaaaAa第25页/共55页 。)的方差为(此外,还应满足的矩阵为:关于第一特征根如矩阵15436. 03142. 02171. 00210. 01757. 01421. 00948. 00806. 00061. 003770. 00669. 00979. 00915. 01759. 02523. 03877. 00510. 00376. 00966. 04468. 05238. 00840. 05489. 02739. 02274. 00168. 00007. 01939. 01669. 00701. 00912. 01778. 02919. 0

13、3986. 03053. 04586. 05298. 05436. 0A*626*1212262524232221262524232221XaXaUaaaaaaaaaaaaaAa第26页/共55页 。)的方差为(此外,还应满足的矩阵为:关于第一特征根如矩阵1022. 03142. 02171. 00210. 01757. 01421. 00948. 00806. 00061. 003770. 00669. 00979. 00915. 01759. 02523. 03877. 00510. 00376. 00966. 04468. 05238. 00840. 05489. 02739. 0227

14、4. 00168. 00007. 01939. 01669. 00701. 00912. 01778. 02919. 03986. 03053. 04586. 05298. 0022. 0A*656*1515565554535251565554535251XaXaUaaaaaaaaaaaaaAa第27页/共55页U1U2U3U4U5X1X10.5852 0.5852 -1.1443 -1.1443 0.7823 0.7823 0.0352 0.0352 -0.8298 -0.8298 X2X2 -0.2175 -0.2175 0.0189 0.0189 0.6032 0.6032 0.1289

15、 0.1289 1.5590 1.5590 X3X30.5288 0.5288 1.6213 1.6213 -0.7370 -0.7370 -0.4066 -0.4066 -1.1704 -1.1704 X4X40.1890 0.1890 -0.9874 -0.9874 -0.7753 -0.7753 0.1229 0.1229 0.6988 0.6988 X5X5 -0.1193 -0.1193 -0.0626 -0.0626 -0.2509 -0.2509 -0.5860 -0.5860 1.0488 1.0488 X6X60.1948 0.1948 0.8108 0.8108 0.146

16、7 0.1467 0.9523 0.9523 -0.5140 -0.5140 第28页/共55页SXXXXXXXUXXXU*6*2*15*6*2*11X5140. 05590. 18298. 0.1948. 02175. 05852. 0原变量,即的表示为正态离差标准化第29页/共55页常数)()()(),、()、,)、(,(为对应的均数标准差分别、如6216211621*6*2*115069. 03153. 04074. 03842. 017.271948. 06897. 620.922175. 04365. 137.1705852. 03842. 017.276897. 620.92436

17、5. 137.1701948. 02175. 05852. 0XXXXXXUXXXXXXU粗典型变量系数可由标准典型变量系数与相应的标准差之比获得。jijijSaa/*第30页/共55页V1V2V3V4V5Y1Y1-0.0838 -0.1325 1.0807 0.3750 -0.0376 Y2Y2-0.0878 1.2688 0.0701 0.2476 -0.3342 Y3Y30.2147 -0.3301 0.2218 -1.0863 1.4100 Y4Y40.2920 -0.2392 -0.5765 1.3368 -0.2942 Y5Y50.7607 -0.2995 0.6532 -0.00

18、17 -0.6905 第31页/共55页1. 两变量组的变量单位改变,典型相关系数不变,但典型变量加权系数改变。(无论原变量标准化否,获得的典型相关系数不变)2. 第一对典则相关系数较两组变量间任一个简单相关系数的绝对值都大,即 1max(|Corr(Xi,Yj)|) 或 1max(|Corr(X,Yj)|) max(|Corr(Xi,Y)|)第32页/共55页 为了使结果更加明了,增加大值或小值,减少中间大小的值,将典型变量系数旋转,可得到校正的典型相关系数。缺点:1.可能影响max(U1,V1); 2. 影响(U1,V1)与其他典型变量间的独立性。第33页/共55页1. 全部总体典型相关系

19、数均为02. 部分总体典型相关系数为0(1),( , ).(2)p qX YNnpq对资料的要求:两个变量组应服从多变量正态分布。即设()第34页/共55页0121121121:0;1, 2,;min(,):0(1)(10.7643)(10.5436)(10.2611)(10.1256)(10.0220)0.0680(1)(3) / 2ln28(653) / 2)ln 0.068056.457930,iimiiHimmp qHWnpqWpqdfP 卡 方所 有至 少 一 个似 然 比 统近计 量:自 由 度似0.0024(56.4579,30)chidist第35页/共55页1/22121/2

20、211121/41/414;4530;(3)/ 221/ 2 1701 0.0680702.240.068030(2.24,30,70)0.0030ttWdfp qFtWdfpqdfpqwnpqdfwtpqFPFDIST 第36页/共55页 Test of H0: The canonical correlations in the current row and all that follow are zeroLikelihood Approximate Ratio F Value Num DF Den DF Pr F1 0.06798466 2.24 30 70 0.00302 0.2884

21、0509 1.38 20 60.649 0.16863 0.63195301 0.80 12 50.561 0.65044 0.85521598 0.54 6 40 0.77295 0.97803479 0.24 2 21 0.7920第37页/共55页第38页/共55页212211(0.76430.54360.2611 0.12560.0220)1.716513.2422 1.19120.35330.14360.02254.9528E H3.2422miimiiiPillai traceHotellingLawley traceRoy s Greatest root统计量统计量()统计量为的

22、最大特征值本例为:第39页/共55页0122345:0;,;min( , );2:0(1)(1 0.5436)(1 0.2611)(1 0.1256)(1 0.0220)0.28 840.63200.85520.9780iimkii kHikmmp qkmHWWWWW取值( , )至少一个似然比统计量如第40页/共55页122122(1)(1)/ 2ln(1)(1)282(65 1)/ 2)ln0.288424.867820,0.2065(24.8678,20)kkikinkpqWpsqkdfPchidist 卡方近似自由度 第41页/共55页1/2221/22112121/ 71/ 71(1

23、) (1)4;(1)(1)5(1)(1);(3)/ 2(1)(1)/ 2 13,12;7;21;50.561 0.632050.560.7981120.6320(0.7981tstsWdfpsqsFtWdfpsqsdfpsqswnpqdfwtpsqssdftwdfFPFDIST 如果那么,12,50.56)0.6504第42页/共55页第43页/共55页第44页/共55页U1U2U3U4U5V1V2V3V4V5身身 高高X X1 10.9050-0.08060.3777-0.14870.08870.7912 -0.0594 0.1930-0.0527 0.0132 坐坐 高高X X2 20.8

24、6160.01120.4152-0.03600.24120.7532 0.0083 0.2121-0.0128 0.0357 体体 重重X X3 30.93610.1655-0.0471-0.2933-0.02470.8184 0.1220 -0.0240-0.1039 -0.0037 胸胸 围围X X4 40.6958-0.3189-0.53820.31910.13540.6083 -0.2351 -0.27500.1131 0.0201 肩肩 宽宽X X5 50.13560.5329-0.0321-0.23760.73890.1185 0.3929 -0.0164-0.0842 0.109

25、5 骨盆宽骨盆宽X X6 60.24330.4412-0.04050.74780.39080.2127 0.3253 -0.02070.2650 0.0579 脉脉 搏搏Y Y1 1-0.3610 -0.0625 0.3757 0.1605 0.0410 -0.4130 -0.0848 0.7353 0.4530 0.2764 收缩压收缩压Y Y2 20.3963 0.6232 0.0495 0.0508 0.0332 0.4533 0.8452 0.0968 0.1433 0.2240 舒张压舒张压( (音变音变) )Y Y3 30.5801 0.1568 0.0378 0.0287 0.1

26、050 0.6636 0.2127 0.0740 0.0810 0.7087 舒张压舒张压( (消音消音) )Y Y4 40.5003 0.0296 -0.0837 0.2339 0.0677 0.5723 0.0401 -0.1638 0.6600 0.4565 肺活量肺活量Y Y5 50.7994 0.0094 0.0685 -0.0743 -0.0473 0.9144 0.0128 0.1341 -0.2098 -0.3190 第45页/共55页左上角的矩阵左上角的矩阵 X1=0.9050U1-0.0806U2+0.3777U3-0.1487U4+0.0887U5 X2=0.8616U1

27、+0.0112U2+0.4152U3-0.0360U4+0.2412U5X6右下角的矩阵右下角的矩阵 Y1= -0.4130 V1-0.0848V2+0.7353V3+0.4530V4+0.2764V5 Y2=0.4533V1+0.8452V2+0.0968V3+0.1433V4+0.2240V5.Y5第46页/共55页UVCorr(U,V)1身高、坐高、体重、胸围身高、坐高、体重、胸围舒张压、肺活量舒张压、肺活量0.87422肩宽肩宽收缩压收缩压0.73733胸围胸围(- -)脉搏脉搏0.51054骨盆宽骨盆宽舒张压舒张压(消音消音)0.35425肩宽肩宽舒张压舒张压(音变音变)0.1510

28、第47页/共55页(,)(,)( ,)( ,)ijijjijijjCorr X VCorr X UCorr Y UCorr Y V第48页/共55页 右上角和左下角反映了原变量和对方的典型变量间关系,为利用对方的典型变量来预测原变量(回归)提供依据。 第49页/共55页第50页/共55页 该方法由Stewart and Love 1968; Cooley and Lohnes 1971; van den Wollenberg 1977)发展。 以原变量与典型变量间相关为基础。 通过计算X、Y变量组由自己的典型变量解释与由对方的典型变量解释的方差百分比与累计百分比,反映由典型变量预测原变量的程度。第51页/共55页典型典型变量变量编号编号X X1 1,X X2 2,X X3 3,X X4 4,X X5 5,X X6 6被被U U1 1,U U2 2,U U5 5解释解释 典型相典型相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论