版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、利用Matlab编程实现主成分分析1.概述 Matlab语言是当今国际上科学界 (尤其是自动控制领域) 最具影响力、也是最有活力的软件。它起源于矩阵运算,并已经发展成一种高度集成的计算机语言。它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、与其他程序和语言的便捷接口的功能。Matlab 语言在各国高校与研究单位起着重大的作用。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。 计算相关系数矩阵 (1)在()式中,rij(i,j=1,2,p)为原变量的xi与xj之间的相关系数,其计算公式为 (2)因为R是实对称矩阵(
2、即rij=rji),所以只需计算上三角元素或下三角元素即可。 计算特征值与特征向量首先解特征方程,通常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值的特征向量。这里要求=1,即,其中表示向量的第j个分量。 计算主成分贡献率及累计贡献率主成分的贡献率为累计贡献率为一般取累计贡献率达8595%的特征值所对应的第一、第二,第m(mp)个主成分。 计算主成分载荷其计算公式为 (3)得到各主成分的载荷以后,还可以按照()式进一步计算,得到各主成分的得分 (4)在软件Matlab中实现主成分分析可以采取两种方式实现:一是通过编程来实现;二是直接调用Matlab种自
3、带程序实现。下面主要主要介绍利用Matlab的矩阵计算功能编程实现主成分分析。 主函数 子函数 用总和标准化法标准化矩阵计算相关系数矩阵;计算特征值和特征向量;对主成分进行排序;计算各特征值贡献率;挑选主成分(累计贡献率大于85%),输出主成分个数;计算主成分载荷计算各主成分得分、综合得分并排序读入数据文件;调用以上三个函数并输出结果%cwstd.m,用总和标准化法标准化矩阵function std=cwstd(vector)cwsum=sum(vector,1); %对列求和a,b=size(vector); %矩阵大小,a为行数,b为列数for i=1:a for j=1:b std(i,
4、j)= vector(i,j)/cwsum(j); endendfunction result=cwfac(vector);fprintf(相关系数矩阵:n)std=CORRCOEF(vector) %计算相关系数矩阵fprintf(特征向量(vec)及特征值(val):n)vec,val=eig(std) %求特征值(val)及特征向量(vec)newval=diag(val) ;y,i=sort(newval) ; %对特征根进行排序,y为排序结果,i为索引fprintf(特征根排序:n)for z=1:length(y) newy(z)=y(length(y)+1-z);endfprin
5、tf(%gn,newy)rate=y/sum(y);fprintf(n贡献率:n)newrate=newy/sum(newy)for k=length(y):-1:1 sumrate=sumrate+rate(k); newi(length(y)+1-k)=i(k); if sumrate0.85 break; end end %记下累积贡献率大85%的特征值的序号放入newi中fprintf(主成分数:%gnn,length(newi);fprintf(主成分载荷:n)for p=1:length(newi) for q=1:length(y) result(q,p)=sqrt(newval
6、(newi(p)*vec(q,newi(p); endend %计算载荷disp(result)%cwscore.m,计算得分function score=cwscore(vector1,vector2);sco=vector1*vector2;csum=sum(sco,2);newcsum,i=sort(-1*csum);newi,j=sort(i);fprintf(计算得分:n)score=sco,csum,j %得分矩阵:sco为各主成分得分;csum为综合得分;j为排序结果 function print=cwprint(filename,a,b); %filename为文本文件文件名,
7、a为矩阵行数(样本数),b为矩阵列数(变量指标数)fid=fopen(filename,r)vector=fscanf(fid,%g,a b);fprintf(标准化结果如下:n)v1=cwstd(vector)result=cwfac(v1);cwscore(v1,result);中国大陆35个大城市某年的10项社会经济统计指标数据见下表。城 市名 称年底总人口(万人) 非农业人口比(%) 农 业总产值(万元)工业总产值(万元)客运总量(万人)货运总量(万吨)地方财政预算内收入(万元)城乡居民年底储蓄余额(万元)在岗职工人数(万人)在岗职工工资总额(万元)北 京118434271999970
8、620323455622790863268066465773301天 津 9150136226455023259263171128073113019312254343石 家 庄29186806885768292919113523487095875758877太 原23603827377501937118952032773943100654023呼和浩特 2365 343816 4522 3512 623105 7831 396 588309 337沈 阳 91 295 4185 826 7337 78215 412567 9199 016 9981 152 811大 连 61 879 7398
9、 426 38510 78019 187709 2277 556 796965 922长 春 81 853 2105 966 3434 8109 532357 0964 803 744884 447哈 尔 滨 72 663 8554 186 1236 7207 520481 4436 450 0201 309 151上 海1 42 069 01954 529 0986 40644 4854 318 50025 971 2005 605 445南 京 1989 19913 072 73714 26911 193664 2995 680 4721 357 861杭 州 61 414 73712 0
10、00 79617 88311 684449 5937 425 9671 180 947宁 波 71 428 23510 622 86622 21510 298501 7235 246 350824 034合 肥 4628 7642 514 1254 8931 517233 6281 622 931369 577福 州 32 152 2886 555 3518 8517 190467 5245 030 220680 607厦 门 5333 3745 751 1243 7282 570418 7582 108 331657 484南 昌 8688 2892 305 8813 6743 189167
11、 7142 640 460479 ,555济 南 51 486 3026 285 8825 91511 775460 6904 126 970756 696青 岛 32 382 32011 492 03613 40817 038658 4354 978 045961 704郑 州 4677 4255 287 60110 4336 768387 2525 135 338696 848武 汉 91 211 2917 506 0859 79315 442604 6585 748 0551 314 766长 沙 71 146 3673 098 1798 7065 718323 6603 461 244
12、596 986广 州 41 600 73823 348 13922 00723 8541 761 49920 401 8113 047 594深 圳 1299 66220 368 2958 7544 2741 847 9089 519 9001 890 338南 宁 4720 4861 149 6915 1303 293149 7002 190 918371 809海 口 444 815717 4615 3452 356115 1741 626 800198 138重 庆3 74 168 7808 585 52552 44125 124898,9129 090 9691 606 804成 都1
13、 1 935 5905 894 28940 14019 632561 1897 479 6841 200 671贵 阳 7362 0612 247 93415 7034 143197 9081 787 748419 681昆 明 5793 3563 605 7295 60412 042524 2164 127 900842 321西 安 4739 9053 665 94210 3119 766408 8965 863 980885 169兰 州 5259 4442 940 8841 8324 749169 5402 641 568550 890西 宁 765 848711 3101 7461
14、46949 134855 051219 251银 川 9171 603661 2262 1061 19374 758814 103178 621乌鲁木齐 478 5131 847 2412 6689 041254 8702 365 508517 622 cwprint(cwbook.txt,35,10)fid =6数据标准化结果如下:v1 =0.0581 0.0356 0.0435 0.0680 0.0557 0.1112 0.1194 0.1184 0.0346 0.0354 0.0770 0.0089 0.0407 0.0139 0.0688 0.0234 0.0080 0.0047 0.
15、0139 0.0391 0.0056 0.0093 0.0053 0.0097 0.0263 0.0086 0.0028 0.0064 0.0064 0.0045 0.0062 0.0315 0.0375 0.0305 0.0198 0.0213 0.0253 0.0295 0.0443 0.0286 0.0295 0.0321 0.0431 0.0276 0.0628 0.0142 0.0610 0.0440 0.0488 0.1853 0.0176 0.1086 0.1848 0.1148 0.0250 0.0318 0.0233 0.0444 0.0391 0.0286 0.0250 0
16、.0152 0.0337 0.0361 0.0609 0.0251 0.0259 0.0327 0.0286 0.0344 0.0271 0.0185 0.0270 0.0105 0.0239 0.0140 0.0139 0.0056 0.0133 0.0025 0.0497 0.1428 0.0123 0.0983 0.0292 0.1437 0.0466 0.0199 0.0456 0.0200 0.1100 0.0479 0.0149 0.0220 0.0313 0.0244 0.0174 0.0125 0.0283 0.0238 0.0175 0.0259 0.0300 0.0213
17、0.0134 0.0062 0.0074 相关系数矩阵:std =1.0000 -0.3444 0.8425 0.3603 0.7390 0.6215 0.4039 0.4967 0.6761 -0.3444 -0.4750 -0.3539 0.1971 0.3571 0.2600 0.1570 0.8425 -0.4750 1.0000 0.3358 0.5891 0.5056 0.3236 0.4456 0.5575 0.3603 0.3096 0.3358 1.0000 0.1507 0.7664 0.9412 0.8480 0.7320 0.7390 -0.3539 0.5891 0.
18、1507 1.0000 0.4294 0.1971 0.3182 0.3893 0.6215 0.1971 0.5056 0.7664 0.4294 1.0000 0.8316 0.8966 0.9302 0.4039 0.3571 0.3236 0.9412 0.1971 0.8316 1.0000 0.9233 0.8376 0.4967 0.2600 0.4456 0.8480 0.6761 0.4689 0.3090 特征向量(vec):vec =-0.1367 0.2282 -0.2628 0.1939 0.6371 -0.2163 0.3176 -0.0329 -0.0217 0.
19、0009 0.0446 -0.1447 -0.4437 0.4058 -0.0522 -0.0280 0.2040 -0.0492 -0.5472 -0.4225 0.3440 0.3188 -0.4438 0.2401 0.0067 -0.4176 -0.2856 -0.2389 0.1926 -0.4915 -0.4189 0.2726 0.2065 0.3403 0.0404 0.1408 0.0896 0.0380 -0.1969 -0.0437 -0.0343 0.2360 0.2981 0.4739 0.5685 0.2358 0.1465 -0.1502 -0.2631 0.12
20、45 0.4879 -0.5707 0.1217 0.1761 0.0987 0.3550 0.3280 -0.7894 -0.1628 0.1925 0.2510 -0.0422 0.2694 0.0396 0.0456 0.1668 特征值(val)val =0.0039 0 0 0 0 0 0 0 0 00 0.0240 0 0 0 0 0 0 0 00 0 0.0307 0 0 0 0 0 0 0 0 0 0 0.0991 0 0 0 0 0 0 0 0 0 0 0.1232 0 0 0 0 0 0 0 0 0 0 0.2566 0 0 0 00 0 0 0 0 0 0.3207 0
21、0 00 0 0 0 0 0 0 0.5300 0 00 0 0 0 0 0 0 0 2.3514 00 0 0 特征根排序:各主成分贡献率:newrate =第一、二主成分的载荷: 第一、二、三、四主成分的得分:score = 4 7 4 0 1 8, 1 843 427, 19 999 706, 20 323, 45 562, 2 790 863, 26 806 646, 410.80, 5 773 301 9, 1 501 136, 22 645 502, 3 259, 26 317, 1 128 073, 11 301 931, 202.68, 2 254 343 2, 2 918 6
22、80, 6 885 768, 2 929, 1 911, 352 348, 7 095 875, 95.60, 758 877 3, 236 038, 2 737 750, 1 937, 11 895, 203 277, 3 943 100, 88.65, 654 023 2, 365 343, 816 452, 2 351, 2 623, 105 783, 1 396 588, 42.11, 309 337 9, 1 295 418, 5 826 733, 7 782, 15 412, 567 919, 9 016 998, 135.45, 1 152 811 6, 1 879 739, 8
23、 426 385, 10 780, 19 187, 709 227, 7 556 796, 94.15, 965 922 8, 1 853 210, 5 966 343, 4 810, 9 532, 357 096, 4 803 744, 102.63, 884 447 7, 2 663 855, 4 186 123, 6 720, 7 520, 481 443, 6 450 020, 172.79, 1 309 1511 4, 2 069 019, 54 529 098, 6 406, 44 485, 4 318 500, 25 971 200, 336.84, 5 605 445 1, 9
24、89 199, 13 072 737, 14 269, 11 193, 664 299, 5 680 472, 113.81, 1 357 861 6, 1 414 737, 12 000 796, 17 883, 11 684, 449 593, 7 425 967, 96.90, 1 180 947 7, 1 428 235, 10 622 866, 22 215, 10 298, 501 723, 5 246 350, 62.15, 824 034 4, 628 764, 2 514 125, 4 893, 1 517, 233 628, 1 622 931, 47.27, 369 57
25、7 3, 2 152 288, 6 555 351, 8 851, 7 190, 467 524, 5 030 220, 69.59, 680 607 5, 333 374, 5 751 124, 3 728, 2 570, 418 758, 2 108 331, 46.93, 657 484 8, 688 289, 2 305 881, 3 674, 3 189, 167 714, 2 640 460, 62.08, 479 ,555 5, 1 486 302, 6 285 882, 5 915, 11 775, 460 690, 4 126 970, 83.31, 756 696 3, 2
26、 382 320, 11 492 036, 13 408, 17 038, 658 435, 4 978 045, 103.52, 961 704 4, 677 425, 5 287 601, 10 433, 6 768, 387 252, 5 135 338, 84.66, 696 848 9, 1 211 291, 7 506 085, 9 793, 15 442, 604 658, 5 748 055, 149.20, 1 314 766 7, 1 146 367, 3 098 179, 8 706, 5 718, 323 660, 3 461 244, 69.57, 596 986 4
27、, 1 600 738, 23 348 139, 22 007, 23 854, 1 761 499, 20 401 811, 182.81, 3 047 594 1, 299 662, 20 368 295, 8 754, 4 274, 1 847 908, 9 519 900, 91.26, 1 890 338 4, 720 486, 1 149 691, 5 130, 3 293, 149 700, 2 190 918, 45.09, 371 809 4, 44 815, 717 461, 5 345, 2 356, 115 174, 1 626 800, 19.01, 198 1383
28、 7, 4 168 780, 8 585 525, 52 441, 25 124, 898,912, 9 090 969, 223.73, 1 606 8041 003.56, 0.335, 1 935 590, 5 894 289, 40 140, 19 632, 561 189, 7 479 684, 132.89, 1 200 671 7, 362 061, 2 247 934, 15 703, 4 143, 197 908, 1 787 748, 55.28, 419 681 5, 793 356, 3 605 729, 5 604, 12 042, 524 216, 4 127 90
29、0, 88.11, 842 321 4, 739 905, 3 665 942, 10 311, 9 766, 408 896, 5 863 980, 114.01, 885 169 5, 259 444, 2 940 884, 1 832, 4 749, 169 540, 2 641 568, 65.83, 550 890 7, 65 848, 711 310, 1 746, 1 469, 49 134, 855 051, 27.21, 219 251 9, 171 603, 661 226, 2 106, 1 193, 74 758, 814 103, 23.72, 178 621 4,
30、78 513, 1 847 241, 2 668, 9 041, 254 870, 2 365 508, 55.27, 517 622另外再附上两种主成分分析方法:第一种方法:用matlab的各个函数组合得到的结果:clc;clear;X=281110050;5 2120012;10 9101020;4 8 70062;31 2 20072;4 1 11000.5 1;5 1 110030;26 7 40062;p=mean(X); %每一列的平均值pq=repmat(p,8,1);b=std(X); %每一列的标准差bq=repmat(b,8,1);ding = (X-pq)./bq;%标准化矩阵dd =cov(ding);%协方差计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社区生活e站工作制度
- 上饶市万年县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 朔州市应县2025-2026学年第二学期五年级语文第五单元测试卷(部编版含答案)
- 东莞市南城区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 绵阳市北川县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 西双版纳傣族自治州勐腊县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 呼伦贝尔市新巴尔虎右旗2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 信阳市商城县2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 北海市海城区2025-2026学年第二学期六年级语文第五单元测试卷部编版含答案
- 哈尔滨市香坊区2025-2026学年第二学期五年级语文第五单元测试卷(部编版含答案)
- 2025年吉林省长春市中考英语真题(原卷版)
- 新疆圣雄氯碱有限公司2万吨-年废硫酸再生处理项目环评报告
- 2025年口腔正畸主治考试《基础知识》新版真题卷(含答案)
- 冒顶片帮事故培训
- 苏教版高中化学必修二知识点
- 《高速铁路动车乘务实务(第3版)》 课件 项目三任务1铁路客运站车无线交互系统的应用
- LY/T 3408-2024林下经济术语
- 红外线光浴治疗
- 电子警察和信号灯施工方案
- 《数智化技术应用与创新》课件 第1章 走进数智化时代
- 郭庆光《传播学教程》第二版
评论
0/150
提交评论