分块加权主成分分析法_第1页
分块加权主成分分析法_第2页
分块加权主成分分析法_第3页
分块加权主成分分析法_第4页
分块加权主成分分析法_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 27 卷第 3 期南昌大学学报( 理科版)Vol. 27 No . 32003 年 9 月Journal of N anchang U niversity( Natural Science)Sept. 2003文章编号: 1006- 0464( 2003) 03- 0211- 05分块加权主成分分析法徐兵, 邓群钊, 贾仁安( 南昌大学系统工程研究所, 江西南昌 330047)摘 要: 采用分块的方法, 提出了分块加权主成分分析法, 并运用于江西省软科学研究计划项目中, 有效地解决了综合评价中主成份法的逆序问题。关键词: 主成分; 分块加权; 评价中图分类号: N 945116文献标识码:

2、 A主成分分析法以其理论和实践的简洁性, 所得结果的客观性等特点, 广泛应用于经济、社会、科教等领域中众多对象的综合评价, 成为最常用的评价排序方法之一。人们运用主成分分析方法, 通常都是依贡献率大小次序选用主成分, 使原始数据信息的利用率( 累积贡献率) 达 85% 以上, 然后以所选取的主成分为权数进行线性加权, 得到各评价对象的得分值, 并依得分值进行评价排序。但是, 如何保证评价排序的有序性及出现逆序时如何处理, 是个待研究的问题。针对上述问题, 本文给出了一个逆序的实例, 并提出了改进的主成分分析法- 分块加权主成分分析法,很好的解决了逆序问题。1 主成分分析法的必要条件及逆序实例设

3、有 n 个待评价的样本点e 1, e 2, , e n, 每个样本点均由 p 个指标变量描述, 其原始数据矩阵为 X = x ij n p , 对应标准化矩阵为 Z = z ij n p 。参考文献 1 研究了主成分的选取问题, 提出了运用主成分分析法进行评价时, 评价得分值的一般形式:S 1TZ1S =S 2= E w j tjT( 1)Z2 bj = Z E w jt jbjspspj = 1j = 1S nZTnp式中j =E1 w j tj bkj 为评价得分值S 对应于指标z k ( k = 1, 2, , p ) 的权系数, w j 是第j 个主成分的贡献率, tj 可取- 1,

4、1 或 0( 0 表示不选择第 j 个主成分) , bj = ( b 1j , b 2j , , bp j ) T 是第j 个主成分。记: Zi 9 Zk 为样本点Zi 优于Zk ; Zi Zk 为样本点Zi 不劣于Zk ; 若 Zi Zk 和Zk Zi 同时成立, 称 Zk 无差异于 Zi , 记为 Zi WZk 。定义 1若评价得分值 S 是有序的, 当且仅当 S i S k 时, 有 Zi Zk ; 否则称 S 是无序的。要保证 S 是有序的, 必须使正指标( 越大越好的指标为正指标) 的权系数大于零, 负指标( 越小越好的指标为负指标) 的权系数小于零。定理 1主成分评价得分值 S 是

5、有序的, 当且仅当正指标的权系数大于零, 负指标的权系数小于零, 即:E w j tj bkj, k = 1, 2, , ppj = 1 0, 当 z k 为负指标由此可见, 应用主成分分析法进行评价排序时应注意必要条件( 2) 必须满足。我们在江西省软科学研究计划资助项目/ 江西区域可持续发展能力定量评估研究0 的研究过程中, 运用收稿日期: 2003- 04- 17基金项目: 国家自然科学基金资助项目( 79860002) ; 江西省软科学研究计划资助项目( Z1439) ; 南昌大学校基金资助项目 ( Z1759)作者简介: 徐 兵( 1972- ) , 男,讲师1# 212 #南昌大学

6、学报( 理科版)2003 年了算术加权方法和主成分分析法两种方法对江西省的 11 个地市进行评价排序, 然后用迭代组合方法得到综合得分及排名。在运用主成分分析法时, 发现按主成分分析法的一般步骤, 直接用其进行评价, 很难满足必要条件( 2) , 经常会出现逆序现象。表 1江西省 11 地市经济子系统 1999 年数据表指标南昌景市萍乡九江新余鹰潭赣州宜春上饶吉安抚州X 2人均 GDP( 元/ 人)9 5055 7785 1664 2415 5653 9003 1523 5182 6163 1193 234X 3财政收入占 GDP 比重/ %4. 194. 764. 515.1366.755.

7、 975. 856. 066. 165. 72X 4第三产业占 GDP 比重/ %41. 538. 530. 735. 935. 231. 634. 730. 334. 329. 526. 6X 5全员劳动生产率( 元/ 人)28 84421 63011 65319 17612 86529 21714 42613 52016 95314 18516 969X 6工业经济效益综合指数/ %9972. 960. 6465. 3953. 8782. 35 58. 6138. 5669. 9865. 5976. 01X 7人均出口额( 美元/ 人)169. 616. 241. 844. 38. 482

8、2. 857. 152. 814. 751. 550. 66X 8人均旅游外汇收入( 美元/ 人) 5. 1192. 7650. 292 1. 040. 0742. 19 0. 9460.2810. 415 0.595 0. 718X 9人均固定资产投资( 元/ 人)1 138718429630641516313366283425343X 10基本投资占固投比例/ %51. 795854. 3873. 5758. 4450. 6361. 467837. 8175. 9457. 49X 11农基建投资占固投比例/ %0. 690. 801. 430. 792. 760. 150. 130. 41

9、0. 241. 518. 09X 12公路密度/ km#( km2 ) - 10. 2650. 2780. 3720.2040. 2670.2450. 1870.2630. 2040.2130. 21例如: 我们对江西省 11 地市经济子系统 1999 年数据( 表 1) 进行主成分分析, 得到主成分分析表( 表 2) , 我们依贡献率大小选取主成分( 累积贡献率大于 85% ) bT1 , bT2 , bT3 , bT4 , 计算指标权系数数列: A= 53. 54% * t 1* bT1 + 15. 93% * t 2* bT2 + 11. 49% * t 3* bT4 + 8. 87%

10、* t 4* bT4 , 其中 t i ( i = 1, 2, 3, 4) 取- 1 或 1。由于所有指标都是正指标, 要满足必要条件( 2) , 必须使得所有指标的权系数均大于零。要使指标 x 2 的权系数大于零, 必须 t 1= 1, 否则若 t 1 = - 1, x 2 的权系数不大于 53. 54% ( - 1) 0. 913+ 15. 93% ( - 1) ( - 0. 332) + 11. 49% 1 0. 105+ 8. 87% 1 0. 007= - 0. 423 0; 而当 t 1= 1, x 10 权系数不大于 53. 54% 1 ( - 0. 344) + 15. 93%

11、 ( - 1) ( - 0. 383) + 11. 49% ( - 1) ( - 0. 338) + 8. 87% 1 0. 750= - 1. 78 0; 即不能保证指标 x 2、x 10 的权系数同时大于零, 会出现逆序现象。所以我们提出了分块加权主成分分析法来解决逆序问题。表 2 主成分分析表指标 z j第 1 主成分 bT1第 2 主成分 b2T第 3 主成分 b3T第 4 主成分 bT4X 20. 913- 0. 3320. 1050. 007X 3- 0. 6430. 590- 0. 223- 0. 006X 40. 796- 0. 105- 0. 419- 0. 104X 50.

12、 7610. 5140. 0070. 001X 60. 7680. 5050. 296- 0. 001X 70. 9190. 0050. 0010. 127X 80. 9470. 179- 0. 0050. 116X 90. 929- 0. 162- 0. 0040. 223X 10- 0. 344- 0. 383- 0. 3380. 750X 11- 0. 2430. 1330. 8460. 394X 120. 242- 0. 7340. 318- 0. 398贡献率 w53. 54%15. 93%11. 49%8. 87%累积贡献率53. 54%69. 47%80. 96%89. 83%2

13、 分块加权主成分分析法基本思路: 通过将指标分块来消除逆序现象, 使所有指标的权系数都满足必要条件( 2) 。其基本步骤如下:p1) 先对 n 个评价对象在p 个指标变量下进行主成分分析, 计算指标 z k 的权系数: Ak = j =E1 w j tj bkj ( k = 1,第 3 期徐 兵等: 分块加权主成分分析法# 213 #2, , p ) , 其中依贡献率大小选取主成分, 并使累积贡献率大于 85% , t j 可取- 1, 1 或 0( 0 表示不选择第 j 个主成分) , 取- 1 或 1 依所选取主成分的经济含义而定 ( 见 1 ) 。2) 检验 Ak ( k= 1, 2,

14、, p ) 是否满足必要条件( 2) : 若满足, 则利用公式( 1) 计算评价得分值 S , 并依 S 进行排序; 否则转到下一步。3) 对指标变量进行分块。分块方法: 先分析主成分分析中所得到的相关系数矩阵。理论上: 两个同向指标( 两个均为正指标或负指标) 应正相关, 即相关系数应大于零; 两个反向指标( 一个为正指标、一个为负指标) 应负相关, 即相关系数应小于零。因此若两个指标的相关系数不符合上述原则, 则应考虑将其分开; 同时结合第一主成分进行分析, 将第一主成分视为权系数, 则满足必要条件( 2) 的指标与不满足必要条件( 2) 的指标应考虑分开。这样可以将指标变量进行初步分块。

15、每一块由若干指标构成。4) 对每一块进行主成分分析, 计算每一块内指标的权系数, 若某一块内存在指标的权系数不满足必要条件( 2) , 则重复步骤 ( 3) , 对其再进行分块, 直到所有分块都满足必要条件( 理论上可证一定存在满足必要条件的分块情况) 。5) 计算各样本综合得分:在项目研究中我们运用了算术加权方法计算各地区的得分及排名, 通过专家咨询及层次分析法, 得到每个指标在算术加权方法中的权重。定义 2设第 m 个分块由m s 个指标 z m1 , z m2 , , z mm s 构成, 每个指标通过专家咨询及层次分析法所确定m s的权重分别为 u 1, u2, , us , 则 Um

16、 = E ui 称为第m 个分块的块权重。i= 1设由步骤( 4) 最后得到 k 个满足必要条件( 2) 的分块, 首先利用公式( 1) 计算各样本在每一块的得分, 设第 j 个样本在各块的得分依次为v 1j , v 2j , , v kj ( j = 1, 2, , n ) , 各块的块权重依次为 U 1, U 2, , Uk , 利用块权重对第 j 个样本在每一块的得分进行加权平均:kSj =U1 v 1j +U 2 v 2j + ,+Uk v kj =E U mv mj( j = 1, 2, , n)( 3)m = 1最后依 S = S 1, S 2, , Sn T 进行评价排序。定理

17、2分块加权主成分分析法所得到的评价得分值 S 一定是有序的。将公式( 1) 、(3) 结合, 可得到分块加权主成分分析法计算得分值 S 的一般公式:mTS =S1( Z1 )bjm = E Zm E U mw jmt jm bjm( 4)S2 = E U m E w jm tjm ( Z2 )skm smTkm sm = 1j = 1sm = 1j = 1Sn( Znm ) Tm式中 EsU m wjm tjm bijm 为评价得分值S 对应于第m 个分块的指标z im ( i =1, 2, , ms ) 的权系数, U m 为第 mj = 1个分块的块权重, w jm 是第 m 个分块的第j

18、 个主成分的贡献率, t jm 可取-1, 1 或 0( 0 表示不选择第 m 个分mmmm)T是第 m 个分块的第j个主成分, Zm= z ij n m 是标准化矩阵块内的第j 个主成分) , bj = ( b1j , b2j , , bsjZ 的子矩阵( 对应第 m 个分块 ms 个指标的数据) 。3实 例我们对第一部分的逆序例子, 应用分块加权主成分分析法进行评价排序:( 1) 由相关系数矩阵( 表 3) 的第一、二、三、六、七、八列, 表明指标 x 3、x 10、x 11 应与其它指标分开, 再结合主成分分析表( 表 2) 的第一主成分, 指标 x 3、x 10、x 11 可作为一组,

19、 其它指标可作为一组。得到初步分块( 二块: x 3, x 10, x 11 、 x 2, x 4, x 5, x 6, x 7, x 8, x 9, x 12 ) 。# 214 #南昌大学学报( 理科版)2003 年表 3相关系数矩阵X 2X 3X 4X 5X 6X 7X 8X 9X 10X 11X 12X 21. 00-0.7400. 7240.4990.5330.8590.7890. 946-0.184-0.1270. 474X 3-0. 7401. 00- 0. 530 - 0. 129 - 0. 306 - 0. 534 - 0. 509-0. 6290. 0520. 030-0.

20、538X 40. 724-0.5301. 000.4830.4060.6580.6950. 778-0.255-0.5190. 052X 50. 499-0.1290. 4831.000.8720.6690.8550. 636-0.355-0.207-0. 095X 60. 533-0.3060. 4060.8271. 000.7050.8080. 603-0.5360. 088-0. 075X 70. 859-0.5340. 6580.6690.7051. 000.8880. 846-0.263-0.1730. 126X 80. 788-0.5090. 6950.8550.8080.8881

21、. 000. 842-0.260-0.2220. 078X 90. 946-0.6290. 7780.6360.6030.8460.8421. 00-0.083-0.1700. 258X 10-0. 1840. 052- 0. 255 - 0. 355 - 0. 536- 0. 263 - 0. 260-0. 0831. 00-0.002-0. 127X 11-0. 1270. 030- 0. 519- 0. 2070.088- 0. 173 - 0. 222-0. 170-0.0021. 00-0. 092X 120. 474-0.5380. 052- 0. 095 - 0. 0750.12

22、60.078. 0. 258-0.127-0.0921. 002) 对第一块进行主成分分析, 得分块主成分分析表1( 表 4) :表 4分块主成分分析表1指标 z j第 1 主成分( b12 ) T第 2 主成分( b22 ) T第 3 主成分( b 32) TX 30. 7320. 0013- 0. 681X 100. 630- 0. 5040.591X 110. 3560. 8640.355贡献率 w35.305%33. 379%31. 316累积贡献率35.305%68. 684%100%计算指标的权系数向量: 35. 305% ( b11) T + 33. 379% ( b 12) T

23、 + 31. 316( b 13) T = 0. 257, 0. 241, 0. 525 T , 满足必要条件( 2) 。对第二块进行主成分分析, 得分块主成分分析表 2( 表 5) :表 5分块主成分分析表 2指标 z j第 1 主成分( b12 ) T第 2 主成分( b22 ) T第 3 主成分( b 32) TX 20. 8960. 412- 0. 0047X 40. 7740. 103- 0. 548X 50. 802-0. 4260.249X 60. 789-0. 4050.348X 70. 9270. 001- 0.001 6X 80. 962-0. 1420. 006 5X 9

24、0. 9350. 198- 0. 136X 120. 1750. 8780.409贡献率 w66. 96%16. 957%8. 446%累积贡献率66. 96%83. 917%92. 363%计算指标的权系数向量: 66. 96% ( b21) T + 16. 957% ( b22 ) T + 8. 446% ( b23 ) T = 0. 669, 0. 489, 0. 486, 0. 489, 0. 621, 0. 621, 0. 648, 0. 301 T , 满足必要条件( 2) 。3) 由各指标在算术加权方法中的权重( 表 6) , 得到第一块的块权重为 0. 22, 第二块的块权重为

25、 0. 78, 依公式( 4) 计算 11 地市的得分, 并依得分排名( 见表 7) 。表 6算术加权方法中各指标权重表指标X 2X 3X 4X 5X 6X 7X 8X 9X 10X 11X 12指标权重0. 260. 140. 110. 140. 120. 050. 040. 040. 040. 040. 02第 3 期徐 兵等: 分块加权主成分分析法# 215 #表 7 评价结果表南昌景市萍乡九江新余鹰潭赣州宜春上饶吉安抚州得分1. 460. 32- 0. 450. 01- 0. 030. 30- 0. 34 - 0. 49 - 0. 420. 25- 0. 08排名12104538119

26、76本文所提出的分块加权主成分分析法能有效解决逆序问题。而且块权重是通过专家咨询及层次分析法所得到的, 利用块权重对各样本在每一块的得分进行综合, 反映了决策者所认为的指标重要性程度, 是人-机结合进行辅助决策的思想的体现。本文方法在项目中得到了运用, 获得了好的结果。参考文献: 1 傅荣林1 主成分综合评价模型的探讨 J1 系统工程理论与实践, 2001, 21( 11) : 68- 741 2 王惠文1 用主成分分析法建立系统评估指数的限制条件浅析 J 1 系统工程理论与实践 J1 1996, 16( 9) : 24- 271 3 杨维权1 多元统计分析 M 1 北京: 高等教育出版社,

27、19891 4洪 楠1 SP SS for Window s 统计分析教程 M 1 北京: 电子工业出版社, 20001 5 胡水宏, 贺思辉1 综合评价方法 M 1 北京: 科学出版社, 20001 6陈 伟1 主成分分析法用于评价需注意的若干问题 J 1 人类工效学, 2002, 8( 1) : 30- 331THE DIVIDED GROUP PRINCIPLE COMPONENT ANALYSISXU Bing, DENG Qun- zhao, JIA Ren- an( Institute o f System Eng ineering, Nanchang U niversit y, N anchang 330047, China)Abstract: We bring forw ard the divided g roup pri

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论