如何用SPSS软件一步算出主成分得分值_第1页
如何用SPSS软件一步算出主成分得分值_第2页
如何用SPSS软件一步算出主成分得分值_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第 22卷第 5期vol. 22? no. 5统 计 与 信 息 论 坛statistics & information forum2007年 9 月sept. , 2007收稿日期: 2007- 04- 15基金项目: 广州市哲学社会科学规划资助课题( 06yz140); 广东商学院经济贸易与统计学院 2006 年资助课题作者简介: 林海明( 1959- ), 男, 湖南省宁乡县人, 副教授, 研究方向: 数量经济学。?统计理论与方法 如何用 spss 软件一步算出主成分得分值林海明(广东商学院 经济贸易与统计学院, 广东 广州? 510320)摘要: 主成分分析法常被应用于综合评价

2、与监控, 其评价与监控值就是样品的主成分得分值, 故尽快求出主成分得分值是实现综合评价与监控的重要环节之一。多数人使用的 spss 软件求解主成分得分值的方法较慢, 甚至出现错误。而从理论上给出主成分得分值与未旋转因子得分值的关系式, 并利用 spss 软件因子分析模块中未旋转因子得分值, 一步算出主成分得分值, 则大大简化了计算, 其效果比以前的方法好。同时也改正了一些新版文献的错误。关键词: spss 软件; 主成分; 得分值; 一步; 算法中图分类号: o212? ? 文献标识码: a? ? 文章编号: 1007- 3116( 2007)05- 0015- 03一、 引 ? 言在社会经济

3、、 管理、 自然科学等众多领域的多指标体系中, 如资源节约型社会指标体系、 生态环境可持续型指标体系、 和谐社会指标体系、 投资环境指标体系等, 主成分分析法常被应用于综合评价与监控,其评价与监控值就是样品的主成分得分值。因此,尽快求出主成分得分值是实现综合评价与监控的重要环节之一。目前, 多数人会使用 spss 软件, 该软件因子分析模块相对完善, 但没有主成分分析模块, 这对用主成分分析法解决实际问题的使用者来说, 带来了较大的不方便、 甚至出现错误。在参考文献 1 的最新版( 第 3 版) 中, 仍然没有给出主成分得分值的计算结果, 主成分分析与因子分析仍然出现混淆。在参考文献 2 中,

4、 其依据主成分系数与初始因子载荷阵的关系、 主成分的公式, 给出了主成分得分值的三步计算: 第一步, 用初始因子载荷阵算出主成分系数、 给出主成分函数; 第二步, 算出样品观测值的标准化值; 第三步, 算出主成分得分值( 互联网上有 7 8 个页面引用该文) 。在参考文献 3 中, 基于这三步进行操作, 用 spss 软件二次开发出了主成分分析模块。参考文献 2 3 的共性是第二步、 第三步较慢,参考文献 3! 希望有更深入的研究。 那么, 问题的关键是: 能否利用 spss 软件的因子分析模块, 一步算出主成分得分值呢?笔者从理论上给出了主成分得分值与未旋转因子得分值的关系式, 并利用 sp

5、ss 软件中未旋转因子得分值一步算出主成分得分值。大大简化了计算, 效果比以前的方法好。同时, 改正了一些新版文献( 如参考文献 1 ) 的错误。二、 主成分得分值与未旋转因子得分值的关系式? ?设 x = ( x1, #, xp)为正向化随机变量向量( p %2), r 为相关系数矩阵, r 的特征值为?1, #,?p, ?1% # % ?p%0, 前 m 个单位正交特征向量矩阵 am= ( ?1, #, ?m), 主成分向量 ym= ( y1, #,ym)。主成分解(hotelling, 1933):yi= ? ix ? ? varyi= ?i? ? i = 1, #, m设第 j 个样品

6、的正向化观测值的标准化值为xj, z0i为未旋 转 因子 得分 函数, 则 主成 分得 分 值为15yix= xj, 未旋转因子得分值为z0ix = xj。定理 1(1) 主成分 yi的标准化是未旋转因子得分函数z0i, 即:yi=?iz0ii = 1, #, m(2) 主成分得分值与未旋转因子得分值的关系式为:yix= xj=?iz0ix= xji = 1, #, m由于 spss 软件因子分析模块中直接有未旋转因子得分值z0ix= xj, 故从因子分析模块中求解主成分得分值yix= xj, 是一步计算。证明: 由参考文献 4 中的定理 1, 因子分析模型 l 的初始因子解是主成分yi的标准

7、化, 由参考文献 4 中的推论 1, 取 c = i, 初始因子解 zi是未旋转因子得分 z0i。 证毕。三、 spss 软件因子分析模块中一步计算主成分得分值的实例? 为便于比较, 用新版参考文献 1 的例子。在市场研究中, 常常要求分析顾客的偏好和当前市场的产品与顾客偏好之间的差别, 从而找出新产品开发的方向。顾客偏好分析时常用到主成分分析方法。表 1? 25 名顾客对 17 种车型评分表序号 代码车名x1x2x3x4x5x6x7x8x9x10x11x12x13x14x15x16x17x18x19x20x21x22x23x24x251e卡迪拉克eldorado800799049124050

8、89710938092ch雪佛龙 chevette00512004234510430035156983cit雪佛龙 citation40533058141616435447477954m雪伏龙 mal ibu60274007231213455456686585f福特 fairmont20240067150214435306486556mu福特 must ong50071977050211018506575557p福特 pint o100212223030302015005140788a本田 accord59568976096999529989750789ci本田 civic4836709507

9、48885256776507510co林肯 cont inen700899059223040996209190911g普利茅斯granfury700600043410110733345870812h普利茅斯 horizon300500563546130244467565513v普利茅斯 volare400500361402160275447655514fi庞体阿克 firebird010789561320120695826590715d大众 dasher485869650887779537789500016r大众 rabbit485850970969579548788500017dl沃尔沃 d

10、l9989998909999987989919000? ? 例: 表 1 的数据来自 sas 公司。1980年一个汽车制造商在竞争对手中选择了 17 种车型, 访问了25 名顾客, 要求他们根据自己的偏好对 17 种车型打分。打分范围在 0 9. 9 之间, 9. 9 表示最高程度的偏好。1? 数据文件格式。数据文件是以 25 名顾客为25 个变量 x1 x25, 17 种车型为样品, 每种车型的25 个分数是一个样品正向观测值。2? 操作步骤。因子分析模块中未旋转因子得分值的调出, 本文在新版参考文献 1 基础上作了更正修改, 见黑体字( 1) 按analyze&data reduc

11、tion &factor 顺序点击各菜单项, 打开因子分析主对话框。( 2) 选择 x1 x25为分析变量送到右面的 vari?ables 栏中。( 3) 主对话框中点击 extraction 按钮, 在相应的对话框中: ethod 菜单中选择 principle components 要求16统计与信息论坛使用主成分法。( extract 栏中选择 number of factors 3。) display 栏中选择 unrotated facter solution,要求显示未旋转因子得分结果。( 4) 主对话框中点击 score 按钮. 在相应的对话框中选择 save as va

12、riables, 并在 method 栏中选择regression, 要求计算未旋转因子得分并把未旋转因子得分值 z0ix= xj作为新数据保存到数据文件中。( 5) 点击 ok 提交系统执行。( 6) 输出结果: 前三个特征值见表 2、 样品的前三列未旋转因子得分值 z0ix = xj, i = 1, 2, 3 , 其在数据窗口最右边的 fac1- 1、 fac2- 1、 fac3- 1中。表 2? 三个主成分方差百分比表componentextraction sums of squared loadingstotal% of variancecumulative %1? 10. 837?

13、? 43. 347? ? 43. 34825. 80223. 20766. 55532. 0608. 24074. 7953? 主成分得分值一步算法: 利用 transform &compute, 在对话框中输入y1= fac1- 1* sqr( ?1)(表2中 ?1= 10?837), 即得主成分得分值: y1x= xj; 在对话框中输入 y2= fac2- 1* sqr( ?2)(表 2 中 ?2=5?802), 即得主成分得分值: y2x= xj; 在对话框中输入 y3= fac3- 1* sqr( ?3)(表2中 ?3= 2?06), 即得主成分得分值: y3x = xj。 y

14、1、 y2、 y3在数据窗口最右边(见表 3)。表 3? 主成分得分值表车型y1y2y3卡迪拉克 e? - 2. 84? ? 4. 984? - 1. 013雪佛龙 ch- 2. 62- 3. 491- 2. 241雪佛龙 ci- 0. 18- 2. 1520. 86雪伏龙 m- 1. 38- 0. 1161. 468福特 f- 1. 40- 2. 2451. 606福特 mu- 1. 32- 0. 562. 151福特 p- 3. 24- 3. 157- 2. 053本田 a4. 500. 338- 1. 488本田 ci3. 08- 1. 06- 1. 491林肯 co- 2. 925.

15、234- 1. 045普利茅斯 g- 3. 080. 2741. 207普利茅斯h- 1. 18- 1. 0610. 003普利茅斯 v- 1. 66- 0. 5990. 956庞体阿克 fi- 1. 672. 0420. 559大众 d4. 450. 644- 1. 132大众 r4. 69- 0. 102- 0. 104沃尔沃 dl6. 771. 031. 752笔者利用spss 软件因子分析模块中未旋转因子得分值, 一步算出了主成分得分值, 简化了计算, 改正了一些新版文献如参考文献 1 的错误, 其效果比以前的方法好。参考文献: 1 ? 卢纹岱, 等. spss for windows

16、 统计分析(第 3 版) m. 北京: 电子工业出版社, 2006. 2 ? 林海明, 张文霖. 主成分分析与因子分析详细的异同和 spss 软件j. 统计研究, 2005(3) . 3 ? 项径渭, 傅德印. 基于 spss 的二次开发直接求解主成分j . 统计研究, 2006( 4). 4 ? 林海明. 因子分析精确模型的基本思想与方法 j. 统计与信息论坛, 2006( 5): 23- 25.( 责任编辑: 郭诗梦)how to use spss software calculate the value of the principal component scores in one s

17、teplin hai?ming(school of economics trade and statistics, guangdong university of business studies, guangzhou 510320, china)abstract:principal component analysis often been used to conduct comprehensive evaluation and monitoring. thevalue for this purpose isthe sample score of principal component. h

18、ence to obtain it in a fast way becomesvery importantfor the process of comprehensive evaluation and monitoring. the mostly used method for obtain the score of principalcomponent worksslowly and has mistakes. this article derived the functional expression between that score and the scorebefore rotation. the author use the score before

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论