SPSS软件进行主成分分析的应用例子_第1页
SPSS软件进行主成分分析的应用例子_第2页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS 软件进行主成分分析的应用例子5见表 2 2,定量综合赢利能力分家上市公司 4 4 项指标的数据 20022002 年 1616 析如下:表 2 2 20022002 年1616 家上市公司 4 4 项指标的数据公司销售净利率(X X)1资产净利率(X X)2)净资产收益率(X X)X X 销售毛利率(4歌华有 线? ?五 粮液用 友软件 太太药业浙江阳光 烟台万华 方正科技红河光明 贵州茅台 中铁二局红星发展 伊利股份 青岛海尔湖北宜 化? ?雅戈尔福 建南纸73731.1.主成分分析的做法第一,将 EXCELEXCEL 中的原始数据导入到 SPSSSPSS 软件中;注意:导入Sps

2、s的数据不能岀现空缺的现象,如岀现可用0补齐。第二,对四个指标进行标准化处理;【1 1】“分析” | | “描述统计” | | “描述”。【2 2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中, 此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。【3 3】返回 SPSSSPSS 的“数据视图”,此时就可以看到新增了标准化后数据的字段。所做工作a.原始数据的标准化处数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单例子,一个百分 制的变量与一分值的变量在一起怎么比较?只有通过数据标准化,都把它标准到同一个标准时才具有可比 性,一般标准化

3、采用的标准化,即均值,方差,当也有其他标准化,比0-标准化等等,可根据自己的研 究目的进行选择,这里介绍怎么进行据标准化所的结论标准化后的所有指标数据注意:SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算 结果后的变量都是指经过标准化处理后的变量,但SPSS并不直接给岀标准化后的数据,如需要得到标准 化数据,则需调用Descriptives过程进行计算。第三,并把标准化后的数据保存在数据编辑窗口中然后利用SPSSSPSS 的 factorfactor 过程对数据进行因子分析(指标之间的相关性判定略)。【1 1】“分析” | | “

4、降维” | | “因子分析”选项卡,将要进行分析的变量选入“变量” 列表;【2 2】设置“描述”,勾选“原始分析结果”和“ KMOKMO 与 BartlettBartlett 球形度检验”复选框;【3 3】设置“抽取”,勾选“碎石图”复选框;【4 4】设置“旋转”,勾选“最大方差法”复选框;【5 5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框;【6 6】查看分析结果。所做工作a查KMBartlett的检KM值接近值越接近1意味着变量间的相关性越强,原有变量越适合作因子分析Bartlett球度度检验Si值越小于显着水平,越说明变量之间存在相关关系所的结论符合因子分析的条件,可以进行

5、因子分析,并进一步完成主成分分析注意Kaiser-Meyer-Olk in)KM统计量是取值之间当所有变量间的简单相关系数平方和远远大于偏相关系数方和时KIM直接近值越接近1意味着变量间的相关性越强,原有变量越适合作因子分析;所有变量间的简单相关系数平方和接时KM值接 近值越接近0意味着变量间的相关性弱,原有变量越不适合作因子分析Kaise给出了常用km度量标:以上表示非常适合;表示适合;表示一般;表示不太合;以下表示极不适合 球度检验巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对的相伴概率值小 于用户心中的显着性水平,那么应该拒绝零假设,认为相关系数矩阵不可能

6、是位阵,即原始变量之间存在 相关性,适合于做主成份分析;相反,如果该统计量比较小,且其对应的相伴概率大于显着性水平,则不 能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜做因子分析Bartlett球度检验的原假设为相关系数矩阵为单位矩阵Si值为小于显着水平,因此拒原假设,说明变量 之间存在相关关系,适合做因子分析所做工作b.全部解释方差或者解释的总方 仃otal Varianee Explained)初始特征根Initial Eigenvalue)大,并且累计百分比达80%8蟻上查看相关系数矩阵的特征根及方差贡献率见,由于个主成分贡献率85、结合中变量不出现丢失,所以提取 的主成分个m=所的结

7、论初始特征根:=主成分贡献率=注意:主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分 的方差,而方差是变量数据蕴涵信息的重要判据之一。根据入值决定主成分数目的准则有三:1.只取入1的特征根对应的主成分从Total Varia nee Explai ned表中可见,第一、第二和第三个主成分对应的入值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。2.累计百分比达到80%85以上的入值对应的主成分在Total Varianee Explained表可以看岀,前三个主成分对应的入值累计百分比达到%这暗示只要选取三个主成分

8、,信息量就够了。3.根据特征根变化的突变点决定主成分的数量从特征根分布的折线图 (Scree Plot) 上可以看到, 第4个入值是一个明显的折点, 这暗示选取的主成分 数目应有p4。那么,究竟是3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。第四,计算特征向量矩阵(主成分表达式的系数)【1 1】将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编 辑窗口(为变量 V1V1、V2V2);F=V/SQR(入)111【2 2】然后利用“转换” | | “计算变量”,打开“计算变量”对话框,在“目标 变量”文本框中输入“ F F”,然后在数字表达式中输入“ V/SQRV/

9、SQR(入)” 注:入 m=,m=, 即可得到特征向量 F F;11【3 3】然后利用“转换” | | “计算变量”,打开“计算变 量”对话框,在“目标变量”文本框中输入“F F”,然后在数字表达式中输入“ V/SQRV/SQR(入)” 注: :入222=,=,即可得到特征向量 F F;21【4 4】最后得到特征向量矩 阵(主成分表达式的系数)。所做工作a.成分矩阵或者初始因子载荷矩阵Component Matri初始因子载荷矩阵见上图,通过初始因子载荷矩阵还不能得出主成分的表达式,还需要把始因子载荷矩阵 中的每列的系数(主成分的载荷)除以其相应主成分的特征根的平方根后才能到主成分系数向量(主

10、成分 的得岀系数)所的结论1用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷2计算后,得到的主成分表达式的系数矩阵注意1主成分表达式的系提取出来的全部主成分可以基本反映全部指标的信但这些新变量(主成分)的表达却不从输出窗口中直接 得即:主成分中每个指标所对应的系数不是初始因子载荷矩阵中的对应指的载荷,因为ComponenMatri” 是指初始因子载荷矩,每一个载荷量表示主成分与对应量的相关系数2主成分表达式系数的计算方初始因子载荷矩阵或主成分载荷矩(Component Matrix中的数据除以主成分相对应的特根(或特征值)开 平方根便得到两个主成分中每个指标所对应的系数=/SQR)3

11、主成分的指标划分与命中每列表示相应主成分与对应变(Component Matrix初始因子载荷矩阵或主成分载荷矩阵.的相关系数,每个主成分所反映的原始指标各有不同,为进一步明确每个主成分侧重反应的具体原始指标, 需要对原始指标在每个主成分上的载荷进行比较,其中载荷越大,其对应的主成分反映该原始指标的信息 量越大,反之亦然;如果某一原始指标在几个主成分的载荷绝对值不相上下,归类比较含混,导致主成分 的原始指标划分不清。说明有必要作进一步的因子分析。从Component Matrix即主成分载荷表中可以看岀,哪一原始指标在哪一主成分上载荷绝对值较大,亦即与 该主成分的相关系数较高【注:相关分为正负

12、相关】。第五,计算主成分得分矩阵(主成分得分)【1 1】将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分 函 数的表达式;Z= F*zX+ F*zX+ F*zX+ F*zXZ= F*zX+ F*zX+ F*zX+ F*zX?(其中,zX为标准化后的数据)i3422212312422【2 2】 然后利用“转换” | | “计算变量”, 打开“计算变量”对话框, 在“目标变 量”文本框中输入“ Z Z”,然后在数字表达式中输入“ *+*+*z()资Z(销售净利率1+” 注: :F=,F=,即可得到特征向量 Z Z;,)产净利率销售毛利率*Z(净资产收益率)*Z(11【3 3】 同理 注:

13、 :F=,F=,可得到特征向量 Z Z;,22【4 4】求出 1616 家上市公司的主成分值。所做工作:a.对原始数据标准化后的数据标准化后的数据;所的结论:1.用于计算主成分表达式系数的初始因子载荷矩阵中每个指标的载荷。注意:1.特征向量矩阵载荷的用运Z= F*zX+ F*zX+ F*zX+ F*zX 4”3”z= F*zX+ F*zX+ F*zX+ F*zX?(其中,zX为标准化后的数据) 运址心第六,最后利用主成分函数、综合主成分公式:【1 1】将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式;Z=r*Z+r*Z2121【2 2】然后利用“转换” I I “计算变量”,打开“计算变量”对话框,在“目标 变量”文本框中输入“Z Z”,然后在数字表达式中输入“ r*Z+r*Zr*Z+r*Z ” 注: :r=,r=,12112r=,r=, 即可得到综合主成分;2【3 3】综合主成分(赢利能力)值。所做工作:a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论