




已阅读5页,还剩7页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析实验1:数据Employee data.sav中为银行在1969-1971年之间雇员情况的数据,共包括474条观测及如下10各变量:ID,gender , Bdate, Educ, Jobcat ,Salary,Salbegin,Jobtime,Orevexp,Minority.下面我们用主成分分析法处理该数据,一起用少数变量来描述该地区居民的雇佣情况。打开数据Employee data.sav,依次选 分析降维因子分析点击OK即可,输出为:公因子方差给出了该次分析从每个原始变量中提取的信息,可看出除受教育程度信息损失较大外,主成分几乎包含了各个原始变量至少90%的信息。公因子方差初始提取Educational Level (years)1.000.754Current Salary1.000.896Beginning Salary1.000.916Months since Hire1.000.999Previous Experience (months)1.000.968提取方法:主成份分析。解释的总方差显示了各主成分解释原始变量总方差的情况,默认保留特征根大于1的主成分,本例保留3个主成分,集中了原始5各变量信息的90.66%,可见效果比较好。解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %12.47749.54149.5412.47749.54149.54121.05221.04670.5871.05221.04670.58731.00320.07090.6561.00320.07090.6564.3657.29997.9555.1022.045100.000提取方法:主成份分析。实际上,主成分解释总方差的百分比也可以由公因子方差表计算得出,即(.754+.896+.916+.999+.968)/5=90.66%,成分矩阵给出了标准化原始变量用求得的主成分线性表示的近似表达式,以current Salary一行为例,用prin1,prin2,prin3来表示个各主成分,得到:标准化的Salary0.940*prin1+0.104*prin2+(2.857E-02)*prin3.成份矩阵a成份123Educational Level (years).846-.194-.014Current Salary.940.104.029Beginning Salary.917.264-.077Months since Hire.068-.052.996Previous Experience (months)-.178.965.069提取方法 :主成份。a. 已提取了 3 个成份。在上面的主成分分析中,SPSS默认是从相关矩阵出发求解主成分,且默认保留特征根大于1的主成分,实际上,对主成分的个数,我们可以自己确定,方法为:选择 “抽取因子的固定数量 ” 可以输入别的数值来改变SPSS软件保留特征根的大小。另外,还可以直接确定主成分个数。在实际进行主成分分析时可以先按照默认设置做一次主成分分析,然后根据输出结果确定应保留主成分的个数,用该方法进行设定后重新分析。由成分矩阵中的结果可以得到:第一主成分的方差。又有这恰好与公因子方差表中三个主成分提取Salary变量的信息相等,重做一遍主成分,此次将5个主成分全部保留,得到成份矩阵a成份12345Educational Level (years).846-.194-.014.496.008Current Salary.940.104.029-.234.222Beginning Salary.917.264-.077-.183-.225Months since Hire.068-.052.996-.013-.026Previous Experience (months)-.178.965.069.174.038提取方法 :主成份。a. 已提取了 5 个成份。对上表中结果有如下关系式:还可得到标准化原始变量用各主成分线性表示的精确的表达式:Salary=0.940*prin1+0.104*prin2+(2.857E-02)*prin3-0.234*prin4+0.222*prin5由默认选项输出的结果,我们还不能得到用原始变量表示出主成分的表达式,要得到这个结果及其他一些有用的结果,就需要对模块中的设置作调整。方法如下:得分显示因子得分系数矩阵。输出:成份得分系数矩阵成份123Educational Level (years).342-.184-.014Current Salary.380.099.028Beginning Salary.370.250-.077Months since Hire.027-.050.992Previous Experience (months)-.072.917.069提取方法 :主成份。上表给出了用原始变量表示主成分的系数信息,因为系统默认是从相关矩阵出发进行分析,所以,上面表格中的系数是将原始变量标准化后表示主成分的系数,也就是说,有下式成立:标准化prin1=0.342*标准化educ+0.380*标准化Salary+ 0.370*标准化salbegin+ 0.027*标准化jobtime- 0.072*标准化prevexp应当注意,此处给出的用原始变量表示主成分的表达式得到的是标准化后的主成分,也就是说,这样求得的主成分方差是1.,而不是原始变量相关矩阵的各个特征根,如前所述,第一主成分的方差是2.477,而用上式求得的主成分方差为1,要得出为标准化的主成分与原始变量的表达式,只需将给出的系数前面乘以主成分方差的平方根即可,未标准化第一主成分与原始变量的关系式如下:prin1=0.342 *标准化educ+0.380 *标准化Salary+ 0.370 *标准化salbegin+ 0.027 *标准化jobtime- 0.072 *标准化prevexp。类似可写出第二,第三主成分用标准化后的原始变量表示的表达式。实验2:在企业经济效益的的评价中,设计的指标往往很多为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。在我国部分省市自治区独立核算的工业企业的经济效益评价中,涉及9项指标,原始数据为数据集中前十列,后十列为标准化后的数据。第一步:将数据标准化。将变量全部选入变量窗口,选中“将标准化得分另存为变量”第二步:进行主成分分析(如图所示)选择 分析降维因子分析将新产生的变量选入变量窗口(如图)在描述框中选中相关矩阵中的系数回到原对话框点击OK即可,输出得到如下:图1:为相关矩阵表格,可看出变量之间的相关系数。相关矩阵Zscore(VAR00001)Zscore(VAR00002)Zscore(VAR00003)Zscore(VAR00004)Zscore(VAR00005)Zscore(VAR00006)Zscore(VAR00007)Zscore(VAR00008)Zscore(VAR00009)相关Zscore(VAR00001)1.000.869.770-.053.211.920.899.795.896Zscore(VAR00002).8691.000.978.387.472.886.804.814.849Zscore(VAR00003).770.9781.000.523.531.797.736.740.811Zscore(VAR00004)-.053.387.5231.000.323.115-.023.125.051Zscore(VAR00005).211.472.531.3231.000.175.260.371.317Zscore(VAR00006).920.886.797.115.1751.000.877.815.768Zscore(VAR00007).899.804.736-.023.260.8771.000.757.818Zscore(VAR00008).795.814.740.125.371.815.7571.000.715Zscore(VAR00009).896.849.811.051.317.768.818.7151.000图2;前两个主成分y1,y2,的方差和占全部方差的比例为84.7%,我们就选取y1为第一主成分,y2为第二主成分,这样基本上保留了原来指标的信息,由9个指标转化为2个新指标,起到了降维的目的。解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %16.15068.33268.3326.15068.33268.33221.47316.36584.6981.47316.36584.6983.6977.74992.4474.3183.53195.9785.1902.11298.0906.1161.28999.3797.029.32499.7038.024.27099.9739.002.027100.000提取方法:主成份分析。图3:主成分系数矩阵成份矩阵a成份12Zscore(VAR00001).931-.315Zscore(VAR00002).976.163Zscore(VAR00003).931.322Zscore(VAR00004).232.863Zscore(VAR00005).433.596Zscore(VAR00006).923-.200Zscore(VAR00007).897-.274Zscore(VAR00008).871-.064Zscore(VAR00009).899-.154提取方法 :主成份。a. 已提取了 2 个成份。y1=0.931x1+0.976x2+0.931x3+0.232x4+0.433x5+0.923x6+0.897x7+0.871x8+0.899x9y2=-0.315x1+0.163x2+0.322x3+0.863x4+0.596x5-0.2x6-0.274x7-0.064x8-0.154x9线性组合中各变量的系数的绝对值大者表明该主成分主要综合了绝对值大的变量,有几个变量系数大小相当时,应认为这一主成分是这几个变量的总和,这几个变量综合在一起应赋予怎样的经济意义,要结合经济专业知识,给出恰如其分的解释,才能达到深刻分析经济成因的目的。本例中,我们得到的2个主成分有着明显的经济意义,第一主成分的线性组合中除下,x4,x5外,其余变量的系数相当,所以第一主成分可看成是x1,x2,x3,x6,x7,x8,x9的综合变量。根据各变量的含义,可将第一主成分解释为反映工业生产中的投入的资金,劳动力所产生的效果,它是“投入”与“产出”之比,第一主成分所占信息总量为68.3%,在我国目前的工业企业中,经济效益首先反映在投入与产出之比上,其中固定资产所产生的经济效益更大些。第二主成分是把工业生产中所得总量(即工业总产值和销售收入)与局部量(即利税)进行比较,反映了“产出”对国家所做的贡献。这样,在抓企业经济效益活动中,就应注重投入与产出之比和产出对国家所做的贡献,抓住了这两个方面,经济效益就一定会提高。第三步:标准化后的原始数据带入主成分表达式先选择 “数据选择个案如果条件满足将表达式输入计算窗口”一次步骤计算第二主成分得分。结果如下:接下来是将第一主成分为横坐标,第二主成分为纵坐标画图。选择
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国屠宰后鲜肉项目创业计划书
- 中国急救输液泵项目创业计划书
- 中国伞花木属项目创业计划书
- 中国克氏原螯虾项目创业计划书
- 中国观光农业园项目创业计划书
- 2025餐厅转让合同标准版范本
- 2025个人贷款合同范本
- 中国尿石症管理装置项目创业计划书
- 中国电阻网络项目创业计划书
- 中国多媒体移动通信系统项目创业计划书
- 初三英文补考试卷及答案
- 预防粮库粮堆坍塌埋人事故
- 医院生物安全管理制度
- 行政前台面试试题及答案
- 输血制度和流程
- 2024年江苏连云港中考满分作文《天呐原来这么有意思》2
- 法学与社会发展毕业论文范文
- 会展服务合同范文6篇
- 文旅知识培训课件
- 2025年行政执法人员行政执法资格证考试必考题库及答案(共340题)
- 南大版一年级下册心理健康第15课《走进大自然》教案
评论
0/150
提交评论