




已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析在主成分分析在 SPSS 中的操作应用中的操作应用 上上 慧聪网 2005 年 11 月 30 日 9 时 46 分 信息来源 慧聪网行业研究频道 一 引言一 引言 主成分分析和因子分析在社会经济统计综合评价 中是两个常被使用的统计分析方法 现在 SPSS SAS 等统计软件使用越来越普遍 但 SPSS 并未像 SAS 一 样 将主成分分析与因子分析作为两个独立的方法并 列处理 注 主成分分析与因子分析二者是又有着区别 与联系 最主要的不同在于它们的数学模型的构建上 具体区别请见参考文献 2 而是根据二者之间的关系 有机地将主成分分析嵌入到因子分析之中 这样虽然简化了分析程序 却为主成分分析的计算带来不 便 且国内许多 SPSS 教程并没有详细讲解如果应用 SPSS 进行主成分分析 如何使用 SPSS 对主成分 分析进行计算呢 为使读者能够正确使用 SPSS 软件进行主成分分析 本文将通过一个实例来详细介 绍如何用 SPSS 做主成分分析 接下来先简单介绍主成分分析原理与模型 以便读者对主成分分析有 个大致的了解 二 主成分分析原理和模型二 主成分分析原理和模型 1 一 主分成分析原理 主成分分析是设法将原来众多具有一定相关性 比如 P 个指标 重新组合成一组新的互相无关 的综合指标来代替原来的指标 通常数学上的处理就是将原来 P 个指标作线性组合 作为新的综合指 标 最经典的做法就是用 F1 选取的第一个线性组合 即第一个综合指标 的方差来表达 即 Var F1 越大 表示 F1包含的信息越多 因此在所有的线性组合中选取的 F1应该是方差最大的 故称 F1为第一主成分 如果第一主成分不足以代表原来 P 个指标的信息 再考虑选取 F2即选第二个线性 组合 为了有效地反映原来信息 F1已有的信息就不需要再出现再 F2中 用数学语言表达就是要求 Cov F1 F2 0 则称 F2为第二主成分 依此类推可以构造出第三 第四 第 P 个主成分 二 主成分分析数学模型 F2 a12ZX1 a22ZX2 ap2ZXp Fp a1mZX1 a2mZX2 apmZXp 其中 a1i a2i api i 1 m 为 X 的协方差阵 的特征值多对应的特征向量 ZX1 ZX2 ZXp 是原始变量经过标准化处理的值 因为在实际应用中 往往存在指标的量纲不同 所以在计算之 前须先消除量纲的影响 而将原始数据标准化 本文所采用的数据就存在量纲影响 注 本文指的数 据标准化是指 Z 标准化 A aij p m a1 a2 am Rai iai R 为相关系数矩阵 i ai是相应的特征值和单位特征向量 1 2 p 0 进行主成分分析主要步骤如下 1 指标数据标准化 SPSS 软件自动执行 2 指标之间的相关性判定 3 确定主成分个数 m 4 主成分 Fi表达式 5 主成分 Fi命名 主成分与综合主成分 评价 值 三 对沿海三 对沿海 10 个省市经济综合指标进行主成分分析个省市经济综合指标进行主成分分析 一 指标选取原则 本文所选取的数据来自 中国统计年鉴 2003 中 2002 年的统计数据 在沿海 10 省市经济状况主 要指标体系中选取了 10 个指标 X1 GDP X2 人均 GDP X3 农业增加值 X4 工业增加值 X5 第三产业增加值 X6 固定资产投资 X7 基本建设投资 X8 国内生产总值占全国比重 X9 海关出口总额 X10 地方财政收入 图表 1 沿海 10 个省市经济数据 地区地区 GDPGDP 人均人均 GDPGDP 农业增农业增 加值加值 工业增工业增 加值加值 第三产第三产 业增加业增加 值值 固定资固定资 产投资产投资 基本建基本建 设投资设投资 社会消社会消 费品零费品零 售总额售总额 海关出海关出 口总额口总额 地方财地方财 政收入政收入 辽宁辽宁5458 2 13000 14883 3 1376 2 2258 4 1315 95292258 4123 7399 7 山东山东 105501164313903502 538512288 7 1070 7 3181 9211 1610 2 河北河北6076 6 9047950 21406 72092 6 1161 6597 11968 345 9302 3 天津天津2022 6 22068 83 9822 8960703 7361 9941 4115 7171 8 江苏江苏 10636143971122 63536 33967 223201141 3 3215 8384 7643 7 上海上海 5408 8 40627 86 22196 22755 8 1970 2779 32035 2320 5709 浙江浙江 7670165706802356 530652296 6 1180 6 2877 5294 2566 9 福建福建 4682135106631047 11859964 5397 91663 3173 7272 9 广东广东 11770150301023 94224 64793 6 3022 9 1275 5 5013 6 1843 71202 广西广西2437 2 5062591 4367995 7542 2352 71025 515 1186 7 二 主成分分析在 SPSS 中的具体操作步骤 运用 SPSS 统计分析软件 Factor 过程 2 对沿海 10 个省市经济综合指标进行主成分分析 具体操作 步骤如下 1 Analyze Data Reduction Factor Analysis 弹出 Factor Analysis 对话框 2 把 X1 X10选入 Variables 框 3 Descriptives Correlation Matrix 框组中选中 Coefficients 然后点击 Continue 返回 Factor Analysis 对话框 4 点击 OK 图表 2 Factor Analyze 对话框与 Descriptives 子对话框 SPSS 在调用 Factor Analyze 过程进行分析时 SPSS 会自动对原始数据进行标准化处理 所以在 得到计算结果后指的变量都是指经过标准化处理后的变量 但 SPSS 不会直接给出标准化后的数据 如需要得到标准化数据 则需调用 Descriptives 过程进行计算 图表 3 相关系数矩阵 图表 4 方差分解主成分提取分析表 主成分分析在主成分分析在 SPSS 中的操作应用中的操作应用 下下 慧聪网 2005 年 11 月 30 日 9 时 47 分 信息来源 慧聪网行业研究频道 图表 5 初始因子载荷矩阵 从图表 3 可知 GDP 与工业增加值 第三产业增加值 固定资产投资 基本建设投资 社会消费品零 售总额 地方财政收入这几个指标存在着极其显著的关系 与海关出口总额存在着显著关系 可见许多 变量之间直接的相关性比较强 证明他们存在信息上的重叠 主成分个数提取原则为主成分对应的特征值大于 1 的前 m 个主成分 注 特征值在某种程度上可以 被看成是表示主成分影响力度大小的指标 如果特征值小于 1 说明该主成分的解释力度还不如直接引入 一个原变量的平均解释力度大 因此一般可以用特征值大于 1 作为纳入标准 通过图表 4 方差分解主成 分提取分析 可知 提取 2 个主成分 即 m 2 从图表 5 初始因子载荷矩阵 可知 GDP 工业增加值 第三产业增加值 固定资产投资 基本建设投资 社会消费品零售总额 海关出口总额 地方财政收入 在第一主成分上有较高载荷 说明第一主成分基本反映了这些指标的信息 人均 GDP 和农业增加值指标 在第二主成分上有较高载荷 说明第二主成分基本反映了人均 GDP 和农业增加值两个指标的信息 所以 提取两个主成分是可以基本反映全部指标的信息 所以决定用两个新变量来代替原来的十个变量 但这 两个新变量的表达还不能从输出窗口中直接得到 因为 Component Matrix 是指初始因子载荷矩阵 每一 个载荷量表示主成分与对应变量的相关系数 用图表 5 主成分载荷矩阵 中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个 指标所对应的系数 2 将初始因子载荷矩阵中的两列数据输入 可用复制粘贴的方法 到数据编辑窗口 为变量 B1 B2 然后利用 Transform Compute Variable 在 Compute Variable 对话框中输入 A1 B1 SQR 7 22 注 第二主成分 SQR 后的括号中填 1 235 即可得到特征向量 A1 见图表 6 同理 可得到特征向量 A2 将得到的特征向量与标准化后的数据相乘 然后就可以得出主成分表达式 注 因 本例只是为了说明如何在 SPSS 进行主成分分析 故在此不对提取的主成分进行命名 有兴趣的读者可自 行命名 F1 0 353ZX1 0 042ZX2 0 041ZX3 0 364ZX4 0 367ZX5 0 366ZX6 0 352ZX7 0 364ZX8 0 298ZX9 0 355ZX10 F2 0 175ZX1 0 741ZX2 0 609ZX3 0 004ZX4 0 063ZX5 0 061ZX6 0 022ZX7 0 158ZX8 0 046ZX9 0 115ZX10 图表 6 Compute Variable 对话框 前文提到 SPSS 会自动对数据进行标准化 但不会直接给出 需要我们自己另外算 我们可以通过 Analyze Descriptive Statistics Descriptives 对话框来实现 弹出 Descriptives 对话框后 把 X1 X10选入 Variables 框 在 Save standardized values as variables 前的方框打上钩 点击 OK 经标准化的数据会自 动填入数据窗口中 并以 Z 开头命名 图表 7 Descriptives 对话框 以每个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重计算主成分综合模型 即可得到主成分综合模型 F 0 327ZX1 0 072ZX2 0 054ZX3 0 310ZX4 0 323ZX5 0 304ZX6 0 297ZX7 0 334ZX8 0 248ZX9 0 286ZX10 根据主成分综合模型即可计算综合主成分值 并对其按综合主成分值进行排序 即可对各地区进行 综合评价比较 结果见图表 8 图表 8 综合主成分值 城市城市 第一主成分第一主成分 F F1 1 排名排名 第二主成分第二主成分 F F2 2 排名排名综合主成分综合主成分 F F排名排名 广东广东 5 2310 1164 481 江苏江苏 2 2520 2351 962 山东山东 1 9630 5021 753 浙江浙江 1 164 0 1980 964 上海上海 0 305 2 3610 0 095 辽宁辽宁 1 2461 961 0 786 河北河北 1 3570 414 1 107 福建福建 1 978 0 077 1 708 天津天津 3 049 1 019 2 749 广西广西 3 29100 413 2 7510 对得出的综合主成分 评价 值 我们可用实际结果 经验与原始数据做聚类分析进行检验 对有争议 的结果 可用原始数据做判别分析解决争议 具体评价与检
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025广东深圳市宝安区鹏晖中英文学校急聘生物教师1人模拟试卷及参考答案详解1套
- 2025河南新乡事业单位招录203人模拟试卷及答案详解(各地真题)
- 2025江苏省宿迁市沭阳县面向普通高校应届师范类毕业生招聘16人(第二批次)模拟试卷完整答案详解
- 2025年甘肃省陇南市徽县招聘城镇公益性岗位人员26人考前自测高频考点模拟试题完整答案详解
- 小学安全培训收费课件
- 2025年甘肃省平凉华亭市山寨回族乡招聘行政村村文书考前自测高频考点模拟试题及答案详解(夺冠系列)
- 2025辽宁沈阳城市建设投资集团有限公司所属企业沈阳城投新能源集团有限公司招聘7人考前自测高频考点模拟试题完整参考答案详解
- 2025湖南郴州资兴市第一人民医院招聘模拟试卷带答案详解
- 小学安全双控培训内容课件
- 安全培训教学评价意见课件
- 2025至2030中国血液辐照器行业项目调研及市场前景预测评估报告
- 九上第19课:法国大革命和拿破仑帝国-
- 2025年民航维修考试题库及答案
- 医院电梯司机安全培训课件
- 云南省烟草公司2025秋招网申-申论题模板及答案
- 2024年中国农业银行浙江省分行招聘真题
- 医院拆除工程方案范本(3篇)
- 11.3.2 两数和(差)的平方 课件 华东师大版数学八年级上册
- GB/T 32066-2024煤基费托合成液体石蜡
- 沉降计算表格计算表格
- 华为企业应收账款管理【案例分析】
评论
0/150
提交评论