已阅读5页,还剩46页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 统计分析方法 1地理要素间的相关分析 2地理要素间的回归分析 3时间序列分析法 4系统聚类分析方法 5主成分分析方法 6马尔可夫预测方法 7地理系统的空间趋势面分析 主成分分析的原理主成分分析的解法主成分分析方法应用实例 问题的提出 地理系统是多要素的复杂系统 变量太多 会增加分析问题的难度与复杂性 而且多个变量之间是具有一定的相关关系的能否在相关分析的基础上 用较少的新变量代替原来较多的旧变量 而且使这些较少的新变量尽可能多地保留原来变量所反映的信息 主成分分析方法就是综合处理这种问题的一种强有力的工具 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法 从数学角度来看 这是一种降维处理技术 1主成分分析方法的基本原理 假定有n个地理样本 每个样本共有p个变量 构成一个n p阶的地理数据矩阵 当p较大时 在p维空间中考察问题比较麻烦 为了克服这一困难 就需要进行降维处理 要求 较少的几个综合指标尽量多地反映原来较多变量指标所反映的信息 同时它们之间又是彼此独立的 例 成绩数据 100个学生的数学 物理 化学 语文 历史 英语的成绩如下表 部分 对于多维变量的情况和二维类似 也有高维的椭球 只不过无法直观地看见首先把高维椭球的主轴找出来 再用代表大多数数据信息的最长的几个轴作为新变量 这样 主成分分析就基本完成注意 和二维情况类似 高维椭球的主轴也是互相垂直的 这些互相正交的新变量是原先变量的线性组合 叫做主成分 正如二维椭圆有两个主轴 三维椭球有三个主轴一样 有几个变量 就有几个主成分选择越少的主成分 降维就越好 什么是标准呢 那就是这些被选的主成分所代表的主轴的长度之和占了主轴长度总和的大部分 有些文献建议 所选的主轴总长度占所有主轴长度之和的大约85 即可 其实 这只是一个大体的说法 具体选几个 要看实际情况而定 定义 记x1 x2 xP为原变量指标 z1 z2 zm m p 为新变量指标 系数lij的确定原则 zi与zj i j i j 1 2 m 相互无关z1是x1 x2 xP的一切线性组合中方差最大者 z2是与z1不相关的x1 x2 xP的所有线性组合中方差最大者 zm是与z1 z2 zm 1都不相关的x1 x2 xP 的所有线性组合中方差最大者 则新变量指标z1 z2 zm分别称为原变量指标x1 x2 xP的第一 第二 第m主成分 从以上的分析可以看出 主成分分析的实质就是确定原来变量xj j 1 2 p 在诸主成分zi i 1 2 m 上的荷载lij i 1 2 m j 1 2 p 从几何上看 找主成分的问题 就是找出P维空间中椭球体的主轴问题 从数学上容易知道 从数学上可以证明 它们分别是相关矩阵的m个较大的特征值所对应的特征向量 2主成分分析的解法 对原始地理数据 进行标准化处理 标准差标准化 即其中 计算相关系数矩阵R 计算特征值和特征向量根据特征方程计算特征值 即解的特征多项式 求并使特征值按从大到小的顺序排列 即列出关于每个特征值的特征向量 计算主成分贡献率及累计贡献率 贡献率 累计贡献率 一般取累计贡献率达85 95 的特征值所对应的第一 第二 第m m p 个主成分 计算主成分载荷 主成分Zk与变量xi之间的相关系数 各主成分的得分 3特征值与特征向量的计算方法 雅可比法适合于对称矩阵任一实对称矩阵A 均存在一正交变换矩阵T 使那么就是A的特征值 而变陈之积的各列就是相应的特征向量 二维情况 如令则将原始矩阵A化成了对角矩阵 雅可比法的计算步骤 1 选择对称矩阵中非对角线元素最大者 记为2 作正交变换 一般的 假设在原始矩阵的对角线以外元素中 以的绝对值为最大 设 作一个转轴变换 4主成分分析方法应用实例 例2 根据表1中给出的数据 对某农业生态经济系统做主成分分析 表1某农业生态经济系统各区域单元的有关数据 步骤如下 将表中的数据作标准差标准化处理 然后将它们代入公式计算相关系数矩阵 表2相关系数矩阵 2 由相关系数矩阵计算特征值 以及各个主成分的贡献率与累计贡献率 见表3 由表3可知 第一 第二 第三主成分的累计贡献率已高达86 596 大于85 故只需要求出第一 第二 第三主成分z1 z2 z3即可 表3特征值及主成分贡献率 3 对于特征值 4 6610 2 0890 1 0430分别求出其特征向量e1 e2 e3 再用公式计算各变量x1 x2 x9在主成分z1 z2 z3上的载荷 表4 表4主成分载荷 第一主成分z1与x1 x5 x6 x7 x9呈显出较强的正相关 与x3呈显出较强的负相关 而这几个变量则综合反映了生态经济结构状况 因此可以认为第一主成分z1是生态经济结构的代表 第二主成分z2与x2 x4 x5呈显出较强的正相关 与x1呈显出较强的负相关 其中 除了x1为人口总数外 x2 x4 x5都反映了人均占有资源量的情况 因此可以认为第二主成分z2代表了人均资源量 分析 显然 用三个主成分z1 z2 z3代替原来9个变量 x1 x2 x9 描述农业生态经济系统 可以使问题更进一步简化 明了 第三主成分z3 与x8呈显出的正相关程度最高 其次是x6 而与x7呈负相关 因此可以认为第三主成分在一定程度上代表了农业经济结构 另外 表4中最后一列 占方差的百分数 在一定程度反映了三个主成分z1 z2 z3包含原变量 x1 x2 x9 的信息量多少 例3下面 我们根据表3 4 5给出的数据 对某农业生态经济系统做主成分分析 表3 4 5某农业生态经济系统各区域单元的有关数据 步骤如下 1 将表3 4 5中的数据作标准差标准化处理 然后将它们代入公式 3 5 4 计算相关系数矩阵 见表3 5 1 表3 5 1相关系数矩阵 2 由相关系数矩阵计算特征值 以及各个主成分的贡献率与累计贡献率 见表3 5 2 由表3 5 2可知 第一 第二 第三主成分的累计贡献率已高达86 596 大于85 故只需要求出第一 第二 第三主成分z1 z2 z3即可 表3 5 2特征值及主成分贡献率 3 对于特征值 4 6610 2 0890 1 0430分别求出其特征向量e1 e2 e3 再用公式 3 5 5 计算各变量x1 x2 x9在主成分z1 z2 z3上的载荷 表3 5 3 表3 5 3主成分载荷 第一主成分z1与x1 x5 x6 x7 x9呈显出较强的正相关 与x3呈显出较强的负相关 而这几个变量则综合反映了生态经济结构状况 因此可以认为第一主成分z1是生态经济结构的代表 第二主成分z2与x2 x4 x5呈显出较强的正相关 与x1呈显出较强的负相关 其中 除了x1为人口总数外 x2 x4 x5都反映了人均占有资源量的情况 因此可以认为第二主成分z2代表了人均资源量 分析 显然 用三个主成分z1 z2 z3代替原来9个变量 x1 x2 x9 描述农业生态经济系统
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 篮球训练针对少儿的测试与训练计划制定
- 教师职业道德教育之师德师风测试卷及答案
- 广东地区安全员考试bi备知识点
- 2025年中石化招生考试题及答案
- 建筑安全员证试题及答案
- 2025年CCAA服务认证基础考试试题答案解析
- 客户关系维护与拓展策略实战题库及详解
- 体育理论知识试题及答案解析2025版
- 品质管理主管年底总结与2026年度工作计划
- 2025年公共区域照明节能改造合同协议
- 救护车合作协议书合同
- 【西安交通大学】2025年电力人工智能多模态大模型创新技术及应用报告
- 《妇产科宫颈癌》课件
- 上下楼梯安全课件
- 养猪场成本核算流程
- 老年患者安全用药
- 炼钢厂铁水包使用管理制度(4篇)
- 充电宝安全教育
- GB/T 19077-2024粒度分析激光衍射法
- 合同解除协议书范例模板
- 流域水环境综合治理
评论
0/150
提交评论