矿床统计预测201712因子分析.ppt_第1页
矿床统计预测201712因子分析.ppt_第2页
矿床统计预测201712因子分析.ppt_第3页
矿床统计预测201712因子分析.ppt_第4页
矿床统计预测201712因子分析.ppt_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

因子分析是将一些具有错综复杂关系的变量 或样品 归纳为少数几个综合变量 或抽象样品 的多元统计分析方法 在地质学或其它领域的研究中 常需要对对象进行多种因素综合分析 若涉及因素数目很少 且它们都互不相关 就能逐个处理 易于研究 但多数情况下 变量不仅数目多而且不同程度地相互关联 难于研究 这时需要降维 即设法减少变量的数目 并使变量之间变得相互独立 因子分析是一种降维方法 它能从数据中找出几个互不相关的综合因子来代表原来的众多变量 并使这些综合因子既能最大限度地反映原变量中所含有的信息 12 1概述 12地质因素的因子分析 1 什么是因子分析 在地质成因研究中 常用某些综合变量代表不同的成因过程 或反映特定的地质意义 比如 研究碳酸盐岩地层时 会涉及O C Si Ca Mg等多个元素 元素较多且相互关联 比较复杂 但如以化合物为变量 如SiO2 CaCO3 MgCO3 则不仅变量数减少了 而且这些新变量各自代表一种较明确的地质意义 岩石类型及其成因 在地球化学 矿床学研究中 常会涉及许多地球化学元素 通过因子分析 可以根据元素之间的相关关系 获得不同的元素组合 这些元素组合往往反映一定的地质作用或形成阶段 如V Ti Cr组合可能反映与基性 超基性岩浆活动有关的地质作用 而As Sb Hg组合可能与酸性岩浆活动有关 因子分析可找到这些有意义的组合 并将它们称为因子 12 1概述 12地质因素的因子分析 2 因子分析在地质学中有何用处 因子分析分R型和Q型两类 R型因子分析研究变量 获得的因子是变量组合 Q型因子分析研究样品 获得的因子是样品组合 这时因子可理解为一个抽象的典型样品 R型因子分析从数据的协方差矩阵或相关矩阵出发找到因子 而Q型因子分析从相似系数矩阵出发 以下主要介绍R型因子分析 12 1概述 12地质因素的因子分析 3 因子分析方法的类别 1 因子的简单例子 设变量为x1和x2 n个样品 并设数据已经标准化 如图 可见两变量相关 12 2因子分析原理及计算过程 12地质因素的因子分析 x1 x2 F1 F2 若旋转坐标轴到F1和F2表示的新坐标 则F1和F2是x1和x2的线性组合 F1和F2正交 不相关 且F1能够反映数据中大部分变化信息 可用它代表x1和x2 而忽略F2 这样就达到了降维的目的 F1就是要找的因子 2 因子分析方法 多变量数据中的信息主要包含于协方差矩阵中 因子分析的方法是 找到协方差矩阵的各个特征向量作为因子 这相当于将坐标轴旋转到与协方差矩阵的各个特征向量重合 协方差矩阵是实对称矩阵 其对角元素是各变量的方差 非对角元素是两两变量的协方差 协方差矩阵集中体现了多个变量的变化程度和相互关系 协方差矩阵的特征向量是多变量空间中 协方差椭球体 的相互正交的各个轴的方向 而对应的特征值是这些轴的长度 因子是变量的线性组合 其中各变量系数是协方差矩阵特征向量的分量 若数据经标准化 Eq4 3 则协方差矩阵与相关矩阵相同 以上所说的因子分析是广义因子分析 也称为主成分分析 求实对称矩阵特征值与特征向量方法有多种 如雅可比法 迭代法等 原理 计算 12地质因素的因子分析 3 协方差矩阵和相关矩阵 设有p个变量 n个样品 X表示数据 协方差矩阵为 12地质因素的因子分析 Eq12 1 Eq12 2 其中 原理 计算 其中对角线元素都是1 非对角线元素是两两变量之间的相关系数 12地质因素的因子分析 Eq12 3 原理 计算 相关矩阵R与标准化数据的关系是 Eq12 4 若数据已标准化 则协方差矩阵C与相关矩阵一样 相关矩阵为 该关系在前面回归分一节曾讲到 12地质因素的因子分析 4 主因子的表达式 设相关矩阵R的从大到小排列的p个特征值为 原理 计算 Eq12 5 Eq12 6 则 分别称为数据X的第1 第2 第p个主因子或称主成分 对应的p个特征向量为 Eq12 7 12地质因素的因子分析 原理 计算 5 因子载荷 在主因子表达式 Eq12 7 中 系数uij叫做变量xi在因子Fj上的因子载荷 它是xi与因子Fj的相关系数 uij反映变量xi对于因子Fj的重要性 也反映因子Fj在多大程度上能代表变量xi Eq12 7 因子载荷是对主因子进行成因解释的主要依据 主因子中载荷较大的几个变量 可认为是该因子所代表的主要变量组合 主因子的成因意义往往能够由它的主要变量组合反映出来 12地质因素的因子分析 原理 计算 6 主因子的选择 全部主因子的数目与变量数相等 通常 其中少数几个 两 三个 最重要的主因子就能反映变量中大部分变化信息 主因子的相对重要性取决于它对应的特征值的相对大小 特征值的总和等于变量数 选择主因子 就是将p个特征值 j从大到小排列后 取累积百分比 占特征值总和的百分比 占到 比如 80 的前m个主成分 忽略其余次要因子 这意味着m个主要因子反映了所有变量总变化程度的80 选择主因子的目的是减少因子数目 即降维 从而减小进一步成因分析难度 Eq12 7 12地质因素的因子分析 原理 计算 7 载荷矩阵的旋转 为能够更方便地解释主因子所代表的实际意义 可以对因子载荷矩阵进行简化 常用的简化方法是方差极大正交旋转 即对载荷矩阵实施正交变换 使同一主因子上载荷的方差达到最大 旋转的效果是使载荷绝对值向0和1两极分化 原来较大的变得更大 小的更小 在载荷矩阵中更容易看出一个主因子主要代表哪些变量 从而易于解释 方差极大正交旋转的关键是根据载荷方差增大的准则选择正交变换矩阵 反复作用于载荷矩阵 因计算过程及其表示较复杂 故这里略去 下面在需要时可能会直接使用旋转过的载荷矩阵 根据该方程式 原则上可根据各变量在样品上的值 计算各主因子在样品上的值 称为因子得分 一个样品中Fj的因子得分反映Fj对于该样品的重要性或关系的密切程度 若主因子可以解释为代表成因 则通过样品的因子得分可判断样品的成因 比如 某个样品的Fi 第i个主因子得分 远大于其它因子得分 就可认为该样品的成因主要是由Fi 第i个主因子 所代表的成因 如果某样品中有两个主因子得分都较大 可以认为该样品为混合 或叠加 成因 8 因子得分 Eq12 7可以写为 Eq12 8 12地质因素的因子分析 原理 计算 但由于我们只使用m p个主因子 故不能用上式 Eq12 8 直接计算因子得分 因为上式对于所有因子成立 去掉一些因子则不成立 去掉一部分主因子 只剩下m个后 计算因子得分的公式是 其中载荷矩阵可以是经过方差极大旋转的 8 因子得分 Eq12 8 或 Eq12 9 Eq12 10 12地质因素的因子分析 原理 计算 其中k代表样品号 R是p个变量的相关矩阵 X是标准化数据 用上式可计算任何一个样品的m个因子得分 12 3应用示例 12因子分析 用因子分析研究盐泉成矿特征 王学仁等 1980 云南某地共有n 20个盐泉 测量了泉水的p 7种化学成分 如右表 各变量为 12 3应用示例 12因子分析 相关矩阵 如右表 相关矩阵特征值 下表 前3个特征值累积超过91 因此认为只考虑前3个主因子就可以代表所有7个变量 12 3应用示例 12因子分析 前3个主成分因子方差极大旋转后的载荷矩阵 如下表 解释 F1的正方向代表钠盐形成过程 负方向钾载荷较大 可能说明钠盐形成时没有钾 F2的可能代表钾盐形成过程的特征 与Mg共生 符合地质 F3以Br的富集为主 可能代表钾盐形成过程中的环境特征 解释 样品按其F1和F2因子得分可以分为3类 各有不同的成分特征 根据地质理论 盐类矿床先成钠后成钾 所以图中从第 1 到第 3 组样品点可能反映了从钠盐到钾盐的三阶段形成过程 12 3应用示例 12因子分析 因子得分 按公式Eq12 10 算各盐泉3个主因子得分 画出F1 F2因子得分图 示意图 F1 Na F2 K 1 2 3 因子分析法是数学方法 它可以找到统计上互不相关的因子 但不负责因子的物理解释 因此它在许多不同的领域都可应用 对每个主因子的具体物理意义 要根据专业知识来理解或解释 比如 因子分析用于化探数据分析时 每个因子是一种化学元素组合 要结合地球化学知识来认识这种组合代表何种成因机制或环境 因子分析 或主成分分析 也可以用于遥感图像分析 这时 一个因子就是一个波段组合 要结合光谱知识 遥感知识来认识这种组合代表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论