




已阅读5页,还剩18页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
主成分分析问题的实际背景在许多实际问题中,会涉及到许多变量。并且,由于这些变量自身之间存在一定的相关性,使得它们作为单个变量来说,都是不显著的,但是,作为一个整体,它们却是显著的。若直接用这些变量构建模型,则模型将会变得相当复杂;若去掉一些变量,则模型将难以正确地解释实际问题。因此,在对这类问题构建数学模型时,希望压缩变量个数,简化问题。即根据原始变量,构造一个或几个“综合变量”。用这些综合变量代表原始变量。主成分分析就是利用观测数据,将许多变量压缩为少数几个变量,构造综合变量的统计方法。基本模型假设有可观察的原始随机向量,它的期望,协方差矩阵。对于这个可观察的随机变量()(指标)。希望构造它们的个线性组合(“综合”变量)使得可以用这些新变量(指标)y的变化来解释原变量(指标)x的大部分变化,从而达到用这k个变量(指标)来代表原始的p个变量(指标)的目的。主成分分析的任务是寻找,使得最大。由于当乘以任何大于1的常数会使该方差无限制增大,故在寻找时,要求。一般的,有若是优化模型的解,则称是x的第一主成分;若是优化模型的解,则称是x的第二主成分;一般的,若是优化模型,的解,则称是x的第i主成分。基本结论注意,x的协方差矩阵V至少是半正定矩阵,故V的特征值均大于或等于零。将V的非零特征值从大到小依次记为。其相应的正交化单位特征向量分别记为。定理1 x的第i主成分是,且;,。定理2 设y是x的(顺序)主成分向量,则定理3 设y是x的(顺序)主成分向量,则主成分与原始变量的相关系数是。这三个定理表明,主成分的系数是x的协方差矩阵的特征值,且主成分间独立;所有主成分的方差之和等于所有原始变量的方差之和。主成分的意义是的线性组合,可以认为是的一个“综合”。主成分分析就是利用线性变换,将p个随机向量按“总方差”分解为r个互不相关的“综合”随机变量,且这些“综合”变量的方差从小到大顺序排列。比值表示了的方差在总方差中所占的比重,称为的贡献率。该比值的大小表明了主成分对原随机变量x的“综合”能力。它越大,表明其综合能力越强,用的变异去解释x的变异的能力越强。因此,才将()称为()的主成分。进而,在实际过程中,用代替x。标准化变量的主成分分析在实际问题中,随机变量x的各分量的量纲一般是不同的,若它们的差别太大,则通常需要先进行标准化处理,再进行所要求的分析。但是有例子表明,用标准化变量得到的主成分与直接用原始变量得到的主成分是不同的。主成分的实际计算与运用在实际应用中,随机向量x的协方差矩阵V通常是未知的,但可以得到x的观察值。此时,可用V的估计量来代替V。常用的V的估计量是样本协方差矩阵。记I是单位方阵,J是元素全为1的方阵, 分别是随机向量x的样本观测矩阵和平均值向量,则随机向量x的样本协方差矩阵是计算样本协方差矩阵s的特征值及对应的正交化单位特征向量再令, 则y是由x的各个主成分组成的向量。此时,主成分观测矩阵是。在实际应用过程中,为了达到压缩变量的目的,通常不使用所有的主成分,只使用前几个主成分。一般来说,当达到85%左右时,取前k个主成分即可。或者用所谓的“滚石图”来确定要保留的主成分。主成分分析是压缩变量,简化问题的一个有效的统计方法,但是,在实际使用中,主成分的实际意义不好解释,一般都是通过组合系数的大小来解释主成分的实际意义。 例2:经专家分析,认为影响电力需求(y)的主要因素是钢产量(x1)、生铁产量(x2)、钢材产量(x3)、有色金属产量(x4)、原煤产量(x5)、水泥产量(x6)、机械工业总产
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 44851.8-2025道路车辆液化天然气(LNG)燃气系统部件第8部分:过流保护阀
- GB/T 44851.7-2025道路车辆液化天然气(LNG)燃气系统部件第7部分:安全阀
- GB/T 46185-2025液晶聚芳酯长丝
- GB/T 46082.2-2025气焊设备用安全装置第2部分:其他装置
- GB/T 46075.3-2025电子束焊机验收检验第3部分:电子束电流特性的测量
- 广西城市职业大学病理与病理生理期末模拟试题(A卷)附答案详解
- 应急安全培训讲师内容课件
- 2025计算机一级检测卷及完整答案详解(名校卷)
- 疫苗在癌症预防中作用
- 漫画分成合同(标准版)
- 税务教育培训经费管理制度
- 心血管考试试题及答案
- 医保卫生室管理制度
- 公安计算机试题及答案
- 保安服务台账资料相关表格
- 《肠道菌群》课件
- 2025年一建《机电工程管理与实务》施工组织设计施工进度题库
- 液压机管理制度
- 2025版校园食堂日管控、周排查、月调度记录表
- 大型活动标准化执行手册
- 康养中心项目可行性研究报告
评论
0/150
提交评论