




已阅读5页,还剩48页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计划学时 4学时教学课型 理论课教学目的与要求 理解主成分的概念 掌握主成分分析的基本方法教学重点 主成分分析的方法教学难点 主成分分析的方法教学方法 手段与媒介 根据教材用多媒体课件课堂讲授教学过程与内容 主成分概念首先由KarlParson在1901年引进 当时只对非随机变量来讨论的 1933年Hotelling将这个概念推广到随机变量 第七章主成分分析 Principalcomponentanalysis 7 1引言 在多数实际问题中 不同指标之间是有一定相关性 由于指标较多及指标间有一定的相关性 势必增加分析问题的复杂性 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标 同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息 主成分分析是考察多个数值变量间相关性的一种多元统计方法 它是研究如何通过少数几个主成分来解释多变量的方差 协方差结构 导出几个主成分 使它们尽可能多地保留原始变量的信息 且彼此间不相关 一 主成分分析的基本思想 将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标 以两个指标为例 信息总量以总方差表示 Principalcomponentin2d 二 几何解释 y1 y2 旋转变换的目的是为了使得n个样本点在y1轴方向上的离散程度最大 即y1的方差最大 变量y1代表了原始数据的绝大部分信息 在研究某经济问题时 即使不考虑变量y2也损失不多的信息 y1与y2除起了浓缩作用外 还具有不相关性 y1称为第一主成分 y2称为第二主成分 推广开来 对于p维总体 寻求正交变换 使得 在所有正交变换中 所选正交矩阵U 使最大 与不相关 并且在所有与不相关的变量中最大 与 不相关 同时在所有与 不相关的变量中最大 依次类推 为总体的主成分 为第一主成分 为第二主成分 三 主成分分析的数学原理 对原有变量作坐标变换 要求满足 如果z1 u1 x满足 则称z1为第一主成分 如果z2 u2 x满足 则称z2为第二主成分 7 2总体的主成分 设为一p维随机向量 其二阶矩存在 记为的特征值 为相应的单位特征向量 且相互正交 则yi为第i个主成分 一 主成分的导出 二 主成分的性质 1 主成分的均值与协方差 记 2 主成分的总方差 3 原始变量与主成分的相关系数 4 m个主成分对原始变量的贡献率 其特征值为 相应的特征向量为 Prociml X 1 20 250 002 Val eigval x Vec eigvec x D 1 2 B val d 1 c vec d F1 sqrt inv diag X vec sqrt diag val d F2 f1 f1 1 F diag c diag b t c inv diag x j 3 1 Printvalvecbcf1f2f VALVECBC5 8284271 0 38268300 92387955 8284271 0 382683020 923879500 382683420 923879500 171572901001F1F2F 0 9238800 85355340 85355340 997484200 99497470 99497470101 Dataw type cov Inputx1x2x3 Cards 1 20 250002 Procprincompcov Run ThePRINCOMPProcedureObservations10000Variables3TotalVariance8EigenvaluesoftheCovarianceMatrixEigenvalueDifferenceProportionCumulative15 828427123 828427120 72860 728622 000000001 828427120 25000 978630 171572880 02141 0000EigenvectorsPrin1Prin2Prin3x1 3826830 000000 923880 x20 9238800 000000 382683x30 0000001 000000 000000 主成分分析在经济指标综合评价中的应用 核心 通过主成分分析 选择m个主成分y1 y2 ym 以每个主成分yi的方差贡献率 i作为权数 构造综合评价函数 其中为第i个主成分的得分 求出主成分的表达式后 将标准化后的数据再代入yi中 当把m个主成分得分代入F函数后 即可得到每个样本的综合评价函数得分 以得分的大小排序 可排列出每个样本的经济效益的名次 5 原始变量对主成分的影响 分析 y1主要由x3控制 y2主要由x1控制 y3主要由x2控制 Y1的贡献率为 109 793 117 0 938 x1 x2 x3之间的线性关系 Dataw type cov Inputx1x2x3 Cards 16230214304100 Procprincompcov Run 三 从相关矩阵出发求主成分 性质 例7 2 3在例7 2 2中 x的相关矩阵 相应的主成分为 7 3样本的主成分 设数据矩阵为 样本协方差矩阵为 样本相关矩阵为 例7 3 1在制定服装标准的过程中 对128名成年男子的身材进行了测量 每人测得的指标中含有 身高 x1 坐高 x2 胸围 x3 手臂长 x4 肋围 x5 和腰围 x6 所的样本相关矩阵如下 表7 3 1男子身材六项指标的样本相关矩阵 SAS程序 dataexamp731 type corr inputx1 x6 cards 1 00 0 791 00 0 360 311 00 0 760 550 351 00 0 250 170 640 161 00 0 510 350 580 380 631 00 procprincomp Run TheSASSystem08 44Wednesday November24 20061ThePRINCOMPProcedureObservations10000Variables6EigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulative13 287200781 880960730 54790 547921 406240040 947144960 23440 782230 459095080 032753350 07650 858840 426341730 131541600 07110 929850 294800130 168477900 04910 978960 126322230 02111 0000EigenvectorsPrin1Prin2Prin3Prin4Prin5Prin6x10 468906 3647560 092208 1224270 079696 785645x20 403726 3966060 6130110 326444 0270350 443430 x30 3935700 396800 2788700 655713 405232 125342x40 407640 364842 704801 1078290 2345850 370564x50 3374720 5692140 164251 0192970 7305020 033531x60 4268220 3083690 119265 660671 4899410 178828 例7 3 3测得八项男子径赛运动纪录 样本相关矩阵如下 dataexamp733 type corr inputx1 x8 cards 1 000 0 9231 000 0 8410 8511 000 0 7560 8070 8701 000 0 7000 7750 8350 9181 000 0 6190 6950 7790 8640 9281 000 0 6330 6970 7870 8690 9350 9751 000 0 5200 5960 7050 8060 8660 9320 9431 000 procprincomp Run 五 若干补充及应用中需注意的问题 1 关于时间序列数据2 主成分用于聚类分析3 关于不同时期的主成分分析4 对综合得分方法的质疑 小结
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 家园合作在幼儿劳动教育中的互动与角色分工
- 新兴茶产业数字化转型对大学生就业技能要求的变化
- 空气质量管理与碳中和目标的实现路径
- 提升能源装备的环境影响评估与监控技术
- 2024年河源市委宣传部选调公务员考试真题
- 2024年安徽省交通控股集团六安北高速公路管理中心人员招聘考试真题
- PBL方法在中职心理课程中的课题设计与学生参与度分析
- 2025年四川省成都市中考语文试卷含答案
- 云南信息安全涉密培训课件
- 井工煤矿掘进工作面有毒有害气体浓度超限专项应急演练、现场处置方案及安全技术措施
- 2025年供热通风与空调工程师考试试卷及答案
- 跨界合作网络小说IP改编授权协议
- 学校物品捐赠协议书
- 直播停播协议书范本
- 征信修复合同协议
- 《财务报表分析课件》
- 《科研经费的使用与管理》课件
- 超市售后服务管理制度
- 江苏南京历年中考作文题与审题指导(2002-2023)
- 贵州省考试院2025年4月高三年级适应性考试数学试题及答案
- 消化道出血护理新进展
评论
0/150
提交评论