版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
偏最小二乘回归方法第一页,共35页。简言之偏最小二乘回归是一种集多元线性回归分析、典型相关分析和主成分分析的基本功能为一体的新型多元统计分析方法。第二页,共35页。此方法的优点:(1)能在自变量存在严重多重相关性的条件下进行回归建模;(2)允许在样本点个数少于自变量个数的条件下进行回归建模;第三页,共35页。此方法的优点:(3)偏最小二乘回归在最终模型中将包含原有的所有自变量,易于辨识系统信息与噪声,而且其自变量的回归系数也将更容易解释。第四页,共35页。此方法的优点:(4)偏最小二乘回归方法与其他的建模方法相比,具有计算简单、预测精度高,易于定性解释的优点。第五页,共35页。多因变量偏最小二乘算法推导首先将数据做标准化处理。原自变量数据表经标准化后的数据矩阵记为原因变量数据表经标准化后的数据矩阵记第六页,共35页。多因变量偏最小二乘算法推导第一步:记是的第一个成分,,是的第一个轴,它是一个单位向量,即有。记是的第一个成分,是的第一个轴,它是一个单位向量,即。
第七页,共35页。多因变量偏最小二乘算法推导如果要使,能很好的代表与中的数据变异信息,根据主成分分析原理,应该有,。第八页,共35页。多因变量偏最小二乘算法推导另一方面,由于回归建模的需要,又要求对有最大的解释能力,由典型相关分析的思路,与的相关度应达到最大值,即第九页,共35页。多因变量偏最小二乘算法推导因此,综合起来,在偏最小二乘回归中,我们要求与的协方差达到最大,即第十页,共35页。多因变量偏最小二乘算法推导正规的数学表述应该是求解下列优化问题,即第十一页,共35页。多因变量偏最小二乘算法推导采用拉格朗日算法,记对分别求关于,,和的偏导数,并令之为零,有第十二页,共35页。多因变量偏最小二乘算法推导(1)式(2)式(3)式(4)式第十三页,共35页。多因变量偏最小二乘算法推导由上述四个式子可以推出记,所以正是优化问题的目标函数值。第十四页,共35页。多因变量偏最小二乘算法推导把(1)和(2)式写成将(6)代入(5),有(5)式(6)式(7)式第十五页,共35页。多因变量偏最小二乘算法推导同理,可得易知,是矩阵的特征向量,对应的特征值为。是目标函数,它要求取最大值。所以,是对应于矩阵的最大特征值的单位特征向量。第十六页,共35页。多因变量偏最小二乘算法推导易知,是对应于矩阵的最大特征值的单位特征向量。
求得轴和后,即可得到成分,。然后,分别求和对与的三个回归方程第十七页,共35页。多因变量偏最小二乘算法推导其中第十八页,共35页。多因变量偏最小二乘算法推导而,,分别是三个回归方程的残差矩阵。第十九页,共35页。多因变量偏最小二乘算法推导第二步:用残差矩阵和取代和。然后,求第二个轴和以及第二个成分,,有第二十页,共35页。多因变量偏最小二乘算法推导是对应于矩阵的最大特征值的特征向量;是对应于矩阵的最大特征值的特征向量。第二十一页,共35页。多因变量偏最小二乘算法推导计算回归系数因此,有回归方程(8)式第二十二页,共35页。多因变量偏最小二乘算法推导如此计算下去,如果的秩是,则会有由于均可以表示成的线性组合。第二十三页,共35页。多因变量偏最小二乘算法推导因此,(8)式还可以还原成关于的回归方程形式,即是残差矩阵的第列。第二十四页,共35页。偏最小二乘回归的简化算法(1)求矩阵最大特征值所对应的单位特征向量,求成分,得其中第二十五页,共35页。第二十八页,共35页。将(6)代入(5),有典型相关分析中的精度分析是目标函数,它要求取最大值。把(1)和(2)式写成典型相关分析中的精度分析然后,求第二个轴和所以,是对应于矩阵的最大特征值的单位特征向量。第二十八页,共35页。多因变量偏最小二乘算法推导偏最小二乘回归的简化算法(2)求矩阵最大特征值所对应的单位特征向量,求成分,得第二十九页,共35页。因此,综合起来,在偏最小二乘回归中,我们要求与的协方差达到最大,即典型相关分析中的精度分析求得轴和后,即可得到成分,。偏最小二乘回归的简化算法(2)求矩阵最大特征值所对应的单位特征向量,求成分,得其中……第二十六页,共35页。偏最小二乘回归的简化算法至第h步,求成分,是矩阵最大特征值所对应的特征向量。如果根据交叉有效性,确定共抽取h个主成分可以得到一个满意的预测模型。第二十七页,共35页。偏最小二乘回归的简化算法则求在上的普通最小二乘回归方程为
其中第二十八页,共35页。交叉有效性具体的步骤:记为原始数据,是在偏最小二乘回归过程中提取的成分,是使用全部样本点并取h个成分回归建模后,第个样本点的拟合值,是在建模时删除样本点,
第二十九页,共35页。交叉有效性具体的步骤:取h个成分回归建模后,再用此模型计算的的拟合值,记第三十页,共35页。交叉有效性具体的步骤:当即时,引进新的成分会对模型的预测能力有明显的改善作用。第三十一页,共35页。典型相关分析中的精度分析在偏最小二乘回归计算过程中,所提取的自变量成分,尽可能多地代表中的变异信息。对某自变量的解释能力为第三十二页,共35页。典型相关分
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教 八年级 语文 下册 第5单元《20.一滴水经过丽江 第1课时》课件
- 2025 网络基础中全息通信网络的技术与未来展望课件
- 2026年离婚财产合同(1篇)
- 2026年及未来5年市场数据中国同城配送市场发展前景预测及投资战略咨询报告
- 2025 高中信息技术数据与计算之计算思维在森林植被覆盖数据监测分析中的应用课件
- 2025 高中信息技术数据与计算之算法的灰狼优化算法课件
- 光伏系统设计精要
- 原始凭证习题试卷及答案
- 生态养殖培训课件
- 2026年外嫁女等特殊群体权益保障操作指南
- 新工科大学英语 课件 Unit 1 Future by design;Unit 2 Living smarter,living better
- 2025年路桥专业中级试题及答案
- 纺织厂5S管理课件
- 乡风文明建设课件
- 毕业设计(论文)-水下4自由度抓取机械臂设计-scara机器人
- HSK4标准教材课件
- 云南省中药材产地加工(趁鲜切制)指导原则、品种目录、风险提示清单、中药材质量标准制定指导原则
- 金融风控模型建设及管理规范
- T/CSBME 070-2023计算机断层成像(CT)临床图像质量评价
- 《陶瓷工艺概览:课件中的釉料组成与特性》
- DB31T 1502-2024工贸行业有限空间作业安全管理规范
评论
0/150
提交评论