




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能 课程论文 论文题目 论文题目 偏最小二乘算法 PLS 回归建模 学生姓名 学生姓名 张帅帅 学学 号 号 172341392 专专 业 业 机械制造及其自动化 所在学院 所在学院 机械工程学院 年 月 日 人工智能 偏最小二乘法 PLS 1 目录 偏最小二乘回归 1 摘要 1 1 偏最小二乘回归原理 1 2 一种更简洁的计算方法 5 3 案例分析 6 致谢 15 附件 16 人工智能 偏最小二乘法 PLS 2 偏最小二乘回归 摘要 在实际问题中 经常遇到需要研究两组多重相关变量间的相互依赖关系 并研究用一组变量 常称为自变量或预测变量 去预测另一组变量 常称为因 变量或响应变量 除了最小二乘准则下的经典多元线性回归分析 MLR 提取 自变量组主成分的主成分回归分析 PCR 等方法外 还有近年发展起来的偏最 小二乘 PLS 回归方法 偏最小二乘回归提供一种多对多线性回归建模的方法 特别当两组变量的 个数很多 且都存在多重相关性 而观测数据的数量 样本量 又较少时 用 偏最小二乘回归建立的模型具有传统的经典回归分析等方法所没有的优点 偏最小二乘回归分析在建模过程中集中了主成分分析 典型相关分析和线 性回归分析方法的特点 因此在分析结果中 除了可以提供一个更为合理的回 归模型外 还可以同时完成一些类似于主成分分析和典型相关分析的研究内容 提供更丰富 深入的一些信息 本文介绍偏最小二乘回归分析的建模方法 通过例子从预测角度对所建立 的回归模型进行比较 关键词 关键词 主元分析 主元回归 回归建模 1 1 偏最小二乘回归偏最小二乘回归原理原理 考虑 p 个变量与 m 个自变量 的建模问题 偏最小二乘 p yyy 21m xxx 21 回归的基本作法是首先在自变量集中提出第一成分 t t 是 m xxx 21 的线性组合 且尽可能多地提取原自变量集中的变异信息 同时在因变量集中 也提取第一成分 u 并要求 t 与 u 相关程度达到最大 然后建立因变量 与 t 的回归 如果回归方程已达到满意的精度 则算法中止 否则 p yyy 21 继续第二对成分的提取 直到能达到满意的精度为止 若最终对自变量集提取 r 个成分 偏最小二乘回归将通过建立与的回归 r ttt 21p yyy 21r ttt 21 式 然后再表示为与原自变量的回归方程式 即偏最小二乘回归方 p yyy 21 程式 为了方便起见 不妨假定 p 个因变量与 m 个自变量均为 p yyy 21m xxx 21 人工智能 偏最小二乘法 PLS 3 标准化变量 因变量组和自变量组的 n 次标准化观测数据阵分别记为 nmn m npn p xx xx yy yy F E 1 111 0 1 111 0 偏最小二乘回归分析建模的具体步骤如下 1 分别提取两变量组的第一对成分 并使之相关性达最大 2 假设从两组变量分别提出第一对 t 和 u t 是自变量集 的 T m xxX 1 线性组合 u 是因变量集的线性组Xwxwxwt T mm111111 T p yyY 1 合 为了回归分析的需要 要求 Yvyvyvu T pp111111 t1 和 u1 各自尽可能多地提取所在变量组的变异信息 t1 和 u1 的相关程度达到最大 由两组变量集的标准化观测数据阵和 可以计算第一对成分的得分向量 0 E 0 F 记 为和 1 t 1 u 1 11 1 11 1 111 10 1 nmnmn m t t w w xx xx wEt 1 11 1 11 1 111 10 1 npnpn p u u v v yy yy vFu 第一对成分 和的协方差可用第一对成分的得分向量和的内积 1 t 1 u 11 utCov 1 t 1 u 来计算 故而以上两个要求可化为数学上的条件极值问题 1 1 max 2 111 2 11 1001101011 vvvwww xFEwvYwEut TT TT 利用 Lagrange 乘数法 问题化为求单位向量和 使最大 1 w 1 v 10011 VFEw TT 问题的求解只须通过计算矩阵的特征值和特征向量 且 mm 0000 EFFEM TT M 的最大特征值为 相应的单位特征向量就是所求的解 而可由计算 2 1 1 w 1 v 1 w 得到 100 1 1 1 wEFv T 人工智能 偏最小二乘法 PLS 4 3 建立 对 的回归及 对的回归 p yyy 211 t m xx 1 1 t 假定回归模型为 11 1 0 11 1 0 FuF EtE T T 其中分别是多对一的回归模型中的参数向量 T p T m11111111 和是残差阵 回归系数向量的最小二乘估计为 1 E 1 F 11 2 11 01 2 11 01 ttF ttE T T 称为模型效应负荷量 11 4 用残差阵和代替和重复以上步骤 1 E 1 F 0 E 0 F 记则残差阵 如果残差 1 1 01 1 0 TT tFtE 0 01101 FFFEEE 阵中元素的绝对值近似为 0 则认为用第一个成分建立的回归式精度已满足 1 F 需要了 可以停止抽取成分 否则用残差阵和代替和重复以上步骤 1 E 1 F 0 E 0 F 即得 分别为第二对成分的权数 而 T m T m vvvwww 22122212 为第二对成分的得分向量 21 2 21 1 vFuwEt 分别为 X Y 的第二对成分的负荷量 这时有 2 2212 2 2212 ttFttE TT 22 2 1 1 0 22 2 1 1 0 FttF EttE TT TT 5 设 n m 数据阵的秩为 r0 表示在主对角线上方 k 0 表示在主对角线下方 在 这对角线元素就是特征值 i val ind sort val descend 降序排列 ind 表示据单下标换算出全下标 w i vec ind 1 提出最大值对应的特征向量 w star i chg w i 计算 w 的取值 w 是最大特征值对应的特征向量 w t i e0 w i 计算成分 t 的主元向量 T E0 W p 48 e0 不是固定 的在循环体内的 第三步建立回归模型 并估计主成分系数 pi pi e0 t i t i t i 计算第 i 个主成分系数向量 pi pi i E0 ti ti ti P 46 5 12 chg chg eye n w i pi 计算 w 到 w 的变换矩阵 w 为用为缩减的自变 量数据矩阵 X 去求新的主元成分 ti 的对应的权值向量而 wi 为用为缩减的自变 量数据矩阵 X 的残差矩阵 Ei 1 去求得 ti 对应的权值向量 eye n I I 为单位 向量 下次循环用的 p 69 p 51 计算数据残差 Ei 作为初始矩阵计算下一个成分 ti e e0 t i pi 计算残差矩阵 e0 e 将残差矩阵付给 e0 再依次计算下一个主成分 循环计算出所有主成分 第四步 PLS 确定主元 r 个数采用交叉检验法确定 一般 r1 Q h2 i 1 press i ss i 1 else Q h2 1 1 end if Q h2 i 0 表示在主对角线上方 k 0 表示在主对角线下方 在 这对角线元素就是特征值 i val ind sort val descend 降序排列 ind 表示据单下标换算出全下标 w i vec ind 1 提出最大值对应的特征向量 w star i chg w i 计算 w 的取值 w 是最大特征值对应的特征向量 w t i e0 w i 计算成分 t 的主元向量 T E0 W p 48 e0 不是固定 的在循环体内的 第三步建立回归模型 并估计主成分系数 pi pi e0 t i t i t i 计算第 i 个主成分系数向量 pi pi i E0 ti ti ti P 46 5 12 chg chg eye n w i pi 计算 w 到 w 的变换矩阵 w 为用为缩减的自变 量数据矩阵 X 去求新的主元成分 ti 的对应的权值向量而 wi 为用为缩减的自变 量数据矩阵 X 的残差矩阵 Ei 1 去求得 ti 对应的权值向量 eye n I I 为单位 向量 下次循环用的 p 69 p 51 计算数据残差 Ei 作为初始矩阵计算下一个成分 ti e e0 t i pi 计算残差矩阵 e0 e 将残差矩阵付给 e0 再依次计算下一个主成分 循环计算出所有主成分 第四步 PLS 确定主元 r 个数采用交叉检验法确定 一般 r1 Q h2 i 1 press i ss i 1 else Q h2 1 1 end if Q h2 i 0 0975 fprintf 提出的成分个数 r d i p 68 fprintf fprintf 交叉的有效性 f Q h2 i r i break end end 计算回归系数 bi 求 Y 关于自变量主元 t 的回归系数 beta z t 1 r ones num 1 f0 求 Y 关于自变量主元 t 的回归系数 beta z end 删除常数项 第五步根据所求相关回归系数求出自变量 Y 和 X 的回归系数 并求出原始回归 方程的常数项最后建立回归方程 xishu w star 1 r beta z 求 Y 关于 X 的回归系数 每一列是一个回归 方程 mu x mu 1 n mu y mu n 1 end 提出自变量和因变量的均值 sig x sig 1 n sig y sig n 1 end 提出自变量和因变量的标准差 for i 1 m ch0 i mu y i mu x sig x sig y i xishu i 计算原始数据的 回归方程的常数项 end for i 1 m xish i xishu i sig x sig y i 计算原始数据回归方程的系数 每 一列是一个回归方程 end sol ch0 xish 显示回归方程的系数 每一列是一个方程 每一列的第一个 数是常数项 每一列为一个因变量与自变量们的回归方程 此为还原为原始变量 后的方程 save mydata x0 y0 num xishu ch0 xish w1 w 1 w2 w 2 人工智能 偏最小二乘法 PLS 20 w3 w 3 w4 w 4 wx1 w star 1 wx2 w star 2 wx3 w star 3 wx4 w star 4 tx1 t 1 tx2 t 2 tx3 t 3 tx4 t 4 beta z 回归系数 xishu 系数矩阵 即未还原原始变量的系数 每一列为一个因变量与自变量的回 归方程 作图程序如下 load mydata ch0 repmat ch0 num 1 以 ch0 的内容堆叠在 numx1 的矩阵 ch0 yhat ch0 x0 xish 计算 Y 的预测值 y1max max yhat 求预测值的最大值 y2max max y0 求观测值的最大值 ymax max y1max y2max 求预测值和观测值的最大值 cancha yhat y0 计算残差 figure 2 subplot 2 2 1 画直线 y x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届青海省西宁市示范名校化学高一第一学期期末复习检测试题含解析
- 2026届河北大名一中化学高二第一学期期末达标测试试题含答案
- 门面房商铺转租转让合同范本
- 商品行纪合同样本
- 2025版石材铺装工程安全评估报告合同范本
- 2025版社区公共空间管理与维护合同
- 2025年度房地产并购居间合同范本:房地产并购居间服务协议
- 2025年商业综合体内部空间改造合同
- 2025办公设施智能化改造租赁合同003
- 2025版水产养殖病害防治与药物使用规范合同范本
- (新教材)2025年秋期部编人教版三年级上册小学语文全册教案(教学设计)(新课标核心素养教案)
- Welcome Unit 开学第一课(课件)高中英语人教版必修第一册
- (高清版)DZT 0208-2020 矿产地质勘查规范 金属砂矿类
- 医师病理知识定期考核试题与答案
- 课堂因“融错·容错·溶措”而精彩
- 阳光晾衣房钢结构专项施工方案
- 安宁疗护服务流程
- 肿瘤科实习生入科培训课件
- 热分析DSC培训new
- 注塑机安全操作规程
- 运动处方(课堂PPT)
评论
0/150
提交评论