




已阅读5页,还剩61页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章无约束优化 线搜索法LineSearchMethodforUnconstrainedOptimization 常用记号 线搜索法 给定初始估计x 0 设x k 处有g k 0 则第k次迭代 根据某种模型函数确定x k 处的搜索方向p k 线搜索 确定来极小化置 确定步长 精确线搜索 非精确线搜索 精确线搜索 基本性质 新迭代点处的梯度与搜索方向是正交的 仅对二次函数精确步长有解析表达式 最速下降法 收敛性与收敛速率牛顿法 基本牛顿法和修正牛顿法拟牛顿法 割线方程 BFGS与DFP更新共轭梯度法 线性和非线性共轭梯度法 最速下降法 最速下降法 动机 搜索方向 最速下降方向 即 以任何方式使用最速下降方向的方法都是最速下降法 最速下降法 算法 每次迭代的计算量 计算梯度和步长 最速下降法 例子 仅对二次函数 精确步长有解析表达式 最速下降法 全局收敛性 最速下降法 收敛速率 最速下降法是线性收敛的 但收敛因子a依赖于 理想情况 二次函数 精确线搜索 用x k 表示x k 1 的闭合形式 加权 椭球范数 事实 最速下降法 收敛速率 续 最速下降法 收敛速率 续 定理使用精确线搜索的最速下降法应用于二次函数 则对所有k 有 即 分别是G的最大和最小特征值 定理假设f二次连续可微 精确线搜索最速下降法产生的序列 x k 收敛到x 且G 正定 设r是任一满足的标量 分别是G 的最大和最小特征值 则对所有充分大的k 有 最速下降法 收敛速率 续 极端典型 archetypical 的全局收敛方法收敛一般非常 非常 慢 数值上经常是不收敛的 许多别的方法在最坏情况时求助于最速下降方向不是尺度不变的 最速下降法的收敛速率对条件数的灵敏度 最速下降法 收敛速率 续 牛顿法 基本牛顿法 牛顿方向 步 以任何方式使用这个二次模型 二阶泰勒展式 的方法都称为牛顿法 假设G k 正定 牛顿方向 牛顿步 基本牛顿法的第k步迭代 解方程组G k s g k 得牛顿步x k 1 每步的计算量 计算二阶导数 解方程组 O n3 基本牛顿法 例 例1 唯一的全局极小点 基本牛顿法产生的序列 基本牛顿法 例 续 用不同初值得到的迭代序列 二次收敛区域 0 0 2857143 基本牛顿法 例 续 例2 唯一的全局极小点 基本牛顿法产生的序列 基本牛顿法 例 续 唯一的全局极小点 基本牛顿法 局部二阶收敛 典型行为 局部二阶收敛 基本牛顿法 局部二阶收敛 续 定理假设f x 二阶连续可微 且G x 是Lipschitz连续的 设x 是局部极小点 且G 正定 如果初始点x 0 离x 充分近 则基本牛顿法有定义 且产生的序列二阶收敛于x 牛顿法的典型性质 局部二阶收敛 大部分好的优化方法都或多或少和牛顿法有关系 修正牛顿法 牛顿法中潜在的问题 牛顿法中 当x k 远离最优解x 时 G k 不一定正定 即使正定 方法也可能不收敛 策略1 线搜索策略 当G k 非正定时进行修正 确保搜索方向是下降方向 策略2 信赖域策略 精确信赖域法是一种特殊的修正方式 修正牛顿法 一些可能的修正策略 线搜索策略 对搜索方向进行修正 策略1 策略2 确定特殊的 其满足正定 求解下述方程组得搜索方向p k 策略3 确定对角矩阵 其满足充分正定 求解下述方程组得搜索方向p k 策略4 负曲率方向法 当G k 不定 有一个负特征值 时 计算负曲率方向作为搜索方向p k 即满足 修正牛顿法 Cholesky分解 线搜索策略3 修正Cholesky分解 Cholesky分解和LDLT分解 假设A对称正定 其中L是对角线元素为1的下三角矩阵 D是对角线元素为正的对角矩阵 则N是下三角矩阵 引入 则 修正牛顿法 Cholesky分解 续 问题 当A不正定时 LDLT分解可能不存在 即使存在 所得算法对这些例子可能出现数值不稳定 修正牛顿法 修正Cholesky分解 参数设置 一种较好的建议 设u是机器精度 牛顿法 修正Cholesky分解 例 例 u 10e 16 拟牛顿法Quasi NewtonMethod 拟牛顿法 概述 假设B k 满足割线 拟牛顿方程 B k s k 1 y k 1 其中s k 1 x k x k 1 y k 1 g k g k 1 优点 与牛顿法相比 只需一阶导数 每次迭代只需O n2 次乘法运算 H k 正定蕴含着下降性 拟牛顿方向 拟牛顿法的第k步迭代 令H k B k 1置沿p k 作线搜索得到修正H k 得到H k 1 拟牛顿法 割线方程 易见 处的梯度是g k 即 其中H k 1 B k 1 1 拟牛顿法 曲率条件 B k 1 既满足割线方程又要保持正定所必需的条件 曲率条件 curvaturecondition 强Wolfe准则 Wolfe准则 拟牛顿法 简介 1950s中期 1959年 美国Argonne国家实验室的物理学家W D Davidon提出第一个拟牛顿法 革命性思想 Fletcher和Powell 1963年 证明新算法比其它现有方法更快更可靠 DFP法 精确线搜索 1991之前 Davidon的工作一直是一篇工作报告 VariableMetricMethodforMinimization Vol 1 No 1 pp 1 17 1991 SIAMJ Optimization 目前 最有效的拟牛顿法 BFGS法 非精确线搜索 Broyden Fletcher Goldfarb和Shanno 1970 推广 有限内存BFGS方法求解大规模无约束优化 将SR1和BFGS法的修正技术用在约束优化问题的算法中 拟牛顿法 DFP法 得 目的 在H k 正定的前提下 给出切实可行的更新公式使得H k 1 既满足割线方程 又正定 令 对称秩2校正 拟牛顿法 DFP法 续 Sherman Morrison Woodbury公式 Karmarka内点法 拟牛顿法 BFGS法 令 目的 在H k 正定的前提下 给出切实可行的更新公式使得H k 1 既满足割线方程 又正定 对称秩2校正 得 拟牛顿法 BFGS法 续 连续两次应用SMW公式 得 其中 计算搜索方向不用计算二阶导数 计算量 拟牛顿法 BFGS法 续 注 使用满足Wolfe准则的线搜索 且每次先试1是否满足 适当的条件下是超线性收敛的 需要修改算法的编号 算法6 3 1BFGSMethod 拟牛顿法 DFP和BFGS法的性质 定理 假设y k Ts k 0 且H k 正定 则由DFP和BFGS校正得到的矩阵H k 1 也是正定的 a 割线方程对以前的搜索方向都成立 即 b 如果H 0 I 则搜索方向是共轭的 即 c 至多迭代n步即收敛 如果迭代了n步 则H n G 1 拟牛顿法 DFP和BFGS法的性质 续 加权Frobenius范数 DFP法的最小性质 BFGS法的最小性质 加权Frobenius范数 拟牛顿法 DFP和BFGS法的性质 续 拟牛顿法 数值表现 拟牛顿法 对称秩1更新 SR1 法 满足割线方程的SR1校正唯一 是 Sherman Morrison Woodbury公式 特点 即使B k 正定 B k 1 也不一定正定 以前是主要缺点 现在是主要优点 信赖域法 尤其对大规模优化和约束优化有很大的意义 带保护措施 拟牛顿法 对称秩1更新 SR1 法 续 信赖域实现的算法见讲义 共轭梯度法ConjugateGradientMethod 定义当把方法应用于以G为Hessian阵的二次函数时 方法产生的方向关于G是共轭的 称该方法是共轭方向法 共轭方向法 基本性质 定义称不含零向量的向量组关于正定矩阵G共轭 如果 共轭梯度法 线性共轭梯度法 设G对称正定 Hestense与Stiefel 1952年 提出 作为求解系数矩阵对称正定的大规模线性方程组的方法 后来由Fletcher Reeves 1964年 Polak与Ribiere 1971年 将其推广求解非二次函数的极小化问题 偏微分方程数值解 信号处理 参数估计和优化方法等相关计算问题中经常用该方法 通常使用预条件共轭梯度法 PCG 非线性共轭梯度法 线性共轭梯度法 基本思想 设G对称正定 线搜索法 要求用精确步长 且 p 0 g 0 对k 0 共轭的部分 线性共轭梯度法 具体算法 算法6 4 1ConjugateGradientMethod CG 算法最多迭代n次即终止 线性共轭梯度法 算例 例 利用共轭梯度法解方程组Gx b 其中 初始点 终止条件 线性共轭梯度法 特点之一 仅需计算矩阵向量乘Gp k 线性共轭梯度法 性质 定理设m是算法6 4 1中使g m 0的最大整数 则m n 且对所有的k 1 m 下列事实成立 非线性共轭梯度法 FR共轭梯度法 与线性共轭梯度法的区别 梯度的计算 步长的计算 算法6 4 2Fletcher ReevesConjugateGradientMethod FR CG 对于严格凸二次函数 用精确线搜索确定步长 即算法6 4 1 线搜索的参数 非线性共轭梯度法 其它版本 其它共轭梯度法 对于严格凸二次函数及精确线搜索确定步长 四个算法相同 FR CG的理论分析最完善 PR CG的实际表现最好 Polak与Ribiere 1971 Hestenes与Stiefel 终止条件 数值结果 或者迭代10000次后终止 非精确线搜索 满足强Wolfe准则 参数 非线性共轭梯度法 数值表现 非线性共轭梯度法 二次终止与重新启动 预条件共轭梯度法 线性共轭梯度法的收敛速率 如果G有r个不同的特征值 则CG迭代最多在r步内终止 如果G的特征值出现在r个不同的群 则CG迭代将在r步后得到问题的近似解 实线 5个大特征值 其余的靠近1虚线 特征值均匀分布 特征值聚集成4个群 预条件共轭梯度法 预条件 预条件 构造非奇异矩阵C 令x Cx 则 例 预条件共轭梯度法 预条件 构造非奇异矩阵C 令x Cx 则 不必显式执行变换 利用共轭梯度法求解q x 再变换回x所在空间 即可得预条件共轭梯度法 用到M CTC 预条件共轭梯度法 具体算法 算法6 4 3preconditionedConjugateGradientMethod PCG 例 预条件共轭梯
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 种牙专属方案咨询
- Y型钢墩柱施工方案
- 建筑方案设计文本深度要求
- 咨询方案费用
- 商业春季营销活动策划方案
- 清明节营销策划方案
- 房地产夏季营销活动方案
- 职工食堂自查报告
- 绿化给水施工组织设计
- 营口方案智能营销咨询
- 电力线路常见故障培训
- 开发商购房合同范本
- 新质生产力:未来经济发展的重要引擎
- DB43T 2464-2022 旱地烟田冬季绿肥还田技术规程
- 网络社会计算模型研究
- 机油化学品安全技术(MSDS)说明书
- 职业健康中心建设方案
- 贵阳出租车驾驶员从业资格证(区域)考试总题库(含答案)
- 2023年中国银行信息科技运营中心招聘考试真题
- 第4课 用联系的观点看问题 第一框
- 教师节师德演讲师者以德而耕师德的践行与提升课件
评论
0/150
提交评论