下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 群体智能算法在机器学习当中的应用 詹煜 吴冠辰摘 要 大多数机器学习都是使用梯度下降法来对损失函数进行优化的。但梯度下降也要求损失函数必须是凸函数,对于损失函数为非凸函数的情形优化能力有限。群体智能算法是对非凸函数的优化有较好的效果。文章尝试与群体智能算法代替梯度下降,来对凸损失函数进行优化,并在常见的数据集上取得了与梯度下降相似的效果。关键词 机器学习;优化;梯度下降;群体智能算法中图分类号 tp2 文献标识码 a 文章编号 1674-6708(2018)218-0115-02随着信息技术的普及,越来越多的领域发挥着重要的效果,大多数的机器学习算法都是通过对某个参数进行优化,以使损失函数最
2、小或最大化,目前机器学习领域常用的优化算法有梯度下降法 1 ,共轭梯度法,momentum算法 2 及其变体adam等,目前应用最多的是梯度下降法,但以上优化算法,针对的损失函数都是凸函数,而群体智能算法,可以很好地应对非凸函数的优化,因此本文试图用群体智能算法代替梯度下降,对损失函数进行优化,以便未来适应于凸或非凸损失函数的优化问题。本文第一节简要介绍凸函数与梯度下降,第二节简要介绍了群体智能算法,第三节设计实验,并分析实验结果。梯度下降是迭代法的一种,其计算过程就是沿梯度下降的方向求解极小值(也可以沿梯度上升方向求解极大值)。在损失函数是凸函数的情况下,梯度下降能收敛到全局最小值。但是应用
3、于非凸函数时,梯度下降很容易陷入局部最小值,而无法获得全局最小值。梯度下降应用于凸函数的示例如图1所示。梯度下降应用于非凸函数的示例如图2所示。图1中凸函数所标识的点(global?minimum),是通过梯度下降能获得的全局最小值。同时,可以看到函数上两点的连线(图中虚线所示)会处在图像的下方,因此图1也是一个典型的凸函数的图像。从图2中可以看出,非凸函数会存在局部最小值(local?minimum),梯度下降法会有陷于局部最小值的可能而无法获取全局最小值。同时,可以看到函数上两点的连线(图中虚线所示)会处在图像的下方,因此图2也是一个典型的非凸函数的图像。2 群体智能算法群体智能算法4的算
4、法起源于人类对自然界群居生物(如鱼群、蚂蚁、蜜蜂、狮群等)的观察和研究,分析这些生物群体所表现出来的智能模式,并将这些智能模式抽象为算法。群体只能算法的表现是需要相当是数量的种群“个体”,来实现对某个问题的求解需要。由于“群体”具有分布式、自组织、协作性等特点,因此群体智能算法的鲁棒性较好,实现也比較简单,常被用于优化领域。常见的群体算法有蚁群算法、人工鱼群算法、人工蜂群算法、粒子群算法等。3 实验设计及结果分析由于群体智能算法常被用于优化领域,因此本文考虑将群体智能算法代替梯度下降,对机器学习的损失函数进行优化。由于群体智能算法较多,本文选取人工鱼群算法来进行相应的对比。人工鱼群算法 5 是
5、李晓磊等人提出,该算法模拟鱼群的觅食聚集行为实现寻找全局最优。该算法中给鱼群定义了的三大基本行动方式:即觅食、聚群和追尾。通过鱼群中各个体的局部寻优,通过追尾和聚群行为,最终获得全局最优值。人工鱼群算法的实现步骤为:1)全局初始化:?包括种群规模、个体的初始位置、个体的搜索范围(视野),个体的移动步长、子集拥挤程度、迭代次数(即终止条件);2)计算个体的适应值,将最优个体的状态进行公告;3)对每个个体进行评价,根据评价,确认个体下一步的行动,包括觅食、聚群、追尾和随机行为;4)执行个体行动,并在行动后更新个性的相应指标,并生成新鱼群;5)评价所有个体。若某个个体状态优于公告状态,则将该个体的状
6、态更新为公告状态;6)当公告状态达到最优解或满足相应误差精度或算法达到迭代次数上限时算法结束,否则转步骤3。试验采用机器学习中常用的iris数据集进行测试,实验目的是将人工鱼群算法与sgd(随机梯度下降)在分类及回归任务上进行对比。评价指标是准确率,在sgd算法中根据采用数据集的不同;训练集、验证集、测试集的随机划分;是否采用交叉验证;超参数设定的不同等方面的因素,在试验中会产生不同结果。而在人工鱼群算法中,根据种群数量、迭代次数等设定的不同,也会对实验结果有所影响。实验中的人工鱼群算法设定种群数量为60,迭代次数上限为500次。实验结果如表1所示。从实验结果中看,群体智能算法在机器学习中的性能相比sgd还是有一定的欠缺,但是其差距也在可接受的范围内(5%)。但是群体智能算法可以应对于损失函数是非凸函数的情形,因此将群体智能算法应用于非凸损失函数中是下一步的研究方向。参考文献1陈振宏,兰艳艳,郭嘉丰,等.基于差异合并的分布式随机梯度下降算法j.计算机学报,2015,38(10):2054-2063.2欧世峰,高颖,赵晓晖.基于随机梯度的变动量因子自适应白化算法j.自动化学报,2012,38(8):1370-1374.3stephen boyd.convex optimizationm.北京:清华大学出版社,2013,61-167.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 精细氧化铝生产线项目立项报告
- 访汇聚走访包联工作制度
- 课程研发工作制度及流程
- 门诊手术室各项工作制度
- 门诊部特聘专家工作制度
- 防溺水值守工作制度汇编
- 防非法宗教渗透工作制度
- 隔离配餐工作制度范本大全
- 零酒驾创建工作制度模板
- 青年志愿队工作制度汇编
- 汽车制造工艺技术课件:汽车总装生产工艺流程及检测工艺
- 空调维保服务投标方案(技术标)
- 基于大数据的消费者画像与市场洞察
- 儿童保健工作规范和八大技术规范标准
- 2025年贵州开磷控股集团有限公司招聘笔试参考题库含答案解析
- 《更年期的中医调理》课件
- 钢结构防火涂料的施工
- 变电场景一体化通信技术方案
- 电商直播 课件 模块5、6 美妆类商品直播、服装类商品直播
- 第22课 现代科技革命和产业发展
- 大学生国家安全教育的意义
评论
0/150
提交评论