基于预训练模型的持续学习_第1页
基于预训练模型的持续学习_第2页
基于预训练模型的持续学习_第3页
基于预训练模型的持续学习_第4页
基于预训练模型的持续学习_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于预训练模型的持续学习:综述

概述什么是持续学习?传统持续学习与基于PTM的持续学习基于PTM的CL方法的三种分类数据集、基准测试和实验结果什么是持续学习?现实世界的人工智能系统面临着随时间演变的流数据。需要在学习新任务的同时,保留从先前任务中获得的知识。灾难性遗忘:学习新任务会抹去旧知识学习任务1→学习任务2→学习任务3→...记住之前的所有任务✅出色完成新任务❌无法访问旧的训练数据传统持续学习与基于PTM的持续学习传统持续学习:随机初始化→在任务1上训练→在任务2上训练→...从零开始,权重随机初始化必须同时学习如何提取特征和如何分类。基于PTM的持续学习:预训练模型→适应任务1→适应任务2→...从大规模预训练获得的丰富表征开始重点在于运用现有知识,而不是从零开始学习。为什么PTM是游戏规则改变者内置的通用性:已经了解良好的视觉表示效率:轻量级适应vs.完全重新训练表现:更好的起点带来更好的最终结果本研究采用ViTs作为PTMs预训练:ImageNet21K(超过1400万张图像,2.1万个类别)架构:图像块→Transformer模块→特征模型分解:f(x)=W^Tφ(x)X:图像块以及分类标记(CLS)φ:嵌入函数(ViT骨架)基于PTM的CL方法的三种分类基于提示的方法:例如向专家提供背景说明建议:添加可学习的“提示”来指导已冻结的PTM钥匙

方法:L2P、DualPrompt、CODA-Prompt、DAP

基于表征的方法:例如信任专家已有的知识思路:直接使用PTM特征和简单的分类器主要方法:SimpleCIL、ADAM、RanPAC、EASE基于模型混合的方法:就像一个专家委员会共同投票表决一样。想法:创建多个模型并结合它们的决策。关键方法:ESN、HiDe提示符基于提示的方法——核心概念正常维生素输入:[CLS][IMG1][IMG2][IMG3]...[IMG196]提示:[P1][P2][P3]

[CLS][IMG1][IMG2]...[IMG196]提示就像“可调指令”,是引导冻结网络的小参数。灾难性遗忘问题单次提示方法:任务1:更新猫/狗的提示信息任务2:更新汽车的相同提示→忘记了猫/狗!任务3:更新花卉的相同提示→完全忘记了!基于提示的方法——核心概念灾难性遗忘问题单次提示方法:任务一:更新猫/狗的提示信息任务2:更新汽车的相同提示→忘记了猫/狗!任务3:更新花卉的相同提示→完全忘记了!解决方案:快速池策略创建多个提示:P={P₁,P₂,...,P_M}学会选择:针对每个任务应该使用哪些提示?主要挑战:提示选择成为瓶颈基于提示的方法——关键途径L2P(学习提示)-基础方法提示符池:{(key₁,prompt₁),(key₂,prompt₂),...,(keyₘ,promptₘ)}选择:查找与输入特征最相似的键流程:提取特征→与键匹配→使用相应的提示训练:EM算法——选择提示,然后更新它们双提示-共享知识与专业知识通用提示:所有任务共享(通用视觉模式)专家提示:特定任务知识(每个任务一条)见解:有些知识应该共享,有些则需要专门研究。基于提示的方法——关键途径CODA-Prompt-软组合创新:与其进行硬性筛选,不如使用注意力权重。流程:创建多个提示的加权组合公式:最终提示=Σ(注意力权重_i×提示_i)DAP-动态生成最先进:使用神经网络为每个输入生成新的提示训练:训练生成提示的网络,而不是训练提示本身。基于表征的方法——详细探讨简单CIL:基本的最近质心分类器,效果出奇的好defSimpleCIL(task_data):frozen_features=pretrained_vit(task_data)对于每个类:prototype=average(frozen_features[class])分类器权重[class]=原型defclassify(test_image):test_feature=pretrained_vit(test_image)返回cosine_similarity(test_feature,all_prototypes)基于表征的方法——详细探讨ADAM(PTM的自适应聚合)——两全其美:特征=[冻结的PTM特征+微调的PTM特征]原型=连接特征的平均值RanPAC(随机投影和CL的PTM)-统计增强:问题:类原型可能存在关联解决方案:随机投影+在线LDA以提高分离度数据集和实验设计本文使用了来自ImageNet的具有较大域偏移的数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论