版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于预训练模型的持续学习:综述
概述什么是持续学习?传统持续学习与基于PTM的持续学习基于PTM的CL方法的三种分类数据集、基准测试和实验结果什么是持续学习?现实世界的人工智能系统面临着随时间演变的流数据。需要在学习新任务的同时,保留从先前任务中获得的知识。灾难性遗忘:学习新任务会抹去旧知识学习任务1→学习任务2→学习任务3→...记住之前的所有任务✅出色完成新任务❌无法访问旧的训练数据传统持续学习与基于PTM的持续学习传统持续学习:随机初始化→在任务1上训练→在任务2上训练→...从零开始,权重随机初始化必须同时学习如何提取特征和如何分类。基于PTM的持续学习:预训练模型→适应任务1→适应任务2→...从大规模预训练获得的丰富表征开始重点在于运用现有知识,而不是从零开始学习。为什么PTM是游戏规则改变者内置的通用性:已经了解良好的视觉表示效率:轻量级适应vs.完全重新训练表现:更好的起点带来更好的最终结果本研究采用ViTs作为PTMs预训练:ImageNet21K(超过1400万张图像,2.1万个类别)架构:图像块→Transformer模块→特征模型分解:f(x)=W^Tφ(x)X:图像块以及分类标记(CLS)φ:嵌入函数(ViT骨架)基于PTM的CL方法的三种分类基于提示的方法:例如向专家提供背景说明建议:添加可学习的“提示”来指导已冻结的PTM钥匙
方法:L2P、DualPrompt、CODA-Prompt、DAP
基于表征的方法:例如信任专家已有的知识思路:直接使用PTM特征和简单的分类器主要方法:SimpleCIL、ADAM、RanPAC、EASE基于模型混合的方法:就像一个专家委员会共同投票表决一样。想法:创建多个模型并结合它们的决策。关键方法:ESN、HiDe提示符基于提示的方法——核心概念正常维生素输入:[CLS][IMG1][IMG2][IMG3]...[IMG196]提示:[P1][P2][P3]
[CLS][IMG1][IMG2]...[IMG196]提示就像“可调指令”,是引导冻结网络的小参数。灾难性遗忘问题单次提示方法:任务1:更新猫/狗的提示信息任务2:更新汽车的相同提示→忘记了猫/狗!任务3:更新花卉的相同提示→完全忘记了!基于提示的方法——核心概念灾难性遗忘问题单次提示方法:任务一:更新猫/狗的提示信息任务2:更新汽车的相同提示→忘记了猫/狗!任务3:更新花卉的相同提示→完全忘记了!解决方案:快速池策略创建多个提示:P={P₁,P₂,...,P_M}学会选择:针对每个任务应该使用哪些提示?主要挑战:提示选择成为瓶颈基于提示的方法——关键途径L2P(学习提示)-基础方法提示符池:{(key₁,prompt₁),(key₂,prompt₂),...,(keyₘ,promptₘ)}选择:查找与输入特征最相似的键流程:提取特征→与键匹配→使用相应的提示训练:EM算法——选择提示,然后更新它们双提示-共享知识与专业知识通用提示:所有任务共享(通用视觉模式)专家提示:特定任务知识(每个任务一条)见解:有些知识应该共享,有些则需要专门研究。基于提示的方法——关键途径CODA-Prompt-软组合创新:与其进行硬性筛选,不如使用注意力权重。流程:创建多个提示的加权组合公式:最终提示=Σ(注意力权重_i×提示_i)DAP-动态生成最先进:使用神经网络为每个输入生成新的提示训练:训练生成提示的网络,而不是训练提示本身。基于表征的方法——详细探讨简单CIL:基本的最近质心分类器,效果出奇的好defSimpleCIL(task_data):frozen_features=pretrained_vit(task_data)对于每个类:prototype=average(frozen_features[class])分类器权重[class]=原型defclassify(test_image):test_feature=pretrained_vit(test_image)返回cosine_similarity(test_feature,all_prototypes)基于表征的方法——详细探讨ADAM(PTM的自适应聚合)——两全其美:特征=[冻结的PTM特征+微调的PTM特征]原型=连接特征的平均值RanPAC(随机投影和CL的PTM)-统计增强:问题:类原型可能存在关联解决方案:随机投影+在线LDA以提高分离度数据集和实验设计本文使用了来自ImageNet的具有较大域偏移的数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026湖北武汉江夏区新兴商业有限公司招聘项目技术人员2人农业笔试参考题库及答案解析
- 2026西安市未央区草滩社区卫生服务中心招聘农业笔试备考题库及答案解析
- 2026海南保亭黎族苗族自治县特殊教育学校教师校园招聘23人(第1号)农业考试备考试题及答案解析
- 2026淄博市市立医院医共体分院合同制专业技术人员招聘农业考试备考试题及答案解析
- 2026中央戏剧学院招聘9人农业笔试备考试题及答案解析
- 2026山东聊城市高校毕业生“三支一扶”计划招募补充40人农业考试模拟试题及答案解析
- 2026江苏扬州工业职业技术学院博士等高层次人才招聘18人农业笔试备考试题及答案解析
- 议论文和演讲稿相同
- 乡镇干部挥洒汗水演讲稿
- 2026湖南长沙市望城区招聘教师150人农业笔试参考题库及答案解析
- 0151超声科质量与安全管理规章制度
- 铁路动车组运用维修规程(运规)
- DBJ51-T 198-2022 四川省既有民用建筑结构安全隐患排查技术标准
- 《铰链四杆机构》(课件)
- 痔疮术后的个案护理
- 2024-2025学年中职历史世界历史高教版(2023)教学设计合集
- DBJ50-T-372-2020 大型公共建筑自然通风技术标准
- QBT 102T-2023 甜菜糖厂设计规范 (正式版)
- DBJ51-T 146-2020 胶轮有轨电车交通系统设计标准
- 中建项目基础土方开挖施工专项方案
- 紧急避险与逃生知识培训课件
评论
0/150
提交评论