版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大模型微调工程师考试试卷及答案一、填空题(共10题,每题1分)1.大模型参数高效微调的常用方法包括LoRA、______和PrefixTuning等。2.HuggingFaceTransformers库中,加载预训练因果语言模型的类是______。3.微调时冻结预训练模型大部分层的目的是______。4.指令微调核心是让模型理解并遵循______。5.大模型微调常用优化器是______。6.QLoRA通过______量化减少内存占用。7.困惑度(Perplexity)越低,模型生成质量______。8.微调数据集常用格式为______(含指令-输入-输出)。9.vLLM是大模型______工具。10.学习率过高会导致微调模型______。二、单项选择题(共10题,每题2分)1.LoRA微调通常冻结预训练模型的()A.所有层B.大部分层C.仅嵌入层D.仅输出层答案:B2.以下不是参数高效微调优势的是()A.降计算成本B.保预训练知识C.提模型精度D.降过拟合风险答案:C3.指令微调的主要目标是()A.提生成速度B.增强指令遵循C.减内存占用D.优化推理效率答案:B4.QLoRA与LoRA的核心区别是()A.支持量化B.训练所有参数C.仅训嵌入层D.提参数量答案:A5.微调常用学习率策略是()A.固定B.衰减C.递增D.随机答案:B6.微调数据集需包含()A.仅文本B.指令-输出对C.仅数字D.无需标注答案:B7.LoRA训练的参数是()A.低秩矩阵对B.所有预训练参数C.输出层D.嵌入层答案:A8.大模型微调评估指标不包括()A.PerplexityB.BLEUC.准确率D.显存占用答案:D9.冻结层的作用是()A.增计算量B.保留预训练知识C.降精度D.减训练时间答案:B10.支持大模型微调的工具是()A.PyTorchB.HuggingFaceC.PEFTD.以上都是答案:D三、多项选择题(共10题,每题2分,多选/少选不得分)1.微调核心步骤包括()A.数据预处理B.模型冻结C.训练评估D.推理部署答案:ABCD2.参数高效微调方法有()A.LoRAB.QLoRAC.PrefixTuningD.全参数微调答案:ABC3.指令微调关键要素()A.多样化指令B.高质量输出C.大模型D.框架选择答案:AB4.微调需考虑的计算资源()A.GPU显存B.训练时间C.模型大小D.数据集规模答案:ABCD5.微调评估指标()A.PerplexityB.ROUGEC.F1D.准确率答案:ABCD6.LoRA应用场景()A.小样本学习B.领域适配C.指令微调D.模型压缩答案:ABC7.QLoRA优势()A.低显存B.保效果C.无需量化D.支持大模型答案:ABD8.数据集预处理步骤()A.格式转换B.去重清洗C.标注增强D.量化答案:ABC9.支持微调的工具()A.PEFTB.TransformersC.vLLMD.TensorRT答案:AB10.学习率影响因素()A.模型大小B.数据集C.微调方法D.硬件答案:ABCD四、判断题(共10题,每题2分,√/×)1.LoRA需训练所有预训练参数()答案:×2.QLoRA支持4-bit量化()答案:√3.指令微调目标是提生成速度()答案:×4.参数高效微调参数量远小于全参数微调()答案:√5.学习率越高收敛越快()答案:×6.PEFT库用于参数高效微调()答案:√7.微调数据集无需标注()答案:×8.大模型微调只能用GPU()答案:×9.Perplexity越低生成越自然()答案:√10.指令微调+LoRA可提升指令遵循()答案:√五、简答题(共4题,每题5分,约200字)1.简述LoRA核心思想答案:LoRA(低秩自适应)核心是冻结预训练模型大部分参数,仅训练新增低秩矩阵对。预训练权重变化可近似为ΔW=A·B(A、B为低秩矩阵),仅需训练A、B(参数量仅原模型0.1%~1%),既保留预训练知识,又大幅降低计算成本,适合大模型领域适配或指令微调。2.指令微调的作用答案:指令微调让模型理解并执行多样化指令(问答、总结等),提升任务泛化性(无需单任务微调),减少幻觉,输出贴合用户需求。通过大规模指令-输出对训练,模型从“生成文本”转向“响应指令”,是通用助手的关键技术。3.如何选择微调学习率答案:①模型大小:大模型/参数高效微调(LoRA)用1e-6~1e-4,小模型/全参数微调用1e-5;②数据规模:小数据集用低学习率,大数据集可稍高;③预热策略:初始小学习率避免震荡;④验证指标:观察Perplexity,不收敛则降,收敛慢则提。4.什么是QLoRA?优势是什么答案:QLoRA是LoRA的量化增强版,先将预训练模型量化为4-bit,再在量化模型上微调。优势:①低显存占用(7B模型从13GB降至4GB);②保微调效果,不显著降精度;③兼容现有LoRA工具链,易落地;④支持快速推理部署。六、讨论题(共2题,每题5分,约200字)1.如何平衡微调效果与计算成本答案:①方法:优先用LoRA/QLoRA,仅训少量参数;②数据:用高质量小数据集(5k~10k样本),避免冗余;③硬件:4-bit量化降显存,选性价比GPU(A10G),或分布式训练;④评估:小样本验证效果,避免无效训练。例如7B模型用QLoRA+5k指令数据,16GBGPU即可微调,兼顾效果与成本。2.指令微调+LoRA的应用场景答案:①垂直领域助手:医疗/法律场景,用领域指令+LoRA微调,适配专业需求;②多任务通用助手:多样化指令数据训练,响应问答、代码等任务;③快速迭代产品:LoRA快速适配用户反馈,迭代周期从数周缩至数天;④边缘设备:量化后的LoRA模型可低显存部署,满足实时响应。例如某企业用LoRA+医疗指令微调7B模型,16
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医院材料库房管理制度(3篇)
- 元旦景区活动方案策划(3篇)
- 2026年厦门软件职业技术学院单招职业倾向性考试题库含答案详解(预热题)
- 厨艺赛活动策划方案(3篇)
- 2026年哈尔滨电力职业技术学院单招职业技能考试题库含答案详解(能力提升)
- 2026七年级语文人教版上册语文园地二基础训练
- 2026一年级数学上 图形的推理能力
- 治疗高血压中成药
- 内镜医疗护理安全绩效考核指标
- 2026年餐厨垃圾处理试题及答案
- 2026年春季学期学校红领巾广播站工作计划及栏目设置表更新通知
- 2026年包头轻工职业技术学院单招职业技能考试题库附参考答案详解(典型题)
- 2026年春季统编版小学语文三年级下册教学计划含进度表
- 《骨科脊柱手术诊疗指南及操作规范(2025版)》
- 2026年节后复工收心安全专题培训
- 2026年湖南信息职业技术学院单招综合素质考试参考题库含详细答案解析
- 2025年高职化工(无机化学应用)试题及答案
- 多胎羊养殖技术培训课件
- 隧洞爆破安全培训课件
- 箱梁体系转换施工方案
- 一般体格检查头颈部体格检查教案
评论
0/150
提交评论