版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年中级人工智能技术应用理论知识题库及答案一、人工智能基础与机器学习原理1.【单选】下列关于“归纳偏好”的表述,哪一项最符合TomMitchell在《MachineLearning》中的原意?A.算法在训练集上的误差下限B.算法对未见示例的泛化误差上限C.算法在假设空间中对某些假设的先天偏好D.算法对特征缩放方式的敏感程度答案:C解析:归纳偏好指算法在“多个与训练集一致的假设”中,优先选择哪一类假设的先天偏好,是“无免费午餐”定理成立的前提。2.【单选】在支持向量机中,若将高斯核带宽σ→+∞,则模型决策边界将趋近于:A.线性核的决策边界B.抛物线型非线性边界C.对训练集逐点插值的极端复杂边界D.无法确定,取决于惩罚系数C答案:A解析:σ→∞时,高斯核退化为常数1,核矩阵近似全1矩阵,失去非线性映射能力,等价于线性模型。3.【多选】下列哪些技术可直接缓解“维度灾难”带来的过拟合?A.随机森林的随机子空间B.tSNE降维后接逻辑回归C.主成分分析保留99%方差D.对高维图像数据使用2×2最大池化答案:A、C、D解析:tSNE仅用于可视化,其非线性映射不保距,不能直接作为后续模型输入;其余三项均通过降低有效维度缓解过拟合。4.【填空】若某深度网络采用Swish激活f(x)=x·sigmoid(x),则其在x=0处的二阶导数为______。答案:0.25解析:f'(x)=sigmoid(x)+x·sigmoid'(x),f''(x)=2sigmoid'(x)+x·sigmoid''(x)。代入x=0,sigmoid(0)=0.5,sigmoid'(0)=0.25,sigmoid''(0)=0,得f''(0)=2×0.25+0=0.5×0.5=0.25。5.【判断】在梯度提升树中,增加“子采样比例”(subsample)一定会降低模型方差。答案:错误解析:子采样比例过小会引入过大随机性,虽降低单棵树方差,但集成后总方差可能上升,需与learningrate联合调优。6.【简答】请用不超过60字解释“神经正切核”(NTK)在无限宽网络中的核心结论。答案:当宽度→∞,网络参数变化呈线性,训练动力学由恒定NTK核控制,梯度下降等价于核回归。解析:NTK理论揭示无限宽网络在参数空间中的线性化,使深度网络的学习轨迹可解析。7.【计算】给定二维数据{(0,0),(1,1)},标签{+1,1},使用硬间隔SVM,求对偶问题最优α₁、α₂及决策函数。答案:α₁=α₂=0.5,决策函数f(x)=sign(x₁+x₂)。解析:核矩阵K=[[0,1],[1,0]],求解maxΣαᵢ0.5ΣαᵢαⱼyᵢyⱼKᵢⱼ,s.t.α₁=α₂,Σαᵢyᵢ=0,得α₁=α₂=0.5,w=Σαᵢyᵢxᵢ=(1,1),b=0。8.【案例】某电商用XGBoost预测点击率,特征“商品折扣率”缺失率90%。工程师甲用1填充后加“是否缺失”指示器;工程师乙直接删除该特征。若AUC下降明显,请指出更合理的第三种方案并说明理由。答案:采用“折扣率分桶+缺失单独桶”+模型端Embedding:将折扣率做分位数分桶,缺失值独立成桶,再对桶ID学习低维Embedding,既保留缺失信息,又避免1的数值误导。解析:1在树模型中会被当作真实数值,导致分裂错误;删除则丢失信息;Embedding方式让模型自行学习缺失模式,兼顾表达与鲁棒。二、深度学习与计算机视觉9.【单选】在MaskRCNN中,若RoIAlign输出7×7特征图,掩膜分支使用全卷积网络,则掩膜头的参数量与下列哪项无关?A.RoI个数B.掩膜类别数C.输入图像尺寸D.掩膜分辨率答案:C解析:掩膜头对每个RoI独立计算,参数量由类别数、掩膜分辨率及网络结构决定,与输入图像尺寸无直接关联。10.【单选】使用BatchNorm时,若batchsize=1,下列哪种替代方案在ImageNet上Top1精度下降最小?A.GroupNorm+weightstandardizationB.LayerNormC.InstanceNormD.关闭归一化,仅使用L2weightdecay答案:A解析:GroupNorm对batch无依赖,weightstandardization可恢复类似BN的平滑性,实验表明在batch=1时仅掉0.3%。11.【多选】关于VisionTransformer(ViT)的positionembedding,下列说法正确的是:A.1D、2D、relative位置编码在ImageNet上精度无显著差异B.去掉positionembedding后模型仍能保持75%以上精度C.使用RoPE可天然支持任意分辨率微调D.在patchembedding中加入zeropadding可等效替代位置编码答案:B、C解析:ViT对位置信息依赖弱,去掉仍达75%;RoPE通过旋转矩阵实现外推;A项2Drelative优于1D;D项zeropadding无法提供绝对位置。12.【填空】EfficientNetv2中,FusedMBConv模块将depthwiseconv与______合并为单一常规卷积,以减少访存。答案:1×1expandconv解析:FusedMBConv把expand1×1与3×3depthwisefuse成3×3常规卷积,再接squeezeandexcitation。13.【判断】在YOLOv8中,使用DFL(DistributionFocalLoss)后,边界框回归不再直接预测xywh,而是预测分布向量。答案:正确解析:DFL将连续坐标离散化,用分布向量表示框位置,可提升定位精度。14.【简答】描述“对抗补丁”(adversarialpatch)在物理世界攻击目标检测模型的三步关键流程。答案:1.在数字空间优化补丁像素,使模型对含补丁图像误检为目标类别;2.打印补丁并粘贴在物体或背景;3.在多变环境(光照、角度、距离)下验证攻击迁移性。解析:补丁攻击利用模型对纹理过度敏感,通过大尺寸可打印扰动实现物理世界鲁棒攻击。15.【计算】某ResNet50在FP32下占用97MB显存,若采用FP16+Batch=32+梯度检查点(gradientcheckpoint),理论最大显存降低比例是多少?答案:约47%解析:FP16权重减半至48.5MB;激活内存原为(正向+反向)×featuremap≈(1+1)×150MB=300MB,梯度检查点重计算反向,激活降至约150MB;总显存由397MB降至约210MB,降低(397210)/397≈47%。16.【案例】医疗影像团队用UNet分割肺结节,发现小结节召回率仅62%。请给出两项数据层面改进并附预期指标提升。答案:1.采用oversample+copypaste小结节:在训练时以80%概率随机复制小结节粘贴到同图随机位置,使小结节样本增3倍,预期召回+8%;2.引入unsharpmask增强:对原图做高通滤波后加权叠加,突出边缘,预期召回+5%,假阳略升+1%。解析:数据增广+边缘锐化可缓解小目标信噪比低问题,实验已在LUNA16验证。三、自然语言处理与大模型17.【单选】在Transformer中,若将softmax改为ReLU,理论上selfattention的权重矩阵将失去哪一性质?A.非负性B.稀疏性C.行随机性D.对称性答案:C解析:ReLU输出非负但行和≠1,失去概率归一化。18.【单选】使用AdamW时,下列哪组超参在10B参数大模型预训练中通常采用“热身+线性衰减”?A.lr=1e3,β₁=0.9,β₂=0.999,weightdecay=0.1B.lr=3e4,β₁=0.9,β₂=0.95,weightdecay=0.1C.lr=1e2,β₁=0.9,β₂=0.999,weightdecay=1.0D.lr=6e4,β₁=0.95,β₂=0.99,weightdecay=0.01答案:B解析:大模型常用低lr、高β₂=0.95防止早期梯度方差过大,weightdecay=0.1为GPT3同款。19.【多选】关于LoRA微调,下列说法正确的是:A.可将秩r设为1仍保持90%下游精度B.推理时可与原权重合并,不增加延迟C.需保存的参数量与r×(d_input+d_output)成正比D.在Embedding层插入LoRA可提升文本生成多样性答案:B、C解析:r=1通常掉点>5%;Embedding层LoRA主要减少内存,不直接提升多样性;推理合并后无额外计算。20.【填空】GPT3采用BPE编码,若词表大小50k,出现新词“𠮷𠮷”,则最可能将其拆分为______。答案:𠮷+𠮷解析:BPE按频次合并,𠮷已单字成token,重复出现则拆成相同子词。21.【判断】在BERT预训练中,若将NSP任务替换为SOP(SentenceOrderPrediction),模型在问答数据集上EM下降。答案:错误解析:ALBERT实验表明SOP优于NSP,EM提升+1.7%。22.【简答】用不超过50字说明“旋转位置编码(RoPE)”相比绝对位置编码的两点优势。答案:1.外推长度友好;2.显式编码相对位置,提升自注意力插值能力。解析:RoPE通过旋转矩阵将位置信息注入query/key,支持更长序列的零样本泛化。23.【计算】给定句子“AI赋能”被tokenizer分词为[“AI”,“Ġen”,“power”],id=[314,128,64],若使用绝对位置编码,位置3的向量维数为768,请写出第3维(0index)的值,假设使用正弦编码:PE(pos=3,2i)=sin(3/10000^(2i/768))。答案:sin(3/10000^(4/768))≈0.063解析:i=1对应2i=2,指数4/768,10000^(4/768)=e^(4ln10000/768)≈1.05,3/1.05≈2.857,sin(2.857rad)≈0.063。24.【案例】某企业用LLM做客服,发现模型频繁调用“查询订单”插件却返回空结果。日志显示用户已提供订单号,但插件入参始终为空。请给出根因与修复方案。答案:根因:Prompt模板将订单号放在system字段,模型未识别需提取;修复:在Promptuser段显式写“请提取订单号:12345并调用插件”,并给出fewshot示例,插件描述增加“入参order_id为11位数字”的regex,强制functioncalling格式。解析:LLM对system指令遵循度低,需把关键信息放user段并示例化,同时用schema约束。四、人工智能工程与MLOps25.【单选】KubeflowPipelines中,哪个组件负责在Kubernetes上自动横向扩展训练Pod?A.TFJobB.PyTorchJobC.KatibD.MPIOperator答案:B解析:PyTorchJob通过CustomResource定义Worker、Master,支持弹性伸缩;Katib负责超参搜索。26.【单选】在Prometheus监控中,衡量GPU显存碎片率的合理指标是:A.nvidia_gpu_memory_free_bytes/nvidia_gpu_memory_total_bytesB.(nvidia_gpu_memory_totalnvidia_gpu_memory_usednvidia_gpu_memory_free)/totalC.container_gpu_memory_usage/container_gpu_memory_limitD.rate(nvidia_gpu_memory_alloc_failures_total[5m])答案:B解析:碎片率=(totalusedfree)/total,可反映无法分配的碎片。27.【多选】下列哪些做法可降低TensorRT引擎的build时间?A.使用预编译的timingcacheB.降低workspacesizeC.启用FP16但关闭INT8校准D.采用NVIDIA官方提供的PlanCache答案:A、C、D解析:降低workspace会限制算法选择,反而可能增加搜索时间;timingcache与PlanCache均可复用优化记录。28.【填空】在RayTrain中,若使用Horovod后端,通过______接口可将单进程代码扩展至多节点。答案:horovod.torch.run解析:ray.train.horovod.HorovodTrainer内部调用horovodrun,用户只需写单进程train_func。29.【判断】MLflow的ModelRegistry支持通过Webhooks触发JenkinsCI,但无法触发GitHubActions。答案:错误解析:MLflow2.8+支持GenericWebhooks,可配置GitHubActions端点。30.【简答】说明“影子模式”(shadowdeployment)在推荐系统上线时的三步实施流程。答案:1.复制线上流量写入Kafka双份;2.新模型消费影子流量,不写回线上;3.对比日志,评估AUC、延迟、资源,确认无差异后切流。解析:影子模式零风险验证新模型,对实时推荐尤为关键。31.【计算】某服务QPS=2000,平均推理延迟=120ms,P99=300ms。若采用batch=8动态批处理,平均延迟升至180ms,P99降至200ms,GPU利用率由35%提升至70%,问:所需GPU实例数下降比例?答案:50%解析:原需实例=ceil(2000×0.3/0.35)≈1714;批处理后实例=ceil(2000×0.18/0.7)≈514;下降(1714514)/1714≈70%,考虑batch=8带来的吞吐提升,实际测算后下降约50%。32.【案例】自动驾驶团队用CI/CD自动训练感知模型,发现每晚数据集扩增10%,训练时长线性增长,已影响次日迭代。请给出两项工程优化并附量化收益。答案:1.引入增量学习:每夜仅训练新增10%数据,使用EWC正则,训练时间由8h降至1.5h,精度掉点<0.3%;2.启用StochasticWeightAveraging+混合精度,配合DALI加速数据加载,整体提速1.8倍,显存节省30%,可支持双倍batch。解析:增量学习避免全量重训;DALIGPU解码+FP16加速,已在nuScenes验证。五、人工智能伦理、安全与合规33.【单选】欧盟AIAct草案将“实时生物识别系统”归为哪一类风险?A.最小风险B.有限风险C.高风险D.不可接受风险答案:D解析:除少数例外,公共场所实时生物识别被认定为不可接受风险,禁止投放。34.【单选】在模型可解释性中,SHAP值满足“局部准确性”与“缺失性”,下列哪项不是其公理?A.局部准确性B.一致性C.对称性D.单调性答案:D解析:SHAP三大公理:局部准确、一致性、对称性;单调性不是。35.【多选】关于联邦学习安全,下列哪些攻击可导致“模型投毒”?A.拜占庭攻击B.后门攻击C.成员推理攻击D.梯度反转攻击答案:A、B解析:成员推理与梯
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026新疆图木舒克团结医院招聘16人考试参考试题及答案解析
- 2026云南红河州弥勒市公安局招聘警务辅助人员115人考试备考题库及答案解析
- 2026年大理州南涧县消防救援局招聘政府专职消防员(46人)笔试模拟试题及答案解析
- 2026广西南宁市良庆区残疾人联合会残疾人专职委员招聘1人考试参考题库及答案解析
- 2026年江西师范大学高层次人才招聘84人笔试模拟试题及答案解析
- 2026年浙江工商大学杭州商学院公开招聘教学科研管理岗(教学秘书)备考题库及参考答案详解一套
- 2026年武义县公证处招聘备考题库完整参考答案详解
- 佛山市容桂外国语高黎学校面向2026届毕业生公开招聘教师备考题库及完整答案详解一套
- 《中国热带医学》编辑部2026年考核招聘专业技术人员备考题库完整参考答案详解
- 2026年重庆两江新区民心佳园小学校物业项目经理招聘备考题库及答案详解一套
- 排水管网清淤疏通方案(技术方案)
- 安全文明施工措施费用支付计划三篇
- GB/T 30564-2023无损检测无损检测人员培训机构
- 人教版九年级化学导学案全册
- 国开电大商业银行经营管理形考作业3参考答案
- 陈独秀早期社会建设思想的形成、渊源及启迪,东方哲学论文
- GB/T 1865-2009色漆和清漆人工气候老化和人工辐射曝露滤过的氙弧辐射
- GB/T 11945-2019蒸压灰砂实心砖和实心砌块
- 2023年自考高级财务会计真题和答案
- 2022年贵阳市法院书记员招聘笔试试题及答案解析
- 防水班日常安全教育登记表
评论
0/150
提交评论