版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2025年(人工智能工程师)计算机视觉基础试题及答案一、单项选择题(每题2分,共20分)1.在YOLOv5中,下列哪一项不是其Head部分新增的结构?A.SPPFB.PANetC.Detect层中的anchorfree分支D.GhostConv答案:D解析:GhostConv是轻量化网络GhostNet提出的模块,YOLOv5官方主干仍使用C3与标准Conv,并未引入GhostConv。2.使用OpenCV的cv2.resize进行双线性插值时,默认的插值标志是:A.INTER_NEARESTB.INTER_LINEARC.INTER_CUBICD.INTER_LANCZOS4答案:B解析:OpenCV文档写明,当interpolation参数缺省时,resize函数自动取INTER_LINEAR。3.在卷积神经网络中,若输入特征图为256×256×64,采用64个3×3卷积核、stride=1、padding=1,输出特征图尺寸为:A.256×256×64B.254×254×64C.258×258×64D.128×128×64答案:A解析:padding=1保证“same”卷积,高宽不变;通道数等于卷积核数量64。4.BatchNorm在训练阶段统计running_mean时,动量momentum典型取值为0.1,其含义是:A.新batch均值占90%,历史占10%B.新batch均值占10%,历史占90%C.直接替换历史均值D.与lr成反比答案:B解析:running_mean=(1momentum)history+momentumnew_batch,故0.1表示新数据权重仅10%。5.在双目立体匹配中,常用“赢家通吃”WTA策略计算视差,其本质是:A.对代价体积做softmaxB.对每个像素选最小代价值对应的dC.用SGM做全局优化D.用深度学习回归连续视差答案:B解析:WTA(WinnerTakesAll)即逐像素argmin,选择代价最小的离散视差。6.使用FocalLoss时,若γ=0,则损失退化为:A.标准交叉熵B.DiceLossC.带权交叉熵D.KL散度答案:A解析:γ=0时调制因子(1p)^γ=1,仅剩−α_tlog(p_t),即平衡交叉熵;若α_t再为1,则完全等价于标准CE。7.在Transformer的Encoder中,MultiHeadAttention后接的子层是:A.另一个MultiHeadAttentionB.Add&Norm→FeedForwardC.FeedForward→LayerNormD.MaskedMultiHeadAttention答案:B解析:Encoder子层顺序:MultiHeadAttention→残差+LayerNorm→FeedForward→残差+LayerNorm。8.使用MobileNetV3Small在ImageNet上训练时,官方输入分辨率是:A.192×192B.224×224C.256×256D.299×299答案:B解析:GoogleAutoML论文与开源代码均默认224×224。9.在mAP@0.5评价指标中,0.5指:A.分类阈值0.5B.IoU阈值0.5C.置信度阈值0.5D.NMS阈值0.5答案:B解析:mAP@0.5表示计算AP时,正样本判定要求检测框与GT的IoU≥0.5。10.使用TensorRT对FP32模型做INT8量化时,必须提供的组件是:A.校准数据集B.QAT权重C.ONNXIRv4D.TensorFlowSavedModel答案:A解析:PTQ(PostTrainingQuantization)需校准集统计激活动态范围;QAT虽可替代,但非“必须”。二、多项选择题(每题3分,共15分;多选少选均不得分)11.下列哪些操作可有效缓解目标检测中正负样本极度不均衡?A.FocalLossB.OHEMC.DataAugmentation(Mosaic)D.SoftNMS答案:A、B解析:FocalLoss与OHEM直接重采样或重加权;Mosaic增强虽提升鲁棒性,但不直接解决失衡;SoftNMS降低高置信度误杀,亦无关失衡。12.关于VisionTransformer(ViT)说法正确的是:A.patchsize越小,计算量呈平方增长B.位置编码可学习也可手工C.分类token在最后一层直接接MLPHeadD.必须使用LayerNorm前置(PreNorm)答案:A、B、C解析:ViT官方采用PreNorm,但研究也验证PostNorm可行,故D非必须。13.在图像分割任务中,DiceLoss相比交叉熵优点包括:A.对前景像素数量不敏感B.可直接优化评价指标C.天然抑制背景梯度D.与FocalLoss互斥答案:A、B、C解析:DiceLoss与FocalLoss可加权组合,非互斥。14.使用PyTorch导出ONNX时,下列哪些算子可能在TorchScript跟踪阶段失败?A.条件分支iftensor.shape[0]>0B.动态for循环依赖tensor值C.nn.Conv2dD.torch.nonzero后接view答案:A、B、D解析:Conv2d为静态算子,无动态控制流,导出稳定;其余三项含动态行为,需script模式或改写。15.在边缘设备部署时,INT8量化可能带来的副作用有:A.精度下降B.推理延迟反而升高C.层融合受限D.模型体积增大答案:A、B、C解析:INT8体积减半;若GPU未支持INT8TensorCore,延迟可能升高;某些算子(如sigmoid)融合受限。三、填空题(每空2分,共20分)16.在经典Harris角点检测中,自相关矩阵M的特征值λ1、λ2均较大时,对应像素点被称为________。答案:角点解析:Harris根据λ1、λ2大小区分边缘、角点、平坦区。17.若使用4×4的输入特征图,经过2×2最大池化、stride=2、padding=0,输出尺寸为________。答案:2×2解析:(4−2)/2+1=2。18.在BatchNorm参数中,可学习参数γ与β的维度与________维度相同。答案:通道(C)解析:BN沿(N,H,W)求均值,每个通道独立仿射。19.在FasterRCNN中,RPN生成的anchor经前景阈值0.7与背景阈值0.3筛选后,再采样共________个anchor用于训练。答案:256解析:论文设定前景128、背景128,共256。20.使用双线性插值旋转图像时,OpenCV默认边界填充模式为________。答案:BORDER_CONSTANT(黑边)解析:未指定borderMode时,cv2.warpAffine取BORDER_CONSTANT,填充0。21.在语义分割评价中,mIoU计算公式为________。答案:\(\frac{1}{C}\sum_{i=1}^{C}\frac{TP_i}{TP_i+FP_i+FN_i}\)解析:C为类别数,含背景常单独计算。22.若学习率调度采用cosineannealing,初始lr=0.1,周期T=100,则第50epoch的lr为________。答案:0.05解析:cosine曲线在T/2处降至一半。23.在CenterNet中,中心点热图使用的损失函数是________。答案:FocalLoss的变体(ModifiedFocalLoss)解析:中心点视为高斯热图,正样本权重用(1−y)^β抑制。24.使用TensorBoard记录图像时,默认最多显示________张。答案:4解析:writer.add_images限制默认4张,可手动改sample_size。25.在MobileNetV2中,bottleneck的扩张因子t通常取________。答案:6解析:论文实验t=6在准确与延迟间折中。四、判断题(每题1分,共10分;正确打“√”,错误打“×”)26.L1正则化比L2更易产生稀疏权重。答案:√解析:L1在0处不可导,几何解在轴上,天然稀疏。27.在YOLOv3中,anchor尺寸通过kmeans在COCO上聚类得到,类别数k=9。答案:√解析:YOLOv3分3尺度,每尺度3anchor,共9。28.ReLU激活函数在负半轴梯度为0,因此一定导致神经元永久死亡。答案:×解析:只有学习率极大或权重初始化极不合理时才“永久死亡”。29.使用MixUp数据增强时,标签也采用线性插值,可提升模型鲁棒性。答案:√解析:MixUp对图像与标签均插值,使决策边界更平滑。30.在Transformer中,位置编码去掉后,模型仍能保持图像分类精度不变。答案:×解析:ViT去掉位置编码后,Top1掉点约3%,顺序信息丢失。31.对灰度图使用直方图均衡化,其熵一定增大。答案:√解析:均衡化扩展动态范围,熵单调不减。32.在FPN中,高层特征图经过上采样后与低层特征做elementwiseadd,可提升小目标检测效果。答案:√解析:高语义+高分辨率融合,增强小目标。33.使用Adam优化器时,β1=0.9、β2=0.999为推荐默认值,无需再调。答案:√解析:原文实验覆盖多数任务,默认即最优。34.在实例分割中,MaskRCNN的mask分支使用sigmoid输出,每个像素多类softmax。答案:×解析:mask分支每类独立sigmoid,避免类间竞争。35.对视频做光流估计时,Farneback算法属于稀疏光流。答案:×解析:Farneback为稠密光流,LucasKanade才是稀疏代表。五、简答题(每题8分,共24分)36.描述非极大值抑制(NMS)在目标检测中的完整流程,并说明SoftNMS的改进思想。答案:流程:1)按置信度降序排列所有框;2)选最高置信度框,计算与其余框IoU;3)剔除IoU≥阈值的框;4)重复23直至无剩余框。SoftNMS改进:不直接剔除,而是将高IoU框的置信度按高斯或线性函数降低,保留更多定位准确的框,尤其密集场景提升召回。37.解释转置卷积(TransposedConvolution)产生“棋盘效应”的原因,并给出两种抑制方法。答案:原因:转置卷积的步长>1时,核权重与输入元素相乘的覆盖模式呈周期性不均,导致输出像素值呈现棋盘状高低交替。抑制:1)使用stride=1的转置卷积+上采样后插值,再经3×3卷积平滑;2)采用亚像素卷积(PixelShuffle)替代,先扩通道再重组,避免不均匀覆盖。38.列举三种常用的图像数据增强方式,并说明其针对的计算机视觉任务痛点。答案:1)RandomErasing:随机遮挡矩形区域,缓解过拟合,提升模型对遮挡鲁棒性,用于行人重识别;2)Albumentations的GridMask:结构化丢弃像素,兼顾遮挡与正则,用于分类;3)Mosaic(YOLOv5):四图拼接,增加小目标与上下文,解决小目标样本不足。六、计算与推导题(共31分)39.(9分)给定3×3灰度图像I=[[1,2,1],[0,2,0],[1,2,1]],使用Sobel算子Gx=[[1,0,1],[2,0,2],[1,0,1]]计算水平梯度,写出完整卷积结果(padding=0,stride=1)。答案:卷积核翻转180°后滑动,得:(1×(−1)+2×0+1×1+0×(−2)+2×0+0×2+1×(−1)+2×0+1×1)=0同理逐元素计算,最终输出:[[0,4,0]]解析:输出尺寸(3−3+1)=1×3,但水平边缘仅中间列有差异,故为[0,4,0]。40.(10分)假设某检测模型在单张图片上预测5个框,置信度与IoU(相对GT)如下表:框1:conf=0.9,IoU=0.81框2:conf=0.8,IoU=0.75框3:conf=0.7,IoU=0.60框4:conf=0.6,IoU=0.45框5:conf=0.5,IoU=0.30若采用IoU阈值0.5作为正样本判定,计算AP@0.5(假设仅1个GT)。答案:排序后依次判断TP/FP:框1:TP框2:TP(重复GT,但仅1GT,故后续算FP)框3:FP框4:FP框5:FPRecall=[1,1,1,1,1]Precision=[1,1,0.67,0.5,0.4]AP=1×(1−0)=1解析:仅1GT,首次命中后召回恒1,AP=1。41.(12分)给定四通道特征图F∈ℝ^{H×W×4},采用可分离卷积(Depthwise+Pointwise)输出8通道,卷积核3×3,padding=1,stride=1。1)计算理论FLOPs;2)若改用普通卷积,FLOPs增加多少倍?答案:1)Depthwise:H×W×3×3×4=36HWPointwise:H×W×1×1×4×8=32HW总计68HW2)普通卷积:H×W×3×3×4×8=288HW增加288/68≈4.24倍解析:可分离卷积将空间与通道解耦,计算量显著下降。七、编程实践题(共30分)42.(30分)请用PyTorch实现一个轻量级UNet,要求:a)编码器使用MobileNetV2的bottleneck(扩张率6,stride=2时下采样);b)解码器用双线性上采样+拼接+普通3×3卷积;c)输入256×256×3,输出256×256×1(二分类分割);d)写出完整前向代码并统计参数量。参考代码:```pythonimporttorch,torch.nnasnnimporttorchvision.modelsasmodelsdefconv_bn_relu(in_c,out_c,k=3,s=1,p=1):returnnn.Sequential(nn.Conv2d(in_c,out_c,k,s,p,bias=False),nn.BatchNorm2d(out_c),nn.ReLU6(inplace=True))classInvertedResidual(nn.Module):def__init__(self,in_c,out_c,s,expand=6):super().__init__()hidden=in_cexpandself.use_res=s==1andin_c==out_clayers=[]ifexpand!=1:layers+=[conv_bn_relu(in_c,hidden,1)]layers+=[conv_bn_relu(hidden,hidden,3,s,1,groups=hidden),depthwisenn.Conv2d(hidden,out_c,1,1,0,bias=False),nn.BatchNorm2d(out_c)]self.conv=nn.Sequential(layers)defforward(self,x):returnx+self.conv(x)ifself.use_reselseself.conv(x)classEnc(nn.Module):def__init__(self):super().__init__()self.head=conv_bn_relu(3,32,3,2,1)128self.b1=InvertedResidual(32,16,1,1)128self.b2=nn.Sequential(InvertedResidual(16,24,2,6),64InvertedResidual(24,24,1,6))self.b3=nn.Sequential(InvertedResidual(24,32,2,6),32InvertedResidual(32,32,1,6),InvertedResidual(32,32,1,6))self.b4=nn.Sequential(InvertedResidual(32,64,2,6),16InvertedResidual(64,64,1,6),InvertedResidual(64,64,1,6),InvertedResidual(64,64,1,6))defforward(self,x):x=self.head(x)x1=self.b1(x)x2=self.b2(x1)x3=self.b3(x2)x4=self.b4(x3)returnx1,x2,x3,x4classDec(nn.Module):def__init__(self):super().__init__()self.up4=nn.Upsample(scale_factor=2,mode='bilinear',align_corners=False)self.c4=conv_bn_relu(64+32,32)self.up3=nn.Upsample(scale_factor=2,mode='bilinear',align_corners=False)self.c3=conv_bn_relu(32+24,24)self.up2=nn.Upsample(scale_factor=2,mode='bilinear',align_corners=False)self.c2=conv_bn_relu(24+16,16)self.up1=nn.Upsample(scale_factor=2,mode='bilinear',align_corners=False)self.c1=nn.C
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第四章 电磁振荡与电磁波 训练题(含答案)
- 2026年西安电子科技大学实验室与设备处(电子封装与检测实验平台)外聘人员一般岗位招聘备考题库及一套参考答案详解
- 2026年杭州市学军小学教育集团诚聘语文、科学教师(非事业)备考题库完整参考答案详解
- 2026年长沙市城市建设档案馆公开招聘普通雇员备考题库及完整答案详解一套
- 2026年滨州医学院烟台附属医院高级专业技术岗位公开招聘人员备考题库参考答案详解
- 2026年黑龙江省金融控股集团有限公司及权属企业招聘备考题库及完整答案详解一套
- 2026年珠江水产研究所观赏渔业研究室项目岗招聘备考题库及完整答案详解一套
- 住宿员工安全管理制度
- 唐山高速公路集团有限公司为所属子公司2025年公开招聘专业人才备考题库及完整答案详解一套
- 养老院医疗保健服务管理制度
- 材料样品确认单
- 彝族文化和幼儿园课程结合的研究获奖科研报告
- 空调安装免责协议
- 《传感器与检测技术》试题及答案
- 湖北省襄樊市樊城区2023-2024学年数学四年级第一学期期末质量检测试题含答案
- 初中班会主题课件科学的复习事半功倍(共23张PPT)
- PCB封装设计规范
- 新北师大版八年级数学下册导学案(全册)
- GB/T 9349-2002聚氯乙烯、相关含氯均聚物和共聚物及其共混物热稳定性的测定变色法
- GB/T 32473-2016凝结水精处理用离子交换树脂
- 《水利水电工程等级划分及洪水标准》 SL252-2000
评论
0/150
提交评论