版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年人工智能训练师标注结果审核实操真题模拟考试1.【单选】在图像分割任务中,标注员将一辆遮挡率为35%的卡车整体标注为“car”。审核员应首先执行哪项校验?A.类别一致性校验 B.遮挡率阈值校验 C.掩膜拓扑封闭性校验 D.坐标越界校验2.【单选】给定文本情感三元组(方面,意见,情感)标注:“这家酒店早餐种类多,但房间隔音太差。”标注员输出:[(早餐,种类多,正),(房间,隔音差,负)]。审核时发现“种类多”被标为意见词,而规范要求意见词必须是形容词或形容词短语。下列修正方案正确的是:A.将“种类多”改为“丰富” B.将“种类多”整体删除 C.将情感改为中性 D.将方面改为“早餐种类”3.【单选】在3D点云目标检测中,若标注框与真实框的3DIoU为0.55,公司要求“strict”档合格线为0.65,“loose”档为0.5。该框应被判为:A.通过 B.严格拒收 C.降级通过 D.需二次人工确认4.【单选】对于一段30秒、采样率16kHz的语音,若采用20ms帧长、10ms帧移提取FBANK特征,其时间轴共生成多少帧?A.2999 B.3000 C.3001 D.30025.【单选】在视频目标跟踪任务中,若标注规范要求“当目标被完全遮挡且后续不再出现时,最后一帧标注为消失帧并打‘lost’标签”。某目标在第87帧被建筑完全遮挡,第88—90帧未出现,第91帧重新出现。审核员应:A.87帧打lost B.88帧打lost C.不lost,连续标注 D.91帧补lost6.【单选】多语种OCR标注中,阿拉伯语文本从右至左书写。若标注员按视觉阅读顺序给字符编号1→n,审核员发现字符顺序与Unicode存储顺序相反。正确的处理是:A.直接通过,阅读顺序优先 B.要求按Unicode顺序重排编号 C.删除该样本 D.标记为语言特例豁免7.【单选】在医疗影像分割中,标注员用多边形勾勒肺部结节,结节最大径为8mm,规范要求“沿结节最大径方向,任意两点误差≤1mm”。若图像像素间距为0.7mm,则该误差在图像上允许的像素距离为:A.1.0px B.1.4px C.1.43px D.2px8.【单选】对于多轮对话状态跟踪(DST),规范要求“当用户显式撤销之前请求时,需将对应槽位置空”。下列哪句需要置空?A.“算了,不要加葱。” B.“我刚刚说不要加葱。” C.“不要加葱,谢谢。” D.“还是加葱吧。”9.【单选】在2D人体关键点标注中,若左手腕被另一个人手遮挡,标注员根据腕部残留边缘估算位置并标记可见性v=2(遮挡)。审核员使用对称一致性校验:若右腕坐标为(x_r,y_r),左腕估算坐标为(x_l,y_l),则当|y_r−y_l|>θ时触发异常。若图像肩宽为w像素,经验公式θ=0.12w+3。当w=220px,|y_r−y_l|=30px,该标注应:A.通过 B.拒收 C.降级 D.需重新拍照10.【单选】在强化学习奖励建模任务中,标注员需对同一轨迹的两段剪辑进行成对比较。若规范要求“禁止出现循环偏好(A>B>C>A)”,审核员发现同一标注员在三个独立HIT里出现A>B、B>C、C>A。应首先:A.全数通过 B.标记该标注员信誉降级 C.仅拒收C>A D.启动全量回溯11.【多选】下列哪些情况会导致“语义分割掩膜”被审核拒收?A.掩膜边缘出现1像素宽缺口 B.同一类别内部出现5像素孤岛空洞 C.掩膜值越界到256 D.使用反锯齿边缘模糊 E.将“人行道”误标为“道路”12.【多选】在语音音素边界标注中,审核脚本自动计算标注员A与黄金标准B的“边界误差超过20ms”的比例。下列哪些做法可有效降低该比例?A.提供慢速0.5x播放按钮 B.显示宽带语图 C.隐藏窄带语图防止干扰 D.启用自动预标注 E.强制每5秒休息一次13.【多选】关于文本实体链接的“候选实体集”质量,审核侧需监控哪些指标?A.候选召回率 B.候选准确率 C.平均候选数 D.实体流行度偏差 E.消歧后实体热度14.【多选】在视频事件检测中,事件区间用[起帧,迄帧]闭合区间表示。下列哪些情况属于“区间抖动”缺陷?A.同一事件相邻帧起帧来回变动±1帧 B.迄帧总比黄金提前2帧 C.起帧随机缺失标注 D.区间标签跳变“打架→打架” E.区间外扩10帧15.【多选】对于多模态情感识别,给定视频片段,标注员需分别标注文本情感、语音情感、面部情感。审核时发现文本情感为“负”,语音情感为“中性”,面部情感为“正”。下列哪些做法符合“分模态独立”原则?A.允许三模态不一致 B.要求至少两模态一致 C.记录分歧但不做强制一致 D.启动跨模态仲裁 E.标记为冲突样本供研究16.【判断】在点云语义分割中,若某点坐标为NaN,审核员可直接将该点类别标为“忽略”并通过。17.【判断】对于对话情感标注,规范规定“当说话人自我笑声小于500ms且无明显语义信息,可整体忽略”。18.【判断】在OCR表格结构识别中,若单元格跨行,标注员必须给出行跨度标签rowspan,即使值为1。19.【判断】在强化学习偏好标注中,若两段轨迹完全相同的观测但动作不同,标注员可以标注“无偏好”。20.【判断】在医学影像AI标注中,只要医生二次审核签字,即可豁免像素级精度校验。21.【填空】在2D检测框回归中,SmoothL1Loss对误差δ的定义为:L(δ)={0.5δ若某框中心点x方向误差为1.8像素,则该Loss值为________。22.【填空】在语音识别CTC解码中,给定T=150帧输出,空白类索引=0,实际文本长度为40字符,则理论上最短的CTC路径长度为________。23.【填空】在图像分类标注中,若标签空间大小C=1000,采用softmax输出,当温度参数τ→0时,信息熵H→________。24.【填空】在视频目标Re-ID标注中,若同一目标在5个镜头出现,规范要求“至少标注________张正样本”才能进入训练集。25.【填空】在文本摘要任务中,若黄金摘要长度为120词,系统摘要长度为100词,重叠词为60词,则ROUGE-1召回率为________%。26.【简答】描述“多边形标注→像素级掩膜”转换过程中,如何消除“自相交”带来的孔洞错误,并给出算法步骤(不超过80字)。27.【简答】当审核语音事件检测时,发现标注员将“咳嗽”事件边界提前了100ms,请说明如何利用“双向对称扩展-收缩”策略快速修正,并指出其前提条件(不超过80字)。28.【简答】在文本NER中,若出现嵌套实体“北京大学人民医院”,规范要求标注最外层机构名。请解释为何禁用“内层嵌套”模式,并给出数据一致性风险(不超过80字)。29.【简答】对于3D点云路面标注,若激光雷达存在“盲区”小于1m,导致前方路面缺失点云,审核员应如何设置“忽略区”并保证后续模型训练不受影响(不超过80字)。30.【简答】在图像隐私合规审核中,若车牌被标注为“可识别个人信息”,但标注员用模糊矩形遮挡,说明为何仍被拒收,并给出合规替代方案(不超过80字)。31.【计算】在目标检测评估中,某类共50个真实目标,模型检出40框,其中30框与黄金框IoU≥0.5。已知该类在0.5阈值下AP计算采用11点插值法,且PR曲线采样点为:(0,1),(0.1,0.93),(0.2,0.85),(0.3,0.78),(0.4,0.65),(0.5,0.65),(0.6,0.55),(0.7,0.45),(0.8,0.30),(0.9,0.15),(1,0)。请计算AP@0.5(保留三位小数)。32.【计算】给定一段4kHz采样率的ECG信号,需检测R峰位置。标注员A与黄金标准B的误差列表(单位:ms)如下:[8,−12,5,20,−7,15,−25,10,−5,18]请计算该标注员的平均绝对误差MAE与均方根误差RMSE(保留一位小数)。33.【计算】在图像语义分割任务中,某张图共含像素2000000个,其中前景占4%。模型预测结果与黄金掩膜的混淆矩阵为:TP=78000,FP=6000,FN=2000,TN=1914000。请计算前景类的IoU与dice系数(保留三位小数)。34.【计算】在文本分类任务中,采用macro-F1评估,共3类,各类precision分别为0.9,0.8,0.7,对应recall分别为0.85,0.75,0.9。请计算macro-F1(保留三位小数)。35.【计算】在视频动作定位中,采用TemporalIntersectionoverUnion(tIoU)阈值0.5。某事件黄金区间为[120,180]帧,标注员输出[125,190]帧。请计算tIoU(保留两位小数)。36.【实操综合】阅读以下“客服对话情感标注”场景,完成(1)—(4)要求。【场景】用户:我昨天刚买的耳机就充不进去电,太失望了!客服:非常抱歉给您带来困扰,我们立即为您换新。用户:真的吗?那太好了,谢谢!标注员输出:用户情感:负 客服情感:正 对话整体情感:正(1)指出标注员违反的规范条款(20字内)。(2)给出符合规范的修正结果(20字内)。(3)若采用“情感转移矩阵”审核,列出本次转移概率(给出2×2矩阵)。(4)说明若用户后续追加“但是换新要多久?”时,整体情感如何再次调整(30字内)。37.【实操综合】下图为某街景图像截取,请依据“路面交通标志”像素级标注规范,完成(1)—(3)。【图略】文字描述:图像中央有一白色直行箭头,边缘磨损;左侧近景有黄色网格线,部分被车辆遮挡;远方路面有裂缝。(1)列出应标注的类别及优先级顺序(30字内)。(2)指出若标注员将裂缝全部标为“忽略”带来的模型风险(30字内)。(3)给出磨损箭头边缘的“抗锯齿”处理方案及审核通过条件(40字内)。38.【实操综合】下表为某语音关键词“唤醒词”检出结果,共5条,每条给出起止时间(秒)及置信度。1 [0.8,1.5] 0.922 [2.1,2.9] 0.883 [3.0,3.7] 0.454 [5.2,5.9] 0.955 [6.1,6.8] 0.51规范要求:置信度≥0.6且时长≥0.6秒;相邻检出若间隔<0.3秒需合并。(1)列出审核后最终保留的区间(给出序号)。(2)若黄金标准仅在[0.9,1.6]与[5.3,6.0]存在唤醒词,计算检出率与误报率(保留两位小数)。(3)说明置信度0.45的检出应如何记录至日志以便后续阈值调优(20字内)。39.【实操综合】在“法律文书要素抽取”任务中,需识别“案号、案由、原告、被告、判决结果”。标注员对以下片段输出JSON:{"案号":"(2025)京01民初12345号","案由":"知识产权权属侵权纠纷","原告":"北京A公司","被告":"上海B公司","判决结果":"驳回原告诉讼请求"}审核员发现文书原文判决结果句为:“综上,依照《民事诉讼法》第六十四条,判决如下:驳回原告北京A公司全部诉讼请求,案件受理费由原告承担。”(1)指出标注员对“判决结果”字段抽取的精确度问题(20字内)。(2)给出修正后的JSON(仅列改动字段)。(3)若采用序列标注BIO模式,用一行BIO标注“驳回原告诉讼请求”7字(用B-/I-表示)。40.【实操综合】在“多轮对话状态跟踪”中,槽位列表为{菜品口味,餐具数量,送餐时间}。对话如下:U1:我要一份微辣宫保鸡丁。 S1:好的,微辣宫保鸡丁一份。U2:不要辣。 S2:收到,改为不辣。U3:给我两双筷子。 S3:已备注两双筷子。U4:算了,三双吧。 S4:好的,三双筷子。U5:晚上7点送到。 S5:收到,晚上7点。标注员最终状态:{菜品口味:微辣,餐具数量:2,送餐时间:19:00}(1)列出所有违反DST更新规则的轮次(10字内)。(2)给出正确最终状态(JSON格式)。(3)若采用“用户确认”机制,说明应在哪一轮插入显式确认语(20字内)。——答案与解析——1.B 遮挡率35%已超“car”类允许30%上限,需先阈值校验。2.A “种类多”为名词短语,应换形容词“丰富”。3.C IoU0.55介于strict与loose之间,降级通过。4.B 帧数=floor((30×16000−20)/10)+1=3000。5.C 目标未永久消失,应连续标注。6.B Unicode顺序是下游模型输入依据,必须重排。7.C 1mm÷0.7mm≈1.43像素。8.A “算了”表撤销,需置空。9.B θ=0.12×220+3=29.4,30>29.4,拒收。10.B 出现循环偏好,标注员信誉降级。11.ABCE 缺口、孤岛、越界、误标均拒收;反锯齿若规范允许可过。12.ABD 慢速、语图、预标注有助降低误差;隐藏窄带无益。13.ABCD 候选召回、准确率、数量、流行度偏差均需监控。14.AB ±1帧抖动、固定偏移2帧属区间抖动;缺失、跳变、外扩不属。15.ACE 分模态独立允许不一致,记录分歧即可。16.× NaN点应先剔除,不可标为忽略通过。17.√ 规范允许忽略短笑。18.× rowspan仅当>1时标注。19.√ 完全相同观测可标无偏好。20.× 医生签字亦需像素级校验。21.1.3 |δ|=1.8>1,L=1.8−0.5=1.3。22.40 最短路径长度=文本长度=40。23.0 τ→0,分布趋one-hot,熵→0。24.20 规范≥20张。25.50 Recall=60/120=0.5→50%。26.使用射线法检测自交点,拆环重排,再调用Even-Odd填充,消除孔洞。27.以黄金边界为中心,先对称扩展100ms再收缩,前提:事件孤立且背景静音。28.内层嵌套致同一文本多重标签,增加模型歧义,跨标注员一致性下降。29.在盲区纵向延伸忽略区至路面可见起点,训练时权重置0,评估不计入。30.模糊遮挡仍属可逆处理,合规方案:用纯色块覆盖并标注“personal_data”。31.AP@0.5=0.749 11点平均:(0.65+0.65+0.65+0.65+0.65
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年4月份黑龙江齐齐哈尔市碾子山区开发公益性岗位3人备考题库及答案详解参考
- 2026江苏南京大学SZXZ2026-009生物医学工程学院科研人员招聘备考题库及一套答案详解
- 2026贵州红星电子材料有限公司招聘6人备考题库含答案详解(巩固)
- (一模)淄博市2025-2026学年度高三模拟考试历史试题(含答案详解)
- 2026甘肃天水秦安县云山中心卫生院招聘1人备考题库及参考答案详解(考试直接用)
- 2026云南玉溪市人力资源社会保障信息中心城镇公益性岗位招聘1人备考题库及参考答案详解(综合卷)
- 2026广东广州市南方医科大学口腔医院财务人员招聘2人备考题库附参考答案详解【培优a卷】
- 2026北京大旺食品有限公司丰台分公司招聘8人备考题库审定版附答案详解
- 2026广东东莞市望牛墩镇中心幼儿园招聘备考题库带答案详解(基础题)
- 2026湖北恩施州来凤县绿水镇中心幼儿园带班教师1名备考题库附答案详解【满分必刷】
- 西南大学PPT 04 实用版答辩模板
- 东北地区概况农业生产条件及农业发展
- 胃malt淋巴瘤临床与诊治进展
- 承包人实施计划及施工组织设计
- 马克思主义哲学十讲
- 血脂异常和脂蛋白异常血症病人的护理
- 《草船借箭》【市一等奖】
- 连续性血液净化设备技术要求
- 物流项目计划书
- 进展性脑卒中的诊疗策略课件
- 统编人教版五年级上册小学语文第四单元测试卷
评论
0/150
提交评论