版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年人工智能训练师文本标注实操考核试题及答案一、单选题(每题2分,共20分)1.在命名实体识别(NER)任务中,下列哪一类实体在医疗文本中最常被标注为“MED”?A.疾病名称B.药品通用名C.医院科室D.医保政策编号答案:B解析:医疗领域NER标签集通常将药品通用名归为“MED”,疾病名称归为“DIS”,科室归为“DEP”,政策编号归为“DOC”。2.当标注规范要求“最小片段原则”时,下列哪种切分方式正确?A.“北京市政府”→[北京市][政府]B.“北京市政府”→[北京][市政府]C.“北京市政府”→[北京市政府]D.“北京市政府”→[北京][市][政府]答案:C解析:最小片段原则指在语义完整前提下取最短跨度,行政区划整体作为单一实体。3.在情感极性标注中,若文本出现“谈不上喜欢,也谈不上讨厌”,应标注为:A.正向B.负向C.中性D.无法判断答案:C解析:文本未呈现明显情感倾向,属于中性。4.事件抽取任务中,触发词“确诊”对应的论元角色最不可能包含:A.患者B.疾病C.医院D.价格答案:D解析:价格与“确诊”事件无直接语义关联。5.在关系抽取标注中,若实体对为(阿司匹林,头痛),最可能的关系类型是:A.治疗B.副作用C.禁忌D.成分答案:A解析:阿司匹林常用于缓解头痛,构成“药物治疗疾病”关系。6.当标注规范允许嵌套实体时,下列哪种嵌套合法?A.[北京大学]@[北京大学医学部]B.[北京大学医学部]@[北京大学]C.[北京大学]@[北京]D.[北京]@[北京大学]答案:B解析:外部实体需完全包含内部实体,且语义上具有上下位关系。7.在对话状态追踪(DST)标注中,若用户说“算了,就要刚才那个”,标注者应:A.忽略该句B.回退至上一确认状态C.标记为“取消”D.标记为“重复”答案:B解析:DST规范中“算了+指代”通常触发状态回退。8.文本分类任务中,若标签体系为“财经、体育、娱乐、其他”,下列文本应标为“其他”的是:A.央行降准0.25个百分点B.奥斯卡红毯星光黯淡C.羽毛球世锦赛抽签出炉D.火星探测器传回新照片答案:D解析:D选项属于科技天文,不在给定标签体系内。9.在共指消解标注中,若前文出现“该公司”,后文出现“其子公司”,二者关系应为:A.共指B.下位C.上位D.无关联答案:B解析:“其子公司”是“该公司”的下位实体,不构成严格共指。10.当标注工具出现“标签冲突”提示时,首要操作是:A.强制保存B.查看规范C.跳过该句D.重启工具答案:B解析:规范是冲突仲裁的唯一依据。二、多选题(每题3分,共30分)11.关于医疗文本症状标注,下列说法正确的是:A.“伴有恶心”中的“恶心”需标注为症状B.“无发热”中的“发热”仍需标注为症状C.“发热38.5℃”需拆分为“发热”+“38.5℃”两个片段D.“无恶心、呕吐”可整体标注为“否定症状”答案:A、B、D解析:C错误,温度值作为属性依附于症状,不单独拆片。12.在事件论元标注中,时间表达式可充当:A.事件锚点B.论元C.事件极性D.修饰语答案:A、B、D解析:时间本身不构成极性。13.当规范要求“不跨句抽取关系”时,下列哪些做法合规?A.将两句合并后抽取B.仅在同句内标注C.跨段使用共指链D.放弃跨句关系答案:B、D解析:规范禁止即放弃。14.在隐私脱敏标注中,必须打码的元素包括:A.18位身份证号B.手机号中间四位C.医生姓名D.患者年龄>89答案:A、B、D解析:医生姓名若未公开可不打码。15.对于中文分词歧义,下列哪些情况需人工干预?A.组合型歧义B.交集型歧义C.真歧义D.伪歧义答案:A、B、C解析:伪歧义可通过词典自动消解。16.在情感强度标注中,可量化的特征有:A.程度副词B.感叹号数量C.表情符D.句法否定答案:A、B、C解析:否定改变极性而非强度。17.当标注“实体边界”时,下列哪些符号应排除?A.全角括号B.句末标点C.内部连字符D.前缀“第”答案:B、D解析:括号与连字符可能属于实体一部分。18.在指令遵循数据集里,下列哪些行为属于“拒绝回答”类别?A.询问违法操作B.请求医疗诊断C.索要个人隐私D.要求写论文致谢答案:A、B、C解析:D属于正常创作。19.关于多语言混合文本标注,正确的是:A.代码混合句需按主语言分词B.英文缩写首次出现需标注全称C.日文假名转写后标注D.阿拉伯数字统一半角答案:B、D解析:A应分别按各自语言分词;C无需转写。20.在强化学习人类反馈(RLHF)排序标注中,需遵循:A.单轮独立B.同模型同温度C.禁止tiesD.随机顺序呈现答案:A、B、D解析:规范允许ties时选“无优劣”。三、判断改错题(每题2分,共10分)21.在事件抽取中,触发词只能是动词。答案:错误。部分名词如“爆炸”也可作触发词。22.若规范未说明,默认将“%”纳入数字实体尾部。答案:正确。百分号视为数字单位。23.情感标注时,出现“?”即可判定为负向。答案:错误。问号仅表疑问,不决定极性。24.对于古文文本,可直接使用现代NER标签。答案:错误。需先定义古专名标签如“PER-古”。25.在对话中,用户连续3句均为“嗯”,可合并为一条标注。答案:错误。每句独立保留,防止信息丢失。四、简答题(每题10分,共20分)26.描述“嵌套实体”与“重叠实体”的区别,并各举一例说明标注方式。答案:嵌套实体指一个实体完全包含另一个实体,且二者语义层级不同,如“北京大学人民医院”中“北京大学”是组织子片段,可标注为:[ORG北京大学]@[ORG北京大学人民医院]重叠实体指两个实体共享部分字符但互不包含,如“上海市中心医院”可切出[LOC上海市]与[ORG上海市中心医院],二者在“上海市”重叠。标注时采用双通道分别记录,或采用BIESO+层级标签,如:上/B-LOC海/I-LOC市/L-LOC中/B-ORG心/I-ORG医/I-ORG院/L-ORG解析:嵌套侧重层级,重叠侧重边界交叉,需不同存储结构。27.给定句子“患者自诉昨日无明显诱因出现胸痛,呈压榨样,持续约10分钟,伴冷汗,服用硝酸甘油后缓解。”请完成:①标注所有症状及属性;②标注治疗动作及药物;③写出事件结构(触发词+论元)。答案:①症状及属性:[症状胸痛]{属性压榨样}{属性持续约10分钟}[症状冷汗]②治疗:[治疗动作服用][药物硝酸甘油]③事件结构:触发词:出现论元:患者—患者,症状—胸痛,时间—昨日触发词:服用论元:患者—患者,药物—硝酸甘油,效果—缓解解析:按医疗事件模板抽取,时间、症状、药物、效果四要素齐全。五、实操题(共70分)28.序列标注(15分)文本:“3月15日,张炜医生在复旦大学附属华山医院为李婷实施了达芬奇机器人辅助下肾部分切除术,手术历时2.5小时,出血量80ml。”要求:采用BIOES方案,标注所有医疗实体(角色:时间、医生、医院、患者、手术、设备、解剖部位、数值+单位)。答案:3/B-TIME月/I-TIME15/I-TIME日/E-TIME,/O张/B-DOC炜/E-DOC医/O生/O在/O复/B-HOS旦/I-HOS大/I-HOS学/I-HOS附/I-HOS属/I-HOS华/I-HOS山/I-HOS医/E-HOS院/O为/O李/B-PAT婷/E-PAT实/O施/O了/O达/B-EQU芬/I-EQU奇/I-EQU机/I-EQU器/I-EQU人/I-EQU辅/I-EQU助/E-EQU下/O肾/B-ORG部/I-ORG分/I-ORG切/E-ORG除/O术/O,/O手/O术/O历/O时/O2/B-DUR./I-DUR5/I-DUR/E-DUR小/O时/O,/O出/B-VOL血/I-VOL量/I-VOL80/I-VOLml/E-VOL。/O解析:严格按医疗领域标签,设备“达芬奇机器人”整体标注,解剖部位“肾”作为手术对象需完整覆盖。29.关系抽取(15分)基于28题结果,完成三元组抽取,格式(头实体,关系,尾实体)。答案:(张炜,医生-主刀-手术,肾部分切除术)(复旦大学附属华山医院,医院-地点-手术,肾部分切除术)(李婷,患者-接受-手术,肾部分切除术)(达芬奇机器人,设备-辅助-手术,肾部分切除术)(3月15日,时间-发生-手术,肾部分切除术)(80ml,出血量-度量-手术,肾部分切除术)(2.5小时,时长-度量-手术,肾部分切除术)解析:每对实体均在同一子句,关系符合医疗事件本体。30.事件时序排序(10分)给定三句:a.“术后第1天患者拔除导尿管。”b.“术中出血80ml。”c.“术后第3天患者出院。”请按真实发生顺序排列,并指出可插入的合理时间表达式。答案:顺序:b→a→c可插入:b前加“手术当日”,a前加“术后24小时”,c前加“术后72小时”。解析:术中→术后24h→术后72h为临床常规。31.情感极性+强度(10分)评论:“快递小哥雨天送餐晚了18分钟,但提前打电话说明,餐品还是热的,给五星!”要求:①划分评价对象;②标注极性;③强度1—5。答案:对象1:快递小哥极性:正向强度:4(解释:晚18分钟本可负向,但主动沟通提升满意度)对象2:餐品温度极性:正向强度:5对象3:整体服务极性:正向强度:5解析:多对象需分别评价,强度考虑上下文抵消。32.对话动作+槽位填充(10分)用户:我想订明天去杭州的车次,最好上午出发,但是别太早,九点左右吧。系统:好的,请提供身份证号。用户:等等,我改后天。请标注用户每句的对话动作及槽位。答案:U1:动作=Inform+Request,槽位={目的地=杭州,出发日=明天,时间段=上午,近似时间=09:00}U2:动作=Inform+修正,槽位={出发日=后天}解析:修正动作需覆盖旧值。33.多模态融合标注(10分)图文对:图:一只柯基身穿红色雨衣坐在雨中的草坪上,背景模糊。文:“谁说短腿不能浪漫?”要求:①图文匹配度0—1;②若<1,指出缺失元素;③标注文本幽默标签。答案:匹配度:0.85缺失:文本未显式提及“红色雨衣”与“草坪”幽默标签:自嘲幽默解析:幽默来自“短腿”与“浪漫”的反差,视觉元素强化萌态。六、综合设计题(30分)34.构建一个“中文电子病历症状-否定”标注方案,需包含:①标签体系;②边界规则;③否定作用域;④嵌套处理;⑤质量检验指标。答案:①标签体系:SYM症状NEG否定信号dSYM被否定症状ATTR属性(部位、性质、程度、时间)②边界规则:症状最小片段至临床术语词级,如“压榨样疼痛”取整体;“右下腹疼痛”拆[右下腹][疼痛]两部分,疼痛为核心。③否定作用域:采用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 06岁儿童工作制度
- 4s店市场部工作制度
- picc门诊工作制度
- 三会一层权责工作制度
- 三级审读工作制度汇编
- 上门托育全天工作制度
- 专门协商机构工作制度
- 严格执行护理工作制度
- 严管大户专项工作制度
- 中医护理小组工作制度
- 安徽省“江南十校”2026届高三综合素质检测英语试题
- 2026年平安笔试测试题答案
- 雨课堂学堂在线学堂云《当代中国社会与文化:大湾区文化景观(暨南)》单元测试考核答案
- 卫星通信系统运行与维护指南(标准版)
- 2026年国投人力资源服务有限公司招聘备考题库及1套完整答案详解
- 汽车概论(第4版)课件:国内外主要汽车集团与品牌
- 2026年朔州陶瓷职业技术学院单招职业技能测试必刷测试卷及答案1套
- 2025年大学《司法鉴定学-声像资料司法鉴定》考试参考题库及答案解析
- 高效碳素焙烧炉施工技术的优化和实施
- 2025年高校教师资格证之《高等教育法规》考试题库含答案详解(培优)
- 2025年AI时代数字身份安全技术应用指南-
评论
0/150
提交评论