版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年人工智能易用性测试基础考试题库一、单项选择题(每题2分,共30分)1.在易用性测试中,下列哪项最能直接反映“可学习性”指标?A.用户首次完成任务所需时间B.用户完成任务的出错次数C.用户主观满意度评分D.用户记忆路径的准确率2.某语音助手在安静环境下识别率99%,在65dB咖啡厅降至78%,该现象最符合易用性维度中的哪一项缺陷?A.有效性不足B.容错性差C.适应性差D.可理解性差3.采用Think-Aloud法时,主试最合理的介入时机是:A.用户停顿超过3秒B.用户首次偏离任务路径C.用户出现明显挫败表情D.用户主动求助4.在SUS量表中,第4题“我认为我需要经过专业技术培训才能使用该系统”为反向题,若受试者勾选“非常不同意”,则该题应计:A.0分B.1分C.4分D.5分5.某模型在Edge设备上推理延迟为120ms,按Doherty阈值标准,该延迟属于:A.即时反馈B.可接受延迟C.破坏沉浸D.不可容忍6.当使用NASA-TLX评估AI辅助驾驶系统时,下列哪项子量表最能揭示“人机互信”问题?A.心理需求B.时间需求C.努力程度D.挫败感7.在眼动实验中,首次注视时间(TTFF)过长最可能表明:A.界面元素视觉显著性不足B.界面元素过于密集C.用户疲劳D.校准误差8.某推荐系统采用“5-星+评语”混合评价,若需计算评语情感极性,下列哪种算法对反讽文本鲁棒性最佳?A.TF-IDF+SVMB.BERT-large+微调C.N-gram+朴素贝叶斯D.Word2Vec+逻辑回归9.A/B测试中,若对照组与实验组样本量相等,显著性水平α=0.05,检验效能1-β=0.8,期望检测的转化率最小提升为2%,则每组所需样本量约为:A.1900B.2700C.3900D.540010.在无障碍测试中,针对运动障碍用户,下列哪项设计最能降低“操作负荷”?A.增大点击热区至48×48dpB.提供语音替代输入C.降低界面色彩对比度D.增加动画反馈时长11.当使用Fleiss’Kappa评估三位评分者对30段AI合成语音的自然度评分一致性时,若κ=0.41,应解释为:A.轻微一致B.中等一致C.显著一致D.几乎完美12.某聊天机器人上线后,用户平均对话轮次从3.2降至1.5,CSAT同步下降,最可能原因是:A.意图识别阈值过高导致拒识B.语音合成语速过快C.服务器响应延迟增加D.用户群体年龄增大13.在可用性实验室中,若背景噪音控制在28dB(A),该数值主要影响下列哪项指标的测量精度?A.任务完成时间B.眼动轨迹C.语音录入错误率D.皮电反应14.当使用“WizardofOz”方法测试尚未实现的视觉问答系统时,主试需重点控制:A.wizard响应延迟分布B.摄像头分辨率C.室内照度均匀性D.被试近视度数15.下列关于“可解释性”对易用性影响的描述,正确的是:A.可解释性越高,用户信任度一定越高B.可解释性仅对专家用户重要C.可解释性可通过交互式可视化提升D.可解释性与系统响应时间无关二、多项选择题(每题3分,共15分)16.下列哪些做法可有效降低AI系统在老年群体中的“技术焦虑”?A.提供分步式引导动画B.使用技术黑话增强专业感C.允许自然语言模糊输入D.在错误提示中给出“为什么”解释E.将默认字体设为8pt以增强一屏信息量17.关于GOMS模型在AI易用性评估中的应用,正确的有:A.可预测语音任务执行时间B.需假设用户无认知错误C.可量化比较两种交互路径效率D.适用于创意发散型任务E.keystroke-level模型是GOMS的简化实现18.下列指标中,哪些属于ISO9241-11定义的“有效性”范畴?A.任务完成率B.错误率C.用户满意度D.偏离关键路径次数E.帮助文档点击次数19.当使用“系统可用性量表”(SUS)进行跨文化比较时,需注意:A.反向题翻译后需再次语义校准B.亚洲文化下易出现天花板效应C.可直接比较不同语言的原始分D.需检验测量等价性E.口语化翻译会降低信度20.在AI医疗影像辅助诊断的易用性测试中,下列哪些做法符合伦理规范?A.向受试者说明AI仅为辅助B.使用真实患者数据无需脱敏C.允许受试者随时退出D.将测试数据用于后续模型训练无需二次同意E.对对照组提供当前最佳诊断方式三、判断题(每题1分,共10分)21.在Fitts定律中,目标宽度W越大,移动时间MT越长。22.对于语音交互系统,增加“唤醒词”长度一定会降低误唤醒率。23.当使用Bootstrap法估计满意度置信区间时,样本量越小,所需重采样次数越多。24.在可用性测试中,发现问题的数量与受试者数量呈线性正比关系。25.若AI系统提供“撤销”功能,则可完全免除用户操作错误带来的负面体验。26.在眼动热图中,颜色越红表示注视时间越长。27.对于移动端AI相机,启动时间>800ms将导致超过50%用户放弃使用。28.在SUS评分中,得分>80即可认为系统可用性“优秀”,无需结合其他指标。29.当使用EEG评估认知负荷时,α波功率降低通常对应负荷升高。30.在AI推荐系统中,增加“不喜欢”按钮会降低系统的可学习性。四、填空题(每空2分,共20分)31.在经典Fitts定律公式M中,lo32.当使用A/B测试比较两种推荐界面时,若结果指标为二分类“是否点击”,应采用________检验计算p值。33.在语音交互中,从用户结束说话到系统开始反馈的时间称为________时间。34.某AI字幕系统实时性为250ms,该数值低于________ms时,听障用户才能感知“同步”。35.在可用性实验室进行生理信号同步时,常用________协议实现多设备时间戳对齐。36.当使用结构方程模型(SEM)分析“可解释性→信任→满意度”路径时,需首先检验模型的________效度。37.在AI绘图工具中,若用户需输入“prompt”,则该交互属于________模式。38.当使用“五维可解释性量表”时,若“透明度”维度Cronbach’sα<0.6,应首先考虑________。39.在移动端AI测试时,若需模拟弱网环境,通常使用________工具进行带宽限制。40.当计算语音合成系统的MOS分时,需去除最高________%与最低________%的极端评分后再求平均。五、简答题(每题8分,共24分)41.简述在AI辅助编程工具中,如何通过“渐进式披露”设计降低新手用户的认知负荷,并给出两条具体实现策略。42.说明在AI医疗问诊系统的易用性测试中,为何需引入“生态有效性”评估,并列举两项可量化的生态指标。43.当使用眼动指标评估AI课件的可读性时,发现“回视路径时间”显著增加,请给出两种可能的设计缺陷并对应改进建议。六、计算题(共21分)44.(11分)某智能翻译笔在实验室测试中,记录到30名受试者完成“中→英”菜单翻译任务的平均时间μ0=4.8s,标准差s=0.6s。厂商宣称新版算法可缩短时间。现招募25名新用户测得平均时间μ1=4.3s,标准差s1=0.5s。假定时间近似正态且方差齐性,请在显著性水平α=0.05下检验厂商宣称是否成立,给出假设、检验统计量及结论。45.(10分)某AI客服机器人上线后,收集到连续30天的日满意度得分(百分制),样本均值¯x七、案例分析题(共20分)46.阅读下列场景并回答问题:背景:某城市推出AI语音红绿灯,视障者可通过语音指令获取路口信号状态。试点两周后,发现使用率仅15%,访谈得知主要痛点为“唤醒成功率低”“反馈语速过快”。技术日志显示:环境噪音>70dB时唤醒率降至40%;默认语速为260词/分。(1)请给出两条针对“唤醒成功率低”的易用性改进方案,并说明如何量化验证。(8分)(2)设计一项实验,验证“语速调整”对60岁以上视障用户满意度的影响,需包括实验变量、样本量估算公式、主要指标及统计方法。(12分)———答案与解析———一、单项选择题1.A2.C3.B4.C5.C6.D7.A8.B9.C10.B11.B12.A13.C14.A15.C二、多项选择题16.ACD17.BCE18.ABD19.ABD20.ACE三、判断题21.F(W越大MT越短)22.F(过长会降低可用性)23.T24.F(符合对数曲线)25.F26.T27.T28.F29.T30.F四、填空题31.难度(或IndexofDifficulty)32.卡方(或Z)33.响应(或系统延迟)34.8035.LSL(LabStreamingLayer)36.构念37.指令式(或命令式)38.修订或删除低相关题项39.ChromeDevTools/NetworkLinkConditioner(任填一种)40.5,5五、简答题41.渐进式披露通过“先核心后高级”减少一次性信息过载。策略:①代码补全列表默认仅显示高置信度Top-3,按快捷键展开全部;②复杂参数面板默认折叠,仅显示“常用”页签,点击“更多”再展开高级选项。42.生态有效性指测试结果在真实环境中的可推广性。指标:①日均环境噪音分布(dB);②用户行走步数与系统使用频次相关系数。43.缺陷1:行过长导致回视——改为65字符换行并增大行距;缺陷2:概念图与文字不符——在图旁增加编号与文字对应说明,减少整合负荷。六、计算题44.假设:H0:μ1≥μ0,H1:μ1<μ0(单侧)。合并方差=t统计量tdf=53,查表得t0.05=-1.67,t<-1.67拒绝H0,厂商宣称成立。45.允许误差E=1,Z_{0.975}=1.96,n向上取整139天。七、案例分析题46.(1)方案A:采用双麦克风阵列+波束成形,定向拾取行人方向语音;验证:在70dB场景下对比前后唤醒率,配对t检验。方案B:增加骨传导耳机作为近讲拾音,验证:记录信噪比提升值与唤醒率改善的皮尔逊相关。(2)实验设计:被试内设计,自变量为语速(220/240/260/280词/分),因变量为SUS得分。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 厦门软件职业技术学院《系统项目集成管理》2025-2026学年期末试卷
- 闽江师范高等专科学校《电子商务基础与实务》2025-2026学年期末试卷
- 滁州职业技术学院《会计信息系统》2025-2026学年期末试卷
- 轨道作业车司机创新应用模拟考核试卷含答案
- 试驾专员工作总结报告
- 水声换能器密封工岗前管理应用考核试卷含答案
- 井下采矿工操作知识评优考核试卷含答案
- 酶制剂充填封装工诚信强化考核试卷含答案
- 水平定向钻机司机风险评估与管理能力考核试卷含答案
- 房地产投资风险解码-掌握风险谨慎投资房产
- 2026年新疆昌吉州共同体初三5月摸底联考化学试题含解析
- 校园绿化种植与灌溉系统方案
- 钻机介绍教学课件
- 2026北森测评试题及答案
- 深度解析(2026)《NBT 10617-2021制氢转化炉炉管寿命评估及更换导则》
- 华为公司管理制度规范
- 《增材制造工艺制订与实施》课件-增材制造技术应用领域(航空航天)
- 2026年驾驶证换证三力测试备考题及思路梳理含答案
- 2026年2月1日执行的《行政执法监督条例》解读课件
- 柔韧素质及其训练
- 红细胞叶酸课件
评论
0/150
提交评论