2026年人工智能用户研究基础考试试题及答案_第1页
2026年人工智能用户研究基础考试试题及答案_第2页
2026年人工智能用户研究基础考试试题及答案_第3页
2026年人工智能用户研究基础考试试题及答案_第4页
2026年人工智能用户研究基础考试试题及答案_第5页
已阅读5页,还剩10页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2026年人工智能用户研究基础考试试题及答案一、单项选择题(每题2分,共20分)1.在人工智能用户研究中,下列哪项最能体现“可解释性”对终端用户的价值?A.降低模型训练成本B.提升模型在测试集上的准确率C.帮助用户理解为何系统给出特定推荐D.减少数据标注量2.当使用“Think-Aloud”方法评估语音助手时,研究者最需警惕的偏差是:A.社会期望偏差B.幸存者偏差C.选择偏差D.发表偏差3.某推荐系统上线后,点击率提升15%,但退货率增加8%。从用户研究伦理视角,首要应:A.立即回滚算法B.向所有用户推送道歉通知C.启动伦理审查委员会评估伤害阈值D.增加模型正则化系数4.在眼动追踪实验中,若“首次注视时间”(TTFF)显著缩短,最合理的推论是:A.界面视觉复杂度降低B.用户动机减弱C.任务难度增加D.瞳孔直径必然增大5.使用K-means对问卷数据进行用户分群时,决定簇数k的核心指标是:A.轮廓系数B.互信息C.F1-scoreD.AUC-ROC6.在A/B测试中,若α=0.05、power=0.8,最小可检测效应Δ=2%,所需样本量计算公式中,不包含下列哪一参数?A.基线转化率pB.显著性水平Z_{1-α/2}C.效应量Cohen’sdD.检验效能Z_{1-β}7.当采用“日记法”研究AI健康管家使用习惯时,为降低“记忆衰退”误差,最佳采样策略是:A.事件触发+当日补录B.每周一次retrospectiveC.每月一次焦点小组D.季度性深度访谈8.在构建用户信任量表时,经EFA提取出“能力”“善意”“正直”三因子,其累积方差解释≥60%,下一步应:A.直接投入使用B.进行CFA验证结构效度C.删除载荷<0.7的题项D.增加“吸引力”因子9.若某对话式AI在“错误恢复”场景下使用“道歉+解释+建议”策略,用户满意度显著高于“仅道歉”组,这一结果最能支持:A.技术接受模型(TAM)B.计算机作为行动者范式(CASA)C.互动仪式链理论D.算法责任归因框架10.在远程可用性测试中,使用“SUS+单题NPS”组合量表,发现SUS=72、NPS=–3,最合理的解释是:A.系统可用性高但用户忠诚度低B.量表信度不足C.样本量过小D.存在天花板效应二、多项选择题(每题3分,共15分;多选少选均不得分)11.以下哪些做法可有效缓解“算法感知歧视”带来的用户负面情绪?A.提供个性化申诉通道B.隐藏算法决策逻辑以防误解C.公开公平性审计报告D.引入第三方独立监督E.使用更复杂黑盒模型12.在构建“可解释推荐”原型时,下列哪些技术组合可同时满足“局部忠实度”与“全局可读性”?A.LIME+决策树替身模型B.SHAP+规则提取C.注意力热图+自然语言模板D.混淆矩阵+t-SNEE.梯度加权类激活映射+原型批评13.采用“体验采样法(ESM)”研究AI相机滤镜使用情境时,需重点控制哪些混淆变量?A.手机电量B.网络延迟C.社交在场D.用户自拍经验E.当日股市波动14.在“人机协同写作”研究中,若发现“AI先写—用户后改”模式比“用户先写—AI补全”模式更能提升终稿质量,可能的中介变量包括:A.用户自我效能感B.认知负荷C.流体验D.算法推断置信度E.键盘品牌15.当使用“联邦学习”收集用户键盘输入习惯时,为保护隐私,应同步采用:A.本地差分隐私B.安全聚合(SecureAggregation)C.同态加密D.模型水印E.明文梯度上传三、判断题(每题1分,共10分;正确打“√”,错误打“×”)16.在用户体验研究中,p值<0.05即可证明因果性。17.“算法厌恶”现象表明用户永远偏好人类决策。18.使用“出声思考”时,研究者应避免在任务中途纠正用户错误,以免破坏自然流程。19.在问卷量表设计中,反向题项可有效降低“默许偏差”。20.眼动指标“回视路径时间”与信息复杂度呈正相关。21.对于同一模型,SHAP值与LIME值在数学上完全等价。22.在“情感计算”研究中,使用面部EMG测量微笑强度属于主观报告法。23.若AI客服使用拟人化头像,女性用户对其能力评价普遍低于男性,这一现象可用“刻板印象内容模型”解释。24.在远程测试中,使用“任务完成率”作为指标时,需明确定义“完成”的边界条件。25.当采用“混合效应模型”分析纵向数据时,把用户ID作为随机截距可控制个体间差异。四、填空题(每空2分,共20分)26.在“AI医疗影像辅助诊断”可用性测试中,若采用“_________”方法,可在不暴露患者隐私的前提下,让放射科医生评估系统解释的可信度。27.当使用“_________”技术对语音助手日志进行脱敏时,可在保持句法结构的同时替换实体名称。28.若某推荐系统对少数民族群体的召回率显著低于主流群体,这一差距在伦理审查中被称为“_________”。29.在构建用户心智模型时,常用“_________”图表示用户与系统之间的信息交换路径。30.若需检验“可解释界面是否显著降低用户感知风险”,应使用_________统计检验当数据呈正态且方差齐。31.在“人机对话”研究中,若系统回复长度超过_________tokens,用户满意度出现显著下降,该阈值被称为“_________点”。32.当使用“_________”采样方法,可确保在社交媒体招募的AI研究样本与平台总体在性别、年龄上分布一致。33.在实验设计中,将“是否收到解释”作为_________变量,将“信任分数”作为因变量,可有效检验解释对信任的因果效应。34.若某AI教育软件在真实课堂中的效应量Cohen’sd=0.2,则其属于_________效应。五、简答题(每题10分,共30分)35.简述“算法可解释性”与“用户心理模型匹配”之间的关系,并给出一个人机协同写作场景的具体例子说明。36.当使用“远程可用性测试+生物识别”组合方法时,列出三项关键技术挑战及对应解决策略。37.说明在“AI金融投顾”情境下,如何运用“混合效应模型”分析用户投资行为随时间变化的个体差异,并写出模型公式。六、计算与综合题(共45分)38.(15分)某AI相机滤镜上线后,实验组(n₁=5000)使用AI推荐滤镜,对照组(n₂=5000)使用传统热门滤镜。一周后,实验组平均每人发布照片数μ₁=7.8,s₁=3.2;对照组μ₂=7.3,s₂=3.0。假设数据近似正态,方差齐。(1)计算两独立样本t统计量,并判断差异是否显著(α=0.05,双尾)。(2)若认为0.5张照片的效应量过小,需设计多大样本才能在α=0.05、power=0.9下检测到该效应?(给出公式并代入计算)39.(15分)研究者欲构建“AI医疗问诊信任量表”,初步编制20题,经EFA得到特征值>1的因子共4个,累积方差解释58%。经平行检验,仅前3个因子特征值高于随机模拟均值。(1)说明应保留几个因子,并给出理由。(2)若保留3因子,删除载荷<0.5的题项后剩余15题,计算Cronbach’sα=0.78,是否满足信度标准?(3)为进一步验证结构效度,需采用何种统计方法?写出检验指标及判断标准。40.(15分)某城市出行App引入“AI路线推荐”,为评估公平性,收集不同收入群体(高、中、低)在高峰时段的平均通行时间(分钟):高收入:32,30,34,31,33中收入:35,36,34,37,38低收入:40,42,41,43,44(1)给出单因素方差分析的原假设与备择假设。(2)计算组间平方和SSB与组内平方和SSW。(3)在α=0.05下,完成F检验并给出结论。(F₀.₀₅(2,12)=3.89)七、设计题(25分)41.请为“2026年生成式AI辅助学术写作平台”设计一套为期两周的“纵向混合方法”用户研究方案,需包含:1.研究问题与假设(5分)2.样本招募与筛选标准(5分)3.数据收集工具与流程(含主客观指标)(8分)4.数据分析计划(含统计与质性分析)(4分)5.伦理与隐私保障措施(3分)卷后答案与解析一、单项选择题1.C2.A3.C4.A5.A6.C7.A8.B9.D10.A二、多项选择题11.ACD12.ABC13.ABCD14.ABC15.ABC三、判断题16.×(p值仅说明统计显著,不证明因果)17.×(厌恶程度因情境、解释方式而异)18.√19.√20.√21.×(二者近似但非等价)22.×(EMG为生理测量)23.√24.√25.√四、填空题26.可解释性模拟/代理模型解释27.命名实体匿名化(或NER+同义替换)28.算法偏见/公平性差距29.信息流程图(或概念图)30.独立样本t检验31.60~80;满意度拐点(或饱和点)32.分层配额采样33.自变量/实验操纵变量34.小五、简答题(答案要点)35.算法可解释性通过提供与用户需求、背景知识一致的解释,缩小用户心理模型与系统模型之间的差距,降低认知失调。例如,人机协同写作中,AI对生成文本给出“基于您前文‘气候变化’关键词,引入最新UN报告数据”的解释,使用户形成“AI在补充权威数据”的心理模型,从而提升信任与采用率。36.挑战与策略:1.生物信号远程校准困难→采用预实验录制基准视频,自动对齐心率;2.家庭环境噪声干扰眼动数据→使用9点校准+AI滤波;3.隐私合规→本地差分隐私上传,仅传输聚合特征。37.模型公式:=其中∼N(0,)六、计算与综合题38.(1)t自由度≈9998,查t界值≈1.96,8.06>1.96,差异显著。(2)n每组需约1530人,原样本已远超,故当前检验足够。39.(1)保留3因子,因平行检验显示第4因子特征值未超随机阈值,且前3因子理论可解释“能力、善意、正直”维度。(2)α=0.78>0.7,满足探索性研究信度标准。(3)采用验证性因子分析(CFA),指标:CFI>0.9,TLI>0.9,RMSEA<0.08,SRMR<0.08。40.(1)H₀:三组平均通行时间相等;H₁:至少一组不等。(2)总均值=(32+…+44)/15=37.4SSB=5[(32.8–37.4)²+(36–37.4)²+(42–37.4)²]=5[21.16+1.96+21.16]=222.8SSW=∑(x_ij–x̄_j)²=10+10+10=30(3)F=(SSB/2)/(SSW/12)=111.4/2.5=44.56>3.89,拒绝H₀,收入显著影响通行时间。七、设计题(参考示例)1.研究问题:生成式AI解释风格(高vs低可控性)如何影响研究生学术写作自我效能与长期采用意愿?假设:高可控性解释显著提升两周后自我效能与采用意愿。2.样本:招募N=120名硕博研究生,GPower计算得需≥108,考虑20%流失,最终120;筛选:近3月每周写作≥2小时、未使用过该平台。2.样本:招募N=120名硕博研究生,GPower计算得需≥108,考虑20%流失,最终120;筛选:近3月每周写作≥2小时、未使用过该平台。3.工具与流程:前测:写作自我效能量表(α=0.84)、人口学问卷;日记录:ESM每天3次推送,记录即时

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论