人工通识基础 1_第1页
人工通识基础 1_第2页
人工通识基础 1_第3页
人工通识基础 1_第4页
人工通识基础 1_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章习题参考答案一、单项选择题B

解析:LLM获得通用能力的基础是大规模无监督或自监督预训练。预训练阶段在海量无标注文本上学习语言规律与世界知识,这是通用能力的主要来源。B

解析:Transformer用来自建模序列任意位置依赖关系的核心机制是自注意力。它负责捕捉长程依赖和不同位置之间的关系。B

解析:预训练学习一般语言规律,对齐偏向价值与偏好约束,而指令微调直接面向如何按指令完成任务。B

解析:CoT的核心作用是引导模型分步推理,把中间步骤展开,从而提升复杂任务的求解稳定性。C

解析:RAG的基本流程是先检索外部资料,再把检索结果连同原问题一起注入上下文生成答案。B

解析:当任务需要精确计算、实时信息访问或结构化查询时,更适合工具调用,而不是纯语言生成。C

解析:幻觉是指模型输出与事实或来源不一致,而且常常还带着较高自信。D

解析:忠实度/正确性、延迟与成本、可追溯性都属于常见评估维度,UI按钮配色不属于模型评估维度。C

解析:隐私合规的基本做法包括数据最小化与脱敏处理。题目中的其余选项都属于明显不合规或高风险做法。C

解析:更长的上下文和更大的模型通常都会增加推理成本;相反,缓存、提示压缩、去重一般是为了降本增效。二、简答题什么是大语言模型(LLM)?它与传统规则系统的核心差异是什么?

答案:LLM是在海量数据上训练出来、能够理解和生成语言,且具有一定通用任务能力的神经网络模型。与传统规则系统的核心差异在于,前者主要靠数据驱动学习统计规律与表示能力,后者主要靠人工编写规则。前者通用性强,后者通常面向单一任务。为什么提示工程能显著影响模型表现?

答案:因为提示词本身就是模型推理的起始条件和约束条件。任务表述是否明确、结构是否清晰、上下文是否充分、约束是否具体,都会直接影响模型关注什么、如何组织输出。简述预训练、指令微调、对齐的区别与衔接。

答案:预训练负责学通用语言规律和世界知识。指令微调负责让模型按任务指令稳定作答。对齐负责让模型更符合人类偏好、价值和安全要求。何为思维链(CoT)?不适合使用CoT的场景有哪些?

答案:CoT是把问题拆成线性、逐步的中间推理过程来求解。它适合多步计算、解释和局部调试。不适合的场景包括但不限于:答案本就很短的简单事实问答;需要多方案比较的开放任务;需要跨分支复用与合并信息的复杂任务。定义RAG(检索增强生成),给出两个收益与一个风险点。

答案:RAG是先从外部知识库检索相关内容,再把检索结果与原问题一起交给模型生成答案。两个收益是:能引入最新或领域专属知识;能提高答案可信度与可追溯性,并降低幻觉。一个风险点是:若检索结果重复、偏题或质量差,会把噪声带入上下文,反而误导生成。什么是AI的“幻觉(Hallucination)”?请列举两类缓解手段。

答案:幻觉是指模型生成了看似合理但与事实、来源或输入不一致的内容。缓解手段可列举两类:一类是知识增强,如RAG、事实核查;另一类是生成控制,如温度调节、集成输出、人工审核、分层生成后逐步验证。评估大模型的常见维度有哪些?至少列举三项。

答案:可列举忠实度/正确性、可追溯性、延迟、成本、安全性等。简述隐私合规在大模型应用中的两项基本做法。

答案:第一,数据最小化与脱敏,尽量不让模型接触不必要的敏感信息;第二,建立访问控制与审计日志,确保谁访问了什么、做了什么都可追踪。三、分析题分析下面的提示哪个更好?为什么?

答题要点:PromptB更好。

(1)更明确:限定了“50–80字中文总结要点”;

(2)约束更强:要求保留关键数据、禁止虚构;

(3)可验证:要求给出1条引用,便于核对;

(4)输出更稳定:格式、长度、信息边界都更清晰。某RAG系统检索到3段内容:两段重复、1段偏题,回答常常出错。请分析问题并提出具体的改进意见。

答题要点:问题本质:检索质量差,导致上下文中噪声过高。重复段会浪费上下文窗口,降低有效信息密度;偏题段会误导模型关注错误方向。

(1)改进思路一:做检索结果去重;

(2)改进思路二:加入重排序,只保留高相关段;

(3)改进思路三:使用查询改写,提高召回方向的准确性;

(4)改进思路四:做上下文压缩,只保留高相关句;

(5)改进思路五:加入答案验证与引用检查。比较RLHF、DPO与宪法式对齐的异同与它们的适用场景。

答题要点:

相同点:三者都属于对齐方法,目标都是让模型更符合人类偏好、安全要求与行为规范。

不同点:

(1)RLHF先示范,再偏好,再奖励模型和强化学习,链路最完整,但实现最复杂;

(2)DPO直接从偏好数据学习,省去显式奖励模型与复杂RL,工程实现更简洁;

(3)宪法式对齐依据一组明确原则做自我批评和改进,减少人工标注依赖。

适用场景:

(1)RLHF适合资源充足、追求高质量对齐的闭源或头部系统;

(2)DPO适合工程上希望快速、稳定落地的开源或中等规模项目;

(3)宪法式对齐适合强调原则透明、一致拒答与降低标注成本的场景。你在使用大模型时,观察到模型引用的段落与结论矛盾的现象。请给出定位与修复的步骤。

答题要点:步骤要点如下,

(1)先核对引用段落本身是否支持结论;

(2)检查检索阶段是否召回了重复、偏题或相互冲突的材料;

(3)检查重排序是否把低相关材料排到了前面;

(4)检查提示中是否明确要求仅依据所给材料作答;

(5)检查生成阶段是否要求保留引用并逐条对应;

(6)加入答案验证,对结论和证据做一致性检查;

(7)必要时降低温度,并加入人工复核。某工具调用型智能体偶发“错误调用API”和“参数缺失”的问题。请从提示设计与系统设计两侧提出改进的方法。

答案:

提示设计侧:明确工具用途与调用边界;给出参数格式示例;要求调用前先检查必填参数;参数缺失时先追问,不允许猜填;用结构化输出约束调用格式。

系统设计侧:对参数做schema校验;做调用前置校验和默认值检查;对错误调用增加重试与回退;把所有调用写入审计日志;将高风险API放入权限控制与白名单。要对两种提示模板做A/B测试(100条真实查询)。给出试验设计要点。

答题要点:要点概述如下,

(1)使用同一批真实查询,保证样本一致;

(2)随机分配到模板A/B,避免人为偏置;

(3)固定模型、温度、上下文、工具与检索配置;

(4)提前定义指标,如正确性、忠实度、可追溯性、延迟、成本、用户偏好;

(5)最好做盲评,避免评审知道模板来源;

(6)按任务类型分层统计,观察不同场景差异;

(7)记录失败案例,便于后续迭代模板。四、系统设计题设计一个仅概念级“校园热点问答RAG助手”,说明其数据、流程与评估。

答题要点:

数据层设计:学校官网通知、教务公告、校历、奖助学金政策、选课说明、宿舍与后勤FAQ、讲座活动通知。

流程层设计:采集并清洗校内正式文本;按段落或主题切分;建立向量索引,并可辅以关键词索引;用户提问后先做检索再重排序;把相关片段注入上下文生成回答;回答附带来源引用;低置信度问题转人工或仅返回候选来源。

评估层设计:

(1)正确性:答案是否符合校方原文;

(2)可追溯性:引用是否能定位到原通知;

(3)延迟:问答响应时间;

(4)成本:单次问答token与模型费用;

(5)失败率:无答案、错答、引用错位比例。设计一个“阅读小帮手App”(含工具调用)。可以给它提供PDF论文,输出结构化摘要与图表清单。

答题要点:

核心功能:上传PDF,抽取文本与图表信息,输出结构化摘要、关键图表清单、术语解释与进一步提问。

主要模块:

(1)文件解析工具:提取PDF文本、标题层级、参考文献;

(2)图表解析工具:识别图号、表号、标题、所在页;

(3)RAG检索模块:对论文内容分块建索引;

(4)问答模块:按用户问题检索并生成;

(5)摘要模块:生成“研究问题、方法、数据、发现、局限”五栏摘要。

流程:上传PDF→解析文本/图表→切分建索引→生成初始结构化摘要→用户追问→工具调用获取页码、图表信息或引用信息→输出带来源回答。

输出样式:

(1)摘要:标题、研究问题、方法、实验设置、主要结论、局限;

(2)图表清单:图/表编号、标题、页码、用途说明;

(3)延伸问题:建议继续追问的若干个问题。

评估:摘要忠实度、图表识别覆盖率、引用准确率、处理时延。为“课堂智能助教对话系统”提出一套治理清单,包含评测、成本、隐私与安全。只需要设计最小可行版。

答题要点:

(1)评测:建立一套课程真实问答样本,检查正确性、忠实度、可追溯性,记录错答案例并定期回归测试。

(2)成本:优先短上下文,高频问题启用缓存,简单问题走小模型,复杂问题再升级,记录每类请求成本。

(3)隐私:数据最小化,不上传无关个人信息,对学号、手机号等敏感字段脱敏,分角色访问控制,保存必要审计日志。

(4)安全:输入验证,防提示注入,输出过滤,防不当内容,高风险问题设置拒答或转教师,保留人工兜底。阅读DeepSeek-V3论文,设计“分级路由的成本优化方案”,做到先小后大,多模型协同。

答题要点:

设计思路:借鉴DeepSeek-V3总参数很大但每次只激活少量专家的思想,在系统层做分级路由,把昂贵能力只用在真正困难的问题上。

方案框架:

(1)第一级:轻量路由器。先用小模型或规则分类器判断任务类型:闲聊、事实问答、检索问答、复杂推理、工具任务。

(2)第二级:小模型优先。简单问答、格式改写、摘要压缩先交给小模型处理。

(3)第三级:中模型增强。若问题需要检索、较长上下文或多步推理,则升级到中模型,并结合RAG。

(4)第四级:大模型兜底。只有在低置信度、长链推理、跨工具编排或高风险场景时,才调用大模型。

(5)共享能力层。把检索、缓存、工具封装、日志审计作为共享模块,避免重复消耗。

(6)回退与升级机制。若小模型回答失败、证据不足、参数不全或验证不通过,则自动升级。

方案优势:把高成本调用限制在少数难题上;多数请求由小模型快速完成,降低均摊成本;多模型协同下,兼顾速度、质量与可扩展性。

第九章习题参考答案一、简答题1.试举例说明在传统工厂中完成一种产品生产需要经过哪些步骤,而在引入人工智能和数字化技术后,这些步骤如何优化或改变?答题要点:以某类机械产品为例,传统流程通常包括:人工制定生产计划、人工调度设备、人工巡检设备状态、按固定参数加工、事后质检、设备故障后再维修。引入人工智能和数字化技术后,这些环节可优化为:(1)传感器实时采集设备与加工数据;(2)AI辅助排产与调度;(3)机床根据状态变化进行自适应控制;(4)数字孪生先在虚拟环境中优化工艺;(5)机器视觉或智能检测进行在线质检;(6)通过预测性维护提前检修,减少停机。2.智能制造虽有诸多优势,但也面临挑战。请结合本节内容,分析企业在推进智能制造过程中可能遇到的数据、安全、成本或人才方面的问题,并思考可能的解决方案。答题要点:(1)数据问题:数据来源分散、标准不统一、质量参差不齐,易形成信息孤岛。解决方案:建设统一数据平台与标准,增强设备互联和系统互操作。(2)安全问题:设备联网后,系统暴露面扩大,生产数据与控制系统面临安全风险。解决方案:加强工业网络安全防护、权限管理与监测预警。(3)成本问题:前期建设传感器、网络、平台、模型和改造产线,投入较高。解决方案:优先从示范产线或关键设备切入,分阶段实施,逐步扩大。(4)人才问题:既懂制造工艺又懂AI、数据和系统的复合型人才不足。解决方案:加强员工培训和岗位转型,培养“工程+AI”复合能力。3.工业机器人的普及和AI的决策替代,会不会引发制造业工人大规模失业?你认为未来的工厂员工需要具备哪些新技能以适应智能制造环境?答题要点:未来制造业将更多呈现人机协同的格局。高危险、高强度、重复性岗位会更多由智能机器承担,人类则转向更具创造性、维护性和决策性的工作。未来工厂员工需要具备的新技能可能主要包括:(1)机器人编程与维护;(2)设备数据理解与分析;(3)数字化系统操作能力;(4)跨学科协同能力;(5)工程知识与AI技术结合的复合能力。4.智慧建筑通过传感器收集大量用户行为数据,如何在提供智能服务的同时保护用户隐私?请提出至少三种技术或管理措施。答案:(1)数据最小化,只采集实现服务所必需的数据。(2)边缘计算或本地预处理,减少原始敏感数据上云。(3)建立访问控制与权限分级,限制数据使用范围。(4)加强网络安全防护,防止楼宇系统被攻击。(5)建立统一的数据标准和管理机制,明确采集、存储、使用边界。5.生成式设计可能产生突破常规的创新方案,但建筑设计需要符合安全规范和文化习惯。如何确保AI生成的设计既有创新性又具有可实施性?答案:(1)在输入端明确设计目标和约束条件,如用地范围、容积率、日照标准等。(2)把能耗、采光、通风等性能指标纳入仿真评估。(3)结合BIM做碰撞检测和多专业协调。(4)利用4DBIM检查施工可实施性与资源配置。(5)保留建筑师和工程师的人工审查与优化环节。6.如果AI系统能够自主设计实验、分析数据并撰写论文,那么科学发现的功劳应该归属于谁?如何定义和保护研究者的知识产权?答案:略。7.个性化教育的公平性悖论:AI个性化学习系统可能根据学生表现提供不同难度的内容,这是否会加剧教育不平等?如何在个性化和标准化之间找到平衡?答案:略。8.讨论企业在引入AI进行市场分析时需要具备哪些数据和技术条件?遇到预测不准的情况应如何调整策略?答题要点:企业引入AI进行市场分析,至少需要:(1)数据条件:销售记录、消费者评价、网络搜索热度等多源数据;(2)数据处理能力:对数据进行清洗、整合,形成可分析数据集;(3)技术条件:具备机器学习模型训练、实时更新和结果输出能力。若预测不准,应做如下调整:(1)检查输入数据是否偏差或不完整;(2)结合新情况及时更新模型;(3)对极端事件保持警惕,不能机械依赖历史数据;(4)坚持人机结合,由分析人员对AI结果进行复核和解读,再调整采购、定价或营销策略。9.人工智能在财务部门大量取代基础工作岗位,这对财务人员的职业发展意味着什么?你认为财务人员应如何提升自身技能以适应这一变革?答题要点:这意味着财务人员的工作重心将从重复性、事务性工作,转向预算分析、业务规划、风险识别和专业判断等更高价值工作。未来,财务人员应重点提升:(1)数据分析能力;(2)对OCR、RPA、智能财务系统的使用能力;(3)异常处理与人工复核能力;(4)业务理解与战略分析能力;(5)与AI协同工作的能力。10.个性化推荐提升了消费者体验,但也引发隐私担忧。请从消费者和企业双方角度分析,如何在享受精准营销的同时保护个人隐私?尝试提出平衡两者的方案。答题要点:从企业角度:遵守隐私法规,确保数据安全与透明;避免过度收集和滥用个人数据;对推荐系统保持人工监管,避免算法失控或品牌风险;警惕信息茧房。从消费者角度:关注数据授权范围;优先接受透明、可说明的数据使用方式;对个性化推荐保持适度警惕。平衡方案:建议以合规、透明、最小必要、人工监督为原则,在提升推荐准确性的同时控制数据收集边界,并对推荐结果和营销内容进行持续审查。11.人工智能生成的绘画、音乐等作品能否被称为真正的艺术?它们和人类艺术作品相比有什么异同?你认为AI在艺术创作中应扮演怎样的角色?答案:略。12.在传统文化的保护和传播中引入AI技术可能带来哪些利与弊?结合具体案例,谈谈我们应如何平衡AI应用与文化传承,既利用技术推动文化创新又避免对传统的冲击。答案:略。二、分析设计题1.案例分析:选择一家知名制造企业(如华为、比亚迪、特斯拉等),调研其在智能制造方面的具体实践,并分析该实践为企业带来的效益和存在的不足。答案:略。2.智能电网的隐私悖论:智能电表能够精确记录用户用电行为,甚至可以推断出家庭作息规律和生活习惯。如何设计一个既能支持电网优化又能保护用户隐私的数据治理方案?请考虑技术手段(如差分隐私、联邦学习)和管理措施。答题要点:(1)按用途分级采集数据,只保留电网优化所需最小数据集。(2)优先在边缘侧或本地进行预处理,只上传聚合结果或关键特征。(3)对用户数据做脱敏、匿名化处理,可引入差分隐私。(4)多主体协同建模可采用联邦学习,减少原始数据共享。(5)建立明确授权、用途限制、访问审批和审计日志机制。(6)建立模型监控和可解释机制,防止数据滥用与决策失真。3.人机协同的信任机制:当AI检测系统判定产品不合格,但经验丰富的质检员认为合格时,应该如何决策?请设计一个人机协同的质量控制框架,包括权重分配、异议处理、持续学习等机制。答题要点:(1)建立人机协作的判定机制:AI负责高效初筛,人负责高风险和争议样本复核。(2)按风险和置信度分配权重:高置信度常规样本可自动处理,低置信度或高风险样本必须人工复核。(3)设置异议处理流程:AI与人工判断冲突时,进入复核与升级仲裁。(4)保留审计记录:记录判定依据、人工修改原因和最终结论。(5)持续学习:将争议样本回流训练集,持续优化模型。(6)关键环节坚持人工兜底,避免完全自动决策。4.技术债务的量化评估:假设你负责评估一个拥有500万行代码的企业级系统的技术债务,请设计一套评估指标体系,包括静态指标(如代码复杂度)、动态指标(如性能瓶颈)和业务指标(如迭代效率),并说明如何利用AI技术自动化这一评估过程。答题要点:静态指标如:代码复杂度、模块耦合度、循环依赖、反模式、缺陷密度、老旧开源组件漏洞情况。动态指标如:P99延迟、服务可用性、资源利用率、热点模块与高频变更模块、性能瓶颈定位结果、调用链异常。业务指标如:重构所需时间、故障定位时间、新特性交付周期、技术债务相关工时占比、遗留系统集成成本。AI自动化方法:(1)用抽象语法树(AST)分析代码结构,识别异味与反模式;(2)分析代码演化历史,发现逻辑耦合和改动热点;(3)用图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论