版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2026年公需科目《人工智能》试题附答案一、单项选择题(本大题共30小题,每小题1分,共30分)1.1950年,阿兰·图灵在论文《计算机器与智能》中提出了一个用于判断机器是否具有智能的测试方法,该方法被称为()。A.哲学僵尸测试B.图灵测试C.中文房间实验D.盲测实验2.人工智能的核心目标通常被认为是让机器能够模拟人类的()功能。A.仅仅计算B.思维与智能行为C.体力劳动D.存储数据3.在机器学习中,通过已标记的训练数据集来训练模型,从而对新数据进行预测的方法称为()。A.无监督学习B.半监督学习C.监督学习D.强化学习4.深度学习是机器学习的一个子集,其核心结构是模拟人脑神经元的连接方式,这种结构被称为()。A.决策树B.支持向量机C.人工神经网络D.贝叶斯网络5.在神经网络中,负责接收输入信号并进行加权求和,然后通过激活函数输出的基本单元是()。A.层B.权重C.偏置D.神经元6.下列哪项技术是AlphaGo击败围棋世界冠军李世石所主要依赖的算法?()A.专家系统B.深度强化学习C.遗传算法D.模糊逻辑7.在计算机视觉领域,主要用于图像分类、目标检测等任务,且通过卷积操作提取特征的神经网络类型是()。A.卷积神经网络(CNN)B.循环神经网络(RNN)C.生成对抗网络(GAN)D.变换器8.自然语言处理(NLP)技术中,能够理解文本上下文关系,并广泛应用于机器翻译、文本生成的Transformer架构,其核心机制是()。A.卷积机制B.注意力机制C.池化机制D.反向传播机制9.生成式人工智能(AIGC)是指利用人工智能技术生成新的内容,下列哪项不属于典型的AIGC生成内容?()A.文本B.图像C.规整的Excel表格数据统计D.音频10.大语言模型(LLM)训练过程中的一个重要步骤是让模型学会预测下一个词,这种预训练目标通常被称为()。A.掩码语言建模B.因果语言建模C.对比学习D.聚类分析11.在人工智能伦理中,由于训练数据本身存在偏见,导致模型输出结果对某些群体产生歧视,这种现象被称为()。A.算法黑箱B.算法偏见C.隐私泄露D.过拟合12.我国提出的新一代人工智能发展规划中,强调要构建“三步走”战略目标,计划在哪一年成为世界主要人工智能创新中心?()A.2025年B.2030年C.2035年D.2040年13.在机器学习中,模型在训练集上表现很好,但在测试集上表现较差,这种现象被称为()。A.欠拟合B.过拟合C.梯度消失D.梯度爆炸14.下列哪项激活函数是目前深度神经网络中最常用的,能够有效解决梯度消失问题?()A.SigmoidB.TanhC.ReLU(线性整流单元)D.Step15.知识图谱是人工智能的重要分支,其核心组成元素通常包括()。A.仅节点B.仅边C.实体和关系D.表格和字段16.智能体在强化学习中,通过与环境交互,根据获得的奖励或惩罚来调整策略,目标是最大化()。A.单次奖励B.累积奖励C.惩罚最小化D.步数最少化17.目前广泛使用的ChatGPT模型主要基于哪种架构?()A.RNNB.LSTMC.GPT(Decoder-onlyTransformer)D.BERT(Encoder-onlyTransformer)18.在数据预处理阶段,为了消除不同特征量纲的影响,通常会将数据缩放到特定的范围,如[0,1]或标准化为均值为0、方差为1,这被称为()。A.特征选择B.数据清洗C.数据归一化/标准化D.数据采样19.关于“强人工智能”和“弱人工智能”的描述,正确的是()。A.弱人工智能具有自我意识B.强人工智能目前已经实现C.强人工智能指在各方面都能像人类一样思考的机器D.现在所有的AI应用都属于强人工智能20.在自动驾驶技术中,利用激光雷达、摄像头等传感器感知周围环境的技术属于()。A.决策规划B.感知C.控制D.定位21.2023年,我国正式施行了《生成式人工智能服务管理暂行办法》,该办法旨在促进生成式人工智能健康发展和规范应用,其监管对象主要是()。A.所有计算机软件B.向公众提供生成式人工智能服务的组织和个人C.仅限于硬件制造商D.个人用户22.联邦学习是一种隐私保护机器学习技术,其核心思想是()。A.数据集中存储在云端训练B.数据保留在本地,仅交换模型参数或梯度C.使用完全公开的数据集D.不使用任何数据进行训练23.在评估分类模型性能时,TPR(真正例率)和FPR(假正例率)是绘制ROC曲线的两个重要指标,其中TPR也被称为()。A.精确率B.召回率C.特异度D.准确率24.计算机视觉中的“OCR”技术是指()。A.光学字符识别B.目标字符识别C.开放字符识别D.有机字符识别25.人工智能在医疗领域的应用中,利用AI辅助医生通过影像分析判断病灶,这属于()。A.药物研发B.医学影像分析C.健康管理D.虚拟助手26.在决策树算法中,用于衡量数据集纯度或不确定性的指标通常是()。A.欧氏距离B.信息增益或基尼系数C.相关系数D.余弦相似度27.提示词工程是指针对大语言模型,通过优化输入文本来引导模型生成更准确、高质量输出的技术,其中,“少样本提示”是指()。A.不给任何例子B.给一个例子C.给多个例子D.给错误的例子28.量子计算与人工智能的结合被认为是未来的重要方向,量子计算在处理AI任务时主要优势在于()。A.存储容量无限大B.对特定问题(如组合优化)具有并行计算潜力C.不需要编程D.完全替代传统GPU29.下列关于“数据标注”的描述,错误的是()。A.监督学习离不开高质量的数据标注B.数据标注就是对数据进行打标签C.标注质量对模型效果没有影响D.自动标注是当前降低标注成本的趋势30.数字孪生是充分利用物理模型、传感器更新、运行历史等数据,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程,AI在其中的作用主要是()。A.仅作为展示B.进行预测性维护和优化决策C.替代实体装备D.增加数据存储量二、多项选择题(本大题共15小题,每小题2分,共30分。多选、少选、错选均不得分)1.人工智能发展的三要素主要包括()。A.算法B.算力C.数据D.电力E.人力2.下列属于机器学习常见算法的有()。A.线性回归B.逻辑回归C.K-均值聚类D.支持向量机(SVM)E.决策树3.深度学习相比于传统机器学习,其特点包括()。A.依赖手工特征工程B.能够自动提取特征C.需要海量数据进行训练D.模型参数量通常巨大E.解释性更强4.计算机视觉的主要任务包括()。A.图像分类B.目标检测C.图像分割D.人脸识别E.语音识别5.自然语言处理(NLP)的常见应用场景有()。A.机器翻译B.情感分析C.智能问答系统D.语音转文字(ASR)E.文本摘要6.生成式对抗网络(GAN)由两个主要部分组成,它们是()。A.生成器B.判别器C.编码器D.解码器E.分类器7.人工智能伦理面临的主要挑战包括()。A.隐私保护B.算法透明度与可解释性C.责任归属D.就业影响E.安全性与鲁棒性8.下列关于大语言模型(LLM)的描述,正确的有()。A.具有强大的上下文理解能力B.能够涌现出训练时未明确教导的能力C.可能会产生“幻觉”,即生成看似合理但错误的信息D.不需要任何微调即可适应所有特定领域的任务E.训练和推理成本高昂9.强化学习中的基本要素包括()。A.智能体B.环境C.状态D.动作E.奖励10.智慧城市建设中,人工智能技术的应用体现在()。A.智能交通管理B.智能安防监控C.智慧能源调度D.垃圾分类与处理E.公共服务个性化推荐11.下列属于激活函数的有()。A.SigmoidB.TanhC.ReLUD.SoftmaxE.Linear12.在进行机器学习模型评估时,常用的评估指标有()。A.准确率B.精确率C.召回率D.F1值E.均方误差(MSE)13.数据清洗的主要步骤包括()。A.缺失值处理B.异常值检测与处理C.数据去重D.数据转换E.数据集成14.人工智能在金融领域的应用包括()。A.欺诈检测B.高频交易C.信用评分D.智能投顾E.风险控制15.目前制约人工智能进一步发展的因素有()。A.通用人工智能的理论突破B.优质数据的获取与合规性C.算力资源的瓶颈与能耗问题D.模型的安全性与对抗攻击防御E.跨学科复合型人才的缺乏三、判断题(本大题共20小题,每小题0.5分,共10分。正确的打“√”,错误的打“×”)1.人工智能的研究目标之一是创造出能完全替代人类在所有领域工作的机器。()2.监督学习只需要输入数据,不需要对应的标签数据。()3.神经网络的深度指的是网络中隐藏层的数量。()4.梯度下降算法是神经网络训练中最常用的优化算法之一。()5.卷积神经网络(CNN)主要用于处理序列数据,如文本和时间序列。()6.循环神经网络(RNN)由于其结构特点,非常适合处理具有时间依赖性的序列数据。()7.Transformer架构完全依赖于递归结构来处理序列。()8.所有的AI模型都是“黑箱”,无法解释其内部决策逻辑。()9.过拟合可以通过增加训练数据量、正则化或Dropout等技术来缓解。()10.欠拟合意味着模型太复杂,捕捉了数据中的噪声。()11.人工智能就是机器学习,两者概念完全等同。()12.在聚类分析中,我们通常不知道数据的类别标签。()13.AlphaFold是DeepMind开发的用于预测蛋白质结构的AI系统。()14.伦理和隐私问题在AI发展中属于次要问题,技术突破才是第一位的。()15.只要有足够的数据,深度学习模型就能达到100%的准确率。()16.迁移学习是指将一个领域训练好的模型应用到另一个相关领域,通常可以节省训练时间和数据需求。()17.物联网产生的大量数据为人工智能的应用提供了基础。()18.现在的AI已经具备了真正的情感和自我意识。()19.对抗样本是指通过对输入数据进行微小、人类难以察觉的修改,从而导致模型输出错误的样本。()20.多模态学习是指模型能够同时处理和理解多种类型的数据,如文本、图像、音频等。()四、填空题(本大题共10小题,每小题1分,共10分)1.人工智能、机器学习和深度学习三者之间的关系可以概括为:人工智能包含机器学习,机器学习包含______。2.在神经网络中,用于衡量模型预测结果与真实标签之间差异的函数称为______函数,常见的有均方误差和交叉熵。3.______是一种无监督学习算法,其目的是将数据集划分为若干个互不相交的簇,使得簇内数据相似度高,簇间相似度低。4.在自然语言处理中,将文本转换为计算机可处理的数值向量的过程称为______。5.2016年,______击败了围棋世界冠军李世石,标志着深度学习在复杂策略游戏领域的重大突破。6.______学习是指智能体在与环境的交互中,通过试错来学习最优策略,以最大化长期累积奖励。7.为了解决RNN在长序列训练中的梯度消失问题,研究者提出了______(LongShort-TermMemory)网络。8.在深度学习训练中,______是指每次迭代用于更新模型参数的样本数量。9.能够生成与真实数据分布相似的新数据的模型,如GAN和VAE,被称为______模型。10.随着AI模型规模的增大,其性能会随着计算量、数据量和参数量的增加而提升,这一规律被称为______定律。五、简答题(本大题共4小题,每小题5分,共20分)1.简述监督学习、无监督学习和半监督学习的主要区别。2.什么是卷积神经网络(CNN)?请列举其在计算机视觉中的两个主要应用。3.简述大语言模型(LLM)中“涌现能力”的含义,并举例说明。4.在人工智能应用中,为什么要进行数据标准化?常用的标准化方法有哪些?六、案例分析与应用题(本大题共3小题,共50分)1.(15分)某大型电商平台计划引入人工智能技术来提升用户体验和运营效率。(1)请结合机器学习知识,列举两个可以用于“商品推荐”的具体算法,并简述其原理。(6分)(2)在利用用户历史行为数据进行推荐时,可能会涉及用户隐私。请从技术和伦理角度,提出两种保护用户隐私的方案。(6分)(3)如果推荐系统出现了严重的“信息茧房”效应,即用户只能看到自己喜欢的内容,这会带来什么负面影响?平台应如何通过算法优化来缓解这一问题?(3分)2.(15分)随着生成式AI的普及,某企业打算部署内部使用的智能问答系统,基于大语言模型构建。(1)在部署前,企业需要进行风险评估。请列举大语言模型可能面临的三个安全风险(如数据泄露、幻觉等)。(6分)(2)为了提高模型回答的准确性,企业决定采用RAG(检索增强生成)技术。请简述RAG技术的基本工作流程。(5分)(3)除了RAG,企业还可以采用什么方法来让大模型更好地适应企业内部的专业术语和业务逻辑?(4分)3.(20分)某城市交通管理部门希望利用人工智能技术优化城市交通信号灯控制,缓解拥堵。(1)请设计一个基于强化学习的智能交通信号控制系统的基本框架。需要描述智能体、环境、状态、动作和奖励分别是什么。(10分)(2)在实际应用中,路口的车辆流量数据通常通过摄像头或地感线圈获取。如果摄像头数据存在遮挡或噪声,这对AI模型的训练和预测会有什么影响?应如何处理?(5分)(3)除了信号灯控制,请列举人工智能在智慧交通领域的另外两个应用场景,并说明其作用。(5分)参考答案及详细解析一、单项选择题1.B解析:图灵测试由阿兰·图灵提出,如果一台机器能够与人类展开对话而不被辨别出其机器身份,则称该机器通过了测试。解析:图灵测试由阿兰·图灵提出,如果一台机器能够与人类展开对话而不被辨别出其机器身份,则称该机器通过了测试。2.B解析:人工智能旨在模拟人类的思维活动、感知、推理、学习等智能行为,而不仅仅是计算或存储。解析:人工智能旨在模拟人类的思维活动、感知、推理、学习等智能行为,而不仅仅是计算或存储。3.C解析:监督学习使用有标签的数据进行训练,输入特征对应正确的输出标签。解析:监督学习使用有标签的数据进行训练,输入特征对应正确的输出标签。4.C解析:深度学习基于人工神经网络,特别是具有多个隐藏层的深度神经网络。解析:深度学习基于人工神经网络,特别是具有多个隐藏层的深度神经网络。5.D解析:神经元是神经网络的基本处理单元,负责加权求和及非线性变换。解析:神经元是神经网络的基本处理单元,负责加权求和及非线性变换。6.B解析:AlphaGo结合了深度学习和强化学习(策略网络和价值网络)。解析:AlphaGo结合了深度学习和强化学习(策略网络和价值网络)。7.A解析:CNN通过卷积层提取图像的局部特征,适合处理网格状数据(如图像)。解析:CNN通过卷积层提取图像的局部特征,适合处理网格状数据(如图像)。8.B解析:注意力机制允许模型在处理序列时关注不同位置的信息,是Transformer的核心。解析:注意力机制允许模型在处理序列时关注不同位置的信息,是Transformer的核心。9.C解析:AIGC主要生成创造性内容(文本、图、音、视频),而“规整的Excel表格数据统计”属于传统数据分析任务。解析:AIGC主要生成创造性内容(文本、图、音、视频),而“规整的Excel表格数据统计”属于传统数据分析任务。10.B解析:GPT系列模型采用自回归语言建模,即因果语言建模,预测下一个token。解析:GPT系列模型采用自回归语言建模,即因果语言建模,预测下一个token。11.B解析:算法偏见通常源于训练数据的偏差,导致模型输出不公平。解析:算法偏见通常源于训练数据的偏差,导致模型输出不公平。12.A解析:根据《新一代人工智能发展规划》,我国计划到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平。解析:根据《新一代人工智能发展规划》,我国计划到2025年人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平。13.B解析:过拟合指模型在训练数据上表现过好,学到了噪声,导致泛化能力差。解析:过拟合指模型在训练数据上表现过好,学到了噪声,导致泛化能力差。14.C解析:ReLU函数在正区间导数恒为1,有效缓解了深层网络中的梯度消失问题。解析:ReLU函数在正区间导数恒为1,有效缓解了深层网络中的梯度消失问题。15.C解析:知识图谱由实体(节点)和关系(边)组成,用于描述现实世界中的概念及其关系。解析:知识图谱由实体(节点)和关系(边)组成,用于描述现实世界中的概念及其关系。16.B解析:强化学习的目标是最大化长期累积期望回报。解析:强化学习的目标是最大化长期累积期望回报。17.C解析:ChatGPT基于GPT-3.5或GPT-4架构,属于Decoder-onlyTransformer。解析:ChatGPT基于GPT-3.5或GPT-4架构,属于Decoder-onlyTransformer。18.C解析:数据归一化/标准化将特征缩放到统一范围,有助于模型收敛。解析:数据归一化/标准化将特征缩放到统一范围,有助于模型收敛。19.C解析:强人工智能(AGI)指具备与人类同等智能的机器,目前尚未实现;现有AI均为弱人工智能(专用人工智能)。解析:强人工智能(AGI)指具备与人类同等智能的机器,目前尚未实现;现有AI均为弱人工智能(专用人工智能)。20.B解析:感知层负责收集环境信息,如车辆、行人、车道线等。解析:感知层负责收集环境信息,如车辆、行人、车道线等。21.B解析:该办法规范的是向公众提供生成式人工智能服务的提供者。解析:该办法规范的是向公众提供生成式人工智能服务的提供者。22.B解析:联邦学习核心是“数据不动模型动”,原始数据不出本地。解析:联邦学习核心是“数据不动模型动”,原始数据不出本地。23.B解析:TPR(TruePositiveRate)即召回率,衡量正例被正确预测的比例。解析:TPR(TruePositiveRate)即召回率,衡量正例被正确预测的比例。24.A解析:OCR(OpticalCharacterRecognition)光学字符识别,将图像中的文字转换为文本。解析:OCR(OpticalCharacterRecognition)光学字符识别,将图像中的文字转换为文本。25.B解析:利用CT、MRI影像进行病灶识别是典型的医学影像分析应用。解析:利用CT、MRI影像进行病灶识别是典型的医学影像分析应用。26.B解析:决策树通过信息增益(ID3/C4.5)或基尼系数来选择最佳分裂特征。解析:决策树通过信息增益(ID3/C4.5)或基尼系数来选择最佳分裂特征。27.C解析:少样本提示是在输入中给出少量示例以引导模型。解析:少样本提示是在输入中给出少量示例以引导模型。28.B解析:量子计算利用量子叠加和纠缠,在特定计算任务上具有指数级加速能力。解析:量子计算利用量子叠加和纠缠,在特定计算任务上具有指数级加速能力。29.C解析:数据标注的质量直接影响模型的上限,“GarbageIn,GarbageOut”。解析:数据标注的质量直接影响模型的上限,“GarbageIn,GarbageOut”。30.B解析:AI在数字孪生中用于数据分析、预测仿真和优化决策。解析:AI在数字孪生中用于数据分析、预测仿真和优化决策。二、多项选择题1.ABC解析:算法、算力、数据是人工智能发展的三大支柱。解析:算法、算力、数据是人工智能发展的三大支柱。2.ABCDE解析:五项均为经典的机器学习算法。解析:五项均为经典的机器学习算法。3.BCD解析:深度学习能自动提取特征,通常需要大数据和强算力,且模型参数巨大,但解释性通常弱于传统模型。解析:深度学习能自动提取特征,通常需要大数据和强算力,且模型参数巨大,但解释性通常弱于传统模型。4.ABCD解析:语音识别属于语音处理范畴,不属于计算机视觉。解析:语音识别属于语音处理范畴,不属于计算机视觉。5.ABCDE解析:ASR(语音转文字)通常被视为语音处理,但常与NLP任务紧密衔接,广义上常被包含在语音与语言处理的大范畴内,但在严格NLP定义中,ABCE更典型。但在公需科目考试中,常将ASR归入相关应用或视为语言处理的前置步骤。此处按广义应用场景选ABCDE更符合题意“常见应用场景”。(注:若严格按NLP定义,D属于语音识别,但通常公需科目考察综合应用)。修正:严格NLP不包括ASR,但ASR是NLP系统的输入端,常一起考。为了严谨,若题目仅限NLP核心任务,应选ABCE。但考虑到“应用场景”,ASR是AI应用,故选ABCDE。解析:ASR(语音转文字)通常被视为语音处理,但常与NLP任务紧密衔接,广义上常被包含在语音与语言处理的大范畴内,但在严格NLP定义中,ABCE更典型。但在公需科目考试中,常将ASR归入相关应用或视为语言处理的前置步骤。此处按广义应用场景选ABCDE更符合题意“常见应用场景”。(注:若严格按NLP定义,D属于语音识别,但通常公需科目考察综合应用)。修正:严格NLP不包括ASR,但ASR是NLP系统的输入端,常一起考。为了严谨,若题目仅限NLP核心任务,应选ABCE。但考虑到“应用场景”,ASR是AI应用,故选ABCDE。6.AB解析:GAN由生成器和判别器组成。解析:GAN由生成器和判别器组成。7.ABCDE解析:五项均为当前AI伦理面临的主要挑战。解析:五项均为当前AI伦理面临的主要挑战。8.ABCE解析:LLM具有强大理解能力和涌现能力,存在幻觉,成本高。D错误,特定领域任务通常需要微调或提示工程。解析:LLM具有强大理解能力和涌现能力,存在幻觉,成本高。D错误,特定领域任务通常需要微调或提示工程。9.ABCDE解析:智能体、环境、状态、动作、奖励是强化学习的五个核心要素。解析:智能体、环境、状态、动作、奖励是强化学习的五个核心要素。10.ABCDE解析:AI在智慧城市中涵盖交通、安防、能源、环保、服务等多方面。解析:AI在智慧城市中涵盖交通、安防、能源、环保、服务等多方面。11.ABCDE解析:五项均为常见的激活函数。解析:五项均为常见的激活函数。12.ABCDE解析:均为常用的评估指标,MSE常用于回归,其他用于分类。解析:均为常用的评估指标,MSE常用于回归,其他用于分类。13.ABCDE解析:均属于数据清洗的流程。解析:均属于数据清洗的流程。14.ABCDE解析:AI在金融领域有广泛应用。解析:AI在金融领域有广泛应用。15.ABCDE解析:理论、数据、算力、安全、人才均为制约因素。解析:理论、数据、算力、安全、人才均为制约因素。三、判断题1.×(强人工智能是目标,但目前尚未实现,且并非所有研究都旨在完全替代人类)。2.×(监督学习必须依赖有标签的数据)。3.√(深度通常指隐藏层的层数)。4.√(梯度下降是基础优化算法)。5.×(CNN主要用于图像等网格数据,RNN用于序列数据)。6.√(RNN具有记忆功能,适合序列)。7.×(Transformer抛弃了RNN的递归结构,基于注意力机制)。8.×(并非所有模型都是黑箱,如决策树是白箱,且可解释AI正在发展)。9.√(增加数据、正则化、Dropout是缓解过拟合的标准手段)。10.×(欠拟合意味着模型太简单,无法捕捉数据规律)。11.×(机器学习是人工智能的子集)。12.√(聚类是无监督学习,无标签)。13.√(AlphaFold解决了蛋白质结构预测难题)。14.×(伦理和隐私至关重要,技术不能脱离伦理约束)。15.×(由于噪声和模型偏差,无法达到100%准确率,且追求100%往往导致过拟合)。16.√(迁移学习可以复用知识,提高效率)。17.√(物联网是AI数据的重要来源)。18.×(目前的AI只是模拟,不具备真实情感和自我意识)。19.√(对抗样本揭示了模型的脆弱性)。20.√(多模态学习处理多种模态数据)。四、填空题1.深度学习2.损失3.K-均值(或聚类)4.词嵌入(或向量化)5.AlphaGo6.强化7.长短期记忆网络(或LSTM)8.批大小(BatchSize)9.生成式10.缩放定律五、简答题1.答:监督学习:使用有标签的数据进行训练。输入数据都有对应的正确输出标签,模型通过学习输入与输出的映射关系进行预测。例如:垃圾邮件分类。无监督学习:使用无标签的数据进行训练。模型必须自己在数据中寻找结构、模式或规律。例如:客户群体聚类。半监督学习:介于两者之间,使用少量的有标签数据和大量的无标签数据进行训练。旨在利用有标签数据指导对无标签数据的挖掘,降低标注成本。2.答:卷积神经网络(CNN):一种专门处理具有类似网格结构数据(如图像)的深度神经网络。它通过卷积层提取局部特征,通过池化层降低维度,通过全连接层进行输出。主要特点是局部感知、权值共享和下采样。应用:1.图像分类:识别图片中的主要物体(如识别猫或狗)。2.目标检测:在图片中定位并识别多个物体(如自动驾驶中的行人车辆检测)。3.答:含义:涌现能力是指当模型规模(参数量、数据量、计算量)达到一定临界值时,突然出现的小规模模型所不具备的新能力。这些能力并非通过直接训练习得,而是模型复杂度和通用性提升后的自然结果。举例:1.上下文学习:模型无需更新权重,仅通过提示词中的几个例子就能学会新任务。2.思维链推理:模型能够通过分步骤推理来解决复杂的数学或逻辑问题,而不是直接给出答案。4.答:原因:1.量纲统一:不同特征的单位或量纲不同(如身高1.8米,体重70kg),数值范围差异大,会导致数值大的特征主导距离计算,影响模型收敛。2.加速收敛:标准化可以使损失函数的等高线更圆,梯度下降更快找到最优解,提高训练速度。常用方法:1.Min-Max标准化:将数据线性映射到[0,1]区间。公式:=。2.Z-Score标准化:将数据转化为均值为0,方差为1的分布。公式:=。六、案例分析与应用题1.答:(1)推荐算法及原理:协同过滤:基于“物以类聚,人以群分”的思想。通过分析用户历史行为(如购买、点击),发现用户之间或物品之间的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年宁德市蕉城区临海工业园区开发有限公司招聘项目工程部经理1人考试参考题库及答案解析
- 2026年宁德市统计局普查中心招聘工作人员1人考试备考题库及答案解析
- 2026天津市安定医院招聘第四批派遣制11人考试备考试题及答案解析
- 儿童救护车模型担架长度技术指标
- 行政办公用品采购计划模板节约成本
- (2025年)临床心电图试题和答案解析
- 2026年数据备份时间及方式确认函8篇范文
- 客户信息管理标准化手册
- 产品市场推广手册设计指引
- 企业目标规划与执行方案制定手册
- 2026年1级乐理考试试题及答案
- 2020年HJ1237全国统考培训试题及官方发布答案
- 2025年上海市公安机关辅警招聘(面试)复习题及答案
- 2026年云南省玉溪市学业水平模拟考试九年级物理试题卷
- 2026年及未来5年市场数据中国动物模型行业发展运行现状及投资潜力预测报告
- 电网检修工程预算定额(2020年版)全5册excel版
- 2026年化验考核练习试题附答案详解【突破训练】
- 儿童自闭症康复机构运营方案
- 2025年新疆克拉玛依市初中学业水平模拟测试道德与法治、历史试卷卷-初中道德与法治
- 2026年中考英语仿真模拟试卷 3套(含答案解析)
- GB/T 35609-2025绿色产品评价防水与密封材料
评论
0/150
提交评论