AI行业术语词典_第1页
AI行业术语词典_第2页
AI行业术语词典_第3页
AI行业术语词典_第4页
AI行业术语词典_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

AI行业术语词典前言本词典系统梳理了人工智能领域从基础理论到前沿应用的核心术语,涵盖2026年最新技术进展与行业实践。旨在为科研人员、工程师、产品经理、投资者及相关从业者提供一部专业、准确、实用的参考工具书。本词典坚持"定义精准、原理清晰、应用具体、关联紧密"的编写原则,每个术语均包含英文全称、标准译名、权威定义、核心要点、典型应用及相关术语六个维度,确保读者能够全面理解概念内涵与外延。一、基础概念与核心理论1.1人工智能(ArtificialIntelligence,AI)定义:研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门技术科学。其核心目标是使机器能够执行通常需要人类智能才能完成的任务。

核心要点:发展阶段:符号主义(1950s-1980s)→连接主义(1980s-2010s)→统计学习与深度学习(2010s至今)核心能力:感知、学习、推理、决策、创造分类标准:按能力范围分为弱人工智能(ANI)、强人工智能(AGI)、超人工智能(ASI)

典型应用:智能语音助手、图像识别、自动驾驶、智能推荐

相关术语:通用人工智能、弱人工智能、图灵测试1.2通用人工智能(ArtificialGeneralIntelligence,AGI)定义:具备与人类同等或超越人类水平的通用智能,能够在任何智力任务上表现出与人类相当或更好的能力,并且可以跨领域自主学习和解决问题。

核心要点:与当前弱AI的本质区别:具备通用迁移能力、自主意识、长期规划能力核心特征:多任务泛化、元学习能力、常识推理、自我改进发展现状:尚未实现,是AI研究的终极目标

典型应用:理论上可完成人类所有智力活动

相关术语:弱人工智能、超人工智能、智能涌现1.3弱人工智能(ArtificialNarrowIntelligence,ANI)定义:专注于解决特定领域问题的人工智能系统,不具备通用智能和自主意识。

核心要点:是当前所有商用AI系统的共同特征只能在预先设定的任务范围内表现出智能不具备自我意识、情感和真正的理解能力

典型应用:人脸识别系统、语音转文字工具、下棋AI、推荐算法

相关术语:通用人工智能、专用人工智能1.4图灵测试(TuringTest)定义:由艾伦·图灵于1950年提出的一种判断机器是否具有智能的测试方法。测试者通过文字对话与被测试者(一个人和一台机器)交流,如果测试者无法区分哪个是人类哪个是机器,则认为该机器通过了图灵测试。

核心要点:本质是测试机器的语言理解和生成能力现代大语言模型已能在一定程度上通过图灵测试存在局限性:无法测试机器的真正理解能力和意识

典型应用:评估对话AI的智能水平

相关术语:中文房间论证、智能判定标准1.5智能涌现(EmergentIntelligence)定义:当AI模型的规模(参数数量、训练数据量、计算量)达到一定阈值时,突然出现的、在小规模模型中不存在的、不可预测的高级能力。

核心要点:是大语言模型最显著的特征之一涌现能力包括:复杂推理、上下文理解、少样本学习、多语言能力遵循"缩放定律"(ScalingLaw):能力随模型规模呈指数级增长

典型应用:GPT系列模型的代码生成、数学推理、创意写作能力

相关术语:缩放定律、大语言模型、能力边界二、机器学习2.1机器学习(MachineLearning,ML)定义:人工智能的一个分支,研究如何使计算机系统通过经验自动改进性能,而无需显式编程。

核心要点:核心思想:从数据中学习规律,并用规律预测未知数据三大要素:数据、算法、算力与传统编程的区别:传统编程是"规则+数据→结果",机器学习是"数据+结果→规则"

典型应用:垃圾邮件过滤、房价预测、用户画像、欺诈检测

相关术语:监督学习、无监督学习、强化学习2.2监督学习(SupervisedLearning)定义:机器学习的一种范式,使用带有标签的训练数据来训练模型,使模型能够学习输入到输出的映射关系。

核心要点:训练数据包含输入特征和对应的输出标签目标是让模型能够对新的、未见过的输入做出准确的预测分为分类任务(预测离散标签)和回归任务(预测连续值)

典型应用:图像分类(标签为"猫"、"狗"等)、房价预测(标签为价格)、疾病诊断(标签为"患病"、"健康")

相关术语:分类、回归、训练集、测试集2.3无监督学习(UnsupervisedLearning)定义:机器学习的一种范式,使用不带标签的训练数据来训练模型,使模型能够自动发现数据中的隐藏模式和结构。

核心要点:训练数据只有输入特征,没有对应的输出标签目标是发现数据中的相似性、差异性、聚类结构或潜在特征主要方法包括聚类、降维、异常检测

典型应用:客户分群、图像压缩、异常交易检测、主题建模

相关术语:聚类、降维、K-means、主成分分析2.4半监督学习(Semi-SupervisedLearning)定义:结合监督学习和无监督学习的一种机器学习范式,使用少量带标签数据和大量无标签数据来训练模型。

核心要点:解决了带标签数据获取成本高的问题利用无标签数据来辅助学习数据分布,提高模型泛化能力适用于标注数据稀缺的场景

典型应用:医疗影像诊断(标注数据少)、自然语言处理(大规模无标注文本)

相关术语:监督学习、无监督学习、自监督学习2.5自监督学习(Self-SupervisedLearning,SSL)定义:无监督学习的一个子类,通过从数据本身自动生成标签来训练模型,无需人工标注。

核心要点:核心思想:利用数据的一部分来预测另一部分是当前大模型预训练的主流方法能够从海量无标注数据中学习通用特征表示

典型应用:BERT的掩码语言模型、GPT的自回归语言模型、对比学习

相关术语:预训练、掩码语言模型、对比学习2.6强化学习(ReinforcementLearning,RL)定义:机器学习的一种范式,通过智能体与环境的交互来学习最优行为策略,智能体通过尝试不同的动作获得奖励或惩罚,从而学会在特定环境下做出最优决策。

核心要点:核心要素:智能体、环境、状态、动作、奖励目标是最大化长期累积奖励适用于序列决策问题

典型应用:AlphaGo、自动驾驶、机器人控制、游戏AI

相关术语:智能体、环境、奖励函数、马尔可夫决策过程三、深度学习3.1深度学习(DeepLearning,DL)定义:机器学习的一个分支,基于深度神经网络的学习方法,通过多层非线性变换来学习数据的高级抽象特征。

核心要点:核心是深度神经网络,通常包含多个隐藏层能够自动从原始数据中学习特征,无需人工特征工程是当前AI技术突破的主要驱动力

典型应用:图像识别、语音识别、自然语言处理、自动驾驶

相关术语:神经网络、卷积神经网络、循环神经网络、Transformer3.2神经网络(NeuralNetwork,NN)定义:模仿人脑神经元连接结构的计算模型,由大量相互连接的神经元组成,通过调整神经元之间的连接权重来学习数据中的模式。

核心要点:基本组成:输入层、隐藏层、输出层每个神经元接收输入,进行加权求和后通过激活函数输出学习过程就是不断调整权重以最小化损失函数的过程

典型应用:手写数字识别、简单分类任务

相关术语:神经元、激活函数、损失函数、反向传播3.3卷积神经网络(ConvolutionalNeuralNetwork,CNN)定义:专门用于处理网格结构数据(如图像、视频)的深度神经网络,通过卷积操作来提取数据的局部特征。

核心要点:核心层:卷积层、池化层、全连接层关键特性:局部感受野、权值共享、平移不变性能够有效提取图像的边缘、纹理、形状等特征

典型应用:图像分类、目标检测、图像分割、人脸识别

相关术语:卷积、池化、感受野、ResNet3.4循环神经网络(RecurrentNeuralNetwork,RNN)定义:专门用于处理序列数据(如文本、语音、时间序列)的深度神经网络,通过循环连接来处理序列的上下文信息。

核心要点:具有记忆功能,能够保存之前的信息存在梯度消失和梯度爆炸问题,难以处理长序列改进版本包括LSTM和GRU

典型应用:机器翻译、语音识别、文本生成、时间序列预测

相关术语:LSTM、GRU、序列建模、梯度消失3.5Transformer定义:2017年提出的一种基于自注意力机制的深度学习架构,彻底改变了自然语言处理领域,现已成为大语言模型的基础架构。

核心要点:核心创新:自注意力机制(Self-Attention),能够并行处理序列数据并捕捉长距离依赖关系结构组成:编码器(Encoder)和解码器(Decoder)优势:并行计算能力强、长序列处理能力好、可扩展性高

典型应用:BERT(仅编码器)、GPT(仅解码器)、T5(编码器-解码器)、所有现代大语言模型

相关术语:自注意力机制、多头注意力、位置编码、大语言模型3.6激活函数(ActivationFunction)定义:神经网络中引入非线性变换的函数,使神经网络能够学习复杂的非线性关系。

核心要点:没有激活函数的神经网络只是一个线性模型,无法处理复杂问题常用激活函数:Sigmoid、Tanh、ReLU、LeakyReLU、GELUGELU是当前大语言模型中最常用的激活函数

典型应用:所有神经网络的隐藏层

相关术语:神经网络、非线性变换、GELU、ReLU3.7反向传播(Backpropagation)定义:训练神经网络的核心算法,通过计算损失函数对各层参数的梯度,然后使用梯度下降法更新参数,以最小化损失函数。

核心要点:分为两个阶段:前向传播(计算输出和损失)和反向传播(计算梯度并更新参数)基于链式法则计算梯度是所有深度学习模型训练的基础

典型应用:所有神经网络的训练过程

相关术语:梯度下降、损失函数、链式法则3.8梯度下降(GradientDescent)定义:一种优化算法,通过沿着损失函数的负梯度方向不断更新参数,以找到损失函数的最小值。

核心要点:核心思想:梯度是函数上升最快的方向,负梯度就是下降最快的方向常用变体:随机梯度下降(SGD)、小批量梯度下降(Mini-batchSGD)、AdamAdam是当前最常用的优化器

典型应用:所有机器学习模型的参数优化

相关术语:反向传播、损失函数、Adam、学习率四、自然语言处理4.1自然语言处理(NaturalLanguageProcessing,NLP)定义:人工智能的一个分支,研究如何使计算机能够理解、生成和处理人类自然语言。

核心要点:连接计算机科学和语言学的交叉学科核心任务包括:语言理解、语言生成、语言翻译是人机交互的关键技术

典型应用:语音助手、机器翻译、文本摘要、情感分析、聊天机器人

相关术语:自然语言理解、自然语言生成、大语言模型4.2自然语言理解(NaturalLanguageUnderstanding,NLU)定义:自然语言处理的子领域,研究如何使计算机理解人类语言的含义。

核心要点:目标是将自然语言转换为计算机可理解的结构化表示核心任务包括:分词、词性标注、命名实体识别、句法分析、语义分析是所有语言交互应用的基础

典型应用:智能客服意图识别、搜索引擎理解用户查询、语音助手指令解析

相关术语:自然语言处理、自然语言生成、命名实体识别4.3自然语言生成(NaturalLanguageGeneration,NLG)定义:自然语言处理的子领域,研究如何使计算机生成符合人类语言习惯的自然语言文本。

核心要点:目标是将结构化数据或计算机内部表示转换为自然语言核心任务包括:文本摘要、机器翻译、对话生成、创意写作大语言模型的出现极大地提升了NLG的能力

典型应用:新闻写作、报告生成、邮件自动回复、小说创作

相关术语:自然语言处理、自然语言理解、大语言模型4.4分词(WordSegmentation)定义:将连续的文本序列切分成有意义的词语的过程。

核心要点:对于中文等没有明显词边界的语言尤为重要是自然语言处理的基础步骤常用方法:基于规则的方法、基于统计的方法、基于深度学习的方法

典型应用:所有中文自然语言处理任务的预处理步骤

相关术语:自然语言处理、词性标注、BPE4.5命名实体识别(NamedEntityRecognition,NER)定义:识别文本中具有特定意义的实体,如人名、地名、组织名、时间、日期、数字等。

核心要点:是信息抽取的关键任务通常作为序列标注任务来处理应用于知识图谱构建、信息检索、问答系统等领域

典型应用:从新闻中提取人物和事件、从病历中提取疾病和药物名称

相关术语:自然语言理解、信息抽取、知识图谱4.6情感分析(SentimentAnalysis)定义:识别和提取文本中表达的情感倾向和主观信息的过程。

核心要点:情感倾向通常分为正面、负面、中性三类也可以进行更细粒度的情感分类,如喜怒哀乐应用于舆情分析、用户反馈分析、产品评价分析等领域

典型应用:电商平台商品评价分析、社交媒体舆情监测、客户满意度分析

相关术语:自然语言理解、文本分类、舆情分析4.7机器翻译(MachineTranslation,MT)定义:利用计算机将一种自然语言自动翻译成另一种自然语言的技术。

核心要点:发展阶段:基于规则的机器翻译→基于统计的机器翻译→基于神经网络的机器翻译当前主流是基于Transformer的神经机器翻译大语言模型的出现进一步提升了翻译质量

典型应用:在线翻译工具、跨国企业文档翻译、实时语音翻译

相关术语:自然语言处理、Transformer、大语言模型4.8字节对编码(BytePairEncoding,BPE)定义:一种数据压缩算法,在自然语言处理中被广泛用作分词方法,能够有效地处理未登录词问题。

核心要点:基本思想:将频繁出现的字节对合并成一个新的符号是当前大语言模型中最常用的分词方法能够在词级别和字符级别之间取得平衡

典型应用:GPT、BERT等所有现代大语言模型的分词器

相关术语:分词、Token、大语言模型五、计算机视觉5.1计算机视觉(ComputerVision,CV)定义:人工智能的一个分支,研究如何使计算机从图像或视频中获取高级理解。

核心要点:目标是使计算机能够像人类一样"看"懂图像和视频核心任务包括:图像分类、目标检测、图像分割、人脸识别、行为识别是自动驾驶、机器人、安防等领域的关键技术

典型应用:人脸识别门禁、自动驾驶环境感知、医学影像诊断、视频监控

相关术语:卷积神经网络、图像分类、目标检测、图像分割5.2图像分类(ImageClassification)定义:将图像分配到预定义的类别中的任务。

核心要点:是计算机视觉最基础的任务输入是一张图像,输出是该图像属于各个类别的概率常用数据集:ImageNet、CIFAR-10、CIFAR-100

典型应用:猫狗识别、植物识别、垃圾分拣、医学影像初步筛查

相关术语:计算机视觉、卷积神经网络、ImageNet5.3目标检测(ObjectDetection)定义:在图像中定位并识别多个目标的任务,不仅要识别出目标的类别,还要确定目标的位置和大小。

核心要点:输出是一组边界框(BoundingBox)和对应的类别标签分为两阶段检测(如FasterR-CNN)和一阶段检测(如YOLO、SSD)YOLO系列是当前最流行的实时目标检测算法

典型应用:自动驾驶车辆和行人检测、安防监控异常行为检测、工业缺陷检测

相关术语:计算机视觉、边界框、YOLO、FasterR-CNN5.4图像分割(ImageSegmentation)定义:将图像分割成多个具有特定语义的区域的任务,每个像素都被分配一个类别标签。

核心要点:比目标检测更精细,能够精确到像素级别分为语义分割(区分不同类别)和实例分割(区分同一类别的不同个体)常用模型:U-Net、MaskR-CNN、SegFormer

典型应用:医学影像病灶分割、自动驾驶道路分割、人像抠图、卫星图像分析

相关术语:计算机视觉、语义分割、实例分割、U-Net5.5人脸识别(FaceRecognition)定义:基于人脸特征信息进行身份识别的技术。

核心要点:分为人脸检测(定位人脸位置)和人脸识别(识别人脸身份)两个步骤核心是提取人脸的特征向量并进行比对是应用最广泛的生物识别技术之一

典型应用:手机解锁、门禁系统、身份验证、安防监控

相关术语:计算机视觉、生物识别、特征提取5.6生成对抗网络(GenerativeAdversarialNetwork,GAN)定义:由生成器和判别器两个神经网络组成的生成模型,通过两者之间的对抗训练来生成逼真的数据。

核心要点:生成器的目标是生成尽可能逼真的假数据判别器的目标是区分真实数据和生成的假数据两者相互对抗、共同提升,最终生成器能够生成以假乱真的数据

典型应用:图像生成、人脸生成、图像风格转换、超分辨率重建

相关术语:生成式AI、扩散模型、图像生成5.7扩散模型(DiffusionModel)定义:一种基于概率的生成模型,通过逐步向数据中添加噪声,然后学习如何逆转这个噪声过程来生成数据。

核心要点:是当前图像生成领域的主流技术相比GAN,训练更稳定,生成质量更高典型模型:StableDiffusion、DALL-E3、Midjourney

典型应用:AI绘画、图像编辑、视频生成、3D模型生成

相关术语:生成式AI、生成对抗网络、StableDiffusion5.8视觉Transformer(VisionTransformer,ViT)定义:将Transformer架构应用于计算机视觉任务的模型,将图像分割成多个补丁(Patch),然后将这些补丁序列输入到Transformer中进行处理。

核心要点:打破了卷积神经网络在计算机视觉领域的垄断能够更好地捕捉图像中的长距离依赖关系随着模型规模的增大,性能提升明显

典型应用:图像分类、目标检测、图像分割、多模态模型

相关术语:Transformer、计算机视觉、多模态大模型六、大语言模型与生成式AI6.1生成式AI(GenerativeAI,GenAI)定义:能够生成新的内容(如文本、图像、音频、视频、代码等)的人工智能技术。

核心要点:与判别式AI的区别:判别式AI用于分类和预测,生成式AI用于创造新内容核心技术:大语言模型、扩散模型、生成对抗网络是当前AI发展的主流方向

典型应用:AI写作、AI绘画、AI音乐、AI视频、代码生成

相关术语:大语言模型、扩散模型、生成对抗网络、AIGC6.2人工智能生成内容(ArtificialIntelligenceGeneratedContent,AIGC)定义:利用生成式AI技术自动生成的内容,包括文本、图像、音频、视频、代码等各种形式。

核心要点:与PGC(专业生成内容)、UGC(用户生成内容)并称为三大内容生产方式具有生产效率高、成本低、创意丰富等优势正在深刻改变内容创作行业

典型应用:AI生成的新闻文章、AI绘画作品、AI音乐、AI短视频

相关术语:生成式AI、大语言模型、扩散模型6.3大语言模型(LargeLanguageModel,LLM)定义:基于海量文本数据训练的、具有数十亿甚至上万亿参数的大型语言模型,能够理解和生成自然语言。

核心要点:基于Transformer架构通过自监督学习进行预训练具有智能涌现能力,能够完成各种复杂的语言任务是当前生成式AI的核心技术

典型应用:ChatGPT、文心一言、通义千问、Claude、Gemini

相关术语:Transformer、预训练、智能涌现、生成式AI6.4基础模型(FoundationModel,FM)定义:经过大规模无监督数据预训练的通用模型,可以通过微调或提示工程适配各种下游任务。

核心要点:具有通用性和可迁移性是各种AI应用的基础包括大语言模型、多模态大模型等

典型应用:GPT-4、Gemini、文心一言、通义千问

相关术语:大语言模型、预训练、微调、多模态大模型6.5小语言模型(SmallLanguageModel,SLM)定义:参数规模较小(通常在数十亿参数以下)的语言模型,具有体积小、推理速度快、成本低等优势。

核心要点:可以在边缘设备上运行适用于特定领域的任务通常通过蒸馏大语言模型的知识来获得

典型应用:手机端语音助手、嵌入式设备、边缘计算场景

相关术语:大语言模型、模型蒸馏、边缘部署6.6预训练(Pre-training)定义:在大规模无标注数据上对模型进行初步训练,使模型学习到通用的语言知识和特征表示。

核心要点:是大语言模型训练的第一阶段通常使用自监督学习方法预训练好的模型可以通过微调适配各种下游任务

典型应用:GPT的自回归预训练、BERT的掩码语言模型预训练

相关术语:大语言模型、自监督学习、微调6.7微调(Fine-tuning)定义:在预训练模型的基础上,使用特定任务的标注数据对模型进行进一步训练,使模型更好地适应特定任务。

核心要点:分为全参数微调和参数高效微调能够显著提升模型在特定任务上的性能是将通用大模型应用于特定领域的主要方法

典型应用:医疗大模型、法律大模型、客服大模型

相关术语:预训练、大语言模型、参数高效微调、LoRA6.8参数高效微调(Parameter-EfficientFine-Tuning,PEFT)定义:只微调模型的一小部分参数,而不是全部参数的微调方法,能够显著降低微调的计算成本和存储成本。

核心要点:常用方法:LoRA、Adapter、PrefixTuningLoRA是当前最流行的参数高效微调方法效果接近全参数微调,但成本低得多

典型应用:大语言模型的领域适配、个性化定制

相关术语:微调、大语言模型、LoRA6.9低秩适应(Low-RankAdaptation,LoRA)定义:一种参数高效微调方法,通过在Transformer的注意力层中插入低秩矩阵来学习任务特定的参数,而冻结原始模型的所有参数。

核心要点:只训练低秩矩阵,参数量非常小训练速度快,内存占用低可以轻松地在不同任务之间切换

典型应用:大语言模型的快速微调、个性化定制、领域适配

相关术语:参数高效微调、大语言模型、Transformer6.10提示工程(PromptEngineering)定义:通过设计和优化输入提示词,来引导大语言模型生成预期输出的技术。

核心要点:是使用大语言模型的核心技能不需要修改模型参数,只需要调整输入提示常用技巧:明确指令、提供示例、思维链提示

典型应用:引导大语言模型写代码、写文案、解决数学问题

相关术语:大语言模型、提示词、思维链、少样本学习6.11提示词(Prompt)定义:用户输入给大语言模型的指令或问题,用于引导模型生成相应的输出。

核心要点:是人与大语言模型交互的主要方式提示词的质量直接影响模型输出的质量一个好的提示词应该清晰、具体、包含必要的上下文

典型应用:所有与大语言模型的交互

相关术语:提示工程、系统提示词、思维链6.12系统提示词(SystemPrompt)定义:在对话开始前设置的、用于定义大语言模型角色、行为准则和输出格式的提示词。

核心要点:对整个对话过程都有影响可以用于定制模型的身份、语气、能力范围是构建AI应用的重要手段

典型应用:将模型设定为客服、医生、老师、编程助手等角色

相关术语:提示词、提示工程、大语言模型6.13思维链(ChainofThought,CoT)定义:一种提示技术,通过引导大语言模型一步步进行推理,来提高模型解决复杂问题的能力。

核心要点:基本思想是"让模型像人一样思考"通常在提示词中加入"让我们一步步思考"或提供推理示例能够显著提升模型的数学推理、逻辑推理能力

典型应用:解决数学问题、逻辑推理题、复杂规划问题

相关术语:提示工程、大语言模型、推理能力6.14少样本学习(Few-ShotLearning)定义:大语言模型只需要少量示例就能学习并完成新任务的能力。

核心要点:是大语言模型的涌现能力之一不需要对模型进行微调通常在提示词中提供几个输入输出示例

典型应用:文本分类、命名实体识别、翻译任务

相关术语:大语言模型、提示工程、零样本学习6.15零样本学习(Zero-ShotLearning)定义:大语言模型不需要任何示例就能完成从未见过的任务的能力。

核心要点:是大语言模型最强大的能力之一完全依赖于模型在预训练阶段学到的通用知识体现了模型的泛化能力

典型应用:各种通用语言任务,如翻译、摘要、问答

相关术语:大语言模型、提示工程、少样本学习6.16幻觉(Hallucination)定义:大语言模型生成的内容看似合理但实际上是虚假的、不准确的或不存在的现象。

核心要点:是大语言模型最主要的问题之一产生原因:训练数据中的错误、模型的概率性本质、知识边界模糊解决方法:RAG、事实核查、更好的训练数据

典型应用:模型编造不存在的事实、引用不存在的文献、生成错误的代码

相关术语:大语言模型、检索增强生成、事实核查6.17检索增强生成(Retrieval-AugmentedGeneration,RAG)定义:一种结合信息检索和生成模型的技术,在生成回答之前先从外部知识库中检索相关信息,然后基于检索到的信息生成回答。

核心要点:能够有效减少大语言模型的幻觉问题可以更新模型的知识,解决知识过时问题不需要对模型进行微调,部署简单是当前企业级AI应用的主流技术

典型应用:企业知识库问答、文档分析、客服系统、法律助手

相关术语:大语言模型、幻觉、向量数据库、嵌入6.18嵌入(Embedding)定义:将文本、图像等非结构化数据转换为低维稠密向量的过程,这些向量能够捕捉数据的语义信息。

核心要点:语义相似的数据在向量空间中距离较近是RAG、语义搜索、推荐系统等技术的基础通常由专门的嵌入模型生成

典型应用:语义搜索、文档聚类、RAG、推荐系统

相关术语:检索增强生成、向量数据库、语义搜索6.19向量数据库(VectorDatabase)定义:专门用于存储和检索向量数据的数据库,支持高效的相似度搜索。

核心要点:是RAG系统的核心组件能够快速从海量向量中找到与查询向量最相似的向量常用数据库:Pinecone、Chroma、Milvus、FAISS

典型应用:RAG系统、语义搜索、推荐系统、图像检索

相关术语:嵌入、检索增强生成、语义搜索6.20混合专家模型(MixtureofExperts,MoE)定义:一种大模型架构,将模型分为多个专家子模型,每个专家负责处理特定类型的输入,同时有一个门控网络来决定将输入分配给哪些专家。

核心要点:能够在不显著增加计算量的情况下扩大模型规模每个专家只需要处理一部分输入,提高了训练和推理效率是当前大模型发展的重要方向

典型应用:GPT-4、Gemini、DeepSeek-V2、Mixtral

相关术语:大语言模型、模型架构、缩放定律6.21上下文窗口(ContextWindow)定义:大语言模型能够处理的最大输入长度,通常以Token为单位。

核心要点:决定了模型能够"记住"多少上下文信息上下文窗口越大,模型能够处理的文本越长大上下文窗口是当前大模型的发展趋势之一

典型应用:处理长文档、长对话、书籍分析

相关术语:大语言模型、Token、长上下文理解6.22Token定义:大语言模型处理文本的基本单位,可以是一个完整的单词、一个单词的一部分、一个标点符号或一个字符。

核心要点:1个Token大约相当于0.75个英文单词或1.3个中文汉字模型的输入和输出都以Token为单位进行计算大语言模型的价格通常按Token计费

典型应用:所有大语言模型的输入输出处理

相关术语:大语言模型、字节对编码、上下文窗口6.23对齐(Alignment)定义:使大语言模型的行为与人类的价值观、意图和期望保持一致的过程。

核心要点:是大语言模型安全可控的关键主要方法:RLHF、RLAIF、宪法AI目标是让模型生成有用、无害、诚实的内容

典型应用:防止模型生成有害内容、使模型更好地理解用户意图

相关术语:大语言模型、基于人类反馈的强化学习、AI安全6.24基于人类反馈的强化学习(ReinforcementLearningfromHumanFeedback,RLHF)定义:一种训练大语言模型的方法,通过人类对模型输出的反馈来训练奖励模型,然后使用强化学习算法根据奖励模型来优化大语言模型。

核心要点:是当前大语言模型对齐的主流方法分为三个阶段:监督微调、训练奖励模型、强化学习优化能够显著提升模型的有用性和安全性

典型应用:ChatGPT、Claude、文心一言等主流大语言模型

相关术语:对齐、强化学习、大语言模型6.25缩放定律(ScalingLaw)定义:描述大语言模型的性能与模型规模(参数数量)、训练数据量、计算量之间关系的经验定律。

核心要点:模型性能随这三个因素的增加呈幂律增长只要资源足够,增加模型规模就能持续提升性能是大模型发展的重要理论基础

典型应用:指导大模型的训练和研发

相关术语:大语言模型、智能涌现、混合专家模型七、强化学习7.1强化学习(ReinforcementLearning,RL)定义:机器学习的一种范式,通过智能体与环境的交互来学习最优行为策略,智能体通过尝试不同的动作获得奖励或惩罚,从而学会在特定环境下做出最优决策。

核心要点:核心要素:智能体、环境、状态、动作、奖励目标是最大化长期累积奖励适用于序列决策问题

典型应用:AlphaGo、自动驾驶、机器人控制、游戏AI

相关术语:智能体、环境、奖励函数、马尔可夫决策过程7.2智能体(Agent)定义:强化学习中的决策主体,能够感知环境状态并执行动作来改变环境。

核心要点:是强化学习的核心具有感知能力、决策能力和学习能力目标是最大化长期累积奖励

典型应用:游戏中的AI角色、自动驾驶汽车、机器人

相关术语:强化学习、环境、动作、奖励7.3AI智能体(AIAgent)定义:基于大语言模型的智能体,能够自主感知环境、制定计划、执行动作、调用工具并与其他智能体协作,完成复杂的任务。

核心要点:核心组件:大语言模型(大脑)、记忆模块、规划模块、工具调用模块具有自主性、反应性和社会性是当前AI发展的前沿方向

典型应用:个人助理、自动编程助手、科研助手、多智能体协作系统

相关术语:大语言模型、工具调用、多智能体系统、规划7.4多智能体系统(Multi-AgentSystem,MAS)定义:由多个相互交互的智能体组成的系统,这些智能体可以协作或竞争来完成复杂的任务。

核心要点:每个智能体都有自己的目标和能力智能体之间可以通过通信来交换信息能够完成单个智能体无法完成的复杂任务

典型应用:团队协作游戏AI、分布式机器人系统、供应链管理、交通调度

相关术语:AI智能体、协作、竞争7.5环境(Environment)定义:强化学习中智能体所处的外部世界,智能体可以通过动作来改变环境的状态,并从环境中获得奖励。

核心要点:可以是真实世界,也可以是模拟环境具有状态转移函数和奖励函数可以是完全可观测的,也可以是部分可观测的

典型应用:围棋棋盘、游戏世界、自动驾驶模拟环境、机器人工作环境

相关术语:强化学习、智能体、状态、奖励7.6状态(State)定义:环境在某一时刻的特征表示,包含了智能体做出决策所需的所有信息。

核心要点:完全可观测环境:智能体能够观察到环境的完整状态部分可观测环境:智能体只能观察到环境的部分状态状态转移是概率性的

典型应用:围棋棋盘的局面、游戏中的角色状态、自动驾驶汽车周围的环境

相关术语:强化学习、环境、观察、动作7.7动作(Action)定义:智能体在某一状态下可以执行的操作。

核心要点:动作空间是智能体所有可能动作的集合可以是离散的,也可以是连续的动作会改变环境的状态

典型应用:围棋中的落子、游戏中的移动和攻击、自动驾驶汽车的加速和转向

相关术语:强化学习、智能体、状态、奖励7.8奖励(Reward)定义:环境对智能体动作的反馈信号,用于评价动作的好坏。

核心要点:是强化学习的监督信号智能体的目标是最大化长期累积奖励奖励函数的设计是强化学习的关键

典型应用:围棋中获胜获得正奖励、失败获得负奖励、游戏中得分获得正奖励

相关术语:强化学习、环境、智能体、奖励函数7.9奖励函数(RewardFunction)定义:定义了智能体在不同状态下执行不同动作所能获得的奖励。

核心要点:直接决定了智能体的行为设计良好的奖励函数是强化学习成功的关键存在奖励黑客问题:智能体可能找到最大化奖励但不符合预期的方法

典型应用:AlphaGo的奖励函数(获胜+1,失败-1)、自动驾驶的奖励函数(安全行驶+正奖励,碰撞-负奖励)

相关术语:奖励、强化学习、智能体7.10马尔可夫决策过程(MarkovDecisionProcess,MDP)定义:用于描述强化学习问题的数学框架,假设未来的状态只依赖于当前的状态和动作,而与过去的状态和动作无关(马尔可夫性质)。

核心要点:由状态集、动作集、状态转移函数、奖励函数和折扣因子组成是大多数强化学习算法的理论基础适用于完全可观测环境

典型应用:大多数强化学习问题的建模

相关术语:强化学习、状态、动作、奖励7.11Q学习(Q-Learning)定义:一种无模型的强化学习算法,通过学习动作价值函数Q(s,a)来估计在状态s下执行动作a所能获得的长期累积奖励。

核心要点:是最经典的强化学习算法之一属于时序差分学习方法不需要环境模型,直接从经验中学习

典型应用:简单的强化学习任务、游戏AI

相关术语:强化学习、动作价值函数、时序差分学习7.12深度Q网络(DeepQ-Network,DQN)定义:将深度学习与Q学习相结合的强化学习算法,使用深度神经网络来近似动作价值函数Q(s,a)。

核心要点:是深度强化学习的开创性工作引入了经验回放和目标网络两个关键技术来稳定训练能够直接从原始像素输入中学习玩Atari游戏

典型应用:Atari游戏AI、简单的机器人控制

相关术语:Q学习、深度强化学习、经验回放7.13策略梯度(PolicyGradient)定义:一类直接优化策略函数的强化学习算法,通过计算策略梯度来更新策略参数,使策略能够最大化长期累积奖励。

核心要点:直接优化策略,不需要学习价值函数适用于连续动作空间代表性算法:REINFORCE、PPO

典型应用:机器人控制、游戏AI、自动驾驶

相关术语:强化学习、策略、近端策略优化7.14近端策略优化(ProximalPolicyOptimization,PPO)定义:一种改进的策略梯度算法,通过限制每次策略更新的幅度来避免策略更新过大导致的训练不稳定问题。

核心要点:是当前最流行的强化学习算法之一实现简单,训练稳定,性能优秀被广泛应用于各种强化学习任务

典型应用:OpenAIFive、机器人控制、大语言模型的RLHF训练

相关术语:策略梯度、强化学习、基于人类反馈的强化学习八、多模态AI8.1多模态AI(MultimodalAI)定义:能够同时处理和理解多种模态数据(如文本、图像、音频、视频、3D模型等)的人工智能技术。

核心要点:目标是使AI能够像人类一样通过多种感官感知和理解世界核心技术:多模态表征学习、多模态融合、多模态生成是当前AI发展的重要方向

典型应用:图文问答、视频理解、语音+图像交互、自动驾驶多模态感知

相关术语:多模态大模型、多模态融合、多模态生成8.2多模态大模型(MultimodalLargeLanguageModel,MLLM)定义:基于大语言模型扩展而来的、能够处理多种模态数据的大模型。

核心要点:通常以大语言模型为基础,通过添加其他模态的编码器来实现多模态能力能够理解跨模态的语义关系是当前多模态AI的主流技术

典型应用:GPT-4V、Gemini、文心一言、通义千问

相关术语:大语言模型、多模态AI、多模态融合8.3模态(Modality)定义:信息的表现形式或感知方式,如文本、图像、音频、视频、触觉等。

核心要点:不同模态提供了不同的信息渠道模态之间存在互补性和冗余性多模态AI的目标是整合不同模态的信息

典型应用:文本模态、图像模态、音频模态、视频模态

相关术语:多模态AI、多模态融合、多模态表征8.4多模态融合(MultimodalFusion)定义:将来自不同模态的信息整合在一起,以获得更全面、更准确的理解的过程。

核心要点:分为早期融合、中期融合和晚期融合早期融合:在特征提取阶段融合不同模态的特征中期融合:在模型中间层融合不同模态的特征晚期融合:在输出阶段融合不同模态的预测结果

典型应用:图文问答、情感分析(结合文本和语音)、自动驾驶多传感器融合

相关术语:多模态AI、多模态表征、多模态大模型8.5多模态生成(MultimodalGeneration)定义:根据一种或多种模态的输入生成另一种或多种模态的输出的过程。

核心要点:包括文本到图像、文本到视频、文本到音频、图像到文本等是生成式AI的重要组成部分大模型的出现极大地提升了多模态生成的能力

典型应用:AI绘画、AI视频生成、AI语音生成、图文生成

相关术语:生成式AI、扩散模型、多模态大模型8.6对比式语言-图像预训练(ContrastiveLanguage-ImagePre-training,CLIP)定义:OpenAI提出的一种多模态预训练方法,通过对比学习来学习文本和图像的联合表征,使文本和图像在同一向量空间中具有语义一致性。

核心要点:训练目标是最大化匹配的文本-图像对的相似度,最小化不匹配的文本-图像对的相似度能够进行零样本图像分类是许多多模态大模型的基础

典型应用:零样本图像分类、图像检索、图文匹配

相关术语:多模态AI、对比学习、预训练8.7多模态思维链(MultimodalChainofThought,MCoT)定义:将思维链技术扩展到多模态领域,引导大模型同时处理文本和图像信息,一步步进行推理,以提高多模态任务的性能。

核心要点:能够处理包含文本和图像的复杂推理问题通常在提示词中引导模型先描述图像内容,再进行推理显著提升了多模态大模型的推理能力

典型应用:数学应用题(包含图表)、科学问题(包含实验图)、医学影像诊断

相关术语:思维链、多模态大模型、推理能力九、AI工程与部署9.1MLOps(MachineLearningOperations)定义:将DevOps理念应用于机器学习领域的一套方法论和实践,旨在实现机器学习模型从开发到部署、运维和迭代的全生命周期自动化和标准化。

核心要点:融合了机器学习、DevOps和数据工程核心目标:提高模型开发效率、保证模型质量、降低运维成本覆盖模型全生命周期:数据准备、模型训练、模型部署、模型监控、模型迭代

典型应用:企业级机器学习平台、推荐系统、风控系统

相关术语:DevOps、LLMOps、模型部署、模型监控9.2LLMOps(LargeLanguageModelOperations)定义:MLOps在大语言模型时代的演进和扩展,专门针对大语言模型的全生命周期管理。

核心要点:除了传统MLOps的功能外,还包括提示词管理、RAG系统管理、微调管理、模型评估等大语言模型具有规模大、推理成本高、输出不确定等特点,需要专门的工程化支持是当前企业级大模型应用的关键

典型应用:企业级大模型平台、AI应用开发平台

相关术语:MLOps、大语言模型、检索增强生成、微调9.3模型部署(ModelDeployment)定义:将训练好的机器学习模型或大语言模型转换为可在生产环境中运行的服务或应用程序的过程。

核心要点:部署方式:本地部署、云部署、边缘部署部署形式:API服务、嵌入式应用、容器化部署关键指标:延迟、吞吐量、资源占用、可用性

典型应用:将大语言模型部署为API服务、将图像识别模型部署到手机上

相关术语:MLOps、LLMOps、边缘部署、容器化9.4边缘部署(EdgeDeployment)定义:将模型部署在靠近数据源的边缘设备上,而不是集中式的云端服务器上。

核心要点:优势:低延迟、高隐私性、节省带宽、离线可用挑战:边缘设备计算资源有限、模型需要轻量化适用于对延迟和隐私要求高的场景

典型应用:手机端AI应用、物联网设备、自动驾驶汽车、工业机器人

相关术语:模型部署、模型轻量化、端侧AI9.5模型轻量化(ModelLightweighting)定义:通过各种技术手段减小模型的体积和计算量,使其能够在资源有限的设备上运行。

核心要点:常用方法:模型蒸馏、模型量化、剪枝、知识蒸馏目标是在尽量不损失模型性能的前提下减小模型大小和计算量是边缘部署的关键技术

典型应用:将大语言模型压缩后部署到手机上、将图像识别模型部署到嵌入式设备上

相关术语:边缘部署、模型蒸馏、模型量化9.6模型蒸馏(ModelDistillation)定义:一种模型轻量化技术,通过训练一个小模型(学生模型)来模仿一个大模型(教师模型)的行为,从而将大模型的知识转移到小模型中。

核心要点:能够显著减小模型的体积和计算量学生模型的性能可以接近教师模型是大语言模型轻量化的常用方法

典型应用:将大语言模型蒸馏为小语言模型、将复杂的图像识别模型蒸馏为简单模型

相关术语:模型轻量化、大语言模型、小语言模型9.7模型量化(ModelQuantization)定义:一种模型轻量化技术,将模型的参数和激活值从高精度浮点数(如32位浮点数)转换为低精度数(如16位浮点数、8位整数、4位整数)。

核心要点:能够显著减小模型的内存占用和计算量加速模型推理速度可能会有一定的精度损失

典型应用:大语言模型的推理加速、边缘设备上的模型部署

相关术语:模型轻量化、模型部署、推理加速9.8推理(Inference)定义:使用训练好的模型对新的输入数据进行预测或生成输出的过程。

核心要点:与训练的区别:训练是学习模型参数的过程,推理是使用模型参数的过程推理的关键指标:延迟、吞吐量、准确率大语言模型的推理成本很高

典型应用:使用大语言模型生成文本、使用图像识别模型识别图片

相关术语:训练、大语言模型、模型部署、推理加速9.9训练(Training)定义:使用训练数据来学习模型参数的过程,使模型能够从数据中学习规律。

核心要点:是一个计算密集型过程,需要大量的算力大语言模型的训练成本极高训练的目标是最小化损失函数

典型应用:训练大语言模型、训练图像识别模型

相关术语:推理、大语言模型、损失函数、反向传播9.10特征存储(FeatureStore)定义:专门用于存储和管理机器学习特征的系统,支持特征的定义、计算、存储、检索和共享。

核心要点:是MLOps的核心组件之一解决了特征不一致、重复计算、特征泄露等问题支持离线特征和在线特征的统一管理

典型应用:推荐系统、风控系统、广告系统

相关术语:MLOps、特征工程、机器学习9.11模型注册表(ModelRegistry)定义:用于存储、版本管理和部署机器学习模型的系统。

核心要点:是MLOps的核心组件之一支持模型的版本控制、元数据管理、模型审批和部署实现了模型的可追溯性和可复现性

典型应用:企业级机器学习平台、模型管理系统

相关术语:MLOps、模型部署、版本控制9.12模型监控(ModelMonitoring)定义:对部署在生产环境中的模型进行持续监控,以确保模型的性能和可靠性。

核心要点:监控指标:模型性能(准确率、召回率等)、数据漂移、概念漂移、系统性能(延迟、吞吐量等)能够及时发现模型性能下降并触发告警是模型全生命周期管理的重要环节

典型应用:监控推荐系统的点击率、监控风控系统的误判率

相关术语:MLOps、数据漂移、概念漂移9.13数据漂移(DataDrift)定义:生产环境中的输入数据分布与模型训练时的数据分布发生变化的现象。

核心要点:是导致模型性能下降的主要原因之一分为协变量漂移(输入特征分布变化)和概念漂移(输入与输出之间的关系变化)需要定期重新训练模型来应对数据漂移

典型应用:电商用户行为变化导致推荐系统性能下降、市场环境变化导致风控系统失效

相关术语:模型监控、概念漂移、模型迭代9.14概念漂移(ConceptDrift)定义:输入数据与目标变量之间的关系发生变化的现象,即使输入数据分布没有变化,模型的预测结果也会变得不准确。

核心要点:比数据漂移更难检测和处理分为突然漂移、逐渐漂移和周期性漂移需要持续监控和模型更新

典型应用:欺诈模式的变化导致欺诈检测系统失效、消费者偏好的变化导致推荐系统失效

相关术语:模型监控、数据漂移、模型迭代9.15工具调用(FunctionCalling)定义:大语言模型能够根据用户的需求自动调用外部工具或API来完成任务的能力。

核心要点:是AI智能体的核心能力之一扩展了大语言模型的能力边界,使其能够获取实时信息、执行复杂计算、与外部系统交互模型需要能够理解什么时候需要调用工具、调用哪个工具以及如何调用

典型应用:调用搜索引擎获取实时信息、调用计算器进行数学计算、调用数据库查询数据

相关术语:AI智能体、大语言模型、检索增强生成9.16推理加速(InferenceAcceleration)定义:通过各种技术手段提高模型推理速度、降低推理延迟和成本的过程。

核心要点:常用方法:模型量化、模型蒸馏、剪枝、算子优化、硬件加速大语言模型的推理加速尤为重要硬件加速包括GPU、TPU、NPU等专用芯片

典型应用:大语言模型的推理服务、实时图像识别、自动驾驶

相关术语:模型量化、模型蒸馏、边缘部署、GPU十、AI伦理与安全10.1AI伦理(AIEthics)定义:研究人工智能技术开发和应用中涉及的伦理问题的学科,旨在确保AI技术的发展符合人类的价值观和利益。

核心要点:核心原则:公平性、透明性、可解释性、问责性、隐私保护、安全性关注的问题:偏见与歧视、隐私泄露、失业问题、AI滥用、存在性风险是AI健康发展的重要保障

典型应用:制定AI伦理准则、AI伦理审查、AI影响评估

相关术语:AI安全、公平性、可解释性、隐私保护10.2AI安全(AISafety)定义:研究如何防止AI系统造成意外或故意伤害的学科,包括技术安全和社会安全两个方面。

核心要点:技术安全:防止AI系统出现故障、被攻击、产生有害输出社会安全:防止AI技术被滥用、造成社会问题长期安全:防止通用人工智能带来的存在性风险

典型应用:大语言模型的对齐、AI系统的安全测试、防范AI诈骗

相关术语:AI伦理、对齐、提示注入、数据泄露10.3偏见与歧视(BiasandDiscrimination)定义:AI系统由于训练数据或算法设计的原因,对特定群体产生不公平的对待。

核心要点:来源:训练数据中的偏见、算法设计中的偏见、标注过程中的偏见危害:加剧社会不平等、损害特定群体的利益解决方法:数据清洗、算法公平性优化、多元化团队

典型应用:招聘算法对女性的歧视、贷款审批算法对少数族裔的歧视、人脸识别算法对不同肤色人群的准确率差异

相关术语:AI伦理、公平性、训练数据10.4可解释性(Explainability)定义:AI系统能够解释其决策过程和结果的能力。

核心要点:对于高风险领域(如医疗、金融、司法)尤为重要分为全局可解释性和局部可解释性黑箱模型(如深度神经网络)的可解释性较差

典型应用:解释医疗AI的诊断结果、解释贷款审批AI的拒绝原因、解释司法AI的判决依据

相关术语:AI伦理、可解释人工智能、黑箱模型10.5可解释人工智能(ExplainableAI,XAI)定义:旨在提高AI系统可解释性的技术和方法。

核心要点:目标是使AI系统的决策过程透明、可理解常用方法:注意力可视化、特征重要性分析、反事实解释是AI伦理和监管的重要要求

典型应用:医疗AI、金融AI、司法AI

相关术语:可解释性、AI伦理、黑箱模型10.6隐私保护(PrivacyProtection)定义:在AI系统的开发和应用过程中,保护个人隐私和数据安全的措施。

核心要点:AI系统需要大量数据,容易导致隐私泄露常用技术:联邦学习、差分隐私、同态加密、数据脱敏是AI伦理和法律的重要要求

典型应用:医疗数据的隐私保护、用户行为数据的隐私保护、人脸识别的隐私保护

相关术语:AI伦理、联邦学习、差分隐私、数据泄露10.7联邦学习(FederatedLearning)定义:一种分布式机器学习方法,在不共享原始数据的情况下,多个参与方共同训练一个模型。

核心要点:数据保留在本地,只共享模型参数或梯度能够有效保护数据隐私适用于数据敏感的场景

典型应用:医疗数据联合建模、金融数据联合建模、手机端用户数据建模

相关术语:隐私保护、分布式机器学习、差分隐私10.8差分隐私(DifferentialPrivacy)定义:一种严格的隐私保护数学框架,通过在数据或计算结果中添加适量的噪声,来保证单个数据点的存在与否不会影响计算结果,从而保护个人隐私。

核心要点:提供了可量化的隐私保证可以与各种机器学习算法结合使用存在隐私和效用之间的权衡

典型应用:数据发布、机器学习模型训练、统计查询

相关术语:隐私保护、联邦学习、数据脱敏10.9提示注入(PromptInjection)定义:一种针对大语言模型的攻击方式,攻击者通过在输入中嵌入恶意指令,来绕过模型的安全限制,使模型执行攻击者想要的操作。

核心要点:是当前大语言模型最主要的安全漏洞之一分为直接注入和间接注入间接注入是指恶意指令隐藏在外部数据中(如RAG检索到的文档)

典型应用:诱导模型生成有害内容、诱导模型泄露系统提示词、诱导模型执行恶意代码

相关术语:AI安全、大语言模型、检索增强生成10.10数据泄露(DataLeakage)定义:AI系统在训练或推理过程中意外泄露敏感数据的现象。

核心要点:来源:训练数据泄露、模型参数泄露、推理过程泄露大语言模型可能会记住训练数据中的敏感信息会导致严重的隐私和安全问题

典型应用:大语言模型生成训练数据中的个人信息、模型参数泄露导致知识产权侵权

相关术语:AI安全、隐私保护、大语言模型10.11深度伪造(Deepfake)定义:利用深度学习技术生成的虚假内容,包括虚假图像、虚假视频、虚假音频等。

核心要点:生成的内容非常逼真,难以辨别真伪可以用于恶意目的,如造谣、诽谤、诈骗、政治操纵是AI安全的重要挑战之一

典型应用:AI换脸视频、虚假语音、虚假新闻

相关术语:生成式AI、扩散模型、AI安全10.12AI对齐(AIAlignment)定义:使AI系统的目标和行为与人类的价值观、意图和期望保持一致的过程。

核心要点:分为内部对齐和外部对齐内部对齐:使AI系统的目标与人类的目标一致外部对齐:使AI系统的行为符合人类的期望是通用人工智能安全的核心问题

典型应用:大语言模型的RLHF训练、宪法AI、AI安全研究

相关术语:AI安全、基于人类反馈的强化学习、通用人工智能十一、前沿研究方向11.1通用人工智能(ArtificialGeneralIntelligence,AGI)定义:具备与人类同等或超越人类水平的通用智能,能够在任何智力任务上表现出与人类相当或更好的能力,并且可以跨领域自主学习和解决问题。

核心要点:是AI研究的终极目标核心挑战:通用迁移能力、常识推理、自主意识、自我改进当前研究方向:多模态融合、推理能力提升、智能体技术

典型应用:理论上可完成人类所有智力活动

相关术语:弱人工智能、超人工智能、智能涌现11.2AI智能体(AIAgent)定义:基于大语言模型的智能体,能够自主感知环境、制定计划、执行动作、调用工具并与其他智能体协作,完成复杂的任务。

核心要点:被认为是通往AGI的重要路径之一核心研究方向:记忆机制、规划能力、工具使用、多智能体协作具有巨大的应用潜力

典型应用:个人数字助理、自动科研助手、自动编程系统、多智能体协作系统

相关术语:大语言模型、工具调用、多智能体系统、规划11.3多模态大模型(MultimodalLargeLanguageModel,M

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论