人工智能通识教程 课件 第08讲 第5章 常用大模型【5.4-5.5】_第1页
人工智能通识教程 课件 第08讲 第5章 常用大模型【5.4-5.5】_第2页
人工智能通识教程 课件 第08讲 第5章 常用大模型【5.4-5.5】_第3页
人工智能通识教程 课件 第08讲 第5章 常用大模型【5.4-5.5】_第4页
人工智能通识教程 课件 第08讲 第5章 常用大模型【5.4-5.5】_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章

常用大模型第08讲人工智能通识教程【教材第5章5.4-5.5节】人工智能通识教程

本章导读:大模型的普及应用人们带来许多便利,如智能客服、生成文本、生成摘要、生成图片、生成视频等。为了更好地利用大模型,需要了解其基本含义、基本架构、训练与部署方法,也需要多方面了解其应用。人工智能通识教程(1)了解大模型的发展历程;(2)理解大模型的概念和特征;(3)掌握大模型的分类和关键技术;(4)掌握大模型提示工程;(5)了解大模型训练与部署。本章学习目标人工智能通识教程本章思维导图第4页共23页5.1大模型概况5.2大模型数据与存储5.3大模型的架构5.4大模型提示工程人工智能通识教程5.7案例实践(第09讲)目录5.5大模型训练与部署5.6大模型的应用(第09讲)人工智能通识教程5.4大模型提示工程5.4.1提示工程简介零样本提示是一种在没有样本的情况下,仅通过设计合适的提示词来引导模型完成任务的方法。在零样本提示中,提示词需要明确地表达任务的目标和要求。提示工程是一种通过设计合适的提示词来引导大模型生成特定输出的技术。在大模型的应用中,提示词的设计对于模型的性能和输出质量有着重要的影响。5.4.2零样本提示5.4.3少样本提示链式思考提示是一种通过设计一系列相互关联的提示词,引导模型进行逐步推理和思考的方法。在链式思考提示中,每个提示词都对应一个推理步骤或者思考角度,模型需要根据前一个提示词的输出结果,结合自身的知识和逻辑,来回答下一个提示词的问题。少样本提示是在只有少量样本的情况下,通过设计合适的提示词来提高模型性能的方法。在少样本提示中,提示词不仅要明确任务的目标和要求,还需要充分利用少量样本的信息。5.4.4链式思考提示第6页共23页人工智能通识教程5.4.5提示词提示词通常包含以下几个要素:指令(Instruction):明确告诉模型需要执行的具体任务。例如“生成一段描述春天的短文”。上下文(Context):提供任务执行所需的背景信息,帮助模型理解任务的情景和环境。例如,“描述一个充满阳光和温馨的家庭场景,展现生活中简单而美好的瞬间”。输入数据(InputData):模型需要处理的具体信息。例如“包括自然元素(如花园、阳光、绿植)、有6位家庭成员的互动(2人在喝茶、3人在看电影,1人宠物猫陪伴)以及宁静的氛围”。输出指示器(OutputIndicator):告诉模型用户期望的输出类型或格式。例如“文字字数不少于200字”。提示词是提示工程的基础,提示工程则是对提示词的设计和优化过程。提示工程通过总结和应用各种技巧,帮助用户写出更有效的提示词,从而提高模型的输出质量和准确。第7页共23页人工智能通识教程5.4.5提示词提示词的优化技巧提供详细的场景上下文:通过详细的描述帮助模型更好地理解任务背景。例如,“描述一个充满阳光和温馨的家庭场景,展现生活中简单而美好的瞬间”。角色扮演:通过设定角色和背景,使模型生成的内容更加生动和具体。例如,“假设你是一位家庭成员,描述你在家庭聚会中的感受”。分步提问:将复杂任务分解为多个步骤,逐步引导模型生成内容。例如,“首先描述家庭成员的互动,然后描述家庭氛围”。样本提示:提供示例,帮助模型理解任务要求。例如,“例如,家庭成员们在客厅里聊天、吃美食,背景音乐轻柔舒缓”第8页共23页人工智能通识教程例,利用智普清言观察大模型的输出结果1.生成文字提示词:生成一段描述春天的短文。提示词优化:生成一段描述春天的短文,包括盛开的花朵、温暖的阳光和轻柔的微风。2.生成图片提示词:生成一幅描绘日落的图片。提示词优化:生成一幅描绘海边日落的图片,画面中有椰子树和沙滩。3.生成视频提示词:生成一段10秒的视频,展示一个家庭聚会的场景。提示词优化:生成一段10秒的视频,展示一个家庭聚会在宽敞的客厅里,家庭成员们在聊天、吃美食,背景音乐轻柔舒缓。第9页共23页人工智能通识教程5.5大模型训练与部署5.5.1大模型训练预训练,大模型因其通用性(即L0通用预训练大模型)。可以在这些预训练模型的基础上,通过引入少量增量数据进行训练,从而快速构建出适用于特定垂直领域的L1模型。模型库,是一个托管和共享大量开源模型的平台社区。可以下载各种预训练大模型,此外,主流的ModelHub平台还提供丰富的共享数据集和应用程序等资源。分布式加速库,为大模型提供了多维度的分布式并行能力,使得大模型能够在AI集群上实现快速训练和推理。同时,这些加速库还能提升模型和算力的利用率,优化AI集群的线性度。修改和迭代,无论是机器学习(ML)还是大型语言模型(LLM),都需要借助实验管理工具进行版本控制和协作管理。实验管理的主要任务是记录实验元数据,辅助版本控制,以确保实验结果的可复现性。大模型训练框架,大模型训练框架如飞桨、MindSpore、OneFlow、TensorFlow、PyTorch等。例如,PyTorch提供了灵活的训练接口。大模型训练平台,大模型训练平台如阿里云ModelScope、百度飞桨AIStar、华为ModelArts、GoogleCloudAIPlatform、AWSSageMaker等。例如,阿里云ModelScope提供了强大的训练和部署能力。第10页共23页人工智能通识教程5.5.2训练的基本步骤分词器是将文本切分成有意义的子单元的工具,其训练是大模型训练的第一步。分词器的性能直接影响模型对文本的理解和处理能力。1.分词器训练分词器的作用:分词器将输入的文本字符串分解为一个个独立的词汇或标记(token),这些词汇或标记是模型能够理解和处理的基本单位。例如,将句子“我爱北京天安门”切分成“我”、“爱”、“北京”、“天安门”等词汇。分词器类型:常见的分词器类型包括基于规则的分词器、基于统计的分词器和基于深度学习的分词器。基于规则的分词器通过预定义的词汇表和分词规则进行切分,简单高效但难以处理未登录词和歧义;基于统计的分词器利用大规模语料库统计词频和共现概率,能够较好地处理未登录词,但需要大量标注数据;基于深度学习的分词器使用神经网络模型,如BiLSTM、Transformer等,能够捕捉文本的上下文信息,具有更高的准确性和鲁棒性。第11页共23页人工智能通识教程分词器训练过程:以基于深度学习的分词器为例,训练过程通常包括数据准备、模型构建、模型训练和模型评估等步骤。数据准备阶段需要收集大量的标注语料库,包含文本及其对应的分词结果;模型构建阶段选择合适的神经网络架构,如BiLSTM-CRF模型,其中BiLSTM用于捕捉文本的双向依赖关系,CRF层用于建模词汇之间的转移概率;模型训练阶段使用标注语料库对模型进行训练,通过优化算法调整模型参数,使其能够准确地预测词汇的边界;模型评估阶段使用测试集对训练好的分词器进行评估,计算其准确率、召回率和F1分数等指标,以衡量其性能。第12页共23页人工智能通识教程预训练是在大规模无标注数据上学习通用特征表示和知识的过程,通常采用自监督学习。预训练的目的是让模型在未接触具体任务之前,先对语言的结构、语义和规律有一个全面的了解,从而为后续的下游任务打下坚实的基础。2.预训练预训练数据:预训练使用的数据通常是大规模的无标注文本数据,如维基百科、新闻网站、书籍、网页等。预训练模型架构:预训练模型通常采用Transformer架构,它由编码器(Encoder)和解码器(Decoder)组成,通过自注意力机制和前馈神经网络,能够捕捉文本中的长距离依赖关系和复杂的语义信息。编码器负责对输入文本进行编码,生成上下文表示;解码器则根据编码器的输出和已生成的文本,逐步生成新的文本序列。预训练过程:预训练过程包括模型初始化、数据加载、前向传播、损失计算和反向传播等步骤。模型初始化阶段对模型参数进行随机初始化或加载预训练好的参数;数据加载阶段将大规模无标注数据分批次输入模型;前向传播阶段模型根据输入数据生成预测结果;损失计算阶段根据预测结果和真实数据计算损失函数值,如交叉熵损失;反向传播阶段通过梯度下降算法更新模型参数,使其能够更好地拟合数据。第13页共23页人工智能通识教程有监督微调是使用标注数据对预训练模型进行进一步训练,以适应特定下游任务。微调的目的是让模型在预训练阶段学到的通用特征表示的基础上,进一步学习到与特定任务相关的特征和知识,从而提高模型在该任务上的性能。3.有监督微调微调数据:微调使用的数据是针对特定任务进行标注的数据集,如文本分类任务中的标注文本及其对应的类别标签,问答任务中的问题-答案对等。微调数据通常规模较小,但标注质量较高,能够为模型提供明确的任务指导。微调方法:常见的微调方法包括全参数微调和部分参数微调。全参数微调是对预训练模型的所有参数进行微调,使其能够更好地适应任务;部分参数微调则是冻结预训练模型的部分参数,只对特定的层或参数进行微调,以减少计算资源消耗和防止过拟合。微调过程:微调过程包括数据准备、模型配置、训练与优化等步骤。数据准备阶段收集和标注与任务相关的数据集;模型配置阶段根据任务需求对预训练模型进行适当的配置,如添加任务特定的输出层、调整模型的超参数等;训练与优化阶段使用标注好的数据集对模型进行训练,通过优化算法更新模型参数,使模型在任务数据集上的性能达到最优。第14页共23页人工智能通识教程奖励建模是设计奖励函数,评估模型输出与人类价值观的一致性,使模型学习到符合期望的行为。奖励建模的目的是引导模型生成更加符合人类价值观和偏好的输出,提高模型的实用性和可靠性。4.奖励建模奖励函数:奖励函数是衡量模型输出质量的指标,它根据模型输出与人类价值观的一致性给出一个奖励分数。奖励函数的设计需要考虑多个因素,如输出的准确性、相关性、连贯性、安全性等。例如,在对话系统中,奖励函数可以综合考虑回答的正确性、相关性和用户满意度等因素,给出一个综合的奖励分数。奖励建模方法:常见的奖励建模方法包括基于规则的奖励建模和基于学习的奖励建模。基于规则的奖励建模通过制定一系列规则来定义奖励函数,如根据输出中是否包含某些关键词、是否符合语法规范等规则来计算奖励;基于学习的奖励建模则是通过从大量标注数据中学习奖励函数,如使用监督学习方法训练一个奖励模型,使其能够根据输入和输出自动计算奖励分数。奖励建模过程:奖励建模过程包括数据准备、模型设计、模型训练和模型评估等步骤。第15页共23页人工智能通识教程强化学习是应用强化学习技术,根据奖励信号调整模型行为,生成更加符合人类价值观的输出。强化学习通过与环境的交互,不断学习和优化模型的行为策略,使其能够在长期过程中获得最大的累积奖励。5.强化学习强化学习:涉及智能体(Agent)、环境(Environment)、状态(State)、动作(Action)和奖励(Reward)等基本概念。智能体是学习和决策的主体,环境是智能体所处的外部世界,状态是环境在某一时刻的情况,动作是智能体在某一状态下所采取的行为,奖励是环境对智能体动作的反馈。强化学习算法:常见的强化学习算法包括Q学习、策略梯度、演员-评论家(ActorCritic)等。Q学习通过学习状态-动作对的价值函数来选择最优动作;策略梯度通过优化智能体的策略参数来最大化期望奖励;演员-评论家算法结合了策略梯度和价值函数的方法,同时学习策略和价值函数。强化学习过程:强化学习过程包括初始化、交互、更新和迭代等步骤。初始化阶段设置智能体的初始状态和策略参数;交互阶段智能体根据当前策略与环境进行交互,选择动作并获得奖励和新的状态;更新阶段根据奖励信号和学习算法更新智能体的策略参数和价值函数;迭代阶段重复交互和更新过程,直到智能体的策略收敛到最优策略。第16页共23页人工智能通识教程5.5大模型训练与部署5.5.3大模型训练方法分布式训练通过将模型的计算任务分散到多个计算节点上,可以显著提高训练效率和处理大规模数据的能力。1.分布式训练数据并行:数据并行是将训练数据均匀地分配到多个计算节点上,每个节点独立计算损失和梯度,然后通过通信操作将梯度汇总并更新模型参数。数据并行适用于模型较小、数据量大的情况。模型并行:模型并行是将模型的不同部分(如层或子网络)分配到不同的计算节点上,每个节点只计算模型的一部分,然后通过通信操作将计算结果传递给其他节点。模型并行适用于模型较大、数据量适中的情况。流水线并行:流水线并行是将模型的计算过程划分为多个阶段,每个阶段由不同的计算节点负责,形成一个流水线。数据在流水线中依次通过各个阶段,每个节点在完成自己的计算任务后,将结果传递给下一个节点。流水线并行适用于模型较大、计算过程复杂的任务。第17页共23页人工智能通识教程混合精度训练结合了单精度浮点数(FP32)和半精度浮点数(FP16)的优点,通过在不同的计算阶段使用不同精度的浮点数,可以提高训练效率和减少内存占用。2.混合精度训练梯度累积是一种在小批量训练中模拟大批量训练效果的方法。在每次迭代中,模型不立即更新参数,而是将计算得到的梯度累积起来,直到累积到一定数量后再进行一次参数更新。梯度累积可以提高训练的稳定性,使模型能够更好地利用大批量数据的优势,同时减少内存占用和通信开销。3.梯度累积模型蒸馏是一种将大模型的知识迁移到小模型中的方法,通过训练小模型来模仿大模型的行为和输出。例如,在部署一个大规模的图像识别模型到移动设备上时,由于设备的计算资源和存储空间有限,可以采用模型蒸馏的方法,将大模型的知识迁移到一个小模型中,然后将小模型部署到移动设备上,从而在保证模型性能的同时,满足设备的资源限制。4.模型蒸馏第18页共23页人工智能通识教程5.5.4大模型部署大模型从研究环境成功部署到实际应用场景中,是一项复杂且充满挑战的任务。这不仅涉及到技术层面的考量,还与资源管理、性能优化、安全性等多方面因素息息相关。大模型的部署方式可以根据不同的需求和场景进行选择。常见的部署方式包括公有云部署、私有云部署、混合云部署和本地化部署。公有云部署适合中小企业和个人开发者;私有云部署适合对数据安全要求较高的大型企业;混合云部署适合业务具有周期性和复杂性的企业;本地化部署适合对数据安全和自主性要求较高的机构。第19页共23页人工智能通识教程1.按部署环境分类1)公有云部署公有云部署是指将大模型部署在云服务商提供的AI平台上,使用方通过API调用大模型。云服务商通常会提供一系列的AI平台和接口,支持多种大模型的部署和调用。2)私有云部署私有云部署是指在企业或机构内部的私有云环境中部署大模型,实现数据和算力的自主可控。私有云部署通常需要企业自行构建和维护硬件环境,但可以更好地保护数据的安全性和隐私。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论