版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章创造的革命团结创新共赢生成式AI重塑未来1目录Introduction0101AIGC概述0303提示工程0202AIGC基本原理0404检索增强0505智能体0606DeepSeek
AIGC概述
AIGC的定义与发展历程生成式人工智能(ArtificialIntelligenceGeneratedContent,简称AIGC)是人工智能领域中一个快速发展的分支,它通过学习大量的数据,生成与训练数据相似但又具有创造性的新内容。与传统的分析式人工智能不同,生成式人工智能不仅能够理解和分析数据,还能够生成全新的内容,如文本、图像、音频和视频等。
AIGC概述发展历程•萌芽阶段:20世纪50年代。•2014年,生成对抗网络(GAN)的提出标志着AIGC领域的一个重要里程碑。•2017年,谷歌推出了Transformer模型•AIGC领域的又一重要进展:预训练模型的兴起。2022年以来,以ChatGPT为代表的大语言模型引领了新一轮AIGC的发展热潮
AIGC概述AIGC的应用领域AIGC技术在教育、医疗、娱乐、艺术等多个领域得到了广泛应用,为各行业带来了深远的影响。AIGC基本原理生成对抗网络(GAN)GAN的核心思想是通过两个神经网络:生成器(Generator)和判别器(Discriminator)的对抗训练来生成高质量的内容。AIGC基本原理GAN工作步骤生成器生成样本1生成器从随机噪声向量开始,通过神经网络映射生成一个数据样本。234判别器评估样本
判别器接收两个来源的输入:真实数据样本和生成器生成的样本。判别器的目标是输出一个概率值,表示输入样本是真实样本的概率。对抗训练训练过程判别器的目标是最小化真实样本被误判为假的概率,同时最大化生成样本被正确判为假的概率在训练过程中,生成器和判别器交替进行更新。生成器尝试生成更逼真的样本,而判别器则不断学习如何更好地区分真假样本。AIGC基本原理变分自编码器(VAE)变分自编码器是一种结合自编码器和概率图模型的生成式深度学习模型。•编码器将输入数据(如图像、文本等)压缩为低维的潜在特征,这些特征可以作为后续生成模型(如U-Net)的输入。•解码器的作用是将潜在变量z解码回原始数据的分布。AIGC基本原理VAE工作流程输入数据
x
进入编码器(Encoder);编码器学习潜在变量
z
的分布,即后验分布
qϕ(z∣x)从该分布中采样得到潜在表示
z;解码器(Decoder)根据
z
重构数据,即似然分布
pθ(x∣z);输出重构后的数据,完成生成或重建过程。AIGC基本原理
扩散模型的核心思想是通过逐步添加噪声将数据转化为噪声(正向扩散),再从噪声中逐步去除噪声恢复出原始数据(逆向扩散)。•正向扩散过程:将原始数据(如图像或视频)逐步转化为高斯噪声。•逆向扩散过程:逆向扩散过程是正向扩散的反向操作,目标是从噪声中逐步恢复出原始数据。扩散模型(DiffusionModels)AIGC基本原理扩散模型(DiffusionModels)文图AIGC基本原理扩散模型(DiffusionModels)文本编码:通过编码器(如CLIP)转换为词元嵌入(TokenEmbeddings)迭代去噪:一个随机噪声张量被送入图像信息生成器(UNet+调度器)UNet在文本条件的指导下,逐步预测并去除噪声。此过程循环迭代,每一步都生成一个噪声更少的张量。图像解码:处理后、干净的潜在张量被送入图像解码器,转换回最终的像素图像。AIGC基本原理扩散模型(DiffusionModels)AIGC基本原理扩散模型(DiffusionModels)AIGC基本原理生成式模型的工作流程1、
数据准备预训练过程中使用的是大规模的文本数据集,这些数据通常是未经标注的原始文本,使用前通常要进行分词(Tokenization)处理,将文本拆分成tokens。AIGC基本原理生成式模型的工作流程2、预训练阶段(Pretraining)•关键技术:自监督学习•目标:让模型能够从大量的无标签文本数据中学习语言的统计规律、语法结构、语义关系等。
通过预测文本的某些部分(例如下一个token,或者遮掩的部分)来训练自己,从而学习到语言的规律,以便后续可以迁移到具体的下游任务(如文本分类、问答、翻译等)。AIGC基本原理生成式模型的工作流程3、微调阶段(Finetuning)•选择预训练模型•准备数据集•调整模型结构•设置训练参数•执行微调•评估与调优微调是在预训练模型的基础上,使用特定任务的小规模数据集进行二次训练的过程。AIGC基本原理生成式模型的工作流程4、奖励模型与强化学习•奖励模型(RewardModel,RM)是强化学习与人类反馈(RLHF)过程中至关重要的一步,它的作用是评估大语言模型输出的文本质量,给出一个分数,指导模型在后续生成过程中更好地符合人类偏好和需求。•强化学习的核心思想是通过奖惩机制来引导模型的学习。AIGC基本原理训练成本与token训练成本主要包括:计算资源,GPU/TPU的硬件消耗(占80%以上成本);数据成本,数据收集、清洗、标注的费用;能耗与运维,包括电力、冷却、存储等;研发成本,算法设计、调参、实验迭代。
训练数据规模与Tokens数量相关,模型的训练数据通常以Tokens总量衡量。
提示工程提示工程本质Prompt是用户向模型提供的输入,用于引导模型生成特定类型、主题或格式的文本输出。这种输入可以是一个问题、一个描述、一组关键词或上下文信息等,它告诉模型用户希望得到的输出类型和内容。一个典型的提示通常包含以下几个关键元素:指令、上下文、示例、输入、输出格式及其他信息。
提示工程提示工程的关键要素准确理解语义,精准传递信息的密钥构建语境,为AI创作营造特定场景引导提示,为AI创作指引方向设定限制,确保AI创作符合预期精准传递语义信息,以便让AI理解主题、对象、情感倾向与任务要求。有效的提示词能够为AI创设特定语境,确保生成的文案符合场景和受众需求。为AI的创作设定明确的方向提示词能够为AI的创作设定明确的边界,确保其输出内容紧扣主题且符合要求。
提示工程提示工程的的技巧与优化1.如何写好提示词•明确要求•明确目的•夸奖大模型,•使用结构化语言•提供上下文信息•尝试多种表达方式•逐步细化2.提示词原则•设定角色•给出示例•思维链•自我反思
提示工程提示工程的的技巧与优化优化检索增强什么是检索增强检索增强是一种结合信息检索、文本增强及文本生成的自然语言处理技术。它通过检索外部知识库中的相关信息,来增强生成式人工智能模型的生成能力。核心如何有效地检索和利用外部知识,以提高生成内容的质量和准确性,解决大模型在回答特定领域问题时,可能出现的知识过时、事实性错误等问题。检索增强检索增强的工作机制RAG在用户提出问题后,首先通过检索引擎在外部知识库或文档库中查找与问题相关的信息片段,然后将这些信息与问题一起输入到大模型中。大模型基于这些检索到的信息以及自身已有的知识进行融合理解,从而生成更加准确、全面且基于最新信息的回答。检索增强检索增强的工作机制数据准备检索
生成阶段RAG系统首先会对用户提出的自然语言问题进行处理,通过词法分析、句法分析等工具,来理解问题的语义和意图,识别出关键信息。基于对问题的理解,RAG系统会在大量的知识源(知识库)中进行检索。这些知识源可以是各种相关网站、文档、百科知识等,也可以是自己创建的知识库。RAG系统将检索到的相关片段与原始问题合并,形成更丰富的上下文信息。检索增强图数据库在检索增强中的应用1.图数据库在RAG中的优势•设定角色复杂关系处理•动态知识更新•减少幻觉一种高效存储和查询复杂关系数据的工具(如Neo4j、TigerGraph等),在检索增强(Retrieval-AugmentedGeneration,RAG)系统中具有重要的应用价值检索增强图数据库在检索增强中的应用2.图数据库与RAG的结合方式•知识图谱构建从文本数据中提取实体和关系,并将其存储到图数据库中。•检索阶段
根据用户查询提取关键实体和关系,从图数据库中检索相关信息。•生成阶段将检索到的信息作为上下文输入到语言模型中,生成准确且连贯的回答。检索增强图数据库在检索增强中的应用3.图数据库在RAG中的应用案例•知识问答系统图数据库能够快速检索与用户问题相关的实体和关系,生成高质量的问答内容。•多领域知识整合图数据库可以整合不同领域的知识,支持跨领域的查询和生成任务。•个性化内容生成根据用户的特定需求和偏好,图数据库可以定制化检索和生成过程。
AI智能体认识智能体智能体(Agent)能够自主感知环境、做出决策并执行行动以实现特定目标的系统。
大模型Agent是一种构建于大型语言模型(LLM)之上的智能体,它具备环境感知能力、自主理解、决策制定及执行行动的能力。
AI智能体智能体的系统架构(1)感知模块(2)核心处理模块(3)记忆模块
(4)规划与决策模块(5)交互模块系统架构图
AI智能体智能体的关键技术提示工程(PromptEngineering):设计指令模板引导模型行为(如角色扮演、格式约束)。微调(Fine-tuning):通过领域数据或人类反馈(RLHF)优化模型特定任务表现。多模态扩展:融合视觉、语音模型(如GPT-4V)处理跨模态任务
AI智能体智能体的工作流
智能体工作流以大型语言模型为技术基础,通过多个AI智能体的协作,将复杂任务分解为可管理的子任务,并通过迭代优化完成目标的系统。链式工作流:多个步骤按线性序列组织,一个步骤的输出作为下一个步骤的输入,形成一个连续的处理链。并行化工作流:通过同时执行多个任务或处理多个数据集,提高数据密集型操作的效率。路由工作流:根据输入条件动态指导执行路径,使系统能够在没有预定义序列的情况下适应不同情况。
AI智能体构建你专属的智能体想象这样一个场景:清晨的第一节课前,教室位置突然变更却无人通知;面对繁多的选修课,不知如何搭配才能满足学分要求;深夜复习时,找不到适配专业的高质量学习资源……这些困扰大学生的真实问题,正是智能体大显身手的舞台。
AI智能体构建你专属的智能体1.明确目标功能设计:该智能体的功能包括查询课表时间/地点、推荐专业相关学习资源、解答选课/学分等教务问题、用表情包缓解学业压力。用户画像:面向全校新生,需理解不同专业术语。
AI智能体构建你专属的智能体2.配置基础信息访问Coze官网:/用学校邮箱注册(支持Google/手机号注册)一个Coze账号,进入"CreateBot"界面。“+”开始
AI智能体构建你专属的智能体
AI智能体构建你专属的智能体
AI智能体构建你专属的智能体3.编写提示词配置智能体的第一步就是编写提示词,也就是智能体的人设与回复逻辑。智能体的人设与回复逻辑定义了智能体的基本人设,此人设会持续影响智能体在所有会话中的回复效果。
AI智能体构建你专属的智能体
AI智能体构建你专属的智能体
模型的训练数据是互联网上的公开数据,模型通常不具备垂直领域的专业知识,如果智能体涉及智能问答场景,你还需要为其添加专属的知识库,解决模型专业领域知识不足的问题。
在编排页面,定位到知识功能区域,然后单击对应的添加按钮(+)添加要使用的知识库内容。4.添加知识库
AI智能体构建你专属的智能体5.调试与发布配置好智能体后,在“预览与调试”区域中测试智能体是否符合预期。完成调试后,单击“发布”将智能体发布到各种渠道中,在终端应用中使用智能体。目前支持将智能体发布到飞书、微信、抖音、豆包等多个渠道中,你可以根据个人需求和业务场景选择合适的渠道。DeepSeek从中国出发的AI探索者在2021-2023年全球AI技术突破的窗口期,中国人工智能发展面临重要转型机遇:以GPT-4为代表的国际大模型掀起技术革命浪潮国内亟需突破应用创新局限向底层技术攻坚在此背景下,2023年中文大模型“百模大战”全面爆发,DeepSeek应运而生……DeepSeek技术架构DeepSeek采用三阶分层架构实现高效智能推理:·输入解析层:通过多模态感知网络精准识别任务本质。·知识检索层:依托超2000亿参数的领域知识库进行靶向信息提取,如同为AI配备专业智库·推理生成层:运用链式思维技术,将复杂问题拆解为可验证的逻辑单元,其独特的递归验证模块可实时检测推理漏洞。DeepSeek全能实践:多维度能力与跨领域赋能DeepSeek的核心能力源于其多模态融合架构,可同步处理文本、代码、数据、图表等多类型信息,实现从“单一工具”到“全能助手”的进化。能力维度学术场景示例行业应用延伸技术支撑点文本生成实验报告结构化写作金融年报自动生成长文本逻辑链控制技术代码开发Python爬虫脚本调试工业物联网协议转换器开发多语言代码理解框架数据分析问卷统计结果可视化解读城市交通流量预测模型构建非结构化数据提取引擎知识融合量子物理与哲学交叉研究生物制药专利知识图谱构建跨学科语义关联算法DeepSeek全能实践:多维度能力与跨领域赋能跨域创新案例:理工科穿透性应用文科创造性拓展艺术设计协同创作DeepSeekDeepSeek本地部署与知识库搭建(1)DeepSeek本地部署环境(2)安装Ollama并部署DeepSeek模型(3)安装与配置AnythingLLM(4)配置向量模型与知识库(5)知识库的使用DeepSeekDeepSeek本地部署与知识库搭建01DeepSeek本地部署环境02安装Ollama并部署DeepSeek模型安装与配置AnythingLLM配置向量模型与知识库知识库的使用030405DeepSeekDeepSeek本地部署的硬件要求DeepSeekDeepSeek本地部署的硬件要求DeepSeekDeepSeek本地部署的软件需求/提供图形界面和知识库管理功能的应用框架,如AnythingLLM。用于本地运行DeepSeek模型的开源工具,如Ollama。用于将文档转换为向量模型,如BGE-M3。DeepSeekDeepSeek本地部署打开终端(Windows使用PowerShell或命令窗口),根据硬件选择参数规模,如选择7b,输入命令下载模型。
ollama
rundeepseek-r1:7b
等待下载完成,提示“success”,表示安装成功。DeepSeekDeepSeek本地部署安装与配置AnythingLLM
/desktop)下载对应系统的安装包DeepSeekDeepSeek本地部署连接Ollama与DeepSeek
首次运行AnythingLLM,点击页面左下角的工具按钮中的设置(扳手),选择“Ollama”作为模型提供商。在“OllamaModel”中选择已下载的DeepSeek模型(deepseek-r1:7b)。DeepSeekDeepSeek本地部署
找到并点击设置菜单栏的“外观”,可以切换不同语言的界面,如在“DisplayLanguage”中选择“Chinese”DeepSeek
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年IT经理招聘笔试模拟题
- 2025年住房和城乡建设领域现场专业人员考试监理员练习题及答案
- 2025年建设工程质量检测人员考试(建筑地基与基础检测)题库及答案(池州)
- 2026年政治逻辑与思维知识体系
- 2026年卫生健康知识普及活动方案设计
- 2025年甘肃甘肃注册测绘师资格考试(测绘综合能力)题库及答案
- 2026年中国烹饪协会西点师预测题集
- 2026年证券从业资格考试考点速递
- 2026年上市公司招聘笔试模拟题及答案详解
- 2026年检验技师招聘考试仿真题集
- 2026年全国高考语文(全国Ⅰ卷)真题及答案
- 2026春西师大版小学数学四年级下册期末综合测试卷含答案
- IATF16949 五大核心工具综合培训(APQP-FMEA-SPC-MSA-PPAP)
- 人教版五年级下册道德与法治专项训练测试题(附答案)
- 股票技术指标公式参考文档
- 2026年餐厅装修设计需求说明书
- 安装与土建交叉作业施工方案1
- 初中七年级道德与法治下册《让和声更美-集体生活中的个人与规则》教学设计
- (2026版)《电力重大事故隐患判定标准及治理监督管理规定》培训
- 城市轨道交通乘客服务标准手册
- DB11T 2409-2025建筑屋顶光伏应用条件评估技术规范
评论
0/150
提交评论