智能体构建与应用开发(Python+LangChain)(微课版)课件全套 项目1-8 认识大语言模型和智能体- 部署和发布智能体_第1页
智能体构建与应用开发(Python+LangChain)(微课版)课件全套 项目1-8 认识大语言模型和智能体- 部署和发布智能体_第2页
智能体构建与应用开发(Python+LangChain)(微课版)课件全套 项目1-8 认识大语言模型和智能体- 部署和发布智能体_第3页
智能体构建与应用开发(Python+LangChain)(微课版)课件全套 项目1-8 认识大语言模型和智能体- 部署和发布智能体_第4页
智能体构建与应用开发(Python+LangChain)(微课版)课件全套 项目1-8 认识大语言模型和智能体- 部署和发布智能体_第5页
已阅读5页,还剩192页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目1认识大语言模型和智能体汇报人:时间:2026/05/01项目1认识大语言模型和智能体目录CONTENTS01项目描述02任务1-1使用Cline智能体生成代码03任务1-2使用智能运维助手配置Linux服务器01项目描述项目1认识大语言模型和智能体项目背景与人物王亮入职人工智能公司,公司专注于构建和开发智能体。作为新人,他需要尽快掌握大语言模型和智能体的基本知识,技术主管要求其首先学习大语言模型的基本原理和应用。项目任务与目标通过Cline智能体自动生成社团宣传网页、运维助手智能体自动安装和运行服务,熟悉智能体与大语言模型之间的关系以及智能体的工作流程。项目1任务思维导图如图1-1所示。02任务1-1使用Cline智能体生成代码

学习目标知识目标了解大语言模型的应用场景,了解大语言模型的发展历史,掌握智能体和大语言模型之间的关系。技能目标能够在硅基流动平台上申请API开发密钥,能够使用Cline智能体自动生成企业网站。素养目标通过学习和使用DeepSeek国产大模型,培养学生的爱国主义精神;通过学习Cline智能体,培养观察和处理技术细节,不断提升技术水平的素养。1.1.1任务描述技术变革背景2022年11月,ChatGPT大语言模型发布后,迅速渗透到各行各业,改变了传统的工作模式,其中编写程序向自动化生成代码模式转变。任务核心要求技术主管要求王亮在硅基流动平台申请大语言模型API密钥,然后安装VisualStudio工具和Cline智能体。最终交付成果在对接到硅基流动平台的大语言模型后,使用Cline智能体自动生成企业网站,完成社团宣传网页的构建任务。1.1.2必备知识大语言模型定义大语言模型(LLM)是一种基于深度学习技术的模型,通过大量文本数据训练,学习语言的结构、词汇、语法和语义,在处理自然语言任务时表现出强大能力。训练过程特点训练过程非常庞大和复杂,通常需要大量的计算资源和时间。模型通过不断优化参数,使其能够准确地理解和预测文本内容。十大应用场景涵盖智能客服、内容生成、翻译和语言转换、写作助手、编程助手、虚拟助手和对话系统、个性化推荐系统、医学和健康管理、法律和合同分析、教育和学习辅导。智能体与LLM关系智能体包含大语言模型,LLM负责语言理解、推理决策和任务规划,为智能体提供思考能力;智能体扩展感知模块和执行模块,两者共同构成完整系统。1.1.3申请大语言模型API密钥平台选择与注册由于本地部署对服务器要求高,使用网络上的大语言模型。硅基流动提供模型多,新用户注册赠送14元费用可覆盖学习成本。打开官网/zh/login,输入手机号获取验证码登录,查看模型广场中的DeepSeekV3.1和R1等模型。创建API密钥单击左侧导航栏中的API密钥,单击新建API密钥,在弹出的对话框中输入名称密码名称test,单击新建密钥按钮,完成后在API密钥页面查看用户创建的密钥。1.1.4安装Cline并集成大语言模型API安装VisualStudioCode下载运行visualstudiocode.exe,接受协议,保持默认安装位置,选择创建桌面快捷方式和添加到PATH选项,单击安装按钮完成安装。集成Cline智能体插件启动VisualStudioCode,单击左侧扩展图标,在搜索框中输入cline,选择第一项Cline插件,单击Install安装按钮,等待成功后安装Cline智能体插件。配置大语言模型API单击Cline图标,单击设置图标弹出API配置对话框,选择ActMode模式,APIProvider选择OpenAICompatible,输入硅基流动平台URL和API密钥,勾选enabled和read自动批准选项,完成配置。1.1.5自动生成社团宣传网站创建工作空间在D盘新建目录myweb,选择VisualStudioCode文件菜单下的AddFoldertoWorkspace,选择myweb目录添加,选择Yes信任目录中的文件,成功添加工作空间。输入提示词任务在Cline交互对话框输入:创建人工智能社团宣传网站,包含index.html、activity.html、contactus.html,导航栏包含首页、活动内容、联系我们,蓝白色调,自适应PC和手机浏览。智能体生成代码Cline发送请求给DeepSeek-V3,模型分析任务返回执行步骤。Cline依次创建index.html、activity.html、contactus.html、style.css文件,每个文件提示用户Save或Reject,选择Save接受代码。测试运行效果DeepSeek-V3返回TaskCompleted,提议运行index.html。选择RunCommand启动页面,测试导航栏链接,成功访问首页、活动内容页和联系我们页,验证网站功能完整。03任务1-2使用智能运维助手配置Linux服务器学习目标知识与技能目标掌握Linux服务器的应用场景,了解智能运维在企业中的应用场景;能够使用VMwareWorksation运行Linux服务器,能够使用运维助手智能体配置Linux服务。素养目标通过本地运行Linux服务器,培养学生勇于尝试、精益求精的工匠精神;通过使用运维助手智能体配置Linux服务,激发学生的求知欲望和探索精神。1.2.1任务描述任务核心内容公司准备在Linux服务器上部署网站,为降低配置难度,技术主管要求王亮通过运维助手智能体对接大语言模型与Linux服务器,使用自然语言,实现在Linux服务器上安装启动Nginx网站服务,同时配置防火墙放行Nginx服务。1.2.2必备知识Linux服务器应用场景Linux作为开源操作系统,凭借高稳定性、强大安全性和灵活可定制性,广泛应用于Web服务器、数据库服务器、文件服务器、虚拟化与云计算、邮件服务器、开发与测试环境、网络安全与防火墙等七大领域。智能运维AIOps应用场景智能运维通过自动化和智能化方式提升企业IT管理效率,包括服务器监控与管理、自动化故障修复、资源优化与调度、安全管理、性能优化与决策支持五大应用场景,减少故障保障系统稳定运行。1.2.3运行Linux服务器01安装VMwareWorksation下载vm16目录,运行VMware-workstation.exe,接受许可协议,保持默认安装位置,选择将控制台工具添加到系统PATH,去掉检查更新和体验计划选项,完成安装。02启动Linux服务器下载linux目录,启动VMwareWorksation选择文件打开,选择linux.vmx文件加载openEuler服务器,开启虚拟机,在localhostlogin处输入root,密码abc@123.com成功登录。03测试网络连通性服务器IP为28,ping测试外部网络访问,在Windows主机cmd中使用ping命令测试与服务器连通性,验证双向网络正常。1.2.4智能体集成大语言模型API与服务器对接DeepSeek大语言模型运行Linux智能体.exe,在大语言模型设置部分输入硅基流动APIURL和API密钥,测试连接成功获取116个模型,默认选择deepseek-ai/DeepSeek-V3模型。SSH连接Linux服务器输入服务器IP28、端口22、用户名root、密码abc@123.com,勾选保存设置,单击连接按钮,SSH状态从红灯变为绿灯表示成功连接。自然语言执行运维任务隐藏连接设置,输入问题:安装启动nginx服务,设置为开机自启动,配置防火墙放行nginx服务。DeepSeek-V3返回配置命令,确认风险后执行,智能体在服务器上自动运行命令完成配置。验证服务部署效果在Windows主机浏览器通过28访问linux服务器部署的nginx服务,页面显示Welcometonginx!,验证服务正常运行,任务完成。项目1认识大语言模型和智能体-小结项目一介绍了大语言模型和智能体,在任务一中介绍Cline智能体,在对接DeepSeek大语言模型后,通过自然语言自动生成社团宣传网站,在任务二中介绍智能运维助手智能体,在对接大语言模型后,通过自然语言在Linux服务器上安装和启动服务,通过二个任务的实践,使读者理解智能体和大语言模型的功能以及两者之间的关系。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目2使用Coze平台构建智能体汇报人:时间:2026/05/01

项目二使用coze平台构建智能体目录CONTENTS01项目描述与任务概览02任务2-1构建基础智能体03任务2-2构建基于工作流的智能体04任务2-3构建基于知识库的智能体05任务2-4使用AgentSkills技能沉淀用户经验01项目描述与任务概览项目2使用Coze平台构建智能体Coze平台简介Coze是北京字节跳动科技有限公司推出的低代码平台,旨在简化智能体的创建和开发流程,通过图形化界面和拖拽式操作降低技术门槛。核心功能特色平台提供大量模板和预设功能,用户可快速组合组件、设置逻辑,构建符合需求的智能体,无需编程基础即可轻松上手。应用场景价值用户可学习智能体构建基础知识,探索聊天机器人和自动化工作流程等应用场景,非常适合智能体开发者的入门学习。项目2任务思维导图四大核心任务项目包含任务2-1构建基础智能体、任务2-2构建基于工作流的智能体、任务2-3构建基于知识库的智能体、任务2-4使用AgentSkills技能沉淀用户经验四个递进模块。教学闭环设计每个任务下设学习目标、任务描述、必备知识和实操步骤四个模块,形成从基础到进阶、从简单到复杂的完整学习路径。02任务2-1构建基础智能体

任务2-1构建基础智能体学习目标知识目标掌握Coze智能体平台的功能、Coze智能体提示词的通用结构、智能体插件的功能三大核心知识要点。技能目标能够使用提示词创建语言翻译助手智能体,能够基于提示词和插件创建新闻播报助手智能体。素养目标通过提示词构建培养创新思维和创造力,通过插件构建培养逻辑思维与问题解决能力。任务2-1构建基础智能体任务描述工作情境王亮所在公司专注于智能体的构建和开发,由于刚刚接触智能体,需要学习智能体的基础知识。任务要求公司技术负责人要求王亮登录Coze智能体开发平台,熟悉基本操作,利用提示词创建语言翻译助手智能体、使用插件创建新闻播报助手智能体。Coze智能体平台核心功能角色定义与内置插件用户可使用自然语言设定AI角色,赋予专业知识与对话风格;平台集成联网搜索、天气查询等即插即用插件快速扩展功能。知识库增强与多模态交互支持上传PDF、Word等文档构建专属知识库;不仅支持文本对话,部分高级模型还具备图像识别与生成能力。自定义API与社交平台发布可将企业内部私有API便捷接入平台;构建完成的智能体可一键发布至微信、飞书等主流社交与协作平台。Coze智能体提示词通用结构角色与目标角色定义是提示词设计的起点,用简洁明确的话概括智能体核心身份;目标应聚焦1-2个核心目标确保行为一致性。技能与工作流技能列举实现目标所需的专业能力和知识储备;工作流将模糊复杂的任务转化为能够精准执行的一系列清晰指令。输出格式与限制输出格式规定回复的组织结构和呈现样式;限制条件设定行为边界和禁止事项,是保障安全性的关键环节。设计原则提示词设计是迭代过程,建议先完成角色、目标、限制三个基础部分,再逐步细化技能、流程和格式要求。智能体插件功能详解外部集成与自动化赋能插件充当智能体与外部世界连接的标准化桥梁,实现与社交媒体、办公软件、数据库的无缝集成;让智能体具备自动发送邮件、创建日历、管理文档等实际操作能力。交互增强与企业定制通过图像、语音等多模态插件增强交互体验;支持创建自定义插件,将内部CRM、ERP系统API封装成私有插件,打造专属智能助手。创建语言翻译助手智能体登录与创建登录Coze官网,单击扣子编程菜单,选择智能体开发,采用标准创建方式输入名称和功能描述。配置提示词选择单AgentLLM模式,使用通用结构提示词,输入角色和目标提示词,删除其他内容。选择模型选择DeepSeek-V3.2大语言模型,确保翻译质量和响应效果。测试验证在预览与调试窗口输入你好进行测试,验证智能体成功将中文翻译成英文。发布语言翻译助手智能体01设置开场白开场白是智能体对话的起点,具有引导、吸引和设定期望的多重作用,输入让我来帮你实现英文翻译吧。02选择发布平台可发布到Coze商店、豆包、飞书、抖音小程序、微信等平台,也可作为API或ChatSDK发布实现对接。03完成发布Coze商店默认已授权配置,直接发布后可通过立即对话或复制链接使用,同时保存到项目管理菜单。创建新闻播报助手智能体创建与配置创建智能体新闻播报助手,选择DeepSeek-V3-0324模型,搜索并添加头条相关插件,在人设与回复逻辑中设置角色和目标,使用大括号符号调用getToutiaoNews插件。测试使用在预览与调试页面输入AI创业进行测试,验证新闻播报助手调用头条新闻插件,成功列出相关新闻内容。03任务2-2构建基于工作流的智能体任务2-2构建基于工作流的智能体学习目标知识目标理解智能体中工作流的基本概念,了解工作流中节点常用数据类型,了解变量的特点。技能目标能够创建生成小红书笔记的工作流,能够创建基于工作流的智能体。素养目标通过创建工作流培养关注细节和精确执行的能力,通过创建智能体培养逻辑思维和问题解决能力。任务2-2构建基于工作流的智能体任务描述工作情境王亮帮助多个客户运营微信公众号,面临频繁的文案创作和内容优化任务,需要提高工作效率并确保文案质量。解决方案在Coze平台上基于工作流智能体,根据用户输入搜索相关素材生成个性化文案,减少手动编写时间,提高文案质量和创意。智能体中工作流的基本概念01工作流介绍Coze工作流注重自动化和灵活性,通过将多个步骤自动执行形成可复用流程,支持可视化方式组合插件、大语言模型、代码块等。02为什么需要工作流大语言模型基于概率生成内容,在高精度任务中可能无法达到理想输出,工作流能够补充大模型不足,确保流程稳定可靠。03解决的五大问题提示词无法达到预期效果、需多次调用插件或外部工具、需使用代码加工数据、需条件分支处理、需一次请求多次输出消息。工作流节点常用数据类型与变量特点基础数据类型Integer整数、String字符串、Number数字、Boolean布尔值用于表示基础数值和文本信息。复杂数据类型Object对象、Array数组用于表示结构化数据和有序元素集合,Time时间和File文件用于特定场景。模型响应类型Response_for_model表示模型处理后的结果或响应,用于机器学习和人工智能领域。变量三大特点变量有名字便于访问修改,可存储不同类型数据,可以随时更新存储内容,是灵活的数据容器。创建生成微信公众号文案的工作流创建与添加节点进入扣子编程页面单击工作流开发,输入名称wxgzh和描述。添加头条搜索插件的search功能和大模型节点,调整四个节点位置后用边连接开始、search、大模型和结束节点。编辑节点配置编辑开始节点接收input变量,search节点配置input_query,大模型节点选择DeepSeek-V3.2并设置系统提示词和用户提示词,结束节点输出大模型结果。试运行与发布工作流01试运行验证单击试运行按钮,输入DeepSeek使用技巧,等待四个节点全部运行完成后查看结果,单击预览按钮生成微信公众号文案。02正式发布确认工作流运行正常后单击发布按钮,输入版本描述,将工作流发布到资源库中供后续调用。03查看资源发布完成后在资源库的资源中可以查看刚刚发布的工作流,验证发布成功。创建使用微信公众号文案助手智能体创建与添加工作流创建新智能体微信公众号文案助手,选择DeepSeek-V3.2模型,单击工作流右侧加号按钮,选择已创建的wxgzh工作流并添加。配置与测试在人设与回复逻辑中设置角色、目标和技能,将用户输入传递给wxgzh工作流。输入deepseek使用技巧测试,验证返回文案内容。04任务2-3构建基于知识库的智能体任务2-3构建基于知识库的智能体学习目标01知识目标掌握知识库和大语言模型之间的关系,了解Coze知识库中支持的多模态数据。02技能目标能够创建课程知识库并导入知识库数据,能够发布智能体为API接口,能够在静态网页中嵌入智能体API接口。03素养目标通过创建知识库培养将复杂问题进行拆分和组装的素养,通过嵌入API培养面对挑战时保持专注和韧性。任务2-3构建基于知识库的智能体任务描述工作情境李明是某高校专业带头人,积累了大量教学素材,传统管理方式已无法满足日益增长的教学需求。解决方案王亮通过Coze平台建立全面课程资源库,支持在线更新与扩展,提升教学管理效率,增强学生实践能力与创新能力。知识库与大语言模型关系及多模态数据知识库核心价值为大模型提供精准、实时且专属的行业数据,弥补训练数据滞后、缺乏领域细节等不足,在准确性、实时更新、定制化、结构化、专业支持、安全性六方面提升回答质量。文本与表格格式文本支持PDF、TXT、MD、DOC、DOCX、在线数据、飞书、公众号、Notion;表格支持Excel、CSV、JSON格式API内容、飞书表格。图片类型支持支持JPG、JPEG、PNG等常见图像格式,用于存储和分析非文本信息,辅助展示内容。建立专业教学知识库创建知识库进入资源库菜单选择知识库,选择创建扣子知识库,选择文本格式,输入名称云计算专业和描述。上传文档支持PDF、TXT、DOC、DOCX、MD格式,每个文件不超过100M,PDF最多500页,上传本地课程资源。分段策略设置分段标识符为自定义,默认以三个井号作为标识符,分段最大长度5000,重叠度为0,内容较少时不进行分段。处理完成在分段预览页面查看原始文档和预览情况,确认后进入数据处理页面等待全部内容处理完成。创建使用教学助手智能体创建与配置创建智能体教学助手,选择DeepSeek-V3.2模型,添加云计算专业知识库,设置人设与回复逻辑定义教学助手角色和行为规范。测试验证输入共有几门课程验证返回五门课程信息,询问Linux操作系统课程有哪些项目验证返回八个教学项目,询问Apache服务配置验证返回相关配置方法。05任务2-4使用AgentSkills技能沉淀用户经验任务2-4使用AgentSkills技能沉淀用户经验学习目标01知识目标掌握Skills技能的核心概念与价值,了解Skills技能与插件、工作流的区别。02技能目标能够添加和使用平台的Skills技能,能够创建和使用自己的Skills技能。03素养目标通过使用平台Skills培养资源整合与效率意识,通过创建自己的Skills培养经验沉淀与抽象思维。Skills技能核心概念与价值及区别核心概念与价值Skills技能是可复用的工作经验包,将专业知识、操作流程、最佳实践封装成结构化模块,把隐性知识转化为显性资产。核心价值在于实现经验的固化与复用,降低知识传递成本,让通用AI按专家方式做事。与插件、工作流的区别与插件区别:插件是工具级能力集合提供外部接口,Skills是封装完整工作方法的专家系统。与工作流区别:工作流是可视化流程引擎强调执行路径,Skills是经验知识包让通用AI变成领域专家。

项目二使用coze平台构建智能体-小结项目2介绍了智能体的创建和使用方法,在任务2-1中介绍了如何基于提示词和插件创建智能体。任务2-2中首先创建了生成微信公众号文案的工作流,然后基于工作流创建智能体,任务2-3首先创建了课程知识库并向知识库中导入数据,然后基于知识库创建智能体,任务2-4中介绍了Skills技能的创建和使用。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目3熟悉LangChain开发基础汇报人:时间:2026/05/01项目3熟悉LangChain开发基础目录CONTENTS01项目描述02任务3-1配置LangChain开发环境03任务3-2使用ModelIO核心组件01项目描述项目3熟悉LangChain开发基础项目背景与需求Coze平台功能受限于预设模块,难以实现复杂业务逻辑。LangChain作为企业级开发框架,提供代码级控制能力,支持任意模型组合、自定义工具链、复杂记忆管理及本地知识库集成,实现高度定制化工作流。学习目标与价值项目3从环境搭建开始,逐步深入LangChain核心模块,掌握构建可扩展、可维护的智能应用关键技能,完成从可视化平台使用者到AI开发者的关键跨越,培养企业级AI应用开发能力。02任务3-1配置LangChain开发环境学习目标知识目标了解LangChain和大语言模型的关系,理解LangChain的核心架构设计思想,掌握框架与模型间的协同增强机制。技能目标能够完成Python环境与LangChain依赖的安装配置,能够使用PyCharm创建和调试LangChain项目,具备基础工程实践能力。素养目标掌握AI应用开发基础工程配置能力,培养依赖管理、环境排查与解决实际技术问题的综合素养。3.1.1任务描述业务场景分析王亮所在公司需要为客户开发定制化、专业级智能体应用,超出低代码平台能力范围,必须掌握主流LangChain智能体编程框架。具体任务要求从零开始搭建LangChain本地开发环境,安装Python解释器与PyCharm,通过包管理工具安装LangChain核心依赖并验证成功,为深入框架核心组件与链式开发奠定基础。3.1.2必备知识基础关系LangChain是专为LLM应用开发设计的框架,本身不提供或训练模型,而是连接开发者与各种LLM的桥梁和工具箱。协同增强通过提示模板、记忆管理、工具调用、检索增强等抽象,将单一文本生成模型升级为智能体系统。整体架构采用模块化架构,拆分为langchain-core核心抽象层、langchain主集成包、langchain-community第三方集成包。核心组件涵盖Runnable接口、LCEL表达式语言、模型层、提示系统、输出解析器、记忆模块、工具与智能体、检索器等九大组件。3.1.3安装Python解释器和集成开发环境01Python解释器安装访问官网下载Python3.12.9,自定义安装至D盘python目录,勾选添加PATH环境变量及管理员权限等关键选项。02PyCharm安装配置下载Windows版本PyCharm,完成安装选项配置,启动后修改主题为LightwithLightHeader。03项目创建新建纯Python项目,位置D:\langchain\project3,解释器类型选择项目venv,指定已安装的python.exe文件。3.1.4安装LangChain核心依赖01镜像源配置将pip默认包下载地址设置为阿里云镜像源,加快国内下载速度,提升依赖安装效率。02核心依赖包安装langchain、langchain-openai、langchain-community三个核心包及python-dotenv环境变量管理包。03包功能说明langchain提供模块化工具和标准接口,langchain-openai封装OpenAIAPI调用,python-dotenv管理敏感配置信息。04安装验证创建test_env.py导入依赖并查看langchain版本号,运行输出版本信息验证安装成功。03任务3-2使用ModelIO核心组件

学习目标知识目标了解LangChainModelIO模块核心组件,了解调用模型常用输入格式,掌握输出解析器的作用与原理。技能目标能够调用大语言模型API完成基础文本生成,设计动态提示词模板,配置输出解析器转换结构化数据。素养目标培养模块化编程思维与接口规范意识,提升自然语言交互逻辑的抽象能力。3.2.1任务描述任务要求技术主管要求王亮学习LangChainModelIO模块,通过接口调用大语言模型实现基础文本生成,创建动态提示词模板,配置输出解析器将非结构化文本转换为结构化数据格式,完成模型调用、模板应用与数据解析的完整技能链。3.2.2必备知识ModelIO核心组件大语言模型接口统一多模型源API,提示词模板动态构建指令,输出解析器格式化非结构化响应。基础输入格式纯文本格式适合简单任务,结构化消息格式区分系统、用户、助手角色,适合多轮对话。高级输入格式包括提示模板生成文本和消息、文档格式、工具函数调用格式、多模态格式等增强型输入。输出解析器作用将AI自由文本自动转换为结构化数据,实现从聊天伙伴到自主完成标准化任务智能助手的转变。3.2.3调用大语言模型01环境变量配置使用硅基流动平台API密钥,新建.env文件输入API_KEY和BASE_URL,实现配置与代码分离保障安全。02模型调用实现实例化ChatOpenAI类配置api_key、base_url、model参数,通过invoke方法发送指令并处理异常。03关键参数说明常用参数包括api_key认证、base_url服务地址、model模型标识、temperature随机性、max_tokens最大生成数等。3.2.4创建和使用提示词模板文本提示词模板PromptTemplate创建填空式文本框架,通过变量替换生成具体提示,适合批量处理和标准化任务。聊天提示词模板ChatPromptTemplate构建角色对话框架,支持系统、用户、助手三种角色,确保多轮对话格式一致。多轮对话实现将前一轮真实回复嵌入assistant消息,使AI在完整上下文中理解任务,实现连贯对话。核心方法属性包括from_template创建模板、format填充变量、format_messages生成消息列表、append追加消息等。3.2.5使用输出解析器StrOutputParser字符串输出解析器从复杂消息对象中提取纯文本内容,通过invoke方法将AIMessage转换为可读字符串。JsonOutputParserJSON输出解析器识别符合JSON格式的内容,转化为Python字典,支持通过键名访问各字段数据。CommaSeparatedListOutputParser列表解析器将逗号分隔文本转换为Python字符串列表,通过get_format_instructions生成格式指令引导模型输出。项目3熟悉LangChain开发基础-小结项目3介绍了LangChain框架的基础开发知识,帮助学习者建立起利用LangChain进行大模型应用开发的基础能力。在任务3-1中完成了LangChain及必要依赖的环境配置,为后续开发打下基础。任务3-2深入讲解了ModelIO组件,这是连接语言模型与数据输入输出的关键模块。任务3-3讲解了基础链与路由链的构建与应用,展示了如何将多个组件串联以实现复杂的处理流程。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目4实现对话上下文记忆管理汇报人:时间:2026/05/01项目4实现对话上下文记忆管理目录CONTENTS01项目描述02任务4-1配置基础记忆功能03任务4-2配置持久化记忆功能01项目描述项目4实现对话上下文记忆管理项目背景与目标AI应用需记住会话历史、重要细节及上下文关联,提供连贯、个性化的交互体验。本项目深入LangChain记忆管理,实现会话上下文的临时存储和持久化存储,为构建具备长期记忆的AI应用打下坚实基础。任务架构概览项目4任务思维导图涵盖两大核心模块:任务4-1配置基础记忆功能,实现内存中的会话缓存;任务4-2配置持久化记忆功能,支持文件与数据库级别的长期存储方案。02任务4-1配置基础记忆功能任务4-1配置基础记忆功能01学习目标体系知识目标:了解记忆必要性、Token计量、Message类作用及InMemoryChatMessageHistory特点。技能目标:配置完整会话上下文与指定轮次最近会话。素养目标:培养设计思维与工程能力。02任务场景描述王亮面临AI应用开发关键挑战:让会话应用在多轮交互中保持连贯性,为客户提供专业的连续服务体验,实现维护完整会话历史及保留最近N轮会话内容的能力。03核心知识模块必备知识包括四大板块:记忆会话上下文的必要性、Token上下文容量计量单位、Message类的核心作用、InMemoryChatMessageHistory的特点和应用场景,为后续实践奠定理论基础。记忆会话上下文的必要性信息断层现象用户每次提问需重新提供背景信息,形成失忆式会话模式。客服场景中反复陈述订单号、问题细节,导致沟通成本指数级增长。指代理解失效自然语言中30%内容依赖上下文指代,无记忆AI无法解析它、这个等代词,必须要求用户完整重复信息,破坏流畅性。交互体验割裂每次会话如与陌生人初次交流,无法建立连续性关系。教育、医疗、咨询等深度服务场景中,严重降低用户信任度。技术基石价值记忆消除重复沟通成本,支持复杂任务分解与延续,赋能个性化服务与长期关系维护,是构建差异化竞争力的核心。Token上下文容量计量单位Token核心概念与影响Token是大语言模型处理文本的最小语义单元,中文通常一个汉字对应一个Token,英文单词可能拆分为多个Tokens。每个模型有固定上下文窗口限制,Token消耗直接关联API调用成本和服务响应速度,开发者需在上下文丰富性与成本效率间寻求平衡,不同模型的Token划分存在差异。Message类的核心作用01类型体系与角色划分采用层次化类型系统:HumanMessage表示用户输入,AIMessage封装模型回复,SystemMessage承载系统指令,严格对应会话三方参与角色。02内部结构与数据表示核心结构包括content字段存储文本内容,type字段标识角色类型,additional_kwargs保存扩展参数。支持字符串与多模态内容,实现字典与对象格式转换。03高级特性与生态集成支持tool_calls工具调用字段,统一处理文本、图像等多模态输入。深度集成ChatPromptTemplate、链式调用和智能体系统,提供转换工具实现外部数据交换。InMemoryChatMessageHistory特点和应用场景核心特点零配置启动,导入即可使用;消息顺序存储,确保时序完整性;纯内存操作,纳秒级响应但程序结束后数据永久丢失;单机限制,无法跨实例同步共享状态。适用场景开发测试阶段快速验证会话流程;短期会话应用如一次性问答、简单查询工具;演示环境构建可立即运行的会话样例,无需配置后端存储服务。保存完整会话上下文环境初始化创建项目4,安装langchain等核心依赖,拷贝.env和model.py文件,建立基础开发环境。无记忆问题演示建立forget.py展示模型无法记住历史信息,每轮调用仅传入当前输入,导致AI无法回答我叫什么名字等依赖上下文的问题。完整记忆实现建立save_all.py,使用InMemoryChatMessageHistory创建存储器,通过add_message添加消息,messages属性获取历史,extend批量保存问答对。运行效果验证多轮会话完整保存,AI正确理解它指代python,实现上下文感知的连贯回复,show_history函数可视化展示会话轨迹。保存最近会话上下文截断原因分析硬件资源限制:内存显存天花板;模型架构约束:Transformer平方级复杂度与固定上下文窗口;经济性能平衡:Token消耗转化API成本;语义时效规律:最近2-4轮涵盖90%相关信息,早期内容增加认知噪声。主动截断实现建立save_limit.py,设置MAX_MESSAGES为4保留最近2轮。流程:构建临时上下文供AI理解,extend存入本轮问答,超限时通过切片history.messages[-MAX_MESSAGES:]删除最早消息,平衡连贯性与资源消耗。03任务4-2配置持久化记忆功能

任务4-2配置持久化记忆功能学习目标知识目标:了解会话持久化存储必要性,掌握LangChain常用方案。技能目标:使用本地文件、SQLite和MariaDB持久化存储。素养目标:培养数据安全意识与分布式系统思维。任务场景王亮面临应用重启导致会话记忆丢失问题,技术主管要求配置多层级持久化存储方案,确保会话记忆在不同存储介质中持久保存,保障多轮交互的一致连贯体验。持久化方案概览文件系统存储:JSON/TXT/YAML格式,简单直接;关系型数据库:MySQL/PostgreSQL/SQLite,支持复杂查询;非关系型数据库:MongoDB/Redis,灵活扩展;向量数据库:Pinecone/Chroma,支持语义检索。使用本地JSON文件存储会话核心组件与实现流程FileChatMessageHistory实现自动持久化,为每个session_id创建独立JSON文件;RunnableWithMessageHistory封装读取、注入、保存全流程;MessagesPlaceholder在模板中预留历史位置。建立chat_with_file.py,整合AI模型、提示模板和文件存储器,实现接收输入、读取历史、组合上下文、生成回答、自动保存的闭环,验证多轮对话连贯性与文件持久化效果。使用SQLite数据库存储会话01SQLite数据库特性轻量级嵌入式关系型数据库,单文件存储,无需独立服务器,Python标准库内置。提供结构化管理和SQL查询能力,B-tree索引保持性能稳定,适合本地数据管理。02核心工具链SQLChatMessageHistory实现数据库持久化存储;SQLAlchemy提供ORM和连接管理,create_engine创建数据库引擎对象,协调后续所有数据库交互。03实现与验证建立chat_with_sqlite.py,create_engine创建chat.db引擎,构建带记忆对话链。运行后将多轮对话保存到SQLite,能正确回答历史问题,结束查询显示所有记录。使用MariaDB数据库存储会话01MariaDB数据库概述开源关系型数据库管理系统,客户端-服务器架构,MySQL兼容分支,支持主从复制和集群部署,具备企业级数据解决方案能力。02环境准备步骤运行Linux服务器,使用智能体安装MariaDB,配置防火墙放行3306端口,设置root密码000000,授权远程权限,创建chat_db数据库。03代码实现建立chat_with_mariadb.py,create_engine使用mysql+pymysql连接远程数据库,构建带记忆对话链实现远程持久化存储,自动管理记忆读写。04效果验证多轮对话保存到Linux服务器chat_db数据库,查询message_store表验证数据存储,显示用户ID为001的完整会话记录,实现企业级持久化方案。项目4实现对话上下文记忆管理-小结项目4介绍LangChain中实现对话上下文记忆管理,在任务4-1中在内存中临时存储会话记录,包括存储全部会话记录和最近会话记录。任务4-2介绍了持久化存储会话记录,包括本地json文件持久化存储、SQLite轻量级数据库持久化存储、企业级的Mariadb持久化存储等三种方式。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目5构建Agent智能体与工具系统汇报人:时间:2026/05/01项目5构建Agent智能体与工具系统目录CONTENTS01项目描述02任务5-1智能体调用工具03任务5-2智能体调用MCP服务01项目描述项目5构建Agent智能体与工具系统项目背景与目标在AI应用开发中,仅实现基础对话功能已不足以满足复杂业务场景需求。本项目基于LangChain框架,通过Agent智能体与Tool工具系统深度集成,使大模型具备执行具体任务的能力。项目内容结构首先介绍工具的定义和调用方法,调用本地定义的工具;然后介绍智能体通过MCP协议调用外部工具。项目5任务思维导图展示了智能体构建与应用开发的完整任务路径。02任务5-1智能体调用工具学习目标知识目标掌握工具的基本概念,掌握广义智能体和狭义智能体的概念区别,了解大语言模型工具调用能力的发展历程。技能目标能够使用@tool装饰器创建自定义功能工具,使用create_agent方法构建智能体并装配工具列表,通过自然语言指令驱动智能体正确调用工具并解析返回结果。素养目标通过复杂任务分解培养系统工程思维,通过调试智能体的工具选择与参数传递培养工程实践能力。5.1.1任务描述任务描述在成功为AI助手赋予记忆能力,使其能连贯处理多轮对话后,技术主管要求王亮探索LangChain框架的智能体模块,学习创建工具、构建智能体,实现一个能听懂要求、选择工具、执行操作、返回结果的智能工作流,让AI不仅能对话,还能像专家一样执行具体任务。5.1.2必备知识工具的基本概念工具是智能体实现具体功能的核心执行单元,为智能体提供超越纯文本对话的专业能力延伸。每个工具是封装特定操作的标准化功能模块,输入输出接口严格定义,以便智能体准确调用并解析结果。广义智能体广义智能体是完整的端到端AI代理系统,包含大语言模型、智能体框架和专业工具集。三者深度融合,形成能独立理解复杂意图、规划多步任务并驱动工具完成实际工作的自主系统。狭义智能体狭义智能体特指AI架构中的协调与执行框架层,不包含大语言模型的认知能力,也不包含具体工具的实现,是一个纯粹的工作流引擎,负责将外部大模型的智能决策转化为具体的工具调用序列。大语言模型调用工具能力的发展历程包括工程化探索期(提示词约定与格式解析、生成并执行代码)、接口标准化期(OpenAI推出FunctionCall功能)、智能化协作期(引入智能体架构实现自主工作流引擎)三个阶段。5.1.3构建工具新建项目打开PyCharm创建项目5,导入LangChain核心依赖,安装langchain、langchain-openai、langchain-community和python-dotenv。拷贝project4中的.env文件和model.py文件到项目5根目录下。创建省会查询工具使用@tool装饰器将普通Python函数转化为AI可调用的智能工具。通过三引号文档字符串说明工具功能、参数要求、返回值和使用示例,定义省份数据字典并增强输入处理。创建数学计算工具并测试通过@tool装饰器将calculator函数转换为AI可调用的工具,使用eval()进行数学计算并通过try-except结构实现完整错误处理。将所有工具整合到all_tools列表中便于统一管理和调用。5.1.4构建智能体并调用工具创建智能体通过create_agent函数创建具有工具调用能力的智能体,将大语言模型的推理能力与外部工具的执行能力有机结合。常用参数包括model、tools和system_prompt,构建用户与大语言模型、工具集之间的智能协调者。调用工具并返回结果实现包含过程可视化的智能体交互系统。通过交互式while循环构建命令行问答界面,通过agent.invoke()触发完整推理执行工作流,通过show_process函数深度解析消息流,实现智能体内部操作过程的可视化。03任务5-2智能体调用MCP服务学习目标知识目标与技能目标掌握MCP协议的核心功能和MCP架构的核心组件。能够开发运行高德MCP服务端的程序,能够开发高德MCP客户端程序,实现智能体与外部服务的标准化集成。素养目标通过智能体集成MCP服务,培养学生构建标准化、可复用智能体工具的架构与集成能力。通过遵循MCP协议标准进行开发,培养学生理解和使用接口规范的职业习惯。5.2.1任务描述任务描述王亮在开发一个具备天气和地理查询功能的智能体后,无法获取真实的天气和地理数据,技术主管要求他为该智能体集成高德地图的MCP服务能力,实现从申请开发者密钥、运行MCP服务器、开发MCP客户端到最终智能体集成的完整链路,确保智能体能够理解用户自然语言中的查询需求,调用高德地图API并返回精准结果。5.2.2必备知识MCP协议的核心功能MCP是一个开放通用的协议标准,旨在为大语言模型提供统一的外部资源访问接口,使其能够动态调用工具和获取实时数据。MCP作为一种标准协议,就像为AI大模型提供了一个万能接口,使得AI模型能够与多种数据源和工具进行无缝连接。MCP架构的核心组件MCP采用客户端-服务器模式,包括MCP主机、MCP客户端、MCP服务器、本地资源和远程资源五个部分。MCP主机是智能应用程序,客户端负责协议通信,服务器封装特定功能,本地资源和远程资源提供数据支持。5.2.3在高德开放平台上申请开发密钥登录高德开放平台使用浏览器打开高德开放平台,使用短信登录或手机扫描二维码登录方式进行登录。首次登录时按照提示使用支付宝和邮箱进行实名验证,登录成功后单击控制台链接进入控制台。创建新应用进入控制台后选择应用管理下的我的应用,单击创建新应用按钮。输入应用名称为MCP,选择应用类型为旅游,单击新建按钮成功创建名称为MCP的应用。添加Key在MCP应用中选择添加Key链接,输入Key名称为MCP_Agent,选择服务平台为Web服务,勾选阅读并同意高德开放平台服务协议和高德开放平台隐私权政策,单击提交按钮成功创建Key开发密钥。查看配额成功创建Key后,可以选择右侧查看配额链接。高德开放平台为认证用户提供了免费的调用服务,足够学习使用。该密钥将用于后续MCP服务器的环境变量配置。5.2.4本地运行MCP服务器01查询高德MCP服务器软件包安装node.js软件,查看npm包管理工具的版本信息和默认仓库地址。使用npm查询包含amap的软件包,发现高德MCP服务器的软件包名称为@amap/amap-maps-mcp-server,其中@amap表示命名空间,是高德官方认证的包。02编写运行高德MCP服务器代码MCP服务端和客户端的通信包括stdio、Socket、SSE等方式,本任务采用Socket通信方式。导入和定义MCPServerTCP类,编写主启动函数启动MCP服务进程、建立TCP网络服务、启动工作线程。03客户端连接管理与输出转发编写客户端连接管理代码实现多客户端并发处理能力,编写MCP输出转发代码实现数据广播功能。通过持续监听MCP进程输出,将数据转发给所有连接的客户端,实现TCP网络传输的标准格式转换。5.2.5开发MCP客户端与智能体集成MCP客户端任务客户端需要完成三个核心任务:建立连接并初始化协议,查询可用工具列表,调用工具并处理结果。连接建立后按照MCP协议规范发送初始化请求,完成协议握手和会话建立。编写高德MCP客户端代码实现连接配置与初始化、底层通信处理、获取工具列表、工具调用和结果解析等功能。通过_send方法封装底层TCP连接管理、数据序列化、网络传输、响应接收和JSON解析等完整通信流程。智能体集成MCP客户端完成建立连接、智能体构建与能力集成、交互执行与闭环管理三个核心任务。通过@tool装饰器定义weather_tool和geo_tool两个核心工具函数,将远程能力封装成智能体可直接调用的本地函数接口。测试智能体启动MCP服务器端程序后运行智能体程序,输入问题北京今天的天气,智能体调用weather_tool工具获取实时天气信息。输入问题沈阳市的经度和纬度,智能体调用geo_tool工具获取经纬度信息,实现完整服务闭环。项目5构建Agent智能体与工具系统-小结项目5系统介绍了智能体与工具系统的集成演进路径。任务5-1中介绍了本地工具的定义与调用方法,让智能体掌握基础执行能力。任务5-2进一步引入了MCP(模型上下文协议)标准,讲解了通过协议化的方式发现、封装和调用外部工具服务,实现智能体能力从本地到云端、从封闭到开放的关键跨越。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目6实现RAG检索增强生成汇报人:时间:2026/05/01项目6实现RAG检索增强生成目录CONTENTS01项目描述与任务思维导图02任务6-1处理和检索文档03任务6-2持久化存储向量数据01项目描述与任务思维导图项目6实现RAG检索增强生成项目背景与目标随着企业级应用中知识库问答、智能客服等需求的增长,如何让大模型突破训练数据局限,准确高效利用外部私有或实时数据成为关键技术挑战。核心技术路线本项目首先对原始文档进行预处理与向量化表示;然后实现基于关键字匹配和语义相似度的混合检索策略;最后利用专业向量数据库对海量向量化数据进行持久化存储与高效检索。02任务6-1处理和检索文档任务6-1处理和检索文档知识目标理解文档切分的不同策略及其适用场景;了解向量化处理文档的作用;掌握关键字检索和语义检索的区别。技能目标能够将文档分割为合适的文本块;能够使用嵌入模型将文本转换为向量表示;能够实现基于关键词的精确匹配检索功能;能够实现基于向量相似度的语义检索功能。素养目标通过合理设计文档切分策略,培养学生"平衡粒度、保留语义"的信息处理思维;通过对比不同检索方法的效果,培养学生的数据驱动决策意识和优化能力。6.1.1任务描述任务需求王亮完成智能体任务开发后,技术主管提出了新的需求:为使AI助手能有效处理公司内部的专业知识查询,需构建一套文档智能处理系统,将各类内部文档(如产品手册、技术文档等)转化为结构化的可检索知识库,具体完成文档结构化切分、文本向量化表示、基于关键词和语义的检索等任务。6.1.2必备知识文档切分的不同策略及其适用场景固定长度切分与按句子切分固定长度切分按预设字符数或token数等长切割,实现简单、处理速度快,但可能切断语义单元。按句子切分基于语法规则,按句号、问号、感叹号等分割,保持语法和语义完整性。按结构切分与重叠切分按结构切分依据文档固有组织形式,如章节、段落、列表项等,适合处理高度结构化文档。重叠切分让相邻文本块保留10%-20%重叠内容,为后续处理提供关键上下文信息。按语义/主题切分按语义或主题切分通过分析文本内容结构,在主题转换或语义变化边界处分割,确保每个文本块语义相对完整和独立,适合处理结构清晰、逻辑分明的文档。策略选择要点不同切分策略各有优劣:固定长度适合标准化输入场景;句子切分适合问答系统;结构切分适合法律合同、产品说明书;重叠切分适合上下文依赖性强的场景;语义切分需要借助NLP技术识别边界。6.1.2必备知识向量化处理文档的作用实现文本的数学化表示向量化将非结构化自然语言文本转化为结构化数学向量,每个文档被映射为高维空间中的点,坐标位置编码了文本单元的语义信息,使文本处理转变为几何运算和数学分析。支持高效的语义相似度计算向量化使语义相似度计算简化为向量间距离度量,如余弦相似度、欧氏距离。语义相似的文档在向量空间中位置相近,即使使用不同词汇表达相同概念也能被识别。赋能高级人工智能任务文档向量化是RAG系统、文本分类、聚类任务的基础技术支撑。在检索增强生成系统中,向量化是连接用户查询与相关知识文档的关键桥梁。提升处理效率与可扩展性向量化后的文档表示形式统一、维度固定,便于并行计算和批量处理。可采用专门优化的向量数据库进行管理,支持快速近似最近邻搜索,构建大规模知识库和搜索引擎。6.1.2必备知识关键字检索和语义检索的区别关键字检索关键字检索的核心在于精确匹配,主要服务于目标明确的查找需求。通过比对用户输入的词汇与文档中出现的字面内容,快速返回所有包含该关键词的结果。优点是响应速度快、实现简单、技术成熟稳定;缺点是依赖字面匹配而缺乏语义理解,无法处理同义词或相关概念,检索准确性受限。语义检索语义检索的核心在于理解意图与关联,主要服务于探索性和概念性的信息需求。通过深度理解查询和文档的含义来寻找相关内容,擅长知识问答、内容推荐、学术研究等需要智能联想的场景。优点是能够深入理解语言含义,处理同义词替换、概念扩展等复杂语言现象;缺点是技术要求复杂、计算资源消耗大、响应速度通常较慢。6.1.3切分文档新建项目与固定长度切分打开PyCharm创建项目6,导入LangChain核心依赖。固定长度切分按预设字符数机械分割,示例代码设置块大小为20个字符,通过滑动窗口遍历文本,但会在语义中间切断文本。按句子切分文档基于语言标点边界进行语义分割,通过识别句号、问号等标点符号确保每个文本块都是完整语义单元。示例代码使用sentence_split函数逐个字符遍历,利用中文句号作为句子边界标识进行智能分割。按结构切分文档基于文档固有逻辑结构进行分割,通过识别换行符、标题等格式标记确保每个文本块是完整主题单元。示例代码通过识别连续空行(\n\n)将文档切分成多个独立段落单元。重叠切分文档基于滑动窗口机制进行语义增强,设定固定文本块大小和相邻块之间的重叠区域。示例代码先按标点将文本切分为独立语义单元,再采用滑动窗口组合成更大文本块,确保上下文信息在切分边界处得以保留。6.1.4向量化处理文档文档向量化概念文档向量化是通过数学表示方法将非结构化的文本内容转换为机器可处理的数值向量,运用特征提取、编码转换或模型映射等手段,构建支持相似性计算、聚类分析和高效检索的数学表示系统。示例代码结构示例代码包含数据准备、转换函数、向量化结果三个部分。词汇表word_list定义六个中文词汇,sentence_to_Vector函数将句子转换为二进制向量,通过遍历词汇表检查单词是否存在来构建向量表示。相似度比较分析句子1"猫喜欢鱼"和句子2"狗喜欢骨头"只有一个共同特征,不太相似;句子1和句子3"猫讨厌鱼"有两个共同特征但情感相反;句子1和句子4完全相同,所有特征都相同,因此完全相似。6.1.5实现关键字检索关键字检索技术概述关键字检索是通过用户提供的关键词或短语在文档中定位相关信息的搜索技术,运用文本匹配、索引构建和排序算法等手段,实现从用户查询到目标文档的定向定位过程。优缺点分析优点是响应速度快且实现简单,能够快速从海量文档中定位包含特定词汇的信息,技术成熟稳定。缺点是依赖字面匹配而缺乏语义理解,无法处理同义词、一词多义等语言现象,检索准确性受限。代码实现要点示例代码包含文档加载、文档内容显示、关键字检索、结果输出四个部分。使用TextLoader加载文档,按换行符分割为独立信息单元,采用双重循环结构进行关键字匹配检索。检索结果分析提问"上班时间"和"联系"能够正确回答,因为文档某行包含用户提问内容。但提问"公司在哪里"无法返回正确结果,因为程序只是做关键字的包含匹配,无法理解用户输入问题的语义。6.1.6实现语义检索01语义检索技术概述语义检索是通过理解用户查询意图和文档内容含义来进行信息匹配的智能搜索技术,运用语义理解、向量表示和深度学习等手段,建立从概念意图到语义空间的知识映射关系,实现智能匹配过程。02优缺点分析优点是能够深入理解语言含义而非简单字面匹配,可以处理同义词替换、概念扩展和上下文关联等复杂语言现象。缺点是技术要求复杂且计算资源消耗大,在特定专业领域因训练数据不足而表现不佳,响应速度通常比传统关键字检索慢。03代码实现核心示例代码包含初始化、创建模型类、文档解析、数据处理、语义匹配算法、输出结果六个部分。使用SiliconFlowEmbeddings类调用硅基流动API,采用余弦相似度算法计算向量相似度,阈值设为0.3,实现了从关键词匹配到语义理解的跨越。03任务6-2持久化存储向量数据任务6-2持久化存储向量数据01学习目标知识目标:掌握持久化向量数据的常用方法;掌握FAISS向量数据库的存储机制。技能目标:能够使用FAISS数据库持久化向量数据;能够查询FAISS数据库中的向量数据。素养目标:培养学生处理非结构化数据的工程化能力和系统化解决复杂问题的能力。02任务背景王亮在开发企业内部信息查询功能智能体时,每次查询都需要对文档进行向量化处理,导致响应速度慢且资源消耗大。技术主管要求他实现向量数据库的持久化存储与查询能力。03核心需求将公司文档一次性向量化并持久化存储为本地向量数据库;当智能体启动时快速加载已持久化的向量索引;确保用户使用自然语言查询时能准确返回相关文档信息。6.2.2必备知识持久化向量数据的常用方法主要包括文件系统存储、专用向量数据库、传统数据库扩展、云存储服务和混合存储架构五种方案。文件系统存储因简单直接成为最常用的方法,常用工具包含开源的FAISS、Annoy、Hnswlib,以及功能更完整的Chroma、Qdrant等。专用向量数据库如Pinecone、Weaviate、Milvus等提供分布式存储、实时更新、复杂过滤和自动缩放能力。FAISS向量数据库的存储机制FAISS是Facebook开源的向量数据库,专注于高维向量的高效相似性搜索和聚类。采用索引与元数据分离的双文件架构,索引文件存储量化编码的向量数据及检索结构,元数据文件存储向量ID到原始文档的映射关系。持久化基于faiss.write_index()和faiss.read_index()函数对实现,支持内存映射加载模式,可通过索引合并技术实现增量存储管理。6.2.3使用向量数据库存储数据功能实现流程五个阶段:连接搭建阶段配置硅基流动API连接;数据预处理阶段将数据封装为Document对象;向量转换阶段通过BAAI/bge-large-zh-v1.5模型生成向量;检索结构构建阶段利用FAISS组织成高效索引;持久化存储阶段将向量检索结构序列化为本地文件。核心代码结构导入FAISS、requests、Embeddings、Document等五个核心组件;定义SiliconEmbeddings类继承Embeddings抽象基类;创建VectorDatabaseManager类封装构建和持久化操作;定义create_documents函数构建公司信息文档集合;主程序入口实现完整的构建与持久化流程。运行结果程序向量化处理文档后,FAISS向量数据库持久化向量数据,保存到当前项目的company目录。生成索引文件和元数据文件,实现检索系统能力从临时计算到永久存储、从内存检索到持久化查询的关键跨越。6.2.4检索向量数据库功能实现流程与代码结构五个阶段:构建模型阶段加载相同嵌入模型配置;数据库加载阶段从本地文件读取已序列化的向量检索结构;查询向量化阶段将用户问题转换为查询向量;相似度匹配阶段进行近似最近邻搜索;结果返回阶段格式化输出相关知识片段。代码导入requests、FAISS、Embeddings、List四个核心组件,定义SiliconEmbeddings类,主程序通过FAISS.load_local加载数据库,使用similarity_search执行相似度搜索。测试结果与项目总结查询系统能够根据语义相似度从FAISS向量数据库中检索到与用户问题最相关的文档内容,实现了基于向量匹配的智能问答功能。项目6系统介绍了RAG检索增强生成系统的构建与优化路径,任务6-1掌握从非结构化文本中提取和查找信息的能力,任务6-2实现检索系统能力从临时计算到永久存储、从内存检索到持久化查询的关键跨越。项目6实现RAG检索增强生成-小结项目6系统介绍了RAG检索增强生成系统的构建与优化路径。任务6-1中介绍了文档处理与检索的核心技术,让系统掌握从非结构化文本中提取和查找信息的能力。任务6-2引入向量化持久存储方案,通过向量数据库实现检索数据的长期化存储,实现检索系统能力从临时计算到永久存储、从内存检索到持久化查询的关键跨越。感谢您的观看THANK

YOU

FOR

WATCHING汇报人:时间:2026/05/01项目7综合项目:设计开发个人智能学习助手汇报人:时间:2026/05/01项目7综合项目:设计开发个人智能学习助手目录CONTENTS01项目7综合项目:设计开发个人智能学习助手02任务7-1搭建项目框架并实现基础界面03任务7-2设计开发智能模块04项目小结05项目练习与思考01项目7综合项目:设计开发个人智能学习助手项目7综合项目:设计开发个人智能学习助手项目概述本项目运用项目3到项目6所学的LangChain核心技术,设计并开发一款功能完整的个人智能学习助手应用,整合ModelIO模型调用、提示词工程、对话记忆管理、Agent智能体与工具系统以及RAG检索增强生成等关键技术。项目目标构建一个具备完整前后端交互能力的智能化学习平台,通过本项目的实施,读者将深入掌握LangChain框架在实际应用开发中的综合运用能力,实现从理论学习到工程实践的转化。02任务7-1搭建项目框架并实现基础界面任务7-1搭建项目框架并实现基础界面01任务背景王亮在完成单项技能训练后,技术主管提出综合项目要求。为使智能学习助手具备完整的Web服务能力,需搭建项目基础框架并实现前后端交互界面。02核心任务完成项目目录结构组织、依赖安装、准备前端静态页面、Flask后端服务初始化等具体任务,为后续智能模块开发提供完整的运行环境和交互基础。03工程意义该任务是整个综合项目的基础环节,实现从本地脚本到Web项目服务化改造的关键工程实践,推动系统从临时进程向持久化、有状态的产品化形态转化。学习目标知识目标理解将LangChain应用从本地脚本到Web项目服务化改造的工程意义;掌握Flask框架的路由请求处理机制。技能目标能够搭建个人智能学习助手的项目目录架构;能够准备并组织前端静态页面,实现前后端基础交互;能够使用版本控制工具管理项目依赖,形成规范的开发流程。素养目标通过从零搭建完整项目框架,培养模块解耦、逐步集成的系统工程思维;通过项目目录结构的规范组织,养成结构清晰、命名规范的工程化编码习惯。能力培养本任务旨在培养读者的工程实践能力,使其能够将LangChain技术从实验环境迁移到生产环境,具备构建可交付Web应用的综合能力。7.1.1任务描述任务描述王亮在完成单项技能训练后,技术主管提出了综合项目:设计开发个人智能学习助手。在本任务中,为使智能学习助手具备完整的Web服务能力,需搭建项目基础框架并实现前后端交互界面,完成项目目录结构组织、依赖安装、准备前端静态页面、Flask后端服务初始化等具体任务。该任务是整个综合项目的基础环节,为后续智能模块的开发提供完整的运行环境和交互基础。7.1.2必备知识服务化改造的工程意义能力交付方式升级:从个人工具演变为公共服务;并发处理能力突破:支持海量请求并发处理;系统架构质变:从临时进程演进为持续运行的守护服务,从内存级临时数据升级为持久化存储,从无状态单次调用扩展为带会话管理的连续交互。Flask路由请求处理机制路由定义机制使用@app.route()装饰器,支持静态路由和动态路由;请求匹配流程按照路由注册顺序进行URL模式匹配;请求对象封装为request全局对象,包含方法、参数、表单、JSON、文件等;响应返回方式支持字符串、jsonify()、send_from_directory()、render_template()等多种类型。7.1.3搭建项目基础框架01创建项目目录启动PyCharm,将项目保存到d:\langchain\project7下。将项目5中的.env文件和model.py文件拷贝到project7目录,建立data/目录存储程序运行数据、static/目录存储前端静态页面文件、utils/目录包含四个核心功能模块、app.py作为Flask后端服务文件、requirements.txt记录项目依赖。02安装依赖优势requirements.txt管理依赖的核心价值:确保环境一致性,锁定精确版本号消除兼容性问题;提升部署效率,通过pipinstall-rrequirements.txt快速重建环境;便于维护管理,集中呈现所有第三方依赖,支持版本追溯和自动化构建。03配置依赖版本核心依赖包括:flask==3.1.2、flask-cors==6.0.2、langchain==1.2.9、langchain-community==0.4.1、langchain-openai==1.1.7、python-dotenv==1.2.1。通过终端执行pipinstall-rrequirements.txt命令完成安装,确保开发、测试、生产环境完全一致。7.1.4启动Flask后端服务器准备前端静态页面前端通过HTML搭建页面结构,CSS美化视觉样式,JavaScript实现与后端API的异步交互。3个前端页面文件(index.html、style.css、script.js)从教材资源下载并拷贝到static目录。编写启动服务代码导入依赖模块、创建Flask应用实例、配置静态首页路由@app.route('/')返回index.html、配置静态资源路由@app.route('/<<path:filename>')返回CSS/JS/图片等资源文件。增加API接口定义四个POST接口:/api/upload文件上传接口、/api/ask智能问答接口、/api/plan学习计划接口、/api/timer计时器工具接口,均使用pass占位待后续实现。启动测试服务通过app.run(host='',port=5000,debug=True)启动开发服务器。本地访问地址:5000,远程访问地址05:5000,可查看首页、智能问答、学习计划、学习工具四个页面。03任务7-2设计开发智能模块任务7-2设计开发智能模块任务背景在构建了Web服务框架后,技术主管要求王亮将LangChain的RAG检索增强生成、对话记忆管理、智能体与工具系统等关键技术落地为可交付的功能模块,将分散的技术点整合为具有实际业务价值的完整功能。核心模块具体包括:实现文档的上传和切分、开发基于关键词匹配的知识问答能力、配置会话记忆的持久化存储机制、生成个性化学习计划、封装定时器工具并集成到智能体,体现从学习到应用的转化能力。学习目标知识目标理解Web服务层与业务逻辑层的关系;掌握前后端与业务逻辑三层数据传递机制,明确各层职责边界和数据流转规则。技能目标能够开发基于RAG的智能问答模块,实现上下文感知的精准回答;能够实现基于JSON文件的会话持久化存储;能够开发个性化学习计划生成模块;能够构建智能体工具系统,实现定时器功能。素养目标通过RAG系统的完整构建,培养数据驱动、检索先行的智能问答系统设计思维;在完整智能模块的开发实践中,塑造问题分解、逐步迭代的工程攻关能力。7.2.1任务描述任务描述在构建了Web服务框架后

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论