智能体项目开发实战(扣子)(微课版)课件 项目5、6 开发多模态智能体、搭建复杂的工作流与智能体_第1页
智能体项目开发实战(扣子)(微课版)课件 项目5、6 开发多模态智能体、搭建复杂的工作流与智能体_第2页
智能体项目开发实战(扣子)(微课版)课件 项目5、6 开发多模态智能体、搭建复杂的工作流与智能体_第3页
智能体项目开发实战(扣子)(微课版)课件 项目5、6 开发多模态智能体、搭建复杂的工作流与智能体_第4页
智能体项目开发实战(扣子)(微课版)课件 项目5、6 开发多模态智能体、搭建复杂的工作流与智能体_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目5开发多模态智能体工信精品人工智能系列教材《智能体项目开发实战(扣子)(微课版)》目录01多模态智能体概述02创建图像类智能体03创建音频类智能体04创建视频类智能体05课后实践项目5开发多模态智能体5.1多模态智能体概述了解多模态智能体的特点、类型与扣子编程的多模态处理能力5.1项目引入与学习目标项目引入多模态智能体能够综合处理图像、音频、视频等多种信息,在内容创作、技能辅导、媒体编辑等领域开启全新应用场景。扣子编程集成强大的多模态模型与工具,极大降低开发门槛。知识目标了解多模态智能体的特点了解多模态智能体的类型了解扣子编程的多模态处理能力能力目标能够创建图像类智能体能够创建音频类智能体能够创建视频类智能体素养目标培养媒体融合的工程思维培养解决垂直领域问题的创新能力树立合规采集音视频数据的意识项目5开发多模态智能体04引入三维教学目标5.1.1什么是多模态智能体多模态智能体是指能够同时处理和理解至少两种模态信息(如文本、图像、音频、视频等)的智能体,通过模拟人类多感官认知方式,提供更自然、精准的交互体验。感知组件接收并解析多模态输入支持文本、图像、音频、视频等多种格式输入多源化,格式多样化决策组件进行意图识别与上下文理解知识检索与逻辑推理生成执行计划,处理跨模态语义关联动作组件调用工具生成多模态回答输出文本转语音、文生图、视频生成输出形态丰富化、多样化适用场景内容创作:自动化完成短视频生成、海报设计、多语言文案创作教育辅导:个性化学习助手,支持图文音视频多模态交互企业服务:智能客服、数据分析和报告生成项目5开发多模态智能体055.1.2扣子编程的多模态处理能力能力支柱之一:丰富的多模态插件扣子编程集成官方与第三方插件,覆盖图像生成、语音合成、视频生成等多个领域,可供智能体随时调用以扩展其多模态能力。项目5开发多模态智能体07能力支柱之二:多模态模型多模态模型是能够同时理解和处理多种类型信息(文本、图像、音频、视频等)的AI模型,是多模态智能体实现复杂任务的核心引擎。字节跳动豆包系列"豆包·1.6"系列—支持视觉理解"豆包·1.8·深度思考"—深度推理"豆包·2.0"系列—新一代多模态"Doubao-音乐生成"模型"Doubao-图像生成"模型阶跃星辰系列"阶跃星辰·1v·图片理解""阶跃星辰·10-turbo·视频理解"专注于视觉内容深度理解支持复杂场景分析与推理能力支柱之三:支持多模态创作的工作流节点扣子编程直接提供图像处理和音视频处理两类工作流节点,本质上是调用相应官方插件的图形化接口,开发者可更便捷地集成多模态处理能力。5.2创建图像类智能体掌握图像感知理解、图像生成与图像处理的核心技能5.2.1图像类智能体的应用场景图像内容理解与描述识别图片中的物体、场景、动作生成自然语言描述提供图片的语音解说应用于智能导览、无障碍辅助等场景视觉问答根据输入的图片回答用户问题教学场景:学生上传几何题照片智能体识别图片内容并解答应用于教育辅导、技术支持等文生图与创意生成根据文字描述(提示词)生成图像为营销文案快速生成配图为教学内容创作古诗词意境画应用于广告设计、内容创作等图像增强与编辑通过自然语言指令优化图像风格转换与内容修改抠图、美颜、提升画质应用于图像处理、设计辅助等项目5开发多模态智能体115.2.2图像感知与理解使用"图片理解"插件或具有视觉理解能力的多模态大模型实现图像感知与理解。两类工具的核心区别如下:对比项"图片理解"插件多模态大模型核心定位专用工具,执行确定性任务通用智能,大模型原生多模态能力工作模式接收指令,返回标准化识别结果生成式对话,图片作为上下文进行推理输出特点结构化数据,适合程序化调用自然语言回复,更人性化适用场景自动化流程,批量提取信息交互式应用,创意推理主要能力●多维度内容识别●OCR光学字符识别●专项元素识别●语义理解与描述生成项目5开发多模态智能体12同步训练5-1测试图像感知与理解能力搭建工作流,通过"图片理解"插件和大模型节点测试扣子编程的图像感知与理解能力,对比两者输出差异。1创建test_imgRecog工作流,配置开始节点变量image(Image类型)和instruction(String类型)2添加"图片理解"插件节点(imgUnderstand工具),设置text和url输入变量3添加大模型节点("豆包·1.6·极致速度"),设置视觉理解输入变量image4连接结束节点,设置两个输出变量:output_plugin(插件输出)和output_llm(大模型输出)5试运行:上传图片,输入指令(如"图中有什么"),对比插件输出(格式化风格)与大模型输出(自然语言风格)输出对比分析图片理解插件速度较慢,输出内容具有典型的插件格式化输出风格返回结构化数据,适合后续程序化处理执行确定性任务,结果稳定可靠大模型-视觉理解速度较快,输出内容具有典型的大模型输出风格返回自然语言描述,更人性化能处理模糊指令和开放式问题项目5开发多模态智能体135.2.3图像生成——图像生成节点图像生成节点是扣子编程的图像生成核心工具,支持文生图和图生图。配置说明主要参数模型设置选择生成图片的模型及参数模型:Seedream4.0/3.0/动漫/人像等比例:支持多种宽高比水印:Seedream支持AI生成水印数量/质量:控制生成张数与精细度参考图生成图像的参考图(图生图)参考模式:空间关系/人物姿势等参考图:上传图片或引用上游输出参考程度:越高图像越相似提示词图像模型的生成指令正向提示词:必选,描述期望画面内容负向提示词:可选,描述不希望出现的内容支持中文提示词和中英文混合扣子编程的图像生成节点完全支持中文提示词,可直接用中文描述画面。对于国际通用技术术语,使用英文可能使模型识别更精准。Seedream4.0/4.5模型使用费用偏高,官方提倡优先使用Seedream系列替代原有通用模型。项目5开发多模态智能体145.2.2图像生成——画板节点与图像处理插件画板节点支持自定义绘制的图形创作节点应用场景:电商海报、营销广告、社交媒体配图变量元素:引用上游节点输出变量作为画板元素固定元素:本地上传图片、固定文本、绘制图形可设置元素图层、画板尺寸、颜色、透明度图像处理插件扣子编程提供丰富的图像处理插件●智能抠图—自动去除背景●风格滤镜—艺术风格转换●提示词优化—提升生成质量●图片裁剪/美颜/画质提升不同插件节点对应不同配置参数项目5开发多模态智能体15同步训练5-2搭建图像处理工作流"搜图→抠图→加滤镜"1创建与搜索创建img_process工作流,添加"头条图片搜索"插件,设置keyword变量2循环处理添加循环节点(数组循环),循环数组为搜索结果result3智能抠图循环体中添加"智能抠图"插件(cutout工具),自动去除背景4风格滤镜循环体中添加"风格滤镜"插件(style_transfer工具),风格变量设为"搞笑涂鸦",原图变量为cutout输出5输出与测试连接结束节点,循环输出变量为style_transfer的data。试运行输入"小狗",查看"搜图→抠图→加滤镜"完整流程项目5开发多模态智能体16案例实战5-1环保主题公益海报生成器(一)用户输入环保主题(如"保护森林"),智能体自动生成包含匹配背景图、醒目标题和行动口号的完整公益海报。核心技术:大模型节点(文案)+图像生成节点(背景)+画板节点(排版)1创建工作流创建poster_generator工作流,描述为"自动化生成主题海报"。配置开始节点输入变量theme(必填,描述"环保主题")2文案生成添加"文案生成"大模型节点。系统提示词设定为环保宣传文案策划,输出严格JSON格式:{"title":"...","slogan":"..."}3文本处理添加文本处理节点,选择"字符串拼接"。输入变量String1和String2分别引用文案生成的title和slogan,拼接命令:{{String1}},{{String2}}4图像生成添加图像生成节点。模型选择"Seedream4.0",比例"9:16"。正向提示词:公益海报背景+自然风光+生态和谐+高质量摄影。负向提示词:text,watermark,human项目5开发多模态智能体17案例实战5-1环保主题公益海报生成器(二)5画板节点排版添加画板节点,设置3个元素:image(背景图,引用图像生成data)、title、slogan(引用文案生成输出)编辑画板:尺寸1080x1920像素,背景图透明度降低以便显示文字,设置文本样式(字体、颜色、位置)6测试与发布连接画板节点与结束节点,结束节点输出变量为画板data值试运行:输入主题词"保护森林",查看生成的公益海报效果测试无误后发布工作流项目5开发多模态智能体18案例实战5-1环保主题公益海报生成器(三)创建智能体调用工作流新建"环保主题公益海报生成器"智能体,功能介绍:"根据您的环保主题,一键生成宣传海报"在"编排"面板添加poster_generator工作流,编写提示词(角色:环保宣传设计助手;技能:调用工作流生成海报)案例核心要点●大模型节点负责生成结构化文案(JSON格式),确保输出可控●文本处理节点实现字符串拼接,将多个输出组合为图像生成提示词●画板节点是多模态图文排版的核心,掌握多层元素合成和文本样式设置●负向提示词可有效过滤不希望出现的元素(如文字、水印、人物)项目5开发多模态智能体18案例实战5-2小红书文案生成器(一)用户输入产品或主题,智能体自动生成包含标题、正文、话题标签的完整小红书文案,并配AI生成风格图片。图文排版采用Markdown格式混合呈现文本和图片。1创建工作流创建xhs_note工作流,描述"自动化生成小红书文案"。配置开始节点输入变量description(必填)2文案生成添加"文案生成"大模型节点。人设:百万粉丝资深小红书美妆时尚博主。核心技能:标题创作、文案结构、语言风格、话题标签输出格式要求标题:带数字、悬念、情绪符号的"炸裂式"标题正文:严格运用"痛点引入→亲身体验→效果对比→行动号召"的黄金公式语言风格:口语化、亲切,善用感叹词、表情和网络热词,营造"闺蜜安利"真实感话题标签:自动添加3~5个精准热门标签,如"#好物分享""#护肤"输出格式:标题:.../正文:.../标签:#标签1#标签2#标签3项目5开发多模态智能体19案例实战5-2小红书文案生成器(二)3提示词生成添加"提示词生成"大模型节点。人设:AI绘画提示词工程师。将文案主题和内容转化为详细、专业的英文AI绘画提示词(包含主体、场景、风格、色彩、光线等细节)4图像生成添加图像生成节点。模型选择"Seedream4.0",比例"3:4"。正向提示词引用提示词生成节点的output。为提升响应速度,两个大模型节点均可选择响应更快的版本5结束节点与Markdown返回配置结束节点:text变量引用文案生成output,image变量引用图像生成data。返回文本使用Markdown格式混合呈现文案和配图预览。扣子编程支持富文本渲染,可直接在小红书等平台预览页面中显示图文并茂的效果项目5开发多模态智能体20案例实战5-2小红书文案生成器(三)智能体配置与测试●创建"小红书文案生成器"智能体,功能介绍:"专注于生成符合小红书平台调性的高互动率图文笔记"●在"编排"面板添加xhs_note工作流,编写提示词(角色:文案小助手;技能:自动调用工作流处理请求)●配置开场白:"Hi,我是你的文案小助手!请告诉我你想推广的产品或主题..."●测试:输入产品描述,智能体自动返回完整小红书文案和配图项目5开发多模态智能体205.3创建音频类智能体掌握音频类智能体的开发,让智能体能听、能说、能创作5.3.1音频类智能体的应用场景智能语音助手内容创作与播客生成无障碍交互语言学习与培训音乐创作与辅助项目5开发多模态智能体225.3.2音视频通话提升对话体验在智能客服、智能穿戴、语音陪伴等场景中,为智能体开启音视频通话功能并合理设置音色,可显著提升交互的丰富性和生动性。开启音视频通话在智能体编辑页面的"编排"面板中设置允许用户通过语音或视频与智能体实时沟通可设置音色和默认输入方式合适的音色能增强用户好感和信任发布平台差异发布至扣子商店:支持语音、视频、屏幕共享发布到豆包:仅支持语音通话功能根据目标平台选择合适的交互方式项目5开发多模态智能体23案例实战5-3英语口语陪练(一)创建"Lucy英语口语陪练"智能体,启用文本和语音两种模态,用于对话练习和发音纠正。流程围绕"选择主题→开展对话→记录进度→再选择新主题"循环展开。1创建智能体与变量创建"Lucy英语口语陪练"智能体。创建两个用户变量:current_topic(记录当前主题)、practiced_topics(记录已练习主题,实现进度跟踪)2编写提示词角色:友好耐心的AI口语陪练老师Lucy,美式英语,语速适中,发音清晰。技能1:选择练习主题(优先推荐新主题)。技能2:围绕主题练习对话(自适应难度、纠错鼓励)项目5开发多模态智能体243设置开场白与音色设置开场白:"Hello!I'mLucy,yourEnglishspeakingpartner.Whatwouldyouliketotalkabouttoday?"在"编排"面板"对话体验"中找到"音视频",语言选择"英语",音色选择"Lily"4开启语音通话回到"音视频"区域,开启语音通话功能用户可选择语音输入,或让智能体朗读对话文本朗读功能超出免费额度后需付费案例实战5-3英语口语陪练(二)5测试主题选择与纠错能力测试练习主题选择:智能体给出主题列表供用户选择,并提示已练习过的主题。选择主题后,智能体引导围绕该主题进行口语对话练习。测试纠错能力:故意输入"Igotoschoolyesterday.",智能体以鼓励方式纠正为"Iwenttoschoolyesterday."并给出简单解释。项目5开发多模态智能体255.3.3扣子编程的音频处理能力能力说明技术实现语音识别将语音转换为文本,是音频类智能体的"听觉系统""语音识别"插件(录音质检、会议总结、音频内容分析)"大模型语音识别"插件(多语种、方言、口音识别更准确)直接使用OpenAPI,第三方插件(如"腾讯云语音识别")语音合成将文本转换为自然流畅的语音,是音频类智能体的"发声系统""语音合成"插件、"语音合成火山版"插件(根据音色和文本合成音频)"语音播客"插件(专为文本转语音播客场景设计)直接使用OpenAPI,第三方插件(如"DubbingX语音合成")实时通信与音频处理实现高质量实时交互,全双工通信,像真人对话一样直接为智能体开启语音通话功能声纹识别(提取说话人声音特征,自动核验身份)硬件设备基于WebSocket实现语音交互基于RTC实现按键说话、语义判停、语音控制设备音乐生成与理解赋予音频类智能体"创作"和"分析"音乐的能力"音乐生成"插件、"Doubao-音乐生成"插件(根据输入或歌词生成歌曲)"音乐搜索和播放"插件第三方插件(如"网易云音乐")项目5开发多模态智能体26同步训练5-3搭建语音播客使用"语音播客"插件搭建工作流,用户输入播客文本内容,工作流生成播客内容和音频链接,完成文字变播客的全过程。1创建工作流创建test_genPodcast工作流,描述"自动化生成播客音频"2配置播客插件添加"语音播客"插件(genPodcastURL工具),设置input_text和use_head_music=true3设置超时时间超时时间设置为"600"(秒),展开"异常处理"才能设置该项4添加选择器节点配置选择器节点,条件为genPodcastURL节点的输出变量code值为0(表示成功),否则为失败分支5输出节点与测试成功分支添加输出节点(输出播客链接),连接结束节点。试运行输入"为什么要学习AI智能体开发?"项目5开发多模态智能体27同步训练5-3搭建语音播客使用"语音播客"插件搭建工作流,用户输入播客文本内容,工作流生成播客内容和音频链接,完成文字变播客的全过程。项目5开发多模态智能体275.4创建视频类智能体掌握视频分析与理解、视频生成与编辑的核心技能5.4.1视频类智能体的应用场景视频类智能体需要处理时间维度上的连续信息,同步处理图像、音频和文本信息,技术架构更加复杂,应用场景更加广泛。视频内容分析与摘要视频创作与编辑交互式视频体验视频类智能体的技术挑战视频信息融合:需要同步处理图像、音频和文本信息,理解时间维度上的连续变化计算资源需求:视频处理通常需要更高的计算能力和存储资源实时性要求:交互式视频应用对延迟和响应速度有更高要求项目5开发多模态智能体295.4.2扣子编程的视频处理能力能力说明技术实现多模态信息提取从视频中提取图像、音频、文本信息视频提取音频节点、视频抽帧节点第三方视频下载和视频提取类插件视频分析与理解对视频信息进行深度分析和理解具有视觉理解功能的大模型(如"豆包·1.6·视觉理解")第三方视频理解和视频解析类插件视频生成与编辑自动生成视频、剪辑与合成、添加特效视频生成节点、"Doubao-视频生成"插件"视频剪辑"插件(字幕添加、音视频合成、视频拼接、插帧、超分辨率)第三方插件(如剪映系列)视频通话高质量、低延迟、支持视频流的实时对话直接为智能体开启视频通话功能支持实时视频交互和屏幕共享项目5开发多模态智能体30同步训练5-4搭建视频处理工作流搭建test_videoFunc工作流,测试扣子编程的视频处理能力,对用户输入的视频文件进行分析并提取其中的音频。1创建工作流创建test_videoFunc工作流。配置开始节点输入变量vedio_file(类型为Video,必填)2视频分析添加"大模型-视频分析"节点,选择"豆包·1.6·视觉理解"模型,设置视觉理解输入变量vedio_file3提取音频添加"视频提取音频"节点,设置输入变量video为vedio_file,输出音频格式选择"mp3"4结束节点配置连接结束节点,设置输出变量report(引用视频分析output)和mp3_file(引用提取的audio)5试运行测试上传视频文件,单击"试运行",智能体给出视频分析报告和提取的音频文件链接项目5开发多模态智能体31案例实战5-4一键生成景点推介短视频(一)用户输入景点名称,智能体自动生成可编辑的剪映草稿。结合速推AIGC插件体系,将大模型文本生成、文生图、文生音频、视频合成串联起来,实现一键生成景点推介短视频。整体流程设计输入景点名称生成解说词文本转语音文生图视频剪辑合成输出剪映草稿技术方案:结合速推AIGC提供的"视频合成_剪映小助手"和"剪映小助手数据生成器"插件,实现从内容生成到视频合成的全自动化流程。所需资源均在扣子编程免费额度内。关键技术组件文本生成大模型节点生成景点解说词口语化断句,每1~2短句换行输出Array<String>类型语音合成批处理节点批量转换解说词"语音合成"插件speech_synthesisvoice_id选择"甜美悦悦"视频合成速推AIGC剪映插件体系create_draft+add_audios+add_images+add_captions字幕最后添加,防止被遮挡项目5开发多模态智能体32案例实战5-4一键生成景点推介短视频(二)创建工作流与解说词生成创建spot_video工作流。添加"解说词生成"大模型节点(旅游视频解说词创作者人设),输出变量commentary类型为Array<String>。严格遵循口语节奏,每1~2个短句后必须换行,单个句子不超过20字。项目5开发多模态智能体33案例实战5-4一键生成景点推介短视频(三)语音合成(批处理节点)在解说词生成节点后添加批处理节点,重命名为"语音合成"。设置输入变量input的值为解说词生成节点的输出变量commentary的值。在批处理体中添加"语音合成"插件节点(speech_synthesis工具),配置如下:●输入变量text:引用语音合成节点的输入变量input●voice_id选择"甜美悦悦"●将子节点与批处理体右侧小蓝点连接,完成批处理体配置●将语音合成节点的输出变量speeches设置为speech_synthesis节点的输出变量link的值(语音文件链接)项目5开发多模态智能体33案例实战5-4一键生成景点推介短视频(四)文生图功能提示词生成在语音合成节点后添加"提示词生成"大模型节点。人设:AI视觉内容创作专家,将景点文案转化为高质量英文文生图提示词。输入变量:commentary(解说词生成输出)和spot(开始节点input)。输出变量prompts类型为Array<String>。文生图(批处理节点)在提示词生成节点后添加批处理节点,重命名为"文生图",并行运行数量设置为2。设置输入变量prompts的值为提示词生成节点的输出变量commentary的值。在批处理体中添加图像生成子节点:模型选择"Seedream4.5",正向提示词引用prompts。将图像生成子节点与批处理体右侧小蓝点连接,完成批处理体配置。将文生图节点的输出变量images设置为图像生成节点的输出变量data的值。项目5开发多模态智能体34提示词生成要求每行解说词生成一份提示词。提示词需包含:核心场景与主体、环境与氛围(时间/天气/光影/色彩)、构图与视角、画质与风格。禁止使用模糊词汇,必须用具体细节体现。案例实战5-4一键生成景点推介短视频(五)视频剪辑合成使用速推AIGC两个插件:"视频合成_剪映小助手"和"剪映小助手数据生成器",按顺序完成视频剪辑合成。1创建剪映草稿添加"视频合成_剪映小助手"插件(create_draft工具)设置草稿高度和宽度(与图像生成比例一致)2获取时间线添加"剪映小助手数据生成器"(audio_timelines工具)输入变量links引用语音合成的speeches3制作音频数据添加audio_infos工具mp3_urls引用speeches,timelines引用audio_timelines输出4批量添加音频与图片add_audios工具:audio_infos引用audio_infos输出,draft_url引用create_draft输出add_images工具:image_infos引用imgs_infos输出,draft_url引用create_draft输出5添加字幕caption_infos工具:texts引用解说词commentary,timelines引用audio_timelinesadd_captions工具:captions引用caption_infos输出。注意:字幕应当最后添加,防止被遮挡素材添加顺序(非常重要)正确的添加顺序:音频→图片→字幕。字幕必须最后添加,以防止字幕被音频或图片素材遮挡。入场/出场动画:图片可设置"淡入""淡出",字幕可设置"飞入""飞出"等动画效果。项目5开发多模态智能体35案例实战5-4一键生成景点推介短视频(六)测试与发布工作流打开"试运行"面板,输入"北京故宫",单击"试运行"按钮。输出剪映草稿链接,存储在云端。发布工作流。案例实战5-4一键生成景点推介短视频(七)下载剪映草稿下载安装速推AIGC剪映小助手和剪映。将草稿链接粘贴到剪映小助手,单击"创建剪映草稿"下载到本地。在剪映中编辑导出在剪映"本地草稿"列表中查看下载的草稿。播放预览,根据需要进一步编辑,然后导出发布。项目5开发多模态智能体36案例实战5-4一键生成景点推介短视频(八)创建智能体创建"景点短视频生成小精灵"智能体。添加spot_video工作流。配置唯一性核查提示词(如"故宫"需确认是北京故宫还是沈阳故宫)。项目5开发多模态智能体365.5课后实践1图像生成工作流创建一个简单的工作流,使用图像生成节点的文生图和图生图能力。建议先根据提示词生成图像,再以此图像作为参考图生成具有特定风格(如动漫)的图像。体验Seedream系列模型的不同风格效果。2看图讲故事工作流根据上传的图片生成一个生动的小故事,再将其转换为语音以便播放。使用具有视觉理解能力的多模态大模型实现看图生文,使用官方插件"语音合成"实现文本转语音。提示词示例:"你是一位优秀的儿童故事创作者。请根据对图片的分析内容,创作一个简短、有趣、适合学龄前儿童听的故事。"3视频处理工作流创建一个简单的视频处理工作流,抽取视频的关键帧并生成视频摘要。使用视频抽帧节点抽取上传的视频文件的关键帧,然后使用具有视觉理解能力的多模态大模型基于关键帧生成视频摘要。项目5开发多模态智能体37项目5总结开发多模态智能体图像类智能体图像感知与理解图像生成(文生图/图生图)图像处理与画板排版音频类智能体语音识别与合成音视频通话体验音乐生成与播客视频类智能体视频分析与理解视频生成与编辑视频通话与合成《智能体项目开发实战(扣子)(微课版)》人民邮电出版社项目6搭建复杂的工作流与智能体工信精品人工智能系列教材《智能体项目开发实战(扣子)(微课版)》项目6搭建复杂的工作流与智能体目录01工作流进阶02多Agent模式智能体开发03课后实践业务逻辑节点、工作流嵌套合同金额审查、多平台文案生成多Agent模式概述与切换电商客服模拟实战改进工作流、代码节点练习工作流嵌套改造、添加Agent节点项目6搭建复杂的工作流与智能体02学习目标知识目标了解业务逻辑节点了解工作流嵌套了解多Agent模式智能体能力目标运用业务逻辑节点创建工作流通过工作流嵌套实现业务逻辑模块化设计多Agent模式智能体协同工作素养目标培养模块化的工程思维培养精益求精的工匠精神提高分析和解决复杂问题的能力项目6搭建复杂的工作流与智能体03项目引入在掌握了智能体的基本开发技能之后,本项目将介绍如何搭建复杂的工作流和多Agent模式智能体。本项目首先介绍如何利用业务逻辑节点精准控制工作流,并通过工作流嵌套将复杂业务逻辑模块化;然后引领读者探索多Agent模式智能体的开发,让多个具备不同专长的智能体协同工作,从解决单一问题转向处理复杂的系统性任务。学习路径业务逻辑节点精准控制工作流工作流嵌套模块化复杂业务多Agent模式智能体协同工作实战项目6搭建复杂的工作流与智能体046.1工作流进阶利用业务逻辑节点精准控制工作流,通过工作流嵌套实现复杂业务逻辑模块化项目6搭建复杂的工作流与智能体056.1.1业务逻辑节点业务逻辑节点是工作流中进行复杂判断、流程控制和数据处理的核心组件,将传统编程逻辑封装为可视化模块。选择器节点条件分支控制意图识别节点识别用户意图批处理节点并行批量处理循环节点串行重复执行代码节点自定义业务逻辑变量聚合节点多路输出整合这些节点将大模型的生成能力与确定性的业务规则结合,大幅提升复杂AI项目的可靠性和执行效率。项目6搭建复杂的工作流与智能体076.1.1业务逻辑节点——批处理节点与循环节点的区别对比项批处理节点循环节点目标定位大规模、任务间无依赖的批量操作任务有先后顺序或需要结果依赖的场景执行方式并行执行串行执行数据依赖任务间相互独立,无先后顺序要求当前任务可以依赖上一次循环的结果中断能力不支持提前终止,会处理完当前批次支持通过终止循环节点提前跳出,灵活性高资源配置可设置并行数量,占用资源较多每次只处理一个任务,资源占用稳定可控运行控制仅支持处理数组参数,运行次数默认为数组长度使用数组循环、指定循环次数和无限循环适用场景批量生成图像、批量查询数据、大规模数据并行分析连续对话生成、多步骤有状态的数据处理(如依次审批)项目6搭建复杂的工作流与智能体086.1.1业务逻辑节点——代码节点支持语言JavaScriptPython网页版代码IDE,支持AI插件辅助编写核心能力数据转换与处理数字计算与逻辑判断调用外部API开发优势无须考虑代码部署专注代码逻辑即可AI辅助编写与调试项目6搭建复杂的工作流与智能体0901接收参数所有上游节点传递的数据封装在params对象中示例:constcityName=params['city']02编写代码实现业务逻辑:数据转换、数字计算、调用外部API等整合上游节点数据,生成数组类型输出结果03返回结果必须将结果封装到对象中返回即使仅有一个输出,也务必以对象形式返回6.1.1业务逻辑节点——变量聚合节点变量聚合节点的核心作用是将多路分支的输出变量整合成统一的输出,简化下游节点配置。问题场景工作流设计了多个分支,如果有任意一个分支未运行,汇总输出的节点会从该分支读取空值,导致工作流报错。解决方案使用变量聚合节点聚合多路分支的输出变量,它会读取多路分支中第一个不为空值的变量,供下游节点使用。核心特性适用于完成条件分支或并行任务后需要汇总结果的场景无需额外处理未运行分支的输出结果,从而简化工作流同一分组内的变量数据类型必须相同(通常为String类型)项目6搭建复杂的工作流与智能体11同步训练6-1基于变量聚合节点创建知识问答工作流训练目标:当用户提问时,变量聚合节点从3个并行的查询渠道中选择一个有效且相关的答案,并传递给用户。分支一:联网问答使用"联网问答(免费版)"插件从多个网站搜索信息并返回结构化数据分支二:头条搜索使用"头条搜索"插件搜索用户询问的内容并返回结果分支三:大模型生成使用大模型节点基于内置知识生成简要回答变量聚合节点:按优先级聚合三个分支的输出(联网问答→头条搜索→大模型),返回第一个非空值项目6搭建复杂的工作流与智能体12同步训练6-11创建工作流创建名为info_qa的工作流,描述为"知识问答"2配置开始节点将输入变量input改为question,勾选"必填"3添加联网问答插件添加"联网问答(免费版)"的search_url工具,设置query=question4添加链接读取插件在联网问答节点后添加"链接读取"的LinkReaderPlugin,处理返回结果提示:"链接读取"插件用于获取URL链接下的标题和内容,从输出变量data(对象数组)中选择url字段。项目6搭建复杂的工作流与智能体13基于变量聚合节点创建知识问答工作流同步训练6-15添加头条搜索插件在开始节点后添加"头条搜索"的search工具重命名为"头条搜索"设置count=1,input_query=question6添加头条搜索结果处理在头条搜索节点后添加"链接读取"的LinkReaderPlugin设置url=头条搜索节点的输出变量url从data(嵌套对象数组)中选择doc_results.url字段当前工作流结构开始节点联网问答分支+链接读取头条搜索分支+链接读取项目6搭建复杂的工作流与智能体14基于变量聚合节点创建知识问答工作流同步训练6-17添加大模型节点(第三个并行分支)设置输入变量input=question系统提示词:专业问答助手,精通百科知识,输出纯文本段落,3~5句话,100~200字,客观中立流畅8添加变量聚合节点将三个并行分支连接到变量聚合节点,在Group1分组内按顺序添加变量:1.联网问答答案处理→content2.头条搜索结果处理→content3.大模型节点→output分组内变量的顺序至关重要:变量聚合节点默认返回每个分组中第一个非空值的变量。应将最权威、最新的答案放在第一位。项目6搭建复杂的工作流与智能体15基于变量聚合节点创建知识问答工作流同步训练6-17添加大模型节点(第三个并行分支)设置输入变量input=question系统提示词:专业问答助手,精通百科知识,输出纯文本段落,3~5句话,100~200字,客观中立流畅8添加变量聚合节点将三个并行分支连接到变量聚合节点,在Group1分组内按顺序添加变量:1.联网问答答案处理→content2.头条搜索结果处理→content3.大模型节点→output分组内变量的顺序至关重要:变量聚合节点默认返回每个分组中第一个非空值的变量。应将最权威、最新的答案放在第一位。项目6搭建复杂的工作流与智能体15基于变量聚合节点创建知识问答工作流同步训练6-19连接结束节点将变量聚合节点与结束节点连接设置输出变量output=Group1返回文本回答内容:{{output}}完整工作流结构项目6搭建复杂的工作流与智能体16基于变量聚合节点创建知识问答工作流同步训练6-110试运行工作流打开"试运行"面板输入:"请介绍一下钱学森的生平"查看关键节点的运行详情,验证三个分支输出项目6搭建复杂的工作流与智能体16基于变量聚合节点创建知识问答工作流案例实战6-1合同金额审查助手贴近办公场景,搭建一个用于合同金额审查与风险提示的工作流。核心:通过代码节点执行严格的合同审查逻辑,输出包含审查结果、风险提示和建议的结构化报告。核心审查规则判断金额是否超出部门预算上限判断金额是否符合审批权限识别敏感数字(如整万数围标风险)工作流流程接收合同文件文件读取解析合同文本代码审查生成报告结束节点项目6搭建复杂的工作流与智能体17案例实战6-1合同金额审查助手——创建工作流并进行配置1创建工作流创建contract_review工作流,描述为"合同金额自动审查"2配置开始节点输入变量contract_file(File类型,必填)用于接收用户提交的合同文件3添加文件读取插件添加"文件读取"的read工具设置url=contract_file4添加"解析合同文本"大模型节点提取结构化JSON数据:合同名称、双方主体、金额、支付方式等输出变量类型设置为ObjectJSON输出格式示例{"contract_title":"合同名称","parties_involved":["甲方","乙方"],"contract_amount":50000,"amount_unit":"元","payment_terms":"支付方式描述","key_dates":["签署日","开始日"]}项目6搭建复杂的工作流与智能体19案例实战6-1合同金额审查助手——在工作流中添加代码节点代码节点是工作流核心,使用Python实现合同审查逻辑,将非结构化条款转化为可量化、可审计的审查规则。1定义业务规则各部门预算上限(销售部10万、市场部5万、行政部2万)审批权限(经理3万、总监10万、VP无上限)2核心审查逻辑检查是否超出部门预算判断所需审批层级识别敏感数字(整万数围标风险)3生成审查总结风险等级评定(低/中等)合并提取信息和审查结果返回结构化对象Python核心审查代码片段#1.定义业务规则company_rules={"department_budget_limits":{"销售部":100000,"市场部":50000,"行政部":20000},"approval_authority":{"manager":30000,"director":100000,"vp":inf}}#2.核心审查:检查预算、审批层级、敏感数字ifcontract_amount>department_budget:#超预算风险review_results["risk_findings"].append("合同金额超过部门预算上限")ifcontract_amount%10000==0:#整万数风险review_results["risk_findings"].append("合同金额为整万数,建议复核")#3.返回结构化审查结果return{"structured_review":{"extracted_information":contract_data,"compliance_review":review_results}}项目6搭建复杂的工作流与智能体20案例实战6-1合同金额审查助手——继续完成工作流6试运行代码节点在代码编辑器中单击"测试代码"填写输入参数,单击"运行"查看输入参数和输出内容7添加"生成报告"节点大模型节点,将结构化数据转化为易于阅读的审查报告以友好语气输出,避免恐慌8配置结束节点连接生成报告节点与结束节点设置输出变量output开启"流式输出"实现打字机效果项目6搭建复杂的工作流与智能体21案例实战6-1合同金额审查助手——测试与发布工作流9测试工作流在"试运行"面板中上传合同样本文件单击"试运行"按钮,验证结果是否符合预期10发布工作流测试无误后,单击"发布"按钮工作流即可被智能体调用项目6搭建复杂的工作流与智能体21案例实战6-1合同金额审查助手——创建智能体调用工作流1创建智能体新建"合同金额审查助手"智能体功能介绍:审查合同金额,输出结构化报告2添加工作流在"编排"面板中添加contract_review工作流使智能体具备合同审查能力3编写提示词角色:企业法务与财务部门的合同金额审查助手,具备强大的合同审查与风险识别能力核心职责:1.意图识别与工作流调用:当用户提交合同文件后,自动并优先调用工作流2.结果解读:用通俗易懂的语言向用户概括核心结论(总体风险等级、关键风险等)4配置开场白:您好!我是您的合同金额审查助手。我可以基于内置的审查规则,为您提供合同金额准确性、关键条款合规性等快速审查服务,并生成风险提示报告。请直接将需要审查的合同文件发送给我即可。项目6搭建复杂的工作流与智能体22案例实战6-1合同金额审查助手——测试智能体项目6搭建复杂的工作流与智能体226.1.2工作流嵌套工作流嵌套是实现复杂业务逻辑模块化的核心。将完整工作流封装为独立的子工作流节点,像调用普通组件一样在其他主工作流中重复调用。核心思想遵循软件工程的模块化思想:将一个庞大复杂的工作流拆解为多个功能单一、易于管理和维护的独立模块。嵌套结构示意子工作流A功能单一、独立模块子工作流B功能单一、独立模块子工作流C功能单一、独立模块主工作流:任务调度与内容整合,调用多个子工作流完成复杂任务项目6搭建复杂的工作流与智能体23案例实战6-2多平台文案生成助手通过工作流嵌套,将复杂任务拆解为多个独立、可复用的子工作流,由主工作流调度整合。用户输入一个核心主题,智能体自动完成以下任务:1生成一篇文章2改写多平台文案3为文案生成配图4输出结构化报告支持平台小红书微博文章+配图(Markdown格式排版)项目6搭建复杂的工作流与智能体25案例实战6-2多平台文案生成助手——设计思路直接用一个工作流实现会非常臃肿且难以维护。通过工作流嵌套拆分为1个主工作流+3个子工作流。子工作流一:生成文章generate_article接收主题,生成详细文章3个节点:开始→大模型→结束子工作流二:改写文案adapt_content接收文章,改写多平台文案输出JSON格式:小红书+微博子工作流三:文生图text2image接收文案,生成配图4个节点:开始→提示词→图像→结束主工作流:multiplatform_copywriting任务调度与内容整合:开始(接收topic)→嵌套generate_article→嵌套adapt_content→代码节点(JSON转数组)→循环节点(遍历数组,嵌套text2image)→结束(整合输出)项目6搭建复杂的工作流与智能体26案例实战6-2子工作流一:生成文章1创建工作流创建generate_article工作流描述:"接收一个主题描述,生成一篇详细文章"2配置节点开始节点:输入变量topic(必填)大模型节点:系统提示词为专业编辑大模型节点提示词系统提示词:你是一名专业编辑。请根据用户提供的主题,撰写一篇结构完整、内容翔实的文章。用户提示词:请围绕主题{{topic}}撰写文章。结束节点:输出变量full_article=大模型节点的output项目6搭建复杂的工作流与智能体27案例实战6-2子工作流二:改写多平台文案创建adapt_content工作流:接收详细文章,将其改写成适合不同平台的文案。两种平台风格小红书风格包含表情符号语言亲切,使用"宝子们""安利"等网络用语添加3个相关话题标签微博风格语言精炼,有话题性可带热搜体标签,如#AI绘画#输出JSON格式:{"xiaohongshu":"...","weibo":"..."}项目6搭建复杂的工作流与智能体28案例实战6-2子工作流三:文生图创建text2image工作流:接收一段文案,生成配图。节点说明提示词生成节点大模型节点,用于将文本转成AI绘画的英文提示词图像生成节点基于提示词生成图像,输出变量data包含图像URL测试该工作流,然后将其发布。只有已发布的工作流才能被主工作流嵌套调用。项目6搭建复杂的工作流与智能体29案例实战6-2主工作流:任务调度创建multiplatform_copywriting主工作流,用于任务调度和内容整合。1嵌套生成文章添加工作流节点选择generate_article设置topic=开始节点的topic2嵌套改写文案添加工作流节点选择adapt_content设置source=full_article3代码节点转换添加代码节点将JSON格式文案转换为数组输出变量copies(字符串数组)4循环节点生成配图添加循环节点,循环类型选择"使用数组循环",循环数组变量copies=代码节点的输出在循环体中添加工作流节点,选择text2image,设置text=循环节点的copies值循环节点会为小红书和微博文案各执行一次文生图子工作流项目6搭建复杂的工作流与智能体305配置循环节点输出设置循环节点输出变量output=text2image节点的image_url收集所有循环结果(数组类型)6配置结束节点返回变量:topic、full_article、copies、images使用Markdown格式完成图文排版案例实战6-2主工作流测试7测试工作流在"试运行"面板中输入主题文本单击"试运行"按钮,观察主工作流如何调用各个子工作流项目6搭建复杂的工作流与智能体31案例实战6-2多平台文案生成助手——创建智能体调用工作流8创建智能体测试结果符合预期后发布工作流创建"多平台文案生成助手"智能体并调用主工作流Markdown报告输出格式示例#内容生成报告##主题{{topic}}##生成的文章内容{{full_article}}##多平台文案及配图###小红书文案{{copies[0]}}![配图]({{images[0]}})###微博文案{{copies[1]}}![配图]({{images[1]}})项目6搭建复杂的工作流与智能体316.2多Agent模式智能体开发将复杂任务拆分给若干个各具专长的智能体协同完成,组建高效的多智能体系统项目6搭建复杂的工作流与智能体326.2.1多Agent模式概述单Agent模式的局限处理复杂任务时,需编写非常详细冗长的提示词需要添加各种插件和工作流调试复杂度高,任何细节变动都可能影响整体功能多Agent模式的解决方案为智能体添加多个Agent(每个Agent作为一个节点,相当于子智能体)通过多Agent节点之间的分工协作高效完成复杂任务用户输入满足跳转条件时,对话移交给另一个Agent处理多Agent模式架构示意用户父Agent调度中心AgentA专业领域一AgentB专业领域二AgentC专业领域三适用场景:智能客服、深度研究报告撰写、多角色协同的虚拟公司等项目6搭建复杂的工作流与智能体3301独立提示词分解为不同的Agent节点配置独立的提示词02独立技能配置为每个Agent节点配置独立的插件和工作流6.2.2多Agent模式与工作流的区别对比项多Agent模式工作流核心目标自主协作的智能体,多个具备决策能力的智能体动态交互,共同完成任务执行预设流水线,将任务分解为一系列固定的、自动化的步骤灵活性灵活性高,智能体可根据上下文和任务目标,自主决定行动路径,解决模糊或开放性问题灵活性较低,流程固定,像按食谱做菜一样,适用于步骤明确、结果可预测的任务可控性开发者定义角色和目标,具体执行由智能体动态决策开发者定义每个步骤的执行逻辑和数据流转条件开发调试较复杂,需设计多个智能体相对简单、流程可视化、节点输入输出清晰,便于逐步调试和逻辑验证适用场景问题复杂、开放,需要动态规划和专业判断流程清晰、结果明确的标准化任务选择建议工作流是以低代码方式开发插件的方法;多Agent模式允许通过将不同角色分配给不同Agent来扩展智能体功能。项目6搭建复杂的工作流与智能体356.2.3切换到多Agent模式将智能体由单Agent模式切换为多Agent模式后,以下配置会发生变化:保留的全局配置人设与回复逻辑触发器变量、数据库开场白、快捷指令背景图片和语音变化的配置快捷指令默认不指定节点(可根据用户输入自动分配)首次切换时,已有的工作流、插件和知识库被保留并添加到默认的第一个Agent中项目6搭建复杂的工作流与智能体36案例实战6-3基于多Agent模式模拟电商客服电商客服涉及内容较多,非常适合用多Agent模式处理。本例示范多Agent模式智能体开发,突出优势:专业分工、易于维护和可扩展性。智能体架构父Agent(调度中心)接收用户请求,分派给子Agent订单查询Agent查询订单状态、物流信息促销咨询Agent解答产品价格、优惠活动人工客服Agent处理投诉、转接人工开发步骤概览创建并切换模式全局设置配置各Agent节点连接与测试发布项目6搭建复杂的工作流与智能体37案例实战6-31创建智能体登录扣子编程,切换到旧版页面输入智能体名称和功能介绍,由AI自动生成图标2切换为多Agent模式单击"单Agent"右侧图标,选择"多Agents"编辑页面变为画布形式,默认有开始节点和父Agent项目6搭建复杂的工作流与智能体38基于多Agent模式模拟电商客服案例实战6-3全局提示词配置角色:电商智能客服专家,始终秉持"客户第一"的原则,提供准确、高效、友好的服务技能:1.精准理解需求——快速识别用户意图,提供针对性解答2.高效解决问题——直接处理的问题给出清晰答案,复杂问题有效引导或平滑转接3.提升服务体验——保持热情耐心,回复末尾询问是否

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论