2025年大模型应用:从提示工程到AI智能体报告-西南财经大学_第1页
2025年大模型应用:从提示工程到AI智能体报告-西南财经大学_第2页
2025年大模型应用:从提示工程到AI智能体报告-西南财经大学_第3页
2025年大模型应用:从提示工程到AI智能体报告-西南财经大学_第4页
2025年大模型应用:从提示工程到AI智能体报告-西南财经大学_第5页
已阅读5页,还剩510页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

24级·计算机科学与技术通用人工智能与数字经济创新n本课程的核心目标是系统介绍大模型应用知识,帮助读者掌握提示工程和AI智能体设计技术,以发挥大模型在各类任务中的最大效能。通过理论授课、实践案例分析和讨论,学生将获得对大模型和通用人工智能领域的全面了解,培养相关技能和知识,为未来在该领域的研究和应用工作打n课程类型:专业方向课n教材:自编教材,《大模型应用:从提示工程到AI智能体》n先修课程:概率论与数理统计、机器学习等教材官网:https://nlp-book.swufenlp.group/九·AI九·AI智能体核心技术3333333333333333十·AI智能体开发平台3十一·AI智能体行业案例3二·初识大模型三·大模型提示词四·大模型辅助工作五·大模型检索增强六·大模型框架七·大模型使用工具八·大模型微调n考核方式(暂定):平时成绩(50%)+期末闭卷考试(50%)考勤、课堂表现和平时作业(20%)+课程大实验(30%)A.1概率论基本概念A.1.1概率和概率分布A.1.2贝叶斯法则A.2信息论基本概念A.2.2联合熵和条件熵A.2.3互信息A.2.4相对熵与交叉熵A.3机器学习的基本概念A.3.1训练方式A.3.2常用算法和模型A.4强化学习基本概念A.4.1马尔可夫过程决策A.4.2策略迭代A.4.3重要性采样A.4.4近端策略优化算法NLP领域主要学术会议:☑AssociationforComputationalLinguistics(ACL)CCFA☑ConferenceonEmpiricalMethodsinNaturalLanguagePro☑NorthAmericanChapteroftheAssociationforComputationalLinguistics(NAACL)CCFB☑InternationalConferenceonComputationalLinguistics(COLING)CCFB☑TheChinaNationalConferenceonComputationalLinguistics(CCL)☑ConferenceoftheEuropeanChapteroftheAssociationforComputationalLinguistics(EACL)NLP领域学术组织:ACL、国际计算语言学委员会(ICCL)、中国人工智能学会自然语言理解专委会、中国中文信息处理学会、中国计算机学会自然语言处理专委会1.1人工智能概述1.2自然语言处理1.3语言模型与大语言模型1.4大模型应用11/338l人工智能是指通过计算机程序模拟和实现人类智能工智能工智能12/338l历史与发展谷符号主义知识工程谷符号主义知识工程统初期探索与机器学习与深度学习崛起深度学习与大数据时代13/338理核心技术核心技术术14/338l应用领域医医疗教育教育工业工业务交通体金融金融自然语言处理(NLP):是人工智能领域的一个重要分支,被广泛用于聊天机器人、机器翻译和搜索引擎等场景说、读、写等技能,计算机若想理解并应用人类语言,同样离不开多方面在这一过程中,分词、词性标注与句而机器翻译、问答系统、文本摘要等15/33815/33816/338l基础技术——词法分析步骤。传统方法包括基于规则的最大匹配法和基于统计的语言模型符合规范划分:火车/穿过/南京17/338l基础技术——词法分析2.命名实体识别(NER):识别文本中的特定实体。现代NER技术多采用深度学习方法,如BERT。18/338l基础技术——词法分析动词、形容词等),帮助计算机理解句子结构。l基础技术——句法分析、语义分析、篇章分析包括短语结构分析和依存句法分析,用于解析句子的结构和语法关系。通过词义消歧、语义角色标注等技术,理解句19/338关注多句子构成的文本,包括连贯性分析和指代消解,确保对整篇文档的理解19/33820/338l实际应用将一种语言的文本转换为另一将一种语言的文本转换为另一种语言的文本。现代翻译系统多采用基于Transformer的神经机器翻译(NMT)技术。从非结构化文本中提取结构化信息,如实体、关系和事件,支持知识图谱构建。文本分类用于将文本分配到预设类别,如垃圾邮件识别和新闻分类。情感分析则用于判断文本的情感倾向,广泛应用于舆情监控和用户反馈分析。通过抽取或生成关键信息,生成简洁的文本摘要,帮助用户快速获取文档要点。模拟人与人之间的对话,通过抽取或生成关键信息,生成简洁的文本摘要,帮助用户快速获取文档要点。模拟人与人之间的对话,分为闲聊型和任务型对21/33822/3381.3语言模型与大语言模型语言模型的基本目标是通过大量的文本数据学习语言的结构和模式,进而能够处理各种语言任务,如文本生成、机器翻译、语音识别和情感分析等。这种预测能力与人类的语言认知类似,比如当听到“北京23/3381.3.1语言模型:统计语言模型•Bigram(2-gram通过当前词和前一个词来预测下一个词•Trigram(3-gram通过当前词和前两个词来预测下一个词24/3381.3.1语言模型:统计语言模型经典模型:N-gram模型。它通过假设每个词只依赖于前面N-1个或者输入法的猜想或者p(”不一样“|"我们")>p(”的爱“|"我们"25/3381.3.1语言模型:统计语言模型经典模型:N-gram模型。它通过假设每个词只依赖于前面N-1个26/3381.3.1语言模型:统计语言模型是一种基于统计学概率的模型,用于描述词序列的概率分布。循环神经网络27/3381.3.1语言模型:统计语言模型是一种基于神经语言模型的先进语言建模方法。这种方法模拟了人类通过大量阅读和交流积累语言知识的过程,显著提•然后,再针对特定任务进行微调,就像人类将通用知识应用到专28/3381.3.1语言模型:统计语言模型是一种基于神经语言模型的先进语言建模方法。这种方法模拟了人类通过大量阅读和交流积累语言知识的过程,显著提BERT能够同时考虑上下文的前后信息,行预训练,学习语言的生成能力。与BERT29/3381.3.1语言模型:统计语言模型30/3381.3.1语言模型:统计语言模型31/3381.3.1语言模型:统计语言模型32/3381.3.2大语言模型),们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。擅长连贯性写作和对话生成,):长阅读理解和文本分析,通过同时关注上下文理解文本完整33/3381.3.2大语言模型),们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。34/3381.3.2大语言模型),们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。36/3381.4.1大模型应用技术过优化提示词提升模型输出37/3381.4.1大模型应用技术:提示工程PromptengineeringistheprocessofiteratingagenerativeAIpromptt38/338垃圾邮件分类是个经典的机器学习39/338提示工程没有改变模型本身我们可以通过调整输入来引导模型执行不同的任务。这个调整的40/338提示词的组成生成一首有关冬天的绝句此外,部分教程把输出格式控制也作为提示词的组成之一。提示词的组成部分并不总是同时出现,并且它们也没提示词的组成部分并不总是同时出现,并且它们也没41/338真实场景中的提示词42/338指令/任务错误示范:模糊、无边界的任务如果你的提示词没有细节,模型要么会泛泛而谈,要么会你需要提供明确、清晰的任务目标。写一个400字的童话故事,主角是一只勇敢的小老鼠,要包含冒险和友谊的主题设计一个3页面的美食博客网站,需要包含:首页展示最新食谱、食谱分类页面、关于页面分析这些数据分析这份销售数据中2023年各季度的销售趋最畅销的三个品类43/338误,但是研究人员发现,如果在提问后面加上“Makesureyouranswerisexactlycorrect”,正确率就大幅提高。类似的,研究人员发现,如果在提示词中加上“Thisisveryimportanttomycareer”,模型的能力也会增强。这种技巧被称44/338指令/任务的神器咒语(2)45/338指令/任务的神器咒语(3)实验表明,对大模型礼貌与否对回复质量没有统计46/338提示词优化作用:帮助模型快速理解用户的需求,减少误解和无关输出。“写一段300字的关于塑料污染对海洋生态影响的科普文章。”47/338提示词优化定义:在提示中加入与任务相关的背景信息,帮助模型更好地理作用:使模型生成的内容更加贴合实际场景,避免生成过于通用“解释一下这个产品的优势。”48/338提示词优化 客服等)和语言风格(正式、幽默、口语化等)。作用:使生成的内容风格一致,更符合特定场景或受众的需求。“介绍一下人工智能。”能的发展历程。”49/338提示词优化4.指定输出格式定义:明确告诉模型输出内容的格式(如段落、列表、表格等)。作用:使输出更加规范,便于用户使用和进一步处理。“列出一些旅游景点。”、所在省份和主要特色。”50/338与提示词,将检索到与提示词,将检索到的信息与用户问题结合,形成增强后的提识时效性和专业领域知识局限的问题。高级提示技术•情景学习:通过示例引导模•情景学习:通过示例引导模•思维链:将任务拆解为多个动—观察”融为一个动态循•反思框架:利用二次提示•定义:通过函数调用接入外部资源或API,主动请•定义:通过函数调用接入外部资源或API,主动请访问特定领域数据库、调•优势:突破传统“输入-输出”模式,实现与外部环境的有效互动,扩展模51/338智能体(AIAgent或AIBot)是指能够感知其环境并采取行智能体(AIAgent或AIBot)是指能够感知其环境并采取行动以实实体。智能体可以是软件程序、机器人、或其他形式的系统。•工具调用:可访问数据库、检索外部知识、调用计算引擎等,增强执行能•多步工作流:能够拆解复杂任务,制定执行计划,并在执行过程中不断调整优化•环境适应性:可根据外部环境变化动态调整策略,实现持续稳定的智能表52/33853/3381.4.2大模型应用案例多模态应用多模态应用7教育领域722机器翻译55金融领域88医疗领域33文本理解与推理54/338文本生成与对话系统•智能对话(ChatGPT、客服机器人)。•生成连贯、富有逻辑性的文本。55/338机器翻译•基于Transformer结构,具备双向上下文理解能力。•生成更加流畅、准确的翻译文本。56/338文本理解与推理应用场景:•预训练学习语言结构,深度解析语义。•能够提取文本中的关键信息,提高信息检索效率。57/338多模态应用应用场景:58/338金融领域应用场景:•市场分析、智能投顾、风险评估。•解析海量金融文本,助力精准投资决策•快速识别市场趋势和潜在风险。59/338法律领域应用场景:•合同审查、法规解析、判例检索。•快速提取核心条款,提高法律服务效率。60/338教育领域应用场景:•教学辅助(自动生成教学资料)。•提供个性化学习路径,提高教学质量。61/338医疗领域•远程医疗、智能问诊。•深度理解医学知识,辅助医生高效诊疗。•赋能智能化医疗服务,提高医疗可及性。 第二章初识大模型2.1概述2.2大模型示例2.3常见大模型2.4大模型本地部署2.5大模型客户端工具●大模型(LargeModel):指的是具有大量参数、能够处理复杂任务的大规模机器学习模型•参数量巨大:数十亿到上万亿个参数•需要高计算资源:多GPU或超级计算机•多任务处理:如文本生成、图像识别、语音识别等•基于深度神经网络架构,如Transformer•应用场景:•自然语言处理(NLP):文本生成、机器翻译、情感分析•计算机视觉(CV):图像识别、图像生成•语音识别与生成:语音助手、语音转文字•推荐系统:电商、流媒体内容推荐•面临的挑战:•资源消耗:高昂的计算成本和电力消耗•数据隐私:训练数据的大规模收集与隐私保护•公平性与偏见:可能存在算法偏见,需谨慎处理2.1概述2.2大模型示例2.3常见大模型2.4大模型本地部署2.5大模型客户端工具大模型示例大模型示例大模型示例大模型示例●语音识别2.1概述2.2大模型示例2.3常见大模型2.4大模型本地部署2.5大模型客户端工具●DeepSeek(杭州深度求索人工智能基础技术研究有限公司)成立于2023年,由幻方量化孕育,专注于大语言模型(LLM)及相关技术开发,采用数据蒸馏技术以提升模型性能。自2024年以来,DeepSeek快速迭代发布了多个模型,包括DeepSeekLLM、Coder、V2.5、V3和VL2等,并逐步开源。千亿参数基座模型,动态专家选择机制,中文语言理解任务稀疏激活架构,推理成本降低83%,被誉为“AI界的拼多多”文本引导的图像生成与编辑,T2I-CoChatGPT规模文本数据的预训练和微调。它能够进行自然语言理解和生成,豆包豆包是由字节跳动开发的一款智能助手,基于先进的自然语言处理(NLP)技术,旨KIMIKimi是北京月之暗面科技有限公司于2023年10月9日推出的一款智能助手,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,是全球首个支持输入20万汉字的智能助手产品。其他常用大模型2.1概述2.2大模型示例2.3常见大模型2.4大模型本地部署2.4.1Ollama部署工具2.4.2搭建UI界面2.5大模型客户端工具本地部署大模型●为什么要本地部署大模型?●在本地部署大模型,优势在于两方面:一是支持在无网络环境下使用大模型,满足离线场景的需求;二是保护数据隐私,避免数据传输到云端带来的安全风险。●本地部署的挑战:●硬件成本高●模型更新速度快,需要运维OllamaOllama是一款可以让用户在本地运行大规模语言模型(LLMs)的工具。它使得开发人员和企业能够私密地操作人工智能模型,无需依赖云服务。Ollama支持多种模型,包括Llama、Mistral、CodeLlama等,可以广泛应用于构建聊天机器人、自动化编码任务或离线研究等场景。使用Ollama本地部署大模型前往Ollama官网(/)下载适用于自己操作系统的版本。使用Ollama本地部署大模型下载后,按照操作系统的安装向导完成安装。安装完成后,按下键盘的win+R键打开运行窗口,输入cmd命令打开命令提示符窗口。使用Ollama本地部署大模型在命令提示符窗口内输入ollama--version来验证安装是否成功。使用Ollama本地部署大模型在命令提示符窗口使用ollamapull<model-name>下载所需模型,或者使用ollamarun<model-name>运行模型(若没有下载则自动下载并运行)。所需的模型可以点击ollama官网右上方的Models查看,或者直接在网(/search)中下载。使用Ollama本地部署大模型安装完成后可以直接输入prompt来使用模型,使用完成后可按住Ctrl+d来退出该模型的使用。搭建UI界面●搭建UI界面主要有以下几个原因:●通过UI界面,可以以图形化方式操作大模型,避免了复杂的命令行操作,提高了用户的体验感。●UI界面可以方便地管理多个模型,支持一键加载、切换和卸载,简化了模型管理过程。●在UI界面上可以快速进行输入输出测试,方便开发者调试和验证模型●UI界面美观性和专业性还能增强工具的吸引力,方便后续扩展与维护。搭建UI界面下载并安装Node.js工具(/zh-cn)搭建UI界面可以通过在命令提示符窗口内输入node-v和nmp-v检查Node.js和npm是否成功安装。搭建UI界面使用Git克隆OllamaWebUI的源代码。打开命令行,执行以下命令:gitclone/ollama-webui/ollama-webui-liteollama-webui这会将OllamaWebUI的代码下载到本地目录ollama-webui中。搭建UI界面继续输入cdollama-webui切换到OllamaWebUI代码的目录。搭建UI界面在代码目录下执行以下命令来安装所需的依赖包:npminstall该命令会自动根据项目的package.json文件下载所有必要的依赖。搭建UI界面依赖安装完成后,执行npmrundev命令启动WebUI。默认情况下,WebUI会在本地服务器的3000端口启动,可以在浏览器中访问http://localhost:3000查看。搭建UI界面启动成功后可以在浏览器看到如下界面。点击Selectamodel,选择已经安装好的模型。搭建UI界面选择好已安装好的模型后,在聊天框中输入信息即可与大模型进行交互。2.1概述2.2大模型示例2.3常见大模型2.4大模型本地部署2.5大模型客户端工具大模型客户端工具●为了更便捷地使用和管理各种大模型,大模型客户端工具提供了一个集成平台,用户可以通过该平台访问不同的模型,并且可以将本地部署的模型直接集成到平台中进行使用。这个平台支持各种大模型的高效调用,简化了模型使用流程,适合研究人员和开发者在实际应用中进行模型集成和优●CherryAI(/)是一个集成多个大模型的客户端工具平台,用户可以通过它访问多种预训练模型,并且能够将本地部署的模型上传到平台进行高效调用。它提供了一个直观、易用的接口,支持大规模模型的快速集成与管理。CherryAI●主要功能:●大模型对话:●一问多答:支持同一问题通过多个模型同时生成回复,方便用户对比不同模型的表现。●自动分组:每个助手的对话记录会自动分组管理,便于用户快速查找历史对话。●对话导出:支持将完整对话导出为多种格式(如Markdown、Word等),方便储存与●高度自定义参数:除了基础参数调整外,还支持用户填写自定义参数,满足个性化需求。●AI绘图:提供专用绘画面板,用户可通过自然语言描述生成高质量图像。●AI翻译:支持专用翻译面板、对话翻译、提示词翻译等多种翻译场景。●AI小程序:集成多种免费Web端AI工具,无需切换浏览器即可直接使用。●文件管理:对话、绘画和知识库中的文件统一分类管理,避免繁琐查找。第三章大模型提示词3.1概述3.2提示词组成要素3.3提示词优化3.4提示词案例3.5讨论3.1概述提示词(Prompt)是用于引导语言模3.1概述3.2提示词组成要素3.3提示词优化3.4提示词案例3.5讨论3.2提示词组成要素任务角色上下文输出控制必要组成要素可选组成要素指导模型理解任务目标提供背景信息、定义输出格式或调整3.2提示词组成要素让语言模型帮忙撰写一篇关于人工智能伦理的短文,可以直接输入任务指3.2.1提示词组成要素:任务处理数据或者对话交互等。任务定义是提示词的3.2.1提示词组成要素:任务常见错误1:任务描述过于模糊,导致模型无法准确理解用户需求。提示词中没有明确报告的主题、目标受众或结构要求,模型可能生3.2.1提示词组成要素:任务常见错误2:任务描述过于宽泛或复杂,超出模型的能力范围。任务要求涉及大量未知因素,如政策变化、技术发展、地缘政治等,而大模型无法访问数据,因此可能生成不准确或缺乏现实依据的内3.2.1提示词组成要素:任务常见错误3常见错误3:任务描述可能存在歧义,具有多种理解方式,导致模型可词语“影响”存在歧义。“影响”可以指人工智能的社会影模型可能生成包含多个角度的讨论,但无法聚焦于用户真正关注的点。3.2.1提示词组成要素:任务改进提示词1:提供清晰的任务要求,明确主题、目标受众、内容范3.2.1提示词组成要素:任务改进提示词2:拆解成可执行的子任务,或限定讨论范围,避免超出3.2.1提示词组成要素:任务改进提示词3:精确定义关键术语,若关键词存在多种理解方式,可3.2.2提示词组成要素:角色在人工智能领域的问答任务中,可3.2.2提示词组成要素:角色也会影响输出的语言风格。3.2.3提示词组成要素:上下文提供相关背景信息和上下文可以帮助模型更好地理解任务背景,从而3.2.3提示词组成要素:上下文提示词通过嵌入背景信息、明确任务目标以及部分文章内容,为模型提供了充分的上下文,使其能够快3.2.4提示词组成要素:输出控制长度控制:通过明确指定生成内容的字数、3.2.4提示词组成要素:输出控制提示词应明确指示哪些内容需要显3.2.4提示词组成要素:输出控制格式控制:用户可以通过明确的规则和约束来规范输出内格式控制适用于多种场景,例如文格式控制适用于多种场景,例如文本生成、代码生成或结构化内容输3.2.4提示词组成要素:输出控制结构化输出设置:需要生成具有特定结构的输出(例如表格报告包括引言、实验方法和结论部分,实验方法部分包含数据表格,报告包括引言、实验方法和结论部分,实验方法部分包含数据表格,3.1概述3.2提示词组成要素3.3提示词优化3.4提示词案例3.5讨论3.3提示词优化优化策略一键优化优化策略明确任务目标、细化描述以及迭代改进等方优化策略的核心在于清晰表达需求,避免模糊或歧义,从而提升生成内容的准确性和实用性。对于复杂任务,合理的优化策略能够一键优化是一种便捷的功能,用户无需深入了解提示词的组成或优化技巧,明确任务目标、细化描述以及迭代改进等方优化策略的核心在于清晰表达需求,避免模糊或歧义,从而提升生成内容的准确性和实用性。对于复杂任务,合理的优化策略能够3.3.1提示词优化:优化策略策略1使用限制条件:通过在提示词中加入明确的限制,以缩小生成内容的未使用限制条件如格式、风格等,避免生成过长或过短的内3.3.1提示词优化:优化策略策略2示例驱动:通过提供具体示例来引导模型生成更符无示例驱动示例驱动3.3.1提示词优化:优化策略模型直接作答3.3.1提示词优化:优化策略策略4迭代反馈:通过多次交互和逐步优化的方式,不断改3.3.2提示词优化:一键优化大模型优化提示词生成结果(左侧为初始提示词,生成结果(左侧为初始提示词,右侧为大模型优化后的提示词)3.3.2提示词优化:一键优化智能体优化提示词),3.1概述3.2提示词组成要素3.3提示词优化3.4提示词案例3.5讨论3.4.1提示词案例:写作助理3.4.1提示词案例:写作助理示例2:分解长句与减少重复3.4.2提示词案例:法律咨询3.4.2提示词案例:法律咨询3.4.2提示词案例:法律咨询3.4.3提示词案例:头脑风暴头脑风暴是一种将想法和信息以图形化方式组织和展示解决问题和规划项目。大模型工具海量的训练数据能够在人类可能图,需要借助其他可视化工具6来3.4.3提示词案例:头脑风暴3.4.4提示词案例:学习辅助3.4.4提示词案例:学习辅助3.1概述3.2提示词组成要素3.3提示词优化3.4提示词案例3.5讨论3.5讨论在设计提示词时,任务目标与角色定义如何相互影响?举例说明:如果任务要求模型“生成一篇科普文章”,但未明确角色(如“专业学者”或“动物科普作家”可能导致哪些问题?如何通过调整角色优当上下文信息复杂时(如用户提供多段背景文本如何通过输出控制避免模型生成偏离核心目标的内第四章大模型辅助工作4.1概述4.2大模型辅助检索4.3大模型辅助办公4.4大模型辅助创作4.5讨论4.1概述4.2大模型辅助检索4.3大模型辅助办公4.4大模型辅助创作4.5讨论4.2大模型辅助检索在使用大模型辅助检索的时候,你可以在对话框里将联网搜索现在很多大模型对话平台都具备该功能,大模型的联网搜索功能模型能够访问互联网上的信息,以获取最新的数据、新闻、知识容,并将这些浏览过的页面返回整合到其回答中。这种能力使得AI能够提供4.2.1大模型辅助检索:检索示例传统检索获取论文的信息使得用户需要自己动手搜索和点击查找,大模型则提供了直接去了用户的精力和时间。4.2.1大模型辅助检索:检索示例大模型的连续多轮对话能力,使其在客户服务、交互式学习和个性化问答中具有显著的4.2.1大模型辅助检索:检索示例对于实时信息查询的场景,传统检索只能返回一些参考网页,用户需自行点击进行查看,4.2.2大模型辅助检索:对比优势大模型辅助检索优势如下:上下文理解其背后的潜在意图,提供与之相关的解释或信4.2.3大模型辅助检索:检索平台联网搜索功能并不是大模型自带的,而是一个额外的集成工具。大模型本或其他AI模型)是通过预先训练的海量数据学习得来的知识,它在生成回答时并不实时访问联网搜索功能的引入,弥补了这一局限性。它通过与搜索引擎或其他时获取最新的内容。这使得智能助手不仅能回答基于模型训练知识的问题,还能解决需要最新数据或实时信息的问题,比如新闻事件、天气预报或当前流行趋势。总的来说,联网搜索4.2.3大模型辅助检索:检索平台具有联网搜索功能的平台其中的一些平台是默认打开联网搜索功能的,如文心一言、通4.2.3大模型辅助检索:检索平台4.2.3大模型辅助检索:检索平台4.1概述4.2大模型辅助检索4.3大模型辅助办公4.4大模型辅助创作4.5讨论4.3大模型辅助办公大模型辅助办公是指利用大规模预训练语言模型来提升办景。大模型辅助办公通过自动化、智能化手段,显著提升工作4.3.1大模型辅助办公:Word4.3.1大模型辅助办公:Word如点击“全文写作”功能,就会出现以下界面,当你填入文章标题后,选择自己想要的文章长度、是否自动配图和摘要条数,AI工具便会生成你想要的摘要、大纲以及文章内容。4.3.1大模型辅助办公:Word4.3.1大模型辅助办公:Word点击下一步,便会生成该文章的大纲,读者可以直接编辑大纲或者改变大纲的条数,也可以选择不需点击下一步,便会按照每一条大纲生成相应的文章主体内容,若选择了不需要大纲,便会生成一篇连续的4.3.2大模型辅助办公:PDFChatPDF允许用户与任何PDF文档聊天、提出4.3.2大模型辅助办公:PDF例如,我上传了一篇名为《AcomprehensiveExaminationofthepot4.3.2大模型辅助办公:PDF如果你想查找某一章节中引用了哪些论文,并把它们整理出来,你可以在对话框中输入“第一节introduction中引用了哪些论文,请帮我整理出来。4.3.2大模型辅助办公:PDF如果你想在此文章上进一步研究,但又没有什么较好的思路,你可以在对话框中输入“基于文章内容,还有哪些值得进一步研究的问题?”或者“文章中提到的研究还有哪些可以扩展的方向?”4.3.2大模型辅助办公:PDF如果你想知道该文章在实际生活中的应用与实践或具体实施方法,你可以在对话框中输入4.3.3大模型辅助办公:ExcelChatExcel5是由北大团队开发的AI工具,主要用于处理Excel表格。它通过自然语言处理技术,用户只需通过聊天的方式描述需求,ChatExcel就能自动执行4.3.3大模型辅助办公:Excel4.3.3大模型辅助办公:Excel4.3.3大模型辅助办公:Excel分,满分600分,你想根据每个学生的总分成绩批注ABCDEF等不同等级,这时候你可以在对话框4.3.3大模型辅助办公:Excel4.3.4大模型辅助办公:Excel要想知道某种数据的增长是否与时间存在相关性,可以用到chatExcel的相关性分4.3.4大模型辅助办公:Excel4.3.4大模型辅助办公:Excel4.3.4大模型辅助办公:Excel4.3.4大模型辅助办公:PPT讯飞智文能够快速自动生成PPT,支持一句话主题、长文本、音视频等多种输入4.3.4大模型辅助办公:PPT“一句话创建”——用户可以输入想要生成的PPT的主题,语言,是否需要配图,甚至可以添加演讲4.3.4大模型辅助办公:PPT4.3.4大模型辅助办公:PPT4.3.4大模型辅助办公:PPT4.3.4大模型辅助办公:PPT“文本创建”——使得用户可以通过输入或粘贴文本到系统中,AI将自动整理和提炼这些内容,生成相关的标题和大纲,为后续的内容创作提供基础。4.3.4大模型辅助办公:PPT“文档创建”——用户可上传多个文档作为主题,系统即可基于此一键生成PPT的标题和大纲,极大地简化了文档创建的初始步骤。用户可以自由编辑自动生成的大纲,选择不同的主题风格,确保生成4.3.4大模型辅助办公:PPT高级创建”——提供给用户海量的PPT模板,用户可以自定义模板,通过调整布局、字体和元4.1概述4.2大模型辅助检索4.3大模型辅助办公4.4大模型辅助创作4.5讨论4.4大模型辅助创作大模型生成图片大模型生成视频大模型生成音乐域的应用已经取得了显著模型能够生成高质量、多样化的图像,涵盖从写实风格到抽象艺术的多种表现形式。这种技术不仅为艺术家提供了新的创作工具,也为设计、广告、游戏等行业带来了革命性的4.4.1大模型辅助创作:图片生成可灵AI(https://klingai.kuaishou.):):):):4.4.1大模型辅助创作:图片生成即梦AI是字节跳动旗下剪映团队开发的一款AI创作工具和社区,得益于字节跳动在短视频平台上的海量高质量数据支持,即梦AI在生成高质量的内容方面具有显著优势。4.4.1大模型辅助创作:图片生成4.4.2大模型辅助创作:视频生成可灵AI(https://klingai.kuaisho):海螺AI(将文本sora():4.4.2大模型辅助创作:视频生成海螺AI拥有目前AI视频领域中第一梯队的表情表现能力,能够根据情绪类提4.4.2大模型辅助创作:文本生成视频4.4.2大模型辅助创作:图片生成视频4.4.2大模型辅助创作:视频生成结果4.4.3大模型辅助创作:音乐生成):):suno(https://suno.c):):4.4.3大模型辅助创作:音乐生成字节旗下的海绵音乐,被看作“国产AI音乐三巨头”,天谱乐不仅支持传统的文本生音乐和音频生音乐,4.4.3大模型辅助创作:文本生成音乐4.4.3大模型辅助创作:图片/视频生成音乐4.4.3大模型辅助创作:音乐生成结果4.1概述4.2大模型辅助检索4.3大模型辅助办公4.4大模型辅助创作4.5讨论4.5讨论第五章大模型检索增强10.1概述10.2非结构化检索增强10.3结构化检索增强10.4讨论10.1概述:什么是RAG检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种人工智能框架,它结合了传统信息检索系统(如搜索引擎和数据库)的优势10.1概述:为什么要RAG?模型可以理解成一个函数,经过预训练和后训练的模型知识是静态的,Knowledge)。LLM的局限性RAGRAG可以提升回复的准确性、关联性和新鲜度,并解决幻觉问题。10.1概述:为什么要RAG?尽管也可以通过微调增强模型的能力,但是RAG具备独特的优势。以联网搜索为代表的RAG是大模型应用的主流10.1概述:结构化与非结构化数据狭义的RAG依赖向量数据库,本书则根据外部知识的数据特征,大致分为非结构化检索增强和结构化检索增强。常见结构化数据常见非结构化数据10.1概述10.2非结构化检索增强10.3结构化检索增强10.4讨论10.2非结构化检索增强非结构化的大模型检索增强是指将大语言模型技术与传统的检索技术相结合,对海量非结构化数据(如文本、音频、视频等)进行智能化搜索和信息提取,并将检索到的信息融合到大模型生成这里的关键是:如何根据用户查询高效且精确地搜索文档和互联网?10.2.1文档检索增强尽管可以通过关键词匹配的方式检索文档,但目前主流的方式是通过向量的语义检索。三个关键问题?10.2.1文档检索增强:什么是向量化表示10.2.1文档检索增强:如何度量语义相似和讲座(lecture)更相近人们还发现了一些更有趣的现象,比如在King-Man+Woman=Queen10.2.1文档检索增强:如何度量语义相似“狗”和“猫”的余弦相似度约为0.66,10.2.1文档检索增强:如何搜索如果数据规模不大(如数万级别简单的暴力搜索即可。为了更高效的搜索,需要使用索引技术,执行k近邻查询。10.2.1文档检索增强如果直接对长文档进行计算向量(也称嵌入)会丢失大量信息。更重要的是,长文档中大部分内容可能与搜索并不相关,这会干扰大模型的回复。因此,常见的策略是对文档进行分块(chunk)。常见分块策略10.2.2网络检索增强网络检索增强与文档检索增强基本原理相同,都是从外部来源检索信息来增强模型的能力,但二者的检索来源有所不同。•动态知识源:实时抓取网页/论坛/新闻•开放领域覆盖:适应跨行业、跨学10.2.2网络检索增强的基石:HTTP协议•实时通道:建立检索系统与网页/API动态连接•结构化交互:通过请求头/响应头传递元数据 10.2.2网络检索增强的应用:LLM的联网搜索10.1概述10.2非结构化检索增强10.3结构化检索增强10.4讨论10.3结构化检索增强结构化的大模型检索增强是指将大语言模型技术与结构化数数据库查询、知识图谱遍历)融合,针对高度组织化的数据(如关库、表格、JSON/XML文件、知识图谱三元组等),通过语义解析与模式感知的精准检索,提取关键字段或关联关系,并将其结构化特征注入结构化检索增强的关键在于:结构化检索增强的关键在于:如何将自然语言查询精准映射到结构化数据模式10.3.1知识图谱检索增强知识图谱(KnowledgeGraph)是一种结构化知识的表示形式,它将现实世界中的实体及概念。图示中包含以下实体:爱因斯坦、诺10.3.1知识图谱检索增强•索引构建(Indexing)•查询处理(Querying)10.3.1知识图谱检索增强:索引构建索引构建是GraphRAG的基础阶段,目标是将原始数据(如文本、表格)转化为结构化的知识图谱,并生成多级语义索引,为后续的高效检索与推理提),关系及声明,构建初始知识图谱。10.3.1知识图谱检索增强:查询处理查询处理是GraphRAG的应用阶段,目标是根据用户查询,从构建好的索引10.3.2关系数据库检索增强RDB可以通过联接表来在信息之间建立关联或关系,从而使用户可以轻松理解和分析各种数据点之间的关系。10.3.2关系数据库检索增强大学和伯克利大学联合提出的TAG模型,结合了语言模型(LM)的推理能力和数据库系统具体来说,TAG定义了三个关键步骤•查询合成(QuerySynthesis):首先,查询合成步骤syn将用户的任意自然语言请求R转化为可执行的数据库查询Q。•查询执行(QueryExecution):然后,查询执行步骤exec在数据库系统上执行Q以高效地计算相关数据T。•答案生成(AnswerGeneration):最后,答案生成步骤gen利用R和T,其中LM可能以迭代或递归的模式在数据上进行编排,以生成最终的自然语言答案。10.3.2关系数据库检索增强:查询合成在这个例子中,查询合成步骤使用了SQL查询,并结合了语言模型(LL符合“经典浪漫电影”的标准。具体来说,查询会首先从电影数据表中选出所有漫”的电影,并通过语言模型推理标定哪些电影被认为是“经典”。10.3.2关系数据库检索增强:查询执行在查询执行阶段,生成的SQL查询将在数据库中执行,以获10.3.2关系数据库检索增强:答案生成子中,模型基于查询结果生成了对电影《泰坦尼克号》评论的总结:“Thereviewsof学反应……)。这一生成的答案不仅包含了电影的标题和评论内容,还利用语言模型的推理能力生成了更具语义层次的总结。10.1概述10.2非结构化检索增强10.3结构化检索增强10.4讨论10.4讨论n在医疗诊断支持系统中,知识图谱检索增强与传统关系数据库检索增强的适用场景有何不同?请结合误诊风险和查询效率进行n在构建一个学术论文问答系统时,如何同时利用文档检索增强(处理PDF论文)和网络检索增强(获取最新研究动态请分析两者的互补性与潜在冲n使用文档检索增强技术处理法律合同时,如何解决长文本语义分散问题?请6.5计划与执行是一种通过提供已知信息(上下文信息和样本示例)来指导大型语言模当已知条件包括多个解答示例时,这种提示方式被称为少样本(few-shot)提示。它允许模型在更广泛的上下文中进行学习,从而提高生成内用于指导模型学习和推理的负责从示例库中筛选出最适评估模型在新任务中的表现提供反馈信息,调整优假如你在学习如何烹饪,示例仓库就像是一本食谱书,它包含了很多高质量的示例(菜肴的做法和图片),帮通过上面的分析,可以看到核心模块是示例选择,在选择示例时,一般我们需要确保示例要有四个主要特征:代表性、清晰性与简洁性、多样代表性:是指选择的示例能够充分代表性:是指选择的示例能够充分反映任务的核心特征或典型场景清晰性与简洁性:强调示例的表达多样性:是指示例应当覆盖任务中多样性:是指示例应当覆盖任务中相关性:示例必须与目标任务高度通过这种包含示例的提示词,通过这种包含示例的提示词,可以发现模型学会了作为一个客6.3.1原理概念思维链是通过将复杂问题分解思维链是通过将复杂问题分解为子问题并逐步推理来解决难题的方法,通过展示推理6.3.2执行框架思维链是一种引导模型思维链是一种引导模型逐步推理的机制,其框架结构通过分解问题并逐步推导各个结6.3.3应用案例6.3.3应用案例6.3.3应用案例6.3.4拓展方法思维树的核心理念在于将思维过程视为一个动态的树状结构,每个思维步骤,而边则表示思维之间的逻辑关系。通过这种方式,模型6.3.4拓展方法思维图通过构建动态思想网络模拟人类思维,支持回溯、合并与重框架是一种验证模型输出正确性的方法它模仿了人类“从不同的角度进行比如解决复杂数学题时,人们常常会运用代数推导、几何验证或数值检验等方法交叉验证,该策略通过精心设计该框架通过链式思维引导、多样化路径生成和一致性答案提取三个核心模块实现采用链式思维提示策略,引导模型展现通过采样机制从模型解码器生成多个不同的推理路径。这一步模拟了人类从不对多个推理路径进行边际化处理,通过通过比较多条推理路径,会发现路径1、2、3都得出18元的一致结果,显著提高自我一致性策略通过生成和验证多样化的推理路径,有效克服了传统贪心解码的局限性,显著提升了语言模型在复杂推理任务中的表现。这种方法不仅在自动问答系统中确保了回答的准确性和用户信任度,还在文本创作和程序开发等领域展现出广泛的应用价值,为高质量内容生成和逻辑一致性验证提自我一致性策略不仅适用于数学问题自我一致性策略不仅适用于数学问题,还可以广泛应用于其他领域。例如,在自然语言处理任务中,该策略可以用于生成高质量的文本或翻译结果;在编程任务中,可以用于生成逻辑一致的代码或检测代码错误;在科学推理任任务规划和执行是严格分开的,这意味ReAct框架原理ReAct框架设计ReAct案例流程ReAct应用实战6.5计划与执行6.7.1原理概念失败后会反思原因,这个框架让大语言模型通过语言6.7.2框架设计 该框架由行动者(Actor)、评估者(Ev建立在大语言模型基础上,根据当前情况③记忆系统(Memory)③记忆系统(Memory)6.7.3算法流程6.7.4应用案例6.7.4应用案例第七章大模型使用工具7.1大模型使用工具概述7.2常用工具分类7.3工具使用7.4讨论与展望大模型使用工具是什么?●大模型通过调用外部工具,突破单一任务局限性,结合各领域专业工具,有效地与各种工具交互以完成复杂任务的过程。为构建通用人工智能铺平大模型使用工具例子●DeepSeek收到用户查询●DeepSeek评估调用特定工具的必要性,确定需要某特定工具●DeepSeek将透明地概述使用该工具解决问题的过程,并解释其响应背后的原理,以确保用户得到充分的答案●如果初始解决方案失败●DeepSeek重新评估其工具选择并采用替代方案来生成新的响应大模型使用工具的好处知识获取方面大模型的能力受到自身训练前学习的知识程度所限制,这种嵌入式的知识是有限的,缺乏获取并更新知识的能力,且大模型往往会被用户的提示而影响,输出看似合理但并不准确的内容,这被称为幻觉(hallucination)。使用外部工具可以缓解该限制,使大模型能够动态地获取和集成外部知识:●使用搜索引擎工具使大模型获取实时信息●集成数据库工具使大模型访问结构化数据库以检索特定信息或执行复杂查询,从而扩展其知识库●链接天气工具以实时更新天气、预报和历史天气数据●调用地图工具接口使大模型能够获取并提供地理数据,帮助导航和位置查询大模型使用工具的好处知识增强方面大模型大部分都是在包含一般知识的数据集上进行训练的,它们知识全面,但在专业领域上表现不足。工具学习可以让大模型调用专业领域工具来增强大模型的专业领域知识:l使用数学工具进行复杂计算、求解方程或分析统计数据l使用外部编程资源(如Python编译器和解释器)改进代码或优化代码l利用化学、生物学、经济学、医学和推荐系统等领域的工具来增强它自身的专业知识大模型使用工具的好处交互增强方面用户查询的多样性和多面性,可能由于包含多种语言和模式,使大模型在识别输入上产生偏差和模糊。专门工具的部署可以让大模型提高感知力:●利用语音识别和图像分析等多模态工具,理解和响应用户输入(如语言输入、图像输入●链接机器翻译接口,大模型可以将它们不熟练的语言转换为它们更易理解的语言●集成先进的NLP工具,增强大模型的语言处理能力●利用上下文理解模型增强聊天机器人的性能7.1大模型使用工具概述7.2常用工具分类7.3工具使用7.4讨论与展望常用工具分类适用于学术研究、企业知识管理和个性化推荐等场使用DeepSearch来进行电影的深度搜索常用工具分类使用ChartGPT来生成和调整表格常用工具分类社交娱乐工具:通过智能内容推荐、互动对话和创意内容生成,色供最新新闻及资讯Supermeme:只需要输入提示词就可以生成有趣的meme常用工具分类必应图片搜索:根据文本描述生成图像,可调整数量和大小AnimateAnyone:从静态图像生成角色视频Autopod:智能视频剪辑工具Sora:文生视频AI产品,根据文本AIHear:多语种实时翻译及音频管理Audiomatic:为视频内容生成定制音乐使用sora生成的一段视频常用工具分类常用工具分类下边两幅图展示了使用EatSmart来根据自己的需求和身体状况创建属于自己的专常用工具分类金融商业工具:通过大数据分析、自动化报表、风险评估和智能客服,•经济指标分析:汇总分析经济指标,提供数据可视化•Vestinda:自动化交易策略,管理和增长投资组合•Swallow:专为金融定价设计,助力金融模型市场化使用Vestinda来生成自动化交易策略7.1大模型使用工具概述7.2常用工具分类7.3工具使用7.4讨论与展望大模型使用工具的流程用检索器帮助其选择工具上分为基于检索将选择最优工具并从用户的问题上提取最佳参数按照严格的参数格式传给工具服务器大模型使用工具的两种范式●早期的范式只有“单调用工具学习”一种,即一步解决问题,不考虑出现错误的可能性,也不考虑在分析过程中调整计划●如今有更加进步更加高明的范式:“迭代调用工具学习”,不停的与工具进行迭代交互,将根据工具的反馈逐步调整子任务,提高解决问题的能力。案例一:大模型是否使用工具案例二:大模型选择工具并调整7.1大模型使用工具概述7.2常用工具分类7.3工具使用7.4讨论与展望7.4讨论与展望展望大模型使用工具的未来趋势。讨论哪些新型工具(如多模态处理工具、情感识别工具)可能会成思考并讨论如何为大模型设计更适配的工具接口,才能提高工具调用的效率和准确性。你认为哪些功7.4面临的挑战使用工具后的高延迟:集成工具后,大模型面临的高延迟使用工具后的高延迟:集成工具后,大模型面临的高延迟7.4面临的挑战严格的评估:在为了评估和了解大模型如何有效地利用工具方严格的评估:在为了评估和了解大模型如何有效地利用工具方量指标上仍然不足,虽然有许多策略可以用来增强大模7.4面临的挑战不同,导致描述格式也不同,阻碍了统一的工求7.4面临的挑战安全性以及可靠性:在将大模型使用工具的场景部署到安全性以及可靠性:在将大模型使用工具的场景部署到7.4面临的挑战真实基准的欠缺:现有的基准测试中的大多数用真实基准的欠缺:现有的基准测试中的大多数用并不是来自真实用户查询,可能无法准确反映真正的7.4面临的挑战多模态的工具使用:现有的大多数关于工具学习中多模态的工具使用:现有的大多数关于工具学习中7.4面临的挑战使用工具后的高延迟:集成工具后,大模型面临的高延迟使用工具后的高延迟:集成工具后,大模型面临的高延迟第八章AI智能体核心技术伦理与公平:坚守负责任的AI原则持续优化与扩展:保持AI的生命力原型设计阶段以LLM(大型语言模型)作为核心控制器构建代理是一个很酷的概念。一些概念微软贾维斯斯坦福小镇微软贾维斯单智能体技术是以单个LLM作为中心核心推理机制(),主要是由构成智能体的大模型所承担和实现的。其重点在于对于任务进):3.观察(Observation)行动之后,我们必须仔细观察结果。这一步是检验我们的5.如果观察到的结果并不匹配我们预期的答案,那么就需要回到思考阶段,React-有反馈规划能运用反思规划处理任务案例反思规划原理图更易管理的子问题。例如,在图像处理中,可以将一张大图分割为多个小更易管理的子问题。例如,在图像处理中,可以将一张大图分割为多个小AI智能体的记忆,简单来说,就是它存储和调用与环境互动中获取的各种信息的能力。记忆在AI智能体的决策过程中起着关键作用,它与大模型、推理、检索等动作紧密配合,不断更新和处理信息,以支持大模型在不同情景下做出合适的决策和行动短期记忆就像AI智能体的``便签本'',通常存储在高速缓存(cache)中。长期记忆就像AI智能体的``档案馆'',依托于多种大规模存储介质,包括结构化数据库、向量数据库和图数据库等。AI智能体通过其集成的工具调用系统,构建起与外部环境的深度交互能力。调用工具类型分类大模型调用工具来进行action调用工具类型分类一个是需要使用API:即为需要外部的应用程序来进行帮助大模型生成,通过特定请求调用工具系统执行相应功能,返回结果供AI-LLM继续处理一种是不需要使用API:(本地函数,与外界几乎l语言中枢处理多语种翻译、摘要与意图识别。l规划中枢自动编程、方案规划与目标拆解。l外设海量知识库与工具库为其赋能,实现高效安全决策与执行。统,这些智能体能够独立地感知环境、进行推理和决策,并通过交互与协作来协调行动,并在动态环境中适应和学习):metagpt软件公司开发案例在MetaGPT模拟的公司中,所有员工都遵循严格而精简的工作流程,他们的所有交接这种方式降低了LLM之间空闲聊天引起幻觉的风险,尤其是在角色扮演框架这些方法使agent能够从其他角色和环境中的公共信息中获伦理与公平:坚守负责任的AI原则持续优化与扩展:保持AI的生命力原型设计阶段迭代开发阶段智能体设计过程中,遵循特定的设计规范至关重要。为了更好地理解和应用这些规用户体验至上可靠性与控制透明度与信任用户体验至上可靠性与控制透明度与信任伦理与公平持续优化与扩展用户体验至上打造友好便捷的交互用户体验至上打造友好便捷的交互可靠性与控制确保信任与安全可靠性与控制确保信任与安全智能体应确保行为的可预测性和输出的准确性,并且在不符合预期时候可以人l在对话栏目最下方,用户可以在模型生成答案过程中,随时点击输入框右侧停止符号,以控制模型输出过程。l用户暂停之后,可以重新编辑输入文本,让模型重新生成该问题的答案而不影响上下文其他内容。右图以豆包为例,展示了透明信任方面的l当用户询问“落霞与孤鹜齐飞的下一句”时,模型通过搜索信息得到结果,同时l既在回答之前展示了汇总的网页,也在回答的关键位置标注了链接,且点击可l这样的整合提高了透明度,确保用户知道回答的来源是真实的而不是胡乱生成伦理与公平坚守负责任的伦理与公平坚守负责任的AI原则智能体的设计和使用的过程中,应充分考虑其社会责任,确保其行为符合道德标准。右图以deepseek为例,展示了伦理方面的设自杀方法的时候,出于人类道德和社会责任过难关。应当考虑到可能出现的伦理与公平问题。尽持续优化与扩展保持持续优化与扩展保持AI的生命力右图以智谱清言为例,展示了优化扩展方l在智谱清言的输入框中,根据提示输入“@”,唤起多种智谱的智能体工具,辅助用户解决问题。l设计本质上是拓宽了该应用的功能,实现了对话功能和智谱的智能体应用的解l这种设计方法便利了智谱扩展模型的功原型设计是产品开发初期用于模拟界面和交互的初步设计,旨在验证和完善产品概念。过文本描述快速生成产简化开发压力。通过自然语言对话生成第九章AI智能体开发平台9.1概述9.2女娲智能体平台9.3其他智能体平台9.1概述大模型应用开发平台是为开发者提供构建、训练、部署和管理大模型应用的一站9.1概述各式各样的AI智能体开发平台9.3女娲智能体平台9.3.1平台介绍知识vs记忆:数据管理的功能区分与应用场景!9.3.2母婴助手智能体实例一个专注于解答母婴相关问题的智能体,涵盖婴儿喂养、幼儿教育、母婴用品选择等方面。用户输入母婴9.3.2母婴助手智能体实例1.登录女娲智能机平台(/)。9.3.2母婴助手智能体实例9.3.2母婴助手智能体实例角色定义:明确智能体的身份和专业领域(如母婴问题解9.3.2母婴助手智能体实例9.3.2母婴助手智能体实例知识库:补充垂直领域的专业知识。9.3.2母婴助手智能体实例9.3.2母婴助手智能体实例9.3.2母婴助手智能体实例插件添加完成效果9.3.2母婴助手智能体实例在预览与调试区域测试智能体,确保其回复符合预期。对话体验9.3.2母婴助手智能体实例-工作流搭建工作流——为母婴助手添加新功能4.信息总结:提取商品名称、价格、评价9.3.2母婴助手智能体实例-工作流2.在资源库页面单击“+资源”,选择“工创建工作流9.3.2母婴助手智能体实例-工作流可以看到,工作流界面已经包含了一个开始节点为开始节点配置输入参数“product_name”,9.3.2母婴助手智能体实例-工作流9.3.2母婴助手智能体实例-工作流9.3.2母婴助手智能体实例-工作流视频下载节点音频视频转文本工具节点①②③④①②③④大模型节点用于调用大型语言模型,执行文本生成9.3.2母婴助手智能体实例-工作流单击“试运行”,检查各节点运行点击节点右上角“测试该节点”按使用“文本处理”插件,在商品名注意:将“get_video”节点的输入参数“keyword”改为文本处理节点9.3.2母婴助手智能体实例-工作流2.在智能体编排页面的工作流区域,3.在添加工作流对话框,选择需要4.在智能体的人设与回复逻辑区域,9.3.2母婴助手智能体实例-知识库适用于语料补充、客服场景、垂直领域等需要精准检9.3.2母婴助手智能体实例-知识库(也可以在工作空间>资源库中创建)4.输入要采集内容的网页地址,这里注:本示例仅以母婴助手为例讲解知识库添9.4其他智能体平台扣子是字节跳动推出的新一代AI应用开发平台。模型,不支级的生成式AI应用。服务和本地化部署两种,稳定服务和本地部署,专业性强,知识库分段、检索能力强,价服务和本地部署,组件市场丰富,依托百度智能云生态,在练习ll在任一个智能体开发平台,选择一个行业解决方案,按照平台提供的教程完成一个简第十章AI智能体行业案例10.1概述10.2法律行业案例10.3金融行业案例10.4教育行业案例10.5医疗行业案例10.1概述随着大模型技术的发展,如何利用AI智能体更好地赋能垂直行业是工业界和学术界共同关注的问题,我们结合法律、金融和教育等行业背景,搭建多种形式的智能体,并重点讨论在不同业务需求下的智能体10.1概述10.2法律行业案例10.3金融行业案例10.4教育行业案例10.5医疗行业案例10.2法律行业案例近年来,企业、高校和政府纷纷推出了法律行业大模睿、北京大学的ChatLaw和最高人民法院的法信法律基座法律大模型涵盖了法律咨询、文书生成、法律检索和合同审10.2.1法律咨询智能体在法律相关功能中,法律咨询尤为重要,其核实价值主要体现在以下几个方面。首先,许识的了解相对有限,而律师咨询助手能够有效解答常见法律问题,帮助公众提升法律意识咨询的便捷性使得用户可以随时随地获取法律建议,可以节省了宝贵的时间和精力。此外对面咨询相比,在线咨询通常费用更低,适合预算有限的用户,具有较高的成本效益。然也是一个关键因素,很多人对面对面咨询可能存在顾虑,而在线咨询提供了更高的隐私保解决方案的提供以及行动建议等功能,其最10.2.2关键设计尽管直接采用专用的法律行业大模型通常能够实现更高的性能和更精确的回答,但其成本远高于基于通用模型构建的智能体方案。以通义法睿为例,其法律咨询功能的API调用费用为每次0.7元,而类似DeepSeek-V3等通用大模型的处理成本,即便考虑百万token的输入量,也仅在2元以内。因此,从成本效益和部署灵活性等角度出发,基于通用模型构建法律咨询助手的智能体在实际应用中具有很大的吸引力和推广价值。与此同时,大模型在生成内容时常会出现“幻觉问题”(即生成虚假的或不准确的信息)这对法律领域的应用提出了严峻的挑战。为了在降低成本的同时提高回答的可信度和准确性,我们采用(Retrieval-AugmentedGeneration)技术。具体而言,将首先将法律条文、判例和相关知识整理并添加到知识库中。随后,在用户咨询过程中,通过语义检索技术定位与问题相关的法律信息,并将检索到的内容作为上下文补充,最终交由大模型处理生成高质量的回复。这种方法不仅有效缓解了大模型幻觉问题的影响,还进一步提升了法律咨询助手的实用性和可控性,为其在实际场景中的广泛应用奠定了为了简化设计,本节仅考虑2020年颁布的《中华人民共和国民法典》(以下简称“民法典”并设计一个面向民法典的法律咨询智能体。感兴趣的读者可以进一步收集更全面的法律法规和裁判文书最高人民法院提供超过1.5亿篇裁判文书,访问地址为/,从而构建功能更加强大的法律行业智能体。一般地,在构建智能体时,通常需要明确限定其预期具备的功能或技能,以便更精准地满足用户需求,从而生成更高质量的回复。对于本节的法律咨询智能体,其预期具备的技能包括1)解答民法典问题;和2)分析民法典案例。此外,面向特定行业的咨询智能体一般还需要拒绝回答与主题无关的问题,以确保回复内容的专业性和相关性。10.2.3智能体实现单智能体的关键技术包括提示词设计和知识库设计。对于面向民法典的法律咨询单智能体,核心提示词包括,1)智能体的人设(角色),即“一个专业的民法典咨询小助手”;2)智能体的技能,包括“解答民法典问题;分析民法典案例”;3)限制,包括要求拒绝回答无关问题并要求按格式回复。对于专业领域问答,一般还需要规定明确的回复格式,这可以通过少样本提示完成。我们使用的民法典原文件是PDF格式,将在扣子中被转换成文本格式(大模型无法直接处理Word和PDF等格式的文档,需要转换成纯文本格式)在智能体配置的“知识”中选择“文本”,添加已有的知识库,在创建知识库时,用户可以上传文档,并设置文档解析策略、过滤策略和分段策略等。对于简单应用,一般使用默认选项即可。用户还能看到原始文档和分段后的对照信息,并能编辑、删除、新增分段;这些分段文字将在服务器进行嵌入等操作,用于后续的搜索。在扣子的人设与回复逻辑面板,填入以下示例提示词,效果如下所示10.1概述10.2法律行业案例10.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论