大模型应用绪论_第1页
大模型应用绪论_第2页
大模型应用绪论_第3页
大模型应用绪论_第4页
大模型应用绪论_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大模型应用通用人工智能与数字经济创新团队西南财经大学

本课程的核心目标是系统介绍大模型应用知识,帮助读者掌握提示工程和AI智能体设计技术,以发挥大模型在各类任务中的最大效能。通过理论授课、实践案例分析和讨论,学生将获得对大模型和通用人工智能领域的全面了解,培养相关技能和知识,为未来在该领域的研究和应用工作打下坚实基础。课程简介课程类型:专业方向课学分:3课时:17周,1次课/周,3学时/1次课,共51学时教材:自编教材,《大模型应用:从提示工程到AI智能体》先修课程:概率论与数理统计、机器学习等课程信息参考教材教材:适用人群:适用学科专业:主要编者:大模型应用:从提示工程到AI智能体本科生、研究生、科研人员计算机、人工智能学科,陈星延等教材官网:一·绪论二·初识大模型三·大模型提示词四·大模型辅助工作五·大模型检索增强七·大模型使用工具六·大模型框架授课安排3333333教学时间:1周—17周(17周)教学地点:周五1-3节:H301教学方式:概念讲解+实践+答疑十·

AI智能体行业案例九·

AI智能体开发平台八·

AI智能体核心技术333平时成绩考勤、课堂表现和平时作业(20%)+课程大实验(30%)考核方式(暂定):平时成绩(50%)+期末综合项目(50%)考核方式第一章

绪论通用人工智能与金某著名企业新团队1.1人工智能概述

1.2自然语言处理

1.3语言模型与大语言模型

1.3.1语言模型

1.3.2大语言模型

1.4大模型应用目录1.1人工智能概述人工智能不是机器取代人类,而是人类加强自身智慧的工具。 ——马化腾人工智能是指通过计算机程序模拟和实现人类智能的技术领域。它使机器具备以下能力:感知学习推理规划理解语言解决问题弱人工智能设计用于执行特定任务的智能系统通用人工智能(AGI)能够像人类一样执行认知任务的智能系统1.1人工智能概述人工智能不是机器取代人类,而是人类加强自身智慧的工具。 ——马化腾1940s-1950s初期探索与概念提出1956-1970s早期发展与符号主义1980s知识工程与专家系统2010s至今深度学习与大数据时代1990s-2000s机器学习与深度学习崛起历史与发展1970s-1980sAI冬天与低谷1.1人工智能概述核心技术01机器学习自动学习和改进性能、数据驱动的决策02深度学习多层神经网络、大规模数据处理03自然语言处理理解生成人类语言应用:翻译、情感分析04计算机视觉图像和视频处理核心任务:识别、检测、生成05智能语音技术语音识别(语音转文字)语音生成(文字转语音)06强化学习环境交互学习应用:机器人、自动驾驶、游戏AI1.1人工智能概述人工智能不是机器取代人类,而是人类加强自身智慧的工具。 ——马化腾应用领域医疗交通娱乐与媒体工业金融零售与电子商务智能家居教育1.2自然语言处理自然语言处理(NLP):是人工智能领域的一个重要分支,被广泛用于聊天机器人、机器翻译和搜索引擎等场景正如人类在学习新语言时需要兼顾听、说、读、写等技能,计算机若想理解并应用人类语言,同样离不开多方面的技术协作。在这一过程中,分词、词性标注与句法分析等基础任务构成NLP的根基,而机器翻译、问答系统、文本摘要等应用任务则代表了NLP在更广泛场景中的应用实践。1.2自然语言处理基础技术——词法分析1.分词:将文本分解为独立的词汇单元,是中文等语言处理的必要步骤。传统方法包括基于规则的最大匹配法和基于统计的语言模型方法。面临的挑战:分词规范:确定词语边界的规则或指导原则。

不规范划分:火车/穿过/南京某省市长/江大桥

符合规范划分:火车/穿过/某省市/长江大桥歧义切分:不同切分方式带来的语义的曲解。示例:拍/电影的人

拍电影的/人未登录识别:文本中没有出现在预定义词典或训练语料库中的词语,即一些新出现的词汇,如“栓Q”、“凡尔赛”。1.2自然语言处理基础技术——词法分析2.命名实体识别(NER):识别文本中的特定实体。现代NER技术多采用深度学习方法,如BERT。天去某著名企业参加会议(人名)某著名企业(机构名)昨天(时间)1.2自然语言处理基础技术——词法分析3.词性标注:为句子中的每个词标注其词性(如名词、动词、形容词等),帮助计算机理解句子结构。比如在“小明正在认真地学习”这句话中“小明”是名词(表示人)“正在”是助词(表示时态)“认真”是形容词(表示状态)“地”是助词(表示方式)“学习”是动词(表示动作)1.2自然语言处理基础技术——句法分析、语义分析、篇章分析4.句法分析:

包括短语结构分析和依存句法分析,用于解析句子的结构和语法关系。5.语义分析:

通过词义消歧、语义角色标注等技术,理解句子或文本的含义。6.篇章分析:

关注多句子构成的文本,包括连贯性分析和指代消解,确保对整篇文档的理解1.2自然语言处理实际应用对话系统模拟人与人之间的对话,分为闲聊型和任务型对话系统。信息检索与问答系统:信息检索用于从大量文档中找到与用户查询相关的内容,而问答系统则进一步提供精确答案。自动文摘通过抽取或生成关键信息,生成简洁的文本摘要,帮助用户快速获取文档要点。信息抽取从非结构化文本中提取结构化信息,如实体、关系和事件,支持知识图谱构建。文本分类与情感分析:文本分类用于将文本分配到预设类别,如垃圾邮件识别和新闻分类。情感分析则用于判断文本的情感倾向,广泛应用于舆情监控和用户反馈分析。机器翻译将一种语言的文本转换为另一种语言的文本。现代翻译系统多采用基于Transformer的神经机器翻译(NMT)技术。1.3语言模型与大语言模型1.3.1语言模型1统计语言模型2神经语言模型3预训练语言模型1.3.2大语言模型1Transformer架构2大规模预训练和微调1.3语言模型与大语言模型语言模型的基本目标是通过大量的文本数据学习语言的结构和模式,进而能够处理各种语言任务,如文本生成、机器翻译、语音识别和情感分析等。

这种预测能力与人类的语言认知类似,比如当听到“北京是中国的”时,人们很容下一个词是“首都”。核心任务:估计语言中词序列的概率分布,即给定一个词序列,模型预测下一个词出现的概率。1.3.1语言模型:统计语言模型1.统计语言模型(StatisticalLanguageModel,SLM):是一种基于统计学概率的模型,用于描述词序列的概率分布。核心目标:分析大规模语料库中词汇的分布和共现规律,建立一个能够预测给定上下文条件下词出现概率的模型。

经典模型:N-gram模型。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。Bigram(2-gram):通过当前词和前一个词来预测下一个词Trigram(3-gram):通过当前词和前两个词来预测下一个词1.3.1语言模型:统计语言模型经典模型:N-gram模型。它通过假设每个词只依赖于前面N−1个词来简化模型的计算复杂度。应用:p(”不一样“|"我们")>p(”的爱“|"我们")>p(”相爱吧“|"我们")>.......>p("这一家"|”我们“)搜索引擎(Google或者Baidu)、或者输入法的猜想或者提示原理:1.3.1语言模型:统计语言模型经典模型:N-gram模型。它通过假设每个词只依赖于前面N−1个词来简化模型的计算复杂度。优点:缺点:简单现能够在大规模数据集上训练出有效的模型无法捕捉长距离的依赖关系,模型的上下文窗口有限随着N的增大,模型的参数空间急剧膨胀,导致计算开销和存储需求增加统计语言模型主要依赖于大量的标注数据和统计信息,无法有效理解和生成语言的深层次语义1.3.1语言模型:统计语言模型2.神经语言模型(NeuralLanguageModel,NLM):是一种基于统计学概率的模型,用于描述词序列的概率分布。核心目标:在克服传统统计语言模型(如N-gram模型)的局限性,能够更好地捕捉语言的复杂结构和语义信息。

前馈神经网络(FNN)通过固定大小的输入窗口处理文本循环神经网络(RNN)引入循环连接,能够处理任意长度的序列输入。长短期记忆网络(LSTM)通过精心设计的门控机制(输入门、遗忘门和输出门)解决了RNN的梯度消失问题技术实现架构1.3.1语言模型:统计语言模型3.预训练语言模型(Pre-trainingLanguageModel):是一种基于神经语言模型的先进语言建模方法。这种方法模拟了人类通过大量阅读和交流积累语言知识的过程,显著提升了模型在各种自然语言处理(NLP)任务上的表现。具体操作:首先,模型在海量无标注文本上进行预训练,就像让它“博览群书”一样,学习语言的基本规律和知识;然后,再针对特定任务进行微调,就像人类将通用知识应用到专业领域一样。核心优势:无需人工标注数据通用性与多任务能力情景学习能力应用范围:文本生成、机器翻译、语音识别、情感分析、问答系统、1.3.1语言模型:统计语言模型3.预训练语言模型(Pre-trainingLanguageModel):是一种基于神经语言模型的先进语言建模方法。这种方法模拟了人类通过大量阅读和交流积累语言知识的过程,显著提升了模型在各种自然语言处理(NLP)任务上的表现。目前,最著名的预训练语言模型包括:

•BERT

:基于Transformer的双向编码器预训练模型。利用大规模的无

监督数据预训练,然后通过微调(fine-tuning)来应用于各种NLP任务。

BERT能够同时考虑上下文的前后信息,从而捕捉更丰富的语义。

•GPT

:基于Transformer的单向生成模型。通过在大规模文本数据上进

行预训练,学习语言的生成能力。与BERT不同,GPT主要用于生成任

务,如文本生成和对话系统。

•T5

:另一种基于Transformer的预训练语言模型、它将所有NLP任务

都转化为文本到文本的形式,简化了模型的设计和应用。1.3.1语言模型:统计语言模型BERT:基于Transformer的双向编码器预训练模型。利用大规模的无监督数据预训练,然后通过微调(fine-tuning)来应用于各种NLP任务。BERT能够同时考虑上下文的前后信息,从而捕捉更丰富的语义。1.3.1语言模型:统计语言模型GPT:基于Transformer的单向生成模型。通过在大规模文本数据上进行预训练,学习语言的生成能力。与BERT不同,GPT主要用于生成任务,如文本生成和对话系统。1.3.1语言模型:统计语言模型T5:另一种基于Transformer的预训练语言模型、它将所有NLP任务都转化为文本到文本的形式,简化了模型的设计和应用1.3.2大语言模型大语言模型(LargeLanguageModel,LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。工作原理自回归模型(如GPT系列):擅长连贯性写作和对话生成,根据已有内容预测后续文本。自编码模型(如BERT):擅长阅读理解和文本分析,通过同时关注上下文理解文本完整含义。1.3.2大语言模型大语言模型(LargeLanguageModel,LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。Transformer架构:基于自注意力机制,能够同时处理文本中任意位置的词语关系。提升了并行计算效率和长距离信息处理能力。大规模预训练和微调:参数规模从BERT的3.4亿到GPT-3的1750亿,再到Claude2的1.5万亿。预训练需要大量计算资源,如GPT-3耗费数千个GPU数月时间。大规模参数提升模型的知识储备、理解能力和生成能力。微调后表现出强大的少样本学习能力,可适应多种任务,包括多模态任务。大规模并行计算:采用数据并行、模型并行和流水线并行等策略。硬件支持:如Google的TPU和NVIDIA的A100GPU。新一代芯片提升了能效比,降低了能源成本,支持更大规模模型的研究。关键技术1.3.2大语言模型大语言模型(LargeLanguageModel,LLM),也称大型语言模型,是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据上进行训练,可以执行广泛的任务,包括文本总结、翻译、情感分析等等。Transformer架构:基于自注意力机制,能够同时处理文本中任意位置的词语关系。提升了并行计算效率和长距离信息处理能力。大规模预训练和微调:参数规模从BERT的3.4亿到GPT-3的1750亿,再到Claude2的1.5万亿。预训练需要大量计算资源,如GPT-3耗费数千个GPU数月时间。大规模参数提升模型的知识储备、理解能力和生成能力。微调后表现出强大的少样本学习能力,可适应多种任务,包括多模态任务。大规模并行计算:采用数据并行、模型并行和流水线并行等策略。硬件支持:如Google的TPU和NVIDIA的A100GPU。新一代芯片提升了能效比,降低了能源成本,支持更大规模模型的研究。关键技术1.4大模型应用2012年至今2011年之前1.4.1大模型应用技术1提示工程2AI智能体1.4.2大模型应用案例1文本生成与对话系统2机器翻译3文本理解与推理4多模态应用5金融领域6法律领域7教育领域8医疗领域1.4.1大模型应用技术提示工程核心目标:通过优化提示词提升模型输出质量。关键技术:检索增强、认知框架设计、工具使用。01AI智能体定义:基于提示工程理念的高阶形态。功能:自主管理与决策,工具调用,多步工作流。02提示工程(PromptEngineering)是一门专注于开发和优化大模型提示词的新兴学科。PromptengineeringistheprocessofiteratingagenerativeAIprompttoimproveitsaccuracyandeffectiveness.1.4.1大模型应用技术:提示工程大人,时代变了!垃圾邮件分类是个经典的机器学习案例图片来源:AI

forEverybody

提示工程使得非技术人士也能实现专家级模型的功能提示工程没有改变模型本身模型是一个函数,它的参数是固定的,而输入是不固定的。因此,我们可以通过调整输入来引导模型执行不同的任务。这个调整的过程就是提示工程。提示词的组成组成含义例子角色(Role)设定模型扮演的角色你现在是一名法律专家指令/任务(Instruction/Task)模型要完成的任务生成一首有关冬天的绝句问题(Question)需要回答的问题地球上最高的山峰是什么?上下文(Context)提供必要的背景信息示例(Example)具体的示例,帮忙模型理解预期的输出格式或内容提示词的组成部分并不总是同时出现,并且它们也没有严格的次序。此外,部分教程把输出格式控制也作为提示词的组成之一。真实场景中的提示词神奇咒语定义角色明确指令/任务指定输出格式示例明确分隔符指令/任务错误示范:模糊、无边界的任务目标如果你的提示词没有细节,模型要么会泛泛而谈,要么会拒绝回答。你需要提供明确、清晰的任务目标。不好的提示词好的提示词帮我写一个故事写一个400字的童话故事,主角是一只勇敢的小老鼠,要包含冒险和友谊的主题设计一个网站设计一个3页面的美食博客网站,需要包含:首页展示最新食谱、食谱分类页面、关于页面分析这些数据分析这份销售数据中2023年各季度的销售趋势,重点关注:1.季节性波动2.同比增长率3.最畅销的三个品类指令/任务的神奇咒语(1)在GPT

3中,如果直接问它“Whatis965*590?”,它基本都回答错误,但是研究人员发现,如果在提问后面加上“Makesureyouranswerisexactlycorrect”,正确率就大幅提高。在新模型中无法复现类似的,研究人员发现,如果在提示词中加上“Thisisveryimportanttomycareer”,模型的能力也会增强。这种技巧被称为“情绪勒索法”。指令/任务的神器咒语(2)DeepMind团队的论文《LargeLanguageModelsasOptimizers》发现提示词Take

a

deep

breath

and

work

on

this

problem

step-by-step能显著提高模型的能力。指令/任务的神器咒语(3)你需要对大模型礼貌吗?实验表明,对大模型礼貌与否对回复质量没有统计学上的影响。提示词优化明确任务目标、上下文信息、角色设定和输出格式。1.

明确任务目标定义:清晰地告诉模型需要完成的具体任务,避免模糊不清的指令。

作用:帮助模型快速理解用户的需求,减少误解和无关输出。

示例:模糊提示:“写一段关于环保的内容。”优化后的提示:“写一段300字的关于塑料污染对海洋生态影响的科普文章。”提示词优化明确任务目标、上下文信息、角色设定和输出格式。2.

提供上下文信息定义:在提示中加入与任务相关的背景信息,帮助模型更好地理解任务的语境。

作用:使模型生成的内容更加贴合实际场景,避免生成过于通用或不相关的回答。

示例:无上下文提示:“解释一下这个产品的优势。”优化后的提示:“假设你是一位销售经理,向客户解释这款智能手表的健康监测功能和电池续航优势。”提示词优化明确任务目标、上下文信息、角色设定和输出格式。3.

设定角色和语气定义:明确模型在生成内容时所扮演的角色(如专家、朋友、客服等)和语言风格(正式、幽默、口语化等)。

作用:使生成的内容风格一致,更符合特定场景或受众的需求。

示例:无角色提示:“介绍一下人工智能。”优化后的提示:“作为一名科技博主,用幽默风趣的语言介绍一下人工智能的发展历程。”提示词优化明确任务目标、上下文信息、角色设定和输出格式。4.

指定输出格式定义:明确告诉模型输出内容的格式(如段落、列表、表格等)。

作用:使输出更加规范,便于用户使用和进一步处理。

示例:无格式提示:“列出一些旅游景点。”优化后的提示:“以表格形式列出中国十大著名旅游景点,包括景点名称某省市份和主要特色。”高级提示技术内容检索增强定义:结合知识检索与提示词,将检索到的信息与用户问题结合,形成增强后的提示。作用:解决大模型知识时效性和专业领域知识局限的问题。01认知框架情景学习:通过示例引导模型学习和迁移。思维链:将任务拆解为多个步骤,依次推理。自我一致性:从不同角度验证并整合结论。React循环:将“思考—行动—观察”融为一个动态循环。反思框架:利用二次提示(一次生成、一次检查)对输出进行审查和修正。02工具调用定义:通过函数调用接入外部资源或API,主动请求数据或执行操作。作用:实时检索最新资讯、访问特定领域数据库、调用计算引擎进行复杂运算,甚至执行自动化任务。优势:突破传统“输入-输出”模式,实现与外部环境的有效互动,扩展模型的实用价值。031.4.1大模型应用技术:AI智能体智能体(AIAgent或AIBot)是指能够感知其环境并采取行动以实现某种目标的实体。智能体可以是软件程序、机器人、或其他形式的系统。1.4.1大模型应用技术:AI智能体智能体(AIAgent或AIBot)是指能够感知其环境并采取行动以实现某种目标的实体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论