人工智能通识教程课件 第4章 AIGC基础及提示词工程_第1页
人工智能通识教程课件 第4章 AIGC基础及提示词工程_第2页
人工智能通识教程课件 第4章 AIGC基础及提示词工程_第3页
人工智能通识教程课件 第4章 AIGC基础及提示词工程_第4页
人工智能通识教程课件 第4章 AIGC基础及提示词工程_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ArtificialIntelligenceAIGC基础及提示词工程第4章编者:×××4.1AIGC概述4.2AIGC常用工具概览提示词工程概述4.3提示词编写方法及优化技巧4.4章节实训与思考4.54.1.1AIGC的概念AIGC是指利用人工智能技术,特别是深度学习、自然语言处理和计算机视觉等领域的先进算法,自动生成各种形式的内容的新型生产方式。这些内容可以涵盖文本、图像、音频、视频、代码等多种模态,如图所示。人工智能模型通过在海量数据中训练,能够学习到数据中的深层模式、结构和规律,并在此基础上,根据用户输入的指令或提示,创造全新的、具有逻辑性和创意性的内容。AIGC被视为继专业生成内容和用户生成内容之后的一次重大变革,极大地降低了内容创作的门槛,提高了生产效率,并催生了全新的内容生态和商业模式。4.1.2AIGC的发展历程AIGC的发展并非一蹴而就,而是经历了漫长的技术积累和多次关键性的突破。其发展历程大致可以划分为早期探索阶段、技术突破阶段和快速发展阶段3个主要阶段。AIGC的源头可以追溯到人工智能概念诞生之初。1950年,艾伦·图灵提出的“图灵测试”,其核心思想就是判断机器是否能够像人一样“生成”内容并进行智能交互,这可以看作AIGC思想的萌芽。这一时期的研究主要集中在基于规则和模板的简单内容生成上,如通过预设的语法规则生成简单的诗歌或文本,其创造性和灵活性都非常有限。直到21世纪初,随着机器学习和神经网络技术的初步发展,一些能够进行简单文本和图像生成的应用才出现,但这些应用大多停留在实验室阶段,尚未形成广泛的社会影响

。1.早期探索阶段进

入2020年,AIGC迎

展。

以Transformer架

型的出现,将AIGC的能力提升到一个全新的高度。2022年,OpenAI推出的ChatGPT和DALL·E2,以及StabilityAI推出的StableDiffusion等模型,彻底引爆了全球对AIGC的关注。这些大模型不仅能够生成高质量的文本和图像,还能进行复杂的对

话、编写代码、创作诗歌,甚至生成视频。在这一阶段,AIGC开始从实验室走向大众,深刻地改变着内容创作模式,广泛影响了医疗、娱乐等多个行业。3.快速发展阶段2014年,生成对抗网络的提出是AIGC发展史上的一个里程碑。GAN由一个生成器和一个判别器组成,两者通过相互博弈的方式训练,最终使生成器能够创造以假乱真的图像、音频等内容。GAN的出现极大地提升了人工智能生成内容的质量和逼真程度。这些技术突破为AIGC的商业化应用奠定了坚实的基础,也吸引了学术界和产业界的广泛关注。2.技术突破阶段4.1.3AIGC与大模型的关系大模型是AIGC的技术基石和核心引擎,而AIGC则是大模型最引人注目的应用和价值的集中体现。大模型通常基于Transformer等先进的神经网络架构,通过在海量的文本、图像、音频等数据中进行预训练,学到丰富的世界知识和复杂的模式规律。这种大规模预训练赋予大模型强大的“通识”能力和泛化能力,使其能够理解并执行各种复杂的任务。大模型对AIGC的发展和应用深化有深远的影响,主要体现在以下3个方面。随着模型规模的增大和训练数据的增多,大模型生成的内容在质量、连贯性、创造性和多样性上都实现了质的飞跃。大模型能够生成更长、更复杂、更符合逻辑的内容,并且能够模仿不同的风格、体裁和视角,极大地丰富了AIGC的应用场景。提升生成内容的质量和多样性01现代大模型越来越多地具备多模态处理能力,能够同时理解和处理文本、图像、音频、视频等多种信息。这使得AIGC不再局限于单一模态的生成,而是可以实现跨模态的转换和创作。实现多模态融合与生成02大模型通过API的形式提供服务,使得开发者无须从零开始训练复杂的模型,就可以轻松地将AIGC功能集成到自己的应用中。降低应用门槛,促进人机交互034.1.4AIGC的应用领域01文本生成与辅助创作AIGC工具生成的文本内容为创作者提供了丰富的创作素材和思路。创作者可以基于生成的这些文本内容深入思考、拓展和延伸,进而丰富和完善自己的作品。03音视频生成与编辑从音乐创作、语音合成,到视频剪辑、特效制作,AIGC正逐步替代传统的手动操作。在音乐创作方面,AIGC工具可以根据情感分析结果,生成符合情绪变化的背景音乐,为影视作品、游戏等营造恰到好处的氛围。在语音合成领域,AIGC工具能够基于文本描述生成自然流畅的语音播报,广泛应用于有声读物、语音导航等领域。在视频编辑方面,AIGC工具具有强大的识别和剪辑能力,能够自动识别并剪辑出视频中的精彩片段,并为这些片段添加特效和滤镜,甚至还能生成全新的视频内容。02AI绘画与图像编辑AI绘画是AIGC在视觉艺术领域的重要应用。借助先进的深度学习算法,人工智能能够学习并

模仿各种艺术风格,甚至还能创造全新的艺术风格。用户只需提供简单的描述或草图,AIGC工具就能自动生成精美的图像作品。此外,AIGC工具在图像修复、色彩调整等方面也展现了强大的能力。它可以修复老照片中模糊、破损的部分,让历史画面重焕生机;还能精准调整图像的色彩,使其更加符合视觉审美需求,为视觉创意行业带来更多便利与可能性。4.1.4AIGC的应用领域05其他应用领域AIGC在教育、医疗、金融等领域也有广泛的应用。在教育领域,AIGC工具可以生成个性化的学习资料和练习题,满足不同学生的学习需求;在医疗领域,AIGC工具可以辅助医生进行疾病诊断和病历分析;在金融领域,AIGC工具可以进行市场趋势预测和风险评估,为投资决策提供有力支持。04代码生成与软件开发在软件开发领域,AIGC的应用颠覆了传统的编程方式。通过自然语言处理技术,开发者可以使用自然语言描述需求,AIGC工具则能自动编写出相应的代码,这大大简化了编程流程,提高了开发效率。此外,AIGC工具还能辅助开发者进行代码审查,及时发现代码中的错误、缺陷、漏洞。并预测潜在问题,提前采取措施进行修复,从而保证软件开发质量;优化代码结构,使代码更加简洁、高效。4.1.5AIGC的基本用法01020304当前市场上的AIGC工具丰富多样,功能各有侧重。有的专注于文本生成,能快速产出各类文章、文案;有的则在图像创作领域表现出色,可生成风格多样的图片;还有的擅长音频创作,能制作出逼真的语音内容。因此,用户需依据自身需求与实际情况,挑选适合的AIGC工具。选择工具后,便需要注册与登录工具。这一步骤旨在确保用户正常使用工具,并享受其提供的各项服务。完成注册后,使用注册的用户名和密码即可登录对应的AIGC工具。登录成功后,用户可开始使用AIGC工具生成内容。在工具的主界面中通常设有一个文本框,这是用户输入问题或对话内容的区域,输入的内容即为提示词。提示词是引导AIGC工具生成内容的关键指令,清晰准确的提示词能让工具更好地理解用户需求,生成更符合期望的内容。尽管AIGC工具能够自动生成内容,但有时生成的结果可能无法完全满足用户需要。这时,用户可通过以下3种方式对生成内容进行调整与优化。●

修改提示词。●

提出进一步要求。●

调整模型参数。1.选择合适的AIGC工具2.注册与登录AIGC工具3.输入提示词生成内容4.调整与优化生成内容4.1AIGC概述4.2AIGC常用工具概览提示词工程概述4.3提示词编写方法及优化技巧4.4章节实训与思考4.54.2.1文本类AIGC工具文心一言4.2.1文本类AIGC工具DeepSeek4.2.1文本类AIGC工具讯飞星火4.2.1文本类AIGC工具ChatGPT4.2.2图像类AIGC工具文心一言-智慧绘图4.2.2图像类AIGC工具通义万相4.2.2图像类AIGC工具即梦AI4.2.2图像类AIGC工具Midjourney4.2.3音频类AIGC工具讯飞智作4.2.3音频类AIGC工具网易天音4.2.3音频类AIGC工具海绵音乐4.2.4视频类AIGC工具剪映4.2.4视频类AIGC工具讯飞智作4.2.4视频类AIGC工具即梦AI4.2.5辅助办公类AIGC工具WPSAI4.2.5辅助办公类AIGC工具Microsoft365Copilot4.2.6辅助编程类AIGC工具通义灵码4.2.6辅助编程类AIGC工具CodeBuddy4.1AIGC概述4.2AIGC常用工具概览提示词工程概述4.3提示词编写方法及优化技巧4.4章节实训与思考4.54.3.1提示词工程的概念提示词工程正成为连接人类需求与人工智能模型的桥梁。它通过系统性设计输入指令,引导模型生成符合预期的高质量内容,其本质是自然语言编程——无须编写代码,仅通过结构化语言即可精确控制人工智能的行为。这一方法不仅降低了人工智能应用门槛,更让非技术用户也能高效利用人工智能的强大能力。明确指令的核心意图,如“撰写市场分析报告”。任务目标描述提供任务相关的数据或情境,如“基于2025年全球消费趋势数据”。背景信息限定结果的呈现方式,如“分为5个部分,附可视化图表”。输出格式要求4.3.2提示词工程的本质特征

模型适配

精确引导

迭代优化不同人工智能模型的训练数据、推理逻辑存在显著差异。用户进行提示词设计需要紧密贴合具体模型的特点与需求,进行有针对性的优化。例如,针对图像生成模型,需重点补充色调、视觉风格、清晰度方面的提示词,则需加强对逻辑链的引导。提示词工程具有精确引导性,它通过明确的指令和约束,将模型的生成方向限定在特定范围内,减少随机性和不确定性。同时,提示词的有效性高度依赖其所提供的背景信息、上下文和示例,这些信息共同构成了模型理解和执行任务的基础。提示词的设计并非一蹴而就,而是一个需要不断测试、评估和调整的迭代优化过程。用户通过分析模型的输出反馈,持续优化提示词的结构和内容,才能达到最佳效果。4.3.3提示词的作用1.传递意图提示词承担着将人类复杂且可能模糊不清的需求,精准转化为人工智能能够理解并有效执行的具体任务的重任。因此,我们对提示词设计者提出了较高要求,其需具备出色的概括能力及清晰的逻辑表达能力,如此方能确保人工智能准确捕捉到任务的核心要点。4.3.3提示词的作用2.约束边界约束边界旨在通过明确输出范围、设定格式要求、实施风险控制等措施,确保人工智能生成的回答既达到预期,又安全可靠。要想达成这一目标,提示词设计者需具备前瞻性思维与细致入微的洞察力,能够提前预见并有效预防可能产生的各类问题。4.3.3提示词的作用3.激发能力激发能力指的是借助精心设计的指令,引导人工智能调用其内置的特定技能,如逻辑推理能力、创意生成能力等,进而使其能够完成更为复杂且富有创造性的任务。4.3.4大模型生成回复内容的过程1.输入处理文本清洗文本清洗的核心目标是“降噪”,去除无关符号、修正拼写错误,为后续处理提供格式统一、内容准确的原始文本。

token映射大模型的核心计算依赖数值运算,因此,需将清洗后的文本转化为数字。“词表”是关键,它类似“数字字典”,包含大模型可识别的所有token,划分方式由模型训练策略决定。每个token在词表中对应唯一非负整数。

位置编码Transformer架构不具备识别语序的能力,而位置编码则会为每个token补充位置信息。它针对token序列中的每个位置,生成与token数字索引维度相同的位置向量。4.3.4大模型生成回复内容的过程2.上下文理解经输入处理阶段生成数字矩阵后,大模型进入上下文理解阶段,这是分析用户需求、提取语义关键信息的核心阶段,主要通过多层Transformer解码器实现,其基本流程如图所示。●自注意力计算自注意力是Transformer解码器的核心机制,让大模型关注文本中的关键token。●多层特征提取。Transformer解码器通常会对输入的数字矩阵进行多层特征提取。浅层提取文本表层语义,如识别词性;中层分析语法结构和语义关联,如判断所属关系;深层综合信息,明确信息中用户的核心需求。●残差连接与归一化。在多层特征提取过程中,为避免信息丢失或数据波动,会引入残差连接和归一化机制。残差连接将每层解码器的“输入”与“输出”直接相加,传递到下一层,保留浅层原始信息;归一化对每层解码器的输出进行数值标准化处理,使数值范围一致,提升大模型的计算效率和稳定性。4.3.4大模型生成回复内容的过程3.生成回复●

概率分布预测。生成下一个token前,大模型计算词表中所有token作为下一个token的

概率,形成token概率分布预测。●

序列终止条件。大模型通过序列终止条件判断何时停止生成。常见的条件有生成终止token。若满足任一终止条件,则生成过程结束,否则将继续生成下一个token。生成结束后,

大模型将token序列转化为自然语言文本,形成用户最终看到的回复。●

解码策略选择。在概率分布预测中得到所有token的可能性后,大模型通过解码策略选

择具体token构建回复序列。有贪心搜索、束搜索和采样策略3种方式。4.3.5提示词的基本类型指令型提示词指令型提示词是直接向人工智能下达明确任务指令,要求其完成特定动作的类型,在日常使用中最为常见。其核心特征是目标明确单一、表述简洁明了,通常遵循“动作+对象”的结构模式。1信息查询型提示词信息查询型提示词以获取特定信息为目标,旨在让人工智能输出事实性、知识性内容,常用于答疑解惑、调研分析等场景。其关键在于明确查询范围和信息维度,防止大模型输出过于宽泛或无关的内容。2创作型提示词创作型提示词要求人工智能进行创造性输出,广泛应用于文案撰写、故事创作、设计描述等场景。其特点在于需要提供创作方向、风格、细节等要求。3分析型提示词分析型提示词要求人工智能对给定信息进行拆解、对比、推理或总结,输出具有逻辑性的分析结果,常用于工作汇报、问题诊断等场景。其核心在于需要提供分析对象、分析维度,必要时给出参考数据,帮助大模型建立推理框架。4角色设定型提示词角色设定型提示词先为人工智能设定特定的角色身份和交互场景,再让其从该角色视角出发完成任务,增强交互的代入感和专业性。其关键在于明确角色的身份、能力、语言风格,使大模型输出符合角色定位。54.1AIGC概述4.2AIGC常用工具概览提示词工程概述4.3提示词编写方法及优化技巧4.4章节实训与思考4.54.4.1提示词的设计原则清晰性原则是最基本且关键的原则。清晰的提示词应避免使用模糊、有歧义或过于宽泛的语言,而要具体、明确地阐述任务目标、要求及约束条件。

清晰性原则相关性原则强调提示词中的所有信息都应与核心任务紧密相关。这要求剔除那些可能分散人工智能注意力或导致其偏离主题的无关信息。同时,相关性还体现在提供与任务高度相关的示例和背景知识上。

相关性原则具体性原则与清晰性原则紧密相关,它要求提示词包含尽可能多的细节信息。具体而言,要求提供充足的上下文背景,定义关键术语,列举具体的输入数据和期望的输出格式等。

具体性原则4.4.2提示词的编写要点

在开始编写提示词前,用户需明确界定期望人工智能完成的具体任务,如是生成文本、翻译语言、编写代码,还是开展数据分析。任务目标应处于提示词的核心位置,且需用简洁、明了的语言描述,可采用动词开头的方式,如“分析”“总结”“生成”“翻译”

等,直接点明操作类型。01明确任务目标

提供充足的上下文信息极为关键。上下文信息为人工智能理解任务提供了必要的背景与框架,助力其在正确的知识领域中进行推理与生成。上下文信息涵盖多方面内容,包括任务背景介绍、相关历史信息、特定术语定义以及用户具体需求等。02提供上下文信息

提供示例是一种非常有效的技巧。它通过展示一个或多个期望输出的样本,为人工智能提供清晰的模仿模板,其作用是向人工智能直观呈现任务的具体要求,以及期望的输出风格、格式。03提供示例4.4.3结构化提示词框架1.结构化提示词的核心要素无论任务类型如何,高质量的结构化提示词通常都需包含5个核心要素,如表所示,这些要素构成了框架的“通用骨架”,可根据场景灵活拓展。4.4.3结构化提示词框架2.通用结构化提示词框架基于上述核心要素,可构建通用框架,用户只需按步骤填充内容,即可快速生成高质量提示词。该框架适用于写作、分析、建议、总结等多数基础任务,如以“撰写产品推广短文”为例,其结构化提示词如下。4.4.4提示词与大模型协作在许多应用场景中,复杂任务可能无法通过单轮对话完成,而需通过多轮、连续的交互逐步推进。此时,设计提示词需考虑上下文的延续性。用户可在后续提示词中引用之前对话的内容,或对大模型的上一个回答进行追问、补充和修正。协作过程通常从一个初步的、可能不够完善的提示词开始。用户根据任务目标,构建一个包含基本指令和上下文信息的初始提示词,并将其输入大模型。大模型依据此提示词生成初步的输出结果。用户需仔细分析大模型的输出结果,判断其是否符合预期。若输出存在偏差或不足,则需对提示词进行迭代优化。优化的方向多样,具体包括以下3个方面。●内容约束。●风格调整。●逻辑强化。通过持续的实践和积累,用户可形成一套属于自己的提示词库和协作策略。这些策略和提示词库将帮助用户更高效地与大模型协作,从而将大模型打造成一个强大且个性化的智能助手。023.多轮对话中的协作1.协作的初始阶段032.提示词的迭代优化014.协作策略的积累与形成044.4.5提示词误区与应对提示词过于模糊或宽泛,缺乏具体任务目标、受众定位及风格要求。1.提示词过于模糊宽泛在一个提示词中塞入过多不相关任务,导致人工智能注意力分散,无法在任一任务中达到最佳表现。2.提示词任务过多用户期望通过输入一次提示词就获得完美的结果,忽视提示词工程需要持续测试、评估与调整的过程。3.忽视迭代优化过度依赖提示词框架,忽视底层思维与问题理解的重要性。4.过度依赖提示词框架PATR01PART02PART03PART044.1AIGC概述4.2AIGC常用工具概览提示词工程概述4.3提示词编写方法及优化技巧4.4章节实训与思考4.5实训1对比不同提示词生成文本的效果1.需求分析小李是一名新闻学专业的学生,正在参与学院组织的“人工智能辅助内容创作”实训项目。他希望通过亲身体验主流大语言模型的文本生成功能,深入理解提示词的设计与优化如何影响生成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论