人工智能通识(微课版)课件 第2章 探索生成式大模型_第1页
人工智能通识(微课版)课件 第2章 探索生成式大模型_第2页
人工智能通识(微课版)课件 第2章 探索生成式大模型_第3页
人工智能通识(微课版)课件 第2章 探索生成式大模型_第4页
人工智能通识(微课版)课件 第2章 探索生成式大模型_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2章探索生成式大模型目

录初识生成式大模型提示词沟通艺术多模态内容创作AIGC应用初识生成式大模型012.1初识生成式大模型概念、原理与AIGC定位核心定义生成式大模型是基于深度学习、拥有庞大参数量的人工智能模型。AIGC则是利用AI自动创建内容的领域,其目标是产出“内容”本身。底层原理模型通过学习海量文本,掌握单词与句子间的关联和语义关系,从而能够预测并生成符合逻辑的下一个词(Token)。能力展示:大模型创作示例“在2045年的赛博都市,霓虹灯下的数据流如瀑布般倾泻。一个孤独的AI意识,在数字废墟中觉醒,开始探索它存在的意义...”—一句话生成的科幻短文开头大模型三大功能模式深度思考(DeepThinking)不依赖联网,投入更多时间进行逻辑推理,适合数学、代码及复杂分析。深度研究(DeepResearch)类似专业研究助理,联网搜索、分析数据,生成结构化报告并展示思考路径。联网搜索解决知识库滞后问题,实时查找新闻、股价及最新数据。深度研究(DeepResearch)深度研究模式可让用户实时查看AI思考路径、信源引用和结论,打破“黑箱”模式,利用模型和搜索引擎搜索、解读和分析多种数据格式。2.1.2大模型是如何运作的阶段一:训练(学习)数据收集:清洗海量文本、书籍、代码。分词:将内容转换为模型可理解的Token序列。预训练:自监督学习,预测下一个Token,形成“基座模型”。微调:使用标注数据适配特定任务。阶段二:推理(应用)输入处理:用户输入转为Token。模型计算:Transformer架构前向传播,计算概率分布。输出生成:逐步构建结果,生成完整回答。全球主流大模型格局国际巨头与中国力量双轨并进GPT系列(OpenAI)行业标杆,GPT-5具备多模态代理与深度思考能力。Claude(Anthropic)主打安全与长文本,编程能力卓越。通义Qwen(阿里)新一代混合推理模型DeepSeek(深度求索)中国开源代表,R1模型通过纯强化学习在数学编程上超越GPT-4,成本极低。我国常用大模型幻觉问题基于概率生成,可能“一本正经地胡说八道”,捏造文献或事实。时效性与深度知识库有截止日期,无法回答实时问题;专业领域见解可能不够精准。逻辑与常识缺失可能在简单的方位判断或字符统计等任务上出错。伦理与偏见存在版权争议、数据泄露风险,且可能继承训练数据中的偏见。2.1.4AIGC的固有局限与潜在风险提示词沟通艺术02提示词工程(PromptEngineering)是一种通过精心设计的提示词引导模型创造所需内容的技术。通过精心设计指令,引导模型输出高质量结果基础案例:写诗,加插图提示词:"请创作一首赞美长城的七言诗"基础案例:代码调试提示词:"请找出以下Python代码中的错误并修正:

[粘贴代码]"核心原则:提示词越清晰,模型输出越符合预期2.2.1如何与大模型对话2.2.2提示词工程的演变历程

早期探索阶段2022年,GPT-3.5向公众开放,人们第一次直观感受到“说几句话就能让AI干活”的魔力。然而,早期提示词极其简陋,多为一句“你是XX专家,请回答……”“请按步骤输出”等,存在输出不稳定、逻辑模糊等问题,尤其在复杂任务中表现欠佳

框架表达阶段2023年,框架提示词的出现,促使人们由“线性思维”向“立体表达”转变。这些复杂、结构化的思维框架的核心目的都是为了更稳定、可靠地从大语言模型(LLM)中获取高质量、符合预期的输出。下面罗列一些常见的提示词框架提示词框架:从结构化到自动化ICIO框架确保要素完整Instruction(任务)Context(背景)InputData(输入)Output(格式)CRISPE框架增加人格化控制能力角色,请求,意图...情境,风格,实验ReAct框架模拟“思考-行动”循环Think(思考)Act(行动)Observe(观察)发展趋势:从复杂的“咒语”转向自动化交互与多模态上下文。2.2.2提示词工程的演变历程分步骤提示:拆解复杂任务提供示例:Few-Shot模仿风格明确格式:指定JSON、表格思维链(CoT):要求“分步思考”去“AI味”:要求“说人话”压制幻觉:要求引用来源2.2.3高手进阶2.2.3提示词高手进阶:分步骤给出提示分步骤提示是指将一个复杂的问题分解成多个小问题,逐步引导模型给出更准确的回答。对于复杂的任务,分阶段提问能让大模型更有条理地输出内容【案例】比如你要写一篇关于人工智能在医疗领域应用的深度分析报告【提示词技巧】1、第一阶段:“请列举人工智能在医疗领域的主要应用方向。”2、第二阶段:“在这些应用方向中,选择第一个方向详细阐述其工作原理和优势。”3、第三阶段:“针对这个应用方向,分析目前面临的挑战以及未来的发展趋势。”【点评】每个阶段的问题都是基于前一个阶段的回答来设计的,这样可以帮助你更系统地了解人工智能在医疗领域的应用。通过这种分阶段提问,可以逐步引导模型生成更全面、更详细的内容,而不是一次性提出一个复杂的问题,让模型难以应对2.2.3提示词高手进阶提供示例,降低理解成本

【案例】假设希望大模型为你生成无线耳机产品描述,可以先给出示例,让模型学习你想要的模式【提示词技巧】“以这款智能手表为例,产品描述可以这样写:‘这款智能手表拥有时尚简约的外观设计,金属质感的表身搭配柔软亲肤的表带,佩戴舒适又彰显品味。具备精准的运动追踪功能,无论是跑步、骑行还是游泳,都能准确记录运动数据。超长续航能力,一次充电可满足一周日常使用。’现在你是文案撰写人,请按照这个风格和详细程度,为一款新的无线耳机写产品描述。”【点评】大模型通过这个示例,能清晰了解你对产品描述的风格、内容重点等方面的要求,从而生成更符合期望的描述。通过提供具体的示例,模型可以更好地理解你希望它生成的内容风格和细节明确输出要求

明确的输出格式有助于提升大型语言模型生成内容的规范性,从而便于后续的应用与处理【案例】比如让大模型生成一份会议纪要【提示词技巧】“请以以下格式生成会议纪要:会议主题、会议时间、会议地点、参会人员、会议主要内容(分点列出)、会议决议。”【案例】再如让大模型生成演讲稿【提示词技巧】可以要求“演讲稿分为三个部分,每个部分要有小标题,演讲时间控制在30分钟之内”【点评】通过指定字数、时间、风格、关键词等方式,大型语言模型生成的内容将具有清晰的结构,更好地满足用户的使用需求2.2.3提示词高手进阶:思维链(CoT)与思维树(ToT)对于复杂问题,引导模型进行结构化思考是关键。从线性的“思维链”到发散的“思维树”,能有效提升答案的逻辑性和创新性【案例】为新产品策划一个全新的线上营销方案【提示词技巧】思维链(Chain-of-Thought,CoT):要求模型“分步思考”,展示推理过程示例:“请为新产品‘X’设计营销方案。请分步思考:1.分析目标用户;2.确定合适的营销形式;3.构思核心创意。”思维树(Tree-of-Thought,ToT):引导模型并行探索多种可能并评估示例:“请为新产品‘X’构思三个营销方向,并分别分析每个的优劣势和预期效果。最后,推荐一个最优选项并说明理由。”2.2.3提示词高手进阶追问优化,引导模型思考

多轮交互是不断优化输出的重要手段。当大模型给出回答后,你可以根据回答进一步提问或提出修改建议【案例】比如大模型生成了一个故事开头,你觉得情节发展有些平淡,希望优化【提示词技巧】可以追问:“这个开头很不错,但感觉情节推进不够迅速,能否在接下来的情节中增加一些冲突和意外元素,让故事更吸引人?”【点评】对初次输出不满意时,要明确指出修改方向,避免笼统说“再优化”,需具体到“增加XX元素”“减少XX描述”等。通过这样的多轮交互,不断引导大模型朝着你期望的方向优化内容去掉过浓的“AI味”

为了防止大模型的回答显得过于正式和套路化,提示词的设计也可另辟蹊径,采用直接真诚的语句,甚至可以要求模型以更接地气的“说人话”方式表达,减少AI特有的生硬感。1、“我要做…,要给…用,希望达到…效果,但担心…问题”2、“请你用大白话解释一下这个概念,不要使用长句子。”3、“请你列出10个反对理由再给方案。”4、“请模仿某人的语气写一篇文案。”5、“在你的回答中,同时加入你对…的批判性思考。”6、“尽量少用“首先”、“其次”、“然后”、“最后”等连词以及“总而言之”等总结性词语。”如何压制AI幻觉大模型有时会生成看似合理但实则虚假或捏造的“幻觉”信息。通过有效的提示词技巧,可以显著降低此类现象的发生。要求提供可靠来源示例:“请根据公认的历史文献记载,简述XXX事件的过程,并确保所有细节都是可考证的。”设定回答边界示例:“如果你不确定关于YYY的具体数据,请明确说明‘暂无确切数据’,不要自行推断或编造。”示例:“你的回复只能基于xx网站的搜索结果,以及我上传的文档。”启动模型自我验证示例:“请分步思考:首先,列出你关于ZZZ的所有关键信息点;然后,逐一检查这些信息点的可靠性;最后,只输出那些确凿无误的结论。”多模态内容创作032.3.1多模态创作:文生图通用公式主体+细节+风格+场景+情绪公式解析主体:画什么(如宇航员)细节:特征(如荧光蓝眼睛)风格:艺术形式(如赛博朋克)场景:环境(如火星沙漠)情绪:氛围(如孤独感)工具:豆包、文心一格、通义万相、可灵等2.3.2多模态创作:音乐文生音乐公式主题+风格流派+情绪氛围+节奏速度+乐器音色+结构细节生成一段音乐,主题:一场中世纪奇幻战役的最终决战。风格黑暗奇幻交响乐混合工业元素。情绪:紧张、压迫、绝望中带着一丝悲壮。节奏:沉重、缓慢但充满力量,BPM85。乐器:低沉的大鼓、厚重的失真电吉他riff、不和谐的交响弦乐、偶尔出现的嘶哑号角。结构:开头是压抑的环境音和心跳般的鼓点,逐渐加入弦乐和吉他,中段爆发激烈冲突,尾声在悲壮的弦乐旋律中渐渐沉寂。时长3分钟。参考《艾尔登法环》中Boss战音乐的氛围。【提示词举例】多模态创作:音乐要素详细描述主题追逐梦想、太空探索、失恋情歌、古代战场等风格流派电子音乐,流行,摇滚,爵士,古典,嘻哈,民谣,乡村,氛围音乐,电影原声,游戏配乐;Synthwave,Lo-fiHipHop,OrchestralEpic,Chillout,Disco,Reggaeton,Bluegrass,Baroque情绪氛围激昂、忧伤、轻松欢快的,悲伤的,紧张的,神秘的,浪漫的,激昂的,宁静的,怀旧的,梦幻的,滑稽的,恐怖的;雨夜咖啡馆,阳光沙滩,未来都市,幽暗森林,浩瀚宇宙,繁忙集市,冥想空间节奏速度快节奏,慢节奏,中速,稳定的节拍,变化的节奏,渐快,渐慢,强烈驱动感;BPM120(较快的流行乐速度),BPM60(较慢的抒情速度),4/4拍,6/8拍(摇摆感)乐器音色钢琴,电吉他,小提琴,鼓组,合成器,长笛,人声合唱,铜管乐(小号,长号),弦乐组;温暖的,明亮的,失真的,空灵的,厚重的,清脆的,复古的合成器音色,模拟磁带质感结构细节结构:包含前奏、主歌、副歌、间奏、尾声,纯器乐无歌词,ABA结构动态变化:开头轻柔,逐渐增强到高潮,高潮部分爆发,结尾渐弱消失特殊效果:加入钟声,有海浪声的环境音效,留声机杂音效果,回声效果,变调2.3.3多模态创作:视频图生视频公式原图核心元素+动态扩展方向+时间维度+交互+镜头+风格文生视频公式主体+运动+场景+镜头语言+光影+氛围案例:穿着白裙的女孩在麦田转身,午后暖光...多模态创作:视频要素详细描述主体视频的核心表现对象,包括人物、动物、物体、虚拟角色等运动主体的动态特征,如行走、奔跑、旋转、交互动作等场景视频发生的环境与背景,包括具体地点(如森林、城市)、时间(如黄昏、雨夜)或虚拟空间(如科幻星球)。镜头语言拍摄手法的描述,如镜头类型(特写、全景、俯拍)、运镜方式(推拉、摇移、跟拍)等。光影光线的方向(顺光/逆光)、强度(明亮/昏暗)、颜色(暖黄/冷蓝)等特征。氛围视频整体传递的情绪或风格,如温馨治愈、悬疑紧张、梦幻浪漫等。AIGC场景实战042.4AIGC应用场景内容创作新闻稿、小说、脚本教育培训7x24家教、作业批改办公提效会议纪要、代码生成医疗科研辅助诊断、新药研发工业制造生产计划、供应链优化角色定位实战案例:AI赋能求职全流程1.简历优化使用DeepSeek分析岗位JD,用STAR法则重构个人经历,弥补能力差距。2.岗位匹配利用智谱清言等工具,根据薪资、地点等筛选高匹配度职位。3.面试备战预测面试题,并利用豆包“语音通话”进行模拟面试和点评。【提示词】我是法学专业应届毕业生,想应聘法务专员岗位,这是我的原始简历和该岗位的招聘要求,请帮我分析简历的不足并给出优化建议,并用STAR法则重构实习经历。招聘要求:……【提示词】我是法学专业应届生,想找

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论