《人工智能导论》课件-03.豆包文心一言赋能智能创作

上传人：青*** IP属地：福建上传时间：2026-06-07 格式：PPTX 页数：90 大小：59.69MB 积分：9.6 举报 版权申诉

已阅读5页，还剩85页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

ArtificialIntelligence豆包/文心一言赋能智能创作项目3学习目标知识目标1掌握使用人工智能工具进行分镜脚本、文生图的基本概念与原理了解人工智能工具在分镜脚本制作和图像生成中的基本算法和技术了解主流人工智能平台在分镜脚本与文生图中的应用技能目标2能够使用主流人工智能平台进行分镜脚本与图像的生成能够运用所学的技术将创意转化为视频脚本和图像内容能够掌握根据客户需求选择合适方式对分镜脚本与图像进行修改素质目标3培养运用人工智能技术进行数字生产能力弘扬中华优秀传统文化提升对人工智能生成合成内容标识以及数字版权等法律意识提问：“大家知道这是什么非遗项目吗？如果让你用AI来推广它，你会怎么做？”1.文化自信：通过非遗技艺AI创作，引导学生弘扬中华优秀传统文化；2.法治意识：讲解AI生成内容的版权规范，培养学生的数字法律素养；3.美育素养：通过非遗作品创作，提升学生的审美与文化感知能力。思政元素有机融入豆包生成“潮州木雕非遗技艺”短视频分镜脚本任务3.1潮州木雕为国家级非遗，历史悠久、技艺精、寓意深TaskContents目

录3.1.1任务背景3.1.2相关知识3.1.3任务实施3.1.1

任务背景某博物馆的工作人员计划通过短视频推广潮州木雕，让更多人了解这项技艺的价值和现状。潮州木雕作为国家级非遗，面临传承困难，视频需要突出其艺术价值、工艺的复杂性和传承的紧迫性。同时，要展示其文化内涵，比如与潮汕地区生活的联系，以及背后的吉祥寓意。潮州木雕始于唐代，盛于明清，清末至抗战前达到鼎盛。其历史可追溯至潮州开元寺的唐代木鱼和宋代木龙遗物，明清时期，潮州木雕技艺臻于完美，至清代形成独特风格，广泛应用于建筑、家具和祭祀器具。2006年，潮州木雕被列入第一批国家级非物质文化遗产名录，2018年入选第一批国家传统工艺振兴目录。潮州木雕题材丰富，涵盖民间传说、古今人物、花鸟虫鱼、飞禽走兽、江海水族、戏剧故事等，反映潮汕民情风俗。技法多样，包括沉雕、浮雕、通雕、圆雕、镂空雕等，其中通雕（多层镂通）最具代表性，能将不同时空的故事融合于同一画面。常采用髹漆贴金技法，形成金碧辉煌的艺术效果，分为“黑色装金”和“五彩装金”两种。本任务创作一个时长约3-5分钟、具有高度吸引力和传播力的短视频，旨在向大众，特别是年轻群体和非专业人士，普及“潮州木雕”这项国家级非物质文化遗产，提升其知名度、美誉度，并激发对其保护与传承的关注。1.介绍潮州木雕的历史地位（始于唐代、盛于明清、2006年入选国家级非遗）。2.引导学生思考：为什么非遗会面临传承困难？我们这一代人能做些什么？3.强调“用新技术讲好老故事”的时代意义。“潮州木雕，刀刀见匠心，件件有故事。它不仅是潮汕地区的文化符号，更是中华文明的活态传承。但是，随着老一代工匠逐渐老去，年轻人对木雕的了解越来越少。我们今天用AI来创作它的短视频，就是在用年轻人喜欢的方式，让非遗‘破圈’、让文化‘活起来’。你们创作的每一个镜头，都是在为中华优秀传统文化的传承添砖加瓦。”文化传承与时代使命Contents目

录3.1.1任务背景3.1.2相关知识3.1.3任务实施3.1.2相关知识3.1.2.1短视频介绍短视频是一种以移动端为核心传播载体、时长在15秒（抖音时长）至5分钟（B站时长）之间、以碎片化叙事与强交互性为特征的数字视频内容形态。用户通常利用等车、排队等碎片化时间通过移动端观看短视频，短视频基于互联网分发，支持点赞、评论、分享等互动功能。短视频最大的特点是内容生产个人化，普通用户可采用手机和简易的视频剪辑工具进行内容创作，短视频的算法推荐机制使热点内容在数小时内触达数亿用户，打破传统媒体的内容垄断。尤其是AI生成内容（AIGC）工具降低用户创作门槛，豆包等大模型支持文生视频，推动数字内容创作的精品化。短视频作为数字时代的产物，已深度渗透社会各个层面，其影响呈现多维特征。其积极面在于打破信息壁垒、激活创造力、推动产业变革；消极面则源于算法成瘾、内容失序与监管滞后。为此国家网信办等部门出台《网络暴力信息治理规定》，明确平台主体责任，打击虚假信息。抖音、快手等平台建立内容审核机制，拦截超97%的诈骗行为，推出青少年模式限制使用时长。科技向善与网络素养“短视频可以在几小时内触达上亿用户，但算法推荐也可能让人沉迷、信息茧房也可能让人偏执。国家出台的《网络暴力信息治理规定》告诉我们：技术越强大，责任越重大。你们未来创作的每一个视频，都要问问自己：这条内容，是在传播正能量，还是在消耗注意力？是在传递真实信息，还是在制造虚假流量？”短视频的传播力极强，但也是一把双刃剑。引导学生思考：作为创作者，我们如何用好这把剑？3.1.2相关知识3.1.2.2短视频脚本介绍短视频的脚本是短视频创作的核心指导文件。用于规划视频的内容结构、镜头语言、台词设计、节奏把控及拍摄细节，它为整个制作团队提供了明确的指导，确保每个人都明确自己的职责和任务。短视频脚本的制作对应的工作岗位为编剧，编剧需要兼具创意、逻辑与技术能力。即能够进行故事构建与情节设计、熟悉文案撰写与语言把控，又要了解镜头语言与视觉设计，具备团队协作与沟通能力，还要能成本控制与资源整合，具备风险预判与应急能力。是一个艺术与技术融合能力较高的岗位。1.短视频脚本的作用分镜头脚本是短视频创作的核心指导文件，它将抽象创意转化为可执行的拍摄方案，确保拍摄团队对画面、节奏、情感达成共识。其作用包括：3.1.2相关知识3.1.2.2短视频脚本介绍明确每个镜头的拍摄细节，减少现场沟通成本。提升效率通过景别、运镜、音效等设计，保障画面美学与叙事连贯性。提前规划拍摄内容，避免重复返工。控制质量降低成本运镜景别3.1.2相关知识3.1.2.2短视频脚本介绍镜号景别运镜时长(秒)画面内容台词/旁白音效/音乐备注1远景固定5城市日出，车流穿梭旁白："在忙碌的清晨，每个人都是生活的主角。”乌鸣声、轻快背景乐拍摄地点：天桥2中景推镜头8主角挤上公交车，人群拥挤主角内心独白："又是早高峰……公交车报站声、人群喧闹需捕捉主角表情表3-1

分镜头脚本的标准化模板镜号2.分镜头脚本的标准化模板镜号：分镜头的编号，依顺序排列。3.1.2相关知识3.1.2.2短视频脚本介绍景别：远景、全景、中景、近景、特写等5个景别，如表3-2所示。景别定义作用示范图片

远景拍摄对象在画面中占据较小的比例，环境范围广阔，通常用来展

示宏大的场景或空间展现环境全貌，让观众了解故事发生的背景，营造氛围感

全景全景能够完整地展示拍摄对象的整体形象以及其周围的环境，使

观众对主体及其所处空间有全面

的认识介绍主体与环境关系，明确主体所处的具体位置和环境特征，具有叙事功能

中景中景一般拍摄人物膝盖以上或物体的大部分，重点展示人物的动

作、姿态以及人物之间的交流和

互动展示人物互动，如对话、争

吵，推动叙事节奏

近景近景主要拍摄人物胸部以上或物体的局部，强调人物的面部表情

和细微动作，使观众能够更深入

地了解人物的内心世界刻画人物情感，增强观众代入感，使观众感觉自己仿佛与人物近距离接触，更加关注人物

的命运和情节的发展

特写特写是对人物或物体的某-局部进行放大拍摄，突出细节，具有

强烈的视觉冲击力聚焦细节，如眼神、手势，传递情绪张力表3-2景别的定义及作用运镜景别镜号2.分镜头脚本的标准化模板3.1.2相关知识3.1.2.2短视频脚本介绍运镜：推镜头、拉镜头、摇镜头、移镜头、跟镜头、升镜头、降镜头、旋转镜头等8种运镜方式。表3-3运镜的定义与作用运镜景别镜号2.分镜头脚本的标准化模板运镜定义作用推镜头推镜头是指摄像机沿光轴方向向前移动拍摄，画面框架由远及近向被摄主体不断接

近，被摄主体在画面中的比例逐渐增大突出主体、将观众的注意力从广阔的环境聚焦

到特定的主体上，强化情绪、引导叙事拉镜头摄像机沿光轴方向向后移动拍摄，画面框架由近及远，被摄主体在画面中的比例逐渐减小展示环境、让观众了解主体所处的环境背景，

拓宽视野，营造氛围、引发联想摇镜头摇镜头是指摄像机的机位不动，借助三角

架或人体进行水平或垂直方向的移动拍

摄，画面表现为画面框架作上下、左右的展示空间、能够展示较大的空间范围，使观众对场景有更全面的了解，跟踪主体、制造悬念移镜头移镜头是指摄像机沿水平方向进行移动拍摄，画面框架始终处于运动之中，被摄对象在画面中的位置相对稳定增强动感、使画面具有强烈的动感和节奏感，给观众带来身临其境的感觉、丰富视角跟镜头跟镜头是指摄像机始终跟随运动的被摄主

体一起运动而进行的拍摄，画面中主体的

位置和大小基本不变，而背景环境则不断强调主体的运动过程和行动细节，让观众清晰地看到主体的行为和状态、增强真实感、连贯叙事升镜头摄像机从低处向上移动拍摄，画面由下至上逐渐展开升镜头可以展示建筑物、山峰等的高度和壮观

景象，可以营造出一种崇高、神圣的氛围降镜头摄像机从高处向下移动拍摄，画面由上至下逐渐收缩降镜头则可以展示广阔的场景或人群的全貌，

营造出一种压抑、沉重的氛围旋转镜头旋转镜头是指摄像机机身以视轴为轴线进行旋转拍摄，画面围绕一个中心点做圆周表现眩晕或混乱、营造奇幻效果推镜头拉镜头摇镜头移镜头降镜头旋转镜头升镜头跟镜头节奏控制分为快剪和慢剪3.1.2相关知识3.1.2.2短视频脚本介绍3.节奏控制快剪慢剪节奏控制1-3秒镜头快速切换，营造紧张感。快剪作为一种极具力量的剪辑手法，在影视创作中扮演着至关重要的角色。当镜头切换频率达到1-3秒一次时，快剪便能瞬间点燃观众的情绪，将紧张的氛围推向高潮。快剪5秒以上长镜头，深化情感。与快剪形成鲜明对比的是慢镜，它以5秒以上长镜头为特点，为情感的表达提供广阔的空间，让观众能够深入角色的内心世界，感受细腻的情感波动。慢镜音效与音乐分为环境音、背景音乐和卡点剪辑3.1.2相关知识3.1.2.2短视频脚本介绍4.音效与音乐真实还原场景音效，增强沉浸感。环境音，作为影视作品中不可或缺的听觉元素，承担着真实还原场景音效、增强沉浸感的关键使命。匹配视频调性，音乐与内容保持一致。背景音乐犹如一位隐形的画师，用旋律和节奏为画面涂抹情感色彩，匹配视频调性，使音乐与内容保持高度一致，成为塑造作品情感氛围的核心力量。音乐节奏与镜头切换同步。卡点剪辑作为影视剪辑中极具魅力的技巧，通过使音乐节奏与镜头切换同步，为观众带来极具韵律感和冲击力的视听体验。环境音背景音乐卡点剪辑3.1.2相关知识3.1.2.2短视频脚本介绍5.台词与旁白精简原则60秒视频台词不超过180字，避免信息过载。在影视创作中，台词的精简是保持叙事节奏和观众注意力的关键策略，尤其在短视频时代，信息的高效传递尤为重要。画外音用旁白串联情节。画外音作为一种特殊的叙事手段，以旁白的形式为视频情节提供连贯性和深度，是影视创作者手中的一把叙事利刃。留白设计关键镜头无台词，用画面传递情绪。留白设计是影视艺术中极具东方美学韵味的技巧，通过在关键镜头中舍弃台词，让画面本身成为情感和信息的传递者。工匠精神与职业伦理脚本创作需要创意、逻辑、技术，更需要责任意识。强调“编剧”岗位不仅是技术活，更是价值传递者。“脚本是视频的灵魂。一个好的编剧，不仅要懂镜头语言，更要懂人心、懂社会、懂价值。你们在写脚本时，要思考：这个镜头想传递什么情绪？这句台词有没有误导性？这个情节会不会引发不良联想？技术可以快，但价值观不能跑偏。”3.1.2相关知识3.1.2.3短视频脚本生成的算法原理算法原理主要基于自然语言处理（NLP）、机器学习、大数据分析。如广告、无关的评论等并对脚本中的情节、角色、台词等元素进行标注，构建高质量的训练数据集。数据收集与预处理算法通过爬取大量视频脚本数据，对这些数据进行清洗，去除其中的噪声信息1.自然语言处理（NLP）与机器学习例如，Transformer模型中的自注意力机制可以有效地处理长序列数据，更好地理解脚本中不同部分之间的关联，从而学习到如何生成更合理、更连贯的脚本。模型训练利用深度学习算法，如循环神经网络（RNN）或Transformer模型，对训练数据进行学习。这些模型能够捕捉脚本中的语言模式、情节结构和角色关系等规律和技巧。生成脚本根据用户输入的主题、风格等参数，模型自动生成符合要求的视频脚本。3.1.2相关知识2.大数据分析3.1.2.3短视频脚本生成的算法原理010203例如，从各大图片网站、视频平台收集与美食、旅游、科技等不同主题相关的素材，为脚本生成后的素材匹配提供丰富的选择。素材库构建通过爬取和永久授权等方式，构建一个包含图片、视频片段、音效等多样化素材的庞大数据库。比如，对美食素材标注其菜品类型（中餐、西餐等）、烹饪方法（炒、烤、蒸等），对旅游素材标注其景点类型（自然风光、历史文化等）、季节等信息，这样在生成脚本后，能够根据脚本内容快速准确地匹配到合适的素材。例如，生成的脚本是关于海边度假的，算法会从素材库中匹配出海边的风景视频、海浪的声音音效等与脚本相关的素材，使最终生成的短视频在视觉和听觉上都能与脚本内容完美融合。素材标注与分类利用计算机视觉技术对素材进行标注和分类，提取关键特征，便于后续匹配。智能匹配根据生成的脚本内容，算法通过算法自动匹配最合适的素材，确保素材与脚本内容的契合度。生成式AI的原理数据输入文本、图像、音频模型训练生成过程数据输出新的文本、图像、音频生成式AI模型的训练过程在这个过程中，模型会学习输入数据的分布规律和特征。这个部分可能包括各种神经网络结构，如循环神经网络（RNN）、卷积神经网络（CNN）或生成对抗网络（GAN）等。表示模型如何利用学到的数据分布规律来生成新的数据。这可能涉及到从训练数据中提取特征，然后根据这些特征生成新的数据。生成式AI如何生成新的文本(以ChatGPT为例-文字接龙)什么是机器学习？训练的模型分割多个token["什么","是","机器","学习"]机器好机["什么","是",“机”,"器",”学”,"习"]常见的文本分割方式主要有以下几种:1.基于空格分词:即以空格为分隔,将文本分割成词组。例如"IamClaude"会被分割为["I","am","Claude"]。2.基于词典分词:根据预设的词典,在词典中可以匹配到的词组作为一个token。例如"Claude是一款AI"根据词典可分为["Claude","是","一款","AI"]。3.基于字节对齐分词:按照字节个数将文本分割,常见的中文模型使用2字节或3字节对。例如"Claude是一款AI"可以分为["Cl","au","de","是","一","款","AI"]。4.基于子词分词:将单词拆分为更小的子词组成token,例如"learning"可以拆分为["learn","##ing"]。5.BPE分词:通过统计学将高频词组合并为一个token。训练数据量：ChatGPT-3.5：1750亿个参数，

ChatGPT-4：数万亿个参数生成式AI如何生成新的文本(以ChatGPT为例-文字接龙)训练的模型器好机器机.....训练的模型End输出结果机器学习是一门很深奥.......算法公平与科技伦理01介绍NLP、Transformer、大数据分析等技术原理。引导学生思考：算法会不会有偏见？数据会不会有“脏数据”？02“算法看起来很‘客观’，但它背后是人的数据、人的设计。如果训练数据里充满了偏见，那生成的脚本也会带有偏见。这就是为什么国家强调‘算法治理’、‘数据安全’。你们未来开发算法时，一定要有伦理意识，不能让算法成为歧视的放大器。”3.1.2相关知识1.豆包简介3.1.2.4豆包大模型：短视频脚本生成利器豆包是字节跳动的先进人工智能助手，基于超大规模语言模型构建，专注于自然语言处理。自2023年11月16日发布以来，凭借强大的文本生成与理解能力，已成为用户学习、工作和生活中不可或缺的智能工具。在短视频脚本创作领域，豆包凭借其卓越性能，为内容创作者提供了高效、精准的脚本生成功能，助力短视频创作迈向新高度。3.1.2相关知识2.豆包的功能特点3.1.2.4豆包大模型：短视频脚本生成利器1.创意构思与脚本撰写豆包能夠快速理解短视频的核心主题与风格，根据用户输入的关键信息，如视频类型（广告、剧情、知识科普等）、目标受众、故事大纲等，瞬间构思出吸引人的短视频脚本框架。它会合理规划视频的开头、中间情节与结尾，设计出吸引观众眼球的剧情转折、冲突点和高潮部分，让脚本具有完整的叙事结构与强烈的吸引力。例如，在创作一个科普短视频脚本时，豆包可以将复杂的科学概念转化为生动有趣的故事，通过角色对话或情节演示的方式，使观众更容易理解和接受。3.1.2相关知识2.豆包的功能特点3.1.2.4豆包大模型：短视频脚本生成利器2.脚本优化与文案润色生成初步脚本后，豆包还能进一步优化完善。它会对脚本的台词进行润色，使其更加自然流畅、富有感染力，符合不同角色的性格特点与表达风格。同时，对脚本中的场景描述、动作细节等进行精准雕琢，增强画面感与现场感，帮助创作者在观众脑海中勾勒出清晰的视频画面。比如在浪漫爱情短视频脚本中，豆包可以将普通台词升级为饱含深情、细腻动人的对白，提升脚本整体质量。3.1.2相关知识2.豆包的功能特点3.1.2.4豆包大模型：短视频脚本生成利器3.台词与旁白设计结合短视频的特点，豆包精准设计台词与旁白。遵循精简原则，确保在有限的视频时长内，台词信息量适中，避免观众产生认知过载。它会根据情节发展与画面切换的节奏，合理安排旁白的出现时机与内容，用旁白串联起情节，使故事更加连贯流畅。在一些关键镜头，豆包会巧妙地进行留白设计，让画面本身传递情绪与信息，增强视频的艺术感染力与观众的观看体验。3.1.2相关知识2.豆包的功能特点3.1.2.4豆包大模型：短视频脚本生成利器4.镜头语言建议豆包不仅关注脚本内容，还能为创作者提供镜头语言方面的建议。根据情节和脚本需求，它会合理推荐不同的镜头：例如在动作场景的脚本创作中，豆包会建议使用快速切换的特写镜头和跟拍镜头，营造紧张刺激的氛围。帮助创作者更好地通过镜头展现故事，提升视频的视觉表现力。景别（如特写、中景、全景等）拍摄角度（平视、仰拍、俯拍等）镜头运动方式（推、拉、摇、移等）3.1.2相关知识2.豆包的功能特点3.1.2.4豆包大模型：短视频脚本生成利器5.多格式脚本输出与调整豆包能够将生成的脚本以多种常见格式输出，如txt、docx等，方便创作者直接导入视频编辑软件使用。同时，它可根据创作者的反馈与修改意见，快速调整脚本内容，包括修改台词、增删情节、调整镜头设计等，直至满足创作者的要求。3.1.2相关知识3.豆包优势3.1.2.4豆包大模型：短视频脚本生成利器（5）专业的视频领域知识（4）自适应学习与泛化能力强（3）拟人化的情感表达与逻辑理解（2）高效的内容生成（1）强大的多模态能力1.强大的多模态能力文本理解与生成优势

：豆包大模型经过海量文本数据训练，能精准理解用户输入的文本需求，包括主题、风格、情节等细节，并以自然流畅、富有创意的语言生成分镜脚本中的台词和描述。图像与视频的融合能力

：它可以识别和理解图像及视频内容，将图片或视频中的元素融入分镜脚本创作，为用户提供更加直观和形象的创意参考，有助于生成更具视觉冲击力和故事性的分镜画面。3.1.2相关知识3.豆包优势3.1.2.4豆包大模型：短视频脚本生成利器（5）专业的视频领域知识（4）自适应学习与泛化能力强（3）拟人化的情感表达与逻辑理解（2）高效的内容生成（1）强大的多模态能力2.高效的内容生成快速响应

：豆包大模型能够快速生成短视频分镜脚本，短文本场景回答平均在50毫秒左右，长文本场景平均在200毫秒左右，边想边搜的deepresearch能力，可以在5-30分钟内完成过去需要多名专业人士花费数天才能完成的调研报告级别的分镜脚本创作，满足用户对高效创作的需求。高效率的创作支持

：其高效的处理能力，能够帮助用户在短时间内探索多种创意方向，修改和完善分镜脚本，从而更好地适应短视频快速制作和发布的节奏。3.1.2相关知识3.豆包优势3.1.2.4豆包大模型：短视频脚本生成利器（5）专业的视频领域知识（4）自适应学习与泛化能力强（3）拟人化的情感表达与逻辑理解（2）高效的内容生成（1）强大的多模态能力3.拟人化的情感表达与逻辑理解情感丰富的脚本

：豆包大模型在情绪理解和情感表达方面具有明显优势，它能够根据分镜脚本的情节和角色特点，生成具有细腻情感的台词和描述，使视频更具感染力和吸引力，帮助用户更好地传达视频所要表达的情感和氛围。逻辑连贯的剧情

：它可以在保证情感表达自然的同时，兼顾分镜脚本的逻辑连贯性，使视频故事的发展更加合理、顺畅，让观众更容易理解和接受。3.1.2相关知识3.豆包优势3.1.2.4豆包大模型：短视频脚本生成利器（5）专业的视频领域知识（4）自适应学习与泛化能力强（3）拟人化的情感表达与逻辑理解（2）高效的内容生成（1）强大的多模态能力4.自适应学习与泛化能力强自动调整风格

：豆包大模型能够根据不同用户的需求和偏好，自动调整生成分镜脚本的风格，无论是幽默诙谐、严肃庄重还是温馨感人等风格，都能很好地驾驭，满足不同用户和不同短视频主题的多样化需求。广泛的应用场景适应性

：它对于各种题材和类型的短视频分镜脚本生成都有较好的适应性，无论是广告宣传、故事剧情、知识科普还是生活记录等类型的短视频，都能生成贴合主题和风格的分镜脚本。3.1.2相关知识3.豆包优势3.1.2.4豆包大模型：短视频脚本生成利器（5）专业的视频领域知识（4）自适应学习与泛化能力强（3）拟人化的情感表达与逻辑理解（2）高效的内容生成（1）强大的多模态能力5.专业的视频领域知识理解视频创作要素

：豆包大模型对短视频的结构、节奏、镜头语言等专业知识有深入的理解和掌握，能够根据这些专业知识生成合理且富有创意的分镜脚本，包括镜头的景别、角度、运动方式，以及画面的构图、色彩搭配等方面的建议，帮助用户提升视频的专业性和观赏性。紧跟行业趋势

：字节跳动在视频领域拥有丰富的经验和海量的数据资源，豆包大模型可以充分利用这些优势，紧跟短视频行业的最新趋势和热点，为用户提供个性化的创意灵感和新颖的分镜脚本，使用户的短视频更具竞争力和吸引力。3.1.2相关知识4.豆包及相关短视频生成大模型特点及适用场景3.1.2.4豆包大模型：短视频脚本生成利器序号大模型特点适用场景1Kimi操作简单便捷，用户通过手机

APP或电脑网页就能使用。可针对用户的不同需求，如指定主题、时长、风格等，生成对应的分镜脚本，并且能够根据用户的反馈进行优化调整。适合初学者以及对分镜脚本要求不高，但希望快速得到结果的短视频创作者，能帮助他们快速展开创作。2DeepSeek具有较强的多语言能力、逻辑推理能力和通用知识能力，可以生成高质量的中英文内容，在处理复杂的逻辑和概念方面表现出色。能够根据用户需求，生成创意十足且逻辑清晰的分镜脚本，为视频创作提供多样化的思路。对于需要在脚本中体现复杂逻辑关系、多语言元素或专业知识的短视频，如科技产品介绍、商业案例分析等，DeepSeek能发挥其优势。3文心一言百度推出的知识增强大语言模型，具有强大的语言理解和生成能力，能够快速生成符合用户需求的短视频分镜脚本，提供创意和灵感，降低创作门槛。适用于各种类型的短视频创作，尤其是对于希望在短时间内获得大量创意和灵感的创作者，可帮助他们快速打开思路。4通义千问

阿里云推出的企业级大模型，具备多模态能力，能支持图像生成、语音合成等，可与阿里云生态产品无缝协同。其行业解决方案能力强，在电商、零售等领域可针对商品特点生成吸引人的分镜脚本，助力营销推广。在电商营销、企业宣传等领域应用广泛，能为电商短视频制作提供便利，更好地展示商品特点和卖点。技术自信与创新意识“豆包是字节跳动开发的国产大模型，它的多模态能力、文本生成能力，已经达到国际先进水平,特别是最近出来的seedance2.0。这说明什么？说明中国在AI领域，不仅能‘跟跑’，更能‘领跑’。你们这一代人，要做的就是让中国AI走得更远、用得更广、影响更大。”豆包是国产大模型，体现中国在AI领域的技术突破。强调“自主可控”的重要性。Contents目

录3.1.1任务背景3.1.2相关知识3.1.3任务实施实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-1豆包官网网页版界面本次操作使用豆包网页版，可以通过浏览器在线访问豆包官网，如图3-1所示。（1）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-2按提示词要求输入提示词在文本输入框输入“你是一个优秀的短视频编剧，请编写一个潮州木雕非遗技艺短视频分镜脚本”，并鼠标单击“发送”按钮，如图3-2所示。（2）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-3豆包自动生成的短视频脚本豆包自动生成短视频脚本，如图3-3所示。（3）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-4下载豆包生成的短视频脚本如果满意生成的短视频的脚本，可以鼠标单击“下载”按钮，在“下载”菜单下，鼠标单击“Word”按钮，如图3-4所示。（4）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-5下载并打开豆包生成的短视频脚本弹窗显示“新建下载任务”，选择对应下载目录地址后鼠标单击“下载并打开”按钮，如图3-5所示。（5）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-6豆包生成的短视频脚本在Word中打开生成的脚本，如图3-6所示。（6）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-7按短视频脚本模式格式生成新的短视频脚本根据客户的需求，对生成的脚本迭代修改。如希望生成的脚本按以下短视频脚本的标准模板格式生成，在文本输入框输入“对上面的分镜头脚本按镜号、景别、运镜、时长（秒）、画面内容、台词/旁白、音效/音乐、备注，形成新的脚本”，并鼠标单击“发送”按钮，如图3-7所示。（7）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-8按新要求生成的新脚本豆包生成新的视频脚本，如图3-8所示。（8）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-9新旧脚本之间的区别按步骤4-6，下载并打开新的脚本，比较新旧脚本之间的不同，如图3-9所示。（9）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-10新增潮州木雕的工艺的传承内容修改脚本按照用户的需求，对脚本迭代修改，直到满足用户需求为止。如想增加潮州木雕的工艺的传承内容，如图3-10所示。（10）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施图3-11新增传承内容后脚本的变更。按步骤4-6，下载并打开新的脚本，比较新旧脚本之间的不同，如图3-11所示。（11）实施步骤如下本任务计划使用豆包大模型工具生成短视频脚本3.1.3任务实施按用户的需求，对短视频脚本迭代修改，直到客户满意为止。（12）由以上操作可以看出，利用豆包大模型可以在3-5分钟内生成短视频脚本，并可根据客户需求来修改，修改的脚本也可以在3-5分钟内修改完毕，这使得普通人都具备数字生产能力，激活数字创造力，提升了工作效率，同时也对编剧等传统职业较大的冲击。文心一言设计“潮州木雕非遗技艺”的宣传海报任务3.2设计一张具有吸引力的“潮州木雕非遗技艺”宣传海报TaskContents目

录3.2.1任务背景3.2.2相关知识3.2.3任务实施3.2.1任务背景一方面，政府高度重视非遗保护工作，出台了相关实施意见，从完善调查记录、完善名录体系、加强传承体验设施建设等方面，进一步健全非遗保护传承体系。同时，社会各方也积极参与潮州木雕的传承与推广，如一些非遗传习所的建立，为潮州木雕的传承提供了良好的环境和条件。另一方面，随着时代的变迁和现代生活方式的冲击，潮州木雕在适应现代审美和市场需求方面仍需不断探索和创新，以吸引更多年轻人的关注和喜爱，让这一古老的技艺在现代社会中焕发出新的生机与活力。近年来，潮州木雕的传承与发展面临机遇与挑战并存的局面设计一张具有吸引力的“潮州木雕非遗技艺”宣传海报，旨在向广大民众尤其是年轻人，全面、生动地展示潮州木雕的独特魅力和深厚文化底蕴，提高其社会认知度和影响力，增强人们对这一非物质文化遗产的保护意识和传承意愿，进一步推动潮州木雕的传承与发展，促进其与现代生活的融合，使这一古老的技艺在新时代背景下能够持续繁荣，为中华优秀传统文化的传承与发展贡献一份力量。“一张好海报，就像一张文化名片。你们设计的这张海报，可能会出现在博物馆的展板上、学校的宣传栏里、甚至社交媒体的首页上。它要让看到的人，一眼就感受到潮州木雕的精湛与温度。这不仅是设计能力的考验，更是文化理解力的考验。”非遗活化与现代传播强调海报是文化传播的“第一印象”。引导学生思考：如何让年轻人“一眼爱上”非遗？Contents目

录3.2.1任务背景3.2.2相关知识3.2.3任务实施3.2.2相关知识3.2.2.1文生图简介采用大模型工具生成宣传海报是文生图的应用，文生图是人工智能在跨模态生成领域的核心应用之一，通过文本与图像的语义关联，实现了高效、低成本的视觉内容创作，正在重塑设计、娱乐、教育等行业的生产流程。文生图对传统设计行业是一个巨大的冲击，AI可快速完成从需求分析、草图生成到最终渲染的全流程，并可根据实时反馈或客户需求快速迭代设计，使得设计师的核心竞争力将转向创意策划能力、AI协作能力和文化洞察力。文生图Text-to-ImageGeneration是指通过输入文本描述（如自然语言句子、关键词或指令），由计算机算法自动生成符合描述的图像或视觉内容的技术。将文本语义转化为视觉表达，实现从抽象语言到具体图像的跨模态转换。文生图可以实现多模态生成，能结合文本、草图、3D模型生成复合设计，用文生图替代外包设计，降低50%以上视觉内容成本，并可以批量生成本地化设计。文生图技术不仅是工具革新，更是设计行业底层逻辑的重构。行业需建立新的伦理规范和合作机制，在技术进步与人文价值之间找到平衡点，推动设计从“服务商业”向“服务社会”升级。技术赋能与文化自信文生图是跨模态生成的核心技术，降低创作门槛。但门槛降低，不代表价值观可以降低。“文生图让不会画画的人也能‘画’出作品，这是技术的普惠。但你们要记住：工具可以替代笔，但不能替代心。你输入什么提示词，AI就生成什么图。如果你的提示词里没有文化理解，生成的图也就没有灵魂。”文生图的算法原理主要基于深度学习、自然语言处理和多模态学习技术。3.2.2相关知识3.2.2.2文生图的算法原理扩散生成模型变分自编码器跨模态学习（DiffusionModel）（VAE）（CLIP模型）扩散模型是一种基于深度学习的图像生成方法，它通过逐步加噪（扩散过程）和去噪（逆扩散过程）来生成高质图像。在扩散过程中，图片逐渐变得模糊，最终成为标准正态分布；逆扩散则通过一系列采样步骤从噪声中恢复图像。通过编码器，将图像压缩到低维潜在空间（LatentSpace），生成潜在特征表示。通过解码器：将潜在特征解码为像素级图像，实现从文本到图像的转换。通过通过大规模图像-文本对数据集进行预训练，学习文本和图像之间的关联性。通过文本编码器（TextEncoder），将自然语言文本编码为向量表示。通过图像编码器（ImageEncoder）：将视觉图像编码为向量表示。通过对比学习：通过配对图像-文本对进行训练，提升跨模态语义匹配效果。“扩散模型、CLIP这些技术，最早是国外提出的。但文心一言通过自主研发，已经在多模态理解、文生图质量上达到世界水平。这说明什么？说明核心技术是买不来的，必须靠自己攻关。你们未来从事AI研究，也要有这种‘自主可控’的意识。”科技创新与自主可控介绍扩散模型、VAE、CLIP等技术原理。强调国产大模型（如文心一言）在核心技术上的突破。要有效使用提示词为文心一言的文生图功能生成宣传海报，需遵循结构化提示词公式，结合具体案例实现精准创作：结构化提示词公式，采用「主体+细节+场景/背景+氛围+风格+参数」的分层框架：3.2.2相关知识3.2.2.3文生图宣传海报的提示词主体细节场景/背景氛围风格参数明确核心对象（如人物、产品）补充外貌、动作、材质等特征设定环境与氛围传递情感基调指定艺术形式（如工笔画、赛博朋克、3D渲染）明确画质、分辨率等技术要求提示词案例一位潮州木雕匠人正在雕刻《潮州八景》屏风，画面中呈现广济桥、韩文公祠等标志性建筑，镂空通雕技法展现精细的亭台楼阁与波光粼粼的江水，背景为古朴木雕工坊，墙上挂满传统木雕工具与潮剧脸谱，阳光透过木窗洒在匠人专注的脸上，色调以深棕色和朱红色为主，搭配金色点缀。风格为工笔画与写实摄影结合，画质超写实，光影层次分明，突出潮州非遗的匠心精神。1.文心一言简介3.2.2相关知识3.1.2.4文心一言：高效智能助手文心一言是百度公司推出的知识增强大语言模型，自2023年发布以来，在自然语言处理领域展现出卓越的能力。文心一言基于海量文本数据训练，能够精准理解用户需求，为多个领域提供智能化解决方案，成为人们在学习、工作和生活中不可或缺的智能助手。它在文本创作、知识问答、对话交流等场景中均表现出色，为用户带来了高效便捷的体验。1.对话理解与互动交流文心一言具备强大的对话理解能力，能够准确解析对话内容以及上下文关系，从而精准识别用户问题的核心语义，并给出恰当且连贯的回应。在多轮对话场景下，它能够综合考虑对话的历史信息，确保对话的连贯性和逻辑性。例如，在进行复杂的技术咨询时，文心一言可以逐步引导用户，提供详细的解决方案，使对话过程自然流畅，有效满足用户的咨询需求。2.文心一言的功能特点3.2.2相关知识3.1.2.4文心一言：高效智能助手2.文本创作与内容生成文心一言能够快速生成各类文本，包括但不限于新闻报道、故事创作、文案撰写、脚本设计等。用户只需提供主题、风格要求等基础信息，文心一言便能按照指定的风格和格式生成高质量的文本内容。以创作科技产品宣传文案为例，它可以根据产品的特点和目标受众，生成具有吸引力和说服力的宣传文案，为企业的产品推广提供有力支持。2.文心一言的功能特点3.2.2相关知识3.1.2.4文心一言：高效智能助手3.知识问答与信息检索依托庞大的知识库，文心一言能够高效地检索和整合各类知识资源。当用户提出知识性问题时，它能够迅速给出准确且清晰的回答。无论是历史事件、科学原理，还是文学艺术等领域的知识，文心一言都能凭借其强大的知识储备，为用户提供沉浸式的学习体验，帮助用户快速获取所需的知识。2.文心一言的功能特点3.2.2相关知识3.1.2.4文心一言：高效智能助手4.逻辑推理与问题解决文心一言具备出色的逻辑推理能力，能够应对涉及逻辑关系的复杂问题。在面对数学应用题、逻辑谜题等需要推理分析的问题时，它能够清晰地梳理问题中的条件和关系，通过逐步推理，得出正确的答案。这一功能使其在教育、科研等领域具有广泛的应用价值，能够辅助用户进行问题分析和解决。2.文心一言的功能特点3.2.2相关知识3.1.2.4文心一言：高效智能助手5.文生图功能文心一言具备强大的文生图功能，能够将文字描述转化为生动的图像。用户只需输入简洁的文字描述，如“一只在花丛中翩翩起舞的蝴蝶，色彩斑斓，细节丰富，写实风格”，文心一言即可生成相应的图像。其优势特点主要体现在以下几个方面：2.文心一言的功能特点3.2.2相关知识3.1.2.4文心一言：高效智能助手精准理解绘画意图文心一言能够深入理解用户的绘画需求，包括主题、风格、色彩、构图等关键要素。无论是写实风格、卡通风格还是抽象风格，它都能精准把握并呈现在生成的图像中。高质量图像生成快速创作与多样化风格生成的图像具有较高的清晰度和细节表现力，能够满足用户的基本绘画需求。例如，对于人物肖像的绘制，可以准确地表现出人物的面部特征、表情和姿态。在短时间内即可完成图像的生成，大大提高了绘画创作的效率。同时，它支持多种绘画风格，如油画、水彩画、素描等，为用户提供了丰富的创作选择。1.深度与广度兼具的语言理解能力3.文心一言的优势3.2.2相关知识3.1.2.4文心一言：高效智能助手文心一言经过海量文本数据的训练，对自然语言的理解能力极为出色。它能够精准解析复杂长句、多义词以及各种复杂的语法结构，从而准确把握用户的意图。这为后续生成准确、符合逻辑的回答提供了坚实的基础，确保了与用户交流的顺畅和高效。2.高效生成与质量保障并重的内容生产能力3.文心一言的优势3.2.2相关知识3.1.2.4文心一言：高效智能助手在文本生成任务中，文心一言展现出了惊人的效率。凭借先进的语言生成技术，它能够在短时间内快速生成高质量的内容。生成的文本不仅逻辑连贯、条理清晰，而且语言流畅自然，具有较高的可读性。同时，文心一言注重内容质量的把控，通过不断优化生成算法和模型参数，确保生成内容的准确性和可靠性。这使得用户能够在较短的时间内获取优质的信息和创意灵感。3.个性化服务与灵活适应能力3.文心一言的优势3.2.2相关知识3.1.2.4文心一言：高效智能助手文心一言能够根据不同用户的需求、偏好以及使用场景，提供个性化的服务和灵活的解决方案。它可以调整回答的风格和内容，以适应不同用户的创作风格与需求差异。无论是正式严肃的学术讨论，还是轻松幽默的日常聊天，它都能完美适配，为用户带来独特的交互体验。4.多领域知识融合与创新应用3.文心一言的优势3.2.2相关知识3.1.2.4文心一言：高效智能助手文心一言整合了多个领域的知识，能够将不同学科、不同类型的知识相互关联和融合。在回答问题和生成内容时，它可以从多个角度提供全面、系统的视角，使生成的内容更具价值和深度。这种跨领域的知识融合能力不仅丰富了回答的内容，还为用户提供了更广阔的思考空间，激发创新思维。5.文生图功能的独特优势3.文心一言的优势3.2.2相关知识3.1.2.4文心一言：高效智能助手文心一言的文生图功能为创意设计、艺术创作等领域带来了全新的可能性。它使得非专业绘画人员也能够轻松地将自己的创意转化为可视化的图像，降低了创作门槛。同时，该功能还可以辅助专业绘画人员进行灵感探索和草图绘制，提高绘画创作的效率和质量，为艺术创作提供了更多的便利和可能性。4.文心一言与其他大模型在设计宣传海报功能的对比3.2.2相关知识3.1.2.4文心一言：高效智能助手除了文心一言大模型还有其他一些大模型也可以制作宣传海报，下面表3-4是文心一言与其他大模型在设计宣传海报功能的对比。序号大模型优势劣势1Kimi操作简单便捷，可快速生成海报文案并能根据用户反馈进行优化调整。需要用户具备一定基础的设计思路和文案撰写能力，对于复杂或专业性较强的海报设计主题，可能提供的创意和知识支持不够深入，难以生成具有高度创新性和专业性的海报文案。2DeepSeek擅长处理复杂的逻辑和

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《人工智能导论》课件-03.豆包文心一言赋能智能创作

文档简介

温馨提示

最新文档

评论

相关文档