短视频策划与制作课件第六章 AIGC短视频素材创作

上传人：释*** IP属地：山东上传时间：2026-05-25 格式：PPTX 页数：36 大小：4.73MB 积分：5.99 举报 版权申诉

已阅读5页，还剩31页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第六章AIGC短视频素材创作章引导语行业现状与挑战短视频行业飞速发展，但传统创作模式面临技术门槛高、制作成本大、创意局限多等瓶颈，难以满足日益激增的内容需求。AIGC技术赋能AIGC技术的崛起为短视频素材创作带来革命性突破，成为打破行业瓶颈、推动创作模式革新的关键力量，开启智能创作新征程。本章核心内容从底层逻辑到应用场景，从模型解析到平台实操，全方位复盘真实案例，助力创作者掌握高效、优质的AIGC短视频素材创作方法。本章目标深入理解AIGC视频生成技术的核心概念全面掌握AIGC技术在短视频创作中的应用价值系统梳理国内外主流的AI视频生成大模型熟练掌握即梦AI创作平台的使用方法通过分析真实的AIGC短视频创作案例第一节AIGC视频生成技术概述CHAPTER01·OVERVIEWOFAIGCVIDEOGENERATIONAIGC视频生成技术定义核心定义与原理AIGC视频生成技术利用AI算法，根据文本、图像等输入信息，自动生成动态视频内容。它打破了传统创作模式，开启了智能化创作的新时代。多领域技术融合该技术深度融合了深度学习、计算机视觉、自然语言处理（NLP）等前沿领域成果，是人工智能技术在多媒体生成领域的集大成应用。降本增效与个性化大幅降低了视频创作对人力、物力和时间的依赖，实现了高效、低成本的内容生产，同时支持高度个性化的定制需求。创作模式革新从传统的“人工制作”向“AI辅助生成”转变，不仅提升了生产效率，更为创意表达提供了全新的可能性和工具支持。技术发展脉络早期基础探索受限于早期算法与计算能力，生成视频在画质、连贯性及语义理解上存在明显瓶颈，处于技术探索阶段。深度学习演进随着GANs、VAEs等深度学习算法的引入，视频生成质量显著提升，奠定了现代生成技术的算法基础。扩散模型主流化扩散模型通过逐步去噪生成视频，在细节真实感和多样性上表现出色，已成为当前主流的视频生成技术路径。国际竞争格局：OpenAISora发布里程碑2024年2月16日发布，12月10日正式上线。Sora的推出标志着文生视频技术进入了一个全新的阶段。核心技术突破支持生成长达1分钟的高保真视频，能够理解复杂场景中元素的物理属性及其关系，深度模拟真实物理世界。复杂场景生成可生成包含多个角色和特定运动的场景，如霓虹闪烁的东京街头或雪地中的巨型长毛象，细节丰富逼真。国内发展态势即梦AI(3月)平台开启内测，逐步开放网页版和移动端，开启国内视频生成赛道序幕。可灵(6月)官网正式上线，快速推出图生视频功能，展现出强大的技术落地能力。商汤Vimi(7月)专注人物视频生成领域，发布大模型Vimi，在特定场景下表现优异。清影AI(7月)生成视频模型上线，进一步丰富了国产视频生成的技术生态。通义万相(9月)阿里云发布视频生成模型，支持文生视频和图生视频功能。腾讯混元(12月)上线视频生成功能，巨头入场加速行业技术迭代与应用落地。第二节AIGC技术在短视频创作中的应用应用价值一：突破创作门槛，降低技术与成本壁垒轻量化创作流程支持“文本/图片输入-视频输出”模式，用户仅需输入文字指令或上传照片，即可自动生成视频素材，让零基础创作者也能快速实现创意可视化。低成本场景生成轻松生成现实中难以拍摄的科幻、古风、历史重现等复杂场景，为剧情类、科普类短视频提供低成本、高质量的素材解决方案。动态画面仿真生成符合真实物理规律的动态画面，如水流、光影变化等，有效解决传统拍摄中场景搭建难、安全风险高的问题。应用价值二：拓展内容边界，激发多元化创意表达多模态输入支持支持“文生视频+图生视频+参考视频”等多种输入方式。创作者可结合手绘分镜、实拍照片甚至音乐，灵活生成个性化内容，打破单一素材限制。艺术风格与镜头语言实现梵高油画、敦煌壁画等风格迁移，赋予视频独特的艺术笔触。支持指定推、拉、摇等运镜方式，让短视频具备电影级叙事手法，大幅提升表现力。数字人解决出镜难题利用数字人技术，输入文案即可生成播报视频。有效解决口播类创作者的“镜头恐惧”和场地限制问题，降低内容生产门槛。应用价值三：提升创作效率，实现数据驱动迭代智能策划与脚本优化利用AI快速产出创意方案，辅助脚本优化，大幅缩短前期构思周期，让灵感转化为方案的效率倍增。多模态素材批量生成批量生成文本、图像、视频及合成语音音乐，打破素材匮乏瓶颈，支持内容的规模化量产。自动化剪辑与智能特效借助自动化工具完成繁琐剪辑，应用智能特效提升视觉效果，释放创作者精力聚焦于核心叙事。数据驱动的运营迭代基于用户画像分析制定精准发布策略，形成“AI生成素材+人工优化细节”的高效混合创作模式。第三节AI视频生成模型综述CHAPTER03:AIVIDEOGENERATIONMODELS国外主要的视频生成大模型：Sora超长连贯视频生成突破行业限制，可生成60秒连贯高清视频，支持多角色互动与复杂剧情设定，满足广告与短片创作需求。专业运镜与风格一致性模拟推、拉、摇、移等专业运镜动作，在镜头切换中精准保持角色五官、服饰及场景风格的一致性。真实物理交互模拟深度还原环境物理特性，模拟物体间的真实交互，使生成内容更贴近现实世界认知，身临其境。关于SoraSora是OpenAI于2024年2月发布的文本转视频模型。OpenAI致力于推动AI技术发展，Sora的发布标志着视频生成领域迈向了新的高度。国外主要的视频生成大模型：Runway发展历程与技术突破2018年成立于纽约，致力于用AI赋能影视创作。2023年发布Gen1（风格转绘）与Gen2（文生/图生视频）。2025年推出Gen-4，实现“世界一致性”，确保多场景下人物与物体的统一。行业应用与影响力影视制作：技术应用于奥斯卡获奖影片《瞬息全宇宙》。商业合作：与派拉蒙、迪士尼及狮门影业达成深度合作。核心优势：显著提升影视制作效率，拓展创意边界。核心技术亮点Gen系列模型：从Gen1到Gen4，不断突破生成质量与一致性。世界一致性：Gen-4首创技术，解决长视频生成中的物体漂移问题。国内主要的视频生成大模型：即梦全能创作与智能对口型支持文生视频与图生视频，独创智能对口型功能。用户上传文本或录音，即可自动调整视频口型，极大丰富了创作可能性。快速迭代与商业化隶属于字节跳动剪映业务，已推出视频1.2、2.0及Pro版本，采用积分消耗机制，展现了卓越的更新迭代速度。专业影视级应用作为首席AI技术支持，助力《三星堆：未来启示录》科幻短剧制作，应用了剧本创作、分镜设计等十种AIGC技术。国内主要的视频生成大模型：可灵海量数据优势依托快手庞大的视频平台，具备天然的数据积累优势，是国内视频大模型领域的先行者。灵活创作模式支持文生视频和图生视频，可灵活调整创意想象力与相关性，提供极高的创作自由度。2.0版本升级动态质量与真实感显著提升，优化运动流畅性与时序连贯性，支持电影级运镜与复杂场景模拟。多模态交互(MVL)支持文字、图片、视频片段组合输入，解决复杂创意描述难题。国内主要的视频生成大模型：Vidu&清影Vidu：学术与技术的融合背景：由生数科技与清华大学联合打造，融合学术科研与技术实践优势。特色：全球首个参考生视频功能，确保角色、场景一致性；支持首尾帧自动填充过渡内容。清影：高规格视频生成专家背景：智谱清言开发，源自清华大学计算机系知识工程研究室团队。优势：文生视频支持风格、运镜调节；图生视频最高支持16秒4K60帧，画质与时长表现优异。第四节即梦视频生成模型基础使用与功能解析AI视频生成平台操作指南与功能详解通用使用逻辑与核心流程尽管各类AI视频生成模型功能各异，但核心逻辑高度相似。掌握“输入指令-参数设置-生成优化”的通用框架，能帮助我们快速适配即梦AI、可灵、Vidu等各类工具。01输入指令通过自然语言描述视频内容，明确画面风格、镜头运镜及核心情节，这是生成的基础。02参数设置配置视频分辨率、时长、帧率等技术参数，选择合适的模型版本以平衡效果与速度。03生成优化启动生成任务，根据预览结果进行迭代调整，通过画面修复或二次编辑完善最终成片。一、文生图基础操作：登录与进入创作界面注册登录即梦平台访问官网或下载移动端应用。首次使用需手机号注册，已有账号直接登录。进入文生图创作区登录后在首页点击“AI作图”，选择“图片生成”功能，即可进入正式的创作工作区。文生图基础操作：撰写精准提示词（示例）输入框界面与核心逻辑工作区左侧是关键的提示词输入框，这是引导AI生成图片的核心环节。提示词需精准且详细，才能让AI清晰理解创作意图。详细描述示例“在一片神秘的魔法森林深处，有一座由糖果和饼干搭建而成的小屋。小屋的屋顶是五彩的糖霜，墙壁是巧克力饼干，窗户是透明的果冻。屋前有一条流淌着牛奶巧克力的小溪，溪上有一座用棒棒糖拼成的小桥...”文生图基础操作：撰写提示词的技巧描述精准清晰明确主体元素，限定特征细节，确保AI准确理解核心需求。丰富场景构建描述空间布局，渲染环境氛围，增强画面的故事感和代入感。合理风格指引指定艺术风格，参考已有作品，使生成结果符合预期审美。逻辑条理有序遵循正常逻辑，层次分明阐述，避免信息混乱导致结果偏差。文生图基础操作：模型选择与参数设置（模型）模型特性概览图片3.0：影视质感强，文字理解精准，直出2K高清图。图片2.1：平面绘画感突出，生成文字海报有优势。图片2.0Pro：想象力丰富，擅长生成写实摄影风格图像。图片2.0：文字逻辑理解能力强，支持图片参考功能。图片XLPro：支持图片基础控制，可进行个性化定制。模型选择界面演示文生图基础操作：模型选择与参数设置（效果对比）模型升级带来的效果差异以图片2.0Pro模型为例，对比默认模型，生成效果在细节丰富度和艺术表现力上有显著提升。造型想象力：房屋、糖果和小桥的造型设计更具创意。细节表现：光影效果与材质纹理更加细腻真实。图示：图片2.0Pro模型生成效果示例（童话风格场景）文生图基础操作：模型选择与参数设置（参数）清晰度设置支持标清1K或高清2K。高清画质更清晰但消耗资源更多，生成时间更长。图片比例选择可选择1:1,9:16,16:9等多种比例，建议根据实际应用场景灵活选择。图片尺寸限制最大宽高均为2408。尺寸越大细节越丰富，但生成耗时也会相应增加。文生图基础操作：图片生成与结果筛选点击生成与等待完成提示词与参数设置后，点击“生成”按钮。平台将消耗1个点数开始创作，过程需要等待片刻。结果预览与筛选生成完成后，工作区右侧将一次性呈现四张图片。仔细浏览并挑选出最满意的作品，确保效果符合预期。细节审视与重绘可点击单张图片放大查看细节。若结果不理想，点击“重新生成”按钮，平台将依据原参数再次生成图片。二、图生视频和文生视频操作基础：准备工作构思视频内容明确视频主题，规划关键元素，确定风格基调。这是视频创作的第一步，决定了最终成品的方向。准备辅助素材根据主题提前准备相关的图片、图标、特效等素材，丰富视频内容，确保创作过程流畅高效。图生视频和文生视频操作基础：图生视频选择“图片生视频”模式进入“视频生成”页面，在多种模式中选择“图片生视频”，以便基于图片内容生成动态视频。上传清晰图片素材点击“上传图片”按钮，从本地相册或文件夹中选取图片，确保图片质量清晰、内容完整。引导画面动态描述结合图片内容，用文字描述画面的动态效果，引导图片元素如何运动变化，提升生成效果。图生视频和文生视频操作基础：文生视频模式选择：文字生视频选择“文字生视频”模式，该模式与“图片生视频”操作界面非常相近，但区别在于不需要上传图片，完全依靠文本指令进行生成。核心要求：细节描述由于没有图片作为参考，需要通过文字详细描述场景、人物、动作、氛围等元素，用文字勾勒出完整的视频画面蓝图，对提示词的丰富度要求更高。三、撰写视频提示词：借助豆包获取提示词步骤一：输入清晰指令打开豆包，输入明确的创作需求，例如：“生成一段海底奇幻之旅主题的视频提示词，包含美人鱼、发光水母群和神秘沉船，风格偏向梦幻唯美”。建议要求豆包生成3-5种不同版本，以便挑选。步骤二：筛选并复制使用从豆包生成的结果中，选择最符合您创作思路的提示词。将选中的文本复制，粘贴到即梦视频生成页面的文本输入框中，即可开始生成视频。撰写视频提示词：自行撰写提示词要点内容细节丰富明确关键元素，细化动作描述，增添环境描写，让AI生成更精准。镜头运动恰当选择合适运镜（推进、拉远、旋转等），描述运动节奏，增强动态感。风格精准设定指明艺术风格，契合情感基调，确保视频整体调性符合预期。合理控制篇幅简洁明了表意，根据生成时长调整内容量，避免冗余或信息不足。撰写视频提示词：自行撰写提示词（示例）提示词示例解析核心提示词：“在一片广袤无垠的金色稻田里，秋风轻轻拂过，沉甸甸的稻穗随风摇曳...农民们穿着质朴的衣服，脸上洋溢着喜悦的笑容

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

短视频策划与制作课件第六章 AIGC短视频素材创作

文档简介

温馨提示

最新文档

评论

短视频策划与制作课件 第六章 AIGC短视频素材创作

文档简介

温馨提示

最新文档

评论

相关文档

短视频策划与制作课件第六章 AIGC短视频素材创作