版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
任务二
生成视频创设情境王华所在公司负责新产品的宣传,在新产品出来后他要第一时间请专业公司制作视频,经常在领导和制作为员间协调,为了制作视频十分烦恼。而今,她熟练使用生成式人工智能,高效、低成本、轻松解决了这个烦恼。在本任务中,我们一起使用生成式人工智能,使用文本、图片等提示词生成视频。活动目标1.了解AI生成视频的一般操作步骤。2.掌握生成虚拟视频的方法与技巧。3.能够感受人工智能对生活、学习和工作带来的便捷。活动准备初步了解视频生成的原理:文本生成视频的原理是通过自然语言处理(NLP)技术将文本内容转化为视频。这一过程涉及多个步骤和技术,包括文本处理、图像生成、音频合成和视频合成。本处理是第一步,涉及对输入的文本内容进行分词、情感分析和关键词提取等处理,以确保生成的视频与文本内容高度相关。接下来是图像生成,这一步通常需要生成背景图片、文本框等元素。可以使用图像处理工具或库来生成这些图像,并根据文本内容选择合适的图像元素。活动准备初步了解视频生成的原理:音频合成则是为了增强视频的吸引力,可以通过文本转语音(TTS)技术将文本转化为声音,生成配音或背景音乐。最后,视频合成是将生成的图像和音频合成为视频。可以使用视频编辑工具或库来将图像序列和音频合并在一起,设置帧速率和视频分辨率以获得所需的输出效果。AI智能系统会自动分析文本内容,提取关键词,确定视频主题,并根据文本内容自动匹配相应的图像、音效和背景音乐等素材,最终生成一段富有创意的短视频。活动准备初步认识创作平台:1.讯飞智作:核心功能包括有AI配音(多语种、多情感)、虚拟数字人视频生成、PPT智能转视频等。我们可通过输入文本或录音,快速生成新闻播报、教学视频、企业宣传等内容,提升创作效率。根据文案自动生成自然肢体动作,适用于直播、培训、新闻播报等场景。活动准备初步认识创作平台:2.智谱清言大模型:它分为文本生成视频和图像生成视频两种,在文本和图像生成视频的活动,选用视频生成功能,输入一段文字,并选择想要生成的视频风格、情感氛围、运镜方式,就能生成一段充满AI想象力的视频片段。3.其它大模型:我们在实践操作阶段会用到与活动开展和拓展提高部分类似的大模型,通义万相、可灵AI、即梦AI等它们功能类似,部分维度不同。任务二AI换脸使用的在线平台remaker.ai,实现了单人换脸和多人换脸。活动展开-虚拟人参照教材中“活动展开”,尝试操作。1.进入平台。登录讯飞智作官网(),进入AIGC内容创作平台,并修改作品名称。
进入AIGC内容创作平台活动展开-虚拟人参照教材中“活动展开”,尝试操作。1.进入平台。修改作品名称。
修改作品名字活动展开-虚拟人参照教材中“活动展开”,尝试操作。2.选择画布尺寸。选择合适的画布尺寸,点击“虚拟人”按钮,选择你喜欢的虚拟人形象。
画布尺寸选择活动展开-虚拟人参照教材中“活动展开”,尝试操作。3.输入提示词。输入语音播报文字内容、选择配音主播后试听。
播音音色选择播报文字内容活动展开-虚拟人参照教材中“活动展开”,尝试操作。3.输入提示词。浏览虚拟人效果并生成播报视频。
下载作品界面作品导出设置活动展开-AI换脸参照教材中“活动展开”,尝试操作。1.图片换脸。打开网站remaker.ai/zh/face-swap-free/,登录后选择原图和目标图像换脸。
换脸后图片选择原图和目标图像活动展开-AI换脸参照教材中“活动展开”,尝试操作。2.视频换脸。上传源视频和目标图像换脸。
视频换脸界面活动展开-AI换脸参照教材中“活动展开”,尝试操作。2.视频换脸。上传源视频和目标图像换脸。
生成的换脸视频对比活动展开-AI换脸参照教材中“活动展开”,尝试操作。2.视频换脸。上传源视频和目标图像换脸。
生成的换脸视频对比(点击播放)活动展开-文本生成视频参照教材中“活动展开”,尝试操作。1.尝试文生视频。智谱清言大模型中,输入描述文本,设置生成模式、视频风格、情感氛围、运镜方式后生成视频。
输入描述文本生成视频效果活动展开-文本生成视频参照教材中“活动展开”,尝试操作。2.设置声音效果。为生成视频增加音效,添加背景音乐。
增加音效选择背景音乐活动展开-文本生成视频参照教材中“活动展开”,尝试操作。3.修改视频作品。生成的视频作品不满意,可重新生成或删除视频,也可更换或删除AI音效、背景音乐。重新生成或删除作品更换或删除背景音乐活动展开-图片生成视频参照教材中“活动展开”,尝试操作。1.生成视频。打开智谱清言大模型,选择一张图片上传,生成视频。
上传图片视频生成效果活动展开-图片生成视频参照教材中“活动展开”,尝试操作。2.设置声音效果。在智谱清言大模型“我的创作”中增加背景音乐或AI音效,然后下载到本地。
增加AI音效下载视频文件到本地活动展开-图片生成视频参照教材中“活动展开”,尝试操作。3.修改视频作品。生成的视频作品不满意,可更换或删除背景音乐、AI音效,也可重新生成或删除作品。
修改作品更换或删除背景声音活动展开-PPT生成视频参照教材中“活动展开”,尝试操作。1.登录平台。在“百度智能云数字员工”首页点击“营销内容创作”图标进入编辑界面。
扫描观看“百度智能云数字员工”首页活动展开-PPT生成视频参照教材中“活动展开”,尝试操作。1.上传PPT课件。修改作品名字为“ppt生成视频”,单击PPT素材下方“+”图标,在弹出页面中上传ppt。
修改作品名字扫描观看上传PPT活动展开-PPT生成视频参照教材中“活动展开”,尝试操作。2.生成视频。在“时间线”上点击“添加脚本”,进入“输入脚本”菜单,输入文本内容。
选择“输入脚本”选项输入文本内容活动展开-PPT生成视频参照教材中“活动展开”,尝试操作。2.生成视频。选择声音,试听效果,设置参数后导出视频。选择播报声音导出视频应用提升-虚拟人了解讯飞智作工具面板功能①属性栏;②主播选择区;③内容导入区;④预览导出区;⑤片段编辑区等。数字人编辑面板应用提升-虚拟人了解腾讯智影工具面板功能①属性栏:位于页面顶部,可调整视频尺寸、分辨率、码率,开关字幕和AI标识等。②主播选择区:位于预览区右侧,可滑动选择虚拟人、声音、模板、背景、画中画、文本和字幕等。虚拟人选项卡可按照性别、姿势(全身、半身、坐姿等)筛选不同领域主播形象;声音选项卡可更换不同主播声音、调节主播语速和语调;模板中可选择现有场景,也可自己制作模板。③内容导入区:位于预览区下面,可输入文字自动合成语音,也可上传自己录制好的音频;也可点击“动作模式”插入主播动作(无动作、自然动作、AI匹配等)。④预览导出区:可保存文件、预览效果、生成视频文件。⑤片段编辑区:可导入PPT,每页PPT将作为视频的一个片段。应用提升-虚拟人编辑虚拟人:虚拟人动作可为虚拟人选择“自然动作”、“手动添加”、“AI匹配”,根据需要选择虚拟人的手势动作。虚拟人选择界面虚拟人的动作选项应用提升-虚拟人编辑虚拟人:画中画效果点击“画中画”选项卡,上传一张图片后,拖动到合适位置预览效果。上传画中画视频调整画中画视频位置应用提升-虚拟人编辑虚拟人:调整主播声音切换到“声音”选项卡,可选择主播及其风格后,设置“语速”、“语调”、“声音增益”等大小。数字人属性设置应用提升-虚拟人编辑虚拟人:设置背景点击右侧工具栏中“背景”选项卡,可选择“系统背景”和“我的背景”,点击“全部场景”下拉框,筛选不同类型的背景,选择一张背景后预览效果。也可点击“我的背景”选项卡,从本地上传一张图片作为背景。为虚拟人增加背景应用提升-虚拟人编辑数字人:设置字幕点击右侧工具栏中“字幕”选项卡,可开启字幕功能、设置字体及大小、颜色、位置等。字幕样式设置应用提升-虚拟人编辑平台模板:选择模板单击右侧“模板”选项卡,选择一个模板,在弹出预览界面中调整主播和模板元素位置。选择模板风格调整主播和模板元素位置应用提升-虚拟人编辑平台模板:导入PPT增加场景增加或删除场景,并可选择不同的背景模板和虚拟人,导入ppt后,每个页面作为一个场景,ppt内容也根据模板位置嵌入。也可以结合“画中画”功能上传ppt作为背景。导入PPT增加场景选择转场效果应用提升-AI换脸自定义换脸单人换脸:不使用系统原图和目标人脸图,上传自己选定的图片换脸。上传自选图片换脸后效果应用提升-AI换脸自定义换脸多人换脸:选择一张系统默认多人合影照片上传到目标图片框,生成新的换照片。多人合影分解为合影换脸应用提升-AI换脸自定义换脸多人换脸:选择一张系统默认多人合影照片上传到目标图片框,生成新的换照片。合影换脸后的照片合影换脸前的照片应用提升-AI换脸批量换脸多张原图:多张原图需要同时换为1张脸,可以使用批量换脸功能。多张原图换1张脸多原图批量换脸生成图应用提升-AI换脸批量换脸多张原图:多张原图需要同时换为1张脸,可以使用批量换脸功能。多张原图换1张脸多原图批量换脸生成图应用提升-AI换脸批量换脸多张目标人脸:对于1张原图需要同时换为多张脸,可以使用批量换脸功能。1张原图换多张脸1张原图批量换多张脸生成图应用提升-文本生成视频设置进阶参数设置基础参数:输入描述文本后,基础参数可设置生成模式、视频帧率、视频分辨率和生成比例。设置基础参数应用提升-文本生成视频设置进阶参数设置AI特效:平台默认提供了一些简单的AI特效,生成视频时,可以勾选特效。设置AI特效应用提升-文本生成视频设置进阶参数输入描述文本后,还可以设置视频时长、AI音效和水印开关。应用提升-文本生成视频优化提示词结构构造清晰的结构:提示词要按照画面描述要点,告诉人工智能需要生成视频的关键点,如摄像机移动方式、场景描述等,大家不妨尝试如下公式来编写提示词,使用提示词的结构更清晰。[镜头语言]+[光影]+[主体(主体描述)]+[主体运动]+[场景(场景描述)]+[情绪/氛围/风格]例句:摄影机平移(镜头移动),一个小男孩坐在图书馆的长椅上(主体描述),手里拿着一本有趣的童话故事(主体动作)。他穿着一件白色的衬衫,看起来很愉快(主体细节描述),背景是藏满各种书籍的书架,阳光透过窗户酒在男孩身上(所处环境描述)。应用提升-文本生成视频优化提示词结构构造清晰的结构。有无结构的提示词生成视频效果对比应用提升-文本生成视频优化文本描述技巧提示词优化。在描述文字的时候,优化文字描述有助于更贴近我们满意的结果,如强调关键信息、聚焦出现内容、规避负面效果等。①
强调关键信息:在提示的不同部分重复或强化关键词有助于提高输出的一致性。例如,摄像机以超高速镜头快速飞过场景。(其中的“超高速”、“快速“就是重复词)②
设置艺术风格:在提示词中添加"艺术家/艺术作品风格”,可以更好地指定视频的呈现效果。增加文森特·梵高、莫柰风格描述后生成的视频效果对比表如表4-2-3所示。③
规避负面效果:为了进一步保障视频生成质量,可以在提示词中写明不需要的效果。例如:"不出现扭曲、变形、模糊的场景。④
增加电影风格:添加"电影风格”,可以更好地指定视频的呈现效果。无电影效果基础风格、科幻风格、西部风格、黑色电影风格提示词和生成的视频风格对比如表4-2-4所示。
⑤
加强镜头语言:镜头语言是通过摄影机的移动或焦距变化来表现画面内容的一种方式。常用的镜头运动包括推、拉、摇、移、升、降等。应用提升-文本生成视频优化文本描述技巧提示词优化。风格提示词生成视频文森特·梵高文森特·梵高,种子发芽破土而出
莫柰莫奈(ClaudeMonet),种子发芽破土而出电影风格提示词生成视频对比应用提升-文本生成视频优化文本描述技巧提示词优化。风格提示词生成视频基础风格一个乐高积木小人在高速公路上开跑车
科幻风格科幻风格,一个乐高积木小人在公路上开车
西部风格西部风格,一个乐高积木小人在高速公路上开跑车
黑色电影风格黑色电影风格,一个乐高积木小人在公路上开车应用提升-图片生成视频图片上传设置图片尺寸设置。可选原图/9:16/16:9/1:1/3:4/4:3六种比例。图片裁剪非等比裁剪后效果应用提升-图片生成视频图片上传设置图片质量设置。采用分辨率提升工具将图片变清晰,平台默认不允许上传像素低于300px的图片。低像素图片上传提示框应用提升-图片生成视频设置视频描述文本增加视频文字描述能更加准确地生成我们想要的视频。上传图片后,按照“参考[主体]+[主题运动]+[背景]+[背景运动]”方式增加视频描述“小男孩子很开心地慢慢取下墨镜”,增加视频描述文本与无文本生成视频对比效果。增加视频描述文本有无视频描述文本效果对比应用提升-图片生成视频设置尾帧图片设置首帧和尾帧图片应用提升-PPT生成视频添加脚本AI帮写:导入PPT后,点击“添加脚本”,输入关键词后生成脚本。生成后,点击“AI写作助手”继续润色、缩写、扩写脚本。AI帮写脚本AI润色脚本应用提升-PPT生成视频添加脚本音频驱动:导入PPT后,点击“添加脚本”,进入“音频驱动”菜单,可选择本地上传和录制音频。上传本地音频文件麦克风录制音频文件应用提升-PPT生成视频添加脚本音频驱动:导入PPT后,点击“添加脚本”,进入“音频驱动”菜单,可选择本地上传和录制音频。音频转字幕内容应用提升-PPT生成视频声音设置设置播报声音:输入脚本内容,选择配音角色后,可设置停顿时间、语速、语调和音量等。设置播报声音参数应用提升-PPT生成视频设置数字人选择数字人:点击左侧菜单栏“形象”切换到数字人选择界面,根据需要设置不同类型、性别、年龄、姿势、动作、场景的数字人。设置数字人筛选标签应用提升-PPT生成视频设置数字人设置数字人参数:设置数字人展示镜头为“全身”,分别设置数字人进场动画和出场动画,并根据内容增加“点头”、“左摊手”等动画。设置数字人展示镜头设置数字人进出场动画数字人增加动画理论拓展-生物神经网络生物神经元的结构我们的大脑之所以能思考、学习,靠的就是无数个“小零件”-生物神经元。每个生物神经元就像一个小小的信息处理站,它核心结构包括细胞体、树突、轴突、突触。生物神经元的结构理论拓展-生物神经网络生物神经网络:人类智慧的“硬件基础”生物神经元的结构细胞体神经元的“指挥中心”,里面有细胞核,负责处理接收到的信息;树突像树枝一样,细细长长,数量还不少,主要作用是“接收信息”。就像我们的耳朵听声音一样,树突会接收来自其他神经元传来的信号;轴突是一条相对较粗、较长的“电线”,一端连接细胞体,另一端有很多轴突末梢,负责把细胞体处理后的信息传递给其他神经元;突触是轴突末端与其他神经元树突的连接点,是信号“跨细胞传递”的关键。理论拓展-生物神经网络生物神经网络:人类智慧的“硬件基础”生物神经网络的信息传递细胞体神经元的“指挥中心”,里面有细胞核,负责处理接收到的信息;树突像树枝一样,细细长长,数量还不少,主要作用是“接收信息”。就像我们的耳朵听声音一样,树突会接收来自其他神经元传来的信号;轴突是一条相对较粗、较长的“电线”,一端连接细胞体,另一端有很多轴突末梢,负责把细胞体处理后的信息传递给其他神经元;突触是轴突末端与其他神经元树突的连接点,是信号“跨细胞传递”的关键。理论拓展-生物神经网络人工神经网络人工神经网络是由很多个“人工神经元”组成的,这些人工神经元按层排列,主要分为三层:•输入层:就像我们的眼睛、耳朵,负责“接收外界数据”。比如要让计算机识别一张图片,输入层就会接收这张图片的像素数据。•隐藏层:它在输入层和输出层之间,相当于“信息处理工厂”。隐藏层会对输入层传来的数据进行加工、处理,比如提取图片中的线条、颜色等特征。隐藏层可以有一层,也可以有多层,层数越多,处理复杂问题的能力通常越强。•输出层:它是“结果输出端”,会把隐藏层处理好的信息变成我们能看懂的结果。比如识别图片时,输出层会告诉我们“这是一只猫”还是“这是一只狗”。理论拓展-生物神经网络人工神经网络人工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年郑州安检考试试题及答案
- 国家护理数据平台安全性建设
- 2026届河南开封高级中学高三下学期学情调研一英语试卷
- 外科护理中的患者隐私保护
- 咳嗽咳痰护理评估的社区资源
- 2026年4月19日云南省昭通市人才引进面试真题及答案解析
- 剖宫产产妇的出院运动指导
- 外科患者舒适护理
- 第3单元 复习指导教学设计高中地理中图中华地图版选择性必修1-中图中华地图版2020
- 安徽省滁州二中高中信息技术《1.1信息及其特征》教学设计 新人教版必修
- 大族激光苹果创新加速与算力PCB扩产激光龙头迎接新一轮高成长
- 2026年智能制造评估师考试试题及答案
- 2026年春贵州人民版(2024)小学综合实践活动三年级下册(全册)教案(附目录)
- 2026年春人教鄂教版(新教材)小学科学三年级下册(全册)课时练习及答案(附目录)
- 讲师培训训练营
- 建筑安全生产标准化制度
- 命案防控知识宣传课件内容
- 2026中船海鹰企业集团有限责任公司校园招聘笔试备考题库及答案解析
- 错峰生产管理制度
- 【《“对分课堂”教学模式的教学实验探究报告》19000字(论文)】
- 2026秋招:江苏农垦集团笔试题及答案
评论
0/150
提交评论