《人工智能技术应用(第二版)》课件 项目三 任务三 编辑视频_第1页
《人工智能技术应用(第二版)》课件 项目三 任务三 编辑视频_第2页
《人工智能技术应用(第二版)》课件 项目三 任务三 编辑视频_第3页
《人工智能技术应用(第二版)》课件 项目三 任务三 编辑视频_第4页
《人工智能技术应用(第二版)》课件 项目三 任务三 编辑视频_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

任务三

编辑视频创设情境张明在一家新媒体公司上班,主要负责整理、编辑视频工作,时常还需要添加英语或其他语言的字幕,使其比较烦恼。而今,她熟练使用AI,轻松地解决了这些问题。活动目标1.掌握AI视频制作工具使用的一般操作方法。2.了解AI视频制作的常用技巧。3.能够感受人工智能对生活、学习和工作带来的便捷。活动准备初步了解AI视频剪辑原理:AI视频处理是指利用人工智能技术,通过算法和数据驱动的方式,自动生成或辅助生成视频内容的过程,它基于深度学习、计算机视觉等原理,通过训练大量数据模型,实现对视频内容的自动理解、生成和编辑。活动准备认识创作平台:1.鬼手剪辑:鬼手剪辑()是一款AI智能视频剪辑工具,可以快速、批量处理视频素材。通过使用AI技术,鬼手剪辑能够自动识别并去除视频中的内置文字、字幕和水印,同时支持多种语言的互译和配音,还提供了模板制作、脚本混剪等功能,本任务中翻译字幕活动使用鬼手剪辑。活动准备认识创作平台:2.自动剪辑神器。自动剪辑神器(autocut.video)提供便捷的视频编辑功能,将视频素材上传到平台上,选择你喜欢的音乐和风格,一键智能过滤停顿、杂音和静音,让视频更加流畅和自然。活动展开-翻译字幕参照教材中“活动展开”,尝试操作。1.翻译字幕。登录鬼手剪辑平台,依次点击“去创作”、“视频翻译”、“台词提取方式”,设置翻译和配音。

视频翻译引导进入图标设置翻译参数设置配音角色活动展开-翻译字幕参照教材中“活动展开”,尝试操作。2.视频翻译。本地上传视频,等待视频字幕翻译。上传视频视频翻译前后对比活动展开-视频擦除参照教材中“活动展开”,尝试操作。1.视频去文字。鬼手剪辑平台中单击“智能去文字”图标,选择文字语种,上传需要去除文字的视频。

智能去文字引导图片选择擦除模型上传视频活动展开-视频擦除参照教材中“活动展开”,尝试操作。1.视频去文字。鬼手剪辑平台中单击“智能去文字”图标,选择文字语种,上传需要去除文字的视频。

原视频全屏去文字区域去文字活动展开-剪辑视频参照教材中“活动展开”,尝试操作。1.AI一键过滤停顿和静音。单击“极速过滤”按钮,添加素材,设置剪辑节奏,生成作品。

“一键过滤停顿、静音”图标添加素材活动展开-剪辑视频参照教材中“活动展开”,尝试操作。1.AI一键过滤停顿和静音。单击“极速过滤”按钮,添加素材,设置剪辑节奏,生成作品。

设置界面设置剪辑节奏界面活动展开-剪辑视频参照教材中“活动展开”,尝试操作。2.AI一键视频切片。单击“极速过滤”按钮,添加视频,在剪辑节奏菜单下选择“自定义”,单击“滴管”图标设置声音阈值,设置导出位置和格式后开始导出视频。

选择“自定义”剪辑节奏设置声音阈值活动展开-剪辑视频参照教材中“活动展开”,尝试操作。2.AI一键视频切片。单击“极速过滤”按钮,添加视频,在剪辑节奏菜单下选择“自定义”,单击“滴管”图标设置声音阈值,设置导出位置和格式后开始导出视频。

选择“导出切片”界面活动展开-剪辑视频参照教材中“活动展开”,尝试操作。3.按时长平均切片。单击“按时长平均切分”按钮,添加视频,设置切分时间,导出小片段。

“按时长平均切分”图标设置切分时间勾选切片后需要生成的片段界面应用提升-翻译字幕了解台词提取方式视频语音:AI平台从视频语音提取台词,翻译后的语种声音通过设置AI配音自动生成。内置字幕:在“全屏”和“指定区域”显示字幕。字幕提取选项设置字幕位置应用提升-翻译字幕了解台词翻译翻译语种设置:分别设置翻译视频源语种和目标语种,视频源语种下拉选项可以选择中文和英文,要翻译成的目标语种下拉选项可以选择多种。视频源语种设置应用提升-翻译字幕了解台词翻译编辑字幕:视频翻译完成后,点击“字幕调整&下载”按钮,可以进行字幕调整。字幕调整页面增加字幕字幕样式选择框应用提升-视频擦除编辑擦除区域对于AI漏擦情况,可以重新编辑擦除效果。增加擦除区域提交AI生成新作品后,在“我的作品”菜单查看作品列表,点击“编辑视频”按钮进入文字擦除的调整界面,打开“原视频”滑动按钮,向上移动蓝色擦除框确保全部覆盖文字。作品列表窗口“原视频”滑动按钮调整蓝色擦除框应用提升-视频擦除编辑擦除区域在编辑时间轴上,遮罩框所在图层比视频时间线短,为确保整个视频文字被擦除,点击鼠标左键拉动蓝色擦除所在图层到与视频平齐。调整蓝色擦除框所在图层时间线应用提升-视频擦除设置保护区域对于视频中部分内容不需要擦除,使用添加保护区域功能。在“我的作品”找到对应作品“编辑视频”按钮,单击进入文字擦除的调整界面,单击“添加保护区域”按钮,时间编辑线上增加了绿色图层,同时在预览界面也增加绿色透明层。增加擦除区域擦除透明层应用提升-视频擦除设置保护区域移动绿色透明层遮挡标题“酸汤面”,保护其不被擦除,同时将时间轴的绿色图层拖动到标题结束的位置,点击“提交”按钮生成视频。保护标题图层设置时间线应用提升-视频擦除设置保护区域移动绿色透明层遮挡标题“酸汤面”,保护其不被擦除,同时将时间轴的绿色图层拖动到标题结束的位置,点击“提交”按钮生成视频。保护标题图层设置时间线应用提升-剪辑视频批量添加裂变文字登录自动剪辑神器,单击“裂变文字样式”按钮,添加视频。添加文字内容、设置显示时间,单击“裂变”按钮,生成后导出。“裂变文字样式”按钮添加文字及显示时间裂变导出设置应用提升-剪辑视频添加背景单击“添加背景”按钮,选择画面长宽比例,添加视频素材和背景图片素材后导出。“添加背景”按钮添加视频素材和背景图片素材理论拓展-人工神经元模型人工神经元是对生物神经元信号处理机制的数学抽象,是构建所有神经网络的最小功能单元,核心作用是接收多维度输入信号,通过线性加权与非线性转换,输出单一维度的结果信号,为后续复杂网络结构提供基础计算能力。核心构成与工作逻辑人工神经元的数学模型包含输入向量、权重向量、偏置项和激活函数四个关键组件。输入向量记为:权重向量记为:偏置项记为:b,用于调整神经元的激活阈值激活函数记为:理论拓展-人工神经元模型核心构成与工作逻辑人工神经元的数学模型包含输入向量、权重向量、偏置项和激活函数四个关键组件。输入向量记为:权重向量记为:偏置项记为:b,用于调整神经元的激活阈值激活函数记为:将输入信号的线性组合结果

映射到特定范围,最终输出公式为理论拓展-人工神经元模型主流激活函数特性激活函数的选择直接影响神经元的表达能力,以下是几种主流的激活函数,各有适用场景。Sigmoid函数

输出范围为(0,1),可将线性结果映射为概率值,适用于二分类任务的输出层。ReLU函数表达式为ReLU(x)=max(0,x),输入为正时直接输出原值,为负时输出0Tanh函数

输出范围为(-1,1),具有零均值特性,相比Sigmoid更适用于对输出对称性有要求的场景理论拓展-人工神经元模型经典实例:感知机感知机是最简单的人工神经元模型,其激活函数为阶跃函数(输入大于阈值输出1,否则输出0)。感知机仅能处理逻辑“与”“或”运算等线性可分问题,无法解决逻辑“异或”运算等线性不可分问题——这一局限性在20世纪60年代直接导致人工智能发展陷入瓶颈,也推动了后续更复杂网络结构的研发。理论拓展-人工神经网络结构人工神经网络由大量人工神经元按特定规则连接形成,不同连接方式(即结构)决定了信号传递路径与功能特性,核心差异在于信号是否存在循环传递,以及神经元连接范围是否为局部,不同结构对应不同的数据处理场景。(1)前馈神经网络(FNN):前馈神经网络是最基础的结构,信号仅沿“输入层→隐藏层→输出层”单向传递,无反向或循环连接,层与层之间通常采用全连接(前一层每个神经元与后一层所有神经元相连)。(2)卷积神经网络(CNN):专为处理空间结构化数据(如图像、视频帧)设计,核心创新是“局部连接”与“参数共享”。(3)循环神经网络(RNN)与变体:针对时序数据(文本、语音、时间序列)设计,通过神经元循环连接捕捉时序依赖(当前输出依赖历史输入)。理论拓展-人工神经网络结构(4)Transformer:基于“注意力机制”构建,无需循环连接即可捕捉长序列依赖——通过自注意力层计算序列内元素的关联权重,聚焦关键信息,且支持并行计算,训练速度远超RNN。是当前自然语言处理领域的主流框架(如GPT、BERT),也广泛应用于语音处理、跨模态生成等任务。理论拓展-神经网络优化神经网络训练本质是优化过程,目标是调整参数(权重、偏置)以最小化预测值与真实值的差异(损失函数值),同时提升模型在未见过数据上的泛化能力,避免过拟合。损失函数:优化的目标标尺损失函数量化模型误差,按分类任务和回归任务类型选择。分类任务的目标是将样本映射到离散类别,损失函数需衡量预测类别(或概率分布)与真实类别的差异。交叉熵损失衡量概率分布差异,对分类错误惩罚敏感;铰链损失关注分类边界稳定性,要求正确类预测值比错误类高预设阈值。回归任务需预测连续值,损失函数直接衡量预测值与真实值的数值偏差。理论拓展-神经网络优化优化算法:参数调整方法优化算法的核心是基于梯度信息制定参数更新策略,以最小化损失函数。根据更新逻辑的不同,可分为基础算法、改进算法及辅助的学习率调度策略。基础算法包括SGD、BGD和、Mini-batchSGD。其中BGD(批量梯度下降)是在每次用全部训练样本计算梯度后更新参数。优点是梯度估计准确、更新稳定,但缺点是数据量大时计算成本极高,迭代速度慢,不适合大规模数据。SGD(随机梯度下降)是在每次随机取单个样本计算梯度并更新参数,优点是计算快、迭代灵活,适合在线学习。缺点是梯度波动大(受单个样本噪声影响),收敛路径曲折,可能在最优值附近震荡。Mini-batchSGD(小批量梯度下降)是在每次用一小批样本计算梯度后更新,综合了BGD的稳定性(批量梯度更可靠)和SGD的高效性,避免全量计算,是实际任务中最常用的基础算法。理论拓展-神经网络优化防过拟合:提升泛化能力过拟合是模型训练中常见的问题,表现为模型在训练集上误差极小(过度拟合训练数据的细节甚至噪声),但在未见过的测试集上误差显著增大,泛化能力差。过拟合表现为训练集误差小、测试集误差大,解决方法包括正则化、Dropout、数据增强和早停。正则化通过对模型参数施加约束抑制过拟合。L2正则化(权重衰减)抑制权重过大,L1正则化使部分权重为零,实现特征选择;Dropout训练时随机“关闭”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论