版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
07模块七AIGC多模态应用《人工智能——AIGC通识教程》武汉职业技术大学数智商务学院《人工智能——AIGC通识教程(微课版)》本模块内容0101多模态AI概念0202AI图片与海报设计0303AI短视频创作0404AI音乐与配音0505多模态内容协同0606多模态创作项目实践201多模态AI概念超越单一感官的AI新纪元3什么是多模态AI多模态AI:能同时理解和生成文字、图像、音频、视频多种形态内容的AI单模态AI:只处理一种数据类型(纯文本/纯图像)多模态模型代表:GPT-4V(视觉+文字)、GeminiUltra、文心一言多模态核心能力:图文互转、以图问答、语音文字互转、视频理解技术基础:统一的多模态Transformer+跨模态对齐训练4多模态AI的典型能力1看图说话:分析图片内容,生成文字描述或解答问题2文字生图:根据文字描述生成高质量图像3语音交互:实时语音对话,多语言即时翻译4视频理解:分析视频内容,提取关键信息,生成摘要5全模态创作:输入主题,一键生成图文音视频内容包502AI图片与海报设计10分钟完成专业设计6AI图片创作完整流程第1步创意构思:明确主题、风格、用途(社交媒体/打印/电商)第2步提示词设计:主体+场景+风格+技术参数,中文友好第3步即梦AI生成:选择比例(1:1/16:9/9:16),生成多个版本第4步优选迭代:选最接近的版本,用「图生图」微调第5步后期处理:必要时用Canva/PS做文字排版第6步格式输出:按平台要求导出合适分辨率7AI海报设计vs传统设计传统设计流程•设计师:沟通需求→概念草图→初稿→多轮修改•时间:1-5个工作日•成本:几百至几千元/张•专业工具:PS/AI/Sketch,门槛高AI辅助设计流程•任何人:描述需求→即梦AI生成→人工微调•时间:10-30分钟•成本:几乎免费•门槛:低,中文提示词即可VS8商业图像设计提示词公式1电商主图:「[产品名称],极简白色背景,专业产品摄影风格,高清8K,柔和阴影」2促销海报:「[节日名称]促销海报,[主色调]色系,中文大字标题[内容],现代扁平插画风」3个人头像:「商务风专业头像,深色正装,微笑,浅灰渐变背景,正面角度,超高清」4品牌物料:「[品牌名]品牌海报,[品牌色]主色调,[风格]设计语言,[尺寸]比例」903AI短视频创作人人都是视频创作者10AI短视频创作标准工作流1第1步脚本创作:DeepSeek/豆包写视频脚本,确定核心信息和情感节奏2第2步AI视频生成:即梦AI/可灵输入场景描述,生成视频素材3第3步素材整合:剪映AI导入视频片段,AI自动匹配节奏4第4步字幕生成:剪映AI自动识别语音生成字幕,一键样式5第5步音乐配合:从版权音库选择BGM或Suno生成原创音乐6第6步特效调色:AI推荐滤镜,一键美化7第7步发布优化:AI分析最佳发布时间,生成标题和话题标签11短视频类型与AI工具匹配知识科普类:DeepSeek写脚本+剪映AI配图+自动字幕,适合B站/抖音产品展示类:即梦AI生成产品场景视频+图生视频展示多角度生活Vlog类:手机拍摄+剪映AI智能剪辑+AI配乐故事叙述类:可灵生成人物场景+AI配音(ElevenLabs)+剪映合成营销广告类:即梦AI生成品牌视频+AI写文案+专业后期1204AI音乐与配音让声音赋予内容灵魂13Suno音乐创作实战访问:,注册后每天免费50次生成基础格式:[音乐风格]+[情感基调]+[可选:歌词片段]示例提示词:「UpbeatChinesePop,energeticandyouthful,aboutacollegestudent'sday」进阶技巧:指定BPM(tempofast/slow)、乐器(piano/guitar)、人声特点(femalevocal)输出格式:MP3音频,可直接导入剪映使用注意:商业用途需购买付费计划,版权规则需了解14AI配音应用场景1短视频配音:ElevenLabs生成自然人声,多语言、多音色可选2有声书制作:将文字转为音频,支持长文本批量处理3教学课件配音:给PPT/视频配上讲解音频,节省录音时间4广告配音:快速生成多版本配音方案,供客户选择5语音克隆:用自己的声音训练模型,批量生成个人风格配音1505多模态内容协同1+1+1+1>4的创作魔力16多模态内容协同工作流核心理念:每种模态都有其最适合的AI工具,协同使用才能发挥最大价值标准多模态内容包:文字(DeepSeek)+图片(即梦AI)+视频(可灵)+音乐(Suno)工作流工具:扣子(Coze)支持多工具节点串联,实现半自动化内容生产质量控制:每个模态输出都需人工审核,尤其是事实性内容效率提升:多模态协同可将内容制作时间从数天压缩到数小时17多模态内容平台对比平台名称•扣子(Coze)•腾讯元宝•字节即梦•剪映创作多模态能力•工作流编排,多工具串联,API接口•一站式图文音视频生成,微信集成•图像+视频生成,创意设计场景•短视频全链路,AI字幕/特效/配音VS1806多模态创作项目实践综合运用,打造完整作品19综合创作项目:品牌推广内容包1Step1需求分析:确定品牌(可选:学校社团/虚构品牌/真实产品),目标受众,传播平台2Step2文案策划:用DeepSeek创作品牌故事、核心卖点、营销文案3Step3视觉设计:用即梦AI生成品牌海报、产品图、社交媒体配图4Step4视频制作:用可灵生成10秒品牌宣传视频5Step5音乐创作:用Suno生成30秒品牌主题BGM6Step6整合成包:用剪映AI制作最终成片,整合所有素材7Step7作品展示:班级展示,教师+同学评分,最佳作品奖20多模态内容质量评估标准内容一致性:文字、图片、视频、音乐是否传递一致的品牌形象?视觉吸引力:图片和视频的美观程度,是否吸引目标受众停下来看?信息准确性:文字内容是否准确,有无AI幻觉错误?情感共鸣:作品是否能引发目标受众的情感反应?技术完整性:各模态内容是否制作完整,格式符合发布要求?创意性:提示词设计是否有创意,作品是否有独特的风格?21多模态AI内容版权注意事项1平台条款:不同AI工具对商业用途的授权不同,使用前需仔细阅读2人工创作比例:加入足够的人工创意元素,提升版权保护可能性3明确标注:按国家规定,AI生成内容需标注(尤其是新闻/广告类)4模型训练禁忌:不要用AI生成内容去训练其他AI模型(多数平台禁止)5隐私保护:不要将他人肖像、隐私信息输入AI生成工具22模块小结多模态AI:超越单一媒体类型,文字图像音频视频统一处理AI图片/海报:即梦AI文生图,10分钟出专业设计AI短视频:文字脚本→AI视频→剪映AI剪辑,全流程AI辅助AI音乐:Suno一键生成原创BGM,ElevenLabs专业配音多模态协同:每种工具各司其职,协同打造完整内容包版权意识:商业使用前检查平台授权,重要内容标注AI生成23本模块学习要点回顾1✓多模态AI:同时处理文字
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 绿化项目:协力成就-共享成果共创未来
- 航天梦想家-投资航天创美好
- 2026年四川省南充市中考英语试卷附答案
- 2026应聘骨科面试题目及答案
- 2026英语画廊面试题及答案
- 2026年四川省简阳市高二化学下册期末考试模拟检测卷及参考答案(突破训练)
- 2026年江苏省张家港市高二化学下册期末考试模拟试卷及答案(有一套)
- 2026园林类国企面试题及答案
- 2026运营面试题试卷及答案
- 2026年湖北省恩施市高二化学下册期末考试模拟测试卷带答案(模拟题)
- 陋室铭经典中考试题及标准答案
- 江苏师范大学成人继续教育网络课程《英语》单元测试及参考答案
- 河北省石家庄市新华区2022-2023学年六年级下学期期末数学试卷
- 中医四诊在临床护理中的应用
- 北京科技大学经济与管理考试及答案B
- 小学语文人教五年级下册第一单元四时田园杂兴 市一等奖
- 《陈涉世家》比较阅读27篇(历年中考语文文言文阅读试题汇编)(含答案与翻译)(截至2021年)
- GB/T 6405-2017超硬磨料立方氮化硼品种
- GB/T 31125-2014胶粘带初粘性试验方法环形法
- GA 423-2015警用防弹盾牌
- 修机三级验收实施方案
评论
0/150
提交评论