05模块五-AIGC应用基础技术_第1页
05模块五-AIGC应用基础技术_第2页
05模块五-AIGC应用基础技术_第3页
05模块五-AIGC应用基础技术_第4页
05模块五-AIGC应用基础技术_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

模块五AIGC应用基础技术人工智能AIGC通识教程高职通识课程学习目标知识目标能力目标素养目标·掌握AIGC文本生成的基本原理与应用领域了解AIGC图像生成的核心算法与创意应用熟悉AIGC视频、音乐生成技术的发展与应用熟悉AIGC视频、音乐生成技术的发展与应用掌握AIGC程序代码生成的技术与实践了解Al知识库的概念、架构与应用能够使用主流AIGC文本工具进行内容创作具备AI图像生成提示词设计与优化能力能够运用AIGC工具制作简单视频和音乐·培养创意表达与审美能力树立版权意识,尊重知识产权培养跨学科融合创新思维具备使用AI辅助编程的基本本能力能够搭建和应用简单的AI知识库增强技术伦理与责任感激发探索AIGC前沿技术的热情单元一AIGC文本生成技术文本生成是AIGC最成熟、应用最广泛的领域。从ChatGPT到豆包,从文案撰写到代码生成,大语言模型正在重塑我们的文字创作方式。理解文本生成技术,是掌握AIGC的第一步。内容创作智能对话知识问答让AI成为你的写作助手与创意伙伴文本生成技术的基本原理关建架构LLM输入文本编码处理·Transformer架构:2017年提出,成为LLM的基础·自注意力机制:理解上下文关联,捕捉语义关系·预训练+微调:大规模语料预训练,特定场景微调概率解码:基于统计概率逐词生成文本注意力机制概率预测输出生成数据收集数据清洗模型预训练指令微调人类反馈强化学习(RLHF)部署上线大语言模型通过学习海量文本,掌握语言规律,从而生成通顺、有逻辑的文本内容文本生成技术的应用领域教育培训内容创作智能客服·文章、小说、诗歌撰写营销文案、广告标语社交媒体内容生成剧本、脚本创作·7x24小时自动回复·多轮对话理解用户意图·个性化推荐与解答·降低人工客服成本·个性化学习辅导·作业批改与讲解·语言学习对话练习知识问答与梳理办公效率创意设计代码开发·代码生成与补全Bug定位与修复建议·代码注释与文档生成多种编程语言支持·品牌故事与Slogan产品描述与卖点提炼创意灵感激发多语言内容本地化邮件撰写与回复会议纪要整理数据报告生成文档翻译与润色文本生成的挑战与发展趋势当前挑战发展趋势·幻觉问题:Al可能生成虚假信息·事实准确性:难以保证100%正确·时效性:训练数据有截止日期·版权争议:训练数据的版权归属·偏见问题:可能存在算法偏见·安全风险:可能被用于生成有害内容·多模态融合:文本+图像+音视频统一生成推理能力增强:从生成到思考与解决问题领域专业化:垂直领域模型精度更高实时交互:响应速度更快,对话更流畅·个性化定制:根据用户偏好生成内容·安全可控:内容审核与伦理规范完善挑战与机遇并存AI超级个体训练运用豆包AI生成短视频脚本训练要点训练任务明确视频时长和节奏描述清楚产品/主题特点指明目标受众和风格结构化输出:分镜、台词、画面描述可要求AI生成多个版本选择迭代优化:不满意就提出修改意见请帮我写一个15秒的产品介绍短视频脚本。产品:智能保温杯特点:24小时保温、智能测温、提醒喝水目标人群:上班族风格:轻松有趣、贴近生活要求:1.包含镜头描述和台词2.分镜清晰,节奏明快3.突出产品核心卖点4.结尾有号召力说明输出效果单元二AIGC图像生成技术从文字描述到精美图像,只需要几秒钟。Al图像生成技术正在颠覆设计行业,让每个人都能成为视觉创作者。Midjourney、StableDiffusion、文心一格工具越来越多,创意无限可能。图生图局部重绘文生图想象力有多大,画面就有多精彩。图像生成的核心算法扩散模型(DiffusionModel)GAN生成对抗网络Transformer架构代表:StableDiffusion、DALL·E3原理:从随机噪声逐步去噪生成图像优势:生成质量高、细节丰富代表:早期StyleGAN系列原理:生成器与判别器博弈训练优势:生成速度快,人脸生成逼真特点:训练难度大,模式崩溃问题代表:DALL·E2、Parti原理:将图像转化为token序列生成优势:文本理解能力强,语义对齐好特点:开源生态丰富,可本地部署特点:与大语言模型技术路线统一应用:艺术创作、设计、电商应用:人脸生成、图像增强应用:复杂场景生成、多模态技术演进方向:GAN→Diffusion→多模态大模型图像生成在创意设计中的应用商业设计插画艺术海报、Banner设计;Logo与品牌视觉;书籍封面与内插;游戏概念设定;角色与场景设计;艺术创作与实验产品包装设计;广告创意图电商摄影建筑与室内产品主图与详情页;模特图生成与替换;场景图合成;营销活动图建筑效果图生成;室内设计方案;景观规划预览;装修风格探索AIGC图像生成提示词提示词构成要素提示词模板与示例通用模板[主体]+[环境/背景]+[风格]+[光照]+[细节]+[质量]构图层:构图、视角、镜头技术层:分辨率、渲染引擎、光影风格层:艺术风格、画师、时代细节层:细节、材质、颜色只可爱的猫咪坐在窗台上,午后阳光透过窗帘洒进来,吉卜力工作室风格,温暖柔和的光线,细腻的毛发质感,8k分辨率,电影级构图英文提示词通常效果更好多尝试不同的关键词组合细节层:细节、视角、镜头基础层:主体描述(画什么)可以使用负向提示词排除不需要的元素参考优秀作品的提示词学习AI超级个体训练使用腾讯元宝生成HTML网页训练任务训练要点请帮我生成一个个人作品集网页,要求:1.包含导航栏、个人介绍、作品展示、联系方式四个部分2.2.现代简约风格,使用蓝色为主色调3.3.响应式设计,适配手机和电脑4.4.使用HTML+CSS+JavaScript实现55.代码结构清晰,有注释6.加入适当的动画效果明确网页的功能模块指定设计风格和配色方案说明技术栈要求可要求响应式和交互效果生成后可进一步迭代优化可以要求AI解释代码逻辑视频生成技术的基本原理语义理解时序一致性:前后帧画面要连贯·运动合理性:物体运动符合物理规律·时长限制:目前生成视频通常较短·计算量大:比图像生成需要更多算力文本描述语义理解首帧生成时序预测视频输出多帧生成视频输出231.扩散模型路线·基于图像扩散模型扩展·加入时间维度注意力代表:Sora、Pika、Runway2.生成式AI+视频编辑AI辅助视频剪辑·智能特效与转场·代表:剪映、CapCut3.数字人视频生成·文本驱动数字人说话·唇形同步与表情生成代表:HeyGen、D-ID视频生成是AIGC领域技术难度最高、发展最快的方向之一视频生成技术的创新应用营销短视频生成影视前期创意快速生成概念预告片产品展示视频一键生成多版本快速迭代测试场语言多形象选择场景与角色视觉化分镜脚本动态预览降低前期试错成本社交内容创作个人短视频特效表情包和趣味视频生活记录AI增强降低创作门槛降低视频制作成本提高内容产出效率数字人主播/讲师教育培训24小时不间断直播文本驱动口播视频应用于教育、电商、客服知识讲解动画生成虚拟教师授课视频实验过程模拟演示个性化学习视频AIGC视频生成提示词视频提示词要点示例提示词一位年轻女性在咖啡馆里用笔记本电脑工作,窗外下着小雨,玻璃上有雨滴滑落,温暖的室内灯光,电影感画面,镜头缓慢推近,从全景慢推近,从全景到特写,4K分辨率,24fps,浅景深,色调温暖治愈,韩剧风格场景描述:画面中的主体、环境、背景运镜方式:推、拉、摇、移、跟、升降镜头角度:平视、仰视、俯视、特写画面风格:电影感、日系、赛博朋克、水墨画光线效果:自然光、霓虹灯、晨光、黄昏运动描述:物体如何运动、镜头如何移动时长和帧率:几秒、多少fps描述越具体,效果越可控注意运动描述要自然合理可以参考电影风格描述多尝试不同工具的特点AI超级个体训练体验即梦AI文生视频训练任务训练要点1.选择一个你想生成的视频主题2.撰写详细的视频描述提示词3.选择合适的风格和比例4.生成并观察效果5.调整提示词后再次生成,对比差异春日樱花盛开的公园小道,阳光透过花瓣洒下斑驳光影,微风轻拂,花瓣缓缓飘落,一个女孩的背影沿着小路慢慢走,治愈系动漫风格,柔和的色彩慢向前推进,4K画质·从简单场景开始练习·注意描述物体的运动方式·尝试不同的艺术风格·学习镜头语言(推、拉、摇、移)·观察哪些描述AI实现得好,哪些不好·积累有效的提示词模板镜头缓文生视频技术发展很快,持续关注新工具和新能力单元四AIGC音乐生成技术音乐是人类情感的语言,如今AI也能创作动听的旋律。从背景音乐到原创歌曲,AI音乐生成正在democraize音乐创作,让不懂乐理的人也能创作属于自己的音乐。歌曲演唱·音效生成纯音乐·风格转换用AI谱写你的创意旋律AIGC音乐生成技术概述技术原理基于规则的生成:按乐理规则算法生成基于机器学习:从大量音乐中学习模式MIDI生成:先生成音符序列基于深度学习:音频合成:将音符转为实际声音扩散模型等Transformer、歌声合成:生成人声演唱多模态生成:文本描述生成音乐风格迁移:将音乐转为不同风格流流工具1.Suno-高质量歌曲生成,支持歌词2.Udio音乐风格多样,生成质量高3.豆包/文心一言-国内AI音乐生成能力4.AIVA-专注于影视配乐生成AI音乐生成发展迅速,质量正在快速接近人类创作水平音乐生成的创作实践践与评估质量评估维度1.明确需求用途:视频配乐/游戏BGM/歌曲风格:流行/古典/电子/民族情绪:欢快/悲伤/激昂/治愈旋律流畅度:是否悦耳动听节奏稳定性:节拍是否稳定风格一致性:是否符合描述风格情感表达:是否传达了预期情绪音质效果:音频质量是否清晰创新性:是否有独特的创意时长:多少秒/分钟2.撰写描述用文字描述想要的音乐指定乐器和节奏参考风格和艺术家描述情绪和场景3.生成与筛选对比选择最合适的导出合适的格式多生成几个版本调整参数再生成4.后期处理剪辑拼接音量调整混音效果格式转换创作实践流程音乐生成技术的发展前景趋势一个性化定制多模态融合专业级质量根据个人偏好生成专属音乐实时互动式音乐创作音乐风格融合创新视频+音乐联动生成根据画面自动配乐音乐可视化同步接近专业制作人水平支持完整歌曲创作专业音乐制作工具集成场景一内容创作场景二教育培训医疗健康短视频/直播BGM播客/有声书配乐游戏音效与音乐个人音乐创作音乐教育辅助工具个性化练琴伴奏音乐理论可视化作曲教学辅助音乐治疗辅助睡眠助眠音乐情绪调节音乐康复训练配乐AI超级个体训练体验海绵音乐智能生成歌曲训练任务训练要点1.确定歌曲主题和风格2.选择:输入歌词or描述风格3.设置参数:3.速度、调式、歌手音色4.生成歌曲并试听5.调整后重新生成6.导出满意的作品·先从简单的纯音乐开始尝试·歌词创作注意押韵和节奏·可以提供参考歌曲风格·可以提供参考歌曲风格·尝试不同的歌手音色了解基本的音乐术语(BPM、调式等)·注意版权问题,了解使用授权创作一首关于青春校园的民谣歌曲,风格清新治愈,木吉他伴奏,男声演唱,男声演唱,节奏舒缓,歌词要描写校园生活的美好回忆AI音乐是创作助手,最终的艺术判断和选择还需要人的参与单元五AIGC程序代码生成技术写代码不再只是程序员的专利,AI代码生成让编程门槛大大降低。从简单的功能函数到完整的应用程序,AI正在改变软件开发的方式,让创意更快地转化为现实。Bug修复代码生成代码补全人人都可以是开发者的时代正在到来代码生成技术的核心与应用核心技术应用领域大语言模型+代码预训练在海量代码上进行专门训练理解编程语法和逻辑模式代表:CodeLlama、StarCoder1.日常开发3.快速原型代码自动补全重复代码生成单元测试编写代码注释与文档快速搭建MVP技术特点2.学习编程3.快速原型多语言支持:Python、Java、JS等上下文理解:理解项目整体结构推理能力:能解决复杂算法问题解释能力:可以解释代码逻辑代码示例与解释编程问题解答算法思路讲解最佳实践建议快速搭建MVP前端页面生成API接口开发小工具快速开发主流工具4.代码优化重构建议性能优化安全漏洞检测代码规范检查GitHubCopilotQwen-Coder-阿里代码模型豆包/文心一言-通用代码生成Cursor-Al代码编辑器-代码补全AiAI超级个体训练使用Qwen-Coder生成程序代码训练任务高效使用AI编程的技巧编写一个待办事项(Todo)网页应用请用HTML、CSS和JavaScript编写一个待办事项网页应用,要求:1.可以添加、删除、标记完成待办事项22.可以添加、删除3.数据保存在浏览器localStorage中3.界面美观,采用现代设计风格4.4.支持筛选:全部/进行中/已完成55.有动画过渡效果6.6.代码结构清晰,有详细注释明确需求:说清楚要做什么,有什么功能拆分任务:大任务拆成小步骤逐步实现提供上下文:相关的代码和项目结构指定技术栈:明确使用的语言和框架要求解释:让AI解释代码,学习原理要求解释:让AI解释代码,学习原理迭代优化:先跑通,再优化,逐步完善注意验证:AI生成的代码要测试验证AI是编程助手,不是替代品。理解代码原理才能真正掌握编程能力单元六AI知识库及应用技术大模型知识广博但有时效性限制,而且可能不知道你的专属信息。AI知识库技术让大模型拥有专属的记忆和领域知识,打造属于你自己的AI专家。实时更新精准回答专属知识让AI拥有你的专属知识,成为你的领域专家。AI知识库的概念与技术架构AI知识库(AIKnowledgeBase)知识专属:可以注入企业或个人的专有知识实时更新:可以随时添加最新的信息精准可靠:基于真实文档回答,减少幻觉隐私可控:敏感数据不需要送入模型训练是将特定领域或个人的文档、数据等知识,通过向量检索等技术与大语言模型结合,让AI能够基于这些知识进行精准回答的系统文档上传文本分块向量化向量数据库检索相关文档注入PromptRAG架构LLM生成回答向量嵌入(Embedding):·向量数据库:相似度检索:找到最相关的知识片段知识片段RAG技术:检索增强生成,结合检索与生成将文本转为数学向量高效存储和检索向量数据AI知识库的核心应用技术文档处理技术向量检索技术支持多种格式:PDF、Word、PPT、Excel文本向量化(Embedding)向量相似度计算检索结果排序与过滤多轮对话上下文理解OCR识别图片中的文字表格内容理解与提取混合检索(关键词+向量)文本提取与清洗文档结构化处理答案生成技术知识库管理·基于检索结果生成回答引用来源标注回答质量评估不知道就说不知道文档分类与标签版本管理与更新使用数据统计多文档信息整合用户反馈收集知识库效果评估AI知识库的应用案例企业客服与帮助中心教育学习助手法律企业内部知识管理个人知识管理与疗咨询卡片基于产品文档回答用户问题教材与课程知识库智能答疑与辅导个性化学习路径知识图谱构建员工培训与知识问答法条与案例检索个人笔记与文档管理7x24小时智能客服降低人工客服成本提高客户满意度制度流程查询项目经验沉淀与分享新人快速上手医学文献与指南查询专业领域问答辅助决策支持阅读笔记智能整理个人AI学习助理知识体系构建知识库+大模型=各领域的AI专家Theistheresentatblngaduntingtooghenalarenored

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论