AIGC行业专题报告：2023年有望成为AIGC的拐点

上传人：策*** IP属地：山西上传时间：2023-01-30 格式：DOCX 页数：35 大小：1.75MB 积分：19.9 举报 版权申诉

已阅读5页，还剩30页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1|请务必仔细阅读报告尾部的重要声明核心结论行业专题报告核心结论行业专题报告|计算机AIGC报告证券研究报告超配GAN/CLIP/Diffusion是AIGC(AI-GeneratedContent)发展的三大模型。目前AIGC生成正在完成从简单的降本增效(以生成金融/体育新闻为代表)向创造额外价值(以提供绘画创作素材为代表)转移，跨模态/多模态内容成为关键AIGC应用场景广泛。1)文本生成：文本交互成为未来发展方向；2)音频生成：AI编曲将成为AI音频生成中的快速成长赛道；3)图像生成：目前仍然难以达到稳定可靠的生成高质量图像；4)视频生成：跨模态生成领域的中高潜力场景；5)图像、视频、文本间的跨模态生成：文本到视频转换目前还处于技术尝试阶段；6)策略生成：国内相关游戏厂商普遍存在内部开发或外部测试需求；7)虚拟人生成：视频是短期的发展重点。中国AIGC产业仍处于发展初期，底层技术相较国外仍有较大差距。国内最先兴起的是AI写作和语音合成模块，虚拟人概念刚兴起，但技术层面还存在差距，众多国内厂商从内容布局入手，同时众多厂商目前商业模式不成熟，还停留在免向2B+2C方向发展，B端降本增效是根本诉求，C端的付费逻辑在于高效获取信息，替代表达以及扩大用户创造力。2023年有望成为AIGC发展大年。近期微软、谷歌等全球计软件互联网大厂大力投入AIGC，并开始探索应用层面的突破，AIGC已经来到2年前自动驾驶的应用突破拐点，2023年有望成为AIGC大年。类似ChatGPT的“大模型”作为AIGC的底层平台，将成为AIGC的核心资源。拓尔思、金山办公、科大讯飞、商汤科技等；2、掌握独特场景，拥有AIGC应用场景的上市公司：汉仪科技、万兴科技、新国都、海天瑞声。风险提示：政策监管出现变化；技术更新不及预期。超配超配一年行业走势 3002022-062022-10现邢开允S080051907000113072123839xingkaiyun@S080052209000219534078860zhaoyuyang@究慧教育专题2022-10-22—高校智慧教育专题2022-10-172|请务必仔细阅读报告尾部的重要声明 AIAI生成中的快速成长赛道 92.3图像生成：目前仍然难以达到稳定可靠的生成高质量图像 112.4视频生成：跨模态生成领域的中高潜力场景 122.5图像、视频、文本间的跨模态生成：文本到视频转换目前还处于技术尝试阶段 132.6策略生成：国内相关游戏厂商普遍存在内部开发或外部测试需求 142.7虚拟人生成：视频是短期的发展重点 15三、中国AIGC产业仍处于发展初期，2023年有望成为AIGC发展大年 16 EditGAN支持图像进行细节修改 11图13：DeepFaceDrawing草图变完整图像效果 12 3|请务必仔细阅读报告尾部的重要声明 4|请务必仔细阅读报告尾部的重要声明一、GAN/CLIP/Diffusion是AIGC发展的三大模型content)、用户生产内容(UGC，User-generatedcontent)之后的新型内容创作方式，可以在创意、表现力、迭代、传播、个性化等方面，充分发挥技术优势。事件萌芽阶段(20世纪50年代至90年代中期))(21世纪10年代中期至今)具有“智能”的试验方法；重奏《依利亚克组曲AIGC(llliacSuite)》完成；器人“Eliza”问世一部完全由人工智能创作的小说《1Thed年，微软展示全自动同声传译系统，可将英文演讲者的2018年英伟达发布StyleGAN模型可以自动生成高质量图片代，人工智能生成内容百花齐，效果逐渐逼真直至人类难以分辨内容。值(以提供绘画创作素材为代表)转移，跨模态/多模态内容成为关键的发展节点。表表2：AIGC技术应用场景场景内容本结构化写作(新闻播报等，又比较强的规律)非结构化写作(剧情续写、营销文本等，需要一定创意和个性化)辅助性写作(推荐相关内容、帮助润色，部署于严格AIGC)闲聊机器人(虚拟男/女友、心理咨询等)文本交互游戏等(AIdungeon等)文本生成特定语言(生成虚拟人歌声/播报等)中常包含自动作词)图像编辑工具(去除水印、提高分辨率、特定滤镜等)图像自动生成创意图像生成(随机或按照特定属性生成画作等)5|请务必仔细阅读报告尾部的重要声明功能性图像生成(根据指定要求生成营销类海报、模特图、logo等)频生成视频属性编辑(删频生成视频自动剪辑(对特定片段进行检测及合成)视频部分编辑(视频换脸等)文字生成图像(根据文字prompt生成创意图像)文字生成演示视频(拼接图片素材生成视频)文字生成创意视频(完全从头生成特定主题视频)图像/视频到文本(视觉问答系统、自动配字幕/标题等)AIBot资产生成拟人视频生成拟人生成拟人实时交互的基础框架，GAN包含有两个模型，一个是生成模型(generativemodel)，一个是判别模型(discriminativemodel)。生成模型的任务是生成看起来自然真实的、和原始数据相似的实例。判别模型的任务是判断给定的实例看起来是自然真实的还是人为伪造的(真实实型)。资料来源：AI遇见机器学习、西部证券研发中心GAN模型难以创作AIGC三大模型6|请务必仔细阅读报告尾部的重要声明123之后得到结果。2、使用已经标注好的“文字-图像”训练数据。一方面对文字进行模型训练。另一方面对图像进行另一个模型的训练，过程以恢复原始图像。过训练，该模型可以应用这些去噪方法，从随机输入中合成新的“干净”数据。CLIP训资料来源：HIGH-FLYER、西部证券研发中心Diffusion模型有两个特点：1)给图像增加高斯噪声，通过破坏训练数据来学习，然后找7|请务必仔细阅读报告尾部的重要声明资料来源：计算机视觉论文速递、西部证券研发中心资料来源：计算机视觉论文速递、西部证券研发中心上的新闻将由机器人完成。8|请务必仔细阅读报告尾部的重要声明资料来源：澜舟科技官网、西部证券研发中心自作型文本还需要特别关注情感和语言表达艺术。资料来源：彩云小梦官网、西部证券研发中心泛的场景。主要为基于素材爬取的协助作用，例如定向采集信息素材、文本素材预处理、9|请务必仔细阅读报告尾部的重要声明资料来源：写作猫官网、西部证券研发中心C错的消费者反馈。资料来源：小冰岛APP、西部证券研发中心AI场景为文字内容的有声化提供了规模化能力。10|请务必仔细阅读报告尾部的重要声明资料来源：倒映有声官网、西部证券研发中心资料来源：加音官网、西部证券研发中心AIGC作词(NLP中的文本创作/续11|请务必仔细阅读报告尾部的重要声明资料来源：有灵智能官网、西部证券研发中心修改颜色纹理(如DeepAI)、复刻/修改图像风格(DALL·E2已经可以仅凭借单张图像马进行更改)、修改面部特征(Metaphysics，可调节自身照片的情绪、年龄、微笑等；以资料来源：量子位智库、西部证券研发中心图像端到端生成：此处则主要指基于草图生成完整图像(VansPortrait、谷歌ChimeraDeepFaceDrawing)、有机组合多张图像生成新图像(Artbreeder)、根据指定属性生成目标图像(如Rosebud.ai支持生成虚拟的模特面部)等。12|请务必仔细阅读报告尾部的重要声明资料来源：人工智能、西部证券研发中心资料来源：剪映APP、西部证券研发中心、13|请务必仔细阅读报告尾部的重要声明视频部分生成(以Deepfake为典型代表)：视频到视频生成技术的本质是基于目标图像脸再现(人物表情或面部特征的改变)、人脸合成(构建全新人物)甚至全身合成、虚拟环境合成等功能。资料来源：deepfake、西部证券研发中心视频、文本间的跨模态生成：文本到视频转换目前还处于技术尝试OpenAICLIPDALLEAI的一年。同年，CVPR2021收录的VQGAN也引发了广泛关注。2022年被称为“AI绘画“之年，多款模型/软件证明了基于文字提示得到效果良好的图画的可行性，DiffusionModel受到广泛关资料来源：计算机视觉论文速递、西部证券研发中心14|请务必仔细阅读报告尾部的重要声明成的技术是指基于文字(涉及NLP语义理解)搜索合适的配图、音乐等素材，在已有模素材库的体量、已有模版数量等成为关键因素。完全从头生成视频则是指由AI模型基于资料来源：百度智能视频合成平台官网、西部证券研发中心，这一技术还将有制作的全流程中均有应用。资料来源：量子位智库、西部证券研发中心NPC对应的语言、动作、操作逻辑限。15|请务必仔细阅读报告尾部的重要声明独立于玩家操控变动)、RedDeadRedemption2、MonsterHunter:World等大型游戏2.7虚拟人生成：视频是短期的发展重点算驱动”型的虚拟人，综合运用文本、图像、音频等生成技术，打造合应用在虚拟偶像、虚拟主播等领域已有广泛应用。D资料来源：倒映有声官网、西部证券研发中心教育、数字员工等，并以此赋能各行各业。16|请务必仔细阅读报告尾部的重要声明资料来源：小冰官网、西部证券研发中心三、中国AIGC产业仍处于发展初期，2023年有望成为AIGC发展大年引流阶段。此外，AIGCC个人的赋能也是值得关注的方向。资料来源：量子位智库、西部证券研发中心T聊天机器人。17|请务必仔细阅读报告尾部的重要声明支持的聊天式自然语言处理系统，主要用于机器学习项目。它是由Google合作伙伴OpenAI发布的预训练模型，可以帮助开发者快速建立新的聊天机器人应用程序。它的核hatGPT成文本、回答问题以及推理。它具有很好的可扩展性，可以用于各种自然语言处理应用。资料来源：ChatGPT小程序、西部证券研发中心2020年，谷歌就推出了一个26亿参数的端到端神经网络对话模型Meena。但仅仅只DeepMind在2022年9月提出的Sparrow模型，采取了一种基于人类反馈的强化学习(RL)框架。Sparrow模型在最初的设计时就是为了和用户闲聊，并且可以在回答问作词、作曲，全部由AI一手操纵；百度AI数字人度晓晓，挑战写高考作文，40秒写了40篇，得分可以排在总考生前25%。四、建议关注18|请务必仔细阅读报告尾部的重要声明报、创作智能辅助等方面亦有成熟应用场景。AIWPS的智能校对功能月校对字数超过70亿，智能生成的内容占据云端整体内容资源的33.6%，智能美化功能月度活跃用户数量也已人交互平台在媒体、金融、教育、文旅等领域赋能内容生产

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

AIGC行业专题报告：2023年有望成为AIGC的拐点

文档简介

温馨提示

最新文档

评论

AIGC行业专题报告：2023年有望成为AIGC的拐点

文档简介

温馨提示

最新文档

评论

相关文档