从 Sora 看 AI 视频的昨天、今天和明天

上传人：策*** IP属地：山西上传时间：2025-11-07 格式：DOCX 页数：74 大小：6.47MB 积分：19.9 举报 版权申诉

已阅读5页，还剩69页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

传媒行业深度报告TMT及中小盘/传媒2025年9月，OpenAI发布文生视频模型Sora2，与前一代相比实现多层面技术突破，更与社交互动功能深度融合，加快了C端AI应用商业化的速度。与此同时，“AI漫剧”在内的一系列创新内容形态正在迎来供需爆发，催生新的行业受益机会。站在行业二次革命的时点，本篇报告以Sora两代产品为切入点，回顾了AI视频应用发展过程，经历了上一阶段的模型迭代，国内外产品性能均有明显提升，展望下一阶段的AI视频，我们认为其对影视、游戏、IP等行业的赋能作用将进一步凸显，产品形态与各类商业变现路径将更为清晰。oSora2引发行业二次革命，技术更迭推动内容产品形态创新。2025年9月，OpenAI发布文生视频模型Sora2，与前一代相比，Sora2实现了三个层面的技术突破：1）物理世界的拟真突破；2）多模态融合支持同步生成音频；3）初步具备导演的叙事逻辑与剪辑师的镜头调度能力，接近真实拍摄。除此之外，Sora2更具颠覆性的突破在于同时发布的SoraAPP，各类功能支持用户对热门视频进行二次创作并发布，也支持生成虚拟形象植入生成作品中，让AI视频的创作过程融入了社交属性，实现快速传播。与此同时，国内平台上“AI漫剧”这一创新内容形态火爆出圈进入大众视野，作为AI技术与动漫短剧深度融合的产物，“AI漫剧”以漫画、小说等原作品IP为基础，通过AI技术实现全流程制作，保留原作品剧情及艺术风格，又融合短视频的“短平快”特点，相比真人短剧更具漫画风格和多元化特色，有望成为新一阶段占据年轻用户群体互联网时长份额的“黑马”，催生产业链一系列受益机会。o多领域融合趋势凸显，商业化应用有望落地加速。对于下一阶段AI视频应用的发展趋势，我们认为有以下三个方向：1）AI视频与社交互动深度融合，消费级应用落地加速。经历了文生视频模型的演变迭代，下一阶段的文生视频工具将不再局限于专业工具，而是进一步产品化，与社交互动结合，加速C端应用商业化；2）ChatGPT向生态系统演进，AI视频集成平台化程度提升。随着OpenAI宣布ChatGPT向第三方应用全面开放，ChatGPT也将从单纯的对话工具逐渐演变成为覆盖多样化领域的全能生态系统，在此过程中，各类文生视频工具有望接入以ChatGPT为代表的生态系统，实现集成化、平台化以及更大范围的用户触达，实现从简单工具向“生成-分发-变现”全链路平台的转化；3）AI视频与AIAgent深度结合，一站式解决视频创作需求。针对单应用可能无法同时支持脚本生成、文生图、图生视频、剪辑配音等所有流程、用户学习成本较高等问题，文生视频与AIAgent的结合则有望重构视频生产范式，实现一站式解决视频创作需求。o投资机会：1）影视：文生视频颠覆传统影视内容生产，激活行业新动力。基于目前Sora等AIGC工具的技术，AI已经可以承担漫剧、短剧等影视作品大部分制作流程，催生各类创新内容形态供给，为产业链带来新的机会；2）游戏：文生视频赋能游戏制作及玩法创新，商业化空间有望提升。AI视频技术革新了内容创作流程，降低了游戏制作的门槛，有望推动更多创新项目落地，在玩法迭代、用户体验优化等方面同样具备深刻意义；3）IP：文生视频加速IP可视化，有望重塑行业价值。视频大模型具备高效的动画生成能力，将IP改编的制作周期大幅缩短，同时打破了IP内容只能由官方生产的传统模式，(%)——传媒——沪深3004030200-10Oct/24Feb/25Jun/25Sep/251、《互联网行业周报—王者荣耀国表现》2025-10-282、《传媒互联网行业周报—游戏和xushuai2@cmschina.co敬请阅读末页的重要说明2行业深度报告让粉丝能够成为内容的共同创作者，拓宽创意边界，对IP衍生品开发、IP运营均有极强赋能。o相关标的：【腾讯控股】（混元图像大模型能力突破，AI赋能四大核心业务）、【快手】（可灵AI迭代至2.5Turbo版本表现优秀）、【哔哩哔哩】（AniSoraV3等开源视频生成模型赋能动漫等多场景）、【美图公司】（自研视觉大模型+多款AI生产力产品，上线AIAGENTRoboNeo）、【昆仑万维】（AI+大模型、搜索、游戏、音乐、社交、短剧等多领域布局）、【阅文集团】（海赋能主业，启动“AIGC微短剧创作者生态计划”）、【华策影视】（与阶跃星辰合作聚焦文生视频、AI智能体等）、【欢瑞世纪】（聚焦短剧、互动影游、AI短剧与AI漫剧）、【上海电影】（聚焦IP+AIGC新业态，推出“iPAi星球计划”）、【光线传媒】（动画IP储备丰富，AI+动画加速商业化）、【中文在线】（优质IP+AI+短剧，海外ReelShort平台降本提效）、【网易】（AI赋能游戏NPC自然语言指令理解、UGC创作工具等）、【巨人网络】（布局太空杀AI玩法，《原始征途》全面接入DeepSeek-R1）、【恺英网络】（投资企业自然选择旗下AI陪伴应用《EVE》已内测）等。o风险提示：AI技术发展不及预期、商业化存在不确定性、政策监管风险。敬请阅读末页的重要说明3行业深度报告一、Sora2发布，AI视频行业再迎突破 71、Sora2开启行业二次革命，国内外多模态能力逐步提升 72、技术更迭催生“AI漫剧”等创新产品形态，应用场景不断扩张 8二、AI视频的昨天：从技术迭代突破到社交应用融合 1、早期发展阶段：扩散模型为主，开启多应用场景落地探索 2、突破阶段：Sora引领DiT模型，向专业级生产工具迭代 3、应用落地阶段：从专业工具到社交应用，AI内容渗透率加速提升三、AI视频的今天：国内外代表产品介绍 1、海外产品：技术实力强劲，聚焦前沿开源生态丰富 2、国内产品：场景化能力优秀，本土适配及效率表现突出四、AI视频的明天：多领域融合趋势凸显，商业化应用有望落地加速 201、AI视频与社交互动深度融合，消费级应用落地有望加速 202、ChatGPT向生态系统演进，AI视频集成平台化程度有望提升 203、AI视频与AIAgent深度结合趋势凸显，一站式解决视频创作需求 21五、受益机会及相关标的：文生视频赋能行业革新，开启内容创作新纪元 231、影视：文生视频颠覆传统影视内容生产，激活行业新动力 232、游戏：文生视频赋能游戏制作及玩法创新，商业化空间有望提升 253、IP：文生视频加速IP可视化，有望重塑行业价值 284、相关标的 30 30（2）快手 31（3）哔哩哔哩 32（4）美图公司 32（5）昆仑万维 33（6）阅文集团 34（7）芒果超媒 34（8）华策影视 35（9）欢瑞世纪 36（10）上海电影 36（11）光线传媒 37敬请阅读末页的重要说明4行业深度报告（12）中文在线 37（13）网易 38（14）巨人网络 38（15）恺英网络 39六、风险提示 40 8图2：即梦AI&抖音“AIGC短剧联合招募计划” 9图3：腾讯动漫AI漫剧《传武》画面 9图4：芒果TV发布AIGC微短剧创作者生态计划图5：VideoFactory交换式时空交叉注意力机制：时空独立到时空联合图6：根据左侧图，Gemini在右侧生成：展示动物猜国家的小游戏并验证对错11图7：发布后主要开闭源模型对比图8：Sora去噪过程图9：GPT-4o作为实时裁判与用户进行石头剪刀布的小游戏图10：Sora2生成：体操运动员在桨板上后空翻图12：Sora应用客串”功能图14：SoraApp上AI生成的视频 16 图18：可灵主要版本迭代一览图20：Vidu生成视频画面示例图21：美图AI生视频功能上线WHEE 19图22：美图AI生视频功能页面图24：SoraiOS应用商店下载量 20敬请阅读末页的重要说明5行业深度报告图25：快手可灵AI方案框架 21 21图27：美图公司旗下AIAGENTRoboneo 22图28：星界新智（StarSphere）平台交易市场界面 22图29：2015-2024年中国电影票房规模 23图30：AI漫剧《传武》《我的治愈系游戏》 24图31：《独行月球》太空场景 24图32：《一品布衣》截图 25图33：Youtube鼓励Shorts视频创作 25图34：全球游戏市场回暖但增速趋缓 26图35：中国游戏市场收入连续2年超3000亿 26 26图37：AI技术在游戏行业中的应用 27图38：ChatAvatar通过文本对话生成3D角色资产 27图39：Unity《2025年Unity游戏报告》调查结果 27图40：蛋仔派对UGC地图创作 28图41：《哪吒之魔童闹海》“裂空爪”特效 29图42：AIGC动漫西游改编大赛 29图43：2022-2027年中国谷子经济市场规模及预测 30图44：NanoBanana生成3D手办模型 30 30图46：MidJourney、Gen2二创《流浪地球3》预告片 30图47：腾讯混元大模型 31图48：2025GDC腾讯游戏Ai品牌GiiNEX展台 31图49：可灵1.6pro登ArtificialAnalysis图生视频榜首 32图50：《新世界加载中》首映礼 32图51：哔哩哔哩自研「AI原声翻译功能」 32图52：美图公司发展历程 33图53：昆仑万维旗下“Skyreels”AI短剧平台 33图54：阅文集团代表作品 34图55：芒果AIGC微短剧创作者生态计划 35图56：C-dramaRights平台 35敬请阅读末页的重要说明6行业深度报告图57：《十州三境》剧集画面 36图58：即梦AI×上海电影“AI动画创作周” 36图59：上海电影“iPAi星球计划” 36图60：光线传媒旗下优质动画电影 37图61：中文在线首部AI3D动漫《仙尊归来：只手镇人间》登顶抖音动态漫热榜38图62：《逆水寒》AI表情包 38图63：《太空杀》AI原生玩法 39图64：《SOON》游戏开发进入“小时级”时代 39图65：EVE3DAI伴侣实现“电影级”虚拟陪伴 39表1：主要厂商多模态模型核心突破表2：昆仑万维一周连续发布六款大模型 34表3：产业链相关公司 40敬请阅读末页的重要说明7行业深度报告“AI漫剧”创新形态火爆出圈，Sora2升级发布实现显著突破。2025年9月，腾讯动漫上线AI漫剧作品《传武》《我的治愈系游戏》，改编自阅文集团旗下同名漫画及小说，全程由仅有7人的核心团队采用即梦AI制作，20多集仅耗时一个月，上线4天播放破千万，引发行业关注。随着技术迭代，AI内容在各视频平台渗透率持续上升，AI漫剧、AI短剧在内的创新内容形态出现在大众视野，行业供需同步爆发，为内容方、平台方及IP方都带来了新的产业受益机会。与此同时，2025年9月30日，OpenAI发布Sora重大升级版本——Sora2，以及基于该模型的社交应用SoraApp，实现多层面技术突破，融合社交互动功能，七天获得62.7万iOS下载量。无论是内容形态创新还是应用升级，我们认为近期一系列变化均显示出AI视频行业正迎来新一轮变革，对传媒各细分行业的影响也将更为深远。站在行业二次革命的时点，我们在下文回顾了AI视频应用的“昨天”和“今天”，通过对以Sora为代表的一系列AI视频应用迭代、发展过程的研究分析，展望“明天”的AI视频应用，其发展趋势已初见端倪，在影视、游戏、IP等行业的赋能程度也将进一步加深。我们认为其演进方向有望围绕以下三个核心方向展开：1）与社交功能深度融合加速应用商业化；2）有望接入以ChatGPT为代表的生态系统，实现集成化、平台化，从简单工具向“生成-分发-变现”综合平台转化；3）与AIAgent深度结合，重构视频生产范式，实现一站式解决视频创作需求。一、Sora2发布，AI视频行业再迎突破技术突破叠加社交互动融合开启行业二次革命。2025年9月30日，OpenAI发布Sora重大升级版本——Sora2，以及基于该模型的社交应用SoraApp。与2024年2月的第一代产品相比，Sora2实现了三个层面的技术突破：1）物理世界的拟真突破，精准模拟水流、光影、重力与碰撞效果，处理浮力与重心转移等复杂物理场景，提升了人物动作的连贯性与主体稳定性；2）多模态融合，可直接生成同步音频，自动匹配环境声、动作音效与多语言对白；3）初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。除此之外，Sora2更具颠覆性的突破在于同时发布的社交应用SoraAPP，让AI视频不再局限于“生成工具”，而是更具互动属性和普适性的社交应用。应用内各类功能支持用户对热门视频进行二次创作并发布，也支持用户生成虚拟形象植入生成作品中，这类功能极大地增强了互动性和趣味性，更简单的操作也进一步降低了使用门槛，让用户共创和分享更为便捷，实现“社交裂变”传播。在此机制下，即使采取邀请制，SoraApp在上线首日仍迅速攀升至美国AppStore总榜第三名，达到5.6万次的安装量，上线三日登顶榜首，超越了ChatGPT和Gemini，七天获得62.7万iOS下载量，超越ChatGPT首发时的表现。敬请阅读末页的重要说明8行业深度报告AI浪潮下垂类应用百花齐放，国内外多模态能力逐步提升。从2022年11月，OpenAI推出聊天机器人ChatGPT，到2024年轰动行业的OpenAISora第一代发布，再到2025年9月的Sora2升级发布，回顾各领域垂类应用的发展过程，其本质都可归结为AI大背景下的多模态AIGC技术变革。多模态经历了最早的文生图(Text-to-ImageGeneration)、文生音乐(Text-to-MusicGeneration)到文生视频(Text-to-VideoGeneration)的更迭过程，随着技术在质量、时长等方面的成熟和突破，其在影视、游戏等细分领域内容创作过程中的应用渗透率持续提升，极大地提升了制作效率，加速了优质供给产出。互联网平台激励政策频出，AI渗透率迅速提升。随着国内外多模态能力加速升级，AI视频应用不再局限于专业工具，而是逐步深入C端用户群体，在互联网平台掀起新的创作风潮，在此过程中，字节、快手、腾讯等互联网平台正通过技术扶持、流量倾斜和分账方案等方式激励AI视频内容创作，提升长短视频平台AI内容渗透率。具体包括：1）字节跳动，先后推出“AIGC短剧招募计划”、“漫剧扶持政策”、“AI创作浪潮计划”等激励政策，从源头的番茄小说IP库、中期的资金和制作扶持，到终端的抖音、红果等多渠道分发和超高分成，提供从创作工具、课程培训到流量资源、行业机会的全链路支持；2）快手：借助可灵AI给予技术支持，以高分成激励提升平台内AI内容渗透率，推出“灵感·新纪元AIGC创投计划”，覆盖算力成本，投入亿级流量，提供最高90%分账，进一步激活创作者动力。3）腾讯：发力AI短剧等赛道，2025年10月创办腾讯视频AI创作大赛i短剧，通过高额奖金和签约机会鼓励将AI深度应用于短剧赛道，探索规模化精品内容生产模式。敬请阅读末页的重要说明9行业深度报告图2：即梦AI&抖音“AIGC短剧联合招募计划”技术迭代催生“AI漫剧”“AI短剧”等内容形态创新。目前国内代表性AI视频应用包括字节旗下即梦、快手旗下可灵、腾讯旗下混元等，随着内容制作方、平台方与AI内容的结合度进一步加深，AI内容在各视频平台渗透率持续上升，也催生了包括AI短剧、AI漫剧等创新内容形态，行业供需同步爆发，带来新的产其中《传武》改编自阅文集团旗下腾讯动漫同名漫画，《我的治愈系游戏》改编自阅文集团旗下起点读书同名小说，两部作品全程由即梦AI制作，核心团队仅有7人，20多集制作周期仅一个月，上线4天播放破千万，效果精良，收获了用户广泛好评；AI短剧方面，68集AI真人短剧《奶团太后宫心计》近期在抖音等平台累计播放突破2亿，“国内首部付费AI短剧”《兴安岭诡事》上线不到21小时播放量即破千万，抖音原生端收益超过30万，账号涨粉10万+。AI+漫剧、AI+短剧在内的新兴作品形态正逐步成为新的流量聚集地。行业深度报告“短平快”叠加低成本，AI视频应用革新漫剧创作范式。根据巨量引擎，2025年上半年，漫剧供给量以83%的复合增长率快速扩张，近半年累计上线漫剧3000部,环比增长603%，播放量实现92%的复合增长，整体市场规模预计在今年创新高；与此同时，漫剧相关企业数量也同样呈指数级扩张，预计将突破数十万家。漫剧是将静态漫画、小说文本等素材转化为动态作品形式的非真人视频短剧，目标用户初期偏向二次元年轻用户，随着题材扩张逐步覆盖至更大范围的用户群体。漫剧制作成本较低，具备“短平快”的特征，可视为小说及短剧行业的有效结合。在过去，纯2D及3D动画的制作成本较高，而AI可用于规模化生成素材，大大降低制作成本和时间投入，同时相比真人短剧，漫剧本身对AI生成角色画风形象、动作精确度等方面包容性更强，AI内容的可使用率也相对更高。近期长、中、短视频平台及优质IP方均加快了AI漫剧布局，如芒果TV启动“AIGC微短剧创作者生态计划”提供IP、AI工具及流量扶持，阅文开放十万部精品IP并推出“漫剧助手”等AIGC工具，爱奇艺公布漫剧合作激励计划等，随着国内供给爆发，有望催生产业链内包括平台方、IP方、内容方等更广阔的受益机会。图4：芒果TV发布AIGC微短剧创作者生态计划二、AI视频的昨天：从技术迭代突破到社交应用融合扩散模型是目前AI视频生成的主流技术路径，在语义理解、内容丰富程度上均有突破。2022年4月，VideoDiffusionModel推出，标志着扩散模型在视频生成领域的应用正式开启。但是扩散模型具有采样速度慢、计算消耗大等问题，在建模时间维度时通常效果较弱，生成视频动作幅度小，连贯性差。针对这一问题，2023年，扩散模型被成功扩展至时间维度，形成时空扩散架构，即在扩散过程中时间与空间的建模协同进行，代表模型有2023年6月Runway发布的首个商业化文生视频模型Gen-2，其所应用的时空联合扩散（Spatio-TemporalDiffusion）架构能够同时对每一帧画面的内容和帧与帧之间的动态关系进行建模，从而确保了视频在时间上的逻辑连贯性与流畅度。行业深度报告图5：VideoFactory交换式时空交叉注意力机制：时空独立到时空联合AI原生多模态与视觉语言融合，开启多应用场景落地探索。这一阶段，随着多模态技术迭代的重心从模型能力的突破转向实际应用场景探索，各类大模型开始在内容创作、知识检索、交互智能、影视与教育等场景落地。例如，阿里云于2023年8月推出的大规模视觉语言模型Qwen-VL，支持图文输入及视觉定位、图像文字理解等功能，可应用于知识问答、文档分析、识人辨物、内容创作等场景；2023年12月6日，谷歌DeepMind发布Gemini1.0，最通用的模型”，具备原生多模态特性，支持归纳并流畅地理解、操作以及组合不同类型的信息，具备空间逻辑推理、时间线推理、图文理解等能力。图6：根据左侧图，Gemini在右侧生成：展示动物猜国家的小游戏并验证对错Sora引领DiT模型，多模态取得跨越式进展。2024年开始，国内外多模态产品迭代加速，视频生成模型在“时空一致性”与“物理真实性”方面实现跨越式进展。在过去，视频生成模型只能生成数秒级的片段，缺乏对光影反射、物体惯性、空间深度等真实物理规律的建模，而2024年2月，OpenAI发布了革命性的视频生成模型Sora，模型核心基于DiT架构(DiffusionTransformer)，是一种结合了Transformer架构的扩散模型，其将扩散模型与潜空间压缩相结合，通过时空补丁（spacetimepatches）机制在潜空间中实现帧间动态一致性，显著增强了模型的世界理解与物理模拟能力。DiT架构模型在表征层表现突出，当前包括快手可灵、RunwayGen-3、LumaDreamMachine等主流模型多基于DiT架构在进行持续迭代。据腾讯AILab、ArtificialAnalysis评测和用户反馈，闭源模型当行业深度报告前表现持续领先。AI视频向实时交互与专业级内容生产工具演进。Sora问世后，国内外多模态大模型迭代显著加快，除实现真实世界建模外，AI模型的上下文处理能力也从数十万级词元跃升至千万级别，不仅能处理海量文本，还能对长视频、长音频、多章节逻辑链进行综合分析，实现了从“问题回答”到“世界理解”的功能转变。除此之外，多模态开始从单向生成走向实时交互与专业内容生产阶段。支持跨模态实时生成与反馈，成为多媒体生产力工具的核心支撑。例如2024年5月发布的GPT-4o支持以端到端架构实现全模态实时交互，接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像输出的任意组合，可以在最短232毫秒内对音频输入作出响应，接近在对话中的人类响应时间。图9：GPT-4o作为实时裁判与用户进行石头剪刀布的小游戏行业深度报告AI视频与社交功能结合，大众化传播方式加速商业化落地。2025年，基于此前阶段的技术突破，大部分AI视频模型已经能够支持真实世界模拟、实时响应、多模态理解等功能，而对于下一阶段而言，如何实现更广泛用户群体的触达，让AI视频工具成为真正的C端应用，为商业化变现奠定基础成为关键因素。这一阶段部分AI视频产品已经能够以音画一体的技术突破为基础，内嵌于社交应用，与社交属性实现深度融合。2025年9月，OpenAI发布Sora2，核心突破在于通过3D物理引擎式建模，实现复杂动作、刚体与流体的动态交互，如“体操运动员在桨板上后空翻”，生成的视频在物理连贯性和视觉真实感上接近真实拍摄，同时支持画面与背景音效同时生成。图10：Sora2生成：体操运动员在桨板上后空翻除此之外，Sora2更具颠覆性的突破在于OpenAI同时发布的SoraAPP，让AI视频不再局限于“生成工具”，而是更具互动属性和普适性的社交应用，各类功能支持用户对热门视频进行二次创作并发布，也支持生成虚拟形象植入生成作品中，这一机制让AI视频的创作过程融入了社交属性，实现快速社交裂变传播。具体功能包括：1）混剪Remix：允许用户对他人或自己生成的视频进行二次创作，如替换角色、改变风格、扩展故事等，极大地降低了视频创作门槛。2）互动与出演：用户可以将自己或朋友的"形象"置入到AI生成的视频中参与互动，即"客串"功能。3）社区互动：内置社区功能，方便用户分享创作、浏览他人作品并参与趋势挑战，凸显社交和UGC属性。与此同时，国内社交各类互联网平台给予优质AI内容专项资源扶持，旨在进一步提升AI技术对创作者的赋能，提升平台AI内容活跃度和用户参与度。行业深度报告表1：主要厂商多模态模型核心突破厂商模型名称核心突破OpenAISora(2024.2)lll支持文本、图像、音频、视频的输入与输出从“视频生成”升级为“物理世界模拟+视听协同生成”推动AI视频从内容生成走向社交共创。强化多模态的社交属性。Sora2(2025.9)GoogleGemini1.0(2023.12)ll从跨模态理解到全模态生成一体化:支持文本、视频、音频的同步生成与控制。提升Prompt遵从性、镜头逻辑一致性与叙事连续性。迈向可导演化的AI影视创作系Gemini1.5(2024.2)Veo3.1(2025.10)MetaLlama4(2025.4)l实现原生多模态Transformer架构，在底层直接融合文本、图像等多模态，大幅提升跨模态理解能力。三、AI视频的今天：国内外代表产品介绍Sora由OpenAI在2024年2月发布，模型大小适中，参数量为30亿，能够保持较高的运算效率。适中的模型大小使得Sora能够在各种计算设备上运行，为广泛的应用场景提供了可能。OpenAI于25年9月30日发布重大升级版本——行业深度报告Sora2，以及基于该模型的社交应用SoraApp。与前一代相比，Sora2实现了三个层面的技术突破：1）物理世界的拟真突破。Sora2能精准模拟水流、光影、重力与碰撞效果，甚至处理浮力与重心转移等复杂物理场景，极大提升了人物动作的连贯性与主体稳定性；2）多模态融合。Sora2可直接生成同步音频，自动匹配环境声、动作音效与多语言对白；3）初步具备了导演的叙事逻辑与剪辑师的镜头调度能力。Sora能够在模型能力上超过行业平均水平，主要得益于以下方面的技术突破：1）基础架构采用创新DiT混合模型，使得Sora能够生成高质量、高分辨率的视频内容，同时保持较高的处理速度。2）具备强大的视频生成功能。采用将视频和图像数据转化为统一表现形式的方法，提升数据集训练效率，深度模拟真实物理世界，包括展示多个角色、特定运动的复杂场景等。3）语义理解上也具备优势。通过Dall·E3中采用的视频再描述（re-captioning）技术获得大量配有描述文本的训练视频数据，能够理解并执行详细的文本指令，提升文本生成视频的质量。2）PikaPika1.0由PikaLabs在2023年11月发行，具备多种强大的功能，主要包括：1）视频生成与编辑：Pika能够根据用户的指令生成各种风格的视频，包括3D动画、动漫、卡通和电影等。用户还可以选择延长现有视频的长度或将其转换为不同的风格。2）AI编辑功能：Pika提供了AI编辑工具，用户可以利用这些工具更改视频内容的细节，如角色的服装或添加新角色，实现复杂且个性化的视频编辑和创作。3）创意转视频：Pika支持用户上传自己的创意想法，并自动将其转化为相关的视频内容。无论是旅游博客文章、产品设计草图还是婚礼主题和音乐，Pika都能快速生成符合用户需求的视频。行业深度报告3）RunwayRunway旗下视频生成工具主要包括Gen-1、Gen-2。Gen-1于2023年2月推出，立足于风格迁移技术，能够通过应用文本提示或参考图像中指定的风格，将现有视频转化为新视频，但生成视频质量不足，难以作为完整的成片交付使用。在此基础上，Runway于2023年6月推出了Gen-2，在11月发布Gen-2生成4K高清视频的更新升级。相比Gen-1，Gen-2实现了跨越式升级，支持提示词一键生成超写实视频，在分辨率、细节上均实现突破。Gen-2主要支持功能包括：1）图像生成与处理：用户可利用其AI算法创建新的图像、修改现有图像或进行风格转换，为视频制作提供更多的素材和选择。2）3D内容创作：支持3D模型的生成、编辑和渲染，以及实时3D场景的构建和交互。这使得用户能够创建出更加逼真和生动的视频内容。3）一键式智能处理：提供了一键式智能处理功能，能够自动优化视频质量和色彩效果，节省用户的时间和精力。4）多平台输出：支持多种视频输出格式和分辨率，用户可以根据需要将视频上传到社交媒体、分享给朋友或发布到专业平台。4）GoogleVeo3.1Veo3.1模型由谷歌发布，在视频生成方面取得了显著进步，在音频输出、精细化编辑控制、图像转视频效果等方面均有提升，能够生成音画同步、画质高达1080p、时长8秒的高清视频。与前一代veo3模型相比，veo3.1的提升点包括：1）画质与真实世界模拟效果提升：画面细节、光影效果及物体运动轨迹模拟更精准，效果更接近真实世界；2）效果控制编辑功能升级：新增首尾帧和多图参考功能，支持精准风格把控，场景延伸功能突破时长限制；3）音频处理能力提升：支持音画同步生成，提升专业内容制作效率。用户可以在Google的flow、Gemini和lovart等多个平台上使用该模型。在flow平台上，用户可以通过文本转视频、图片转视频以及多图融合转视频等方式生成视频。使用时，只需选择veo3.1-fast模型并输入提示词即可快速生成；Gemini平台同样支持veo3.1模型，用户进入页面后可直接体验视频生成；lovart平台则提供了更灵活的视频生成选项，用户可以新建项目后选择视频生成器，设置视频比例、时长和分辨率等参数。行业深度报告可灵由快手发行，于24年6月6日发布全球首个DID架构的V1.0版本，截至目前已完成三十多次产品及模型迭代，发布了V1.0、V1.5、V1.6、V2.0、V2.1、V2.5Turbo等大版本模型，核心效果持续处于行业领先。可灵AI基于快手自研可灵2.5Turbo模型，提供具备稳定性更强的高质量视频、及图像生成和编辑能力，支持「首尾帧稳定丝滑的画面衔接」「多图参考指定角色生成视频」「拥有百余种风格」，满足创作者在想象力发挥以及对创意素材生产与管理的需求。2）即梦Dreamina即梦Dreamina由字节跳动发行，核心功能是帮助用户根据文本或者图像，生成创意视频，具备画面识别准确、动态丰富、创新性强等特点，支持多种风格的视频生成，如动漫、写实、摄影和插画等，其中首尾帧相连的功能是即梦的一大创新点，为用户提供了更多的创作可能性。即梦主要支持以下功能：1）图生视频与文生视频：用户可以根据图片或文本描述生成创意视频，支持多种风格，如动漫、写实、摄影和插画等。2）尾帧功能：允许用户上传首尾两张图片，实现AI生成补帧画面，增强视频内容的一致性。3）视频功能控制：提供基础的运镜控行业深度报告制、视频比例和运动速度调节功能，使用户能够更灵活地调整视频效果。4）中文语义理解：相较于其他AI视频生成产品，即梦对中文语义的理解更为精准，更适合中文用户使用。3）ViduVidu由生数科技联合清华大学在2024年4月发布，作为中国首个长时长、高一致性、高动态性视频大模型，其技术特点和应用潜力有：1）模型架构创新：采用原创的Diffusion与Transformer融合架构U-ViT，结合了Diffusion模型的生成能力和Transformer模型的感知能力，为视频内容的生成提供了强大的技术支持；2）高清视频生成：Vidu支持一键生成长达16秒、分辨率高达1080P的高清视频内容；3）文化适应性：重点理解和展现中国元素，如熊猫、龙等，在文化表达上更具多样性和深度；4）多镜头与时空一致性：在不同镜头之间保持高度一致性，有利于制作叙事连贯的视频内容，实现不同镜头的切换；5）动态场景捕捉与物理模拟：能够捕捉和渲染动态场景，包括复杂的动作和物体运动。图20：Vidu生成视频画面示例资料来源：生数ShengShu微信公众号，4）WHEEMiracleVision4.0版本迭代主打AI设计与AI视频功能，并于2024年2月上线美图公司旗下应用“WHEE”。MiracleVision4.0版本的视频功能主要包括文生视频、图生视频、视频运镜、视频生视频，其生成能力已能融入行业工作流，尤其在电商和广告领域表现突出。在电商行业，MiracleVision能够快速制作大量商品视频，使商品展示更加灵动且质感高级；在广告行业中，MiracleVision能够制作行业深度报告符合产品特性的创意视频，跳出套路，使品牌理念深入人心。通过MiracleVision的四大功能，用户能够轻松实现视频内容的创作和编辑，为电商和广告等行业提供了高效、创新的解决方案。图21：美图AI生视频功能上线WHEE5）PixversePixVerse由爱诗科技发行。爱诗科技拥有来自清华大学、北京大学、中国科学院等顶级学府的团队成员，在计算机视觉、机器学习、计算机工程和算法设计等领域具备丰富的经验与技术储备，致力于为用户提供创新且实用的AI工具，其中PixVerse便是其最新力作。PixVerse具备多种功能，以满足用户的不同需求，支持文本生成视频和图片生成视频两种方式，用户可以根据个人喜好和创作需求选择适合的生成模式。同时，PixVerse内置了多种动画风格，包括写实、动画、3D动画和CG游戏风格，用户可以根据需要选择合适的风格。此外，它还具备高效压缩技术和画质提升功能，能够在保持视频质量的同时减小文件大小，并将视频提升至4K超高清分辨率。敬请阅读末页的重要说明行业深度报告四、AI视频的明天：多领域融合趋势凸显，商业化应用有望落地加速文生视频工具与社交互动结合，催生C端应用商业化机会。经历了文生视频从GAN模型到基于Transformer的自回归模型、扩散模型的演变迭代，下一阶段的文生视频工具将不再局限于专业工具，而是进一步产品化，与社交互动深度融合，加速C端应用落地商业化。以OpenAI推出的Sora2为例，其突破并非单纯依靠技术更迭，更多的是通过创新功能设计和操作简单化，将AI视频工具转化为更贴近用户的社交互动应用，定位为全AI内容社交平台，所有内容均由AI生成，采用信息流推荐机制，用户创作与消费均围绕AI内容展开。其中“客串（Cameos）”和“混剪（Remix）”功能极大地增强了互动性和趣味性，更简单的操作也进一步降低了使用门槛，让用户共创和分享更为便捷。SoraApp在上线首日迅速攀升至美国AppStore总榜第三名，达到5.6万次的安装量，上线三天登顶榜首，上线七天获得62.7万次iOS下载量，这一数据已经超越了ChatGPT当初的表现，也进一步印证了产品化对C端AI应用商业化推进至关重要。图24：SoraiOS应用商店下载量ChatGPT向操作系统方向演进，文生视频工具集成化、平台化程度有望提升。2025年10月，OpenAI在年度发布会上推出了名为“AppsinsideChatGPT”的功能，宣布ChatGPT将向第三方应用全面开放，以平台化方式为开发者和用户带来全新体验，而ChatGPT也将从单纯的对话工具逐渐演变成为覆盖多样化领域的全能生态系统。在此过程中，各类文生视频工具也有望接入以ChatGPT为代表的生态系统，实现集成化、平台化以及更大范围的用户触达。首批接入的包括Spotify、Coursera、Canva、Figma等12家平台，涵盖了从音乐推荐、在线教育、PPT生成到设计编辑的全场景。平台化的演变不仅意味着更多的第三方应用用户触达，也意味着用户交互方式的根本性改变。例如，当用户要求创建个性化歌单时，ChatGPT支持直接连接Spotify，根据用户喜好自动生成并保存播放列表；用户提出设计海报的需求时，可以在聊天框中@Canva并提供指令，ChatGPT支持通过Canva生成多个选项供选择；多应用的实时响应意味着用户敬请阅读末页的重要说明行业深度报告不需要再在不同应用之间来回切换，大大节省了时间成本和用户教育成本，也标志着AI应用与用户之间的交互模式将逐步从“被动响应”转向“主动服务”。文生视频模型集成化发展，从简单工具向“生成-分发-变现”全链路平台转化。除ChatGPT类的生态系统能够帮助各类视频生成工具实现平台化以外，文生视频工具本身的发展也逐步趋向集成化、平台化，比起单纯的视频生成工具，更趋向于和各类应用场景结合，实现一键打通。例如快手可灵模型尝试与快手商家后台打通，实现一键生成产品视频并直接投放；腾讯混元视频则侧重在IP内容与影视广告中实现半自动生成；即梦AI与抖音创作平台打通，一键生成的内容可直接进行投流。这种平台化趋势让内容真正流动并产生更高价值，对于解决当前AI视频生成与商业化变现的生态断层问题至关重要。图25：快手可灵AI方案框架视频工具与AIAgent结合趋势渐显，一站式解决视频创作需求。AIAgent可以承担传统流程中许多重复性、耗时的任务，也同样能大幅简化文生视频的操作过程。AI对视频创作本身的提效作用已十分明显，但多模态产品百花齐放同样带来了一定的复杂性，单应用可能无法同时支持脚本生成、文生图、图生视频、剪辑配音等所有流程，独立应用之间切换存在不便，用户学习成本较高，而文生视频与AIAgent的结合则有望重构视频生产范式，一站式解决视频创作需求。如美图公司于2025年7月近期推出的图像AIAgent“RoboNeo”，集成公司自训练垂直小模型及行业主流多模态大模型，以“一句话搞定生产力”为核心，通过自然语言对话，让用户无需专业背景或复杂操作，只需输入文字指令，即可快速完成图片精修、品牌设计、电商物料制作、效果预览、视频生成及网站搭建等全场景任务，应用上线首月MAU破百万。对于AI视频而言，与AIAgent的结合意味着视频生成将像对话一样自然，使用门槛也将进一步降低。敬请阅读末页的重要说明行业深度报告图27：美图公司旗下AIAGENTRoboneo文生视频工具功能逐步完善，催生多样化商业变现路径。随着技术迭代，AI视频生成已经不再局限于视觉。如谷歌的Veo3.1模型已经支持AI生成音频，能够根据画面中的物体运动、材质和叙事节奏，动态合成匹配的音效和背景音乐，实现了真正的“音画同步”，让视频作品拥有灵魂。行业的竞争正从算法转向生态，基于视频生成模型的商业化模式也正变得清晰。个人+专业创作者+企业用户需求空间广阔。1）对于个人用户而言，AI视频工具有望重构视频互动方式，如Sora2结合社交互动，有望对标“AI版Tiktok”实现商业化变现；2）对于专业创作者而言，稳定、高效的AI视频生成能力值得付费，截至2023年5月，全球内容创作者数量超过2.08亿，各类设计师、短视频博主、摄影师均可以利用AI视频工具提升工作效率；例如快手旗下的可灵AI超过70%的营业收入来自广告营销从业者和自媒体视频创作者等专业用户付费订阅会员，这些专业用户是视频生成大模型的核心受众群体；3）对于企业用户而言，AI视频工具可广泛用于广告素材、影视内容的创作中，优化现有工作流。多元化商业模式涌现，开辟全新创作者变现路径。除订阅制的商业模式路径，部分产品也开始探索更多样化的商业模式。例如MelodAI平台，引入了Web3的提示即收益机制，用户只需输入提示词生成音乐或视频，就能根据创作行为和内容的影响力获得代币奖励。此外，以星界新智（StarSphere）为代表的平台，旨在构建全球性的AI多模态资产交易市场，让创作者能够将AI生成的视频、图像等作为可交易资产进行确权并上架交易，为创作者开辟全新的变现路径。图28：星界新智（StarSphere）平台交易市场界面敬请阅读末页的重要说明行业深度报告五、受益机会及相关标的：文生视频赋能行业革新，开启内容创作新纪元政策聚焦高质量供给，驱动影视内容多元发展。根据国家电影局统计数据，2018年中国电影票房首次突破609.76亿元，2023年随着线下活动恢复，电影票房达到549.15亿元，同比增长82.64%，且国产电影占比较高。2025年截至10月初，票房已超过2024年全年。在文化强国战略不断深入的背景下，“广电21条”等系列政策释放出了坚定支持影视行业高质量发展的积极信号，政策上呈现对影视规范性、高质量内容输出、而非“数量取胜”的要求。随着居民消费能力持续提升，对影视娱乐的需求有望催生更多影视产品的出现，影视产品的质量与丰富度提升将成为核心发展方向，而创作分工也将更为明确和细化。对于以往因成本或技术限制而难以触及的题材（如硬科幻、宏大历史场景AI视频生成技术能大幅降低制作难度，使更多“小众”但高质量的想法得以实现。图29：2015-2024年中国电影票房规模0文生视频降低行业门槛，加速各类创新内容形态产出迭代。文生视频对影视行业的核心变革，在于形成“创意-落地-优化”的低成本、快速良性循环。基于目前Sora等AIGC工具的技术，AI已经可以模拟生成大量不同角色和场景，在不涉及高成本投入的情况下制作高质量影片，降低行业门槛，加速影视优质内容的产出和迭代，在此前提下，以“AI漫剧”为代表的创新内容形态应运而生，作为AI技术与动漫短剧深度融合的产物，AI漫剧以漫画、小说等原作品IP为基础，通过AI技术实现剧本生成、角色设计、分镜制作、视频合成及后期等全流程，集均时长一般为8-10分钟，融合短视频的“短平快”特点，节奏紧凑且保留原作剧情和艺术风格，相比真人短剧更具漫画风格和多元化特色，成为年轻用户群体青睐的“电子榨菜”式创新内容形态。如腾讯动漫近期新上线的AIGC漫剧《我的治愈系游戏》《传武》，全程由7人团队借助即梦AI完成，AI承担分镜绘制、场景渲染、动作串联等重复性工作，1个月产出20集且上线四天播放量破千万，敬请阅读末页的重要说明行业深度报告较传统动画团队效率提升数倍以上。从上游IP、中游内容制作到下游分发变现，AI漫剧有望带来新一轮产业趋势。图30：AI漫剧《传武》《我的治愈系游戏》文生视频推动影视制作效果优化。在影视作品中期拍摄及后期制作过程中，文生视频技术可以在场景、角色、特效等多方面提升画面制作效果。例如快速将文本描述转化为动态场景，降低搭建成本，实现现实中无法复刻或成本极高的空间呈现，赋予作品更强的视觉冲击力和艺术表现力。如《独行月球》借助AI输入指令，还原月球低重力环境下尘埃的缓慢扩散、光线的特殊折射效果，并结合光流估计技术确保背景与演员动作的光影同步，使场景更具真实感。文生视频赋能影视制作降本提效。内容创作是影视制作行业的核心环节，而生成式AI的应用能够用技术替代人力密集型工作，快速生成故事分镜视频，大幅节约剧本撰写、原画设计、动画制作等准备周期，将所需时间从数月缩短到数天。大大提升内容创作效率。2025年暑期，改编自现象级网文IP的30集完整AI动画《一品布衣》，借助ViduAI融合大语言模型与扩散模型，实现了从文本拆解、角色场景设计到视频制作的全流程落地，从开发到上线仅用60天，创下行业纪录。其单集制作周期从传统30天压缩至3天，效率提升超90%；人力成本从30人团队精简为1人，节省96%；单分钟成本从5万元降至3000元，直接降本93%。同时，该片在角色一致性、动作连贯性等技术难点上突破显著，不仅让30集内容保持统一的艺术风格与叙事水准，更确保制作质量未因提速而打折。敬请阅读末页的重要说明行业深度报告“用户即创作者”生态趋势涌现，注入影视行业全新活力。从内容创作的角度来看，影视内容生产的个性化和多元化尤为重要。传统影视行业多为单向、标准化创作，而文生视频模型能够根据用户具体需求构建差异化视觉内容，个人及专业用户均可将其用于定制社交媒体内容，内容生命力和观众参与度进一步提升，形成消费与生产互动共振的新生态。2024年3月，OpenAI计划携Sora与好莱坞等影视公司合作，希望拓展OpenAI在娱乐行业的影响力与商业价值，将“互动粉丝创作”视为影视公司的新兴盈利点；2025年9月，YouTube引入谷歌的升级AI创作生成工具Veo3Fast，鼓励用户对原有影视IP素材进行混剪、风格化改编与多版本衍生创作。这种“用户即创作者”的互动生态，不仅提升了内容的多元性和长尾价值，也增强了观众的情感黏性与社区互动参与感，有望为影视行业注入全新活力。图33：Youtube鼓励Shorts视频创作游戏市场步入存量博弈，AI创新玩法或成破局关键。根据Newzoo发布的《2025年全球游戏市场报告》，2028年全球游戏平台端收入预期将达到2054亿美元，五年复合增长率3.15%。国内方面，根据伽马数据，2024年中国游戏市场实际销售收入为3257.83亿元，同比增长7.53%，自主研发游戏国内市场实销收入2607.36亿元，同比增长1.7%。随着整体增速放缓，流量竞争趋向饱和，目前游戏市场步入“存量博弈”模式，游戏企业从扩张型增长转向精细化运营与效率敬请阅读末页的重要说明行业深度报告竞争，对成本端的管控以及创新玩法的开拓成为下一阶段占据市场份额的重要因素。2024-2033年全球生成式AI在游戏中的市场规模预计将从14.3亿美元增长至111.1亿美元，CAGR为25.6%，随着生成式AI技术的迭代发展，AI将成为游戏研发中的重要一环。图34：全球游戏市场回暖但增速趋缓全球游戏市场平台收入（十亿美元）同比增速2022202320242025F2026F图35：中国游戏市场收入连续2年超3000亿00Sora加速游戏行业革新，有望重塑游戏创作流程。2023年5月，英伟达推出游戏定制化AI模型代工服务AvatarCloudEngine（ACE），开发人员能够利用AI视频生成工具AudiotoFace进行栩栩如生的角色动画创作，开发者FallenLeaf借此成功完成《索利斯堡》角色脸部动画。2024年，Sora的问世更是加快了行业革新的速度。Sora可以模拟人工开发过程，以视频游戏为例，通过向Sora提供包含“Minecraft”（《我的世界》游戏）一词的提示，即可以高保真的方式渲染出与该游戏极其相似的游戏场景，同时还可以模拟玩家操作游戏角色。通过生成式AI技术，开发者能够以更快的速度和更高的效率生成逼真的游戏场景、动画和视觉效果，对物理特性、游戏玩法等内容的验证有巨大帮助，意味着小型开发团队也能够在资源有限的情况下产出更多优质产品。从内容生产到玩家体验实现多维度赋能，如2D/3D美术资源生成、代码编写、剧情与NPC行为逻辑生成、自动化效率测试等，AIGC技术的投入能够一定程度节约成本，提升产出效率。如影眸科技的ChatAvatar平台支持通过对话或图片等方式一键生成3D角色资源，还支持导入到Unity、虚幻引擎、Maya等中使用，小团队甚至是视频创作者个体都可以使用，大大降低了游戏角色建模的技术敬请阅读末页的重要说明行业深度报告门槛，简化游戏创作流程从而提高创作效率。Unity发布的《2025年Unity游戏报告》显示，2024年接受调研的工作室中，有96%的游戏工作室在工作流程中使用了AI，而这一数据在2023年仅为62%。图37：AI技术在游戏行业中的应用图38：ChatAvatar通过文本对话生成3D角色资产图39：Unity《2025年Unity游戏报告》调查结果文生视频赋能玩法创新，AI激发个性化活力。以Sora为例，其在生成视频时长、内容逻辑一致性、视频分镜等方面形成突破，一方面技术革新了内容创作流程，降低了游戏制作的门槛，另一方面，类似Sora的文生视频模型在上线后的玩法迭代、用户体验优化等方面同样具备深刻意义。2025年9月，AI3D生成公司VAST与网易《蛋仔派对》达成合作，将TripoAI3D大模型技术引入游戏的UGC创作系统。玩家可通过文字或图片生成3D模型，并直接用于地图创作，极大提高了UGC内容的多样性和游戏的可玩性。敬请阅读末页的重要说明行业深度报告图40：蛋仔派对UGC地图创作Z世代消费理念崛起，“情绪价值”为先壮大IP消费基础。根据国家统计局数据，目前Z世代占国内总人口的比重不到20%，但所贡献的消费规模已占到40%。到2035年，73%的Z世代人口将会成为职场新人，Z世代整体消费规模有望增长4倍至16万亿元，是未来消费市场增长的核心要素。Z世代消费者更多聚焦自尊和情绪价值的需求，对于个性化消费和社交化消费更为关注，年轻群体深受热剧综、游戏、卡通动漫等影响，能够与相关IP衍生产品建立情感共鸣，激发购买意愿，从而助推二次元、盲盒、玩具游艺、IP礼品纪念品等新消费方式火爆出圈。根据阿里鱼消费品与营销项目授权报告，消费者购买过的IP类型TOP3依次是影视综艺、电子游戏、卡通动漫，分别占比48.8%、47.4%、44.8%，均为与“谷子经济”高度关联的消费赛道。有超七成用户表示在挑选商品时会考虑商品里的IP元素。随着IP产业不断与其他产业融合，游戏与影视、动漫、文学等领域的联动将更加频繁，通过推出衍生作品或改编作品，形成新的商业模式和盈利点。AI助力内容制作提效，加速IP孵化及优质作品产出。传统动画制作流程繁琐，依赖大量人工绘制和调整，成本高昂且周期漫长，对大量优质IP的变现形成桎梏，而现有视频大模型可将IP改编的制作周期从数月甚至数年缩短至几周甚至几天，“IP＋AI”有望带来极低或零边际成本的内容生产。以动画电影《哪吒之魔童闹海》为例，其借助AI辅助角色设计、场景渲染及特效生成，其中的“裂空爪”八层岩浆流体特效，借助AI通过智能拆解任务系统，同步处理流体力学模拟、材质渲染与动态合成，将原本需要百人团队协作的复杂工程转化为精准的算法指令，大大节省了投入成本。敬请阅读末页的重要说明行业深度报告图41：《哪吒之魔童闹海》“裂空爪”特效AI助力IP内容改编打造互动生态，拓宽多元创意边界。在内容创作领域，AI文生视频技术打破了IP内容只能由官方生产的传统模式，让粉丝能够成为内容的共同创作者，不仅能拓展丰富创意边界，更能形成极强的社群归属感和参与感。 2025年5月，由Vidu发起的动画西游改编大赛掀起了AI驱动的全民二次创作浪潮，让粉丝从“观众”变为“共创者”。利用Vidu等全球领先的AI视频内容生产平台，构建新的互动场，生成的AI视频在社交平台自主裂变传播，反哺IP生态，形成“用户参与-内容裂变-IP增值”的正向循环，进一步提升IP的情感附加值，扩大IP生态商业化价值。图42：AIGC动漫西游改编大赛AI赋能IP衍生品开发效率提升，有望最大化商业化价值。随着以Z世代为主导统计数据，2024年我国谷子经济市场规模已达1798.8亿元，预计2027年将突破3000亿元关口，2024年淘宝平台IP衍生周边成交额已超百亿元人民币，包含毛绒玩具、吧唧等，还有爆款谷子单品链接成交额突破4000万元。IP经济的核心在于IP价值的多维度释放，而AIGC恰好为此流程提供了技术支点，不仅能根据用户偏好助力开发各类IP衍生品，如玩具、盲盒、数字藏品等，为创意生成效率提升助力，还能助力IP跨平台推广，通过短视频、互动推文等形式扩大IP影响力。目前，类似Sora、GoogleNanoBanana等多模态产品技术已经支持快速生成角色多角度3D模型，未来可用于手办、潮玩等设计流程，减少传行业深度报告统生产流程中建模耗时，为各类IP衍生品提供源源不断的供给支撑。图43：2022-2027年中国谷子经济市场规模及预测图44：NanoBanana生成3D手办模型0AI推动IP长尾价值释放，长线运营有望迎来新范式。对于优质IP而言，其商业化价值释放中一个核心痛点在于，主产品（如电影、电视剧）上线后，IP热度会随时间推移自然衰减，如何在成本可控的情况下维持IP热度成为又一重要命题。对于传统运营流程而言，为维持热度而持续的进行内容投入意味着成本投入。AI时代下，AI图像及视频生成技术使得“长尾内容”的规模化与个性化生产成为可能。例如Sora等AI工具可以通过故事续写、支线剧情、小剧场、风格混剪等方式，将核心IP快速转化为海量的衍生短视频内容，填充到社交媒体矩阵中，在此过程中，AI还能学习并迁移原IP的视觉风格，在衍生过程中实现风格的融合与创新，为粉丝提供近乎无限的“精神食粮”，将短暂的“爆款”转化为长期的“文化符号”，为其商业化价值的最大化提供助力。图45：Sora2二创《凡人修仙传》图46：MidJourney、Gen2二创《流浪地球3》预告片资料来源：哔哩哔哩，招商证券腾讯混元大模型自2023年首批通过备案后，至2025年持续迭代升级并实现规Hunyuan-MT-7B等）、语音模型、视觉理解模型（如Hunyuan-MT-7B）、视觉生成模型（如HunyuanImage3.0、文生图-all、文生视频-fast等），集成文本生成、图像创作、视频生成及3D模型生成等多模态能力，其中翻译模型行业深度报告Hunyuan-MT-7B于25年9月登顶HuggingFace全球热榜，支持33个语种互译；HunyuanImage3.0（混元图像3.0）是全球首个统一图像理解与生成的原生多模态开源模型，基于800亿参数架构，在推理时激活130亿参数，具备思维链推理能力，在文本-图像对齐和视觉质量评估中达到业界领先水平，成为目前最强大的开源图像生成模型，发布后在人工评测GSB（Good/Same/Bad）评估体系中展现出显著的性能优势，表明HunyuanImage3.0作为开源模型，在综合性能上已达到业界领先闭源模型的同等水平，是目前表现最优的开源解决方案。此外，混元3D世界模型1.0开源可分钟级生成可编辑虚拟世界。目前大模型已全面融入腾讯各业务线，包括C端腾讯元宝入驻微信联系人列表，支持文件解析与代码生成；B端通过腾讯云对外输出能力，赋能游戏、腾讯会议、广告、客服等场景，成为四大核心业务增量引擎。图47：腾讯混元大模型图48：2025GDC腾讯游戏Ai品牌GiiNEX展台公司围绕商业要素构建垂直领域模型集群，核心模型包括快意大模型（侧重语言处理）、可图（图像生成）、可灵AI视频大模型（支持文生视频、图生视频及视频编辑在视频生成领域，可灵AI表现尤为突出，2025年9月已迭代至2.5Turbo版本，文本理解能力、视频动态质量进一步增强，能更好地学习和模拟真实世界的物理动态。可灵AI目前已在全球拥有超过4500万创作者，累计生成超2亿个视频和4亿张图片，服务超过2万家企业客户，25年Q2单季可灵AI营收达2.5亿元，其应用场景的深度探索也带来了商业化的快速增长。影视领域，2025年6月与星芒短剧、异类Outliers联合出品了全球首部AI单元故事集《新世界加载中》，迄今全球累计播放量近2亿，并获得首届中国微短剧盛典“年度AI短剧”荣誉；游戏领域与《逆水寒》合作生成角色及特效，支持玩家将静态图片到动态视频的高效转化。行业深度报告图49：可灵1.6pro登ArtificialAnalysis图生视频榜首图50：《新世界加载中》首映礼公司围绕其“内容生态+创作者社区”的核心优势布局AI应用，包括开源多个关键基础模型，其中开源动漫视频生成模型AniSora在2025年7月已迭代至V3版本，支持番剧片段、VTuber内容、鬼畜视频等多类二次元场景一键生成。今年世界人工智能大会上，B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」，以便海外用户更好体验游戏、科技、二次元等主推内容，功能除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外，还能完美还原UP主的声线、音色、气口，而非传统的机器音翻译，同时还能基于翻译语言进行口型模拟。创作者支持方面，2025年7月7日，公司宣布推出内部代号为“代号H”的、专为视频播客创作者设计的AI创作工具，支持文案与音频输入生成视频，具备高效生成能力——千字内容可在6分钟内完成视频制作，未来有望进一步压缩至3分钟。图51：哔哩哔哩自研「AI原声翻译功能」公司以“AI美学+垂直场景深耕”为核心战略，依托长期的影像技术积累与美图影像研究院研发实力，构建起以自研AI视觉大模型MiracleVision为核心的技术体系。AI视频方面，模型满足文生视频、图生视频、视频运镜、视频生视频四大行业深度报告功能，支持多图参考、首尾帧控制等快捷操作。搭载精密计算运动模块，保证动作连贯性，并引入画质增强的后处理模块，更精准理解语义，生成流畅视频内容，目前MiracleVision的AI视频能力已能融入行业工作流。2025年7月15日，美图AIAGENT产品RoboNeo正式上线，作为专注于影像与设计的AI智能体，其核心亮点是以自然语言交互赋能视觉创作，极大降低专业创作门槛。功能上，RoboNeo可完成AI智能修图、视频处理生成、AI设计生成等多种视觉创作任务，支持多模态创作，功能覆盖范围广泛，是公司完善AI应用生态的重要一环。图52：美图公司发展历程公司坚持“AllinAGI及AIGC”战略方向，以自主可控的算力集群为支撑，保持产品高频迭代，构建起从基础模型到场景应用的全产业链布局。25年8月，公司连续发布六款大模型，从SkyReels-A3音频驱动人像视频生成模型，到Matrix-Game2.0世界模型升级版、Matrix-3D场景生成大模型，再到SkyworkUniPic2.0、SkyworkDeepResearchAgentv2和MurekaV7.5中文音乐生成模型，覆盖视频、3D、图像、智能体和音乐等多模态核心赛道。公司旗下短剧平台DramaWave截止25Q2年化流水收入(ARR)突破2.4亿美金，月活超1000万，累计下载量突破3000万，跻身全球短剧应用前五，在营销素材、广告投放等方面深度应用AI提升效率；公司旗下Skyreels是全球首款AI短剧平台，集成了剧本、分镜、3D生成等大模型，提供从文本到视频的一体化创作流程，支持高精度角色控制和音乐视频制作，支持创作者“一键成剧”。图53：昆仑万维旗下“Skyreels”AI短剧平台行业深度报告表2：昆仑万维一周连续发布六款大模型产品/模型名称描述SkyReels-A3一款基于DiT的、音频驱动人像视频生成的模型Matrix-Game2.0国产开源Genie3，交互世界模型升级版Matrix3.03D场景生成大模型SkyworkUnipic2.0统一多模态理解、生成与编辑一体化SkyworkDeepResearchAgentv2多模态深度调研与浏览器智能体双升级MurekaV7.5中文音乐生成与描述性TTS新突破资料来源：量子位，招商证券公司坚持“以IP为核心、精品化为路径”的策略，夯实竞争优势。公司已汇聚超1390万部作品储备、超950万名创作者，覆盖200多种内容品类并深耕科幻、历史、非遗等垂类，触达全球众多用户，IP生态持续扩容。2025上半年长剧霸屏榜Top10中60%改编自阅文IP；动漫端《斗破苍穹》年番登顶腾讯视频付费榜，《道诡异仙》漫画刷新新作攀升纪录，30部漫剧播放量破千万，同时开放十万部精品IP用于漫剧开发，推出AIGC工具“漫剧助手”提升改编效率；2025年3月宣布开放2000余

人人文库> 全部分类> 应用文书 > 研究报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

从 Sora 看 AI 视频的昨天、今天和明天

文档简介

温馨提示

最新文档

评论

从 Sora 看 AI 视频的昨天、今天和明天

文档简介

温馨提示

最新文档

评论

相关文档