版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
正在你身边证券研究报告|传媒行业|2023年10月26日传媒团队.行业年度策略报告OpenAI的拐点:重启“趋势性”增长正在你身边1)ChatGPT美国地区移动端付费率于八月底九月初出现增长拐点,全球地区移动付费率于七月底八月初出现增长拐点,预期Vision、Voice、3)全球热门类GhatGPT应用(接入OpenAIAPI的应用)总体付费率呈现增长趋势,全球AI付费习惯逐步形成,增长较为明显的插件应用类型主要4)根据我们的测算,在OpenAI的100亿美元资金的情况下,如果在6000万DAU、付费率逐月提升0.25%的条件下,压缩两次后的GPT-3.5模型和GPT-4到2026年12月或许可以实现每月营收超过算力成本;付费率逐月提升0.5%的条件下,同一结果可能提前到23正在你身边司,特别是积极进行智慧化、数字化布局,有独特科教资源的公司,如南方传媒(教育信息化)、中国科传(科教类出版物)、皖新传媒(华为合作学习机、智慧教育业务)、世纪天鸿(教辅教材)、中南4正在你身边一.一.OpenAI的财务改善:用户付费重启增长 ChatGPT美国地区移动端付费率于八月底九月初出现增长拐点,全球地区移动付费率于七月底八月初出现增长拐点。预期Vision、Voice、DALL·E3的多模态功能将奠定后续几个月的付费率增长。GhatGPT于6到8月份的移动端付费率增长呈现疲软状态,OpenAI亏损压力大,有关于为降低亏损压缩性能的新闻也随之增多。7月初,代码解释器(CodeInterpreter)等功能的开发推动了越来越多的用户为其付费。移动端付费率大幅增长后,OpenAI也随之在GhatGPT中推出了新的图像功能和语音功能。在你身边GhatGPT用户付费率重启增长,降低了亏损率,推动了OpenAI财务状况的改善,为日活用户规模的增长提供了现金流基础。2023年10月10日,ChatGPT网页端和APP端日活用户量带来的盈亏影响大于用户增长带来的盈亏影响。 全球热门类GhatGPT应用(接入OpenAIAPI的应用)总体付费率呈现增长趋势,全球AI付费习惯逐步形成。自2023年6月以来,除本身具有高付费率的ChatAI的美国和全球地区的移动付费率有所回落,其他类ChatGPT应用的美国和全球地区的移动付费率都出现了不同程度的增长。2023-06-012023-07-012023-0 增长较为明显的插件应用类型主要为PDF、搜索类。PDF阅读类应用(AIPDF、AskYourPDF)及搜索类应用(MixerBoxWebSearchG、KeyMate.AISearch、WebPilot)在接入Chatgptplugins后出现访问量上升的趋势,笔记类应用(Noteable)也出现了先升后降的趋势,而2086420AskYourPDFMixerBoxWebSearchGAiPDFNoteable接入Chatgptplugins后的流量变化 ChatGPT的使用用户中程序员较多,ChatGPT可以作为一个强大的编码助手,帮助程序员解决编程问题、提供代码示例和调试建议。除了提供建议和示例外,ChatGPT还可以直接生成代码段,帮助程序员加速开发过程,大大提高了代码质量和效率。2023年7月11日,OpenAI推出代码解释器(Codeinterpreter),具体来说包括帮助分析数据、创建图表、编辑文件、执行数学运算等功能,代码解释器扩展了ChatGPT的功能,为用户带来更好的交互式编程体验和强大的数据可视化功能。帮助用户了解全球互联网的状态,包括流量分布、设备类型、操作系统、网络协议 ChatGPT可以用于生成创意和灵感,协助设计师进行创意设计。设计师们可以向ChatGPT提出关于色彩、形状、材料等方面的问题,从中获取创作灵感,融入自己的设计作品里。GPT-4的多模态功能可以输入图片,较GPT-3.5更为便利。GPT-4新功能CodeInterpreter可以进行GIF动画渲染以及基本视频编辑,为创作者提供帮助。将ABC音乐符号转换为wav、midi 对一般白领来说,ChatGPT可以帮助工作的用户快速理解数据、制定分析策略和解释分析结果,也可以回答数据相关问题,并提供数据可视化建议。其中使用最多的大多为PDF阅读及创建生成图表类的应用,如AskYourPDF、Zapier、ChatWithPDF、ShowMe等。新推出的多模态功能可以将手绘资料转化为电子表格,有助于提升办公效率。插件可通过提供PDFURL来询问问题、 GPT-4可以切换不同“身份”进行智能对话、撰写文章、回答问题等,GPT-4插件的搜索及学术功能对学生或教师群体较为有益。ChatGPT较火的Plugins中有大量搜索及学术类的应用,如Consensus搜索符合条件的学术论文;ScholarAI可以访问开放获取的科学文献,特别是来自SpringerNature期刊的文献。此外,学生群体还可以使用CodeInterpreter进行数据分析,执行数学运算等。询问任何与语言相关的问题,可以帮助翻译、解释语法规则 假设每用户平均使用8次/天,未压缩的GPT-3.5/GPT-4在2500万DAU及高并发条件下分别需21.8/53.1万GPUs。计算GPT-3.5的算力时,我们的假设条件为用户平均请求次数为10次,但根据实际的用户使用情况,平均每个活跃用户每天发送7~8次请求。若每用户平均请求8次,GPT-3.5和GPT-4模型在2500万日活用户及高并发条件下分别需要21.8万、53.1万GPUs(27.2/10*8)。假设ChatGPT共有6000万DAU,每用户平均8次请求次数的条件下,压缩两次(*75%*75%)后的GPT-3.5/GPT-4全年整体算力成本约为37.9亿美元。如果GPT-3.5的成本大约下降两次25%,在6000万DAU,每用户平均8次请求次数的条件下,GPT-3.5整体算力成本约为35.5亿美元,GPT-4整体算力成本约为2.3亿美元,整体所需算力成本共约37.9亿美元。68789在Open在OpenAI的100亿美元资金的情况下,敏感性假设分析:如果在6000万DAU、付费率逐月提升0.25%的条件下,压缩两次后的GPT-3.5模型和GPT-4到2026年12月或许可以实现每月营收超过算力成本。根据Similarweb访问量数据,如果按压缩后的GPT-3.5模型,并以单价每张卡每小时1.4美元计算,2023年上半年OpenAI总算力成本大约可达到23.9亿美元。从2023年7月开始,若日活跃用户为6000万,以平均每用户使用8次,付费的GPT-4所占的比例为1.5%计算,压缩两次(*75%*75%)后的GPT-3.5和GPT-4模型每月整体的算力成本约为3.16亿美元。若OpenAI的月活付费率每月提高0.25%,OpenAI每月营收到2026年12月大约可以达到4.20亿美元/月,所需算力的成本为4.18美元/月,月营收超过成本,实现扭亏。 时间付费率OpenAI算力成本(亿美元/月)OpenAI营收(亿美元/月)2023年7月2023年8月2023年9月2023年10月2023年11月2023年12月2024年1月2024年2月2024年3月2024年4月2024年5月2024年6月2024年7月2024年8月2024年9月2024年10月2024年11月2024年12月2025年1月2025年2月2025年3月2025年4月2025年5月2025年6月2025年7月2025年8月2025年9月2025年10月2025年11月2025年12月2026年1月2026年2月2026年3月2026年4月2026年5月2026年6月2026年7月2026年8月2026年9月2026年10月2026年11月2026年12月在Open在OpenAI的100亿美元资金的情况下,敏感性假设分析:如果在6000万DAU、付费率逐月提升0.5%的条件下,压缩两次后的GPT-3.5模型和GPT-4总体可能在2025年4月转亏为盈。根据Similarweb访问量数据,如果按压缩后的GPT-3.5模型,单价每张卡每小时1.4美元,从2023年7月开始,如果按GPT-4Plus用户付费率约2%以及6000万日活跃用户计算,若OpenAI的月活付费率每月提高0.5%,OpenAI每月营收到2025年4月大约可以达到4.29亿美元/月,压缩两次(*75%*75%)后的GPT-3.5及GPT-4所需算力的成本为4.20美元/月,月营收超过成本,实现扭亏。但实际上其每月付费率的增长超过了0.5%,因此OpenAI的扭亏可能更早出现。 2023年7月2.00%3.160.692023年8月2.50%3.210.862023年9月3.00%3.261.032023年10月3.50%3.311.202023年11月4.00%3.361.372023年12月4.50%3.411.542024年1月5.00%3.461.712024年2月5.50%3.511.892024年3月6.00%3.562.062024年4月6.50%3.612.232024年5月7.00%3.662.402024年6月7.50%3.712.572024年7月8.00%3.762.742024年8月8.50%3.812.912024年9月9.00%3.863.092024年10月9.50%3.913.262024年11月10.00%3.953.432024年12月10.50%4.003.602025年1月11.00%4.053.772025年2月11.50%4.103.942025年3月12.00%4.154.112025年4月12.50%4.204.292025年5月13.00%4.254.46正在你身边二.二.OpenAI的读图:GPT4Vision1.ChatGPT多模态:从“灰度测试”到“全面放开” 9月25日,OpenAI宣布在ChatGPT中向部分会员推出新的“读图”和“语音”功能,ChatGPT多模态能力升级。为更好地吸引新用户进入,OpenAI并未将新功能全部面向用户推出,而是采用了分批开放的策略。 ·GPT4Vision:9月25日,OpenAI宣布推出名为GPT4Vision的多模态模型。OpenAI希望以“GPT4Vision”的名义更广泛地提供图像理解,将为GPT-4打开许多新的基于图像的应用程序,例如生成匹配图片的文本等。据外媒TheInformation爆料,在GPT-Vision之后,OpenAI可能会推出更加强大的多模态大模型,名为Gobi。与GPT-4不同的是,Gobi一开始就被设计为多模态。·AnyMAL:9月底,来自Meta的研究人员发布了关于AnyMAL的研究,这是一个经过训练的多模态编码器集合,可将来自各种模态(包括图像、视频、音频和IMU运动传感器数据)的数据转换到LLM的文本嵌入空间。·Gemini:据TheInformation,Gemini将于今年秋季正式发布。目前,谷歌已经对一些外部公司开放了多模态大模型Gemini的功能。Gemini由一组大型语言模型组成,可能使用MOE架构与投机采样(SpeculativeSampling)技术,通过小模型提前生成token传输至大模型进行评估,提高模型总推理速度。 ·OpenAI的开源视觉模型——CLIP:当前开源的版本是参数量相对较小的版本,ChatGPT4使用的版本参数量更大。2021年年初,OpenAl发布的CLIP模型(ContrastiveLanguage-lmagePre-training)的基础版本(也称为CLIP-ViT)包含了约4.9亿个参数。·Salesforce开源视觉模型——BLIP2:BLIP2由以下三个模型组成:图像编码器(ImageEncoderQ-Former和LLM,可通过利用预训练好的视觉模型imageEncoder和语言模型LLM来提升多模态效果和降低训练成本。·Meta开源视觉模型——Nougatmodel:可执行光学字符识别(OCR)任务,将科学文档处理成标记语言。Nougat用到了2个SwinTransformer,参数量分别为350M、250M。·谷歌开源视觉模型——Pix2Struct:一种imageencoder-textdecoder模型,针对各种任务(包括图像字幕和视觉问答)对图像文本对进行训练。主要训练的基于BERT-base初始化的Q-Former只有188M的参数量。模型名称模型介绍Q-former分两步进行预训练。第一步主要从冻结的视觉编码器中进行视觉-语言表示学习,Nougat是一个标准的Encoder-Decoder框架下的Transformer架构,允许端到端的训础Pix2Struct用于纯视觉语言理解,可以在包含任何视觉语言的任务上进行4.开源多模态模型案例:以阿里mPLUG- 1.模型结构:视觉模块采用CLIPViT-L/14(openai开源),语言模块采用LLaMA。2.模型训练:·视觉和语言模态间的对齐:冻住LLM的参数,采用LAION-400M,COYO-700M,CC以及MSCOCO训练视觉基础模块和视觉摘要模块。·指令微调:冻住视觉基础模块、视觉摘要模块和原始LLM的参数,参考LoRA,只在LLM引入少量参数的adapter结构用于指令微调。 多模态ChatGPT结合了文本和其他模态(如图像、音频、视频等)的处理能力,可以应用于各种场景,如办公场景、教育场景、医疗诊断场景等,为用户提供更丰富、智能和个性化的对话和交互体验。例如,ChatGPT可以初步分析患者的病情,提高医生的诊疗效率。此外,ChatGPT还可以通过图像分析和处理,帮助视障人士理解周围环境。题ChatGPT可以对手绘资料进行识别处理,自动绘制电子 实测评价:可以较准确地识别图片中发动机的组成部件。 实测评价:可以较为准确地识别化学反映路径图中的元素和具体路径。 实测评价:可以准确地将手绘表格整理为电子表格。 实测评价:对X光片的认知较为准确,可以识别出智齿存在发育问题。ChatGPT虽对医学问题的问答存在回避现象,但实际已具备初步诊疗的能力。 实测评价:可以准确地识别图片中的物体并对当前地点做出判断。 实测评价:可以准确地识别图片中的物体和颜色28正在你身边三.三.OpenAI的画图:DALL·E3或将抢夺MJ付费用户 DALL·E系列是由OpenAI开发的一系列基于大型语言模型的文本到图像生成系统。根据OpenAI的描述,DALL·E3是在ChatGPT上原生构建的,它可以让ChatGPT用作集思广益的合作伙伴和提示的细化。相比于Midjourney,融合ChatGPT超级大脑的DALL·E3,降低了提示词门槛,可以根据简单的句子或详细的段落生成相关图片。DALL·E3目前可以在ChatGPT4的网页端和移动端使用。 按照6小时/天的工作时间计算,订阅费用为20美元/月的DALL·E3同Midjourney的订阅费用为120美元的大型计划每月所允许生成的图片组数相近。收费模式:目前,Midjourney有四种订阅模式(每个月10/30/60/120美元),DALL·E3是为ChatGPTPlus用户推出的功能,其收费即为Plus订阅收费标准20美元/月。使用限制:Midjourney的标准计划、专业计划和大型计划会提供无限的Relax模式时间,Fast模式会有相应的限额(每个月3.3/15/30/60小时),深度用户在Fast模式下平均每天使用2小时,大约可以生成80-90组图片;若DALL·E3按照GPT-4每3小时使用50次的限制,每天六小时可生成100组图片。√√待待3个并发Relax作业3个并发Relax作业 根据Midjourney用户使用时间采样数据,Midjourney平均使用Relax模式约41分钟,Fast模式平均使用约84分钟,平均每天生成56组图片。DALL·E3若按GPT-4每3小时使用50次的限制,则每天三小时可生成50组图片,略低于Midjourney的使用。模式00000000000000000080.060.040.0 评测结果:DALL·E3对“过马路”这一动作的理解更为到位。提示词:一张从侧面拍摄的图片,在一个阳光明媚的日子里,一个穿着红色连衣裙、扎着辫子的女孩帮助一位白发老人穿过繁忙的十字路口。 评测结果:DALL·E3对“到处”的理解更为到位。提示词:到处都是机器人的未来世界。 评测结果:DALL·E3对于“发射”的理解更为到位。提示词:一枚现代火箭从海底深处发射,周围环绕着生机勃勃的海洋生物;从海底俯瞰火箭冲破水面;耀眼的烟花和水面上反射的亮色为盛大的庆祝活动增添了欢乐的气氛。 评测结果:DALL·E3对于“打开”这一动作的动感表现更强。有一个神秘的发光装置。 评测结果:DALL·E3对于“蓝色”的理解更为到位。提示词:在一个舒适的厨房里,挂钩上挂着锅碗瓢盆,架子上摆满了食材,还有一个散发着蓝色火焰的炉子,一 评测结果:丰富完善的prompt下,Midjourney与DALL·E3的表现均较为准确。38正在你身边四.语音多模态:扩大用户群体四.语音多模态:扩大用户群体 新增语音功能进一步降低了使用门槛,有助于ChatGPT进一步扩大用户群体。新功能推出后,用户可以直接通过语音与ChatGPT进行交流,用户无需再具备打字能力。据第52次《中国互联网络发展状况统计报告》,截至2023年6月,使用手机上网的用户群体高达99.8%,而使用台式电脑、笔记本电脑上网的用户群体仅为34.4%和32.4%。PC设备要求用户具备打字能力,使用门槛较手机高,而ChatGPT的语音功能仅需用户会说话即可,进一步提升了功能的渗透潜力。 ChatGPT实现与用户使用语音进行实时交互,或将重塑一对一辅导教育。语音多模态推出后,用户只需轻触按钮,用语音提问问题,ChatGPT将自动生成回答,并将回答转换为语音播放给用户。这一交互方式更加自然和便捷,使得用户可以像与人对话一样与AI进行交流,从而享受定制化、个性化的学习体验。ChatGPT新增语音功能可以为用户提供一对一的口语交流,帮助用户进行语言学习。41正在你身边五.多模态五.多模态API:11月6日OpenAI开发者大会前瞻 1、多模态API:11月6日首届开发者大会上,OpenAI或将推出年度重磅更新——视觉多模态API。2、多模态应用场景:据量子位公众号整理,在YCAlumniReunion2023上,奥特曼表示看好AI在医学、教育上的赋能——AI医学顾问以及AI个性化一对一辅导。这两者社会价值都十分巨大。此外,OpenAI正在筹建OpenAI学院,预计2023年底启动。它有可能是人人可访问的免费在线教学系统,老师能与GPT-5来互动,在课程期间接收反馈和指导。GPT-4化身AI学习助手,既可以作为学生的虚拟导师,又可以作为教师的课件助手。2.中小开发者:PythonOpenAI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年社区护理学考前冲刺练习题库【综合题】附答案详解
- 2026年智慧树答案【病理学】智慧树网课章节通关练习试题及参考答案详解(综合题)
- 2026年环境影响评价工程师之环评法律法规每日一练及参考答案详解(能力提升)
- (2026年)甲状腺进修汇报课件
- 康复护理延伸中的技术创新与应用
- 生物质嵌入改性聚氨酯泡沫:吸附性能与应用潜力的深度剖析
- 生物质低温液化技术与染料吸附树脂制备的协同创新研究
- 2026贵州安顺市消防救援支队招聘政府专职消防员13人备考题库(第二批)及一套参考答案详解
- 生物炭:解锁松嫩平原苏打盐碱地改良密码
- (2026年)抢救车管理PDCA案例汇报课件
- 体育与健康如何设计与开展跨学科主题学习活动以“我的运动画像为例”P义务教育课程方案和课程标准国家级示范培训课件
- 三十六计完整版本
- 电力服务收费标准附表
- 中药黄芪课件
- 深远海智能养殖装备平台
- 骨折病人的院前急救
- svw cpc验收srb311电气movifit sc操作手册
- 中大国际九号
- GB/T 14413-1993船用舷窗
- GB/T 14048.7-2016低压开关设备和控制设备第7-1部分:辅助器件铜导体的接线端子排
- 2022~2023血站上岗证考试题库及答案参考85
评论
0/150
提交评论