版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
——AI跟踪报告之九3月29日GPTChatGPT级GPT本能力升级;GPT深度学习堆栈,开源Evals评估框架。Copilot:AI商业化里程碑AIPowerPlatformCopilotGPTAIpowered,让制作者可以用自然语言描述他们想百度:发布文心一言大模型,性能强大、功能丰富,为垂类应用落地提供强大支持;含上千个各种场景下的AI算子和预训练模型。边缘算力:翱捷科技、晶晨股份、瑞芯微、全志科技等;模型/算法/数据:建议关注三六零(A股唯一自研大模型)、商汤科技(神经网络)等;风险提示:ChatGPT信息泄露风险、虚假信息法律风险,行业研发不及预期风险。目录Copilot:AI商业化里程碑缘算力、模型/算法/数据、应用三个维度持复杂性问题解决,可靠性与安全性显著提升生成文本输出(自然语言、代码等)。图1:GPT-4能够发现图片中的异常图2:GPT-4发现鸡块的排列与世界地图的联系图3:GPT-4能够解释论文内容资料来源:OpenAI官网,光大证券研究所整理资料来源:OpenAI官网,光大证券研究所整理5资料来源:OpenAI官网,光大证券研究所整理在标准学术视觉基准测试中,GPT-4性能优于其它模型。OpenAI在一组标准学术视觉基准测试中对GPT-4的表现进行评估,结果,GPT-4在TextVQA、图表质量管理、AI2D等方面都显著优于其他模型。此外,OpenAI表示,这并不完全代表GPT-4的能力范围,因为该模型被发现能够不断解决新任务,公司计划近期发布更多分析和评估数据。图4:GPT-4在文本、图片处理方面与SOTA等模型的对比资料来源:OpenAI官网,光大证券研究所整理注:OpenAI以机器学习模型设计的传统基准评估了GPT-4,结果显著优于现有大模型6677文本能力方面,GPT-4的表现显著优于现有大型语言模型。GPT-4能够处理超过2.5万字的文本,允许长篇内容创建、扩展对话以及文档搜索和分析等应用场景。OpenAI在为机器学习模型设计的传统基准测试(包括MMLU、HellaSwag、ARC等)中比较GPT-4与GPT-3.5、SOTA等模型的性能。结果表明,GPT-4在基准测试中的表现显著优于现有大型语言模型,并且在大部分的测试中优于最先进的SOTA模型。图5:GPT-4在基准测试中的表现显著优于现有大型语言模型资料来源:OpenAI官网,光大证券研究所整理注:OpenAI以机器学习模型设计的传统基准评估了GPT-4,结果显著优于现有大模型资料资料来源:OpenAI官网,光大证券研究所整理MMLU基准(MultilingualMulti-LevelUnification,是一种新的基准测试,旨在评估多语言NLP模型的性能)常用于测试大规模多任务语言理解能力,涵盖自然科学、通常使用英文编写。OpenAI使用AzureTranslate将MMLU基准翻译成多种语言,并将GPT-4与其他语言模型应用测GPT-4在包括拉脱维亚语、威尔士语和斯瓦希里语等多种小众语言上的表现,均优于言模型的英语表现。图6:GPT-4在MMLU基准测试中表现优于GPT-3.5、Chinchilla、PaLM等语言模型资料来源:OpenAI官网,光大证券研究所整理899GPT-4在人类模拟考试中的表现超越GPT-3.5。在没有专Quantitative等测试中的得分基本全部高于GPT-3.5。数在应试者的前10%左右,显著优于GPT-3.5倒数10%左右的得分。图7:GPT-4与GPT-3.5在各项考试中表现情况对比资料来源:OpenAI官网,光大证券研究所整理GPT-4在语言风格方面得到更新。与具有固定冗长语气和风格的经典ChatGPT不同,开发人员(普通用户也将会开放)可以AI有“自定义”的功能。GPT-4拥有自定义语言风格的功能资料来源:OpenAI官网,光大证券研究所整理GPT-4在可靠性与安全性方面实现最好结果。OpenAI表示,在6个月的时间内通过对抗性测试程序和ChatGPT经验教训迭代调整GPT-4,在可靠性、真实性、可控性以及拒绝越界和敏感问题方面获得有史以来最好结果。相较GPT-3.5,GPT-4对禁止内容作出响应的可能性下降82%,生成可靠性内容的可能性提高40%。然而,OpenAI仍然提示GPT-4在偏见、隐私和虚假信息等方面的风险。为此,OpenAI纳入更多人工反馈(包含ChatGPT用户),并与50多位专家合作,在技术发展的同时提高AI的安全性。图9:GPT-4响应不正确行为和敏感信息的可能性更低资料来源:OpenAI官网,光大证券研究所整理资料来源:OpenAI官网,光大证券研究所整理构建可预测的深度学习堆栈是GPT-4项目的重点之一。OpenAI开发基础设施和优化算法,能在多个模型中表现出可预测行为。为验证可预测性,OpenAI通过对使用相同训练方法但计算量少10000倍的模型进行推断,在内部代码库中准确预测GPT-4的最终损失。能。使用Evals指导模型开发,方便用户将其应用于跟踪模型版本的性能和不断发展的产品集成。比如,Stripe使用Evals来PTOpenAI认为,准确预测未来的机器学习能力是安全性的重要组成部分。但相较于潜在影响而言,其并没有得到足够的重视。OpenAI正加大开发力度,为社会提供更好的未来系统预期指导。OpenAI词预测资料来源:OpenAI官网,光大证券研究所整理图12:GPT-4扭转了逆向缩放(模型性能随规模扩大而下降)趋势资料来源:OpenAI官网,光大证券研究所整理目录缘算力、模型/算法/数据、应用三个维度osoftCopilotopilot赋能销售人员随时快速响应。助力客服人员时刻对答如流。升级市场营销体验,轻松找到目标受众。助力电商营销提效,智能生成个性化内容。提升供应链敏捷性,将风险降到最低。资料来源:百度tDynamicsCopilot力客服人员时刻对答如流。在Dynamics365CustomerService中,能够针对聊天对话和电子邮件中的问资料来源:微软官方公众号资料来源:微软官方公众号arketingotaDynamicsCustomerInsightsCopilot准确定位特定客户群体。图16:Dynamics365CustomerInsights资料来源:微软官方公众号icsMarketing资料来源:微软官方公众号介。使用Shopify的BusinessCentral用户可以将其产品和简介快捷发布到Shopify平SupplyChainCenterCopilot记可能影响关键供应链流程的外部问题,筛选出受影响的订单。并自动生成电子邮件向图18:Dynamics365BusinessCentral资料来源:微软官方公众号图19:MicrosoftSupplyChainCenter资料来源:微软官方公众号CopilotGPT建到Microsoft365。在AI过各个otinWord2.CopilotinPowerPoint能够在创作过程中,通过自然语言命3.CopilotinExcel能够帮助用户释放洞察、识别趋势,在短4.CopilotinOutlook能够帮助用户整合并管理收件箱。CopilotinTeams能够直接从对话上下文中提供实时摘要和6.BusinessChat汇集了来自文档、演示文稿、电子邮件、日键日期,根据其他项目文件制定计0:Microsoft365Copilot系统资料来源:微软t资料来源:微软官方公众号图22:通过CopilotinWord快速起草报告资料来源:微软官方公众号图23:CopilotinExcel图24:借助CopilotinExcel将基础数据转化为深度洞察资料来源:微软官方公众号资料来源:微软官方公众号的提示或大纲开始一个新的演示。可以便捷的浓缩冗长的演示文稿,并使用自然语言命令来调整布局、重新编资料来源:微软官方公众号图26:使用简单描述让CopilotinPowerPoint生成PPT资料来源:微软官方公众号。资料来源:微软官方公众号图28:利用CopilotinOutlook快速回复邮件资料来源:微软官方公众号资料来源:微软官方公众号图30:通过CopilotinTeams聚焦会议要点资料来源:微软官方公众号汇集起来,总结聊天内容、攥写电子邮件、查找关键日期,甚至根据其他项目文件制定计资料来源:微软官方公众号图32:在CopilotinTeams中开展智能对话资料来源:微软官方公众号PowerPlatformCopilot未来前景打开werAutomateGPTAIpowered (1)PowerAppsCopilot可以让制作者可以通过自然语言对话的方式来描述并且直接生成想要的应用程序,可以通过和Copilot的对话 (2)通过PowerAutomateCopilot,可以通过自然语言来生成比以前更复杂的流程,Copilot还可以以对话的方式不断优化和迭代更新 (3)通过PowerVirtualAgentsCopilot,可以直接使用自然语言来描述机器人流程,无需手动一个一个进行创建。资料来源:微软官方公众号资料来源:微软官方公众号irtualAgentsCopilot资料来源:微软官方公众号目录缘算力、模型/算法/数据、应用三个维度搜索AIGC媒体金融教育医疗…NLP大模型CV大模型跨模态大模型生物计算大模型行业大模型搜索AIGC媒体金融教育医疗…NLP大模型CV大模型跨模态大模型生物计算大模型行业大模型I飞桨平台,形成几大模型体系,配套大模型平台支持模型的广泛应用,建设了大模型为核心驱动的新产品和源:百度,光大证券研究所模文心NLP大模型性能强大、功能丰富,为垂类应用落地提供强大支持。其中,文心一言(生成式AI产品)是基于产业级知表1:百度文心NLP模型级场景取得效果SOTA学文献学科分类、新闻分型共计45个自然语言理解数据集上取得了答、语义检索、情感分匹配、文本纠错等各类自然务00亿文本分类、语义相似度计算等60多项任务本解析等ERNIE知识增强,显本/小样本学习能力答、语义检索、情感分匹配、文本纠错等各类自然务源:文心大模型官网,光大证券研究所NPUSporeMindSpore官网海康威视AI开放平台为碎片化的行业应用场景提供了一站式算法训练平台,具备基于小样本数据训练高精度算法的能力。AI开过样本数据采集、线上数据标注、线上算法训练的过程,即可获得有针对性的智能算法,随之可部署到海源:海康威视公告平台。拖曳即可构建算法方案,实现数据驱动的算法自动优化迭代和一键式交付,大幅降低使用门源:大华股份公告目录缘算力、模型/算法/数据、应用三个维度投资建议:从三大层面关注AI软硬件投资机会唯一自研大模型)、商汤科技(神经网络)、云从科技(神经网络)、格灵深瞳(神经网络)、科大讯飞(神经网络&NLP)、拓尔思 (NLP)、海天瑞声(数据标注)。云端算力:(1)AI芯片:寒武纪(A股AI算力芯片龙头);(2)GPU:景嘉微、海光信息、芯原股份(IP);(3)CPU:龙芯中科、科技、博创科技、源杰科技、中际旭创等;(6)CHIPLET:兴森科技、长川科技、方邦股份、华正新材、通富微电、长电科技等。边缘算力:(1)SoC:翱捷科技、晶晨股份、富瀚微、瑞芯微、全志科技、中科蓝讯、炬芯科技等;(2)AIoT:乐鑫科技、恒玄科技等;(3)RISC-V:中科蓝讯、乐鑫科技、全志科技等。服务器:工业富联、浪潮信息、中科曙光、神州数码。网络;AIGC技术提高生产效率,降低生产成本,利好下游垂类应用企业,建议关注鸿合科技(教育)、万兴科技(图像);AI趋势,建议关注:创维数字、晶晨股份。图40:行业重点上市公司盈利预测与估值图40:行业重点上市公司盈利预测与估值(续)图40:行业重点上市公司盈利预测与估值(续)目录tGPT缘算力、模型/算法/数据、应用三个维度GPTGPT不及预期风险,独立、客观人观点。研究人员获取报酬的评判因素包括研究的质量和准确性、客户反馈、竞争性因素以及光大证券股份有限公司的整体收益。所有研究人员保证他们报酬的任何一部分不曾与,不与,也将不会与本报告中具体的推荐意见或观点有直接或间接的联系。业及公司评级体系tCtS-tC个月的投资收益率领先市场基准指数S%至tS%;9-tC个月的投资收益率落后市场基准指数S%至tS%;tS明光大证券股份有限公司(以下简称“本公司”)创建于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课件的正确使用
- 2026年跨境农产品出海项目营销方案
- 智能化手术室设备配置优化
- 移动医疗设备互联互通
- 医疗健康信息标准与互操作性
- 主任讲解儿科急救处理流程
- 柴油电控线下培训课件
- 医疗信息化建设与数据分析
- 移动医疗咨询服务平台
- 板厂安全生产培训内容课件
- 高二化学上学期期末试题带答案解析
- 高标准农田建设培训课件
- 解答题 概率与统计(专项训练12大题型+高分必刷)(原卷版)2026年高考数学一轮复习讲练测
- 2024-2025学年北京市海淀区第二十中学高二上学期期末物理试题(含答案)
- 金属加工工艺规划
- 送你一朵小红花评语
- 临床成人吞咽障碍患者口服给药护理
- (16)普通高中体育与健康课程标准日常修订版(2017年版2025年修订)
- 2025至2030中国IT培训行业项目调研及市场前景预测评估报告
- 多联机空调安装施工方案
- 菏泽在线食品安全培训课件
评论
0/150
提交评论