信息技术-计算机行业行业深度报告:AI Agent投资框架:算力需求测算与应用趋势展望_第1页
信息技术-计算机行业行业深度报告:AI Agent投资框架:算力需求测算与应用趋势展望_第2页
信息技术-计算机行业行业深度报告:AI Agent投资框架:算力需求测算与应用趋势展望_第3页
信息技术-计算机行业行业深度报告:AI Agent投资框架:算力需求测算与应用趋势展望_第4页
信息技术-计算机行业行业深度报告:AI Agent投资框架:算力需求测算与应用趋势展望_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国银河证券|CGSSIMULATION行业深度报告·行业深度报告·计算机行业AIAgent投资框架:算力需求测算与应用趋势展望●海外推理算力供需剪刀差将不断扩大。我们在6月24日发布的2025年中期策略报告里测算了未来3年海外AIAgent应用每日消耗的算力总量,测算思路主要是每日Agent应用算力消耗=每日Agent需求总token数*单token消耗算力。根据测算,推理算力需求总量2026-2028年的增速分别达到8倍、3.5倍、2.5倍。而英伟达将于2026下半年推出的VeraRubinNVL144,性能是GB300NVL72的3.3倍;下一代的RubinUltraNVL576将于2027年下半年推出,性能是GB300NVL72的14倍。AI芯片性能的进化无法●海外AI算力与应用实现正向循环,国内AI应用整体月活量增长弱于海外,豆包相对优势较为突出。根据全球AIWeb产品月活数据,海外整体活跃度较国内更高,截至今年5月,海外前20名产品合计月活量呈现逐月增长的趋势(月增速约4%),而国内合计月活量环比下降比较明显,豆包增长较为突出。截至今年5月,豆包大模型日均tokens使用量超过16.4万亿,同时火山引擎占据国内公有云上大模型调用量46.4%的市场份额,位列第一。在海外AI应用月活量呈现逐月增长的趋势算力与应用实现正向循环,驱动北美四大云厂商2025年资本开支积极指引。●AIAgent的商业模式正从“提供工具”向“交付价值”转变,SAAS企业有望迎来价值重估的机会。生产力智能体以提升效率为核心,除了通用型同于生产力智能体,企业级智能体的参与者更大比例是原有深耕垂直领域的Agent时会重点考虑投资回报率(ROI),结链、法律/政务、医疗/教育。的相关公司;2、字节在AI应用生态领域已构建起相对优势,建议关注字节型卡位公司的投资机会相对提升,建议关注在AIAgent方面布局领先的垂万兴科技;2)企业Agent:第四范式、汉得信息、金蝶国际、致远互联、泛微网络、用友网络;3)金融Agent:税友股份、恒生电子、同花顺、财富趋势、金证股份、京北方、长亮科技、宇信科技;4)工业Agent:道通科技、鼎捷数智、能科科技、赛意信息;5)办公Agent:金山办公、彩讯股份;6)医疗Agent:卫宁健康、东软集团、嘉和美康;7)能源Agent:国能日新、朗新集团。●风险提示:技术研发进度不及预期风险;供应链风险;消费需求不及预期风险;行业竞争加剧风险。计算机行业推荐维持评级相对沪深300表现图2025-7-62请务必阅读正文最后的中国银河证券股份有限公司免责声233中国银河证券中国银河证券行业深度报告·计算机行业目录 4二、AIAgent技术范式革命 7 7(二)环境感知:从文本到多模态融 8 (四)工具使用:从API调用到交互协作 (五)记忆能力:从短期缓存到长期记忆增强 三、全球AI大模型动态更新:功能与趋势 11 (一)AIAgent正从“提供工具”向“交付价值”转变 (二)AI智能体开发平台:大厂逐步构建各自的AIAgent生态 (三)生产力智能体:通用型和AI工具类增长最快 (四)企业级智能体:SAAS服务商迎来弯道超车机遇 五、产业链投资机会 17六、风险提示 19行业深度报告·行业深度报告·计算机行业一、AIAgent推理算力供需剪刀差测算我们在6月24日发布的2025年中期策略报告里测算了未来3年海外AIAgent应用每日消我们根据以下假设来测算,未来3年海外AIAgent应用每日消耗的算力总量。(1)假设目前全球AIAgent日活人数与AIWeb总日活人数相当,即2025年AIAgent全球(不含中国)渗透率约为7%。我们预期2026-2028年渗透率分别为11%、14%、16%。根据非凡产研统计的全球AIWeb产品月活数据,海外整体AIWeb产品活跃度较国内更高,2025年5月前20名海外产品合计月活量约为8.47亿,国内约为1.05亿;海外合计月活量呈现逐月增长的趋势(月增速4%左右),而国内合计月活量环比下降比较明显(5月环比4月仍下降约考虑到AIWeb日常使用率较高,我们假设DAU(日活)/MAU(月活)=38%,则AIAgent全球(不含中国)日活人数约为3.25亿。若按照2026-2028年渗透率分别为11%、14%、16%计算,则AIAgent全球(不含中国)日活人数分别为5.24亿、6.84亿、8.00亿。23国内4567m89出海内容检测931国内资料来源:非凡产研,中国银河证券研究院图2:2025年5月中国AIWeb产品月活数据6腾讯元宝个人助理yuanbao.tenc13即梦AI图片生成1420问小白智慧搜索965.7544请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告·行业深度报告·计算机行业图3:2025年5月全球AIAPP产品月活数据123-0.13%-0.13%4国内5MicrosoftEdge:AIBrows6国内78国内9CharacterAI:Chat,Talk国内TalkieAI:ChatWithCharaChaton-AIChatBotAssi-2.12%-2.12%Genius:AIArtPhotoEd-28.15%B612AIPhoto&VideoEdi图片增强UpFoto-AIPhotoEnhanChatbotAI-AIWritingfoRemini-AIPhotoEnh图4:2025年5月中国AIAPP产品月活数据2百度A搜索34-0.15%5美图公司6美图公司789录4.17%美图公司即梦AI图片生成即梦AI-即刻造梦资资(2)假设每个日活用户2025年每日仅使用1次AIAgent应用,2026-2028年分别增加到2、3、4次(场景增加);且随着应用深度的增加,单次使用AIAgent产生的请求次数也会增加,假设2025-2028年分别为50、80、100、120次。AI系统,那么每一次自主规划或API调用都对应着一次对模型的请求,每循环一次至少对应着10次请求,若一个任务拆解为5次循环,则至少需要请求50次。未来MCP的成熟应用有望使循环次Agento5请务必阅读正文最后的中国银河证券股份有限公司免责声56请务必阅读正文最后的中国银河证券股份有限公司免责声明。6(3)假设每一次请求需要的token数,2025-2028年分别为2000、2500、3000、3500。目前主流AI智能体完成一个简单的任务(比如制作一张数据图表)大约消耗10万token,比较复杂的任务(比如制作一个Web应用)能达到消耗90万token以上。我们假设2025年平均使用一次AIAgent应用消耗10万token,对应50次请求,则单次请求比如一张512*512像素的图片对应约334tokens,Kimi的Vision模型实行按量计费方式,单张(4)假设目前平均单token消耗算力约为8TFLOPs,随着模型参数量以及多模态数据量的增加,单token消耗算力有望逐年增长,我们假设2025-2028年平均单token消耗算力分别为我们基于通义千问2多模态代表模型Qwen2-VL-2B-Instruct的官方测试结果来推算单token消耗算力,推理速度测试基于NVIDIAA10080GB,测试了生成2048个token时,输入长度分别模型在公有云和私有化部署下的值也区别很大。我们可以参考OpenAI的毛利率认为其成本主要是推理计算消耗的算力,根据财务文件,OpenAI预计其2025年毛利率能达到49%。那么我们根据OpenAI目前token收费就能计算出单token消耗算力值。参考H200租赁价格约3美元/小时,H200在BF16下的算力为1979TFLOPs,那么3美元相当于能买到720万TFLOPs。截至2025年6月的最新价格,价格处于中位的GPT-40输出价格为15美元/百万token,毛利率49%对应算力成本约7.5美元/百万token,计算出单token消耗算力达到18TFLOPs。对于多模态模型而言,多模态数据使得token数急剧增加,单token消耗算力也会相应增长。比如OpenAI在4月发布的图像生成模型GPT-image-1,在价格方面,GPT-image-1按token定价,图像定价是文本的8倍:文本输入token(提示文本):每100万token5美元;图像输入token(输入图像):每100万token10美元;图像输出token(生成的图像):每100万token40美元。AWQGPU数量11111号关单蹒度厚点咳C(CUDACore)NVLink40张量还算核TensorCore)光E息端核心(ETCore)10请务必阅读正文最后的中国银河证券股份有限公司免责声明。(5)基于以上假设,我们计算出未来3年全球(不含中国)AIAgent应用每日消耗的推理算力总量,2026-2028年的增速分别达到8倍、3.5倍、2.5倍。在40%的算力利用率下,对应2025年H200的需求量为380.54万块,2026年B200的需求量为1347.87万块。AI芯片性能的进化全球互联网用户(单位亿,不含中国)Agent日活人数(单位亿)1234每日请求总数(单位亿)总token数(单位亿)单token消耗算力(TFLOPs)8H200需求(万块)单块B200在BF16下的24h算力(PFLOPs)B200需求(万块)资料来源:中国银河证券研究院二、AIAgent技术范式革命AutoGLM。Anthropic于2024年10月23日发布了Claude3.5Sonnet模型,得益于Anthropic推出的API,Claude可以感知并与计算机界8请务必阅读正文最后的中国银河证券股份有限公司免责声明。8击屏幕以及通过虚拟键盘输入信息。智谱同样于2024年10月推出了AutoGLM,聚焦于设备操控能力,支持通过工具调用完成具体任务(如操作手机、电脑等),能理解屏幕信息、规划任务、自如果说2024年的AIAgent像是一个操控工具,那么经历了2025年至今的技术演进,AIAgent已经从“被动工具”迈向“自主决策体”,并且智能体从个体走向协作,AIAgen台出现,AIAgent应用逐渐形成生态。2025年AIAgent的技术演进主要可以从以下四个方面来表2:2025年AIAgent的主要技术演进工具使用从API调用到交互协作(视觉交互与协议标准化MCP与A2A)从短期缓存到长期记忆增强(RAG向量数据库与MemGPT)资料来源:中国银河证券研究院Anthropic于2025年5月发布ClaudeOpus4和ClaudeSonnet4,再次将代码、高级推理杂图文信息、支持多图对比和图像驱动的工具调用,为AIAgent提Manus是中国初创公司Monica于2025年3月发布的通用型AI智能体。Manus的核心能力是基于多模态感知做“真实世界任务”,可以批量读图、提取表格、拍图识别文件结构从而自动生成幻灯片、代码、项目说明等,实现了图文交互,是字节跳动2025年通过AgentTARS、BAGEL多模态模型、Seed系列等模型体现出强环境理解+工具控制+多模态融合的综合实力。AgentTARS从文本语言模型到视觉语言融合感知,在GUI中执行真实操作;BAGEL多模态模型具有统一感知2024年:基于思维链(CoT)和思维树(ToT)的提示词工程,依赖人工设计流程。比如CoT使用线性分步骤推理,应用于数学题、逻辑判断、代码生成等场景,依然依赖于人类提前设定结构主执行任务拆解、重试、选择路径、调用工具的能力;Anthropic推出的ClaudeOpus4在编码和复杂问题的解决方面表现出色,能独立运行长达七小时,具有长期任务规划能力,ExtendedThinking是一种增强的推理能力,使模型回答前更好的分解问题、规划解决方案并寻找不同的解决方法;Manus采用多智能体架构,能够自动完成复杂任务,例如研究、执行、交付结构化结果;字节跳动AgentTARS能够通过自然语言与计算机图形用户界面交互,实现文件管理、浏览器导航等自动化,UI-TARS-1.5是视觉语言模型,能有效执行多种任务增强模型推理和适应能力。Softwareengineer图10:ClaudeOpus4测试碾压OpenAI最强推理模型o3-一-tt99行业深度报告行业深度报告·计算机行业2024年:API调用阶段。早期模型比如Claude次智能处理一个工具调用,缺乏任务拆解和工具序列执行的能力。这个阶段的交互是单向的,并不具备持续控制、反馈处理或多工具协同能力。2025年:视觉交互与协议标准化(MCP与A2A)。工具调用体系在2025年迎来关键转折一首先,视觉交互能力的提升让AI能理解内容并进行自动化操作,比如Anthropic的BrowserUse,开源网页自动化接口,无需调用预定义API,个工具API也有独特的数据结构,开发者需要为每个组合编写定制化连接代码。MCP(ModelContextProtocol),简称模型上下文协议,是Anthropic公司于2024年11月推出的开放标准协议,让各种不同的大型语言模型能够无缝地与各种外部数据源和工具(如业务软件、数据库、代码库等)进行交互操作。开发者只需按MCP标准开发一次接口,即可被多个模型调用。OpenAI、A2A(Agent2Agent)协议是谷歌于2025年4月推出,作为AI智能体间的“通用语言”,允51资料来源:腾讯研究院,中国银河证券研究院●Agent2米资料来源:谷歌,中国银河证券研究院OpenAI的AgentSDK使得开发以标准方式构建、测试、发布AIA用,强调工具的模块化。AIAge2024年:短期记忆优化。通过扩展上下文窗口(如GPT-4支持128KTokens)提升对话连请务必阅读正文最后的中国银河证券股份有限公司免责声明。请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告行业深度报告·计算机行业可以在不分拆摘要的情况下一次性处理长文档、财报等。但对话结束后就“失忆”,无法做到跨会话记忆,并且为被动式记忆,记忆内容需人工重新附加到Prompt,模型无法记住用户的个性化偏忆”的跃迁,AI不再仅依赖于上下文窗口,具备跨会话、跨任务的持续记忆能力。RAG(检索增强生成)就是通过检索获取相关的知识并将其融入Prompt,让大模型能够参考相应的知识从而给出合理回答;因此,可以将RAG的核心理解为“检索+生成”,向量数据库用来存放向量化之后的知MemGPT(Memory-GPT)由伯克利大学的研究团队开发,被誉为最专业的LL架。该技术灵感来源于传统操作系统中的分层内存系统,通过快速内存和慢速内存之间的数据移动提供较大内存资源的可能。MemGPT也是一个智能管理不同可以分析远超底层LLM上下文窗口的大型文档,并且可以创建会话代理,通过与用户的长期交互OpenAI为GPT-40引入MemoryAPI,使模型能够记住个性向量数据库json.img数据检索数据准备inMemGPT,afixed-contexfunchonsthatalowittomanagetparsestheLLMtextouputsateachprocessingcycle,andeithefunchioncal,tcanrequestinmedlaeretumofexyield,theLLMwinotberunagainunithenextextemaleventtrigger( scheduledinternupfl.从全球AI大模型2024年12月至2025年5月的流量趋势来看,不同功能的大模型流量分化较为明显。AI工具类模型的总流量增速经历了先抑后扬的走势,2025年3月以来的同比增速保持在20%以上;其中通用类、编程类大模型流量增速最快,2025年3月以来的同比增速分别保持在请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告行业深度报告·计算机行业25%、75%以上。近一个月流量同比下降比较明显的领域依次为法律、客服、写作、图片生成。■■■■■■■■■■■Allother资料来源:similarweb,中国银河证券研究院资料来源:similarweb,中国银河证券研究院通用类大模型里,2025年3月以来的流量同比增速表现较好的依次为Grok、Google、Meta;流量在2025年初经历了爆发式增长,但近一个月同比下降;Huggingface和Poe近一个月流量也图17:通用类大模型的流量趋势(2024.12-20图17:通用类大模型的流量趋势(2024.12-2025.5)Depsek211%223%1013%3029%7694%%资料来源:similarweb,中国银河证券研究院图18:通用类大模型的流量份额(2024.12-2025.5)资料来源:similarweb,中国银河证券研究院四、AIAgent商业模式变革2024Q4,我们认为AIAgent模型有望推动APP生态逐渐向模型生态转变,AIAgent应用有望取代APP的地位;2025年至今,我们已经看到多个拥有头部模型的大厂也推出了AI智能体开发平台,正在逐步构建起各自的AIAgent生态。请务必阅读正文最后的中国银河证券股份有限公司免责声明。伴随着AIAgent从“被动工具”迈向“自主决策体”,并且从个体走向协作,AIAgent的商业模式也将发生变革,AIAgent应用的竞争点正从“提供工具”向“交付价值”转变。能真正提升下游企业利润的AIAgent应用将会胜出,从这个角度来说,对应垂直行业knowhow型卡位公司的投资机会相对提升,能融入智能体能力的SAAS企业有望迎来价值重估的机会。通用智熊体智能体开发平台文心智能体平台腾讯元器KUNLUN滴普科技KortixAl4gen1Buder生产力智能体文心快码创作智能体企业级智能体致远互联企业级智能体致远互联焦点科技卓世科技紫鼠云(二)AI智能体开发平台:大厂逐步构建各自的AIAgent生态AI智能体开发平台具有汇聚流量的优势,如果在上面的Agent应用丰富起来,构建起AIAgent生态,则有望成为AI时代的“安卓”圈,因此平台的开放性和模型技术优势也是关键驱动力。字节跳动发布“Coze”,以零代码方式构建多模态、可记忆的智能体,应用于内容创作、教育辅导等场景,提升营销效率,也可辅助教学;阿里推出“百炼平台”,支持从模型调用到插件集成的全流程智能体开发,应用于电商服务助手、日程管理助手等场景;腾讯的“元器”,结合混元大模型与微信生态,实现一站式创建和分发,应用于客服助手、内容创作等场景,可以提升服务效率,辅助创作。根据IDC报告显示,2024年中国公有云上大模型调用量达114.2万亿tokens(不包含出海群体使用的海外MaaS平台的调用量),按照大模型调用量的市场份额来看,字节火山引擎占据了46.4%的市场份额,位列第一,其次为百度智能云(19.3%)和阿里云(19.3%)。此外,腾讯云、中国移动、天翼云等其他厂商整体占据15%的市场份额。2024年模型调用量仍然以文本类的能力为主,2024Q4语音类模型调用量也开始增长。预计2025年图像、视频类大模型的调用量也将开始起量,成为驱动未来2年大模型tokens增长的重要力量。行业深度报告行业深度报告·计算机行业图20:2024.6-2024.12中国公有云大模型日均调用量0资料来源:IDC,中国银河证券研究院图21:2024年中国大模型服务调用量分布百度云百度云19.30%火山引擎阿里云资料来源:IDC,中国银河证券研究院作等领域增长最快。根据火山引擎数据,其AI工具类场景tokens消耗5个月增长4.4倍,其中AI搜索增长10倍,AI编程增长8.4倍,K12在线教育增长12倍。智能巡检、视频检索等新场景突破计算机和数学占比37.2%(编程、开发)、艺术和创作10.3%、教育/档案9.3%。图22:火山引擎AI工具类场景tokens消耗5个月增长4.4倍5学习教育:幅一可智验、图片信自理解等惚%一起题一资料来源:火山引擎,中国银河证券研究院资料来源:Anthropic,中国银河证券研究院通用型:Manus智能体和Genspark智慧搜索核心用于跨领域信息整合以及自动化执行。Manus的商业模型为基于任务效果“后付费”或“按结果计费”,用户只为成功输出付费,近20人团队支撑千万级收入;Genspark聚焦于知识工作者、学生、程序员等使用场景学术类、代码等查询,更注重“本地化内容”以及“中文搜索习惯”,结合多模态能力,支持图片创作型:LiblibAI图片生成服务主要为设计师、插画师、自的服务,同时构建内容共创与分享的垂直社区生态,产品涵盖多样化的图像生成方式、丰富的模型资源、活跃的社区互动以及多模态扩展等。2025年2月完成数亿人民币的A+轮融资,投资方包括请务必阅读正文最后的中国银河证券股份有限公司免责声明。请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告行业深度报告·计算机行业流程自动化开发。产品核心功能与架构为多智能体协作、自然语言编程、全准化操作流程,适合于无深入编程技能的个人开发者、辅助编程教学的教育(百万美金产品收入102930405760748图片编相09000图片编相000600200040图25:豆包大模型日均tokens使用量超过16.4万亿截至2025年5月底,豆包大模型日均截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月刚发布时增长超过137倍。16.4万亿+12.7万亿截至2025年5月4万亿企业级智能体指专为企业环境设计和部署的AI执部分决策和执行行为。当前国内外企业级智能体正加速落地,成为企业提企业架构面临全面转型(多模态)(大规模GPU推理)请务必阅读正文最后的中国银河证券股份有限公司免责声明。请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告·计算机行业因为MCP、A2A协议出现以及Agent生态的模式会呈指数级增长,而这些故障对基础设施的影响是巨大的,对于企业来说,无论是为智能体重商能很好地帮企业解决这种复杂性部署,因此在Agent技术布局具有先发优势的SAAS企业有望迎数据基础与商业价值,我们认为企业级智能体有望最快落地的领域按优先级排序为:企业服务 企业服务(OA/ERP/CRM等)营销/电商医疗教育资料来源:中国银河证券研究院猿”大圣AI中台系列:为B端而生的AIPaaS平台+开箱即用基础应用;2)应用层“灵手”业务智能体系列:各大业务领域数十个场景AI助手/智能专家,构建覆盖全业务链的智能体生态;3)模型层“灵睿”垂直模型系列:多个行业专识模型+飞码代码大模型;4)服务层“灵策”配套服务系AI,提供多模型对接能力,内置智能对话、可自配置的多分类智能知识问答等应用,同时,还提供向量管理与应用能力、私有模型训练与应用能力,可以帮助企业高效自定义实现各种业务流程+AI能力,提供智能助手与AIGC应用编排能力,实现企业流程智能化交互、引导、流转,帮助企业快需求从基础服务向合规税优转化,中小微企业面临内部高价值财税方案供不应求,而以AI为驱动的财税平台是打破痛点的关键。税友股份作为财税SaaS领军者在Agent上布局领先,公司凭借深耕行业25年的经验,已直接服务超100万中小企业,赋能财税代理服务行业支撑服务超700万小微企业,拥有活跃企业用户900万,付费企业用户615万。手IntuitAssist不谋而合,后者通过每月1200万次交互验证了生成式AI的商业潜力。请务必阅读正文最后的中国银河证券股份有限公司免责声明。行业深度报告·计算机行业行业深度报告·计算机行业快麦小智客服机器人、深绘美工机器人、快麦工单、跟单宝等力融入公司现有的快麦小智客服机器人、深绘美工机器人、有成系列产图28:税友股份人工智能平台“犀友”实现合规税优服务囵场开72国服0资料来源:税友股份官网,中国银河证券研究院a三资料来源:汉得信息官网,中国银河证券研究院五、产业链投资机会根据英伟达产品计划,其BlackwellUltra(GB300)芯片,BlackwellUltraNVL72平台将于2025下半年推出,在NVL72状态下(72颗芯片互联)AI性能是GB200的1.5倍。其下一代AI芯片Rubin,VeraRubinNVL144将于2026下半年推出,性能是GB300NVL72的3.3倍;而更强的RubinUltraNVL576将于2027年下半年推出,性能是GB300NVL72的14倍。我们可以看力与应用实现正向循环,驱动北美四大云厂商2025年资本开支积极指引。在海外token需求持续海外推理算力供需剪刀差将会不断扩大。建议关注国内NV链相关企业:工业富联截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月刚发布时增长137倍。同时,字节火山引擎占据了国内公有云上大模型调用量的46.4%的市场份额,位列第一。字节在AI应用生态领域已构建起相对优势,建议关注字节生态合作伙伴:润泽科技、汉得信息、行业深度报告·计算机行业中国银河证券行业深度报告·计算机行业从应用层面来说,伴随着AIAgent从“被动工具”迈向“自主决策体”,并且从个体走向协转变。能真正提升下游企业利润的AIAghow型卡位公司的投资机会相对提升,能融入智能体能力的SAAS企业有望迎来价值重估的机会。个股层面我们建议重点关注:1)电商Agent:光云科技、美图公司、虹软科技、万兴科技;2)卫宁健康、东软集团、嘉和美康;7)能源Agent:国能日新、朗新集团。-美图公司-同花顺鼎捷数智中国银河证券行业深度报告·计算机行业东软集团国能日新朗新集团请务必阅读正文最后的中国银河证券股份有限公司免责声行业深度报告·行业深度报告·计算机行业图1:2025年5月全球AIWeb产品月活数据 4图2:2025年5月中国AIWeb产品月活数据 4图3:2025年5月全球AIAPP产品月活数据 5图4:2025年5月中国AIAPP产品月活数据 5图5:AIAgent工作流程 5 6图7:A100、H100等算力卡的参数 6图8:基于思维树(ToT)的提示词工程 9 9图10:ClaudeOpus4测试碾压OpenAI最强推理模型03 图11:MCP的技术架构三个核心部分:MCPHost(执行环境)、MCPClient(通信枢纽)和MCPServer 图12:MCP与A2A的协作机制 图13:RAG系统结合向量数据库的运行流程 1图14:MemGPT如何扩展LLM的上下文范围 1图15:按大模型功能划分的流量趋势(2024.12-2025.5) 图16:按大模型功能划分的流量份额(2024.12-2025.5) 图17:通用类大模型的流量趋势(2024.12-2025.5) 图18:通用类大模型的流量份额(2024.12-2025.5) 图19:中国AIAgent行业图谱 图20:2024.6-2024.12中国公有云大模型日均调用量 图21:2024年中国大模型服务调用量分布 图22:火山引擎AI工具类场景tokens消耗5个月增长4.4倍 图23:Claude模型的使用量按工作类型划分:编程开发、艺术创作靠前 图24:中国AI产品年收入榜单 图25:豆包大模型日均tokens使用量超过16.4万亿 图26:企业架构转型(从PC时代到AI时代) 图27:企业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论