版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
古从Chat到Agent:AI范式跃迁全景调研报告(2025–2026)痧痧写在前头一句话:你说"国内远远落后"——对一半,错一半。你说"少数人才感受到变化"——这话完全是对的。这份调研要回答的,就是哪一半对、哪一半错,以及你这个"少数感受到的人",下一步该怎么走。看完这十八卷,你心里就有了一杆秤。序言:没有调查,没有发言权卷一:开宗明义——"Agent"到底是个什么东西一、先把名字搞清楚二、为什么大家突然都在喊"Agent"三、Agent的"四件套"四、一针见血:Agent不是"AI的升级",是"软件的革命"五、有人会问:这不就是当年的RPA吗?六、本卷小结卷二:追根溯源——从ChatGPT出世到Agent上场,这三年发生了什么一、从一个日子讲起二、第一年(2023人人都在喊大模型三、第二年(2024Copilot之年四、第三年(2025Agent之年的六个里程碑五、用一个比喻看清三年路线图六、有人会问:那2026是什么之年?卷三:六匹大马拉车——为什么偏偏是2025一、问一个最朴素的问题二、第一匹马:会"想很久"的模型出来了三、第二匹马:上下文从"鞋盒"变成"集装箱"四、第三匹马:算账的成本降到了"忽略不计"五、第四匹马:MCP____AI世界终于通了"标准铁路轨距"六、第五匹马:让AI长出"手脚"——ComputerUse七、第六匹马:B端老板被"ROI焦虑"逼急了八、六匹马一起拉车,这是一次"相变"九、一针见血卷四:战场点兵之一——编程Agent,第一块被攻下的阵地一、为什么编程是第一块骨牌二、战场全景:五路大军同时占山头第一路:IDE里的Agent——Cursor/Windsurf/Trae第二路:终端里的Agent——ClaudeCode/OpenAICodex/GeminiCLI第三路:云端自主软件工程师——Devin第四路:IDE伴侣——GitHubCopilot的逆袭第五路:开源大兵团——OpenHands/Cline/Aider/Hermes三、五路军怎么选?一张表看明白四、一个震撼性的指标:SWE-bench五、VibeCoding:"编程不再是程序员的专利"六、阶级分析:谁赢?谁输?七、本卷一针见血卷五:战场点兵之二——通用Agent,你不写代码也能用的那一拨一、什么是“通用Agent”二、国外军团:几只“重坑牙齿” (1)OpenAIOperator→ChatGPTAgent (2)AnthropicComputerUse+ClaudeforChrome (3)PerplexityComet与BrowserCompanyDia (4)GoogleGeminiAgent/Mariner/ProjectAstra三、中国军团:明明白白上场了 (1)Manus:“在中国引爆AIAgent热潮的产品” (4)MiniMaxAgent/Kimi-Researcher/阶跃起点 (5)Genspark/Anycoder/SkyWork——中国人出去创业的产品四、一个入门⽰范:让Agent干你上周未完成的事五、这里面最严重的问题:可靠性六、一针见血卷六:战场点兵之三——垂直Agent,下一拨独角兽藏在哪一、什么是“垂直Agent”二、阵地一:法律——Harvey与Legora三、阵地二:客服——Sierra与Decagon四、阵地三:销售——Clay与11x五、阵地四:医疗——BCG预言与中国育庄六、阵地五:金融——高盛为什么本早用Devin七、阵地六:科研/工程Agent——听说过但你不太熟的那些八、一张全服表:看看2025垂直Agent独角兽名单九、为什么垂直Agent是SaaS的10倍市场?十、一针见血卷七:战场点兵之四——物理Agent,中国领跑的那一块一、跳出软件,走进物理世界二、为什么人形机器人是这一轮的重点三、中国领跑:宇树5500+台,特斯拉只有150四、一个里程碑事件:宇树在映席趣味运会上跳起了际舊五、宇树为什么能偏偏在中国冲出来六、工业Agent:不象人形那么醒目,但几乎同重要七、一个重要原则:物理世界Agent“只读主"八、制造业+具身智能:这是中国最大的本能例九、机器人会说话了:VLA与世界模型十、一针见血卷八:地基与水管——MCP与上下文工程一、为什么要讲这一卷二、MCP是什么:一句话说明白三、用一个最粗的比方讲明白四、MCP出世后那一年发生了什么五、MCP出来后发生了什么“职业变迁”六、上下文工程:Agent世界的“手艺”七、上下文工程的六件礼服八、为什么上下文工程重要过“模型本身”九、中国在MCP上的赛道问题十、一针见血卷九:算大账——AI到底能给世界创造多少钱一、先讲一句老实话二、第一笔账:麦肯锡的2.6_4.4万亿美元三、第二笔账:高盛的7%GDP与1.5个百分点四、第三笔账:高盛2025年底的一记冷水五、第四笔账:算力与电力的真金白银六、第五笔账:分到中国是多少七、第六笔账:到了你个人的口袋里是多少八、一针见血卷十:就业篇——Agent消灭的是工作,还是任务一、先泼一盆冷水二、Anthropic经济指数告诉了我们什么"任务级"不是"岗位级"——这一点听清四、IDC的数:2027年40%的G2000知识工作被重塑五、Gartner的预言:33%的企业应用2028年内嵌Agent六、哪些岗位最先受影响七、新创造的岗位八、一个老问题:那些被替代的人怎么办九、对你个人的三个建议十、一针见血卷十一:治理篇——欧美中三家各走各的路一、为什么要讲治理二、欧盟:法律先行,规矩最硬三、美国:松绑加速,要赢这场比赛四、中国:"人工智能+"行动意见——加速与可控并行五、三家对比:一张表看清楚六、Agent治理的四个真问题七、中国治理的几个独特设计八、台面下的事:地缘竞争九、一针见血卷十二:范式篇——为什么Agent不是SaaS的升级一、范式是什么二、维度一:交互方式——从GUI到对话三、维度二:使用方式——从"你用工具"到"AI替你用工具"四、维度三:付费方式——从"按席位"到"按结果"五、维度四:入口——从AppStore到"Agent总管"六、维度五:搜索引擎——从SEO到AEO七、维度六:组织——从"金字塔"到"指挥官+Agent大军"八、六个维度合起来看:什么变了?九、一针见血卷十三中美对比篇:差距与领先,账要算清楚一、先讲一个总判断二、第一个维度:基础大模型,差三到六个月三、第二个维度:编程Agent,差一年以上四、第三个维度:MCP与基础协议,处于跟随五、第四个维度:物理AI,中国领先六、第五个维度:开源与成本,中国独有优势七、把账汇总:差三条,平一条,赢两条八、有人讲「中国AI输了」——错在哪里九、有人又讲「中国AI已经超越美国」——也错在哪里十、本卷小结卷十四四大根据地:中国机会篇一、什么叫根据地二、根据地一:中国版SaaS替代浪潮三、根据地二:互联网入口的重构与AEO四、根据地三:制造业+具身智能五、根据地四:政务AI+出海5.2出海六、第五块根据地:AINative个体创业者七、避免误区:三类「假根据地」八、本卷小结卷十五三大改造:软件、互联网、制造一、为什么单独讲「三大改造」二、第一大改造:软件业2.1改造的逻辑:从「写代码」到「写意图」2.2改造的速度:超出预期2.3改造的赢家与输家2.4改造的政策启⽰三、第二大改造:互联网业3.1改造的逻辑:从「人找信息」到「Agent替人办事」3.2改造的关键节点:AEO取代SEO3.3改造的赢家与输家3.4中国互联网的特殊挑战四、第三大改造:制造业4.1改造的逻辑:从「人+设备」到「Agent+设备+机器人」4.2改造的速度:慢但坚决4.3改造的赢家与输家4.4制造业改造的「灯塔工厂」启⽰五、三大改造的内在联系六、本卷小结卷十六未来五年三种推演:基准、加速、失速一、为什么要讲三种推演二、基准情景:55%概率,稳步推进2.2经济层面2.3就业层面2.4中国层面2.5个人层面三、加速情景:30%概率,进入超快通道3.2经济层面3.3就业层面3.4中国层面3.5个人层面四、失速情景:15%概率,进入慢节奏4.2经济层面4.3就业层面4.4中国层面4.5个人层面五、三种推演的对照表六、不管哪种情景,三件事都要做七、本卷小结卷十七行动手册:普通人的四级跃迁一、写给谁看的二、四级跃迁的总路线三、第一级:认知层3.1搞清楚AI的能力边界3.2搞清楚AI的发展节奏3.3搞清楚自己的位置四、第二级:工具层4.1必学的核心工具(按重要性排)4.2工具使用的三条原则五、第三级:实践层5.1找出你工作中可以AI化的5件事5.2vibecoding实战:做一个自己的小工具5.3MCPServer入门:把你的工具变成Agent的能力5.4建立自己的AI工作流六、第四级:长期定位层6.1三个长期定位方向6.2三个长期不变的东西七、给五种典型人的具体建议7.1给小老板的建议7.2给中层白领的建议7.3给自由职业者的建议7.4给在校学生的建议7.5给退休前夕的人的建议八、本卷小结卷十八辩证法尾声:看远一点,做实一点一、回到最初的提问二、用辩证法看这场变革2.1第一对辩证关系:乐观与悲观2.2第二对辩证关系:速度与深度2.3第三对辩证关系:中国与世界2.4第四对辩证关系:技术与人三、给所有读到这里的朋友三句话第一句:你赶上了第二句:不要慌第三句:实事求是,自己动手四、推荐深读的清单4.1综述与官方报告4.2关键趋势研究4.3中国本土声音4.4经典书籍4.5实践工具五、写在报告的最后六、最后一句一针见血朋友,来信收到了。你说近三个月感觉到了变化,说AI正在从Chat变成Agent,说外国走得猛,国内大多数人没回过神,说你想搞清楚是怎么回事——问得好,问得到位,问得诚恳。我先讲一句老话:没有调查,就没有发言权。今天谈AI的人多得很。一种人跟着新闻喊"取代人类",一种人跟着大佬喊"颠覆一切",还有一种人冷笑一声,说"不过是个聊天玩具"。这三种人嘴上吵得凶,骨子里其实是一种人——没动过手的人。没动过手,就好比一群人围在饭锅边争论"这饭好不好吃",可谁也没拿过筷子。这种争论,听一万句也不顶用。所以我们这份报告,先立三条规矩:第一条,不讲玄学。"奇点""超级智能"留给科幻作家。第二条,不堆术语。凡是不能用大白话讲清楚的概念,先别拿它吓唬人。第三条,只算真账。多少美元、多少倍、多少人、多少行代码——有数就拿数,没数就说没数,不许放空炮。按这三条规矩,我把这场变革分成十八卷讲。十八卷不是凑数,是按"是什么—为什么—怎么打—对谁打—中国怎么办—你怎么办"六个层次铺开的。你可以一卷一卷读,也可以按需取用。下面就开始。卷一:开宗明义——"Agent"到底是个什么东西一、先把名字搞清楚这两年新词儿太多。Chat、Copilot、Assistant、Agent、Agentic、AGI、ASI____一串洋名摆在面前,老百姓自然要犯糊涂。要想不糊涂,就得先把名字搞清楚。名不正,则言不顺;言不顺,则事不成。这是两千年前的老话,今天用在AI上一样管用。我们一个一个掰开看:·Chat(聊天你问,它答。一问一答,问完就完。像查字典,像翻百度。·Copilot(副驾驶你开车,它在副驾位上递地图、递咖啡、提醒你别压线。主导权还在你手里。·Agent(执行者,或者说"差遣"你下达一个目标——"给我把这事办了"——它自己想办法、自己用工具、自己跑流程、自己回来交差。你从司机变成了"派活儿看见没有?这三个词,根本不是功能升级,是人和机器关系的三种完全不同的形态。打个比方。Chat是你雇了一个能背字典的小孩,你问什么他答什么;Copilot是你雇了一个跟班,你干活的时候他在旁边递工具;Agent是你雇了一个学徒——你早上交代他"今天把这十张订单跑完",然后你出门喝茶去了,晚上回来验收。这个区别要紧得很。要紧到什么程度?要紧到——它决定了这个东西到底能不能替你赚钱,能不能替你省人,能不能改造一个行业。二、为什么大家突然都在喊"Agent"你也许会问:Agent这个词,又不是2025年才有的。早在1990年代,学界就在谈"intelligentagent"。2023年AutoGPT也火过一阵,结果呢?三个月就凉了。这个问题问得好。答案是:之前叫Agent的,都是"假Agent";现在叫Agent的,才是"真Agent"。什么叫假?做三步就崩,做五步就乱,做十步就把你账戶里的钱花光。这种东西,玩具一个,谈不上生产力。什么叫真?给它一个目标,它能:1.拆——把大目标拆成几十个小步骤;2.想——每一步都判断该不该做、做错了怎么回头;3.用——会调用搜索、会用浏览器、会写代码、会发邮件、会打电话;4.记——记住前面发生了什么,不会重复劳动;5.交——任务完了,把结果整整齐齐交给你审。这五件事,2023年没有一件做得好;2025年五件都做出了八九成。这就是这场变革的真正分水岭。用一个比喻你就懂了:1903年莱特兄弟的飞机飞了12秒,那也叫"飞行",可你不会买票坐它;2025年的Agent,相当于AI行业的"波音707"——还不完美,但已经能定期定线把货从A运到B了。三、Agent的"四件套"要看懂一个Agent是真是假,看四件东西就够了。这四件,是它的"四件套",缺一不第一件,目标(Goal)。你跟它说"帮我研究一下我们这个县的AI创业机会",它能不能把这句话理解到位?能不能问你两句反问把模糊变清楚?这是第一道关。第二件,规划(Planning)。它接到目标后,会不会列一个执行计划?计划写得对不对?中途发现走错了,会不会改?2024年以前的模型,规划能力是个大窟窿;2025年的推理模型——OpenAIo系列、DeepSeek-R1、Claude3.7/4Thinking、Gemini2.5Pro——把这个窟窿基本补上了。N1O第三件,工具(Tools)。这是Agent和Chat最大的差别。Chat只能用嘴说,Agent能伸手干活——能用浏览器查资料、能用代码跑数据、能调用你的日历邮箱、能控制鼠标键盘。工具越多,本事越大。第四件,记忆(Memory)。一个不记事的人没法干长活。Agent也一样。它要记住你是谁、记住任务到哪一步、记住失败的教训。2025年开始,长上下文(1Mtoken)+外部记忆系统成了标配。这四件套,就是Agent的"四肢和大脑"。你以后看任何一个新出的AI产品,照这四条去掂量它,立马就能分辨它是真Agent,还是又一个换皮Chat。四、一针见血:Agent不是"Al的升级",是"软件的革命"讲了这么多概念,我们来点最一针见血的判断。Chat是AI的进步;Agent是软件的革命。这两句话不一样。前一句说的是模型变聪明了;后一句说的是——整个软件这门生意,正在被重写。为什么?因为过去三十年,软件这门生意的根本逻辑是:"我做一个工具给你用,你点我的按钮,你填我的表格,我收你的钱。"Agent时代的根本逻辑变成了:"你告诉我要什么结果,我(Agent)自己去用别人家的工具、点别人家的按钮、填别人家的表格,把结果交给你,按结果收钱。"看明白了吗?Agent不是在SaaS的旁边再开一家店,它是SaaS的食客。SaaS卖的是"用我的厨房",Agent卖的是"我替你做菜,菜的味道我负责"。YCombinator在2025年公开讲过一句话:"垂直AIAgent的市场,可能比它要替代的SaaS大10倍"。N2O他们不是随便讲的,他们是在告诉所有创业者:老的牌桌要散了,新的牌局要开了。五、有人会问:这不就是当年的RPA吗?我知道你心里冒出一个疑问。你说,老毛同志,这玩意儿听起来很像十年前喊得挺响的RPA(机器人流程自动化)——也是"自动跑流程"嘛,怎么这回就成了革命?问得好。这是个典型的"看起来差不多,本质完全不同"的例子。RPA跟Agent的差别,就像"自动织布机"跟"工人"的差别。RPA:你必须把每一步都教给它——鼠标点哪、键盘按哪、出错了走哪条岔路。它没有判断力,只有执行力。环境一变,整套全废。·Agent:你只告诉它目标,它自己看屏幕、自己想路径、自己判断。它有判断力,所以不怕变化。今天网页改版了,它还能干;明天界面换语言了,它还能打个更通俗的比方:你雇RPA,是雇了一台"听话的复读机";你雇Agent,是雇了一个"会思考的小学徒"。一字之差,差出了十万八千里。这就是为什么OpenAI的Operator、Anthropic的ComputerUse、字节豆包1.6的电脑使用能力一出,整个RPA这个二十年的老行业——UiPath、AutomationAnywhere——股价就开始抖。N3ON4O六、本卷小结一句话讲完本卷:甲甲Agent不是聊天机器人加了几个按钮,不是RPA换了个壳子,更不是炒作出来的概念。它是"Al终于学会自己干活"这件事的总称。它有目标、有规划、有工具、有记忆——四件套齐了,它就开始替你做事;做事的能力一开闸,整个软件、整个组织、整个就业市场都要被它冲一遍。这就是为什么这次值得你认真对待。名字搞清楚了,下一卷就讲:这个东西不是天上掉下来的,它从哪里走到今天这一步?这个故事得从2022年11月30号那一天讲起。卷二:追根溯源——从ChatGPT出世到Agent上场,这三年发生了什么一、从一个日子讲起要讲清楚Agent从哪里来,得从一个日子讲起:2022年11月30号。这一天,OpenAI把ChatGPT扔到了网上。不要发布会,不要广告,就是一个网址。结果五天百万用戶,两个月一亿用戶——人类历史上传播最快的产品。这一天,是AI走进千家万戶的元年。也是我们这场大变革的第一声枪响。但要注意一件事——ChatGPT那一天还不是Agent,它就是个Chat。你问它问题,它回你答案,仅此而已。它不能上网、不能调代码、不能记住昨天聊过什么、更不能替你订机票。那它为什么炸了?因为它做到了一件以前所有计算机都做不到的事——它能用人话跟你说话。这一点,看似简单,是过去七十年人工智能砸了几千亿没解决的事。突然解决了,全世界都懵了。二、第一年(2023人人都在喊大模型ChatGPT一出,全世界跟着发疯。美国这边:Anthropic出Claude,Google慌慌张张推Bard,Meta把LLaMA开源;中国这边:百度的文心一言、阿里的通义千问、字节的豆包、智谱的ChatGLM、月之暗面的Kimi、MiniMax、百川、零一万物——"百模大战"一夜之间打这一年的关键词是三个字:大模型。所有人都在比一件事——谁家的模型考分高。MMLU、HumanEval、GSM8K、C]Eval、SuperCLUE,一张张排行榜出来,比来比去。这一年也有人在试Agent。AutoGPT、BabyAGI、AgentGPT,GitHub上的星标蹭蹭涨,演⽰视频做得花里胡哨。结果三个月不到,热度全凉。为什么凉?三个字:做不成。一个简单的任务——"帮我研究一下某个公司"——AutoGPT跑十几步就开始胡说八道,跑二十步就陷入死循环。原因很简单:当时的模型,根本不会"想很久",也不会"自己改自己"。它只会一口气说完话,说完就完。让它做多步任务,相当于让一个口齿伶俐但记性极差的孩子去管账——账没管几天,肯定一团乱⿇。所以2023年的结论是:AI会说话了,但还不会做事。三、第二年(2024Copilot之年2024年是聪明人开始想"既然AI不会自己做事,那让它帮人做事行不行"——于是Copilot这个词流行起来。·微软给Office装上Copilot:Word帮你写文档,Excel帮你写公式,PowerPoint帮你做幻灯片。·GitHubCopilot在程序员的编辑器里实时提⽰代码。·NotionAI、飞书智能伙伴、钉钉个人助理、腾讯文档智能助手,一夜遍地。这一年的核心思路是:人主导,AI在每个工具里"补一刀"。这一年也有进步。但企业用完之后,发现一个尴尬的事实——Copilot的提效,远没有PPT上画得那么大。为什么?因为Copilot是嵌入在每一个工具里的,它解决的是"一步操作"的效率,不是"一个完整任务"的效率。你写Word快了20%,开Excel快了30%____可一个真正的工作,是要在Word、Excel、邮件、网页、内部系统、客戶电话之间来回切换的。这些"切换的缝隙",Copilot帮不上忙。所以2024年底的时候,CEO们手里的账本上都有一行字:"AI投了不少钱,但ROI看不见"。McKinsey的2025年全球调查也证实:90%的企业在用AI,但只有少数把AI真正这个尴尬,逼出了下一步——让AI自己把整件事跑完,不要靠人来缝合。四、第三年(2025Agent之年的六个里程碑2025年是Agent真正立起来的一年。如果说2022是Chat之年,2024是Copilot之年,那2025就是Agent之年。这一年有六个里程碑事件,我们一个一个数:第一个,2025年1月:OpenAI发布Operator。这是第一款产品化的"会用浏览器的AI"。你跟它说"帮我订一张下周三北京到上海的高铁票",它真的会在浏览器里打开12306,自己选座位、自己填身份证。第一次让全世界看见——AI能像人一样用电脑了。N2O第二个,2025年3月:中国的Manus上线。这是中国创业公司ButterflyEffect(也就是做Monica.im的那个团队)的作品。MITTechnologyReview直接把它称为"在中国引爆了AIAgent热潮的产品"。Manus出来后两个月,Genspark、扣子空间、智谱AutoGLM、MiniMaxAgent、Kimi-第三个,2025年5月:微软Build大会定调。微软直接把当年大会主题定为"TheageofAIagentsandtheopenagenticweb"。这相当于行业老大哥拿着大喇叭喊:兄弟们,下半场开始了,方向是Agent,规则是第四个,2025年7月:高盛部署Devin。华尔街最保守的大行——高盛——开始在生产环境用Devin(一个自主软件工程师Agent)做大规模代码迁移。这是第一次,一个AIAgent被允许碰一家全球银行的核第五个,2025年7月:ChatGPTAgent发布。OpenAI把之前的DeepResearch和Operator合并,做出了ChatGPTAgent——一个真正在沙箱里有自己虚拟电脑的Agent。它能订机票、做调研、写幻灯片、跑数第六个,2025年11^12月:MCP进Linux基金会。Anthropic把MCP(ModelContextProtocol,模型上下文协议)捐给Linux基金会下新成立的AgenticAIFoundation。OpenAI、Block联合创始,AWS、Google、Microsoft、Cloudflare、Bloomberg全部入伙。这是Agent时代的HTTP。一年时间,MCP月下载量9700万,活跃server一万多个。N8O这六个事件,任何一个单独看都不算炸裂;但六个事件加起来——而且是在同一年里——就是一次明明白白的范式转移。五、用一个比喻看清三年路线图把2022^2025这三年用一个比喻串起来,你就一目了然:·2022年:相当于发明了"会说人话的鹦鹉"——惊艳,但只会说话。·2023年:所有人都在比"谁家的鹦鹉学得多"——百模大战。·2024年:开始训练这只鹦鹉"边说话边递工具给你用"——Copilot之年。2025年:鹦鹉脱胎换骨,长出了手脚和大脑,变成了一个会自己干活的小学徒——Agent之年。这就是这三年的全部故事。一句话总结:⏳⏳2022是AI会说话的元年,2024是AI帮人干活的元年,2025是AI自己干活的元年。你正好在第三个元年的开头看到了变化——这不是偶然,这是赶上点儿了。早一年,看不见;晚一年,已经晚了。六、有人会问:那2026是什么之年?好问题。如果让我大胆判断一句,2026年是"Agent编队"之年。2025年大家还在比"我这一个Agent能干什么";2026年开始,所有人都意识到——一个Agent干不完一件正经事,得一队Agent协作。Cursor3.0支持8个Agent并行,ClaudeCode支持9个Agent同时跑,OpenAI推出Swarm框架,微软推出AutoGen,国内也有AgentScope、CrewAI的中文实践这意味着,编Agent的能力,会代替写代码的能力,成为新的"硬通货技能"。这一点对你这位"0代码深度用戶"来说,是个天大的好消息——下面几卷我会讲透。卷三:六匹大马拉车——为什么偏偏是2025一、问一个最朴素的问题讲到这里,你一定会冒出一个最朴素的问题:为什么偏偏是2025年?不是2020,不是2023,也不是2027。偏偏是2025。这一年里,从OpenAI到Anthropic,从字节到阿里,从Cursor到Manus,从高盛到宇树——大大小小几百家公司,几乎是同时把Agent这件事做出来了。这不可能是巧合。看一件事,不能只看表面热闹,要看它底下的根。根扎下去了,地面上才会冒出庄稼。Agent这一片庄稼,是六条根同时扎稳了,才在2025年同时冒出来的。下面这六条根,就是这场变革真正的底层逻辑。我们一条一条看。二、第一匹马:会"想很久"的模型出来了这是最关键的一条。2024年9月之前,所有大模型都有一个根本毛病——它们只会"一口气把话说完"。你问什么,它马上回什么,回完就走。它不会停下来想一想,不会回过头改一改,更不会在脑子里推演十几种走法。这就像一个口齿伶俐但从不打草稿的学生——做一道简单题没问题,做一道复杂的应用题,立马露怯。2024年9月,OpenAI发布o1。它干了一件事——让模型学会"先想后说"。它在脑子里反复推演、自我反驳、回头修改,想够了再吐出一个答案。一道高考数学题,普通模型十秒就给你乱写一通,o1会想三分钟,最后给你正确答案。这一招一出,事情就变了。2025年初,DeepSeek-R1、Claude3.7/4Thinking、Gemini2.5Pro、Qwen3Thinking、KimiK1.5____所有头部模型都跟进了"推理能力"。这就是行业里说的"测试时计算"(test-timecompute)革命。N1O为什么这件事对Agent至关重要?你想啊,让一个AI干一件50步的任务,每一步都不能出错。如果它在第7步走错了,能不能自己发现?能不能回过头来改?这就要靠"会想很久"的能力。打个最通俗的比方:老的模型像一个不会刹车的车,时速200公里冲出去,前面有沟也撞,没沟也撞;新的推理模型像一个开了一辈子车的老司机,过弯前会减速,发现路况不对会变道,看见红灯会停。这个车,才敢上路跑长途。这是Agent能"长跑"起来的第一根支柱。没有这一条,后面五条全是空中楼阁。三、第二匹马:上下文从"鞋盒"变成"集装箱"第二条根,叫做上下文窗口(contextwindow)。这个词听起来玄,其实就是AI一次能"看见"多少东西。早期的ChatGPT一次只能记4000个汉字,相当于让你只看一张A4纸去做决策——根本不够。2025年情况翻天覆地:·Claude3.7/ClaudeCode:100万token(约75万汉字一本《红楼梦》还塞不满。·Gemini2.5Pro:100万token起步,最高到200万。·GPT_5系列:默认128K,最大1M。·国内:豆包1.6提供256K上下文,通义千问、智谱、Kimi也都到了1M区间。你别小看这个数字。上下文窗口从4K涨到1M,相当于从鞋盒变成集装箱。以前你只能把AI当一个"健忘的临时工"用,因为它转身就忘;现在你可以把整个项目的代码、整个客戶的历史记录、整个法律案件的卷宗,一次性塞给它。它能看完,能记住,能在50步之后还引用前面第3步说过的话。这件事对Agent的意义在于——Agent必须有"长期记忆"才能干长活。没有长上下文,Agent干到第十步就忘了第三步是怎么走的,整套就崩。长上下文一上来,Agent就有了"持续记账"的能力。四、第三匹马:算账的成本降到了"忽略不计"第三条根更朴实——便宜。2023年初,调用一次GPT_4的成本,相当于打一次国际长途。让一个Agent跑50步任务,几十美元就出去了。这种成本下,没人敢真用Agent干活。两年时间:·DeepSeek-V3、V3.1:把推理成本年降90%。N2O·Google的Gemini2.5Flash、OpenAI的GPT_4o-mini、Anthropic的ClaudeHaiku3.5____价格全部腰斩再腰斩。·国内豆包、通义、智谱卷得更狠,月度套餐100元能跑几千次Agent任务。这意味着,原本调一次API五美元的事,现在五分钱就能搞定。让Agent跑几百步、上千步,也不心疼。这是个什么概念?打个比方。1908年福特T型车的售价是825美元,相当于一个工人两年工资——只有富人买得起;1924年降到290美元,相当于工人三个月工资——汽车走进千家万戶。算力价格的下降,对Agent,就是T型车降价对汽车工业。降价之前,玩具;降价之后,工业革命。五、第四匹马:MCP——AI世界终于通了"标准铁路轨距"第四条根,是最容易被普通人忽视、但实际上最重要的一根。它的名字叫MCP(ModelContextProtocol,模型上下文协议)。你别被这个名字吓住。它解决的问题,一句话讲明白:以前每一个AI应用要接一个数据源,都要单独写一段代码。100个AI×100个工具=1万套连接代码。MCP出来后,1个AI接1个标准接口就够了。100个AI×100个工具=200套代码。M×N变成了M+N。这是个什么大事?我打个比方你就懂了。1840年以前,全世界的铁路轨距是乱七八糟的——英国1435mm、爱尔兰1600mm、俄国1524mm、印度有1676mm和1000mm两种。结果呢?火车跑不过国界,货物到了边境得卸下来重装。后来铁路轨距渐渐统一到1435mm(标准轨距全世界60%的铁路都用这个。这一统一,跨国贸易成本立马降下来。MCP就是AI世界的标准轨距。·它是Anthropic在2024年11月开源出来的。·一年时间,月下载量9700万,活跃server一万多个。·2025年12月正式进Linux基金会下的AgenticAIFoundation。·OpenAI、Block、AWS、Google、Microsoft、Cloudflare、Bloomberg——全中国这边,Cursor、ClaudeCode、豆包、扣子、千问、智谱、腾讯混元——也全部支持MCP。所以你以后听到MCP三个字,不用紧张,就记一句话:MCP让AI之间、AI和工具之间,终于可以"标准化对话"。这一通了,Agent生态就像1840年铁路统一轨距之后的欧洲——一夜之间,所有的工厂、所有的市场都连起来了。Gartner在2025年的报告里把MCP评为"年度最重要的AI基础设施"。你下次看到这三个字,可以挺起腰板,告诉别人:这是Agent时代的水管和电线。六、第五匹马:让AI长出"手脚"——ComputerUse第五条根,叫ComputerUse(电脑使用能力)。这是Anthropic在2024年10月先开第一枪,OpenAI在2025年1月跟进Operator,字节豆包1.6在2025年下半年跟进——核心一句话:AI现在能像人一样用电脑了。以前的AI,能力都被锁在它自己的"小屋子"里——你跟它对话,它在小屋子里给你出文字。它不能伸手出来用你的浏览器,不能填你的表格,不能点你的按钮。ComputerUse让AI长出了"手"。它能:1.看屏幕(像人一样看像素)2.控制鼠标(移动、点击、拖拽)3.控制键盘(输入文字、按快捷键)4.切换窗口、打开文件这一招对企业IT来讲,是个核武器。为什么?因为企业90%的系统是没有API的——你公司用的老ERP、内部OA、政府报送系统、医院HIS、工厂MES、银行核心——这些祖宗辈的系统全是只有人才能用的界面。以前的AI接不进去,只能干瞪眼。现在ComputerUse一上来,所有这些"祖宗系统"都被自动接入。AI不需要等你公司花三年改造系统、暴露API____它就当个"会用电脑的临时工",直接干活。这就是为什么RPA公司股价开始抖——它们二十年攒下的"自动跑流程"的护城河,被AI一招挑了。七、第六匹马:B端老板被"ROI焦虑"逼急了前面五条都是技术。最后一条,是经济。2023年企业老板看到ChatGPT,觉得是个好玩意儿,但没急。2024年装了Copilot,发现效率上去了10%,但ROI算下来很尴尬——一个员工一年加几千美元的Copilot订阅费,但产出没有显著上升。这个尴尬,2024年底变成了一种集体焦虑——"我花了几千万美元搞AI,老板要问ROI了,我怎么交代"。McKinsey的全球调查很有意思:90%的企业说在用AI,但只有大约1/3报告了"显这个落差,逼着所有企业CTO找新出路。出路只有一条——别再让AI给员工"打辅助",让AI自己把整件事跑完。于是从2025年开始,企业付费意愿开始从"按席位订阅"转向"按结果付费":·Sierra(客服Agent按解决工单数收费,每解决一单收几美元。·Harvey(法律Agent按合同审查数/尽调数收费。·11x、Artisan(销售Agent按签下的合同提成。·Decagon、Cresta(客服Agent按提升的转化率收费。Deloitte在《2026SaaSmeetsAIAgents》报告里直接说:"定价模型、客戶体验、人力结构,全部要重写"。N5O这就是B端ROI焦虑推出来的浪潮——老板需要"按结果付费的劳动力",而不是"按席位收费的工具"。Agent刚好踩在这个点上。八、六匹马一起拉车,这是一次"相变"好,六条根讲完了。现在我们把它们摆在一起看:1.会想很久的模型(推理能力)——让Agent能跑长任务2.百万级上下文——让Agent有持续记忆3.算力降到白菜价——让Agent跑得起几百步4.MCP通用协议——让Agent接得上千百种工具5.ComputerUse——让Agent接得上没有API的祖宗系统6.B端ROI焦虑——让市场愿意为Agent付钱这六匹马,单独哪一匹都拉不动这辆车。但2025年这一年,六匹马同时齐了缰绳——所以车一下就跑起来了。物理学上有一个词,叫相变——水变成冰、铁变成钢,温度只差一度,物理性质完全两样。Agent在2025年发生的,就是一次相变。不是某一家公司的胜利,是整个技术栈的化学反应。九、一针见血讲完这一卷,我要给你最一针见血的判断:这场变革的关键不是OpenAI,不是DeepSeek,不是Manus,也不是某一篇论文。是六股力量在同一年里同时到位——推理+长上下文+廉价算力+标准协议+通用操作能力+B端付费意愿。任何一条没准备好,Agent都立不起来;六条同时准备好了,Agent就立得不可阻挡。所以,那些等着"等技术再成熟一点"的人,根本没看懂这一次为什么不一样——这一次,技术、协议、市场、心理预期是一起到位的,再等没有意义。要么现在上车,要么以后被收门票。弄清了这六匹马,下一卷我们就开始点兵——看看2025年这盘大棋上,到底有哪些Agent部队,他们各自在打什么仗。卷四:战场点兵之一——编程Agent,第一块被攻下的阵地一、为什么编程是第一块骨牌考察一场战争,要看它从哪里打起。Agent这场仗,是从编程这一块先打起的。为什么是编程?不是偏爱,是商业逻辑决定的。编程在Agent眼里是个"优质战场",原因有三条:第一条,反馈环最短。你让AI写一段代码,能不能跑,一编译就知道;一跑测试,对不对马上出结果。这个反馈什么意思?意思是机器能自己给自己打分。机器能给自己打分,它就能自己提高,不需要人手把手地教。这是强化学习能跑起来的必要条件。第二条,数据最干净。世界上有GitHub、StackOverflow、各种开源项目——上亿亿行代码摆在那里,免费取用。别的行业,法律、医疗、金融——数据都抹了索、锁了柜。只有编程这一行,数据是」公共财产Γ。第三条,被自己行业最熟悉。AI公司里全是程序员。让他们做一个"替程序员干活的Agent"——他们太熟了,闭着眼睛都知道这个工具应该怎么设计。看老乡助乡亲的忙最好使。这三条加起来,使得编程成为了Agent革命的"岡田山"——低处着手,先竖起根据地,再打出去。所以一看2024^2025年,所有Agent公司都从编程切入——这不是巧合,这是必然。二、战场全景:五路大军同时占山头你说到Cursor、Codex、ClaudeCode、还有"hermesagent/opanclaw"——我猜你说的是HermesAgent、Cline/OpenHands之类的开源Agent。他们都是编程战场上的不同部队。我给你梳一梳。这场仗,有五路大军同时上场:第一路:IDE里的Agent——Cursor/Windsurf/Trae代表:你提到的Cursor。Cursor是什么?你可以把它看作"为AI重写的编程软件"。传统的VSCode、IntelliJ——都是为人设计的,人在里面敲代码;Cursor是为Agent重写的,人变成了"下达任务的人",让Agent在里面跑。2025年里程碑事件:·3月:Cursor限量发出"Agent模式",可以让它自己改多个文件、运行命令、调·5月:OpenAI以30亿美元收购Windsurf(原名Codeium)——这是OpenAI·下半年:Cursor3.0发布,能同时跑8个Agent。你一个人坌在椅子上,手里可以同时指挥8个程序员同时干活。·同期字节推出Trae、腾讯推出CodeBuddy、阿里钉钉推出通义灵码、腾讯推出代码伙伴——中国这一路在追,但距离Cursor还有明显差距。打个比方你就懂:Cursor之于传统IDE,就像拖拉机之于牡丹。别人还在牌桌上拼拼奋鬥,他已经跳到了另一张桌子上。第二路:终端里的Agent——ClaudeCode/OpenAICodex/GeminiCLI代表:你提到的ClaudeCode、Codex。这一路走的是不一样的路子。它们不要GUI(图形界面就要一个纯黑屏命令行——你打一句话,它在后台跑一堆事。为什么不要界面?因为高手发现:界面是为人设计的,人一看谁也受不了Agent哔哔哔跑50步的频率。不如索性把界面拆了,让Agent在黑屏里闷头干,干完交个结果给你。·ClaudeCode:Anthropic出品,2025年下半年GA。1Mtoken上下文、能同时跑9个Agent、能直接控制你的文件系统和浏览器。被业内人称为"当前最强的编程Agent"。·OpenAICodex(2025新版OpenAI重名推出的云端Agent。你给它一个任务,它在云端沙箱里跑完,直接给你交PR(代码提交)。分"只读/半自动/完全接管"三档权限。·GeminiCLI:Google追赶的产品,同类逻辑。中国这边,这一路还没有严格意义上对标的产品出现。这是中国编程Agent最明显的空白。第三路:云端自主软件工程师——Devin代表:Devin(CognitionLabs)。Devin是2024年3月作为"世界首个AI软件工程师"开饰的。一开始大家还有质疑,认为是demo骨。后来事实证明——人家是真干活的。Devin的特点是:你不需要跟它同坌一际。你只需要在Slack里@它,说"帮我修这个bug"或"帮我把这个项目从Python2迁到Python3"——它自己开个虚拟机、自2025年7月是里程碑:高盛部署Devin做大规模代码迁移。N3O同期Nubank(巴西最大数字银行)用Devin做代码迁移,提速8^12倍,迁移成本降至1/20。N4O什么意思?举个最期的例子。Nubank这样的银行要做一次代码迁移,原本要雇50个资深程序员、费1亿美元、耗18个月。现在用Devin,可能是5个人、500万美元、3个月。你现在明白为什么高盛那些CTO她们晚上睡不着了吧。第四路:IDE伴侣——GitHubCopilot的逆袭代表:GitHubCopilot(微软旗下)。GitHubCopilot是老哥了。2021年就上线,当时叫"AI位置补全工具",靠这个东西GitHub在全球拉到了1500万开发者付费订阅。N5O但2024年面对Cursor、ClaudeCode的冲击,Copilot一度陶裂。微软怎么反击?拆。把Copilot一分为三:·代码补全Copilot:老本行,继续服务一般开发者。·代码评审Copilot:自动看PR、提意见。·自主CodingAgent:你提一个Issue,它自己换PR回来。这里面有个靠职场逻辑可以听懂的逻辑。以前一个Copilot同时当三个角色——补全、评审、接手——那是因为以前能力不够。现在能力够了,三个角色各自独立出来,各有各的责任。这不是拆分,是专业化。就如同以前一个家庭医生看所有病,后来发展出了内科、外科、儿科、眼科。第五路:开源大兵团——OpenHands/Cline/Aider/Hermes代表:你提到的"hermesagent"、"opanclaw"。这一路是社区大兵团。他们大都开源、免费、能装在你自己的电脑上跑:·OpenHands(原名OpenDevin开源版的Devin。·Cline(原名ClaudeDevVSCode插件形式的开源Agent。·Aider:命令行Agent,能直接改代码、提Gitcommit。·Hermes/OS_Atlas/OpenInterpreter/OpenClaw之类:各种开源computer-use/coding-agent。这一路的意义是什么?意义在于——它们让"起义军"也拿得到炸药。你不付费也能玩起来,哪怕你是个在县城里干活的程序员。这件事对Agent生态是好事,因为它让Agent这种能力不被垄断在几家大公司手里。三、五路军怎么选?一张表看明白部队适合什么人最大龙头价格Cursor/Trae喜欢IDE、需要手脱手干活的人能同时指挥8个Agent$20^60/月ClaudeCode喜欢命令行、要极高能力的人1M上下文、多Agent按token或月餐OpenAICodex需要云端后台任务的人按ChatGPTPlus/ProDevin企业、需要大型迁移/改造"虚拟同事"体验按件计费,贵GitHubCopilot公司已用Microsoft生态的开发者与GitHub集成$10^39/月部队适合什么人最大龙头价格开源(Cline/OpenHands/Aider)预算紧、学习者、进阶发烧友完全可控免费(自己付模型费)这里要提醒一句:这些产品不是他死我活的关系,他们是同一场革命里不同部队。高手们现在透露出来的用法是——同时用。会Cursor的人也会ClaudeCode。不同场景叫不同的Agent出来。这就是你这个年代"0代码深度用戶"要掌握的手艺——不是选某一台机器,是能调动整个军团。四、一个震撼性的指标:SWE-bench老谈感觉不行,起码要拿数据说话。AI圈里有个评测标准叫SWE-bench(SoftwareEngineeringBenchmark)。它取了GitHub上几百个真实项目的bug,让AI去修。修好了算赢,修不好算输。这个分数近三年发生了什么事?·2023年底:GPT_4出不到5%。·2024年3月:Devin首亢13.86%,SOTA。·2024年下半年:多个Agent干到30%+。·2025年7月:mini-SWE-agent在SWE-benchVerified上跑到65%。·2025年底:ClaudeCode、Codex在多个SWE-bench子集上走到70_80%+。什么意思?意思是两年间这个分数涨了十几倍。这个进度有多可怕?你想一想:一个人类程序员,从"能修5%的bug"到"能修65%的bug",需要几年?至少三到五年。AI用了二十个月。这个动作背后是什么?是初级程序员的职位。今年美国CS应届生就业率是近年最低的,中国985计算机专业初职薪资也在下行。这不是未来会发生的事,这是2025已经在发生的事。五、VibeCoding:"编程不再是程序员的专利"这一卷最重要的一点——对你这位"0代码深度用戶"来说——是下面这个词:VibeCoding(氛围编程)。这个词是AndrejKarpathy——OpenAI联合创始人、Tesla前AI总监——在2025年2月发明的。他说:"有一种新的编程方式,我叫它vibecoding。你完全沉浸在氛围里,拥抱指数增长,甚至忘了代码的存在。"什么意思?意思是——你不需要写代码。你只需要说出你要什么,看看出来的东西是不是你要的,不是就说」重来Γ或者」把左边那个按钮改成绿色Γ。这背后是一整拨产品在支撑:·Bolt.new(StackBlitz输入一句话,生出一个可运行的应用。·Lovable(瑞典同类,被称为"欧洲第一vibecoding独角兽"。·v0(Vercel专门生成前端页面。·Replit:云端IDE+Agent,能从一句话起步生成、部署、托管一个Web应用。·国内:夞克、豆包vibe、微信凢圈「打造」、豆豆「打造」——跟进中。这件事的意义多大?软件创造权第一次从工程师手里溢出来,走进了所有人手里。以前,你只能雇人让他帮你做一个应用,起价三五十万,耗时半年。现在你一个人,一个下午,可以生一个能跑、能部署的Web应用。这是什么概念?打个比方:这就像1450年古腾堡的印刷术出现之后,出书这件事从修道院里的扫书吟生手里溢出,走到了成千上万人的手里。重点不是出书变便宜了,是出书这件事不再需要一个特定阶层的垄断。vibecoding之于软件,就是古腾堡之于书籍。六、阶级分析:谁赢?谁输?我们做一点阶级分析。这场编程Agent革命中:赢家:·资深程序员:会指挥Agent、能看出AI生成代码哪里有坎、能负责架构设计——他们会出现起平均薄弱期,但三五年后薪资会创新高。·产品经理/设计师:原本受限于"说服程序员"的过程,现在能直接用vibecoding把原型跑出来。他们与Agent合香。你这样的"0代码深度用戶":是这场革命里被双重赋权的人——既避开了传统学代码的5年赔付,又在vibecoding的初期红利几乎最大受益。你们是这场革命的太阳肩。输家:·初级/刚毕业程序员:他们原本靠"会写代码"吃饰,现在这个能力被贬值。后面几卷会仔细讲。传统软件外包公司:靠"人型代码机器"赚差价的生意,被代码机器本身干掉。传统SaaS公司:这是下一卷重点之一。七、本卷一针见血⛏⛏编程Agent是这场革命的「岡田山」——低处着手、反馈环短、数据干净、同行热情,所以第一个被攻下。但别误会:不是「只有程序员受影响」。恰恰相反,编程被攻下意味着软件被攻下,软件被攻下意味着互联网被攻下,互联网被攻下意味着只要运营在数字世界里的生意都要被攻下。你现在上车,不是去学个程序员的手艺,是去学一个「指挥编程军团」的本事。这是时代发给你的第一张「入场券」。编程这一块讲完了。下一卷我们看通用Agent——这是你们这些不写代码的人最直接能上手的东西。卷五:战场点兵之二——通用Agent,你不写代码也能用的那一拨一、什么是“通用Agent”上一卷讲的是编程Agent——你得会看代码才用得起来。本卷讲的是通用Agent——你完全不需要懂代码,用中文可以、用语音也可以。什么叫通用Agent?定义一句话:不限定行业、不限定场景、能用浏览器和电脑干总体性工作的Agent。你对它说“帮我调查中国亿能智驾赛道的前十名选手,出一份PPT”,它能干;你对它说“帮我把这个电子表格上的300个邮件地址遭一遭,看看哪些公司是上市的”,它也能干;你跟它说“帮我订下周三上海到杭州的高铁,靠过道的,最便宜的”,它还能这才是你这位“0代码深度用戶”最该着迷的一拨。下面我们一个个拆。二、国外军团:几只“重坑牙齿”(1)OpenAIOperator→ChatGPTAgent2025年1月份,OpenAI推出Operator——第一个产品化的“会用浏览器的AI”。N1O你给它一个网页任务,它能自己打开浏览器、点击、填表、提交。同期OpenAI还有一个叫DeepResearch的东西——专门干调研。你丢一个问题,它能跑几十个网页、看几十篇论文、出一份几千字的报告。2025年7月,OpenAI把这两东西合并,出了ChatGPTAgent。N2O它是什么?一个在OpenAI云端服务器里跑的虚拟电脑。你可以让它:查资料、出调研报告打开电子表格、填数据、出图表·做PPT、发邮件订机票、订酒店、订会议室报名课程、填报名表、送交表单只要你说得出来,它基本都能干。OpenAI给它费了一个虚拟电脑+浏览器+代码环境+文档软件——相当于给它设了个小办公室。你付了ChatGPTPro(每月200美元就能雇这个“虔志劤奋的助手”一个月。这是什么概念?以前你雇个实习生是三千美元一个月,现在二百美元雇个Agent实习生。干的活还不是人实习生能比的。(2)AnthropicComputerUse+ClaudeforChromeAnthropic走的是另一条路。他们2024年10月先推出ComputerUseAPI____不是产品,是能力。谁都能拿这个API去做自己的Agent。2025年8月,Anthropic推出ClaudeforChrome——直接装在你Chrome浏览器里的侧边。N3O你该怎么看网页还怎么看,但Claude能看见你看见的一切,能接手代你点鼠标。这个体验比Operator“独立在云端跑”更紧密——你是点主、Claude是帮Anthropic还在2025年底推出ClaudeSkills,让你能给Claude装上“专业能力包”——比如写动画脚本的能力包、做业务分析的能力包。你不需要重新训练模型,挑一个能力包装上去就行。(3)PerplexityComet与BrowserCompanyDia这是2025年出现的一个新品种:Agent原生的浏览器。·PerplexityComet:Perplexity公司出品。你打开它,不是一个搜索框,是一个能跟你聊、能替你点页面、能跨页面总结信息的助手。·Dia(BrowserCompany同类产品,更偏设计感。·OperaNeon、BraveLeo、MicrosoftEdge+Copilot——传统浏览器一同跟进。这一拨产品背后是一个重要趋势——浏览器从“人看网页的窗”变成了“Agent走网页的道”。这是互联网近三十年最重要的结构变化。后面卷十二将仔细展开。(4)GoogleGeminiAgent/Mariner/ProjectAstraGoogle也没闲着。他们2024年底先推出ProjectMariner(浏览器Agent2025年升级为GeminiAgent。同期ProjectAstra走的是多模态路线——能看、能听、能说的个人助理。Google的优势是它控制了Android、Chrome、Gmail、GoogleWorkspace——这是世界上最多人用的产品。2026年他们的动作会决定“Agent能不能走进千家万三、中国军团:明明白白上场了这一点你一定要听清楚——中国在通用Agent这个赛道上,不是跟随者,是同时上场者。甚至在某些点上是领先的。(1)Manus:“在中国引爆AIAgent热潮的产品”2025年3月6日,ButterflyEffect(也就是Monica.im背后的团队)上线Manus。上线三天,邀请码被炒到50块人民币一个。5月拿到9000万美元融资,估值5亿。MITTechnologyReview直接把它称为“theproductthatlittheAIagentboominChina”——在中国引爆AIAgent热潮的产品。N4OManus能干什么?几个典型例子:“帮我分析一下上个季度中国新能源车SUV市场,出一份PDF报告”、“帮我设计一个个人网站,介绍我是干什么的”、“帮我查一下下周的预报天气,订一头重庆一日游”——都能一句话丢进去,几分钟后拿到结果。2025年12月15日,Manus1.6发布,一口气给出8个专业Agent:ProjectBuilder、DiagramAgent、商务报告Agent、股票研报Agent、集资Agent、职位发布Agent、讨论纪要Agent、面试Agent——一个产品,集成为一拨人的劳动力。这一招一出,中国公司集体跟进。(2)字节豆包/扣子空间字节的豆包一贯是一拨黑马。2025年6月发布豆包大模型1.6,同期上线扣子空间(CozeSpace)——这是一个人人可用的Agent平台。你能在上面创建自己的Agent,也能应用别人建的Agent。到2025年底,扣子上公开的Agent过万。重点一件事:豆包1.6加上了ComputerUse能力,这是中国头部模型中第一个公开跟进这个能力的。ComputerUse这一点能后面会详讲。(3)智谱AutoGLM与Z.ai智谱(清华系)是中国“六小龙”之一。他们推出了AutoGLM——一个能代你用手机、电脑、浏览器的Agent。你说“去美团帮我点一份香辣蛙”,AutoGLM能看手机屏幕、点点点,帮你点好、下单、付费。2025年7月智谱推出Z.ai——为海外市场重包的产品,同期发布GLM]4.5。这个动作背后讲一个现实:中国Agent的金主不能只靠国内市场,要出海。(4)MiniMaxAgent/Kimi-Researcher/阶跃起点其他“六小龙”也几乎同期出Agent:·MiniMaxAgent:不同于他们原本的Talkie/星野AI,一款专门的生产力Agent。·Kimi-Researcher(月之暗面偏重深度调研。·阶跃星辰:主营物理世界模型+多模态Agent。百川智能:偏医疗、法律场景。零一万物:深度调研+企业场景。总之句话,2025年中国Agent产品的数量和迭代速度,只有美国能比。别的国家都是跟进。(5)Genspark/Anycoder/SkyWork——中国人出去创业的产品这里要点名一个现象:中国人在海外创的Agent公司也不在少数。·Genspark:朾峰创始人野马(陈小能、宋亚云)创办。仅9个月护原护ARR过4000万美元。N5O·Anycoder:中国人创的vibecodingAgent。·SkyWork:偏企业场景。这个现象说明:中国人做Agent不亚于别人。现在不够出色的是生态、是开发者社区、是付费意愿,不是人。四、一个入门⽰范:让Agent干你上周未完成的事光讲产品不行,拿个例子看看。假如你是一个中国三线城市的生意人,你上周计划的三件事没做完:调研一下本地竞a茶店市场、写一份开店计划书、设计一个宝贝店面页。你一个人、不会代码、不懂设计。传统做法:找三个朋友、雇一个创意、费三个周末。Agent做法:1.市场调研——你对ChatGPTAgent/Manus/豆包说:“帮我调研XX市中心区的奇茶店市场——多少家、营业额、价格、人流量、热门品项、顾客评价”。它自己去美团、小红书、大众点评、高德地图上梳。半个小时出一份几千字报告+Excel表格。2.开店计划书——你说:“基于刚才这份调研,写一份30页的开店计划书,含选址、面积、预算、人员、三年财务预测”。Agent一气生出Word文档。3.设计宝贝店面页——你说:“用vibecoding帮我设计一个宝贝店首页,黑金风格,竞a茶主题,5个主推产品位,隐藏会员入口”。Lovable/Bolt/Cursor/v0几分钟后交件。总共耗时:不超过三小时。总共花费:不超过100块人民币。这三件事连起来,在2020年要干完,需要三个人、一个月、几万块。这是近五年最重要的一次生产力额外释放。五、这里面最严重的问题:可靠性不讲黑话,讲点实话。现阶段的通用Agent最严重的问题是什么?可靠性。你让ChatGPTAgent干一件30步的任务,70%的概率能顺利完成,20%会在中间某一步卵住,10%彻底走错。这是当前状态。这是啥意思?意思是它现在还不能完全「交完就不管」。你得盯着点。交代一件重要的事,你要中间检查三四次。但别忘了。2024年同样的任务,成功率是20%。2026年预计走到85%+。一年一个台阶。Gartner调查显⽰,2025年企业多Agent架构查询量从2024年Q1到2025年Q2增长了1445%。N6O但同一份报告预警:到2027年底,40%的Agent项目会被取消——原因是贵、不可靠、价值不清。这是什么意思?意思是在未来三年,会干Agent的人与不会干的人,距离将拉到最大。会的人能拿Agent用出10倍效果,不会的人只能看看是不是烫锅。六、一针见血帶通用Agent是你这个「0代码深度用戶」最该抓住的机会窗口。他不要求你懂代码、不要求你懂架构、不要求你设计prompt。你只需要两件东西:一是会拆任务,二是会验货。拆任务是把一件大事拆成清楚、交得出去的子任务;验货是看完东西能不能指出哪里不对、下令重来。这两件事不需要计算机背景,你这个年龄、你这个身份、你这个阅历——刚好适合干。这是时代赏你的股息,别让它从手缝里溢出去。通用Agent讲完了。下一卷我们讲垂直Agent——那些专门为某个行业量身定制的Agent。这里面藏着未来几十个独角兽。卷六:战场点兵之三——垂直Agent,下一拨独角兽藏在哪一、什么是“垂直Agent”上一卷讲的是通用Agent——什么都能干、但哪个都不精。本卷讲的是垂直Agent——只为一个行业、一个场景量身定制,要么不干、要么干到极致。打个比方。通用Agent像个"万能干活的重庆棒棒匠"——什么都会一点,什么都不精通;垂直Agent像个"看了三十年胃病的老中医"——别的他不懂,你那个胃的毛病他闭着眼睛能诊出来。什么东西适合做成垂直Agent?三个条件:第一,场景独特。这件事不是哪里都能用的。法律的事、医院的事、金融的事——都是行业里才习惯的业务。第二,专业门槛高。这件事不是随便一个人能干的。考过司法考才能当律师、取了医师资格才能开药——这些门槛使得劳动力贵、供应少。第三,付费意愿强。这件事一旦能提高效率,客戶愿意出高价。一件法律合同审查,律师收费5000,企业老板倒倒乐意付。三条凑齐,Agent杀进去、劳动力价格压不下去、企业愿意付高价买单——这就是独角兽出现的土壤。YCombinator的合伙人公开讲过一句话:"垂直AIAgent的市场,可能是SaaS市这句话什么意思?意思是——SaaS过去十年是个3000亿美元的市场;垂直AIAgent未来十年可能是3万亿美元。“为什么是10倍”这个逻辑后面卷十二详讲,现在先拿出五块垂直阵地看一看。二、阵地一:法律——Harvey与Legora代表:Harvey、Legora、Hebbia。法律这个行业决定了它会被第一拨打下。为什么?1.劳动力最贵。一个美国靠头律师一小时1000美元;中国红圈所800中高级合伙人一小时5000人民币。2.工作重复性高。看合同、查判例、写调查备忘录——九成是重复劳动。3.错不起、需要个同体担责。Agent不能取代律师,但能让律师一个人干三个人的在这个阵地上:·
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 3《雨的四季》教学设计
- DB5308T 56-2020 普洱茶生态茶园(Ⅰ类)建设及管理规范
- DB5307T 7-2019 民族银制品制作工艺流程规范
- 2026福建三明市建宁县县属国有企业招聘正式职工7人备考题库参考答案详解
- 纺织印染生产安全规范制度
- 西昌学院2026年公开招聘科研助理备考题库(94人)及参考答案详解1套
- 塑料制品厂注塑操作安全办法
- 环境安全防护措施
- 人员进厂登记办法规范
- 2026广东广州花都城投大地建设咨询有限公司招聘项目用工人员8人备考题库及参考答案详解1套
- 2026年全国保密教育线上培训考试试题及完整附答案
- 初三道德与法治中考复习:开放性设问之倡议书、标语与活动方案专项突破教案
- 2025年合肥高新区社区工作者招聘考试试卷真题
- 中国胃肠间质瘤诊疗指南(2025版)
- 北京市石景山区2026年5月初三综合练习(二模)语文试卷(含答案)
- 2026福建漳州水仙药业股份有限公司招聘14人考试备考题库及答案解析
- 2026河南开封工程职业学院招聘57人笔试备考试题及答案解析
- 2026年安徽省检察机关招聘书记员考试真题
- 2025年荣耀AI隐私安全白皮书
- 乌鸦喝水(绘本)
- 水利工程施工监理规范SL288-2014标准参考
评论
0/150
提交评论