智能体管理学-从模型能力到组织操作系统-清新研究-202603_第1页
智能体管理学-从模型能力到组织操作系统-清新研究-202603_第2页
智能体管理学-从模型能力到组织操作系统-清新研究-202603_第3页
智能体管理学-从模型能力到组织操作系统-清新研究-202603_第4页
智能体管理学-从模型能力到组织操作系统-清新研究-202603_第5页
已阅读5页,还剩160页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能体管理学从模型能力到组织操作系统模型能力@清新研究团队|2026年3月沈阳:清华大学新闻学院/人工智能学院双聘教@清新研究团队简介沈阳:清华大学新闻学院/人工智能学院双聘教授、博导六大研究方向:视频号:@清新研究;公众号:@清新研究6.XR应用邮箱:124739259@|6微博:@清新研究|公众号:@清新研究这不是一份“大模型功能说明书”它讨论的是组织如何管理会行动的Al传统视角:模型能力与生成新视角:行动资产与可控智能体系统√一研究对象从“模型能力”转向“行动资产”与“流程单元”。√一核心问题从“能否生成”转向“能否稳定、可控、可审计地执行”。√一目标是在效率、责任与治理之间建立新平衡。@清新研究团队|2026年3月报告结构为什么此刻需要这门学科。时代背景与紧迫性。2管理核心:对象、方法、主体它究竟管理什么、如何管理、由谁来管。定义与范畴。关键维度:组织、指标、经济)组织、指标、经济学。多维视角与支撑体系。中国贡献:路径、原创概念元中国路径与原创概念。独特实践与理论创新。元@清新研究团队|2026年3月结论一:未来竞争力取决于管理密度不是谁先接入模型,而是谁先把模型变成制度化生产系统迁移能力智能体规模监督带宽流程、权限、智能体规模监督带宽流程、权限、日志和责任链(·模型只提供可能性,真正可经营的是·模型只提供可能性,真正可经营的是流程、权限、日志和责任链。·智能体规模扩张的瓶颈,往往不是模型智力,而是·智能体规模扩张的瓶颈,往往不是模型智力,而是监督带宽。上上0··能够沉淀协议资本的组织,更容易穿越模型迭代周期。@清新研究团队|2026年3月结论二:智能体管理的目标不是“全自动”而是“高可信的人机协同”全自动幻象(Blue)高可信的人机协同(Blue)一越是高影响场景,越需要明确人工接管点与终止条件。一自动化扩张会引发责任折返,问责要求会向少数关键节点集中。可信吞吐比总吞吐更接近真实商业价值。@清新研究团队|2026年3月结论三:组织必须建立六层管理框架战略、组合、流程、协议、基础设施一层就会在规模化阶段失控制翻译成组织能力控制@清新研究团队|2026年3月@清新研究团队|2026年3月组织面对的对象已经从“回答者”变成“行动者”单步问答,辅助创作,自动化流程,多智能体协作,信息检索。代码生成。任务执行。复杂目标达成。@清新研究团队|2026年3月AI已进入真实业务流程,而不只是演示环境试验生产概念验证概念验证CensusBTOS显示,约3.8%-3.9%的美国联邦政府usecase激增,说明AI台账、公开披露与跨机构治理正在成形从571增长生成式AI从32增长(近9倍)治理状态2023usecases从571个升至1,110个。个增至282个,接近九倍增长。开披露,治理就不再是临时性动作。2026年3月◎清新所究团队2026年3月◎清新所究团队政策语言已经从“鼓励探索”变成“明确治理”中国强调落地窗口期美国强调机构治理和公信力—中国政策强调智能体已在生产生活中发挥作用,但仍有“最后一公里”—中国政策强调智能体已在生产生活中发挥作用,但仍有“最后一公里”inventory体系。两类政策都说明:AI现在被视为长期制度对象,而不是短期技术热点。https://ww.whitehouse.go/wp-content/uploads/2025/02/M-25-Z1-Accelerating-Federal-Use-of-Al-through-Innovation-Governance-and-Pub智能体扩张正在碰到硬边界美国用电量增长(EIA)规模/需求规模/需求智能体规模化与资源需求—EIA预计美国用电量2026年增长1%、2027智能体规模化与资源需求年增长3%,大型计算中心是关键驱动。—DOE页面转述EPRI估计:到2030年数据中心用电可占美国总用电9%。一这意味着智能体规模化不能脱离电力、机房和容量规划独立存在。时间电力、机房、容量规划时间◎清新研究团队12026年3月1数据来源:hts:/weiago/resrom/elaspres58.,hp;tps/wenersygovloe/clean-energy-resources-met-dota-center-eleticity-demand从工具管理走向组织操作系统管理从工具管理走向组织操作系统管理组织操作系统(权限、责任、回滚和监督)现在管理会行动、会协同、会影响结果的执行单元流程(执行单元)过去管理软件模块软件(IT可用性)过去管理软件模块,现在管理会行动、会协同、会影响结果的执行单元。过去只管IT可用性,现在还要管权限、责任、回滚和监督。这要求管理学、信重新组合。组织为什么需要一门“智能体管理学”财务研罪能辨研罪能辨财务一真正的挑战是规模化经营而不是-一次性部署。一这门学科的目标,是把Al变成稳定、可信、可持续的组织能力。@清新研究团队|2026年3月0U定义、边界与 0什么叫“智能体”持续感知持续感知智能体核心反馈环规则协作一它不是单次回答,而是带有目标闭环与反馈机制的行动系统。一是否能调用工具、利用记忆并对流程结果负责,是关键分界线。一因此,智能体是组织中的‘行动资产’,不是‘聊天附件’。@湾新研究团队|2026年3月智能体不等于聊天机器人任务1任务2结果达成任务3工具调用结果达成√聊天机器人强调对话→智能体强调目标闭环与结果责任传统软件RPA和上下文适配工具调用和异常丰富的任务@清新研究团队|2026年3月单体、群体、流程、制度制度单体智能体限和记忆。流程群体能力边界多智能体系统关注角色分工、冲突解决和协同效率。☆权限记忆@清新研究团队|2026年3月按任务与环境划分智能体类型任务复杂性知识型智能体事务型智能体环境互动性审批路由工单台账环境互动性处理检索、归纳、分析和写作。决策链处理审批、(路由、工单和台账。√优化流程、监控资源、预测需求与调度。把管理问题推进到物理世界。@清新研究团队|2026年3月单体智能体好用,不代表多智能体可管复杂度会随协同层数快速上升消息传递角色分工消息传递冲突协调任务拆解冲突协调@清新研究团队|2026年3月真正要设计的不是“去人化”-把人当成需要消除的变量,而非关键的系统组件。-普通场景也要设计例外升级路径,而不是事后补锅。-缺乏人的介入,系统容易产生严重错误或无法问责。-人的位置决定系统可信度和问责效率。智能体管理学是交叉而非替代管理学信息系统提供组织目标、激励与责任框架。提供流程、接口和平台治理方法。运筹与控制论智能体管理学嵌入这些成熟框架之中。四宫格展示四门学科及其交叉地带四宫格展示四门学科及其交叉地带提供优化算法、动态调整与反馈机制。把概率式AI@清新研究团队|2026年3月六层管理框架与生命周期生命周期生命周期@清新研究团队|2026年3月智能体管理的六层框架战略、组合、流程、协议、控制、基础设施一六层分别回答为何做、先做什么一六层分别回答为何做、先做什么、嵌入哪里、如何连接、如何纠偏、靠什么运行。协议→嵌入哪里协议如何连接>如何纠偏缺一层就会在规模化阶段形成结构性短板。一框架的任务,是把模型能力翻译成组织能力。靠什么运行靠什么运行战略层:先回答“为什么部署智能体”不是所有效率问题都值得用智能体重写战略地图高价值智能体分散的小工具采购一战略层关注增长、成本、体验、质量和风险的权衡。一它要求组织选择真正高价值、可持续、可复制的命题。>-没有战略层,智能体会退化为分散的小工具采购。@清新研究团队|2026年3月组合层:管理场景组合,而不是单个明星项目先后顺序、资源占比与风险分层都在此决定高景高影响低高规则(现金流)高影响高争议场景应降低逆降频高规则低回低频高影响(争议)低频低影响低频低影响(瘦狗)低@清新研兖团队|2026年3月频次高低@清新研兖团队|2026年3月真正产生价值的是端到端流程改写明确启动信号,定义输入输出。明确启动信号,定义输入输出。智能体的价值不在单次回答,而在减少等分升级没有流程改写,智能体只能停留在旁路辅助。全面重构业务流,实现闭环价值。旁路辅助真正产生价值传统流程端到端流程改写@清新研究团队|2026年3月数据格式露知识API@清新研究团队|2026年3月控制不是束缚,而是规模化前提控制层缺失止使用条件和复盘机制。一高影响Al:忽视可说一后果:智能体越强,事故放大系数越高。一明确定义:建立异常使用条件和复盘机制。一高影响Al:落实可说一优势:确保安全可控,实现规模化应用。规模化应用→一基础设施层决定延迟、可用性、容量上限和边际成本。一电力与机房正在成为生成式AI的外生约束。$202420252026时间一组织不能只谈模型效果,而不谈底座承载能力。仪表盘结合机虏和电力图标六层管理框架的真正作用一六层框架一六层框架负责把答案嵌入责任链、流程链和价值链,Layer6:度化生产力把“智能”转化为“制度化生产力”@清新研究团队|2026年3月智能体生命周期不是三步,而是六步部署之后仍全面上线,集成到生产部署之后仍全面上线,集成到生产小范围测试,验证可行性。定义目标,规划架构与而不是技术☆立项设计试点部署监控退役功能。复盘和资产迁功能。@清新研究团队|2026年3月立项阶段最重要的不是“能做”,而是“值不值得做”先选可控高频场景,再扩展到复杂场景高影响场景要先定义红线,再高影响场景要先定义红线,再讨论效率提升。优先进入高频、高规则、可回滚、收益可量化的流程。使用矩阵评估场景优先级,聚焦高价值区域。质量质量成本X影响设计阶段写边界,试点阶段找极限不要等上线后才发现目标函数错了☑明确目标:清楚定义系统☑☑明确目标:清楚定义系统☑权限:界定不同用户和角☑知识范围:划定人工智能模型或系统所基于的数据和知识边界。☑人工接管条件:预设在何种情况下需要人工干预或☑异常样本:使用非典型、稀有或错误的输入数据进行测☑极端工况:在超出正常运行范围的条件下评估系统表价惰。☑越早暴露问题,越不容易在系统边界系统边界试点暴露规模化代价@清新研究团队|2026年3月部署后真正开始管理高信任高质量高信任高质量例外率例外率满意度综合绩效综合绩效——部署只是进入真实世界的开始,而不是项目完成。——监控指标必须覆盖业务结果、风险事件和人机交互质量。——没有持续监控,组织只会在事故发生后被动应对。持续改进趋势时间退役阶段决定组织能否穿越模型更替新接口新接口旧接口新资产退役要处理知识迁移、日志保全、接口替换与旧接口新资产历史责任归档。不能把下线当删除,而要当作资产迁移工程。这正是协议资本重要的原因。@清新研究团队|2026年3月组织设计、治理与采购规则@清新研究团队|2026年3月智能体一进组织,最先变化的不是流程,而是角色结构业务风险风险—过去是业务提需求、—过去是业务提需求、IT交系统;现在需要四类角色协同。—谁定义目标、谁维护系统、谁审风险、谁签字负责,都要明确。—否则智能体一旦出错,就会出现责任真空。责任真空因为规模化部署需要一个真正的聘部门交汇点核心职责:制度化集成制度与治理基础☑其核心任务是把AI放进制度,政策没有台账,就没有组合治理l0一Alstrategy让组织回°么、如何成熟化。是只看单个项目。台账本身就是管理基础设施。@清新研究团队数旅来源:/wp-content/uploads/2025/02/M-25-21-Accelerating-Federal-Use-of-A1-through-lnnovation-Governance-AgentOps:智能体时代的平台中枢中控室编排知识工具调用工具调用成功案例@清新研究团队|2026年3月业务所有者必须重新成为智能体治理核心技术团队不能单独定义业务成功业务与技术共管√业务负责人要定义目标函数、可接受错误和接管条件。√业务负责人主导定义正确的业务目标、明确的错误边界和可靠的接管机制。√技术团队负责平台能力,不应独自承担业务成败判断。活的平台能力,确保智能√谁拥有流程,谁就必须拥有智能体的业务责√业务拥有流程并全面承技术提供支持。@清新研究团队|2026年3月@清新研究团队|2026年3月安全、法务、审计需要从末端审批前移到前端设计高影响场景尤其如此越权、偏差、留痕、申诉与终止条件,应在设计阶段写清。审计越权、偏差、留痕、申诉与终止条件,应在设计阶段写风险团队要参与条款、接口、测试与上线门槛制定。隐私等项目成型再审查,往往只剩“要么放行、要么叫停”。@清新研兖团队|2026年3月|数据来源:hps:///wp-content/uploads/2025/02/M-25-21-Accelerating-Federal-Use-of-Al-through-Innovafion-Goverhance-and-Public-Trust.pdf;htps:///wp-confen+/uploads/2025/02/M-25-22-Driving-Efficient-Acquisition-of-Arificial-lnfelligence-in-真正的规模上限,往往由监督带宽决定规模能力规模能力不足5监督带宽缺口规模一试点阶段看似可行,常常因为有少量资深员工持续盯住输出。一一旦规模扩大,最先耗尽的往往是人工审核、纠偏和复盘能力。一因此,监督带宽必须被当作战略资源来预算。@清新研究团队|2026年3月这就是“责任折返”一普通任务被自动化后,留下来的往智能体时代的精确治理一所以智能体时代不是少治理,一问责会向少数关键节点集中,而不是自然消失。@清新研究团队|2026年3月高影响AI不能套用同一套轻治理模板一涉及权利、安全、公共资源和关键服务的场景,需要更严格门槛。一最低风险管理实践不是负担,而是进入高价值场景的入场券。高层影响:低层影响:基础服务基础治理一真正可持续的扩张,一定先从高影响治理能力开始。AI采购正在成为治理起点,而不是采购终点采购准备与需求明确关键条款、API与数据格式持续治理与长期成本优化团队,并持续性能监采购阶段就要考虑数供应商锁定问题。后期迁移成本越低。开放与标准化API是反锁定的基础开放接口(API)模型/平台迁移协议资本协议资本标准化权限(效果评估可延续米开放接口减少模型替换和平台迁移时的重复集成成本。米标准化日志和权限结构,让历史责任和效果评估可延续。◎清新研究团队12026年3月1数据束源:http:/ww.whitehouse.sgov/wp-content/uplads/2025/021M-25-2-Driving-fficient-Acquisition-of-Atfcial-nteligence-in-Goverment.pdfdQ●治理不是为了减慢创新,而是为了让创新能持续。●真正成熟的组织,会把●治理不是为了减慢创新,而是为了让创新能持续。接口和监督能力一起建设。@清新研究团队|2026年3月第五部分指标体系、单位经济学与基础设施边界2026年3月/@清新研究团队2026年3月/智能体不是免费的组织能力一单位任务成本应包含智能体不是免费的组织能力一单位任务成本应包含模型调用、工具调用、人工复核和基础设施折旧。一如果规模扩张只放大调用和审核成本,它就不是可经营资产。一真正的管理,是在质量与成本之间找到可持续平衡。单位任务总成本工具调用模型调用(20%)成本成本人工复核基础设施折旧人工复核成本占比如果规模扩张只放大调用和审核成本,它就不是可经营资产。任务规模@清新研究团队|2026年3月可信吞吐比总吞吐更重要有效完成量必须同时满足质量、留痕和可回滚留痕质量可回滚·高吞吐但不可审计的系统,商业价值会被返工与事故吞噬。·可信吞吐把结果、可靠性和责任一起计入产出定义。·它是智能体经营层最值得保留的总指标。@清新研究团队|2026年3月任何一边被忽略,规模化都会失真一盲目追求速度,会推高例质量质量一只追求质量而不给成本上限,会让系统无法普及。一管理者要做的,是定义在什么速度成本@清新研究团队|2026年3月数据不是“越多越好”,而是“能否被智能体可靠调用”错误一知识过期、权限错配、数据碎片化会直接破错误一知识过期、权限错配、数据碎片化会直接破坏行动质量。一能否为智能体提供高质量、带时间戳、可追踪的数据,比单纯堆数据更重要。一这也是数据治理从分析时代进入执行的标志。2026.03.15@清新研究团队|2026年3月能源边界正在进入管理报表动美国用电量连续增长。2030年数据中心用电可能因此,任务分层、批处理和边缘因此,任务分层、批处理和边缘部署会变成管理策略。20242026@清新研究团队|2026年3月|数据来源:R&D的重心正在向AI集中组织更需要把投入转化为可复用流程资产(2023)7350亿美元370亿美元占全社会78%增长趁势→NSFNCSES显示,2023年美国企业R&D执行额7350亿美元,占全社会78%。→2022年10人以上企业AI相关R&D已达到370亿美元。真正稀缺的,不只是资金和模型,而是把投入沉淀为组织能力。7350亿提升组织能力投入370亿(资金/横型)总R&DAIR&D研发过程&沅淀@清新研兖团队|2026年3月|数据来源:科研与人才投入正在为下一轮竞争做准备技术领先最终仍要落回组织吸收能力2025NSFAI投资(新增)人才与生态网络连接指数组织创新吸收转化能力趋势时间(未来竞争)—NSF—NSF在2025年新增1亿美元NationalAlResearchInstitutes投资。人才和应用生态连接起来。一对组织而言,关键是能否把外部创新转化为内部流程收益。(技术/知识)(效率/增长)@清新研究团队|2026年3月|数据来源:中国数字基础设施已经具备大规模接入条件中国数字底座数据仪表盘2025年软件业务收入5G移动电话用户&1000M宽带用户5G移动电话用户同比增长同比增长为智能体排续连接提供底座23839万户2023@清新研究团队|2026年3月|数据来源:实体智能体的底座正在形成工业与服务机器人的增长说明AI管理将走向现场管理复杂度管理复杂度同比增长同比增长现在未来2026年3月@清新研究团队2026年3月@清新研究团队“多算真账”一先算有效产出,再算边际成本。一把电力、数据和监督都纳入经流模型。一这会改变未来所有AI项目的立项逻辑。一先算有效产出,再算边际成本。@清新研究团队|2026年3月人机协同、岗位变化与场景落地@清新研究团队|2026年3月从“替代叙事”转向“协同叙事”组织真正要设计的是分工边界组织真正要设计的是分工边界日一智能体擅长高频、可结构化、可复制的工作。日一人类更适合处理例外、判断、协调和责任承担。目一好的分工不是谁更强,而是谁更适合哪个节点。协同!协同!智能体人类@清新研究团队|2026年3月官方预测没有指向‘全面岗位坍塌’而是指向任务重构和新岗位增长软件开发者就业增长(2023-2033)增长显著数据库管理员增长(2023-2033)稳定增长数据库架构师增长(2023-2033)强劲需求—BLS预计2023—2033年软件开发者就业增长17.9%。一数据库管理员增长8.2%,数据库架构师增长10.8%。一这说明高质量疲数据、系统维护和复杂协同任务仍会增加。职业增长数据仪表盘:未来十年趋势02023202S2027AI对新手更像“经验压缩器”而非简单裁员器管理重点应转向学习曲线设计生产率与学习曲线提升问题解决成功率新手解决量经验复制收益经验压缩,时间/经验智能体时代会新增哪些关键岗位平台与监督(Platform&Supervision)AgentOps、流程架构岗位更重要。关注系统稳定与合规。测试与验证(Testing&Verification)AI测试岗位崛起。核心是验证智能体输出的准确性。知识治理成为核心。确保智能体知识库的质量与更新。风险运营不可或缺。管理潜在风险与伦理问题。会不会验证和治理’。→●新职业体系的变化,正是组织分工重构的外在表现。未来组织真正稀缺的四类能力协议治理能力→决定系统能否长期迁移和扩展。监督审查能力→决定系统是否可信。决定智能体能否嵌入决定智能体能否嵌入真实业务节点。长@清新研究团队|2026年3月绩效制度也要改写不能只奖励“提效”若只看自动化率,团队会倾向于追求表面部署而忽略回滚成本。还要奖励“稳态运行”V●绩效应同时覆盖可信吞吐、例外率、用户信任和知识维护。●智能体时代的优秀团队,不是上线线最多,而是跑得最稳。9表面部署@清新研究团队|2026年3月场景一:客服与服务运营这是最容易验证智能体管理价值的起点长↓客服场景具有高频、标准化和可追踪的特点,适合先行真正的提升不只是自动回复,而是减少等待、返工和升级成本。同时,它也能暴露监督带宽与知识维护的真实问题。@清新研究团队|2026年3月|数据来源:两类场景对应两种完全不同的治理重心研发与知识工作一研发与知识工作更关注知识源质量、制造与现场服务一制造与现场服务更关注权限、物理安全、延迟和回滚。V1.0-V1.0-延迟延迟权限权限这再次说明:智能体管理不能用一套轻模板覆盖所有场景。2026年3月@清新研究团队2026年3月@清新研究团队第七部分中国路径、标准化与制度化进程@清新研究团队|2026年3月中国路径的底层特征系统工程实体终端(工厂)一这使中国智能体落地更像系统工程,而不只是产品创新。一优势不只在市场规模,还在强场景、强连接和政策塑形能力。一未来竞争可能体现为‘制度化落地速度’之争。@清新研究团队|2026年3月‘人工智能+'把智能体直接写进国家目标政策已经把它视为生产力组织单元普及率增长曲线政策已经把它视为生产力组织单元新一代智能终端、智能体等应用普及率超新一代智能终端、智能体等应用普及率超相关应用普及率目标提升至治理与标准能力一国务院提出到2027年新一代智能终端、智能体等应用普及率超70%。治理与标准能力一到2030年,相关应用普及率目标提升至90%以上。2026年3月◎清新研文团队2026年3月◎清新研文团队一发改委指出,当前仍存在供需对接不畅一发改委指出,当前仍存在供需对接不畅后一公里”提供方法。一这类障碍通常不是单一算法问题,而是方法组织与制度问题。管理层旋木部市物部扶术那市场部管理部管理部连接技术与管理,打通应用全链路@清新研究团队2026年3月@清新研究团队2026年3月标准化正在从模型转向具身智能全链路数据质量训练场训练场评测◎满新研究园队|2026年3月|数妮末源:/gb/search/gbDetailedzid=37FCO3D2E1586322E06397BEOAOAA17F本报告原创核心概念监督带宽“四个概念共同解释:为什么很多组织技术可行、经营却失速。☆它们不是口号,而是从可核实事实推导出的管理框架。√这些概念可直接转化为治理语言和组织动作。√

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论