打破人月神话Agent重塑风控场景产运研职能_第1页
打破人月神话Agent重塑风控场景产运研职能_第2页
打破人月神话Agent重塑风控场景产运研职能_第3页
打破人月神话Agent重塑风控场景产运研职能_第4页
打破人月神话Agent重塑风控场景产运研职能_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

打破“人月神话”Agent重塑风控产运研职能快手/磁力引擎风控技术负责人01兵种重塑之路风控产运研如何构建AI超级组织020304AIAI时代危机先介绍下我们的业务场景安全安全效率效率体验体验短视频广告内容审核业务形态安全、体验、效率的“不可能三角”短视频广告内容审核业务形态风控产运研传统“固态组织”配置规则,风险拦截需求分析,PRD设计技术研发,需求交付感知风险,发起需求固态组织分工明确边界清晰过去10年,技术出现了哪些变化?大模式时代,“协调税”为何成为效能陷阱?过去10年,发生了什么变化?人工经验规则驱动机器学习开启智能审核DeepLearning时代ChatGPT引爆生产力革 LSTM、BERT等模型用于 AIGC多模态内容审ChatGPT带来文本低成本Prompt对OCR+NLP组合识别图片内嵌大模型时代的“效能陷阱”成了吞噬大模型红利的最大黑洞。协调税Software3.0时代已经到来AI-Native原生阶段软件20软件20Copilot过渡阶段Copilot过渡阶段工业化分工时代职能重塑之路从从到产品研发&DE运营算法AI-Native组织:从“师级单位”到“AI合成旅”Native产品产运研Agent协作全景图需求撰写AgentPRD评需求撰写AgentPRD评审Agent需求理解Agent解析PRD并自动拆解Task运维发布Agent生成与维护CI/CD流水线编码测试Agent结合Context编码和测试原型设计AgentAgent运营角色边界模糊持续反馈进化共享上下文角色边界模糊持续反馈进化共享上下文产品经理面临的挑战传统低代码平台VSVibeCoding模式低代码平台正在消亡,每个产品经理都可以低代码平台正在消亡,每个产品经理都可以VibeCoding产品经理:从PRD设计到“P2P”设计新的产品设计模式(P2P):prompttoproductPrompt驱动的产品原型设计对话式产品原型设计对话式产品原型设计的水准,告别“一句话PRD”策略运营面临的挑战只会简单的规则运营,我的工作会不会被LLM取代?运营角色升级1:PE运营审核审核AgentWorkflow风险运营Prompt抽帧图地址集合:{frame}ASR输入:{ASR}任务是的标准。角色变化首先明确人物为受益人才受益人定义:人物使用了产品推广素材中仅提及成为自己的老板、2、具备面向MLLM的Prompt编运营角色升级2:RAG运营情绪识别情绪识别数据运营数据分析数据处理排序多路召回TextRank历史对话函数调用query运营运营在线离线案例查询风险研判政策解读ResponseTopK分镜向量库视频向量库规则向量库图片分镜库query扩写query改写意图识别知识库管理模式变化运营角色升级3:Agent运营APEAPEAMLAML研发工程师面临的挑战如何逃离LLM带来的DangerZone?CodingAgent:利用AI提效AIAI大幅提升编码效率AICoding:不同颗粒度的人机协作方案整主打一个“快”标准CRUD、增加列表或表AgentSkillsOpenSpecSpecKitSpec(详细设计文档)。从PromptEngineer到HarnessEngineer2026HarnessEngineer2025ContextEngineer20242026HarnessEngineer2025ContextEngineer2024PromptEngineer马具(Harness):约束烈马:AI大模型提示词规范(Spec)提示词(Prompt)激发的是AI能力的上限,而工程约束(Harness)守住的是商业交付的底线。Agent驱动的质量左移期期SDLC利用多模态大模型在代码生成的同时,直接进行静态分析与逻辑验证,实现代码生成Agent和质量测试Agent的“左右互搏”,将质量防线推向最左端核心范式:MLLMAsJudge过去:传统滞后断言/手工测试(阻塞点)…现在/未来:生成即验证算法工程师面临的挑战人人都是AI原住民算法的核心竞争力是什么?训练流程已被AAAI2026接收模型架构数据组成:风控目标数据、风控强化数据;数据样本量:10w+。++MixtureofExperts+Grouped-queryAttention训练流程已被AAAI2026接收模型架构数据组成:风控目标数据、风控强化数据;数据样本量:10w+。++MixtureofExperts+Grouped-queryAttention①预训练②中训练(Mid-Training)③后训练LMDecoderTokenizer Connector口口口口口口口口口风控目标数据案例:风险识别(+CoT)风控强化数据案例:风险识别QueryQuery:#角色定义\n你是一名严格违规点:1、素材中不得涉及出国劳务、代办签证相关服务属于“…ResponseResponse:<think>obs:按照审核规则逐条分析过程\n\n1.**出国劳Query:#角色定义\n你是一个审核“特殊行业含财商教育”的广告审核人员,负责根据给定的规则定含财商教育违规点和豁免点的判断。你的任务是基于抽帧图片中的视觉内Answer:违规VisionEncoder作为广告素材内容审核员,您的任务是根据提供的广告对其是否存在特定违规内容进行分析。请使用指定的格式对广告进行分析回复。###回复格式:###字段说明:VisionEncoder作为广告素材内容审核员,您的任务是根据提供的广告对其是否存在特定违规内容进行分析。请使用指定的格式对广告进行分析回复。###回复格式:###字段说明:阶段1:Rule-AnchoredSFT阶段2:GRPO-SCARRLground_truthr1r2Policy+…涉及低俗强暗示涉及低俗弱暗示其他###涉及低俗强暗示规则:涉及性器官,隐私部位漏点,特写;涉及色情资源展示或资源获取;涉及凸点,下体紧绷;Guide+predictionAGrGScaR1ScaR2Risk:存在“顶级规格”、“价值9999”、xxxCause:可能存在虚假营销、xx假..</answer>sScaRG…请根据上述格式对提供的图片和文本进行深入分析,按照指定格式回复。1、模型参数量:30B-A3B、7B、8B2、模型风控能力超越32B,推理成本降低80%构建风控垂直领域预训练、中训练、后训练多模态KwaiBLM大模型向前飞跃:数据飞轮驱动持续进化角色升级价值升级角色升级价值升级医疗游戏食品建材劳动过程升级文娱交通...低俗内容政治敏感…涉及功效夸大1.质量评估(LLM-as-a-Judge)准确性真实性指令遵循1.启发式过滤(HeuristicFiltering)2.数据去重(Hash/Embedding)Cluster1Noise3.多模态对齐(CLIPScore)风控多模态业务2非推理开源文本业务1推理数据决定了模型能力的上限,而算法和算力只是逼近这个上限的手段面对职能重塑AI绩效考核指标也发生了变化组织职能重塑和考核指标变化例原型设计产能+原型设计产能+100%•AI的规则“教练”量•驱动模型SFT管道数量对抗周期周->小时•LLM架构“设计者”数据工程(DE)数据工程(DE)料”标注自动化率>70%者”Training增益垂直领域基座覆盖>80%坑点和教训AI驱动组织升级,听起来很美,其实踩坑无数团队管理坑团队管理坑新老双轨坑踩坑1:工程落地坑Demo惊艳全场生产一塌糊涂工程落地坑|VibeCoding关键洞察LLM的概率性输出、AI幻觉、上下文遗忘随着对话轮次的增加,随着对话轮次的增加,AI会不可避免地产生意图漂移与上下文遗忘。解法:SDD(规格驱动开发)WorkflowDesignDesignSpecProposal明确意图、需求对齐TestAI驱动业务编码架构蓝图、系统设计TaskAIAI是拿着图纸施工的执行者,.md文件是必然的副产物,代码是结果SDD研发选型对比GSDgstack(71.2kstar)SpecKit(87.5kstar)OpenSpecSuperpowers(150kstar)(44.5kstar)(Specification)简单QA/对话生成多虚拟角色、YC式proposalfirstspec(Execution)严格4步:Specify(Context)者踩坑2:新老双轨坑增量新项目中高效可用,存量复杂系统里极易失效解法:构建AI-Native的Git结构GENTS.mRCHITECTURE.mdocs/GENTS.mRCHITECTURE.mdocs/design-system-reference-llms.txtnixpacks-llms.txtuv-llms.txt...──PRODUCT_SENSE.md──QUALITY_SCORE.md──RELIABILITY.md──SECURITY.md存量Repo如何面向AI-Native重构辑2、建立语义索引Agent具备全局依赖感知,告别“盲人摸象”3、补全测试围栏踩坑3:团队管理坑职能重塑过程中追求面面俱到反而会带来生产关系新老冲突破解管理坑:拒绝面面俱到,用“3步演进”重塑组织局部破局试试平滑过渡推推全面重塑升升组织行动建议绩效重构:关注Token经济学与Skills贡献未来的技术绩效考核,需要重新定义研发效能看板。从监控“研发吞吐量(Velocity)”全面转向衡量:Leverage)”从管理人力与时间,全面转向管理Token投资ROI与Skills贡献组织进化:逆

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论