2025QECon全球软件质量效能大会:大促狂欢背后快手电商质量守护与效能跃迁之路_第1页
2025QECon全球软件质量效能大会:大促狂欢背后快手电商质量守护与效能跃迁之路_第2页
2025QECon全球软件质量效能大会:大促狂欢背后快手电商质量守护与效能跃迁之路_第3页
2025QECon全球软件质量效能大会:大促狂欢背后快手电商质量守护与效能跃迁之路_第4页
2025QECon全球软件质量效能大会:大促狂欢背后快手电商质量守护与效能跃迁之路_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大促狂欢背后快手电商质量守护与效能跃迁之路赵先炮|快手电商营销质量负责人互联网从业经验10+

当前在快手电商担任营销质量负责人

,负责营销导购中心质量保障

、大促质量保障、

电商质量度量及故障演练等工作。赵先炮快手目录CONTENTS01

被动救火03

智能增效02

体系保障PART

01被动救火技术报白盒化业务大促活动

单元化

服务分组警策略熔断大V直播

需求变更

稳定性挑战业务&技术的双重压力架构升级降级限流oa

高可用服务端可用性3个9以上

电商业务架构oa

高体验限流避免流量超限

,请求排队提供良好限流体验oe

高性能直播间福利品抢购场景高性能要求oa

高流量近百万下单请求

,近千万级人同时在线

电商业务特点牢固稳定性、流畅性能体验、追求低成本

单热点商品库存扣减难题

用户下单体验需改善

数据一致性实时性要求高快手大V有1亿+粉丝,经常推出库存为几百万的低价商品,造成业界最高的单热点商品扣减流量问题。直播间福利品抢购场景,流量远超过系统承载流量,超大流量下抢购场景对用户体验带来极大影响,限流排队重试提升体验是快手电商不

断改进的目标。百万单福利品抢购场景,用户下单后的链路:如订单查询,商家操作订单等异步链路,对数据一致性、实时性提出高要求。

业务体量增长带来成本上升

营销玩法迭代导致的复杂度提升业务持续高速发展,随着时间积累,数据量成指数级增长,数据量的提升也带来一系列问题,成本升高、性能变差等。活动优惠玩法层出不穷,各种优惠玩法叠加,互斥,规则,对象等多重维度增加业务的复杂性,交易模型要求能够快速支撑各种灵活的定制逻辑。

面临的问题

质量状况PART

02体系保障迭代演变成成功能交付、内测&公测、预演、压测、大V保障、故障演练的组合拳保障方式

功能交付:需求的交付协同

内测&公测:大促活动的整体验收

预演:大促玩法和核心链路的全集成覆盖

压测:流量评估、全链路压测及限流体验保障

大V保障:大V直播功能预演

降级演练:活动降级方案的演练大V保障功能交付内测&公测

初建保障体系压测功能预演降级演练

以项目的交付时间为起点

梳理全节奏里程碑,全员协同质量保障

项目交付电商-双11内测&公测38女神节:问题

41个

+

高优

19个

+

值守

5点

秒杀进度条不更新底导分辨率异常海景房不展示券压测数据10+个直播预告,线上请求近百个预告的查券

体验问题频发

推荐重复

推荐结果不稳定

模版化

报名流程繁琐关健点准出标准核心玩法覆盖核心玩法全部参与内测,2轮+,准出要求P2+问题全部修复数据真实会场、商家商品报名、推荐的数据全是真实的线上数据(非测试),数据量级和线上一致对招商数据进行时光机迁移,活动未正式开启前能提前透出主播及商品;推动运营提前完成相关配置,并对质量把关玩法真实玩法的内测至少有一轮和最终用户的真实玩法一致,如平台券配置、抽奖奖品等配置真实直播间、买家首页、搜索、挂件、Banner位、底导等配置类资源位和线上一致,产运需提前进行资源位配置,并同步测试主R对配置进行验证资损点覆盖需求涉及交易(正向、逆向、物流)、营销(平台券、商家券)、风控(拦截场景、规则)均需要做资损利益点的用例评估数据链路覆盖数据需在大盘链路中进行验证,包含新客、老客、不同用户画像、商家流量的消耗等,包含ToC、ToB的链路问题决策修复所有问题(功能、体验、性能)当场主R共同决策,其中体验类问题需上升决策,P1级以上问题需日清问题跟进提前拉内测群集中沟通,根据群里反馈进行Team的在线记录,需包含上报人、截图、视频等关键信息内测运营申请预算,在研发、测试、项目全员群进行内测前的通知参与人员开发主R、产品主R、运营主R、测试主R、设计主R均需要参与内测和问题的决策修复公测&内测优化质量保障只关注大促玩法本身,对日常的核心链路关注不够

大促玩法+核心链路100%全覆盖

最高规模的集成,集中把功能、体验、性能等问题暴露出来并提前验收预演非全链路

数据易污染构造困难配置复杂数据仍然做不到百分百的完全隔离

,还是会有存在对线上数据污染的风险

,安全性差"读线上写影子"的压测方案与真实场景天然存在差距

,对压测仿真度有差异全链路压测当前影子方案配置是基于链路维度

,配置成本高

,操作复杂电商写请求多

,压测数据存在线上表

,无法快速清除

,无法快速构造早期读线上、写影子无影子表线上表压测压测标记压测数据物理删除低公司A

公司

B公司

C快手早期快手现状读

线上写

影子业务隔离商家店铺隔离高压测方案数据隔离稳定性物理隔离数据脱敏id偏移隔离业务隔离商家店铺隔离高

高全链路建设读写影子链路读

线上写

影子安全性低

中高中

压测调研

全链路压测流程压测隔离标记压测隔离标记统一标识压测流量标记压测流量统一标识,上下游传

递,监控识别压测平台支持场景编排,定制、预约压测,智能熔断、隔离标记传递、压测标记传递基础架构组kstable平台压测平台业务服务监控平台压测数据全链路压测中间件隔离技术配置策略压测标记和泳道识别升级框架Ktrace定位数据偏移联调验证压测通道建设支持不同环境压测:生产环境、

预发环境等数据逻辑隔离数据隔离、存储隔离,建设影子表,数据偏移隔离配置平台Kstable平台配置压测隔离策略,配置简洁、易用、可视化、一键操作J

压测数据

流量模型大V(蛋蛋/瑜大)直播间功能普通主播福利品大促开播影响因子人货场辛巴普通品爆品日常开播压测例行化

推动内测、公测落地,召回有效问题300+

组织功能预演,对大促核心玩法、核心交易链路进行全覆盖,召回有效问题20+

将功能预演与封版回测结合,降低预演人力的投入

故障演练覆盖,召回问题20+

例行化压测,核心场景100%覆盖,召回问题80+

多场大促更是做到了零故障交:双12、春

节、

38、

520几场大促0故障交付无延期交付

顺利交付春节、

38大促、520&616、七夕、双11、双12等10多场大促活动

无QA导致的需求延期交付

大促期间质量整体稳定,无重大舆情事件发生

大促技术故障从21年的近10个逐年收敛

保障效果召回问题零故障故障收敛PART

03智能增效

舆情早期监控扩大召回范围、减少无效预警!有效日反馈20~

借力LLM预警线上反馈商家入驻优惠报价营销活动交易优惠支付资质业务域间存在壁垒却需协同,构造测试数据时需跨域沟通、重复解释需求,手工拼接参数,单场景耗时数十分钟…接口文档分散、字段含义隐晦,理解成本高,一旦参数错误需反复重试,精力被琐碎事务分散,无法聚焦核心质量风险。

接口文档理解难

单场景耗时数十分钟 跨域沟通成本高精力被多域交集场景吞噬数据构造之痛!!!

手工测试痛点30+高峰期执行次数4

0

%

+重复性工作2

0m

i

n

+单次验证成本优惠3min设置优惠:分摊、金额、库存、限购、优惠范围、使用范围等

优惠报价验证验证

10min领取优惠,优惠氛围、报价信息、优惠叠加正确下单

5min订单金额、优惠、分摊、信息正确逆向3min退款、配额、限购、预算回退正确预算2min预算创建

&活动创建新优惠适配分摊校验优惠创建成本线上上升工作量随业务增长线性上升,

团队持续承压维护成本高接口变更修改成本高,

常因字段遗漏失败传统数据构造之痛!!!

传统工具成本高学习成本高新人上手需一周以上,熟悉框架收益

体验提升:从“平台查询”到“像聊天一样问问题”,7

×24小时即时响应,解决时效提升3-5倍

人力节省:70%依赖平台化的重复性操作及其查询

任务均由agent处理统一聊天窗口工作流与开放接口低成本拼接,聚合分散功能,通过agent调用,首批场景平均耗时从15分钟降至3分钟智能体低成本破局:统一入口B端数据工厂晶RPCM端

智能体破局 过程透明可见,执行结果实时回传 语义检索精准匹配,理解成本趋近于零

新人十分钟即可独立使用以自然语言

描述需求,系统秒级定位工具,无需记忆多个平台和复杂入参。预设高频问题模板,

一键点击即可发起调用。第一刀:自然对话得数据! AI助力三把刀四段式提示词模版快速复用将提示词拆分为四大模块,新建Agent时仅需替换业务部分的设置即可上线。技能列出工具调用、业务操作、二维码生成等原子能力默认值区分全局环境与业务参数,提供

修正方向角色声明其必须调用工具

、自我纠错、推理参数的能力限制分全局与业务两类,给出金额单位、参数依赖等硬规则

提示词模板化模糊指令自动补全输入“创建一张券”

,自动补全时间、价格、渠道等必填项工具数量爆炸100+单Agent上限 指数级增长上下文爆炸20+单工具参数

1w+提示词字数双重爆炸危机!!!

双模怯落地模型理解力骤降,Token费用翻倍,限量调用等难题叠加,

平台能力逼近天花板!SingleAgent专注单活动构造MultiAgent协调多活动串联职责清晰,杜绝提示词爆炸可并行,分钟级完成工作 原子能力录入方便:一个cURL即可完成注册,创建工具只需几十秒

提示词模版化:沉淀业务通用模版,只需替换“

业务参数”

,无需从零写

Prompt 双模式落地:单Agent快速搭、多Agent灵活联,低成本实现场景全覆盖 灵活度远超脚本:参数支持自定义,原子能力任意串联第二刀:轻量化搭建Agent!秒级注册原子能力,提示词模版化,单多Agent

协同作战

,大幅降低

Agent

建设门槛与成本 AI助力三把刀ReAct回路匹配

“必须用工具、按错误修正参数”

的规则,形成多轮调用与实时调整,加速收敛到正确结果。业务错误自动修正入参错误等问题,如接口返回金额“必须大于0.1元”明确提示,自动解读并调整参数异常智能调整遇转义错误或JSON解析失败,捕获异常并转化为“JSON格式非法”

,调整参数重试系统异常自动重试遇服务抖动、请求超时等问题,无需人工干预,模型可自动触发重试机制恢复任务业务错误系统异常

推理异常

智能体自动修复统一包装错误助模型自修自动反思

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论