2026智观未来 · 可观测性标杆案例集_第1页
2026智观未来 · 可观测性标杆案例集_第2页
2026智观未来 · 可观测性标杆案例集_第3页
2026智观未来 · 可观测性标杆案例集_第4页
2026智观未来 · 可观测性标杆案例集_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

BonreeBONREEOBSERVABILITYBENCHMARKCASECOLLECTIONprefcce大模型深度融入业务场景,叠加企业IT架构传统碎片化运维模式已难以支撑业务极速迭企业实现风险前置预判、业务价值量化与技测平台,以AI智能运维引擎、自适应根因分稳定性管控等痛点,全面保障企业核心数字维驱动业务精细化运营。2026年,Bonree观测与自动化决策能力上持续突破,已支撑等重点行业标杆落地实践,既涵盖了国内复杂IT架构下AI可观测建设的落地实践,也呈现了博睿数据布局东南亚的首个标杆项目,成功打破国际品牌在东南亚高端可观测领域的长期垄断,充分彰显中国软件的全球竞争方案选型逻辑与落地成效,为企业构建AI驱动的可观测性体系提供高复用、可落地的参广州王老吉大健康产业有限公司0163件、数据库、底层基础设施全栈端到端观测能02泰康财险(泰康在线)是泰康保险集团旗下的互联网保险公司,依托泰康云及腾讯云混合云架构承载核心业务系统运建设的推进,以及国家金融监督管理总局【2024】11号文件对重要业务服务全链路监测提出的更高要求,泰康财险对系统可观测能力确每日告警总量庞大,告警风暴频发,大量无效告警无法真实反映系统健康状态;研发、运维团队每周需投入大量人力专项优无统一监控管理平台,缺少标准化分层指标体系、统一可视化大屏与自动化巡检报表;未搭建主动巡检与风险预警模型,无配套SLI/SLO管理规范;业务交易、订单、用户流量等指标零散自建,缺少中心级业务观测大盘,风险只能事后抢修,难以实现风险左移,无法满足监同时承载泰康云、腾讯云双异构云环境,各类监控工具技术栈、采集协议不统一,多套系统并行维护带来高额人力与硬件资源成本;工具操作、配置调优学习门槛高,缺少自助化监控运维能力,且暂未落地AI根因分析、故障业务影响量化等智能化能力,难以长03数据安全性与监管合规性。平台遵循可靠性原则,采用集群式部署,单点故障时其他节点自动接管,保障业务持续运行;采用开放性架指标,补全当前缺失的P99/P95响应务全链路健康视图,指标异常可逐层下钻溯源。同时通过数据与算法自动生成故障影响树,降低根因定位成本;结合业务场景落地标准04建设业务相关的运维监控看板,完整覆盖端到端全链路监测,提升业务质量可视化能力,满足国家金融监督管通过统一告警事件管理平台与AI智能降噪收敛,大幅降低虚警率,有效减少每周专项告警治理工作量;一站式融合指标、日志、链路、变更事件数据,实现故障快速通过主动巡检体系与AI故障预测,提前识别系统隐患,增强风险感知能力,降低重大故障发生率,推动团队从通过标准化治理指标、日志、追踪等观测数据,提升数据质量,为后续根因分析、智能告警、故障预测及业务建立系统故障主动预警机制,将传统被动运维模式0563在智己汽车复杂的车联网运维场景中,面临“日均5000余条告警、上千个微服务、多套监控工具并存”06智己汽车后端业务系统采用微服务架构部署在混合云环境,服务约25万+台在网车辆的营销、销售、售后、车联网、OTA升级、智能驾驶、手机APP等上千个微服务。随着业务快速增长,监控体系逐步形成多套工具并存的局面:容器平台自带监控、Prometheus采集业务指标、APM采集调用链和应用性能数据、各云厂商原生监控、日志平台等。应用、业务、告警数据分散在各平台,日均产生5000余条告多套监控系统各自产生告警,缺乏跨平台、跨服务的关联分析能力。同一故障在不同系统重复报警,导致运维人员面临大量重复告警,关2根因定位依赖人工研判原有APM采集了丰富的调用链追踪和应用性能数据,但停留在单系统内查看和分析的层面,未与告警事件管理和AI智能分析形成数据闭路。BonreeONE具备全栈端到端可观测能力,通过无侵入式数据采台内置的AI引擎提供智能降噪与异常检测能力;智己汽车在此基础上自主研发事件融合平台和根因分析引擎,双方围绕以下三大能力,构07运维人员登录平台后,首先通过APM模块的完整调用链检索,精准定位故障服务及异常节点,快速区分是下游依赖超时还是代码逻辑缺通过Dify编排)进行跨源根因推理,将核心业务,全域接入上千个微服务监控数据。依托一体突破:告警纳管后收敛率达70%以上,根因分析准确率超85%,故障定位从平均45分钟压缩至分钟级。同时,故障发现从小时级被动响应提升至秒级感知,问题发现率达95%;配合预测性维护实现2分钟内告警,推动运维08AI根因分析和字节码级APM监控显著提升故障定位准确网服务可用性提升至99.95%,智能驾驶、车机互联、远程控制等核心功能稳定性显著提高;建立了AI驱动的统工具并存的真实复杂环境下完成工程化落地验证,形成从数据采集到智能决策的全链路数据底座支撑,真正实满足准确率高,低噪声的异常发现和应急管理诉求0963随着王老吉大健康公司(以下简称“王老吉”)业务持续发展,IT业务系统架构日趋复杂,系统访问压力与功能数量同步增长,应用系统的复杂度不断攀升。在IT故障与风险点持续增加的趋势下,传统基础架构监控手段已无法满足当前运维需求。与此同时,公司面临业务需求快速变化、用户期望持续提升以及降本增效压力等多重挑战,IT应用在运行过程中发生性能下降或服务异常的概率显著增大,进而影响业务服务的连续性。因此,构建有效的应随着王老吉大健康公司(以下简称“王老吉”)业务持续发展,IT业务系统架构日趋复杂,系统访问压力与功能数量同步增长,应用系统的复杂度不断攀升。在IT故障与风险点持续增加的趋势下,传统基础架构监控手段已无法满足当前运维需求。与此同时,公司面临业务需求快速变化、用户期望持续提升以及降本增效压力等多重挑战,IT应用在运行过程中发生性能下降或服务异常的概率显著增大,进而影响项目实施前,王老吉缺乏RUM(真实用户监控)和APM(应用性能监控)的监控告警机制,系统运行状态是否正常完全依赖用户投诉反馈⃞首个发现系统异常的人员往往是客服或业务人员,而非运维工程师。这种被动响应模式导致故障发现严重滞后,运维工作陷入盲运维人员登录平台后,首先通过APM模块的完整调用链检索,精准定位故障服务及异常节点,快速区分是下游依赖超时还是代码逻辑缺调取RUM会话回放,还原异常时段真实用户的操作路径与页面交互轨迹,结合客户端IP、设备类型、地域分布等维度,判断故障是否由针对复杂故障,进一步调取数据库、缓存、消息队列等中间件的精细化监控数据,横向对比连接数、响应延迟、队列积压等核心指标。通过多维度关联分析,快速识别如慢SQL、连接池耗尽、缓存击穿或消息堆积等深层隐患,为根因判断提供量化依据,大幅减少试错成基于以上场景数据分析制定针对性恢复措施,并在故障处置完毕后将完整的链路数据、根因结论及处理过程沉淀为标准化故障预案,录告警准确率提升至≥95%,大幅减少无效告警对运维团队的干扰;在能力建设层面:成功落地RUM、APM及核心中间件监控,助力王老吉实现了从用户端到服务端的全链路可化监控告警体系。让系统状态真正实现“可视、可测、可溯源”。运维团队告别了过去“被动等投诉”的运维模式,实现了从被动监未来博睿数据将继续携手王老吉,聚焦于AI能力深化,重点引入智能根因分析、AI辅助诊断等能力,进一AI驱动的智能可观测领域领军企业博睿数据(股票代码企业SarawakInformationSystemsSdnBhd(简称SAINS)正式建立战略合作伙伴关系,在东南亚市场落地首个标杆客户项目。本次合作中,博睿数据核心产品BonreeONE一体化智能可观测平比肩全球顶尖水平的产品实力、灵活的部署方式与极具国际竞争力的价格优势,标作为马来西亚砂拉越州政府全资控股的核心科技企业,SAINS承担着区域数是当地数字化转型的核心载体与标杆企业。其IT运维体系建设、全域技术监控平在核心能力层面,博睿数据BonreeONE一体化智能可观测平台具备从用户体验、应用端可观测能力,依托AI智能运维引擎、自适应业务场景,高效解决分布式架构下的运维数据孤岛、故障定位滞后、系统稳定性管控难等行业痛点,全面保障马来西亚砂拉越州核心数与SAINS达成合作,不仅是博睿数据东南系,实现技术迭代与场景适配的双重升级,产品能力已达相较于海外传统竞品,博睿数据不仅拥有功能完备、性能领先的核心产品,更具备灵活的部署方式支持私有化部署及公有云部署、高效的技术服务响应体系以及极致的成本优势,精准契合东南亚数字化市场的发展需求。本次标杆项目的落地,彻底打破了国际品牌在东南亚高端可观测市场的垄断局面,验证了中国软件的全球化竞争力,为博睿数据深度开拓东南亚市场、辐射整个亚太区域奠定了坚实的口1663集团有限责任公司(简称“内蒙古机场集团”)的合内蒙古机场集团作为区域重要的航空运输枢纽管理企业,下辖多个机场,IT系统涵盖航班运行、旅客服务、地面保障、安检管理、货运物旅客终端日益多样化(小程序、Android、iOS等),传统的基础监控手段无法从应用层面透视业务质量,故障排查往往需要联合多个正实现“可视、可测、可溯源”。运维团队告博睿数据依托BonreeONE,为内蒙古机场集团打统。BonreeONE作为国内领先的一体化智能可观测平台,具备全栈监平台支持对PHP、Node.js、C++、Python、Go、.NET、Java等主流开发语言应用的性能监控,实现从代码到业务的全链路平台支持自动发现应用间调用关系并自动生成拓扑图,可直观呈现机场各业务系统间的依赖关系与数据流向。支持全局拓扑图查看、拓平台支持代码级性能剖析(Profiling),可对内存、CPU、时延等代码资源消耗进行精细化监控;支持动态获取线上代码的函数出入参平台支持面向重要URL的链路分析及拓扑能力,支持业务要素监控,可根据请求Header、Cookie、URL参数标记客户业务参数(如userId),并据此过滤调用链,实现对关键业务流程的精准追踪。同时支持Web端页面加载、JS性能、API性能等指标监控,以及App端平台支持应用指标告警、聚合数据告警及指标数据计算后告警,具备告警自动化和告警降噪能力,有效减少告警误报和冗余。支持配置动态下发、实时生效,无需重启应用进程;支持配置按标签、环境复制及全局配置,大幅提升运维效率。平台全面开放数据接口),建立了一套覆盖多语言、多组件的统一可观测体系。助力内蒙古机场集团打通了从旅客端到后端服务、从代码到业务的端到端全链路通过自动拓扑和代码级诊断,提升故障定位效率。借助智能告警和灵活配置,降低运维复杂度。推动运维团队从“被动救火”向“主动预防”转变,以数据驱动运维决策,为机场集团20随着中铁云网信息科技有限公司(以下简称“中铁信科”)各类统建业务系统的建设规模持续扩大,杂,对应用性能监控和运维管理的能力要求不断提升。与此同时,应用系统的稳定性和响应速度直接关系到业务效率与用户现有工具缺乏对应用程序前后端服务、数据库、中间件等各环节的细粒度监控能力,无法获取接口响应时间、吞吐量、错误率、慢SQL缺少自动化的异常检测和预警机制,问题往往依赖人工缺乏详细的事务追踪能力,无法沿调用链追溯问题上述痛点,使得业务系统在面临高并发、复杂调用场景时,运维保障压力显著增大,亟需引入一套专业、全面的应用监控与辅助诊断系通过对Java、JS、Python、Go等多语言应用的深度性能通过对Java、JS、Python、Go等多语言应用的深度性能通过建设应用监控与辅助诊断系统,实现对各类业务系统的全链路监控,覆盖用户端真实体验指标、分布式调用链路追踪及性能趋势分析,形成从数据采集、分析到22借助异常根因定位、多类型数据库(含国产数据库)存储性能深度分析、Kubernetes集群健康评估等功能,结合线程剖析和内存dump等高级诊断手段,辅助研发和运维人员精准识别和定位性能瓶颈,快速定位问题根系统对信创国产化中间件、数据库、操作系统及芯片架构的全面兼容,确保中铁信科业务系统在国产化环境下通过周期性的报告产出(包括性能报告、异常报告等),为运维决策提供数据支持。系统架构具备良好的扩展性,支持未来新增功能模块的集成,可随业务发展2363博睿数据24博睿数据药师帮(09885.HK)成立于2015年,是中国院外医药产业最大的数字化综合服务平台,致力于以数字化赋能药企、分销商、药店及基层医疗机构,推动药品高效流通。公司秉持“让好医好药普惠可及”的使命,深耕基层市场,积累了强大的数据能力,构模式,已覆盖超49万家药店和37万家基层医疗机构,渗透全国98.9%的县域及91.5%的乡镇然而,随着业务规模的快速扩张和系统架构的日益作为直接面向数十万药店和基层医疗机构的B2B交易平台,药师帮的前端用户体验直接影响交易转化率和客户留存。平台覆盖Web端、App端及小程序等多个终端,但在原有监控体系下,前端仍存在部分性能问题(如页面加载慢、搜索响应延迟、交易流程卡顿等),难以在复杂的分布式系统中,故障根因定位往往需要跨多个团队、多套监控工具进行人工排查。然而在运维领域,故障排查依赖专家经验,缺APM模块实现对后端微服务的全链路性能监控,全面接管药师帮核心交易链路与供应链系统。对订单处理、库存同步、智能补货等关键博睿数据博睿数据25RUM模块实现定位应用运行中的崩溃、卡顿、ANR、JS错误、自定义异常等问题,同时获取多维度分析数据:包括健康评分、不同地区的体验差异、设备适配情况等。提供完整的用户体验上下文信息,可快速分析最终用户的真实感受,及时调整优化方向,确保产品体验博睿数据博睿数据26统故障平均定位时间(MTTI)缩短60%以上,研发与运统故障平均定位时间(MTTI)缩短60%以上,研发与运维团队从繁琐的日志检索中解放,人工排障成本显著降了覆盖从用户端到服务端的全栈可观测能力。平台打通了前端用户体验与后端应用性能的数据关联,实现了“从前端页面加载→用户交互→后端服务调用→数据库RUM模块的上线使药师帮第一次能够量化地评估终端用户体验。页面加载时间、搜索响应延迟、交易流程转化率等关键体验指标实现了实时可视化监控,为产品优化提供了数据支撑,精准定位并优化了基层医生与药店店长在入库、对账等高频操作中的卡顿问题。页面核心接口响应时间平均降低30%,显著提升了下游40多万月活买家的操作流畅度,进一步巩固了药师帮在下沉市场的2763博睿数据与全业务流程的统一监控体系,实现“统一采集、统一分析、统一展示、统一告警”。通过部署500套分层探针,完成基础设施与核心28盛银消费金融承载全流程信贷、资金交易、客户服务等核心金融业务,IT体系涉及大量物理资源、虚拟化集群、微服务应用、国产数原有运维工具彼此独立,多源异构的指标、日志、链路数据割裂,无法实现端到端的全流程关联分析,运维人员需要跨系统反复切换在国产化改造推进过程中,原有工具对国产称、关联关系、业务/实例/主机状态、请求数统计、响应时间、错误信息等;服务节点异常故障原因。同时支持服务、接口、数据库、消息中间件、远程调用及架构拓扑(服务、实例、容器、主机关系),选择不同节点即可查志,直达故障原因。链路中服务节点宕机或异常时拓扑图做特殊标识,直观可见。错误分析场景中,平台记录错误的服务名称、发生时的根因及相关建议。AI算法自动生成根因初步结论(含根因对象、异常类型、关键异常指标等),并支持调用链分析、数据库分析、资入)、接口对接(Webhook、JDBC、第三方平台回调等)。同时支持定制监控大屏开发,具备联动展示功能,支持曲线图、区域图、29现场监测大屏等多种告警推送方式,并具备降噪处理能力,可将多个相关异常告警合并为准确的重要告警,提前发现潜在风险,减少冗余通知,有效解决告警风暴问现场监测大屏等多种告警推送方式,并具备降噪处理能力,可将多个相关异常告警合并为准确的重要告警,提前发现潜在风险,减少冗余通知,有效解决告警风暴问并记录登录、登出、配置修改等操作审计日志。平台提供应用性能和HTTP请求统计报告,支持多图表趋势展示及自定义报告(如慢请求、慢SQL、错误请求等),可定时发送至多人邮箱。同时支持国产化改造,兼容国产操作系统、数据库及中间件,为盛银消金的信创建设提流的端到端透明化管控。全局拓扑自动发现、全链路追踪、单次请求追踪等功能,使运维人员能够快

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论