外卖风控实时数仓实践_第1页
外卖风控实时数仓实践_第2页
外卖风控实时数仓实践_第3页
外卖风控实时数仓实践_第4页
外卖风控实时数仓实践_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、外卖风控实时数仓实践外卖风控介绍实时数仓架构相关优化经验外卖风控介绍业务特点品类多风控场景多交易高频用户商家骑手风控挑战及时性高对抗性灵活性外卖风控整体架构实时风控(微服务)准实时风控(实时流)离线风控(ETL)策略系统(规则+管理+监控)特征库(黑白名单+统计数据+特征数据)公共组件过载保护日志报表监控报警外卖风控介绍实时数仓架构相关优化经验实时数仓特点实时数仓离线数仓层次划分为降低数据处理时延,减少复杂数据加工过程可能导致的 错误,层次划分少。数仓底层为了提升模型稳定性、降低复杂度,层次划分比较多事实数据存储一般将事实数据存放在Kafka上,需要落地的话可以使用ES、Hbase等。无论是结

2、果数据,还是中间过程数据都落在HDFS上维度数据存储根据数据量的大小、访问并发量等因素选择使用HBase/Tair/Redis等KV存储。离线数仓维度数据存放在HDFS上并通过Hive访问数据加工过程Flink、Storm等Hive、Spark SQL等Lambda架构 V.S. Kappa架构LambdaKappa实时性实时实时计算资源流和批同时运行,资源开销大流批分离,回溯数据时才开启批处理,资源开销小批处理效率批处理吞吐量高批处理吞吐量低研发成本流和批各开发一套代码,成本大流批共用一套代码,成本小运维成本维护两套系统,成本大维护一套系统,成本小外卖风控实时数仓架构应 用 层实时风控实时预

3、警实时报表服 务 层统一查询服务统一指标系统存 储 层ESTairRedisHBase计 算 层StormFlink接 入 层KafkaMafka统一查询服务统一查询服务客户端接口层查询解析层元数据查询鉴权层查询缓存层Calcite适配层管理后台UDF管理数据源管理监控&告警逻辑表管理数据源ESHBaseKylinMySQLTair外卖风控介绍实时数仓架构相关优化经验相关优化经验实时Join优化Storm优化Flink优化ES优化稳定性建设效果数据实时Join优化Stream AStream BJoin KeyMemory/RedisStore RecordRetry Delay Stream

4、Time ExceededKey ExistsNNAlarm & FailedJoin successYYStorm优化-并发安全Storm优化-sink优化共享连接池异步写 批量写Storm优化-配置实践Worker数设置为消费Kafka partition总和一半,然后再看性能调整Spout线程数设置为消费Kafka partition数量的一半Bolt线程数设置为QPS* Execute Latency/1000Acker数量设置为worker数的一半Flink优化-扩展DDL自定义Calcite sql解析自定义sink、sourceFlink优化-扩展UDF时间处理函数集合处理函数空

5、间位置函数JSON处理函数数据读取函数Flink优化-checkpoint超时checkpoint模式exactlyOnce-atLeastOnce,去掉checkpoint对齐提升下游消费能力,减少checkpoint对齐时间 降低checkpoint频率尝试更换statebackend: rocksdb-fsFlink优化-常见优化方式调整节点并发作业优化:数据倾斜、数据去重 拆分节点:chain节点拆分调整节点资源ES优化-分片数ES分片是节点个数的1-2倍是最佳的分片个数,保证IO基本均衡ES优化-数值索引ES5.0及以后版本,数值 类型如果不需要范围查 询,应该定义为keyword 类型CPU峰值从80%降到50%稳定性建设监 控延迟监控JVM监控机器监控正 确 性实时抽样对比实时和离线对比容 灾数据双写容错降级数据恢复Storm迁移Flink效果Flink性能高,占用机器资源下降40%+Flink实时join支持好,ES压力降低30%+Flink on YARN资源隔离,稳定性好Flink SQL支持好,代码量和维护成本降低系统相关性能数据ES并发

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论